Python实现抓取网页生成Excel文件的方法示例


Posted in Python onAugust 05, 2017

本文实例讲述了Python实现抓取网页生成Excel文件的方法。分享给大家供大家参考,具体如下:

Python抓网页,主要用到了PyQuery,这个跟jQuery用法一样,超级给力

示例代码如下:

#-*- encoding:utf-8 -*-
import sys
import locale
import string
import traceback
import datetime
import urllib2
from pyquery import PyQuery as pq
# 确定运行环境的encoding
reload(sys);
sys.setdefaultencoding('utf8');
f = open('gongsi.csv', 'w');
for i in range(1,24):
  d = pq(url="http://www.yourwebname.com/?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i));
  itemsa=d('dl dt a') #取title元素
  itemsb=d('dl dd') #取title元素
  for j in range(0,len(itemsa)):
    f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text));
  #end for
#end for
f.close();

接下来就是用Notepad++打开gongsi.csv,然后转成ANSI编码格式,保存。再用Excel软件打开这个csv文件,另存为Excel文件

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python实现远程调用MetaSploit的方法
Aug 22 Python
一个基于flask的web应用诞生 记录用户账户登录状态(6)
Apr 11 Python
Python实现Mysql数据库连接池实例详解
Apr 11 Python
Python实现将罗马数字转换成普通阿拉伯数字的方法
Apr 19 Python
PyQt5实现拖放功能
Apr 25 Python
Python中使用遍历在列表中添加字典遇到的坑
Feb 27 Python
详解python中的生成器、迭代器、闭包、装饰器
Aug 22 Python
python实现图片上添加图片
Nov 26 Python
Pycharm debug调试时带参数过程解析
Feb 03 Python
Python while循环使用else语句代码实例
Feb 07 Python
详解django使用include无法跳转的解决方法
Mar 19 Python
python 通过 pybind11 使用Eigen加速代码的步骤
Dec 07 Python
Python基于Socket实现的简单聊天程序示例
Aug 05 #Python
Python Socket实现简单TCP Server/client功能示例
Aug 05 #Python
对pandas的dataframe绘图并保存的实现方法
Aug 05 #Python
解决PyCharm中光标变粗的问题
Aug 05 #Python
Python实现的中国剩余定理算法示例
Aug 05 #Python
python爬虫_自动获取seebug的poc实例
Aug 05 #Python
python中的break、continue、exit()、pass全面解析
Aug 05 #Python
You might like
PHP树的代码,可以嵌套任意层
2006/10/09 PHP
PHP操作XML中XPath的应用示例
2019/07/04 PHP
php依赖注入知识点详解
2019/09/23 PHP
js实现的网页颜色代码表全集
2007/07/17 Javascript
$.ajax json数据传递方法
2008/11/19 Javascript
Google AJAX 搜索 API实现代码
2010/11/17 Javascript
调试Node.JS的辅助工具(NodeWatcher)
2012/01/04 Javascript
js跳转页面方法总结
2014/01/29 Javascript
无限树Jquery插件zTree的常用功能特性总结
2014/09/11 Javascript
jQuery学习笔记之Ajax用法实例详解
2015/12/01 Javascript
js获取Get值的方法
2016/09/29 Javascript
jQuery得到多个值只能用取Class ,不能用取ID的方法
2016/12/04 Javascript
基于JavaScript实现移动端无限加载分页
2017/03/27 Javascript
详解Vue中使用v-for语句抛出错误的解决方案
2017/05/04 Javascript
使用ef6创建oracle数据库的实体模型遇到的问题及解决方案
2017/11/09 Javascript
swiper移动端轮播插件(触碰图片之后停止轮播)
2017/12/28 Javascript
使用mixins实现elementUI表单全局验证的解决方法
2019/04/02 Javascript
JS实现容器模块左右拖动效果
2020/01/14 Javascript
详解Vue中的Props与Data细微差别
2020/03/02 Javascript
原生js无缝轮播插件使用详解
2020/03/09 Javascript
JavaScript实现多文件下载方法解析
2020/08/07 Javascript
js数组的基本使用总结
2021/01/18 Javascript
Python IDLE入门简介
2017/12/08 Python
Python 3.7新功能之dataclass装饰器详解
2018/04/21 Python
Python使用Selenium爬取淘宝异步加载的数据方法
2018/12/17 Python
python模拟菜刀反弹shell绕过限制【推荐】
2019/06/25 Python
使用python打印十行杨辉三角过程详解
2019/07/10 Python
python3实现elasticsearch批量更新数据
2019/12/03 Python
pycharm 2020 1.1的安装流程
2020/09/29 Python
阿姆斯特丹杜莎夫人蜡像馆官方网站:Madame Tussauds Amsterdam
2019/03/12 全球购物
DOM和JQuery对象有什么区别
2016/11/11 面试题
小学教师岗位职责
2013/11/25 职场文书
秋季运动会稿件
2014/01/30 职场文书
房地产开发项目建议书
2014/05/16 职场文书
年终考核实施方案
2014/05/26 职场文书
机动车登记业务委托书
2014/10/08 职场文书