Python实现抓取网页生成Excel文件的方法示例


Posted in Python onAugust 05, 2017

本文实例讲述了Python实现抓取网页生成Excel文件的方法。分享给大家供大家参考,具体如下:

Python抓网页,主要用到了PyQuery,这个跟jQuery用法一样,超级给力

示例代码如下:

#-*- encoding:utf-8 -*-
import sys
import locale
import string
import traceback
import datetime
import urllib2
from pyquery import PyQuery as pq
# 确定运行环境的encoding
reload(sys);
sys.setdefaultencoding('utf8');
f = open('gongsi.csv', 'w');
for i in range(1,24):
  d = pq(url="http://www.yourwebname.com/?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i));
  itemsa=d('dl dt a') #取title元素
  itemsb=d('dl dd') #取title元素
  for j in range(0,len(itemsa)):
    f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text));
  #end for
#end for
f.close();

接下来就是用Notepad++打开gongsi.csv,然后转成ANSI编码格式,保存。再用Excel软件打开这个csv文件,另存为Excel文件

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python中快速进行多个字符替换的方法小结
Dec 15 Python
python使用两种发邮件的方式smtp和outlook示例
Jun 02 Python
Python 由字符串函数名得到对应的函数(实例讲解)
Aug 10 Python
python中 logging的使用详解
Oct 25 Python
python2与python3共存问题的解决方法
Sep 18 Python
django富文本编辑器的实现示例
Apr 10 Python
Python数据类型之String字符串实例详解
May 08 Python
Python生命游戏实现原理及过程解析(附源代码)
Aug 01 Python
python将三维数组展开成二维数组的实现
Nov 30 Python
Python tkinter布局与按钮间距设置方式
Mar 04 Python
Python实现检测文件的MD5值来查找重复文件案例
Mar 12 Python
Python装饰器结合递归原理解析
Jul 02 Python
Python基于Socket实现的简单聊天程序示例
Aug 05 #Python
Python Socket实现简单TCP Server/client功能示例
Aug 05 #Python
对pandas的dataframe绘图并保存的实现方法
Aug 05 #Python
解决PyCharm中光标变粗的问题
Aug 05 #Python
Python实现的中国剩余定理算法示例
Aug 05 #Python
python爬虫_自动获取seebug的poc实例
Aug 05 #Python
python中的break、continue、exit()、pass全面解析
Aug 05 #Python
You might like
UCenter 批量添加用户的php代码
2012/07/17 PHP
php实例分享之二维数组排序
2014/05/15 PHP
基于jQuery的的一个隔行变色,鼠标移动变色的小插件
2010/07/06 Javascript
基于jquery的button默认enter事件(回车事件)。
2011/05/18 Javascript
jQuery图片播放8款精美插件分享
2013/02/17 Javascript
yepnope.js使用详解及示例分享
2014/06/23 Javascript
简述Jquery与DOM对象
2015/07/10 Javascript
JS实现无限级网页折叠菜单(类似树形菜单)效果代码
2015/09/17 Javascript
Bootstrap入门书籍之(三)栅格系统
2016/02/17 Javascript
AngularJS ng-bind 指令简单实现
2016/07/30 Javascript
NodeJS和BootStrap分页效果的实现代码
2016/11/07 NodeJs
BootStrap实现带关闭按钮功能
2017/02/15 Javascript
利用webstrom调试Vue.js单页面程序的方法教程
2017/06/06 Javascript
Vue.js仿微信聊天窗口展示组件功能
2017/08/11 Javascript
浅谈JsonObject中的key-value数据解析排序问题
2017/12/06 Javascript
vue 项目如何引入微信sdk接口的方法
2017/12/18 Javascript
解决vue项目打包后提示图片文件路径错误的问题
2018/07/04 Javascript
在vue中解决提示警告 for循环报错的方法
2018/09/28 Javascript
微信小程序设置滚动条过程详解
2019/07/25 Javascript
layer实现登录弹框,登录成功后关闭弹框并调用父窗口的例子
2019/09/11 Javascript
小程序websocket心跳库(websocket-heartbeat-miniprogram)
2020/02/23 Javascript
Nodejs 数组的队列以及forEach的应用详解
2021/02/25 NodeJs
探究数组排序提升Python程序的循环的运行效率的原因
2015/04/01 Python
浅谈插入排序算法在Python程序中的实现及简单改进
2016/05/04 Python
Python 提取dict转换为xml/json/table并输出的实现代码
2016/08/28 Python
Python实现列表删除重复元素的三种常用方法分析
2017/11/24 Python
对Python 3.2 迭代器的next函数实例讲解
2018/10/18 Python
Python多线程同步---文件读写控制方法
2019/02/12 Python
使用matplotlib的pyplot模块绘图的实现示例
2020/07/12 Python
Python如何操作docker redis过程解析
2020/08/10 Python
世界汽车零件:World Car Parts
2019/09/04 全球购物
缓刑人员的思想汇报
2014/01/11 职场文书
小学生安全保证书
2015/05/09 职场文书
SQL Server数据定义——模式与基本表操作
2021/04/05 SQL Server
Python3.8官网文档之类的基础语法阅读
2021/09/04 Python
Android Canvas绘制文字横纵向对齐
2022/06/05 Java/Android