Python实现抓取网页生成Excel文件的方法示例


Posted in Python onAugust 05, 2017

本文实例讲述了Python实现抓取网页生成Excel文件的方法。分享给大家供大家参考,具体如下:

Python抓网页,主要用到了PyQuery,这个跟jQuery用法一样,超级给力

示例代码如下:

#-*- encoding:utf-8 -*-
import sys
import locale
import string
import traceback
import datetime
import urllib2
from pyquery import PyQuery as pq
# 确定运行环境的encoding
reload(sys);
sys.setdefaultencoding('utf8');
f = open('gongsi.csv', 'w');
for i in range(1,24):
  d = pq(url="http://www.yourwebname.com/?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i));
  itemsa=d('dl dt a') #取title元素
  itemsb=d('dl dd') #取title元素
  for j in range(0,len(itemsa)):
    f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text));
  #end for
#end for
f.close();

接下来就是用Notepad++打开gongsi.csv,然后转成ANSI编码格式,保存。再用Excel软件打开这个csv文件,另存为Excel文件

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python递归遍历列表及输出的实现方法
May 19 Python
python函数局部变量用法实例分析
Aug 04 Python
Windows下Eclipse+PyDev配置Python+PyQt4开发环境
May 17 Python
华为2019校招笔试题之处理字符串(python版)
Jun 25 Python
Python数据可视化 pyecharts实现各种统计图表过程详解
Aug 15 Python
python中单下划线(_)和双下划线(__)的特殊用法
Aug 29 Python
Python中 Global和Nonlocal的用法详解
Jan 20 Python
终于搞懂了Keras中multiloss的对应关系介绍
Jun 22 Python
Pycharm及python安装详细教程(图解)
Jul 31 Python
python 获取字典键值对的实现
Nov 12 Python
python爬虫分布式获取数据的实例方法
Nov 26 Python
如何利用python 读取配置文件
Jan 06 Python
Python基于Socket实现的简单聊天程序示例
Aug 05 #Python
Python Socket实现简单TCP Server/client功能示例
Aug 05 #Python
对pandas的dataframe绘图并保存的实现方法
Aug 05 #Python
解决PyCharm中光标变粗的问题
Aug 05 #Python
Python实现的中国剩余定理算法示例
Aug 05 #Python
python爬虫_自动获取seebug的poc实例
Aug 05 #Python
python中的break、continue、exit()、pass全面解析
Aug 05 #Python
You might like
php 3行代码的分页算法(求起始页和结束页)
2009/10/21 PHP
php自定义session示例分享
2014/04/22 PHP
php中有关合并某一字段键值相同的数组合并的改进
2015/03/10 PHP
Smarty中的注释和截断功能介绍
2015/04/09 PHP
基于PHP给大家讲解防刷票的一些技巧
2015/11/18 PHP
php多进程并发编程防止出现僵尸进程的方法分析
2020/02/28 PHP
js里怎么取select标签里的值并修改
2012/12/10 Javascript
extjs两个tbar问题探讨
2013/08/08 Javascript
调用DOM对象的focus使文本框获得焦点
2014/02/19 Javascript
js中一维数组和二位数组中的几个问题示例说明
2014/07/17 Javascript
jQuery插件kinMaxShow扩展效果用法实例
2015/05/04 Javascript
对称加密与非对称加密优缺点详解
2017/02/06 Javascript
RequireJs的使用详解
2017/02/19 Javascript
JavaScript中无法通过div.style.left获取值的解决方法
2017/02/19 Javascript
jQuery animate()实现背景色渐变效果的处理方法【使用jQuery.color.js插件】
2017/03/15 Javascript
Vue-cropper 图片裁剪的基本原理及思路讲解
2018/04/17 Javascript
浅谈Vue的响应式原理
2019/05/30 Javascript
vue中解决chrome浏览器自动播放音频和MP3语音打包到线上的实现方法
2020/10/09 Javascript
Python 专题五 列表基础知识(二维list排序、获取下标和处理txt文本实例)
2017/03/20 Python
Python基于回溯法子集树模板解决马踏棋盘问题示例
2017/09/11 Python
Python 网络爬虫--关于简单的模拟登录实例讲解
2018/06/01 Python
pandas.DataFrame的pivot()和unstack()实现行转列
2019/07/06 Python
python scipy卷积运算的实现方法
2019/09/16 Python
wxPython窗体拆分布局基础组件
2019/11/19 Python
微信html5页面调用第三方位置导航的示例
2018/03/14 HTML / CSS
美国著名的婴儿学步鞋老品牌:Robeez
2016/08/20 全球购物
美国知名的时尚购物网站:Anthropologie
2016/12/22 全球购物
路由表示做什么用的?在linux环境中怎么来配置一条默认路由?
2013/06/07 面试题
商场拾金不昧表扬信
2014/01/13 职场文书
应届大学生简历中的自我评价
2014/01/15 职场文书
优秀老员工获奖感言
2014/02/15 职场文书
综治宣传月活动总结
2014/04/28 职场文书
初中英语演讲稿
2014/04/29 职场文书
小学教师师德演讲稿
2014/05/06 职场文书
房屋转让协议书(标准范本)
2016/03/21 职场文书
为Centos安装指定版本的Docker
2022/04/01 Servers