Python实现抓取网页生成Excel文件的方法示例


Posted in Python onAugust 05, 2017

本文实例讲述了Python实现抓取网页生成Excel文件的方法。分享给大家供大家参考,具体如下:

Python抓网页,主要用到了PyQuery,这个跟jQuery用法一样,超级给力

示例代码如下:

#-*- encoding:utf-8 -*-
import sys
import locale
import string
import traceback
import datetime
import urllib2
from pyquery import PyQuery as pq
# 确定运行环境的encoding
reload(sys);
sys.setdefaultencoding('utf8');
f = open('gongsi.csv', 'w');
for i in range(1,24):
  d = pq(url="http://www.yourwebname.com/?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i));
  itemsa=d('dl dt a') #取title元素
  itemsb=d('dl dd') #取title元素
  for j in range(0,len(itemsa)):
    f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text));
  #end for
#end for
f.close();

接下来就是用Notepad++打开gongsi.csv,然后转成ANSI编码格式,保存。再用Excel软件打开这个csv文件,另存为Excel文件

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python开发常用的一些开源Package分享
Feb 14 Python
讲解Python中的标识运算符
May 14 Python
使用Python求解最大公约数的实现方法
Aug 20 Python
Django视图之ORM数据库查询操作API的实例
Oct 27 Python
python reduce 函数使用详解
Dec 05 Python
python实现五子棋小游戏
Mar 25 Python
python 动态调用函数实例解析
Oct 21 Python
Python之Class&Object用法详解
Dec 25 Python
如何在django中添加日志功能
Feb 06 Python
Python不支持 i ++ 语法的原因解析
Jul 22 Python
Python如何给函数库增加日志功能
Aug 04 Python
解决python存数据库速度太慢的问题
Apr 23 Python
Python基于Socket实现的简单聊天程序示例
Aug 05 #Python
Python Socket实现简单TCP Server/client功能示例
Aug 05 #Python
对pandas的dataframe绘图并保存的实现方法
Aug 05 #Python
解决PyCharm中光标变粗的问题
Aug 05 #Python
Python实现的中国剩余定理算法示例
Aug 05 #Python
python爬虫_自动获取seebug的poc实例
Aug 05 #Python
python中的break、continue、exit()、pass全面解析
Aug 05 #Python
You might like
利用ThinkPHP内置的ThinkAjax实现异步传输技术的实现方法
2011/12/19 PHP
PHP配置把错误日志以邮件方式发送方法(Windows系统)
2015/06/23 PHP
php注册审核重点解析(数据访问)
2017/05/23 PHP
取选中的radio的值
2010/01/11 Javascript
基于jquery的地址栏射击游戏代码
2011/03/10 Javascript
使用Jquery来实现可以输入值的下拉选单 雏型
2011/12/06 Javascript
文本框获得焦点和失去焦点的判断代码
2012/03/18 Javascript
javascript的渐进增强与平稳退化浅谈
2013/11/12 Javascript
node.js中的console用法总结
2014/12/15 Javascript
用js编写的简单的计算器代码程序
2015/08/04 Javascript
20分钟轻松创建自己的Bootstrap站点
2016/05/12 Javascript
Node.js Buffer用法解读
2018/05/18 Javascript
layui的table单击行勾选checkbox功能方法
2018/08/14 Javascript
浅谈Vue页面级缓存解决方案feb-alive(上)
2019/04/14 Javascript
jQuery创建折叠式菜单
2019/06/15 jQuery
在vue中高德地图引入和轨迹的绘制的实现
2019/10/11 Javascript
[01:01:13]2018DOTA2亚洲邀请赛 4.5 淘汰赛 Mineski vs VG 第三场
2018/04/06 DOTA
[01:28]一分钟告诉你DOTA2 TI9不朽宝藏Ⅱ中有什么!
2019/07/09 DOTA
python求列表交集的方法汇总
2014/11/10 Python
在Python程序中操作文件之flush()方法的使用教程
2015/05/24 Python
Windows下Anaconda的安装和简单使用方法
2018/01/04 Python
Python3爬虫学习之应对网站反爬虫机制的方法分析
2018/12/12 Python
selenium python 实现基本自动化测试的示例代码
2019/02/25 Python
基于Python测试程序是否有错误
2020/05/16 Python
python能做哪方面的工作
2020/06/15 Python
python制作微博图片爬取工具
2021/01/16 Python
Manuka Doctor英国官网:真正的麦卢卡蜂蜜和护肤品
2018/10/26 全球购物
汽车专业毕业生推荐信
2013/11/12 职场文书
安全责任书范本
2014/04/15 职场文书
一岗双责责任书
2014/04/15 职场文书
同意迁入证明模板
2014/10/26 职场文书
2015年组织委员工作总结
2015/04/23 职场文书
2015年物资管理工作总结
2015/05/20 职场文书
简爱电影观后感
2015/06/10 职场文书
Python控制台输出俄罗斯方块的方法实例
2021/04/17 Python
PC版《死亡搁浅导剪版》现已发售 展开全新的探险
2022/04/03 其他游戏