Python实现抓取网页生成Excel文件的方法示例


Posted in Python onAugust 05, 2017

本文实例讲述了Python实现抓取网页生成Excel文件的方法。分享给大家供大家参考,具体如下:

Python抓网页,主要用到了PyQuery,这个跟jQuery用法一样,超级给力

示例代码如下:

#-*- encoding:utf-8 -*-
import sys
import locale
import string
import traceback
import datetime
import urllib2
from pyquery import PyQuery as pq
# 确定运行环境的encoding
reload(sys);
sys.setdefaultencoding('utf8');
f = open('gongsi.csv', 'w');
for i in range(1,24):
  d = pq(url="http://www.yourwebname.com/?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i));
  itemsa=d('dl dt a') #取title元素
  itemsb=d('dl dd') #取title元素
  for j in range(0,len(itemsa)):
    f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text));
  #end for
#end for
f.close();

接下来就是用Notepad++打开gongsi.csv,然后转成ANSI编码格式,保存。再用Excel软件打开这个csv文件,另存为Excel文件

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python小技巧之批量抓取美女图片
Jun 06 Python
python 日期操作类代码
May 05 Python
对Django url的几种使用方式详解
Aug 06 Python
python3.6生成器yield用法实例分析
Aug 23 Python
Python数据存储之 h5py详解
Dec 26 Python
基于keras 模型、结构、权重保存的实现
Jan 24 Python
opencv python图像梯度实例详解
Feb 04 Python
python shell命令行中import多层目录下的模块操作
Mar 09 Python
python递归调用中的坑:打印有值, 返回却None
Mar 16 Python
python实现图像全景拼接
Mar 27 Python
python3.7+selenium模拟淘宝登录功能的实现
May 26 Python
python 实现网易邮箱邮件阅读和删除的辅助小脚本
Mar 01 Python
Python基于Socket实现的简单聊天程序示例
Aug 05 #Python
Python Socket实现简单TCP Server/client功能示例
Aug 05 #Python
对pandas的dataframe绘图并保存的实现方法
Aug 05 #Python
解决PyCharm中光标变粗的问题
Aug 05 #Python
Python实现的中国剩余定理算法示例
Aug 05 #Python
python爬虫_自动获取seebug的poc实例
Aug 05 #Python
python中的break、continue、exit()、pass全面解析
Aug 05 #Python
You might like
Terran建筑一览
2020/03/14 星际争霸
PHP日期处理函数 整型日期格式
2011/01/12 PHP
php 抽象类的简单应用
2011/09/06 PHP
通过curl模拟post和get方式提交的表单类
2014/04/23 PHP
PHP+jquery+CSS制作头像登录窗(仿QQ登陆)
2016/10/20 PHP
使用正则去除php代码中的注释方法
2016/11/03 PHP
js停止输出代码
2008/07/20 Javascript
javascript函数中的arguments参数
2010/08/01 Javascript
jquery Moblie入门—hello world的示例代码学习
2013/01/08 Javascript
封装了一个支持匿名函数的Javascript事件监听器
2014/06/05 Javascript
Javascript中的delete操作符详细介绍
2014/06/06 Javascript
Node.js中使用mongoskin操作mongoDB实例
2014/09/28 Javascript
javascript中clipboardData对象用法详解
2015/05/13 Javascript
JavaScript实现的仿新浪微博原生态输入字数即时检查功能【兼容IE6】
2017/09/26 Javascript
vue非父子组件通信问题及解决方法
2018/06/11 Javascript
微信小程序如何获取地址
2019/12/24 Javascript
微信小程序实现点击页面出现文字
2020/09/21 Javascript
vue使用echarts图表自适应的几种解决方案
2020/12/04 Vue.js
详解C++编程中一元运算符的重载
2016/01/19 Python
从源码解析Python的Flask框架中request对象的用法
2016/06/02 Python
python中map()函数的使用方法示例
2017/09/29 Python
Python项目打包成二进制的方法
2020/12/30 Python
基于DOM+CSS3实现OrgChart组织结构图插件
2016/03/02 HTML / CSS
国际贸易专业推荐信
2013/11/15 职场文书
四年的大学生生活自我评价
2013/12/09 职场文书
中级会计职业生涯规划范文
2014/01/16 职场文书
《九寨沟》教学反思
2014/04/08 职场文书
民警个人对照检查剖析材料
2014/09/17 职场文书
开业庆典活动策划方案
2014/09/21 职场文书
2017年大学生寒假社会实践活动总结
2016/04/06 职场文书
用人单位的规章制度,怎样制定才是有效的?
2019/07/09 职场文书
导游词之上海东方明珠塔
2019/09/25 职场文书
教你如何用Python实现人脸识别(含源代码)
2021/06/23 Python
C#连接ORACLE出现乱码问题的解决方法
2021/10/05 Oracle
python基础之文件操作
2021/10/24 Python
Python使用plt.boxplot()函数绘制箱图、常用方法以及含义详解
2022/08/14 Python