Python实现抓取网页生成Excel文件的方法示例


Posted in Python onAugust 05, 2017

本文实例讲述了Python实现抓取网页生成Excel文件的方法。分享给大家供大家参考,具体如下:

Python抓网页,主要用到了PyQuery,这个跟jQuery用法一样,超级给力

示例代码如下:

#-*- encoding:utf-8 -*-
import sys
import locale
import string
import traceback
import datetime
import urllib2
from pyquery import PyQuery as pq
# 确定运行环境的encoding
reload(sys);
sys.setdefaultencoding('utf8');
f = open('gongsi.csv', 'w');
for i in range(1,24):
  d = pq(url="http://www.yourwebname.com/?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i));
  itemsa=d('dl dt a') #取title元素
  itemsb=d('dl dd') #取title元素
  for j in range(0,len(itemsa)):
    f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text));
  #end for
#end for
f.close();

接下来就是用Notepad++打开gongsi.csv,然后转成ANSI编码格式,保存。再用Excel软件打开这个csv文件,另存为Excel文件

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python中设置变量作为默认值时容易遇到的错误
Apr 03 Python
python fabric使用笔记
May 09 Python
Python 加密的实例详解
Oct 09 Python
使用python Telnet远程登录执行程序的方法
Jan 26 Python
一行python实现树形结构的方法
Aug 09 Python
python实现的登录与提交表单数据功能示例
Sep 25 Python
python实现差分隐私Laplace机制详解
Nov 25 Python
详解python opencv、scikit-image和PIL图像处理库比较
Dec 26 Python
TensorBoard 计算图的可视化实现
Feb 15 Python
PyCharm取消波浪线、下划线和中划线的实现
Mar 03 Python
最新PyCharm从安装到PyCharm永久激活再到PyCharm官方中文汉化详细教程
Nov 17 Python
python 数据类型强制转换的总结
Jan 25 Python
Python基于Socket实现的简单聊天程序示例
Aug 05 #Python
Python Socket实现简单TCP Server/client功能示例
Aug 05 #Python
对pandas的dataframe绘图并保存的实现方法
Aug 05 #Python
解决PyCharm中光标变粗的问题
Aug 05 #Python
Python实现的中国剩余定理算法示例
Aug 05 #Python
python爬虫_自动获取seebug的poc实例
Aug 05 #Python
python中的break、continue、exit()、pass全面解析
Aug 05 #Python
You might like
用PHP将数据导入到Foxmail
2006/10/09 PHP
php中0,null,empty,空,false,字符串关系的详细介绍
2013/06/20 PHP
PHP树-不需要递归的实现方法
2016/06/21 PHP
javascript学习笔记(二) js一些基本概念
2012/06/18 Javascript
extjs render 用法介绍
2013/09/11 Javascript
js实现跨域的方法实例详解
2015/06/24 Javascript
日常收藏的jquery技巧
2015/12/02 Javascript
解决JavaScript数字精度丢失问题的方法
2015/12/03 Javascript
Node.js的Web模板引擎ejs的入门使用教程
2016/06/06 Javascript
Node.js中的require.resolve方法使用简介
2017/04/23 Javascript
underscore之Chaining_动力节点Java学院整理
2017/07/10 Javascript
使用JS实现图片轮播的实例(前后首尾相接)
2017/09/21 Javascript
浅谈Angularjs中不同类型的双向数据绑定
2018/07/16 Javascript
elementUI select组件value值注意事项详解
2019/05/29 Javascript
Vue自定义指令结合阿里云OSS优化图片的实现方法
2019/11/12 Javascript
js实现限定范围拖拽的示例
2020/10/26 Javascript
关于JavaScript中异步/等待的用法与理解
2020/11/18 Javascript
简单介绍Python中的struct模块
2015/04/28 Python
Python3读取zip文件信息的方法
2015/05/22 Python
python 截取 取出一部分的字符串方法
2017/03/01 Python
windows下numpy下载与安装图文教程
2019/04/02 Python
六行python代码的爱心曲线详解
2019/05/17 Python
Python-while 计算100以内奇数和的方法
2019/06/11 Python
JupyterNotebook设置Python环境的方法步骤
2019/12/03 Python
Python3 Click模块的使用方法详解
2020/02/12 Python
阿迪达斯新加坡官方网站:adidas新加坡
2019/12/06 全球购物
是否可以从一个static方法内部发出对非static方法的调用?
2014/08/18 面试题
篮球比赛策划方案
2014/06/05 职场文书
火锅店的活动方案
2014/08/15 职场文书
银行授权委托书格式
2014/10/10 职场文书
忠诚与背叛观后感
2015/06/04 职场文书
高中数学教学反思范文
2016/02/18 职场文书
python生成可执行exe控制Microsip自动填写号码并拨打功能
2021/06/21 Python
python实现简易自习室座位预约系统
2021/06/30 Python
mysql中DCL常用的用户和权限控制
2022/03/31 MySQL
解决ubuntu安装软件时,status-code=409报错的问题
2022/12/24 Servers