python爬虫爬取网页表格数据


Posted in Python onMarch 07, 2018

用python爬取网页表格数据,供大家参考,具体内容如下

from bs4 import BeautifulSoup 
import requests 
import csv 
import bs4 
 
 
#检查url地址 
def check_link(url): 
 try: 
   
  r = requests.get(url) 
  r.raise_for_status() 
  r.encoding = r.apparent_encoding 
  return r.text 
 except: 
  print('无法链接服务器!!!') 
 
 
#爬取资源 
def get_contents(ulist,rurl): 
 soup = BeautifulSoup(rurl,'lxml') 
 trs = soup.find_all('tr') 
 for tr in trs: 
  ui = [] 
  for td in tr: 
   ui.append(td.string) 
  ulist.append(ui) 
  
#保存资源 
def save_contents(urlist): 
 with open("D:/2016年中国企业500强排行榜.csv",'w') as f: 
  writer = csv.writer(f) 
  writer.writerow(['2016年中国企业500强排行榜']) 
  for i in range(len(urlist)): 
   writer.writerow([urlist[i][1],urlist[i][3],urlist[i][5]]) 
def main(): 
 urli = [] 
 url = "http://www.maigoo.com/news/463071.html" 
 rs = check_link(url) 
 get_contents(urli,rs) 
 save_contents(urli) 
 
main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python+Opencv识别两张相似图片
Mar 23 Python
详解Python中表达式i += x与i = i + x是否等价
Feb 08 Python
使用Python3制作TCP端口扫描器
Apr 17 Python
python3+PyQt5图形项的自定义和交互 python3实现page Designer应用程序
Jul 20 Python
Python使用 Beanstalkd 做异步任务处理的方法
Apr 24 Python
Python判断一个三位数是否为水仙花数的示例
Nov 13 Python
python 计算数据偏差和峰度的方法
Jun 29 Python
python sorted方法和列表使用解析
Nov 18 Python
用pandas划分数据集实现训练集和测试集
Jul 20 Python
pandas将list数据拆分成行或列的实现
Dec 13 Python
python实现大文本文件分割成多个小文件
Apr 20 Python
python开发的自动化运维工具ansible详解
Aug 07 Python
python使用mysql的两种使用方式
Mar 07 #Python
python表格存取的方法
Mar 07 #Python
Django中Model的使用方法教程
Mar 07 #Python
python使用opencv按一定间隔截取视频帧
Mar 06 #Python
python+ffmpeg视频并发直播压力测试
Mar 06 #Python
小白如何入门Python? 制作一个网站为例
Mar 06 #Python
python调用系统ffmpeg实现视频截图、http发送
Mar 06 #Python
You might like
德生S2000收音机更换“钕铁硼”全频扬声器
2021/03/02 无线电
缅甸的咖啡简史
2021/03/04 咖啡文化
PHP实现一维数组转二维数组的方法
2015/02/25 PHP
浅谈PHP发送HTTP请求的几种方式
2017/07/25 PHP
laravel5.4生成验证码的实例讲解
2017/08/05 PHP
PHP实现长轮询消息实时推送功能代码实例讲解
2021/02/26 PHP
AngularJS学习笔记(三)数据双向绑定的简单实例
2016/11/08 Javascript
nodejs实例解析(输出hello world)
2017/01/03 NodeJs
jquery与ajax获取特殊字符实例详解
2017/01/08 Javascript
JavaScript实现购物车基本功能
2017/07/21 Javascript
使用ajax的post同步执行(实现方法)
2017/12/21 Javascript
Webpack中publicPath路径问题详解
2018/05/03 Javascript
基于webpack4搭建的react项目框架的方法
2018/06/30 Javascript
Vue递归实现树形菜单方法实例
2018/11/06 Javascript
angular 实现同步验证器跨字段验证的方法
2019/04/11 Javascript
使用vuex存储用户信息到localStorage的实例
2019/11/11 Javascript
javascript 原型与原型链的理解及应用实例分析
2020/02/10 Javascript
vue.js this.$router.push获取不到params参数问题
2020/03/03 Javascript
详解ES6数组方法find()、findIndex()的总结
2020/05/12 Javascript
基于Vue中的父子传值问题解决
2020/07/27 Javascript
netbeans7安装python插件的方法图解
2013/12/24 Python
pycharm 使用心得(六)进行简单的数据库管理
2014/06/06 Python
Python中的ctime()方法使用教程
2015/05/22 Python
Python子类继承父类构造函数详解
2019/02/19 Python
Python实战之制作天气查询软件
2019/05/14 Python
Python实现bilibili时间长度查询的示例代码
2020/01/14 Python
Keras模型转成tensorflow的.pb操作
2020/07/06 Python
北美最大的手工艺品零售商之一:Michaels Stores
2019/02/27 全球购物
英国最大的在线照明商店:Litecraft
2020/08/31 全球购物
体育教育毕业生自荐信
2013/11/21 职场文书
新闻记者个人求职的自我评价
2013/11/28 职场文书
应届毕业生求职信
2013/11/30 职场文书
2014年党课学习材料
2014/05/11 职场文书
房产公证书样本
2015/01/23 职场文书
西游记读书笔记
2015/06/25 职场文书
婚礼嘉宾致辞
2015/07/28 职场文书