Python3实现爬虫爬取赶集网列表功能【基于request和BeautifulSoup模块】


Posted in Python onDecember 05, 2018

本文实例讲述了Python3实现爬虫爬取赶集网列表功能。分享给大家供大家参考,具体如下:

python3爬虫之爬取赶集网列表。这几天一直在学习使用python3爬取数据,今天记录一下,代码很简单很容易上手。

首先需要安装python3。如果还没有安装,可参考本站前面关于python3安装与配置相关文章。

首先需要安装request和BeautifulSoup两个模块

request是Python的HTTP网络请求模块,使用Requests可以轻而易举的完成浏览器可有的任何操作

pip install requests

BeautifulSoup是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树

pip install beautifulsoup4

代码:

from urllib import request
from bs4 import BeautifulSoup
#构造头文件,模拟浏览器访问
url="http://xa.ganji.com/meirdjm/o2/"
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36'}
page = request.Request(url,headers=headers)
# 发送请求,获取内容
page_info = request.urlopen(page).read().decode('utf-8')
# 将获取到的内容转换成BeautifulSoup格式,并将html.parser作为解析器
soup = BeautifulSoup(page_info, 'html.parser')
# 查找所有a标签中class='list-info-title'
titles = soup.find_all('a',class_="list-info-title")
# 打印抓取到的title
for title in titles:
 print(title.string)

结果:

Python3实现爬虫爬取赶集网列表功能【基于request和BeautifulSoup模块】

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
使用Python3制作TCP端口扫描器
Apr 17 Python
python自动查询12306余票并发送邮箱提醒脚本
May 21 Python
详解Python if-elif-else知识点
Jun 11 Python
对Python3 pyc 文件的使用详解
Feb 16 Python
python 字典套字典或列表的示例
Dec 16 Python
OpenCV python sklearn随机超参数搜索的实现
Jan 17 Python
python词云库wordcloud的使用方法与实例详解
Feb 17 Python
Python多线程thread及模块使用实例
Apr 28 Python
Python项目跨域问题解决方案
Jun 22 Python
pandas map(),apply(),applymap()区别解析
Feb 24 Python
Python中Cookies导出某站用户数据的方法
May 17 Python
Python中 range | np.arange | np.linspace三者的区别
Mar 22 Python
对python opencv 添加文字 cv2.putText 的各参数介绍
Dec 05 #Python
Python寻找两个有序数组的中位数实例详解
Dec 05 #Python
解决Python下imread,imwrite不支持中文的问题
Dec 05 #Python
python批量下载网站马拉松照片的完整步骤
Dec 05 #Python
解决python3中cv2读取中文路径的问题
Dec 05 #Python
利用Python求阴影部分的面积实例代码
Dec 05 #Python
python之cv2与图像的载入、显示和保存实例
Dec 05 #Python
You might like
PHP 5.3.1 安装包 VC9 VC6不同版本的区别是什么
2010/07/04 PHP
用PHP读取和编写XML DOM的实现代码
2011/02/03 PHP
php获取本机真实IP地址实例代码
2016/03/31 PHP
Node.js的MongoDB驱动Mongoose基本使用教程
2016/03/01 Javascript
使用JQuery实现智能表单验证功能
2016/03/08 Javascript
基于jquery实现智能表单验证操作
2016/05/09 Javascript
深入剖析JavaScript:Object类型
2016/05/10 Javascript
jQuery实现圣诞节礼物动画案例解析
2016/12/25 Javascript
利用Angular2 + Ionic3开发IOS应用实例教程
2018/01/15 Javascript
微信 jssdk 签名错误invalid signature的解决方法
2019/01/14 Javascript
JS/CSS实现字符串单词首字母大写功能
2019/09/03 Javascript
layui多图上传实现删除功能的例子
2019/09/23 Javascript
js面向对象之实现淘宝放大镜
2020/01/15 Javascript
vue 中的 render 函数作用详解
2020/02/28 Javascript
JavaScript实现HTML导航栏下拉菜单
2020/11/25 Javascript
JavaScript中的几种继承方法示例
2020/12/06 Javascript
Python入门学习之字符串与比较运算符
2015/10/12 Python
Python爬虫实例爬取网站搞笑段子
2017/11/08 Python
Python抓取框架Scrapy爬虫入门:页面提取
2017/12/01 Python
python+matplotlib绘制旋转椭圆实例代码
2018/01/12 Python
python调用外部程序的实操步骤
2019/03/04 Python
使用python动态生成波形曲线的实现
2019/12/04 Python
利用Pytorch实现简单的线性回归算法
2020/01/15 Python
Speedo澳大利亚官网:全球领先游泳品牌
2018/02/04 全球购物
美国社交购物市场:MassGenie
2019/02/18 全球购物
什么是符号链接,什么是硬链接?符号链接与硬链接的区别是什么?
2013/05/03 面试题
Python是如何进行类型转换的
2013/06/09 面试题
大学同学聚会邀请函
2014/01/29 职场文书
自主招生自荐信指南
2014/02/04 职场文书
《理想的风筝》教学反思
2014/04/11 职场文书
对照四风自我剖析材料
2014/10/07 职场文书
初婚未育证明样本
2014/10/24 职场文书
廉政承诺书2015
2015/04/28 职场文书
2015年中秋放假通知范文
2015/08/18 职场文书
《学会看病》教学反思
2016/02/17 职场文书
yolov5返回坐标的方法实例
2022/03/17 Python