Python3实现爬虫爬取赶集网列表功能【基于request和BeautifulSoup模块】


Posted in Python onDecember 05, 2018

本文实例讲述了Python3实现爬虫爬取赶集网列表功能。分享给大家供大家参考,具体如下:

python3爬虫之爬取赶集网列表。这几天一直在学习使用python3爬取数据,今天记录一下,代码很简单很容易上手。

首先需要安装python3。如果还没有安装,可参考本站前面关于python3安装与配置相关文章。

首先需要安装request和BeautifulSoup两个模块

request是Python的HTTP网络请求模块,使用Requests可以轻而易举的完成浏览器可有的任何操作

pip install requests

BeautifulSoup是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树

pip install beautifulsoup4

代码:

from urllib import request
from bs4 import BeautifulSoup
#构造头文件,模拟浏览器访问
url="http://xa.ganji.com/meirdjm/o2/"
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36'}
page = request.Request(url,headers=headers)
# 发送请求,获取内容
page_info = request.urlopen(page).read().decode('utf-8')
# 将获取到的内容转换成BeautifulSoup格式,并将html.parser作为解析器
soup = BeautifulSoup(page_info, 'html.parser')
# 查找所有a标签中class='list-info-title'
titles = soup.find_all('a',class_="list-info-title")
# 打印抓取到的title
for title in titles:
 print(title.string)

结果:

Python3实现爬虫爬取赶集网列表功能【基于request和BeautifulSoup模块】

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python实现找出数组中第2大数字的方法示例
Mar 26 Python
python 运用Django 开发后台接口的实例
Dec 11 Python
Python输出\u编码将其转换成中文的实例
Dec 15 Python
Python实现的栈、队列、文件目录遍历操作示例
May 06 Python
在PyTorch中Tensor的查找和筛选例子
Aug 18 Python
django 做 migrate 时 表已存在的处理方法
Aug 31 Python
Python中的延迟绑定原理详解
Oct 11 Python
Python实现栈和队列的简单操作方法示例
Nov 29 Python
python numpy数组中的复制知识解析
Feb 03 Python
python由已知数组快速生成新数组的方法
Apr 08 Python
Python中socket网络通信是干嘛的
May 27 Python
详解pandas.DataFrame.plot() 画图函数
Jun 14 Python
对python opencv 添加文字 cv2.putText 的各参数介绍
Dec 05 #Python
Python寻找两个有序数组的中位数实例详解
Dec 05 #Python
解决Python下imread,imwrite不支持中文的问题
Dec 05 #Python
python批量下载网站马拉松照片的完整步骤
Dec 05 #Python
解决python3中cv2读取中文路径的问题
Dec 05 #Python
利用Python求阴影部分的面积实例代码
Dec 05 #Python
python之cv2与图像的载入、显示和保存实例
Dec 05 #Python
You might like
php mysql数据库操作类
2008/06/04 PHP
PHP中MD5函数使用实例代码
2008/06/07 PHP
ajax php传递和接收变量实现思路及代码
2012/12/19 PHP
使用php显示搜索引擎来的关键词
2014/02/13 PHP
php实现用已经过去多长时间的方式显示时间
2015/06/05 PHP
php metaphone()函数及php localeconv() 函数实例解析
2016/05/15 PHP
PHP CURL post数据报错 failed creating formpost data
2016/10/16 PHP
Javascript 文件夹选择框的两种解决方案
2009/07/01 Javascript
Javascript的getYear、getFullYear、getUTCFullYear异同分享
2011/11/30 Javascript
修改jQuery Validation里默认的验证方法
2012/02/14 Javascript
解决jquery的datepicker的本地化以及Today问题
2012/05/23 Javascript
Javascript中 关于prototype属性实现继承的原理图
2013/04/16 Javascript
js复制到剪切板的实例方法
2013/06/28 Javascript
jquery滚动加载数据的方法
2015/03/09 Javascript
D3.js实现折线图的方法详解
2016/09/21 Javascript
jQuery模拟下拉框选择对应菜单的内容
2017/03/07 Javascript
详解vue渲染函数render的使用
2017/12/12 Javascript
JavaScript+H5实现微信摇一摇功能
2018/05/23 Javascript
vuex入门最详细整理
2020/03/04 Javascript
python变量不能以数字打头详解
2016/07/06 Python
对Python3中dict.keys()转换成list类型的方法详解
2019/02/03 Python
python tools实现视频的每一帧提取并保存
2020/03/20 Python
pycharm不以pytest方式运行,想要切换回普通模式运行的操作
2020/09/01 Python
python 写一个水果忍者游戏
2021/01/13 Python
美国市场上最实惠的送餐服务:Dinnerly
2018/03/18 全球购物
Lentiamo比利时:便宜的隐形眼镜
2020/02/14 全球购物
会计的岗位职责
2014/03/15 职场文书
《动手做做看》教学反思
2014/04/09 职场文书
计算机系统管理员求职信
2014/06/20 职场文书
解除劳动合同协议书(样本)
2014/10/02 职场文书
第二批党的群众路线教育实践活动总结报告
2014/10/30 职场文书
2014年安全保卫工作总结
2014/11/13 职场文书
公安干警正风肃纪心得体会
2016/01/15 职场文书
2016大学生就业指导课心得体会
2016/01/15 职场文书
python基于tkinter制作无损音乐下载工具
2021/03/29 Python
Golang 并发编程 SingleFlight模式
2022/04/26 Golang