Python3实现爬虫爬取赶集网列表功能【基于request和BeautifulSoup模块】


Posted in Python onDecember 05, 2018

本文实例讲述了Python3实现爬虫爬取赶集网列表功能。分享给大家供大家参考,具体如下:

python3爬虫之爬取赶集网列表。这几天一直在学习使用python3爬取数据,今天记录一下,代码很简单很容易上手。

首先需要安装python3。如果还没有安装,可参考本站前面关于python3安装与配置相关文章。

首先需要安装request和BeautifulSoup两个模块

request是Python的HTTP网络请求模块,使用Requests可以轻而易举的完成浏览器可有的任何操作

pip install requests

BeautifulSoup是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树

pip install beautifulsoup4

代码:

from urllib import request
from bs4 import BeautifulSoup
#构造头文件,模拟浏览器访问
url="http://xa.ganji.com/meirdjm/o2/"
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36'}
page = request.Request(url,headers=headers)
# 发送请求,获取内容
page_info = request.urlopen(page).read().decode('utf-8')
# 将获取到的内容转换成BeautifulSoup格式,并将html.parser作为解析器
soup = BeautifulSoup(page_info, 'html.parser')
# 查找所有a标签中class='list-info-title'
titles = soup.find_all('a',class_="list-info-title")
# 打印抓取到的title
for title in titles:
 print(title.string)

结果:

Python3实现爬虫爬取赶集网列表功能【基于request和BeautifulSoup模块】

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python基础之getpass模块详细介绍
Aug 10 Python
Python内置模块hashlib、hmac与uuid用法分析
Feb 12 Python
Python实现批量读取图片并存入mongodb数据库的方法示例
Apr 02 Python
攻击者是如何将PHP Phar包伪装成图像以绕过文件类型检测的(推荐)
Oct 11 Python
利用Django模版生成树状结构实例代码
May 19 Python
一篇文章弄懂Python中的可迭代对象、迭代器和生成器
Aug 12 Python
解决Numpy中sum函数求和结果维度的问题
Dec 06 Python
Python字符串中删除特定字符的方法
Jan 15 Python
python 穷举指定长度的密码例子
Apr 02 Python
python编写扎金花小程序的实例代码
Feb 23 Python
python 如何执行控制台命令与操作剪切板
May 20 Python
Python绘画好看的星空图
Mar 17 Python
对python opencv 添加文字 cv2.putText 的各参数介绍
Dec 05 #Python
Python寻找两个有序数组的中位数实例详解
Dec 05 #Python
解决Python下imread,imwrite不支持中文的问题
Dec 05 #Python
python批量下载网站马拉松照片的完整步骤
Dec 05 #Python
解决python3中cv2读取中文路径的问题
Dec 05 #Python
利用Python求阴影部分的面积实例代码
Dec 05 #Python
python之cv2与图像的载入、显示和保存实例
Dec 05 #Python
You might like
完善CodeIgniter在IDE中代码提示功能的方法
2014/07/19 PHP
thinkphp实现like模糊查询实例
2014/10/29 PHP
Smarty模板引擎缓存机制详解
2016/05/23 PHP
php 比较获取两个数组相同和不同元素的例子(交集和差集)
2019/10/18 PHP
摘自百度的图片轮换效果代码
2007/11/19 Javascript
IE8 引入跨站数据获取功能说明
2008/07/22 Javascript
[推荐]javascript 面向对象技术基础教程
2009/03/03 Javascript
JQuery Tips(3) 关于$()包装集内元素的改变
2009/12/14 Javascript
使用dynatrace-ajax跟踪JavaScript的性能
2010/04/12 Javascript
JS onmousemove鼠标移动坐标接龙DIV效果实例
2013/12/16 Javascript
5个数组Array方法: indexOf、filter、forEach、map、reduce使用实例
2015/01/29 Javascript
SpringMVC框架下JQuery传递并解析Json格式的数据是如何实现的
2015/12/10 Javascript
jquery实现的判断倒计时是否结束代码
2016/02/05 Javascript
实用又漂亮的BootstrapValidator表单验证插件
2016/05/30 Javascript
JavaScript中 ES6 generator数据类型详解
2016/08/11 Javascript
纯JS实现图片验证码功能并兼容IE6-8(推荐)
2017/04/19 Javascript
使用Require.js封装原生js轮播图的实现代码
2017/06/15 Javascript
vue使用Google地图的实现示例代码
2018/12/19 Javascript
基于Vue插入视频的2种方法小结
2019/04/02 Javascript
js实现鼠标切换图片(无定时器)
2021/01/27 Javascript
详解Python中表达式i += x与i = i + x是否等价
2017/02/08 Python
Python 新建文件夹与复制文件夹内所有内容的方法
2018/10/27 Python
python面向对象实现名片管理系统文件版
2019/04/26 Python
Python实现发票自动校核微信机器人的方法
2020/05/22 Python
安装Anaconda3及使用Jupyter的方法
2020/10/27 Python
PHP数据运算类型都有哪些
2013/11/05 面试题
连锁经营管理专业大学生求职信
2013/10/30 职场文书
管理部副部长岗位职责范文
2014/03/09 职场文书
《诚实与信任》教学反思
2014/04/10 职场文书
2015年党建工作总结
2015/03/30 职场文书
合同纠纷调解书
2015/05/20 职场文书
2015年小学美术工作总结
2015/05/25 职场文书
少年犯观后感
2015/06/11 职场文书
学校安全管理制度
2015/08/06 职场文书
车辆挂靠协议书
2016/03/23 职场文书
MySQL 表锁定 LOCK和UNLOCK TABLES的 SQL语法
2022/04/18 MySQL