Python3实现爬虫爬取赶集网列表功能【基于request和BeautifulSoup模块】


Posted in Python onDecember 05, 2018

本文实例讲述了Python3实现爬虫爬取赶集网列表功能。分享给大家供大家参考,具体如下:

python3爬虫之爬取赶集网列表。这几天一直在学习使用python3爬取数据,今天记录一下,代码很简单很容易上手。

首先需要安装python3。如果还没有安装,可参考本站前面关于python3安装与配置相关文章。

首先需要安装request和BeautifulSoup两个模块

request是Python的HTTP网络请求模块,使用Requests可以轻而易举的完成浏览器可有的任何操作

pip install requests

BeautifulSoup是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树

pip install beautifulsoup4

代码:

from urllib import request
from bs4 import BeautifulSoup
#构造头文件,模拟浏览器访问
url="http://xa.ganji.com/meirdjm/o2/"
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36'}
page = request.Request(url,headers=headers)
# 发送请求,获取内容
page_info = request.urlopen(page).read().decode('utf-8')
# 将获取到的内容转换成BeautifulSoup格式,并将html.parser作为解析器
soup = BeautifulSoup(page_info, 'html.parser')
# 查找所有a标签中class='list-info-title'
titles = soup.find_all('a',class_="list-info-title")
# 打印抓取到的title
for title in titles:
 print(title.string)

结果:

Python3实现爬虫爬取赶集网列表功能【基于request和BeautifulSoup模块】

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python 内置函数memoryview(obj)的具体用法
Nov 23 Python
python3.6连接MySQL和表的创建与删除实例代码
Dec 28 Python
pycharm重置设置,恢复默认设置的方法
Oct 22 Python
Python判断telnet通不通的实例
Jan 26 Python
Python实现隐马尔可夫模型的前向后向算法的示例代码
Dec 31 Python
Python爬虫库requests获取响应内容、响应状态码、响应头
Jan 25 Python
python设置环境变量的作用整理
Feb 17 Python
使用 prometheus python 库编写自定义指标的方法(完整代码)
Jun 29 Python
Pythonic版二分查找实现过程原理解析
Aug 11 Python
python speech模块的使用方法
Sep 09 Python
教你怎么用Python selenium操作浏览器对象的基础API
Jun 23 Python
详解python的异常捕获
Mar 03 Python
对python opencv 添加文字 cv2.putText 的各参数介绍
Dec 05 #Python
Python寻找两个有序数组的中位数实例详解
Dec 05 #Python
解决Python下imread,imwrite不支持中文的问题
Dec 05 #Python
python批量下载网站马拉松照片的完整步骤
Dec 05 #Python
解决python3中cv2读取中文路径的问题
Dec 05 #Python
利用Python求阴影部分的面积实例代码
Dec 05 #Python
python之cv2与图像的载入、显示和保存实例
Dec 05 #Python
You might like
php,ajax实现分页
2008/03/27 PHP
PHP字符串处理的10个简单方法
2010/06/30 PHP
PHP中数组的三种排序方法分享
2012/05/07 PHP
PHP实现图片压缩
2020/09/09 PHP
javascript 树控件 比较好用
2009/06/11 Javascript
js判断ie版本号的简单实现代码
2014/03/05 Javascript
Express.JS使用详解
2014/07/17 Javascript
jQuery中on()方法用法实例详解
2015/02/06 Javascript
JavaScript评论点赞功能的实现方法
2017/03/13 Javascript
浅谈webpack 自动刷新与解析
2018/04/09 Javascript
对node.js中render和send的用法详解
2018/05/14 Javascript
在vue里使用codemirror遇到的问题
2018/11/01 Javascript
vue data引入本地图片的两种方式小结
2019/11/13 Javascript
vue实现计算器功能
2020/02/22 Javascript
使用Vue-cli 中为单独页面设置背景图片铺满全屏
2020/07/17 Javascript
[43:58]DOTA2上海特级锦标赛C组败者赛 Newbee VS Archon第二局
2016/02/27 DOTA
跟老齐学Python之总结参数的传递
2014/10/10 Python
python 获取当天凌晨零点的时间戳方法
2018/05/22 Python
让Django支持Sql Server作后端数据库的方法
2018/05/29 Python
利用python库在局域网内传输文件的方法
2018/06/04 Python
python统计多维数组的行数和列数实例
2018/06/23 Python
flask中过滤器的使用详解
2018/08/01 Python
详解用Python练习画个美队盾牌
2019/03/23 Python
关于多元线性回归分析——Python&SPSS
2020/02/24 Python
python GUI库图形界面开发之PyQt5拖放控件实例详解
2020/02/25 Python
Python文件操作基础流程解析
2020/03/19 Python
浅谈Python中的生成器和迭代器
2020/06/19 Python
Python3交互式shell ipython3安装及使用详解
2020/07/11 Python
python之pygame模块实现飞机大战完整代码
2020/11/29 Python
HTML5 Canvas 旋转风车绘制
2017/08/18 HTML / CSS
物流经理自我评价
2013/09/23 职场文书
开水果连锁店创业计划书
2013/12/29 职场文书
给老婆的搞笑检讨书
2014/01/12 职场文书
连锁酒店店长职责范本
2014/02/13 职场文书
实习会计求职自荐信范文
2014/03/10 职场文书
电钳工人个人求职信
2014/05/10 职场文书