编程 Python

Python3实现爬虫爬取赶集网列表功能【基于request和BeautifulSoup模块】

Posted in Python onDecember 05, 2018

本文实例讲述了Python3实现爬虫爬取赶集网列表功能。分享给大家供大家参考，具体如下：

python3爬虫之爬取赶集网列表。这几天一直在学习使用python3爬取数据，今天记录一下，代码很简单很容易上手。

首先需要安装python3。如果还没有安装，可参考本站前面关于python3安装与配置相关文章。

首先需要安装request和BeautifulSoup两个模块

request是Python的HTTP网络请求模块，使用Requests可以轻而易举的完成浏览器可有的任何操作

pip install requests

BeautifulSoup是用Python写的一个HTML/XML的解析器，它可以很好的处理不规范标记并生成剖析树

pip install beautifulsoup4

代码：

from urllib import request
from bs4 import BeautifulSoup
#构造头文件，模拟浏览器访问
url="http://xa.ganji.com/meirdjm/o2/"
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36'}
page = request.Request(url,headers=headers)
# 发送请求，获取内容
page_info = request.urlopen(page).read().decode('utf-8')
# 将获取到的内容转换成BeautifulSoup格式，并将html.parser作为解析器
soup = BeautifulSoup(page_info, 'html.parser')
# 查找所有a标签中class='list-info-title'
titles = soup.find_all('a',class_="list-info-title")
# 打印抓取到的title
for title in titles:
 print(title.string)

结果：

Python3实现爬虫爬取赶集网列表功能【基于request和BeautifulSoup模块】

更多关于Python相关内容可查看本站专题：《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python3实现爬虫爬取赶集网列表功能【基于request和BeautifulSoup模块】

- Author -

包子源

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

使用Python3制作TCP端口扫描器

Apr 17 Python

python自动查询12306余票并发送邮箱提醒脚本

May 21 Python

详解Python if-elif-else知识点

Jun 11 Python

对Python3 pyc 文件的使用详解

Feb 16 Python

python 字典套字典或列表的示例

Dec 16 Python

OpenCV python sklearn随机超参数搜索的实现

Jan 17 Python

python词云库wordcloud的使用方法与实例详解

Feb 17 Python

Python多线程thread及模块使用实例

Apr 28 Python

Python项目跨域问题解决方案

Jun 22 Python

pandas map(),apply(),applymap()区别解析

Feb 24 Python

Python中Cookies导出某站用户数据的方法

May 17 Python

Python中 range | np.arange | np.linspace三者的区别

Mar 22 Python

对python opencv 添加文字 cv2.putText 的各参数介绍

Dec 05 #Python

Python寻找两个有序数组的中位数实例详解

Dec 05 #Python

解决Python下imread,imwrite不支持中文的问题

Dec 05 #Python

python批量下载网站马拉松照片的完整步骤

Dec 05 #Python

解决python3中cv2读取中文路径的问题

Dec 05 #Python

利用Python求阴影部分的面积实例代码

Dec 05 #Python

python之cv2与图像的载入、显示和保存实例

Dec 05 #Python

You might like

PHP 5.3.1 安装包 VC9 VC6不同版本的区别是什么

2010/07/04 PHP

用PHP读取和编写XML DOM的实现代码

2011/02/03 PHP

php获取本机真实IP地址实例代码

2016/03/31 PHP

Node.js的MongoDB驱动Mongoose基本使用教程

2016/03/01 Javascript

使用JQuery实现智能表单验证功能

2016/03/08 Javascript

基于jquery实现智能表单验证操作

2016/05/09 Javascript

深入剖析JavaScript:Object类型

2016/05/10 Javascript

jQuery实现圣诞节礼物动画案例解析

2016/12/25 Javascript

利用Angular2 + Ionic3开发IOS应用实例教程

2018/01/15 Javascript

微信 jssdk 签名错误invalid signature的解决方法

2019/01/14 Javascript

JS/CSS实现字符串单词首字母大写功能

2019/09/03 Javascript

layui多图上传实现删除功能的例子

2019/09/23 Javascript

js面向对象之实现淘宝放大镜

2020/01/15 Javascript

vue 中的 render 函数作用详解

2020/02/28 Javascript

JavaScript实现HTML导航栏下拉菜单

2020/11/25 Javascript

JavaScript中的几种继承方法示例

2020/12/06 Javascript

Python入门学习之字符串与比较运算符

2015/10/12 Python

Python爬虫实例爬取网站搞笑段子

2017/11/08 Python

Python抓取框架Scrapy爬虫入门：页面提取

2017/12/01 Python

python+matplotlib绘制旋转椭圆实例代码

2018/01/12 Python

python调用外部程序的实操步骤

2019/03/04 Python

使用python动态生成波形曲线的实现

2019/12/04 Python

利用Pytorch实现简单的线性回归算法

2020/01/15 Python

Speedo澳大利亚官网：全球领先游泳品牌

2018/02/04 全球购物

美国社交购物市场：MassGenie

2019/02/18 全球购物

什么是符号链接，什么是硬链接？符号链接与硬链接的区别是什么？

2013/05/03 面试题

Python是如何进行类型转换的

2013/06/09 面试题

大学同学聚会邀请函

2014/01/29 职场文书

自主招生自荐信指南

2014/02/04 职场文书

《理想的风筝》教学反思

2014/04/11 职场文书

对照四风自我剖析材料

2014/10/07 职场文书

初婚未育证明样本

2014/10/24 职场文书

廉政承诺书2015

2015/04/28 职场文书

2015年中秋放假通知范文

2015/08/18 职场文书

《学会看病》教学反思

2016/02/17 职场文书

yolov5返回坐标的方法实例

2022/03/17 Python