Python基于BeautifulSoup和requests实现的爬虫功能示例


Posted in Python onAugust 02, 2019

本文实例讲述了Python基于BeautifulSoup和requests实现的爬虫功能。分享给大家供大家参考,具体如下:

爬取的目标网页:http://www.qianlima.com/zb/area_305/

Python基于BeautifulSoup和requests实现的爬虫功能示例

这是一个招投标网站,我们使用python脚本爬取红框中的信息,包括链接网址、链接名称、时间等三项内容。

使用到的Python库:BeautifulSoup、requests

代码如下:

# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
url = 'http://www.qianlima.com/zb/area_305/'
user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'
headers = { 'User-Agent' : user_agent}
r = requests.get(url,headers=headers)#连接
content = r.text#获取内容,自动转码unicode
soup = BeautifulSoup(content,"lxml")
tags1 = soup.select('div .shixian_zhaobiao')
tag1 = tags1[0]
tag2 = tag1.find(name = 'dl')
tags2 = tag2.find_all(name = 'a')
tags3 = tag2.find_all(name = 'dd')
for tag in tags2:
 print tag.get('href')
 print tag.string
 print tag.next_element.next_element.string

运行结果如下

Python基于BeautifulSoup和requests实现的爬虫功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python实现进程间通信简单实例
Jul 23 Python
Python基于smtplib实现异步发送邮件服务
May 28 Python
Python实现保证只能运行一个脚本实例
Jun 24 Python
详解字典树Trie结构及其Python代码实现
Jun 03 Python
Python的面向对象编程方式学习笔记
Jul 12 Python
利用python爬取散文网的文章实例教程
Jun 18 Python
django连接mysql配置方法总结(推荐)
Aug 18 Python
24式加速你的Python(小结)
Jun 13 Python
python文本数据处理学习笔记详解
Jun 17 Python
django使用haystack调用Elasticsearch实现索引搜索
Jul 24 Python
Pytorch mask_select 函数的用法详解
Feb 18 Python
Python实现汇率转换操作
May 03 Python
详解pandas DataFrame的查询方法(loc,iloc,at,iat,ix的用法和区别)
Aug 02 #Python
pandas DataFrame创建方法的方式
Aug 02 #Python
django项目环境搭建及在虚拟机本地创建django项目的教程
Aug 02 #Python
Django缓存系统实现过程解析
Aug 02 #Python
tensor和numpy的互相转换的实现示例
Aug 02 #Python
Django文件存储 自己定制存储系统解析
Aug 02 #Python
使用pycharm在本地开发并实时同步到服务器
Aug 02 #Python
You might like
PHP 面向对象 PHP5 中的常量
2010/05/05 PHP
php中获取主机名、协议及IP地址的方法
2014/11/18 PHP
PHP图片加水印实现方法
2016/05/06 PHP
深入研究PHP中的preg_replace和代码执行
2018/08/15 PHP
php中如何执行linux命令详解
2018/11/06 PHP
深入理解PHP+Mysql分布式事务与解决方案
2020/12/03 PHP
javascript入门·图片对象(无刷新变换图片)\滚动图像
2007/10/01 Javascript
javascript学习(二)javascript常见问题总结
2013/01/02 Javascript
jquery 循环显示div的示例代码
2013/10/18 Javascript
JavaScript中对象property的读取和写入方法介绍
2014/12/30 Javascript
AngularJS 路由详解和简单实例
2016/07/28 Javascript
javascript淘宝主图放大镜功能
2016/10/20 Javascript
整理关于Bootstrap警示框的慕课笔记
2017/03/29 Javascript
在vue-cli项目中使用bootstrap的方法示例
2018/04/21 Javascript
JavaScript时间与时间戳的转换操作实例分析
2018/12/07 Javascript
每周一练 之 数据结构与算法(Stack)
2019/04/16 Javascript
JSON是什么?有哪些优点?JSON和XML的区别?
2019/04/29 Javascript
Vue项目使用localStorage+Vuex保存用户登录信息
2019/05/27 Javascript
解决vue做详情页跳转的时候使用created方法 数据不会更新问题
2020/07/24 Javascript
json.stringify()与json.parse()的区别以及用处
2021/01/25 Javascript
[00:36]DOTA2上海特级锦标赛 Alliance战队宣传片
2016/03/04 DOTA
Python进程间通信Queue消息队列用法分析
2019/05/22 Python
python已协程方式处理任务实现过程
2019/12/27 Python
简单了解Django ORM常用字段类型及参数配置
2020/01/07 Python
python如何实现不可变字典inmutabledict
2020/01/08 Python
python GUI库图形界面开发之PyQt5输入对话框QInputDialog详细使用方法与实例
2020/02/27 Python
python实现简单坦克大战
2020/03/27 Python
浅析NumPy 切片和索引
2020/09/02 Python
Airbnb爱彼迎官网:成为爱彼迎房东,赚取收入
2019/03/14 全球购物
What's the difference between Debug and Trace class? (Debug类与Trace类有什么区别)
2013/09/10 面试题
Final类有什么特点
2012/04/25 面试题
医学类导师推荐信范文
2013/11/19 职场文书
2014端午节活动策划方案
2014/01/27 职场文书
学习《中小学教师职业道德规范》心得体会
2016/01/18 职场文书
总结三种用 Python 作为小程序后端的方式
2022/05/02 Python
Linux下搭建SFTP服务器的命令详解
2022/06/25 Servers