Python基于BeautifulSoup和requests实现的爬虫功能示例


Posted in Python onAugust 02, 2019

本文实例讲述了Python基于BeautifulSoup和requests实现的爬虫功能。分享给大家供大家参考,具体如下:

爬取的目标网页:http://www.qianlima.com/zb/area_305/

Python基于BeautifulSoup和requests实现的爬虫功能示例

这是一个招投标网站,我们使用python脚本爬取红框中的信息,包括链接网址、链接名称、时间等三项内容。

使用到的Python库:BeautifulSoup、requests

代码如下:

# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
url = 'http://www.qianlima.com/zb/area_305/'
user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'
headers = { 'User-Agent' : user_agent}
r = requests.get(url,headers=headers)#连接
content = r.text#获取内容,自动转码unicode
soup = BeautifulSoup(content,"lxml")
tags1 = soup.select('div .shixian_zhaobiao')
tag1 = tags1[0]
tag2 = tag1.find(name = 'dl')
tags2 = tag2.find_all(name = 'a')
tags3 = tag2.find_all(name = 'dd')
for tag in tags2:
 print tag.get('href')
 print tag.string
 print tag.next_element.next_element.string

运行结果如下

Python基于BeautifulSoup和requests实现的爬虫功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python聊天程序实例代码分享
Nov 18 Python
解决Python中由于logging模块误用导致的内存泄露
Apr 23 Python
Python自动登录126邮箱的方法
Jul 10 Python
Python反爬虫技术之防止IP地址被封杀的讲解
Jan 09 Python
Python3爬楼梯算法示例
Mar 04 Python
Python实现打砖块小游戏代码实例
May 18 Python
python实现从本地摄像头和网络摄像头截取图片功能
Jul 11 Python
python opencv将图片转为灰度图的方法示例
Jul 31 Python
基于python调用jenkins-cli实现快速发布
Aug 14 Python
使用Python提取文本中含有特定字符串的方法示例
Dec 09 Python
python画图时设置分辨率和画布大小的实现(plt.figure())
Jan 08 Python
OpenCV-Python模板匹配人眼的实例
Jun 08 Python
详解pandas DataFrame的查询方法(loc,iloc,at,iat,ix的用法和区别)
Aug 02 #Python
pandas DataFrame创建方法的方式
Aug 02 #Python
django项目环境搭建及在虚拟机本地创建django项目的教程
Aug 02 #Python
Django缓存系统实现过程解析
Aug 02 #Python
tensor和numpy的互相转换的实现示例
Aug 02 #Python
Django文件存储 自己定制存储系统解析
Aug 02 #Python
使用pycharm在本地开发并实时同步到服务器
Aug 02 #Python
You might like
PHP下用rmdir实现删除目录的三种方法小结
2008/04/20 PHP
PHP导入Excel到MySQL的方法
2011/04/23 PHP
PHP的Yii框架中使用数据库的配置和SQL操作实例教程
2016/03/17 PHP
php抽象方法和普通方法的区别点总结
2019/10/13 PHP
jQuery对表单的操作代码集合
2011/04/06 Javascript
document.getElementById介绍
2011/09/13 Javascript
Jquery 表单验证类介绍与实例
2013/06/09 Javascript
JS简单实现元素复制示例附图
2013/11/19 Javascript
jQuery禁用键盘后退屏蔽F5刷新及禁用右键单击
2016/01/22 Javascript
jQuery实现右下角可缩放大小的层完整实例
2016/06/20 Javascript
详解Node.js中的事件机制
2016/09/22 Javascript
JavaScript中关键字 in 的使用方法详解
2016/10/17 Javascript
JavaScript中最常用的10种代码简写技巧总结
2017/06/28 Javascript
vue.js组件之间传递数据的方法
2017/07/10 Javascript
浅谈Vue.nextTick 的实现方法
2017/10/25 Javascript
基于node下的http小爬虫的示例代码
2018/01/11 Javascript
select2 ajax 设置默认值,初始值的方法
2018/08/09 Javascript
Node.js console控制台简单用法分析
2019/01/04 Javascript
JS中的算法与数据结构之字典(Dictionary)实例详解
2019/08/20 Javascript
VUE项目中加载已保存的笔记实例方法
2019/09/14 Javascript
JS eval代码快速解密实例解析
2020/04/23 Javascript
解决vue安装less报错Failed to compile with 1 errors的问题
2020/10/22 Javascript
django接入新浪微博OAuth的方法
2015/06/29 Python
Python实现队列的方法示例小结【数组,链表】
2020/02/22 Python
python 解决Fatal error in launcher:错误问题
2020/05/21 Python
如何以Winsows Service方式运行JupyterLab
2020/08/30 Python
Python常用GUI框架原理解析汇总
2020/12/07 Python
美国网上订购鲜花:FTD
2016/09/23 全球购物
Volcom法国官网:美国冲浪滑板品牌
2017/05/25 全球购物
iostream与iostream.h的区别
2015/01/16 面试题
中职生自荐信
2013/10/13 职场文书
中式餐厅创业计划书范文
2014/01/23 职场文书
办理信用卡工作证明
2014/09/30 职场文书
2015年万圣节活动总结
2015/03/24 职场文书
2015年个人实习工作总结
2015/05/28 职场文书
公务员爱岗敬业心得体会
2016/01/25 职场文书