Python基于BeautifulSoup和requests实现的爬虫功能示例


Posted in Python onAugust 02, 2019

本文实例讲述了Python基于BeautifulSoup和requests实现的爬虫功能。分享给大家供大家参考,具体如下:

爬取的目标网页:http://www.qianlima.com/zb/area_305/

Python基于BeautifulSoup和requests实现的爬虫功能示例

这是一个招投标网站,我们使用python脚本爬取红框中的信息,包括链接网址、链接名称、时间等三项内容。

使用到的Python库:BeautifulSoup、requests

代码如下:

# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
url = 'http://www.qianlima.com/zb/area_305/'
user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'
headers = { 'User-Agent' : user_agent}
r = requests.get(url,headers=headers)#连接
content = r.text#获取内容,自动转码unicode
soup = BeautifulSoup(content,"lxml")
tags1 = soup.select('div .shixian_zhaobiao')
tag1 = tags1[0]
tag2 = tag1.find(name = 'dl')
tags2 = tag2.find_all(name = 'a')
tags3 = tag2.find_all(name = 'dd')
for tag in tags2:
 print tag.get('href')
 print tag.string
 print tag.next_element.next_element.string

运行结果如下

Python基于BeautifulSoup和requests实现的爬虫功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
深入Python函数编程的一些特性
Apr 13 Python
详细讲解Python中的文件I/O操作
May 24 Python
python之Character string(实例讲解)
Sep 25 Python
详解pandas库pd.read_excel操作读取excel文件参数整理与实例
Feb 17 Python
深入浅析Python 中的sklearn模型选择
Oct 12 Python
Python中logging日志库实例详解
Feb 19 Python
彻底搞懂 python 中文乱码问题(深入分析)
Feb 28 Python
ubuntu 安装pyqt5和卸载pyQt5的方法
Mar 24 Python
Python库安装速度过慢解决方案
Jul 14 Python
python statsmodel的使用
Dec 21 Python
如何在Python项目中引入日志
May 31 Python
Python3.8官网文档之类的基础语法阅读
Sep 04 Python
详解pandas DataFrame的查询方法(loc,iloc,at,iat,ix的用法和区别)
Aug 02 #Python
pandas DataFrame创建方法的方式
Aug 02 #Python
django项目环境搭建及在虚拟机本地创建django项目的教程
Aug 02 #Python
Django缓存系统实现过程解析
Aug 02 #Python
tensor和numpy的互相转换的实现示例
Aug 02 #Python
Django文件存储 自己定制存储系统解析
Aug 02 #Python
使用pycharm在本地开发并实时同步到服务器
Aug 02 #Python
You might like
php实现短信发送代码
2015/07/05 PHP
Yii2框架中使用PHPExcel导出Excel文件的示例
2017/08/09 PHP
用roll.js实现的图片自动滚动+鼠标触动的特效
2007/03/18 Javascript
js右键菜单效果代码
2007/07/21 Javascript
基于jQuery的消息提示插件 DivAlert之旅(二)
2010/04/01 Javascript
JavaScript的单例模式 (singleton in Javascript)
2010/06/11 Javascript
用JavaScript实现用一个DIV来包装文本元素节点
2014/09/09 Javascript
不得不分享的JavaScript常用方法函数集(上)
2015/12/23 Javascript
jQuery中bind(),live(),delegate(),on()绑定事件方法实例详解
2016/01/19 Javascript
JavaScript中通过提示框跳转页面的方法
2016/02/14 Javascript
全面了解JavaScirpt 的垃圾(garbage collection)回收机制
2016/07/11 Javascript
jQuery实现验证码功能
2017/03/17 Javascript
canvas绘制一个常用的emoji表情
2017/03/30 Javascript
详解用node-images 打造简易图片服务器
2017/05/08 Javascript
JS文件中加载jquery.js的实例代码
2018/05/05 jQuery
详解Nodejs mongoose
2018/06/10 NodeJs
jQuery实现点击图标div循环放大缩小功能
2018/09/30 jQuery
layui-table对返回的数据进行转变显示的实例
2019/09/04 Javascript
Node.js中的异步生成器与异步迭代详解
2021/01/31 Javascript
Python生成随机MAC地址
2015/03/10 Python
Python比较两个图片相似度的方法
2015/03/13 Python
Python列表list内建函数用法实例分析【insert、remove、index、pop等】
2017/07/24 Python
Python微信库:itchat的用法详解
2017/08/14 Python
轻量级的Web框架Flask 中模块化应用的实现
2017/09/11 Python
python梯度下降法的简单示例
2018/08/31 Python
Python3.5基础之NumPy模块的使用图文与实例详解
2019/04/24 Python
django-rest-framework 自定义swagger过程详解
2019/07/18 Python
通过实例简单了解Python中yield的作用
2019/12/11 Python
使用Python封装excel操作指南
2021/01/29 Python
马德里运动鞋商店:Nigra Mercato
2020/02/16 全球购物
员工考核管理制度
2014/02/02 职场文书
询价采购方案
2014/06/09 职场文书
大学生入党积极分子党校学习思想汇报
2014/10/25 职场文书
入党转正申请书范文
2019/05/20 职场文书
《女娲补天》读后感5篇
2019/12/31 职场文书
python numpy中setdiff1d的用法说明
2021/04/22 Python