编程 Python

Python基于BeautifulSoup和requests实现的爬虫功能示例

Posted in Python onAugust 02, 2019

本文实例讲述了Python基于BeautifulSoup和requests实现的爬虫功能。分享给大家供大家参考，具体如下：

爬取的目标网页：http://www.qianlima.com/zb/area_305/

这是一个招投标网站，我们使用python脚本爬取红框中的信息，包括链接网址、链接名称、时间等三项内容。

使用到的Python库：BeautifulSoup、requests

代码如下：

# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
url = 'http://www.qianlima.com/zb/area_305/'
user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'
headers = { 'User-Agent' : user_agent}
r = requests.get(url,headers=headers)#连接
content = r.text#获取内容，自动转码unicode
soup = BeautifulSoup(content,"lxml")
tags1 = soup.select('div .shixian_zhaobiao')
tag1 = tags1[0]
tag2 = tag1.find(name = 'dl')
tags2 = tag2.find_all(name = 'a')
tags3 = tag2.find_all(name = 'dd')
for tag in tags2:
 print tag.get('href')
 print tag.string
 print tag.next_element.next_element.string

运行结果如下

Python基于BeautifulSoup和requests实现的爬虫功能示例

更多关于Python相关内容可查看本站专题：《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python基于BeautifulSoup和requests实现的爬虫功能示例

- Author -

郭大侠写leetcode

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python聊天程序实例代码分享

Nov 18 Python

解决Python中由于logging模块误用导致的内存泄露

Apr 23 Python

Python自动登录126邮箱的方法

Jul 10 Python

Python反爬虫技术之防止IP地址被封杀的讲解

Jan 09 Python

Python3爬楼梯算法示例

Mar 04 Python

Python实现打砖块小游戏代码实例

May 18 Python

python实现从本地摄像头和网络摄像头截取图片功能

Jul 11 Python

python opencv将图片转为灰度图的方法示例

Jul 31 Python

基于python调用jenkins-cli实现快速发布

Aug 14 Python

使用Python提取文本中含有特定字符串的方法示例

Dec 09 Python

python画图时设置分辨率和画布大小的实现(plt.figure())

Jan 08 Python

OpenCV-Python模板匹配人眼的实例

Jun 08 Python

详解pandas DataFrame的查询方法（loc,iloc,at,iat,ix的用法和区别）

Aug 02 #Python

pandas DataFrame创建方法的方式

Aug 02 #Python

django项目环境搭建及在虚拟机本地创建django项目的教程

Aug 02 #Python

Django缓存系统实现过程解析

Aug 02 #Python

tensor和numpy的互相转换的实现示例

Aug 02 #Python

Django文件存储自己定制存储系统解析

Aug 02 #Python

使用pycharm在本地开发并实时同步到服务器

Aug 02 #Python

You might like

PHP下用rmdir实现删除目录的三种方法小结

2008/04/20 PHP

PHP导入Excel到MySQL的方法

2011/04/23 PHP

PHP的Yii框架中使用数据库的配置和SQL操作实例教程

2016/03/17 PHP

php抽象方法和普通方法的区别点总结

2019/10/13 PHP

jQuery对表单的操作代码集合

2011/04/06 Javascript

document.getElementById介绍

2011/09/13 Javascript

Jquery 表单验证类介绍与实例

2013/06/09 Javascript

JS简单实现元素复制示例附图

2013/11/19 Javascript

jQuery禁用键盘后退屏蔽F5刷新及禁用右键单击

2016/01/22 Javascript

jQuery实现右下角可缩放大小的层完整实例

2016/06/20 Javascript

详解Node.js中的事件机制

2016/09/22 Javascript

JavaScript中关键字 in 的使用方法详解

2016/10/17 Javascript

JavaScript中最常用的10种代码简写技巧总结

2017/06/28 Javascript

vue.js组件之间传递数据的方法

2017/07/10 Javascript

浅谈Vue.nextTick 的实现方法

2017/10/25 Javascript

基于node下的http小爬虫的示例代码

2018/01/11 Javascript

select2 ajax 设置默认值,初始值的方法

2018/08/09 Javascript

Node.js console控制台简单用法分析

2019/01/04 Javascript

JS中的算法与数据结构之字典(Dictionary)实例详解

2019/08/20 Javascript

VUE项目中加载已保存的笔记实例方法

2019/09/14 Javascript

JS eval代码快速解密实例解析

2020/04/23 Javascript

解决vue安装less报错Failed to compile with 1 errors的问题

2020/10/22 Javascript

django接入新浪微博OAuth的方法

2015/06/29 Python

Python实现队列的方法示例小结【数组，链表】

2020/02/22 Python

python 解决Fatal error in launcher:错误问题

2020/05/21 Python

如何以Winsows Service方式运行JupyterLab

2020/08/30 Python

Python常用GUI框架原理解析汇总

2020/12/07 Python

美国网上订购鲜花：FTD

2016/09/23 全球购物

Volcom法国官网：美国冲浪滑板品牌

2017/05/25 全球购物

iostream与iostream.h的区别

2015/01/16 面试题

中职生自荐信

2013/10/13 职场文书

中式餐厅创业计划书范文

2014/01/23 职场文书

办理信用卡工作证明

2014/09/30 职场文书

2015年万圣节活动总结

2015/03/24 职场文书

2015年个人实习工作总结

2015/05/28 职场文书

公务员爱岗敬业心得体会

2016/01/25 职场文书