使用BeautifulSoup爬虫程序获取百度搜索结果的标题和url示例


Posted in Python onJanuary 19, 2014

熟悉Java的jsoup包的话,对于Python的BeautifulSoup库应该很容易上手。

#coding: utf-8
import sys
import urllib
import urllib2
from BeautifulSoup import BeautifulSoup
question_word = "吃货 程序员"
url = "http://www.baidu.com/s?wd=" + urllib.quote(question_word.decode(sys.stdin.encoding).encode('gbk'))
htmlpage = urllib2.urlopen(url).read()
soup = BeautifulSoup(htmlpage)
print len(soup.findAll("table", {"class": "result"}))
for result_table in soup.findAll("table", {"class": "result"}):
    a_click = result_table.find("a")
    print "-----标题----\n" + a_click.renderContents()#标题
    print "----链接----\n" + str(a_click.get("href"))#链接
    print "----描述----\n" + result_table.find("div", {"class": "c-abstract"}).renderContents()#描述
    print
Python 相关文章推荐
详解Python的Django框架中manage命令的使用与扩展
Apr 11 Python
Python中使用装饰器来优化尾递归的示例
Jun 18 Python
Tensorflow简单验证码识别应用
May 25 Python
Python数据结构之双向链表的定义与使用方法示例
Jan 16 Python
Python cookbook(数据结构与算法)将多个映射合并为单个映射的方法
Apr 19 Python
浅谈tensorflow1.0 池化层(pooling)和全连接层(dense)
Apr 27 Python
python之cv2与图像的载入、显示和保存实例
Dec 05 Python
python实现三次样条插值
Dec 17 Python
python实现感知机线性分类模型示例代码
Jun 02 Python
Python chardet库识别编码原理解析
Feb 18 Python
Python基于smtplib模块发送邮件代码实例
May 29 Python
上帝为你开了一扇窗之Tkinter常用函数详解
Jun 02 Python
压缩包密码破解示例分享(类似典破解)
Jan 17 #Python
vc6编写python扩展的方法分享
Jan 17 #Python
python的urllib模块显示下载进度示例
Jan 17 #Python
Python中for循环详解
Jan 17 #Python
python在命令行下使用google翻译(带语音)
Jan 16 #Python
python支持断点续传的多线程下载示例
Jan 16 #Python
python获得图片base64编码示例
Jan 16 #Python
You might like
PHP封装的字符串加密解密函数
2015/12/18 PHP
PHP错误处理函数
2016/04/03 PHP
PHP5.5基于mysqli连接MySQL数据库和读取数据操作实例详解
2019/02/16 PHP
CSS+Jquery实现页面圆角框方法大全
2009/12/24 Javascript
De facto standard 世界上不可思议的事实标准
2010/08/29 Javascript
Javascript 中的 call 和 apply使用介绍
2012/02/22 Javascript
JavaScript制作的可折叠弹出式菜单示例
2014/04/04 Javascript
jquery提示效果实例分析
2014/11/25 Javascript
基于Bootstrap+jQuery.validate实现Form表单验证
2014/12/16 Javascript
jquery+ajax实现跨域请求的方法
2015/01/20 Javascript
JS 作用域与作用域链详解
2015/04/07 Javascript
基于JavaScript实现瀑布流效果(循环渐近)
2016/01/27 Javascript
jQuery包裹节点用法完整示例
2016/09/13 Javascript
require.js+vue开发微信上传图片组件
2016/10/27 Javascript
基于cookie实现zTree树刷新后展开状态不变
2017/02/28 Javascript
JS滚动到指定位置导航栏固定顶部
2017/07/03 Javascript
JavaScript实现简单的双色球(实例讲解)
2017/07/31 Javascript
vue绑定设置属性的多种方式(5)
2017/08/16 Javascript
node.js 用socket实现聊天的示例代码
2017/10/17 Javascript
移动端 Vue+Vant 的Uploader 实现上传、压缩、旋转图片功能
2019/06/10 Javascript
python中的实例方法、静态方法、类方法、类变量和实例变量浅析
2014/04/26 Python
浅谈django三种缓存模式的使用及注意点
2018/09/30 Python
python3 使用ssh隧道连接mysql的操作
2020/12/05 Python
python中pyqtgraph知识点总结
2021/01/26 Python
HTML5 Canvas API中drawImage()方法的使用实例
2016/03/25 HTML / CSS
HTML5 实现图片上传预处理功能
2020/02/06 HTML / CSS
expedia比利时:预订航班+酒店并省钱
2018/07/13 全球购物
荷兰浴室和卫浴网上商店:Badkamerxxl.nl
2020/10/06 全球购物
介绍一下HTTP、HTTPS和SSL
2012/12/16 面试题
大学英语演讲稿(中英文对照)
2014/01/14 职场文书
乡镇党建工作汇报材料
2014/08/14 职场文书
汽车转让协议书
2015/01/29 职场文书
个园导游词
2015/02/04 职场文书
女性健康讲座主持词
2015/07/04 职场文书
《爬天都峰》教学反思
2016/02/23 职场文书
MySQL的全局锁和表级锁的具体使用
2021/08/23 MySQL