Python抓取百度查询结果的方法


Posted in Python onJuly 08, 2015

本文实例讲述了Python抓取百度查询结果的方法。分享给大家供大家参考。具体实现方法如下:

#win python 2.7.x
import re,sys,urllib,codecs
xh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn=100").read().decode('utf-8') 
rc = re.compile(r'<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>',re.I)
match = rc.finditer(xh)
rcr = re.compile(r'<[^>]+>',re.I)
f = codecs.open("xiaohei.txt", "w", "utf-8")
for i in rc.finditer(xh):
  ss = i.group(0)
  s1 = rcr.sub('',ss)
  print (s1)
  f.write(s1)
f.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
举例介绍Python中的25个隐藏特性
Mar 30 Python
Python的爬虫包Beautiful Soup中用正则表达式来搜索
Jan 20 Python
Python实现计算最小编辑距离
Mar 17 Python
python实现域名系统(DNS)正向查询的方法
Apr 19 Python
Python Sqlite3以字典形式返回查询结果的实现方法
Oct 03 Python
Python通过future处理并发问题
Oct 17 Python
Python 3.x基于Xml数据的Http请求方法
Dec 28 Python
python中使用ctypes调用so传参设置遇到的问题及解决方法
Jun 19 Python
使用python检查yaml配置文件是否符合要求
Apr 09 Python
Python Flask框架实现简单加法工具过程解析
Jun 03 Python
python爬虫用mongodb的理由
Jul 28 Python
python多线程semaphore实现线程数控制的示例
Aug 10 Python
Python抓取淘宝下拉框关键词的方法
Jul 08 #Python
Python根据区号生成手机号码的方法
Jul 08 #Python
Python写入CSV文件的方法
Jul 08 #Python
Python打印斐波拉契数列实例
Jul 07 #Python
Python可变参数函数用法实例
Jul 07 #Python
python类和继承用法实例
Jul 07 #Python
Python实现合并字典的方法
Jul 07 #Python
You might like
php通用防注入程序 推荐
2011/02/26 PHP
PHP实现的迪科斯彻(Dijkstra)最短路径算法实例
2017/09/16 PHP
PHPTree――php快速生成无限级分类
2018/03/30 PHP
纯js网页画板(Graphics)类简介及实现代码
2012/12/24 Javascript
全面理解面向对象的 JavaScript(来自ibm)
2013/11/10 Javascript
js实现点击添加一个input节点
2014/12/05 Javascript
Nodejs实现批量下载妹纸图
2015/05/28 NodeJs
AngularJS 中的事件详解
2016/07/28 Javascript
只要1K 纯JS脚本送你一朵3D红色玫瑰
2016/08/09 Javascript
jQuery实现的多张图无缝滚动效果【测试可用】
2016/09/12 Javascript
jquery.Jcrop结合JAVA后台实现图片裁剪上传实例
2016/11/05 Javascript
Bootstrap路径导航与分页学习使用
2017/02/08 Javascript
在vue组件中使用axios的方法
2018/03/16 Javascript
Vue路由钩子之afterEach beforeEach的区别详解
2018/07/15 Javascript
jquery实现直播弹幕效果
2019/11/28 jQuery
vue中英文切换实例代码
2020/01/21 Javascript
基于JS实现计算24点算法代码实例解析
2020/07/23 Javascript
vue vant中picker组件的使用
2020/11/03 Javascript
Vue 解决在element中使用$notify在提示信息中换行问题
2020/11/11 Javascript
[01:31]DOTA2上海特级锦标赛 SECRET战队完整宣传片
2016/03/16 DOTA
零基础写python爬虫之使用urllib2组件抓取网页内容
2014/11/04 Python
详解python的数字类型变量与其方法
2016/11/20 Python
win与linux系统中python requests 安装
2016/12/04 Python
Django ORM框架的定时任务如何使用详解
2017/10/19 Python
Python 字符串与数字输出方法
2018/07/16 Python
Python 多线程不加锁分块读取文件的方法
2018/12/11 Python
window7下的python2.7版本和python3.5版本的opencv-python安装过程
2019/10/24 Python
如何基于Python创建目录文件夹
2019/12/31 Python
pytorch中index_select()的用法详解
2021/01/06 Python
美国沃尔玛网上超市:Walmart
2020/08/14 全球购物
介绍一下Linux内核的排队自旋锁
2014/08/27 面试题
标准毕业生自荐信范文
2013/11/04 职场文书
加多宝凉茶广告词
2014/03/18 职场文书
竞选大队委员演讲稿
2014/04/28 职场文书
Nginx快速入门教程
2021/03/31 Servers
浅谈自定义校验注解ConstraintValidator
2021/06/30 Java/Android