Python抓取百度查询结果的方法


Posted in Python onJuly 08, 2015

本文实例讲述了Python抓取百度查询结果的方法。分享给大家供大家参考。具体实现方法如下:

#win python 2.7.x
import re,sys,urllib,codecs
xh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn=100").read().decode('utf-8') 
rc = re.compile(r'<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>',re.I)
match = rc.finditer(xh)
rcr = re.compile(r'<[^>]+>',re.I)
f = codecs.open("xiaohei.txt", "w", "utf-8")
for i in rc.finditer(xh):
  ss = i.group(0)
  s1 = rcr.sub('',ss)
  print (s1)
  f.write(s1)
f.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
python中的对象拷贝示例 python引用传递
Jan 23 Python
Python使用metaclass实现Singleton模式的方法
May 05 Python
python实现的守护进程(Daemon)用法实例
Jun 02 Python
django开发post接口简单案例,获取参数值的方法
Dec 11 Python
使用Python中的reduce()函数求积的实例
Jun 28 Python
python自动保存百度盘资源到百度盘中的实例代码
Aug 26 Python
python常用排序算法的实现代码
Nov 08 Python
解决pyPdf和pyPdf2在合并pdf时出现异常的问题
Apr 03 Python
详解python中groupby函数通俗易懂
May 14 Python
keras中epoch,batch,loss,val_loss用法说明
Jul 02 Python
pytest fixtures装饰器的使用和如何控制用例的执行顺序
Jan 28 Python
Python趣味挑战之用pygame实现简单的金币旋转效果
May 31 Python
Python抓取淘宝下拉框关键词的方法
Jul 08 #Python
Python根据区号生成手机号码的方法
Jul 08 #Python
Python写入CSV文件的方法
Jul 08 #Python
Python打印斐波拉契数列实例
Jul 07 #Python
Python可变参数函数用法实例
Jul 07 #Python
python类和继承用法实例
Jul 07 #Python
Python实现合并字典的方法
Jul 07 #Python
You might like
用PHP生成静态HTML速度快类库
2007/03/18 PHP
php sybase_fetch_array使用方法
2014/04/15 PHP
PHP生成唯一订单号
2015/07/05 PHP
php析构函数的简单使用说明
2015/08/24 PHP
WordPress开发中用于获取近期文章的PHP函数使用解析
2016/01/05 PHP
PHP+MySQL存储数据常见中文乱码问题小结
2016/06/13 PHP
PHP面向对象程序设计内置标准类,普通数据类型转为对象类型示例
2019/06/12 PHP
PHP操作XML中XPath的应用示例
2019/07/04 PHP
javascript 使td内容不换行不撑开
2012/11/29 Javascript
利用NodeJS的子进程(child_process)调用系统命令的方法分享
2013/06/05 NodeJs
div模拟滚动条效果示例代码
2013/10/16 Javascript
jQuery实现仿淘宝带有指示条的图片转动切换效果完整实例
2015/03/04 Javascript
javascript中alert()与console.log()的区别
2015/08/26 Javascript
javascript实现滚动效果的数字时钟实例
2016/07/21 Javascript
JS获取url参数、主域名的方法实例分析
2016/08/03 Javascript
js从外部获取图片的实现方法
2016/08/05 Javascript
JS简单去除数组中重复项的方法
2016/09/13 Javascript
基于JavaScript实现幸运抽奖页面
2020/07/05 Javascript
[02:41]DOTA2英雄基础教程 冥魂大帝
2014/01/16 DOTA
python中requests和https使用简单示例
2018/01/18 Python
python实现引用其他路径包里面的模块
2020/03/09 Python
详解Python中string模块除去Str还剩下什么
2020/11/30 Python
Cotton On南非:澳洲时尚平价品牌
2018/06/28 全球购物
Hanro官网:奢华男士和女士内衣、睡衣和家居服
2018/10/25 全球购物
中职生自我鉴定范文
2013/10/03 职场文书
获奖的大学生创业计划书
2014/01/05 职场文书
应届优秀本科大学毕业生自我鉴定
2014/01/21 职场文书
2014年基层党组织公开承诺书
2014/03/29 职场文书
体育之星事迹材料
2014/05/11 职场文书
项目投资建议书
2014/05/16 职场文书
大学同学会活动方案
2014/08/20 职场文书
公司周年庆典致辞
2015/07/30 职场文书
合同补充协议书
2016/03/24 职场文书
Python爬取科目四考试题库的方法实现
2021/03/30 Python
Nginx代理同域名前后端分离项目的完整步骤
2021/03/31 Servers
Nginx+Windows搭建域名访问环境的操作方法
2022/03/17 Servers