Python抓取百度查询结果的方法


Posted in Python onJuly 08, 2015

本文实例讲述了Python抓取百度查询结果的方法。分享给大家供大家参考。具体实现方法如下:

#win python 2.7.x
import re,sys,urllib,codecs
xh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn=100").read().decode('utf-8') 
rc = re.compile(r'<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>',re.I)
match = rc.finditer(xh)
rcr = re.compile(r'<[^>]+>',re.I)
f = codecs.open("xiaohei.txt", "w", "utf-8")
for i in rc.finditer(xh):
  ss = i.group(0)
  s1 = rcr.sub('',ss)
  print (s1)
  f.write(s1)
f.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python中的map()函数和reduce()函数的用法
Apr 27 Python
通过数据库对Django进行删除字段和删除模型的操作
Jul 21 Python
Python通过DOM和SAX方式解析XML的应用实例分享
Nov 16 Python
python中的lambda表达式用法详解
Jun 22 Python
Python之自动获取公网IP的实例讲解
Oct 01 Python
django文档学习之applications使用详解
Jan 29 Python
Python单向链表和双向链表原理与用法实例详解
Aug 31 Python
解决django后台管理界面添加中文内容乱码问题
Nov 15 Python
Python字符串的修改方法实例
Dec 19 Python
TensorFlow内存管理bfc算法实例
Feb 03 Python
新手入门学习python Numpy基础操作
Mar 02 Python
关于Python不换行输出和不换行输出end=““不显示的问题(亲测已解决)
Oct 27 Python
Python抓取淘宝下拉框关键词的方法
Jul 08 #Python
Python根据区号生成手机号码的方法
Jul 08 #Python
Python写入CSV文件的方法
Jul 08 #Python
Python打印斐波拉契数列实例
Jul 07 #Python
Python可变参数函数用法实例
Jul 07 #Python
python类和继承用法实例
Jul 07 #Python
Python实现合并字典的方法
Jul 07 #Python
You might like
PHP 计算代码执行耗时的代码修正网上普遍错误
2011/05/14 PHP
解析php mysql 事务处理回滚操作(附实例)
2013/08/05 PHP
PHP常用算法和数据结构示例(必看篇)
2017/03/15 PHP
PHP实现的激活用户注册验证邮箱功能示例
2017/06/06 PHP
laravel 5.4 + vue + vux + element的环境搭配过程介绍
2018/04/26 PHP
PHP实现redis限制单ip、单用户的访问次数功能示例
2018/06/16 PHP
Javascript中的相等与不等运算
2010/04/25 Javascript
Javascript全局变量var与不var的区别深入解析
2013/12/09 Javascript
判断复选框是否被选中的两种方法
2014/06/04 Javascript
jQuery prototype冲突的2种解决方法(附demo示例下载)
2016/01/21 Javascript
JavaScript条件判断_动力节点Java学院整理
2017/06/26 Javascript
js中如何完美的解析数据
2018/03/18 Javascript
vue首次赋值不触发watch的解决方法
2018/09/11 Javascript
JS实现从对象获取对象中单个键值的方法示例
2019/06/05 Javascript
NodeJS多种创建WebSocket监听的方式(三种)
2020/06/04 NodeJs
基于Vue全局组件与局部组件的区别说明
2020/08/11 Javascript
python字典基本操作实例分析
2015/07/11 Python
详解Python中 sys.argv[]的用法简明解释
2017/12/20 Python
python验证码识别教程之利用滴水算法分割图片
2018/06/05 Python
浅谈pycharm的xmx和xms设置方法
2018/12/03 Python
如何在django里上传csv文件并进行入库处理的方法
2019/01/02 Python
python实现Virginia无密钥解密
2019/03/20 Python
Python实现病毒仿真器的方法示例(附demo)
2020/02/19 Python
opencv 形态学变换(开运算,闭运算,梯度运算)
2020/07/07 Python
详解Python3 定义一个跨越多行的字符串的多种方法
2020/09/06 Python
中国高端家电购物商城:顺电
2018/03/04 全球购物
Blue Nile中国官网:全球知名的钻石和珠宝网络零售商
2020/03/22 全球购物
ORACLE第二个十问
2013/12/14 面试题
关于赌博的检讨书
2014/01/24 职场文书
简历的自我评价范文
2014/02/04 职场文书
买卖车协议书
2014/04/21 职场文书
车间安全生产标语
2014/06/06 职场文书
公司收款委托书范本
2014/09/20 职场文书
庆七一主持词
2015/06/29 职场文书
让JavaScript代码更加精简的方法技巧
2022/06/01 Javascript
Promise静态四兄弟实现示例详解
2022/07/07 Javascript