Python抓取百度查询结果的方法


Posted in Python onJuly 08, 2015

本文实例讲述了Python抓取百度查询结果的方法。分享给大家供大家参考。具体实现方法如下:

#win python 2.7.x
import re,sys,urllib,codecs
xh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn=100").read().decode('utf-8') 
rc = re.compile(r'<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>',re.I)
match = rc.finditer(xh)
rcr = re.compile(r'<[^>]+>',re.I)
f = codecs.open("xiaohei.txt", "w", "utf-8")
for i in rc.finditer(xh):
  ss = i.group(0)
  s1 = rcr.sub('',ss)
  print (s1)
  f.write(s1)
f.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python语言的12个基础知识点小结
Jul 10 Python
在Python中用split()方法分割字符串的使用介绍
May 20 Python
python二分查找算法的递归实现方法
May 12 Python
详解python3百度指数抓取实例
Dec 12 Python
python中使用正则表达式的连接符示例代码
Oct 10 Python
python实现m3u8格式转换为mp4视频格式
Feb 28 Python
Python基于lxml模块解析html获取页面内所有叶子节点xpath路径功能示例
May 16 Python
Python参数类型以及常见的坑详解
Jul 08 Python
Python循环实现n的全排列功能
Sep 16 Python
python中seaborn包常用图形使用详解
Nov 25 Python
python使用列表的最佳方案
Aug 12 Python
Python自然语言处理之切分算法详解
Apr 25 Python
Python抓取淘宝下拉框关键词的方法
Jul 08 #Python
Python根据区号生成手机号码的方法
Jul 08 #Python
Python写入CSV文件的方法
Jul 08 #Python
Python打印斐波拉契数列实例
Jul 07 #Python
Python可变参数函数用法实例
Jul 07 #Python
python类和继承用法实例
Jul 07 #Python
Python实现合并字典的方法
Jul 07 #Python
You might like
php 记录进行累加并显示总时长为秒的结果
2011/11/04 PHP
php删除数组元素示例分享
2014/02/17 PHP
CentOS下PHP7的编译安装及MySQL的支持和一些常见问题的解决办法
2015/12/17 PHP
php实现base64图片上传方式实例代码
2017/02/22 PHP
Yii实现微信公众号场景二维码的方法实例
2020/08/30 PHP
JavaScript 通过模式匹配实现重载
2010/08/12 Javascript
基于Jquery的仿Windows Aero弹出窗(漂亮的关闭按钮)
2010/09/28 Javascript
js 第二代身份证号码的验证机制代码
2011/05/12 Javascript
javascript中万恶的function实例分析
2011/05/25 Javascript
JS判断两个时间大小的示例代码
2014/01/28 Javascript
JavaScript 实现鼠标拖动元素实例代码
2014/02/24 Javascript
Javascript的setTimeout()使用闭包特性时需要注意的问题
2014/09/23 Javascript
js判断某个字符出现的次数的简单实例
2016/06/03 Javascript
自动化测试读写64位操作系统的注册表
2016/08/15 Javascript
JavaScript中for循环的几种写法与效率总结
2017/02/03 Javascript
深入探究angular2 UI组件之primeNG用法
2017/07/26 Javascript
SVG动画vivus.js库使用小结(实例代码)
2017/09/14 Javascript
对vue里函数的调用顺序介绍
2018/03/17 Javascript
VUE实现移动端列表筛选功能
2019/08/23 Javascript
js实现指定时间倒计时效果
2019/08/26 Javascript
python连接池实现示例程序
2013/11/26 Python
用Python实现服务器中只重载被修改的进程的方法
2015/04/30 Python
python创建列表并给列表赋初始值的方法
2015/07/28 Python
Python assert关键字原理及实例解析
2019/12/13 Python
django模型类中,null=True,blank=True用法说明
2020/07/09 Python
财务工作个人求职的自我评价
2013/12/19 职场文书
技校毕业生个人学习的自我评价
2014/02/21 职场文书
不拖欠农民工工资承诺书
2014/03/31 职场文书
初中生评语大全
2014/04/24 职场文书
学校学雷锋活动总结
2014/06/26 职场文书
办理房产过户的委托书
2014/09/14 职场文书
工作散漫检讨书
2014/09/16 职场文书
委托书格式要求
2015/01/28 职场文书
物业项目经理岗位职责
2015/04/01 职场文书
国庆节主题班会
2015/08/15 职场文书
关于对TypeScript泛型参数的默认值理解
2022/07/15 Javascript