Python抓取百度查询结果的方法


Posted in Python onJuly 08, 2015

本文实例讲述了Python抓取百度查询结果的方法。分享给大家供大家参考。具体实现方法如下:

#win python 2.7.x
import re,sys,urllib,codecs
xh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn=100").read().decode('utf-8') 
rc = re.compile(r'<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>',re.I)
match = rc.finditer(xh)
rcr = re.compile(r'<[^>]+>',re.I)
f = codecs.open("xiaohei.txt", "w", "utf-8")
for i in rc.finditer(xh):
  ss = i.group(0)
  s1 = rcr.sub('',ss)
  print (s1)
  f.write(s1)
f.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
go和python调用其它程序并得到程序输出
Feb 10 Python
使用url_helper简化Python中Django框架的url配置教程
May 30 Python
python3.6连接MySQL和表的创建与删除实例代码
Dec 28 Python
使用python读取csv文件快速插入数据库的实例
Jun 21 Python
python交换两个变量的值方法
Jan 12 Python
python实现给微信指定好友定时发送消息
Apr 29 Python
利用Python进行图像的加法,图像混合(附代码)
Jul 14 Python
django基于cors解决跨域请求问题详解
Aug 06 Python
用python3读取python2的pickle数据方式
Dec 25 Python
pytorch中的自定义反向传播,求导实例
Jan 06 Python
postman和python mock测试过程图解
Feb 22 Python
pyecharts在数据可视化中的应用详解
Jun 08 Python
Python抓取淘宝下拉框关键词的方法
Jul 08 #Python
Python根据区号生成手机号码的方法
Jul 08 #Python
Python写入CSV文件的方法
Jul 08 #Python
Python打印斐波拉契数列实例
Jul 07 #Python
Python可变参数函数用法实例
Jul 07 #Python
python类和继承用法实例
Jul 07 #Python
Python实现合并字典的方法
Jul 07 #Python
You might like
dedecms模版制作使用方法
2007/04/03 PHP
PHP无限分类(树形类)的深入分析
2013/06/02 PHP
PHP观察者模式原理与简单实现方法示例
2017/08/25 PHP
Laravel中使用Queue的最基本操作教程
2017/12/27 PHP
php post json参数的传递和接收处理方法
2018/05/31 PHP
Alliance vs Liquid BO3 第一场2.13
2021/03/10 DOTA
一段批量给页面上的控件赋值js
2010/06/19 Javascript
一个jquery实现的不错的多行文字图片滚动效果
2014/09/28 Javascript
JavaScript中textRange对象使用方法小结
2015/03/24 Javascript
jquery超简单实现手风琴效果的方法
2015/06/05 Javascript
使用JQuery实现Ctrl+Enter提交表单的方法
2015/10/22 Javascript
基于jQuery实现动态搜索显示功能
2016/05/05 Javascript
AngularJS控制器之间的数据共享及通信详解
2016/08/01 Javascript
JavaScript性能优化总结之加载与执行
2016/08/11 Javascript
PhotoSwipe异步动态加载图片方法
2016/08/25 Javascript
jQuery返回定位插件详解
2017/05/15 jQuery
Angular2学习教程之组件中的DOM操作详解
2017/05/28 Javascript
使用async-validator编写Form组件的方法
2018/01/10 Javascript
vue-router项目实战总结篇
2018/02/11 Javascript
nginx部署访问vue-cli搭建的项目的方法
2018/02/12 Javascript
深入理解与使用keep-alive(配合router-view缓存整个路由页面)
2018/09/25 Javascript
VuePress 快速踩坑小结
2019/02/14 Javascript
利用es6 new.target来对模拟抽象类的方法
2019/05/10 Javascript
js实现的格式化数字和金额功能简单示例
2019/07/30 Javascript
vue prop属性传值与传引用示例
2019/11/13 Javascript
vue+echarts实现动态折线图的方法与注意
2020/09/01 Javascript
Python实现从脚本里运行scrapy的方法
2015/04/07 Python
Python中字符串对齐方法介绍
2015/05/21 Python
tensorflow构建BP神经网络的方法
2018/03/12 Python
Django model反向关联名称的方法
2018/12/15 Python
Python 读取串口数据,动态绘图的示例
2019/07/02 Python
python time.sleep()是睡眠线程还是进程
2019/07/09 Python
大学新生军训个人的自我评价
2013/10/03 职场文书
关于读书的活动方案
2014/08/14 职场文书
订货会主持词
2015/07/01 职场文书
《牧场之国》教学反思
2016/02/22 职场文书