Python3.4编程实现简单抓取爬虫功能示例


Posted in Python onSeptember 14, 2017

本文实例讲述了Python3.4编程实现简单抓取爬虫功能。分享给大家供大家参考,具体如下:

import urllib.request
import urllib.parse
import re
import urllib.request,urllib.parse,http.cookiejar
import time
def getHtml(url):
  cj=http.cookiejar.CookieJar()
  opener=urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
  opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36'),('Cookie','4564564564564564565646540')]
  urllib.request.install_opener(opener)
  page = urllib.request.urlopen(url)
  html = page.read()
  return html
#print ( html)
#html = getHtml("http://weibo.com/")
def getimg(html):
  html = html.decode('utf-8')
  reg='"screen_name":"(.*?)"'
  imgre = re.compile(reg)
  src=re.findall(imgre,html)
  return src
#print ("",getimg(html))
uid=['2808675432','3888405676','2628551531','2808587400']
for a in list(uid):
  print (getimg(getHtml("http://weibo.com/"+a)))
  time.sleep(1)

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
一个检测OpenSSL心脏出血漏洞的Python脚本分享
Apr 10 Python
简单介绍Python中的JSON模块
Apr 08 Python
python创建进程fork用法
Jun 04 Python
Python中.py文件打包成exe可执行文件详解
Mar 22 Python
Python爬虫框架scrapy实现的文件下载功能示例
Aug 04 Python
python实现创建新列表和新字典,并使元素及键值对全部变成小写
Jan 15 Python
Python使用修饰器进行异常日志记录操作示例
Mar 19 Python
Python 绘制酷炫的三维图步骤详解
Jul 12 Python
OpenCV+Python--RGB转HSI的实现
Nov 27 Python
Python实现图像去噪方式(中值去噪和均值去噪)
Dec 18 Python
pytorch中nn.Conv1d的用法详解
Dec 31 Python
Python编写冷笑话生成器
Apr 20 Python
python实现八大排序算法(1)
Sep 14 #Python
python实现简单聊天应用 python群聊和点对点均实现
Sep 14 #Python
Python实现购物系统(示例讲解)
Sep 13 #Python
python模块之sys模块和序列化模块(实例讲解)
Sep 13 #Python
python模块之time模块(实例讲解)
Sep 13 #Python
python difflib模块示例讲解
Sep 13 #Python
Python网络编程 Python套接字编程
Sep 13 #Python
You might like
福利彩票幸运号码自动生成器
2006/10/09 PHP
PHP入门经历和学习过程分享
2014/04/11 PHP
一键生成各种尺寸Icon的php脚本(实例)
2017/02/08 PHP
PHP实现的二分查找算法实例分析
2017/12/19 PHP
Laravel实现搜索的时候分页并携带参数
2019/10/15 PHP
Mootools 图片展示插件(lightbox,ImageMenu)收集集合
2010/05/21 Javascript
JS中的public和private对象,即static修饰符
2012/01/18 Javascript
ASP.NET jQuery 实例12 通过使用jQuery validation插件简单实现用户注册页面验证功能
2012/02/03 Javascript
ANGULARJS中用NG-BIND指令实现单向绑定的例子
2014/12/08 Javascript
javascript的tab切换原理与效果实现方法
2015/01/10 Javascript
使用jquery操作session方法分享
2015/01/22 Javascript
JavaScript将字符串转换成字符编码列表的方法
2015/03/19 Javascript
Jquery promise实现一张一张加载图片
2015/11/13 Javascript
理解javascript中DOM事件
2015/12/25 Javascript
JSONP和批量操作功能的实现方法
2016/08/21 Javascript
js 轮播效果实例分享
2016/12/28 Javascript
整理关于Bootstrap模态弹出框的慕课笔记
2017/03/29 Javascript
nodejs调取微信收货地址的方法
2017/12/20 NodeJs
AngularJS实现的生成随机数与猜数字大小功能示例
2017/12/25 Javascript
vue+axios+mock.js环境搭建的方法步骤
2018/08/28 Javascript
vuex根据不同的用户权限展示不同的路由列表功能
2019/09/20 Javascript
python学习之matplotlib绘制散点图实例
2017/12/09 Python
python中列表和元组的区别
2017/12/18 Python
python 解决动态的定义变量名,并给其赋值的方法(大数据处理)
2018/11/10 Python
详解如何用django实现redirect的几种方法总结
2018/11/22 Python
Python BeautifulSoup [解决方法] TypeError: list indices must be integers or slices, not str
2019/08/07 Python
python通过SSH登陆linux并操作的实现
2019/10/10 Python
Python模拟登录之滑块验证码的破解(实例代码)
2019/11/18 Python
python实现飞行棋游戏
2020/02/05 Python
赞美老师的演讲稿
2014/05/22 职场文书
设计师求职信
2014/07/01 职场文书
领导班子整改方案
2014/10/25 职场文书
法定代表人证明书
2014/11/28 职场文书
SQLServer 日期函数大全(小结)
2021/04/08 SQL Server
微信小程序中wxs文件的一些妙用分享
2022/02/18 Javascript
解决Mysql报错 Table 'mysql.user' doesn't exist
2022/05/06 MySQL