Python3.4编程实现简单抓取爬虫功能示例


Posted in Python onSeptember 14, 2017

本文实例讲述了Python3.4编程实现简单抓取爬虫功能。分享给大家供大家参考,具体如下:

import urllib.request
import urllib.parse
import re
import urllib.request,urllib.parse,http.cookiejar
import time
def getHtml(url):
  cj=http.cookiejar.CookieJar()
  opener=urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
  opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36'),('Cookie','4564564564564564565646540')]
  urllib.request.install_opener(opener)
  page = urllib.request.urlopen(url)
  html = page.read()
  return html
#print ( html)
#html = getHtml("http://weibo.com/")
def getimg(html):
  html = html.decode('utf-8')
  reg='"screen_name":"(.*?)"'
  imgre = re.compile(reg)
  src=re.findall(imgre,html)
  return src
#print ("",getimg(html))
uid=['2808675432','3888405676','2628551531','2808587400']
for a in list(uid):
  print (getimg(getHtml("http://weibo.com/"+a)))
  time.sleep(1)

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python中list循环语句用法实例
Nov 10 Python
Python合并两个字典的常用方法与效率比较
Jun 17 Python
Python基于回溯法子集树模板实现图的遍历功能示例
Sep 05 Python
分享一个简单的python读写文件脚本
Nov 25 Python
python爬取淘宝商品详情页数据
Feb 23 Python
python matplotlib 在指定的两个点之间连线方法
May 25 Python
python实现飞机大战
Sep 11 Python
python判断输入日期为第几天的实例
Nov 13 Python
python RC4加密操作示例【测试可用】
Sep 26 Python
Python爬虫实现vip电影下载的示例代码
Apr 20 Python
关于Python字符编码与二进制不得不说的一些事
Oct 04 Python
python神经网络 使用Keras构建RNN训练
May 04 Python
python实现八大排序算法(1)
Sep 14 #Python
python实现简单聊天应用 python群聊和点对点均实现
Sep 14 #Python
Python实现购物系统(示例讲解)
Sep 13 #Python
python模块之sys模块和序列化模块(实例讲解)
Sep 13 #Python
python模块之time模块(实例讲解)
Sep 13 #Python
python difflib模块示例讲解
Sep 13 #Python
Python网络编程 Python套接字编程
Sep 13 #Python
You might like
Zend的Registry机制的使用说明
2013/05/02 PHP
PHP的伪随机数与真随机数详解
2015/05/27 PHP
PHP编程计算两个时间段是否有交集的实现方法(不算边界重叠)
2017/05/30 PHP
漂亮的thinkphp 跳转页封装示例
2019/10/16 PHP
PHP设计模式之数据访问对象模式(DAO)原理与用法实例分析
2019/12/12 PHP
Javascript操纵Cookie实现购物车程序
2006/11/23 Javascript
jQuery 网易相册鼠标移动显示隐藏效果实现代码
2013/03/31 Javascript
node.js中的fs.ftruncate方法使用说明
2014/12/15 Javascript
轻松实现Bootstrap图片轮播
2020/04/20 Javascript
在javascript中创建对象的各种模式解析
2016/05/16 Javascript
JS简单实现DIV相对于浏览器固定位置不变的方法
2016/06/17 Javascript
如何在JS中实现相互转换XML和JSON
2016/07/19 Javascript
详解angularjs结合pagination插件实现分页功能
2017/02/10 Javascript
ES6新特性之字符串的扩展实例分析
2017/04/01 Javascript
JavaScript全屏和退出全屏事件总结(附代码)
2017/08/17 Javascript
vue的安装及element组件的安装方法
2018/03/09 Javascript
小程序实现上下移动切换位置
2019/09/23 Javascript
vue微信分享插件使用方法详解
2020/02/18 Javascript
python3.6连接MySQL和表的创建与删除实例代码
2017/12/28 Python
python实现数据库跨服务器迁移
2018/04/12 Python
Python实现手写一个类似django的web框架示例
2018/07/20 Python
python实现大战外星人小游戏实例代码
2019/12/26 Python
使用Python封装excel操作指南
2021/01/29 Python
html5拍照功能实现代码(htm5上传文件)
2013/12/11 HTML / CSS
Solid & Striped官网:美国泳装品牌
2019/06/19 全球购物
意大利买卖二手奢侈品网站:LAMPOO
2020/06/03 全球购物
经典的班主任推荐信
2013/10/28 职场文书
生物学学生自我评价
2014/01/17 职场文书
管理专员自荐信
2014/01/26 职场文书
理想演讲稿范文
2014/05/21 职场文书
运动员获奖感言
2014/08/15 职场文书
乡镇群众路线专项整治方案
2014/11/03 职场文书
加薪通知
2015/04/25 职场文书
学校后勤工作总结2015
2015/05/15 职场文书
在redisCluster中模糊获取key方式
2021/07/09 Redis
python 实现图片特效处理
2022/04/03 Python