编程 Python

Python3.4编程实现简单抓取爬虫功能示例

Posted in Python onSeptember 14, 2017

本文实例讲述了Python3.4编程实现简单抓取爬虫功能。分享给大家供大家参考，具体如下：

import urllib.request
import urllib.parse
import re
import urllib.request,urllib.parse,http.cookiejar
import time
def getHtml(url):
  cj=http.cookiejar.CookieJar()
  opener=urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
  opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36'),('Cookie','4564564564564564565646540')]
  urllib.request.install_opener(opener)
  page = urllib.request.urlopen(url)
  html = page.read()
  return html
#print ( html)
#html = getHtml("http://weibo.com/")
def getimg(html):
  html = html.decode('utf-8')
  reg='"screen_name":"(.*?)"'
  imgre = re.compile(reg)
  src=re.findall(imgre,html)
  return src
#print ("",getimg(html))
uid=['2808675432','3888405676','2628551531','2808587400']
for a in list(uid):
  print (getimg(getHtml("http://weibo.com/"+a)))
  time.sleep(1)

更多关于Python相关内容可查看本站专题：《Python Socket编程技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python3.4编程实现简单抓取爬虫功能示例

- Author -

macwhirr123

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python中list循环语句用法实例

Nov 10 Python

Python合并两个字典的常用方法与效率比较

Jun 17 Python

Python基于回溯法子集树模板实现图的遍历功能示例

Sep 05 Python

分享一个简单的python读写文件脚本

Nov 25 Python

python爬取淘宝商品详情页数据

Feb 23 Python

python matplotlib 在指定的两个点之间连线方法

May 25 Python

python实现飞机大战

Sep 11 Python

python判断输入日期为第几天的实例

Nov 13 Python

python RC4加密操作示例【测试可用】

Sep 26 Python

Python爬虫实现vip电影下载的示例代码

Apr 20 Python

关于Python字符编码与二进制不得不说的一些事

Oct 04 Python

python神经网络使用Keras构建RNN训练

May 04 Python

python实现八大排序算法（1）

Sep 14 #Python

python实现简单聊天应用 python群聊和点对点均实现

Sep 14 #Python

Python实现购物系统(示例讲解)

Sep 13 #Python

python模块之sys模块和序列化模块(实例讲解)

Sep 13 #Python

python模块之time模块(实例讲解)

Sep 13 #Python

python difflib模块示例讲解

Sep 13 #Python

Python网络编程 Python套接字编程

Sep 13 #Python

You might like

Zend的Registry机制的使用说明

2013/05/02 PHP

PHP的伪随机数与真随机数详解

2015/05/27 PHP

PHP编程计算两个时间段是否有交集的实现方法(不算边界重叠)

2017/05/30 PHP

漂亮的thinkphp 跳转页封装示例

2019/10/16 PHP

PHP设计模式之数据访问对象模式（DAO）原理与用法实例分析

2019/12/12 PHP

Javascript操纵Cookie实现购物车程序

2006/11/23 Javascript

jQuery 网易相册鼠标移动显示隐藏效果实现代码

2013/03/31 Javascript

node.js中的fs.ftruncate方法使用说明

2014/12/15 Javascript

轻松实现Bootstrap图片轮播

2020/04/20 Javascript

在javascript中创建对象的各种模式解析

2016/05/16 Javascript

JS简单实现DIV相对于浏览器固定位置不变的方法

2016/06/17 Javascript

如何在JS中实现相互转换XML和JSON

2016/07/19 Javascript

详解angularjs结合pagination插件实现分页功能

2017/02/10 Javascript

ES6新特性之字符串的扩展实例分析

2017/04/01 Javascript

JavaScript全屏和退出全屏事件总结（附代码）

2017/08/17 Javascript

vue的安装及element组件的安装方法

2018/03/09 Javascript

小程序实现上下移动切换位置

2019/09/23 Javascript

vue微信分享插件使用方法详解

2020/02/18 Javascript

python3.6连接MySQL和表的创建与删除实例代码

2017/12/28 Python

python实现数据库跨服务器迁移

2018/04/12 Python

Python实现手写一个类似django的web框架示例

2018/07/20 Python

python实现大战外星人小游戏实例代码

2019/12/26 Python

使用Python封装excel操作指南

2021/01/29 Python

html5拍照功能实现代码(htm5上传文件)

2013/12/11 HTML / CSS

Solid & Striped官网：美国泳装品牌

2019/06/19 全球购物

意大利买卖二手奢侈品网站：LAMPOO

2020/06/03 全球购物

经典的班主任推荐信

2013/10/28 职场文书

生物学学生自我评价

2014/01/17 职场文书

管理专员自荐信

2014/01/26 职场文书

理想演讲稿范文

2014/05/21 职场文书

运动员获奖感言

2014/08/15 职场文书

乡镇群众路线专项整治方案

2014/11/03 职场文书

加薪通知

2015/04/25 职场文书

学校后勤工作总结2015

2015/05/15 职场文书

在redisCluster中模糊获取key方式

2021/07/09 Redis

python 实现图片特效处理

2022/04/03 Python