Python实现简单的获取图片爬虫功能示例


Posted in Python onJuly 12, 2017

本文实例讲述了Python实现简单的获取图片爬虫功能。分享给大家供大家参考,具体如下:

简单Python爬虫,获得网页上的照片

#coding=utf-8
import urllib
import re
def getHtml(url):
  page = urllib.urlopen(url)
  html = page.read()
  return html
def getImg(html):
  reg = r'src="(.+?\.jpg)" pic_ext'
  imgre = re.compile(reg)
  imglist = re.findall(imgre, html)
  return imglist
// 网站地址
url = "http://tieba.baidu.com/p/3368048910?pn=2"
html = getHtml(url)
listimg = getImg(html)
x = 0
for imgAddress in listimg:
  print imgAddress
  urllib.urlretrieve(imgAddress, 'image%s.jpg' % x)
  x+=1

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python的Flask框架与数据库连接的教程
Apr 20 Python
在Django的模型中添加自定义方法的示例
Jul 21 Python
Tensorflow之构建自己的图片数据集TFrecords的方法
Feb 07 Python
python 显示数组全部元素的方法
Apr 19 Python
python+pandas分析nginx日志的实例
Apr 28 Python
Python Pandas批量读取csv文件到dataframe的方法
Oct 08 Python
Python根据成绩分析系统浅析
Feb 11 Python
使用python制作一个为hex文件增加版本号的脚本实例
Jun 12 Python
Python通过Tesseract库实现文字识别
Mar 05 Python
DjangoWeb使用Datatable进行后端分页的实现
May 18 Python
Python实现王者荣耀自动刷金币的完整步骤
Jan 22 Python
python实现双向链表原理
May 25 Python
python文件特定行插入和替换实例详解
Jul 12 #Python
梯度下降法介绍及利用Python实现的方法示例
Jul 12 #Python
python3之微信文章爬虫实例讲解
Jul 12 #Python
python脚本替换指定行实现步骤
Jul 11 #Python
Python书单 不将就
Jul 11 #Python
Python编写一个闹钟功能
Jul 11 #Python
python自定义异常实例详解
Jul 11 #Python
You might like
DC漫画《蝙蝠侠和猫女》图透 猫女怀孕老爷当爹
2020/04/09 欧美动漫
php中explode与split的区别介绍
2012/10/03 PHP
深入理解PHP的远程多会话调试
2017/09/21 PHP
两个数组去重的JS代码
2013/12/04 Javascript
node.js中的console.info方法使用说明
2014/12/09 Javascript
Jquery实现图片预加载与延时加载的方法
2014/12/22 Javascript
jQuery+slidereveal实现的面板滑动侧边展出效果
2015/03/14 Javascript
简介JavaScript中Math.LOG10E属性的使用
2015/06/14 Javascript
js实现a标签超链接提交form表单的方法
2015/06/24 Javascript
详解支持Angular 2的表格控件
2017/01/19 Javascript
bootstrap 下拉多选框进行多选传值问题代码分析
2017/02/14 Javascript
ES6实现的遍历目录函数示例
2017/04/07 Javascript
vue.js  父向子组件传参的实例代码
2017/10/29 Javascript
vue移动端实现下拉刷新
2018/04/22 Javascript
vuex页面刷新后数据丢失的方法
2019/01/17 Javascript
简单了解JS打开url的方法
2020/02/21 Javascript
[04:11]2014DOTA2国际邀请赛 CIS遗憾出局梦想不灭
2014/07/09 DOTA
python实现2014火车票查询代码分享
2014/01/10 Python
使用Python程序抓取新浪在国内的所有IP的教程
2015/05/04 Python
python3 求约数的实例
2019/12/05 Python
pytorch对梯度进行可视化进行梯度检查教程
2020/02/04 Python
python动态规划算法实例详解
2020/11/22 Python
金蝶的一道SQL笔试题
2012/12/18 面试题
中医药大学毕业生自荐信
2013/11/08 职场文书
网络技术专业推荐信
2014/02/20 职场文书
《骆驼和羊》教学反思
2014/02/27 职场文书
高中生的自我评价
2014/03/04 职场文书
股东协议书范本
2014/04/14 职场文书
听课评语大全
2014/04/30 职场文书
2014镇副书记群众路线专题民主生活会思想汇报
2014/09/23 职场文书
关于运动会广播稿50字
2014/10/18 职场文书
行政主管岗位职责
2015/02/03 职场文书
德能勤绩廉个人总结
2015/02/14 职场文书
《祁黄羊》教学反思
2016/02/20 职场文书
pytorch 中autograd.grad()函数的用法说明
2021/05/12 Python
MySQL中几种插入和批量语句实例详解
2021/09/14 MySQL