Python实现简单的获取图片爬虫功能示例


Posted in Python onJuly 12, 2017

本文实例讲述了Python实现简单的获取图片爬虫功能。分享给大家供大家参考,具体如下:

简单Python爬虫,获得网页上的照片

#coding=utf-8
import urllib
import re
def getHtml(url):
  page = urllib.urlopen(url)
  html = page.read()
  return html
def getImg(html):
  reg = r'src="(.+?\.jpg)" pic_ext'
  imgre = re.compile(reg)
  imglist = re.findall(imgre, html)
  return imglist
// 网站地址
url = "http://tieba.baidu.com/p/3368048910?pn=2"
html = getHtml(url)
listimg = getImg(html)
x = 0
for imgAddress in listimg:
  print imgAddress
  urllib.urlretrieve(imgAddress, 'image%s.jpg' % x)
  x+=1

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
详解Python中的相对导入和绝对导入
Jan 06 Python
通过python顺序修改文件名字的方法
Jul 11 Python
Python数据类型之Number数字操作实例详解
May 08 Python
Python3之手动创建迭代器的实例代码
May 22 Python
关于不懂Chromedriver如何配置环境变量问题解决方法
Jun 12 Python
linux环境中没有网络怎么下载python
Jul 07 Python
使用python turtle画高达
Jan 19 Python
Python 基于FIR实现Hilbert滤波器求信号包络详解
Feb 26 Python
windows10 pycharm下安装pyltp库和加载模型实现语义角色标注的示例代码
May 07 Python
Python decimal模块使用方法详解
Jun 08 Python
Python3使用tesserocr识别字母数字验证码的实现
Jan 29 Python
Linux系统下升级pip的完整步骤
Jan 31 Python
python文件特定行插入和替换实例详解
Jul 12 #Python
梯度下降法介绍及利用Python实现的方法示例
Jul 12 #Python
python3之微信文章爬虫实例讲解
Jul 12 #Python
python脚本替换指定行实现步骤
Jul 11 #Python
Python书单 不将就
Jul 11 #Python
Python编写一个闹钟功能
Jul 11 #Python
python自定义异常实例详解
Jul 11 #Python
You might like
屏蔽浏览器缓存另类方法
2006/10/09 PHP
php格式化时间戳显示友好的时间实现思路及代码
2014/10/23 PHP
php获取远程文件内容的函数
2015/11/02 PHP
在PHP中使用FastCGI解析漏洞及修复方案
2015/11/10 PHP
PHP使用Pear发送邮件(Windows环境)
2016/01/05 PHP
Thinkphp微信公众号支付接口
2016/08/04 PHP
禁止iframe脚本弹出的窗口覆盖了父窗口的方法
2014/09/06 Javascript
jQuery实现响应浏览器缩放大小并改变背景颜色
2014/10/31 Javascript
node中socket.io的事件使用详解
2014/12/15 Javascript
JS实现带有抽屉效果的产品类网站多级导航菜单代码
2015/09/15 Javascript
JavaScript控制浏览器全屏及各种浏览器全屏模式的方法、属性和事件
2015/12/20 Javascript
JavaScript中通过提示框跳转页面的方法
2016/02/14 Javascript
Javascript HTML5 Canvas实现的一个画板
2020/04/12 Javascript
JS基于递归实现倒计时效果的方法
2016/11/26 Javascript
JS 拦截全局ajax请求实例解析
2016/11/29 Javascript
JS实现倒序输出的几种常用方法示例
2019/04/13 Javascript
微信小程序使用websocket通讯的demo,含前后端代码,亲测可用
2019/05/22 Javascript
js实现简单页面全屏
2019/09/17 Javascript
Vue 封装防刷新考试倒计时组件的实现
2020/06/05 Javascript
python实现的简单窗口倒计时界面实例
2015/05/05 Python
Python中生成Epoch的方法
2017/04/26 Python
python3.4用循环往mysql5.7中写数据并输出的实现方法
2017/06/20 Python
html5跳转小程序wx-open-launch-weapp踩坑
2020/12/02 HTML / CSS
美国祛痘、抗衰老药妆品牌:Murad
2016/08/27 全球购物
唤醒头发毛囊的秘密武器:Grow Gorgeous
2016/08/28 全球购物
微软英国官方网站:Microsoft英国
2016/10/15 全球购物
Boda Skins皮衣官网:奢侈皮夹克,全球配送
2016/12/15 全球购物
Oracle性能调优原则
2012/05/03 面试题
园林资料员岗位职责
2013/12/30 职场文书
企业项目策划书
2014/01/11 职场文书
学校食品安全实施方案
2014/06/14 职场文书
乡镇党员干部四风对照检查材料思想汇报
2014/09/27 职场文书
房屋买卖协议样本
2014/11/16 职场文书
拾金不昧表扬信
2015/01/16 职场文书
初中运动会前导词
2015/07/20 职场文书
python标准库ElementTree处理xml
2022/05/20 Python