python抓取网页中的图片示例


Posted in Python onFebruary 28, 2014
#coding:utf8
import re
import urllib
def getHTML(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html
def getImg(html,imgType):
    reg = r'src="(.*?\.+'+imgType+'!slider)" '
    imgre = re.compile(reg)
    imgList = re.findall(imgre, html)
    x=0
    for imgurl in imgList:
        print imgurl
        urllib.urlretrieve(imgurl, '%s.%s' % (x, imgType))
        x =x+1

html= getHTML("https://3water.com")
getImg(html,'jpg')
Python 相关文章推荐
python实现socket端口重定向示例
Feb 10 Python
python输出当前目录下index.html文件路径的方法
Apr 28 Python
在windows下快速搭建web.py开发框架方法
Apr 22 Python
Python实现读取Properties配置文件的方法
Mar 29 Python
Python中asyncio与aiohttp入门教程
Oct 16 Python
pandas 将索引值相加的方法
Nov 15 Python
在PyCharm中控制台输出日志分层级分颜色显示的方法
Jul 11 Python
PyCharm2019安装教程及其使用(图文教程)
Sep 29 Python
python多线程并发及测试框架案例
Oct 15 Python
python生成特定分布数的实例
Dec 05 Python
用pandas划分数据集实现训练集和测试集
Jul 20 Python
浅谈Selenium+Webdriver 常用的元素定位方式
Jan 13 Python
使用python分析git log日志示例
Feb 27 #Python
python去掉字符串中重复字符的方法
Feb 27 #Python
tornado捕获和处理404错误的方法
Feb 26 #Python
python为tornado添加recaptcha验证码功能
Feb 26 #Python
python实现博客文章爬虫示例
Feb 26 #Python
python处理中文编码和判断编码示例
Feb 26 #Python
python实现网页链接提取的方法分享
Feb 25 #Python
You might like
解析smarty 截取字符串函数 truncate的用法介绍
2013/06/20 PHP
php中sql注入漏洞示例 sql注入漏洞修复
2014/01/24 PHP
Highslide.js是一款基于js实现的网页中图片展示插件
2020/03/30 Javascript
DIY jquery plugin - tabs标签切换实现代码
2010/12/11 Javascript
javascript写的日历类(基于pj)
2010/12/28 Javascript
javascript获取鼠标点击元素对象(示例代码)
2013/12/20 Javascript
构造函数+原型模式构造js自定义对象(最通用)
2014/05/12 Javascript
JavaScript代码轻松实现网页内容禁止复制(代码简单)
2015/10/23 Javascript
jQuery+CSS3实现3D立方体旋转效果
2015/11/10 Javascript
JavaScript学习笔记之检测客户端类型是(引擎、浏览器、平台、操作系统、移动设备)
2015/12/03 Javascript
js与jquery分别实现tab标签页功能的方法
2016/11/18 Javascript
ES6正则的扩展实例详解
2017/04/25 Javascript
Vue源码学习之初始化模块init.js解析
2017/11/02 Javascript
jQuery实现图片简单轮播功能示例
2018/08/13 jQuery
微信头像地址失效踩坑记附带解决方案
2019/09/23 Javascript
使用Webpack提升Vue.js应用程序的4种方法(翻译)
2019/10/09 Javascript
Vue修改项目启动端口号方法
2019/11/07 Javascript
vue使用prop可以渲染但是打印台报错的解决方式
2019/11/13 Javascript
JavaScript数组排序的六种常见算法总结
2020/08/18 Javascript
小程序实现点击tab切换左右滑动
2020/11/16 Javascript
python 剪切移动文件的实现代码
2018/08/02 Python
tensorflow实现简单逻辑回归
2018/09/07 Python
利用python脚本如何简化jar操作命令
2019/02/24 Python
对python中的*args与**kwgs的含义与作用详解
2019/08/28 Python
pytorch加载自定义网络权重的实现
2020/01/07 Python
Pytorch模型转onnx模型实例
2020/01/15 Python
python GUI库图形界面开发之PyQt5图片显示控件QPixmap详细使用方法与实例
2020/02/27 Python
Python爬取网站图片并保存的实现示例
2021/02/26 Python
伦敦著名的运动鞋综合商店:Footpatrol
2019/03/25 全球购物
英国电信商店:BT Shop
2019/12/17 全球购物
Tommy Hilfiger澳洲官网:美国高端休闲领导品牌
2020/12/16 全球购物
会计电算一体化个人简历的自我评价
2013/10/15 职场文书
师恩难忘教学反思
2014/04/27 职场文书
销售团队激励口号
2014/06/06 职场文书
党的群众路线教育实践活动个人整改措施材料
2014/11/04 职场文书
vue中data改变后让视图同步更新的方法
2021/03/29 Vue.js