Python使用正则匹配实现抓图代码分享


Posted in Python onApril 02, 2015

内涵:正则匹配,正则替换,页面抓取,图片保存 。

实用的第一次 Python 代码 参考

#!/usr/bin/env python
import urllib
import re
 
x=0
def getHtml(url):
 page = urllib.urlopen(url)
 html = page.read()
 return html
 
def getImg(html):
 global x
 reg = 'alt=".+?" src="(.+?\.jpg)"'
 imgre = re.compile(reg)
 imglist = re.findall(imgre,html)
 for imgurl in imglist:
  urllib.urlretrieve(re.sub(r',\d+,\d+',',800,450',imgurl),"img/%s.jpg" % x)
  print "\n"+re.sub(r',\d+,\d+',',800,450',imgurl)+"========"+"img/%s.jpg" % x
  x+=1
 
print 'Starting...'
 
pages = range(1,9)
 
for p in pages:
 html = getHtml('http://m.lovebizhi.com/category/7655/%d/' % p)
 print "\n-------------------------page:%d-------------------------------" % p
 getImg(html)
 
print "\nDone!"

以上所述就是本文给大家分享的全部代码了,本人Python菜鸟,第一个作品,希望对大家能有所帮助。

Python 相关文章推荐
python发送HTTP请求的方法小结
Jul 08 Python
python遍历 truple list dictionary的几种方法总结
Sep 11 Python
python学习基础之循环import及import过程
Apr 22 Python
对python .txt文件读取及数据处理方法总结
Apr 23 Python
python flask解析json数据不完整的解决方法
May 26 Python
如何通过雪花算法用Python实现一个简单的发号器
Jul 03 Python
python多任务之协程的使用详解
Aug 26 Python
Python argparse模块应用实例解析
Nov 15 Python
Python通过文本和图片生成词云图
May 21 Python
Python如何实现定时器功能
May 28 Python
python3.4中清屏的处理方法
Jul 06 Python
浅谈python出错时traceback的解读
Jul 15 Python
用Python展示动态规则法用以解决重叠子问题的示例
Apr 02 #Python
Python编写百度贴吧的简单爬虫
Apr 02 #Python
用Python制作简单的钢琴程序的教程
Apr 01 #Python
仅利用30行Python代码来展示X算法
Apr 01 #Python
探究数组排序提升Python程序的循环的运行效率的原因
Apr 01 #Python
用Python编写分析Python程序性能的工具的教程
Apr 01 #Python
对Python新手编程过程中如何规避一些常见问题的建议
Apr 01 #Python
You might like
PHP缩略图等比例无损压缩,可填充空白区域补充色
2011/06/10 PHP
php和数据库结合的一个简单的web实例 代码分析 (php初学者)
2011/07/28 PHP
分享PHP header函数使用教程
2013/09/05 PHP
PHP实现C#山寨ArrayList的方法
2015/07/16 PHP
php基础教程
2015/08/26 PHP
PHP 根据key 给二维数组分组
2016/12/09 PHP
php扩展开发入门demo示例
2019/09/23 PHP
PHP7创建COOKIE和销毁COOKIE的实例方法
2020/02/03 PHP
My Desktop :) 桌面式代码
2008/12/29 Javascript
js编写trim()函数及正则表达式的运用
2013/10/24 Javascript
input:checkbox多选框实现单选效果跟radio一样
2014/06/16 Javascript
Javascript闭包(Closure)详解
2015/05/05 Javascript
2016年最热门的15 款代码语法高亮工具,美化你的代码
2016/01/06 Javascript
jQuery实现元素拖拽并cookie保存顺序的方法
2016/02/20 Javascript
常用原生JS兼容性写法汇总
2016/04/27 Javascript
js制作网站首页图片轮播特效代码
2016/08/30 Javascript
jquery 多个radio的click事件实例
2016/12/03 Javascript
web前端开发中常见的多列布局解决方案整理(一定要看)
2017/10/15 Javascript
Electron autoUpdater实现Windows安装包自动更新的方法
2018/12/24 Javascript
发布一款npm包帮助理解npm的使用
2019/01/03 Javascript
angular *Ngif else用法详解
2020/12/15 Javascript
[04:29]2014DOTA2国际邀请赛 主赛事第三日TOPPLAY
2014/07/21 DOTA
[01:20:05]DOTA2-DPC中国联赛 正赛 Ehome vs VG BO3 第二场 2月5日
2021/03/11 DOTA
python定时检查启动某个exe程序适合检测exe是否挂了
2013/01/21 Python
python sys模块sys.path使用方法示例
2013/12/04 Python
Python实现二分法算法实例
2015/02/02 Python
修复CentOS7升级Python到3.6版本后yum不能正确使用的解决方法
2018/01/26 Python
pycharm实现在虚拟环境中引入别人的项目
2020/03/09 Python
canvas版人体时钟的实现示例
2021/01/29 HTML / CSS
Footshop乌克兰:运动鞋的最大选择
2019/12/01 全球购物
Feelunique中文官网:欧洲最大化妆品零售电商
2020/07/10 全球购物
职业生涯规划设计步骤
2014/01/12 职场文书
公务员四风问题对照检查材料整改措施
2014/09/26 职场文书
python 下载文件的几种方式分享
2021/04/07 Python
Python打包exe时各种异常处理方案总结
2021/05/18 Python
Python语言内置数据类型
2022/02/24 Python