Python使用正则匹配实现抓图代码分享


Posted in Python onApril 02, 2015

内涵:正则匹配,正则替换,页面抓取,图片保存 。

实用的第一次 Python 代码 参考

#!/usr/bin/env python
import urllib
import re
 
x=0
def getHtml(url):
 page = urllib.urlopen(url)
 html = page.read()
 return html
 
def getImg(html):
 global x
 reg = 'alt=".+?" src="(.+?\.jpg)"'
 imgre = re.compile(reg)
 imglist = re.findall(imgre,html)
 for imgurl in imglist:
  urllib.urlretrieve(re.sub(r',\d+,\d+',',800,450',imgurl),"img/%s.jpg" % x)
  print "\n"+re.sub(r',\d+,\d+',',800,450',imgurl)+"========"+"img/%s.jpg" % x
  x+=1
 
print 'Starting...'
 
pages = range(1,9)
 
for p in pages:
 html = getHtml('http://m.lovebizhi.com/category/7655/%d/' % p)
 print "\n-------------------------page:%d-------------------------------" % p
 getImg(html)
 
print "\nDone!"

以上所述就是本文给大家分享的全部代码了,本人Python菜鸟,第一个作品,希望对大家能有所帮助。

Python 相关文章推荐
python循环监控远程端口的方法
Mar 14 Python
python+selenium实现163邮箱自动登陆的方法
Dec 31 Python
使用Python写一个小游戏
Apr 02 Python
python3写的简单本地文件上传服务器实例
Jun 04 Python
Anaconda下安装mysql-python的包实例
Jun 11 Python
python语音识别实践之百度语音API
Aug 30 Python
python读取图片的方式,以及将图片以三维数组的形式输出方法
Jul 03 Python
python 发送json数据操作实例分析
Oct 15 Python
python 实现绘制整齐的表格
Nov 18 Python
python求一个字符串的所有排列的实现方法
Feb 04 Python
python上传时包含boundary时的解决方法
Apr 08 Python
python新手学习使用库
Jun 11 Python
用Python展示动态规则法用以解决重叠子问题的示例
Apr 02 #Python
Python编写百度贴吧的简单爬虫
Apr 02 #Python
用Python制作简单的钢琴程序的教程
Apr 01 #Python
仅利用30行Python代码来展示X算法
Apr 01 #Python
探究数组排序提升Python程序的循环的运行效率的原因
Apr 01 #Python
用Python编写分析Python程序性能的工具的教程
Apr 01 #Python
对Python新手编程过程中如何规避一些常见问题的建议
Apr 01 #Python
You might like
PHP循环获取GET和POST值的代码
2008/04/09 PHP
Php Image Resize图片大小调整的函数代码
2011/01/17 PHP
匹配csdn用户数据库与官方用户的重合度并将重叠部分的用户筛选出来
2011/12/25 PHP
简单的php文件上传(实例)
2013/10/27 PHP
使用JavaScript动态设置样式实现代码及演示动画
2013/01/25 Javascript
浅谈Javascript 执行顺序
2013/12/18 Javascript
从js向Action传中文参数出现乱码问题的解决方法
2013/12/29 Javascript
JavaScript中数据结构与算法(一):栈
2015/06/19 Javascript
jQuery实现图片上传和裁剪插件Croppie
2015/11/29 Javascript
利用JS提交表单的几种方法和验证(必看篇)
2016/09/17 Javascript
Vue.JS项目中5个经典Vuex插件
2017/11/28 Javascript
angularJs中json数据转换与本地存储的实例
2018/10/08 Javascript
vuex 解决报错this.$store.commit is not a function的方法
2018/12/17 Javascript
Vue.js标签页组件使用方法详解
2019/10/19 Javascript
微信小程序实现限制用户转发功能的实例代码
2020/02/22 Javascript
微信小程序开发(一):服务器获取数据列表渲染操作示例
2020/06/01 Javascript
React实现全选功能
2020/08/25 Javascript
[03:00]《DAC最前线》之欧美新秀VS老将
2015/02/01 DOTA
Python中字典(dict)和列表(list)的排序方法实例
2014/06/16 Python
python实现可以断点续传和并发的ftp程序
2016/09/13 Python
查看django执行的sql语句及消耗时间的两种方法
2018/05/29 Python
Django中使用第三方登录的示例代码
2018/08/20 Python
python3.6利用pyinstall打包py为exe的操作实例
2018/10/31 Python
python3爬虫学习之数据存储txt的案例详解
2019/04/24 Python
python对矩阵进行转置的2种处理方法
2019/07/17 Python
解决Tensorflow占用GPU显存问题
2020/02/03 Python
Python基于codecs模块实现文件读写案例解析
2020/05/11 Python
tensorflow 大于某个值为1,小于为0的实例
2020/06/30 Python
python Scrapy爬虫框架的使用
2021/01/21 Python
PHP如何防止SQL注入
2014/05/03 面试题
应届生护士求职信
2013/11/01 职场文书
学生周末回家住宿长期请假条
2014/02/15 职场文书
2015年庆祝国庆节66周年演讲稿
2015/07/30 职场文书
2019客服个人年终工作总结范文
2019/07/08 职场文书
2019奶茶店创业计划书范本,值得你借鉴
2019/08/14 职场文书
导游词之河北白洋淀
2020/01/15 职场文书