Python使用正则匹配实现抓图代码分享


Posted in Python onApril 02, 2015

内涵:正则匹配,正则替换,页面抓取,图片保存 。

实用的第一次 Python 代码 参考

#!/usr/bin/env python
import urllib
import re
 
x=0
def getHtml(url):
 page = urllib.urlopen(url)
 html = page.read()
 return html
 
def getImg(html):
 global x
 reg = 'alt=".+?" src="(.+?\.jpg)"'
 imgre = re.compile(reg)
 imglist = re.findall(imgre,html)
 for imgurl in imglist:
  urllib.urlretrieve(re.sub(r',\d+,\d+',',800,450',imgurl),"img/%s.jpg" % x)
  print "\n"+re.sub(r',\d+,\d+',',800,450',imgurl)+"========"+"img/%s.jpg" % x
  x+=1
 
print 'Starting...'
 
pages = range(1,9)
 
for p in pages:
 html = getHtml('http://m.lovebizhi.com/category/7655/%d/' % p)
 print "\n-------------------------page:%d-------------------------------" % p
 getImg(html)
 
print "\nDone!"

以上所述就是本文给大家分享的全部代码了,本人Python菜鸟,第一个作品,希望对大家能有所帮助。

Python 相关文章推荐
利用python批量检查网站的可用性
Sep 09 Python
Python中字符串的处理技巧分享
Sep 17 Python
python 爬虫出现403禁止访问错误详解
Mar 11 Python
python发送邮件实例分享
Jul 28 Python
selenium+python自动化测试之多窗口切换
Jan 23 Python
Python3.4学习笔记之列表、数组操作示例
Mar 01 Python
PyQt5创建一个新窗口的实例
Jun 20 Python
Django Channels 实现点对点实时聊天和消息推送功能
Jul 17 Python
详解centos7+django+python3+mysql+阿里云部署项目全流程
Nov 15 Python
详解pycharm连接不上mysql数据库的解决办法
Jan 10 Python
Python上下文管理器Content Manager
Jun 26 Python
python数据处理之Pandas类型转换
Apr 28 Python
用Python展示动态规则法用以解决重叠子问题的示例
Apr 02 #Python
Python编写百度贴吧的简单爬虫
Apr 02 #Python
用Python制作简单的钢琴程序的教程
Apr 01 #Python
仅利用30行Python代码来展示X算法
Apr 01 #Python
探究数组排序提升Python程序的循环的运行效率的原因
Apr 01 #Python
用Python编写分析Python程序性能的工具的教程
Apr 01 #Python
对Python新手编程过程中如何规避一些常见问题的建议
Apr 01 #Python
You might like
一些常用的php简单命令代码集锦
2007/09/24 PHP
PHPMailer邮件发送的实现代码
2013/05/04 PHP
PHP实现递归复制整个文件夹的类实例
2015/08/03 PHP
购物车实现的几种方式优缺点对比
2018/05/02 PHP
TP5框架model常见操作示例小结【增删改查、聚合、时间戳、软删除等】
2020/04/05 PHP
基于Jquery的动态添加控件并取值的实现代码
2010/09/24 Javascript
jquery如何扑捉回车键触发的事件
2014/04/24 Javascript
充分发挥Node.js程序性能的一些方法介绍
2015/06/23 Javascript
原生JS实现图片轮播与淡入效果的简单实例
2016/08/21 Javascript
JavaScript实现向select下拉框中添加和删除元素的方法
2017/03/07 Javascript
让div运动起来 js实现缓动效果
2017/07/06 Javascript
AngularJS+Bootstrap3多级导航菜单的实现代码
2017/08/16 Javascript
使用puppeteer破解极验的滑动验证码
2018/02/24 Javascript
webpack4.0打包优化策略整理小结
2018/03/30 Javascript
微信小程序的mpvue框架快速上手指南
2019/05/15 Javascript
layer iframe 设置关闭按钮的方法
2019/09/12 Javascript
vue在路由中验证token是否存在的简单实现
2019/11/11 Javascript
vue中js判断长时间不操作界面自动退出登录(推荐)
2020/01/22 Javascript
Linux中Python 环境软件包安装步骤
2016/03/31 Python
Python 'takes exactly 1 argument (2 given)' Python error
2016/12/13 Python
python thrift搭建服务端和客户端测试程序
2018/01/17 Python
简单谈谈Python的pycurl模块
2018/04/07 Python
Python对象中__del__方法起作用的条件详解
2018/11/01 Python
解决python replace函数替换无效问题
2020/01/18 Python
TensorFlow命名空间和TensorBoard图节点实例
2020/01/23 Python
html5弹跳球示例代码
2013/07/23 HTML / CSS
Html5嵌入钉钉的实现示例
2020/06/04 HTML / CSS
市场营销专科应届生求职信
2013/11/24 职场文书
体育教育专业自荐信范文
2013/12/20 职场文书
大学生的网上创业计划书
2013/12/31 职场文书
团队精神演讲稿
2013/12/31 职场文书
不假外出检讨书
2014/01/27 职场文书
我爱我家教学反思
2014/05/01 职场文书
《夜莺的歌声》教学反思
2016/02/22 职场文书
2016年暑期社会实践活动总结报告
2016/04/06 职场文书
使用SQL实现车流量的计算的示例代码
2022/02/28 SQL Server