Python使用正则匹配实现抓图代码分享


Posted in Python onApril 02, 2015

内涵:正则匹配,正则替换,页面抓取,图片保存 。

实用的第一次 Python 代码 参考

#!/usr/bin/env python
import urllib
import re
 
x=0
def getHtml(url):
 page = urllib.urlopen(url)
 html = page.read()
 return html
 
def getImg(html):
 global x
 reg = 'alt=".+?" src="(.+?\.jpg)"'
 imgre = re.compile(reg)
 imglist = re.findall(imgre,html)
 for imgurl in imglist:
  urllib.urlretrieve(re.sub(r',\d+,\d+',',800,450',imgurl),"img/%s.jpg" % x)
  print "\n"+re.sub(r',\d+,\d+',',800,450',imgurl)+"========"+"img/%s.jpg" % x
  x+=1
 
print 'Starting...'
 
pages = range(1,9)
 
for p in pages:
 html = getHtml('http://m.lovebizhi.com/category/7655/%d/' % p)
 print "\n-------------------------page:%d-------------------------------" % p
 getImg(html)
 
print "\nDone!"

以上所述就是本文给大家分享的全部代码了,本人Python菜鸟,第一个作品,希望对大家能有所帮助。

Python 相关文章推荐
使用python装饰器验证配置文件示例
Feb 24 Python
解析Python中的二进制位运算符
May 13 Python
python处理大数字的方法
May 27 Python
Python实现二叉堆
Feb 03 Python
浅谈python中的正则表达式(re模块)
Oct 17 Python
pycharm远程linux开发和调试代码的方法
Jul 17 Python
浅析Python 实现一个自动化翻译和替换的工具
Apr 14 Python
Python关于反射的实例代码分享
Feb 20 Python
python输出第n个默尼森数的实现示例
Mar 08 Python
tensorflow转换ckpt为savermodel模型的实现
May 25 Python
Python如何发送与接收大型数组
Aug 07 Python
pytorch 实现在测试的时候启用dropout
May 27 Python
用Python展示动态规则法用以解决重叠子问题的示例
Apr 02 #Python
Python编写百度贴吧的简单爬虫
Apr 02 #Python
用Python制作简单的钢琴程序的教程
Apr 01 #Python
仅利用30行Python代码来展示X算法
Apr 01 #Python
探究数组排序提升Python程序的循环的运行效率的原因
Apr 01 #Python
用Python编写分析Python程序性能的工具的教程
Apr 01 #Python
对Python新手编程过程中如何规避一些常见问题的建议
Apr 01 #Python
You might like
德劲1104的电路分析与改良
2021/03/01 无线电
BBS(php & mysql)完整版(三)
2006/10/09 PHP
第十二节--类的自动加载
2006/11/16 PHP
PHP持久连接mysql_pconnect()函数使用介绍
2012/02/05 PHP
CI映射(加载)数据到view层的方法
2016/03/28 PHP
PHP+jquery+CSS制作头像登录窗(仿QQ登陆)
2016/10/20 PHP
php 访问oracle 存储过程实例详解
2017/01/08 PHP
yii2中LinkPager增加总页数和总记录数的实例
2017/08/28 PHP
基于php伪静态的实现方法解析
2020/07/31 PHP
javascript 用原型继承来实现对象系统
2010/03/22 Javascript
JavaScript 放大镜 放大倍率和视窗尺寸
2011/05/09 Javascript
Jquery 模拟用户点击超链接或者按钮的方法
2013/10/25 Javascript
浅析Javascript使用include/require
2013/11/13 Javascript
探讨jQuery的ajax使用场景(c#)
2013/12/03 Javascript
jQuery实现的简单折叠菜单(折叠面板)效果代码
2015/09/16 Javascript
Jquery easyui开启行编辑模式增删改操作
2016/01/14 Javascript
jQuery EasyUI框架中的Datagrid数据表格组件结构详解
2016/06/09 Javascript
js创建对象几种方式的优缺点对比
2016/09/28 Javascript
JS插件plupload.js实现多图上传并显示进度条
2016/11/29 Javascript
Javascript下拉刷新的简单实现
2017/02/14 Javascript
angular+bootstrap的双向数据绑定实例
2017/03/03 Javascript
实例详解display:none与visible:hidden的区别
2017/03/30 Javascript
JavaScript引用类型Object常见用法实例分析
2018/08/08 Javascript
Vue+axios封装请求实现前后端分离
2020/10/23 Javascript
[38:39]完美世界DOTA2联赛循环赛 IO vs GXR BO2第二场 11.04
2020/11/05 DOTA
python爬虫的数据库连接问题【推荐】
2018/06/25 Python
Django框架安装及项目创建过程解析
2020/09/14 Python
珍惜水资源建议书
2014/03/12 职场文书
市级优秀班主任事迹材料
2014/05/13 职场文书
李开复演讲稿
2014/05/24 职场文书
2014年质量管理工作总结
2014/12/01 职场文书
幼儿园教师个人总结
2015/02/05 职场文书
python爬不同图片分别保存在不同文件夹中的实现
2021/04/02 Python
Pytorch数据读取之Dataset和DataLoader知识总结
2021/05/23 Python
MySQL中的隐藏列的具体查看
2021/09/04 MySQL
MyBatis核心源码深度剖析SQL语句执行过程
2022/05/20 Java/Android