编程 Python

Python使用正则匹配实现抓图代码分享

Posted in Python onApril 02, 2015

内涵：正则匹配，正则替换，页面抓取，图片保存。

实用的第一次 Python 代码参考

#!/usr/bin/env python
import urllib
import re
 
x=0
def getHtml(url):
 page = urllib.urlopen(url)
 html = page.read()
 return html
 
def getImg(html):
 global x
 reg = 'alt=".+?" src="(.+?\.jpg)"'
 imgre = re.compile(reg)
 imglist = re.findall(imgre,html)
 for imgurl in imglist:
  urllib.urlretrieve(re.sub(r',\d+,\d+',',800,450',imgurl),"img/%s.jpg" % x)
  print "\n"+re.sub(r',\d+,\d+',',800,450',imgurl)+"========"+"img/%s.jpg" % x
  x+=1
 
print 'Starting...'
 
pages = range(1,9)
 
for p in pages:
 html = getHtml('http://m.lovebizhi.com/category/7655/%d/' % p)
 print "\n-------------------------page:%d-------------------------------" % p
 getImg(html)
 
print "\nDone!"

以上所述就是本文给大家分享的全部代码了，本人Python菜鸟，第一个作品，希望对大家能有所帮助。

Python使用正则匹配实现抓图代码分享

- Author -

ghoulangle

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

基于wxpython实现的windows GUI程序实例

May 30 Python

python实现备份目录的方法

Aug 03 Python

Python如何判断数独是否合法

Sep 08 Python

Scrapy抓取京东商品、豆瓣电影及代码分享

Nov 23 Python

Python爬虫实例_城市公交网络站点数据的爬取方法

Jan 10 Python

python+matplotlib实现动态绘制图片实例代码（交互式绘图）

Jan 20 Python

Android基于TCP和URL协议的网络编程示例【附demo源码下载】

Jan 23 Python

Selenium定位元素操作示例

Aug 10 Python

pyspark操作MongoDB的方法步骤

Jan 04 Python

Python datetime和unix时间戳之间相互转换的讲解

Apr 01 Python

Django框架模板的使用方法示例

May 25 Python

Flask处理Web表单的实现方法

Jan 31 Python

用Python展示动态规则法用以解决重叠子问题的示例

Apr 02 #Python

Python编写百度贴吧的简单爬虫

Apr 02 #Python

用Python制作简单的钢琴程序的教程

Apr 01 #Python

仅利用30行Python代码来展示X算法

Apr 01 #Python

探究数组排序提升Python程序的循环的运行效率的原因

Apr 01 #Python

用Python编写分析Python程序性能的工具的教程

Apr 01 #Python

对Python新手编程过程中如何规避一些常见问题的建议

Apr 01 #Python

You might like

mysql 全文搜索技巧

2007/04/27 PHP

Phpbean路由转发的php代码

2008/01/10 PHP

php正则表达式验证（邮件地址、Url地址、电话号码、邮政编码）

2016/03/14 PHP

使用composer命令加载vendor中的第三方类库的方法

2019/07/09 PHP

Js 弹出框口并返回值的两种常用方法

2010/12/30 Javascript

Jquery中显示隐藏的实现代码分析

2011/07/26 Javascript

非常强大的 jQuery.AsyncBox 弹出对话框插件

2011/08/29 Javascript

非html5实现js版弹球游戏示例代码

2013/09/22 Javascript

nodejs中实现sleep功能实例

2015/03/24 NodeJs

正则表达式基本语法及表单验证操作详解【基于JS】

2017/04/07 Javascript

JavaScript常用数学函数用法示例

2018/05/14 Javascript

js实现轮播图效果 z-index实现轮播图

2020/01/17 Javascript

[01:11:35]Liquid vs LGD 2018国际邀请赛小组赛BO2 第一场 8.16

2018/08/17 DOTA

[30:55]完美世界DOTA2联赛PWL S2 Magma vs LBZS 第二场 11.18

2020/11/18 DOTA

python cookielib 登录人人网的实现代码

2012/12/19 Python

详细解读Python的web.py框架下的application.py模块

2015/05/02 Python

Python的pycurl包用法简介

2015/11/13 Python

Python的Django框架中使用SQLAlchemy操作数据库的教程

2016/06/02 Python

python监控linux内存并写入mongodb（推荐）

2017/09/11 Python

Python 多线程不加锁分块读取文件的方法

2018/12/11 Python

Python 实现微信防撤回功能

2019/04/29 Python

python的pyecharts绘制各种图表详细（附代码）

2019/11/11 Python

pytorch实现mnist数据集的图像可视化及保存

2020/01/14 Python

Python 时间戳之获取整点凌晨时间戳的操作方法

2020/01/28 Python

Python 读取xml数据,cv2裁剪图片实例

2020/03/10 Python

windows下python 3.9 Numpy scipy和matlabplot的安装教程详解

2020/11/28 Python

Html5如何唤起百度地图App的方法

2019/01/27 HTML / CSS

HTML5的结构和语义(3):语义性的块级元素

2008/10/17 HTML / CSS

女士鞋子、包包和服装在线，第一款10美元：ShoeDazzle

2019/07/26 全球购物

联想智利官方网站：Lenovo Chile

2020/06/03 全球购物

环保建议书300字

2014/05/14 职场文书

主要负责人任命书

2014/06/06 职场文书

班级活动总结格式

2014/08/30 职场文书

2019奶茶店创业计划书范本，值得你借鉴

2019/08/14 职场文书

关于PostgreSQL JSONB的匹配和交集问题

2021/09/14 PostgreSQL

MySQL数据库之内置函数和自定义函数 function

2022/06/16 MySQL