Python使用正则匹配实现抓图代码分享


Posted in Python onApril 02, 2015

内涵:正则匹配,正则替换,页面抓取,图片保存 。

实用的第一次 Python 代码 参考

#!/usr/bin/env python
import urllib
import re
 
x=0
def getHtml(url):
 page = urllib.urlopen(url)
 html = page.read()
 return html
 
def getImg(html):
 global x
 reg = 'alt=".+?" src="(.+?\.jpg)"'
 imgre = re.compile(reg)
 imglist = re.findall(imgre,html)
 for imgurl in imglist:
  urllib.urlretrieve(re.sub(r',\d+,\d+',',800,450',imgurl),"img/%s.jpg" % x)
  print "\n"+re.sub(r',\d+,\d+',',800,450',imgurl)+"========"+"img/%s.jpg" % x
  x+=1
 
print 'Starting...'
 
pages = range(1,9)
 
for p in pages:
 html = getHtml('http://m.lovebizhi.com/category/7655/%d/' % p)
 print "\n-------------------------page:%d-------------------------------" % p
 getImg(html)
 
print "\nDone!"

以上所述就是本文给大家分享的全部代码了,本人Python菜鸟,第一个作品,希望对大家能有所帮助。

Python 相关文章推荐
python的unittest测试类代码实例
Dec 07 Python
tensorflow训练中出现nan问题的解决
Feb 10 Python
使用sklearn之LabelEncoder将Label标准化的方法
Jul 11 Python
简单了解python变量的作用域
Jul 30 Python
python中append实例用法总结
Jul 30 Python
python实现从wind导入数据
Dec 03 Python
Python2与Python3的区别点整理
Dec 12 Python
Python hashlib加密模块常用方法解析
Dec 18 Python
python 遗传算法求函数极值的实现代码
Feb 11 Python
tensorflow 20:搭网络,导出模型,运行模型的实例
May 26 Python
python海龟绘图之画国旗实例代码
Nov 11 Python
Django中ORM的基本使用教程
Dec 22 Python
用Python展示动态规则法用以解决重叠子问题的示例
Apr 02 #Python
Python编写百度贴吧的简单爬虫
Apr 02 #Python
用Python制作简单的钢琴程序的教程
Apr 01 #Python
仅利用30行Python代码来展示X算法
Apr 01 #Python
探究数组排序提升Python程序的循环的运行效率的原因
Apr 01 #Python
用Python编写分析Python程序性能的工具的教程
Apr 01 #Python
对Python新手编程过程中如何规避一些常见问题的建议
Apr 01 #Python
You might like
虫族 Zerg 历史背景
2020/03/14 星际争霸
php+oracle 分页类
2006/10/09 PHP
根据中文裁减字符串函数的php代码
2013/12/03 PHP
PHP连接SQLServer2005方法及代码
2013/12/26 PHP
php定义参数数量可变的函数用法实例
2015/03/16 PHP
PHP 数组遍历foreach语法结构及实例
2016/06/13 PHP
PHP微信红包生成代码分享
2016/10/06 PHP
利用PHPStorm如何开发Laravel应用详解
2017/08/30 PHP
laravel Validator ajax返回错误信息的方法
2019/09/29 PHP
javascript 避免闭包引发的问题
2009/03/17 Javascript
(function($){...})(jQuery)的意思
2010/07/22 Javascript
深入理解Javascript中this的作用域
2014/08/12 Javascript
纯javascript实现自动发送邮件
2015/10/21 Javascript
URL中“#” “?” &“”号的作用浅析
2017/02/04 Javascript
利用js查找数组中指定元素并返回该元素的所有索引示例
2017/03/29 Javascript
requirejs + vue 项目搭建详解
2017/06/16 Javascript
nodejs判断文件、文件夹是否存在及删除的方法
2017/11/10 NodeJs
浅谈Vue 数据响应式原理
2018/05/07 Javascript
js中事件对象和事件委托的介绍
2019/01/21 Javascript
jQuery实现动态添加和删除input框实例代码
2019/03/26 jQuery
小程序开发踩坑:页面窗口定位(相对于浏览器定位)(推荐)
2019/04/25 Javascript
react 组件传值的三种方法
2019/06/03 Javascript
vue中的mescroll搜索运用及各种填坑处理
2019/10/30 Javascript
使用Bootstrap做一个朝代历史表
2019/12/10 Javascript
[46:23]OG vs EG 2018国际邀请赛淘汰赛BO3 第一场 8.23
2018/08/24 DOTA
详解Python核心对象类型字符串
2018/02/11 Python
Python堆排序原理与实现方法详解
2018/05/11 Python
《秋姑娘的信》教学反思
2014/02/28 职场文书
市政管理求职信范文
2014/05/07 职场文书
2014年党员创先争优承诺书
2014/05/29 职场文书
打架检讨书范文
2015/01/27 职场文书
考生诚信考试承诺书
2015/04/29 职场文书
导游词幽默开场白
2019/06/26 职场文书
python内置进制转换函数的操作
2021/06/02 Python
Python实现查询剪贴板自动匹配信息的思路详解
2021/07/09 Python
python程序的组织结构详解
2021/12/06 Python