python爬虫入门教程之点点美女图片爬虫代码分享


Posted in Python onSeptember 02, 2014

继续鼓捣爬虫,今天贴出一个代码,爬取点点网「美女」标签下的图片,原图。

# -*- coding: utf-8 -*- 

#--------------------------------------- 
#  程序:点点美女图片爬虫 
#  版本:0.2 
#  作者:zippera 
#  日期:2013-07-26 
#  语言:Python 2.7 
#  说明:能设置下载的页数 
#--------------------------------------- 
 
import urllib2
import urllib
import re
 
 
 
pat = re.compile('<div class="feed-big-img">\n.*?imgsrc="(ht.*?)\".*?')
nexturl1 = "http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3?page="
 
 
count = 1
 
while count < 2:
 
  print "Page " + str(count) + "\n"
  myurl = nexturl1 + str(count)
  myres = urllib2.urlopen(myurl)
  mypage = myres.read()
  ucpage = mypage.decode("utf-8") #转码
 
  mat = pat.findall(ucpage)
  
 
  
  
  
  if len(mat):
    cnt = 1
    for item in mat:
      print "Page" + str(count) + " No." + str(cnt) + " url: " + item + "\n"
      cnt += 1
      fnp = re.compile('(\w{10}\.\w+)$')
      fnr = fnp.findall(item)
      if fnr:
        fname = fnr[0]
        urllib.urlretrieve(item, fname)
    
  else:
    print "no data"
    
  count += 1

使用方法:新建一个文件夹,把代码保存为name.py文件,运行python name.py就可以把图片下载到文件夹。

Python 相关文章推荐
python类型强制转换long to int的代码
Feb 10 Python
python使用reportlab画图示例(含中文汉字)
Dec 03 Python
用pywin32实现windows模拟鼠标及键盘动作
Apr 22 Python
浅谈Python 的枚举 Enum
Jun 12 Python
Python将list中的string批量转化成int/float的方法
Jun 26 Python
Python文件监听工具pyinotify与watchdog实例
Oct 15 Python
Python3实现爬取简书首页文章标题和文章链接的方法【测试可用】
Dec 11 Python
Python3.7 dataclass使用指南小结
Feb 22 Python
python selenium 查找隐藏元素 自动播放视频功能
Jul 24 Python
python支付宝支付示例详解
Aug 22 Python
调整Jupyter notebook的启动目录操作
Apr 10 Python
Pytest测试框架基本使用方法详解
Nov 25 Python
python爬虫入门教程之糗百图片爬虫代码分享
Sep 02 #Python
python批量同步web服务器代码核心程序
Sep 01 #Python
寻找网站后台地址的python脚本
Sep 01 #Python
python批量修改文件名的实现代码
Sep 01 #Python
python中List的sort方法指南
Sep 01 #Python
Python抓取京东图书评论数据
Aug 31 #Python
Python深入学习之内存管理
Aug 31 #Python
You might like
几种显示数据的方法的比较
2006/10/09 PHP
PHP生成验证码时“图像因其本身有错无法显示”的解决方法
2013/08/07 PHP
一个简单的php MVC留言本实例代码(必看篇)
2016/09/22 PHP
php in_array() 检查数组中是否存在某个值详解
2016/11/23 PHP
php结合redis高并发下发帖、发微博的实现方法
2016/12/15 PHP
ThinkPHP 整合Bootstrap Ajax分页样式
2016/12/23 PHP
PHP fopen中文文件名乱码问题解决方案
2020/10/28 PHP
基于jquery的地址栏射击游戏代码
2011/03/10 Javascript
动态的改变IFrame的高度实现IFrame自动伸展适应高度
2012/12/28 Javascript
使用JavaScript动态设置样式实现代码及演示动画
2013/01/25 Javascript
js验证模型自我实现的具体方法
2013/06/21 Javascript
JS实现图片高亮展示效果实例
2015/11/24 Javascript
简单理解vue中el、template、replace元素
2016/10/27 Javascript
JavaScript字符串对象(string)基本用法示例
2017/01/18 Javascript
ES6中Proxy代理用法实例浅析
2017/04/06 Javascript
jQuery实现火车票买票城市选择切换功能
2017/09/15 jQuery
jQuery+CSS实现的标签页效果示例【测试可用】
2018/08/14 jQuery
vue点击input弹出带搜索键盘并监听该元素的方法
2018/08/25 Javascript
原生JS实现自定义下拉单选选择框功能
2018/10/12 Javascript
Vue+Koa2 打包后进行线上部署的教程详解
2019/07/31 Javascript
node.js开发辅助工具nodemon安装与配置详解
2020/02/06 Javascript
jQuery实现图片切换效果
2020/10/19 jQuery
Python利用matplotlib生成图片背景及图例透明的效果
2017/04/27 Python
Python函数中不定长参数的写法
2019/02/13 Python
pandas DataFrame 交集并集补集的实现
2019/06/24 Python
Django app配置多个数据库代码实例
2019/12/17 Python
基于pytorch中的Sequential用法说明
2020/06/24 Python
Django中的DateTimeField和DateField实现
2021/02/24 Python
用CSS禁用输入法(CSS3 UI规范)实例解析
2012/12/04 HTML / CSS
一款纯css3实现的竖形二级导航的实例教程
2014/12/11 HTML / CSS
css3弹性盒子flex实现三栏布局的实现
2020/11/12 HTML / CSS
编码实现字符串转整型的函数
2012/06/02 面试题
培训自我鉴定
2014/01/31 职场文书
学生生病请假条范文
2014/02/16 职场文书
求职信结尾怎么写
2014/05/26 职场文书
MySql存储过程之逻辑判断和条件控制
2021/05/26 MySQL