python爬虫入门教程之点点美女图片爬虫代码分享


Posted in Python onSeptember 02, 2014

继续鼓捣爬虫,今天贴出一个代码,爬取点点网「美女」标签下的图片,原图。

# -*- coding: utf-8 -*- 

#--------------------------------------- 
#  程序:点点美女图片爬虫 
#  版本:0.2 
#  作者:zippera 
#  日期:2013-07-26 
#  语言:Python 2.7 
#  说明:能设置下载的页数 
#--------------------------------------- 
 
import urllib2
import urllib
import re
 
 
 
pat = re.compile('<div class="feed-big-img">\n.*?imgsrc="(ht.*?)\".*?')
nexturl1 = "http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3?page="
 
 
count = 1
 
while count < 2:
 
  print "Page " + str(count) + "\n"
  myurl = nexturl1 + str(count)
  myres = urllib2.urlopen(myurl)
  mypage = myres.read()
  ucpage = mypage.decode("utf-8") #转码
 
  mat = pat.findall(ucpage)
  
 
  
  
  
  if len(mat):
    cnt = 1
    for item in mat:
      print "Page" + str(count) + " No." + str(cnt) + " url: " + item + "\n"
      cnt += 1
      fnp = re.compile('(\w{10}\.\w+)$')
      fnr = fnp.findall(item)
      if fnr:
        fname = fnr[0]
        urllib.urlretrieve(item, fname)
    
  else:
    print "no data"
    
  count += 1

使用方法:新建一个文件夹,把代码保存为name.py文件,运行python name.py就可以把图片下载到文件夹。

Python 相关文章推荐
Python Tkinter基础控件用法
Sep 03 Python
Python使用Redis实现作业调度系统(超简单)
Mar 22 Python
使用django-crontab实现定时任务的示例
Feb 26 Python
Python基本socket通信控制操作示例
Jan 30 Python
python实现趣味图片字符化
Apr 30 Python
Django 外键的使用方法详解
Jul 19 Python
解决python彩色螺旋线绘制引发的问题
Nov 23 Python
Python tensorflow实现mnist手写数字识别示例【非卷积与卷积实现】
Dec 19 Python
在python tkinter界面中添加按钮的实例
Mar 04 Python
使用python检查yaml配置文件是否符合要求
Apr 09 Python
Python 实现一个计时器
Jul 28 Python
Python tensorflow卷积神经Inception V3网络结构
May 06 Python
python爬虫入门教程之糗百图片爬虫代码分享
Sep 02 #Python
python批量同步web服务器代码核心程序
Sep 01 #Python
寻找网站后台地址的python脚本
Sep 01 #Python
python批量修改文件名的实现代码
Sep 01 #Python
python中List的sort方法指南
Sep 01 #Python
Python抓取京东图书评论数据
Aug 31 #Python
Python深入学习之内存管理
Aug 31 #Python
You might like
SONY SRF-M100的电路分析
2021/03/02 无线电
浅析PHP编程中10个最常见的错误
2014/08/08 PHP
浅析PHP文件下载原理
2014/12/25 PHP
PHP5全版本绕过open_basedir读文件脚本漏洞详细介绍
2015/01/20 PHP
php发送与接收流文件的方法
2015/02/11 PHP
PHP简单获取视频预览图的方法
2015/03/12 PHP
php微信高级接口调用方法(自定义菜单接口、客服接口、二维码)
2016/11/28 PHP
php微信开发之关注事件
2018/06/14 PHP
Ajax+PHP实现的模拟进度条功能示例
2019/02/11 PHP
PHP队列场景以及实现代码实例详解
2021/02/26 PHP
jQuery编写widget的一些技巧分享
2010/10/28 Javascript
js Dialog 实践分享
2012/10/22 Javascript
javascript变量作用域使用中常见错误总结
2013/03/26 Javascript
JQuery的自定义事件代码,触发,绑定简单实例
2013/08/01 Javascript
jquery通过closest选择器修改上级元素的方法
2015/03/17 Javascript
javascript制作sql转换为stringBuffer的小工具
2015/04/03 Javascript
基于JS代码实现当鼠标悬停表格上显示这一格的全部内容
2016/06/12 Javascript
canvas学习之API整理笔记(二)
2016/12/29 Javascript
js canvas实现QQ拨打电话特效
2017/05/10 Javascript
vue 将页面公用的头部组件化的方法
2017/12/18 Javascript
vue2实现搜索结果中的搜索关键字高亮的代码
2018/08/29 Javascript
在vue项目中,将juery设置为全局变量的方法
2018/09/25 Javascript
基于Vue的商品主图放大镜方案详解
2019/09/19 Javascript
JS设置自定义快捷键并实现图片上下左右移动
2019/10/17 Javascript
创建nuxt.js项目流程图解
2020/03/13 Javascript
vue data对象重新赋值无效(未更改)的解决方式
2020/07/24 Javascript
[36:45]TNC vs VGJ.S 2018国际邀请赛小组赛BO2 第二场 8.18
2018/08/19 DOTA
八大排序算法的Python实现
2021/01/28 Python
JavaScript中的模拟事件和自定义事件实例分析
2018/07/27 Python
关于Python中定制类的比较运算实例
2019/12/19 Python
Philosophy美国官网:美国美容品牌
2016/08/15 全球购物
Pam & Gela官网:美国性感前卫女装品牌
2018/07/19 全球购物
Ibatis如何使用动态表名
2015/07/12 面试题
社区禁毒工作方案
2014/06/02 职场文书
镇党政领导班子民主生活会思想汇报
2014/10/11 职场文书
pytest进阶教程之fixture函数详解
2021/03/29 Python