python爬虫入门教程之点点美女图片爬虫代码分享


Posted in Python onSeptember 02, 2014

继续鼓捣爬虫,今天贴出一个代码,爬取点点网「美女」标签下的图片,原图。

# -*- coding: utf-8 -*- 

#--------------------------------------- 
#  程序:点点美女图片爬虫 
#  版本:0.2 
#  作者:zippera 
#  日期:2013-07-26 
#  语言:Python 2.7 
#  说明:能设置下载的页数 
#--------------------------------------- 
 
import urllib2
import urllib
import re
 
 
 
pat = re.compile('<div class="feed-big-img">\n.*?imgsrc="(ht.*?)\".*?')
nexturl1 = "http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3?page="
 
 
count = 1
 
while count < 2:
 
  print "Page " + str(count) + "\n"
  myurl = nexturl1 + str(count)
  myres = urllib2.urlopen(myurl)
  mypage = myres.read()
  ucpage = mypage.decode("utf-8") #转码
 
  mat = pat.findall(ucpage)
  
 
  
  
  
  if len(mat):
    cnt = 1
    for item in mat:
      print "Page" + str(count) + " No." + str(cnt) + " url: " + item + "\n"
      cnt += 1
      fnp = re.compile('(\w{10}\.\w+)$')
      fnr = fnp.findall(item)
      if fnr:
        fname = fnr[0]
        urllib.urlretrieve(item, fname)
    
  else:
    print "no data"
    
  count += 1

使用方法:新建一个文件夹,把代码保存为name.py文件,运行python name.py就可以把图片下载到文件夹。

Python 相关文章推荐
在Python中进行自动化单元测试的教程
Apr 15 Python
编写Python脚本批量下载DesktopNexus壁纸的教程
May 06 Python
Python编程实现正则删除命令功能
Aug 30 Python
详解python多线程、锁、event事件机制的简单使用
Apr 27 Python
python 判断参数为Nonetype类型或空的实例
Oct 30 Python
对python for 文件指定行读写操作详解
Dec 29 Python
python 实现12bit灰度图像映射到8bit显示的方法
Jul 08 Python
Django stark组件使用及原理详解
Aug 22 Python
简单了解python装饰器原理及使用方法
Dec 18 Python
Python如何使用字符打印照片
Jan 03 Python
Python unittest装饰器实现原理及代码
Sep 08 Python
matplotlib阶梯图的实现(step())
Mar 02 Python
python爬虫入门教程之糗百图片爬虫代码分享
Sep 02 #Python
python批量同步web服务器代码核心程序
Sep 01 #Python
寻找网站后台地址的python脚本
Sep 01 #Python
python批量修改文件名的实现代码
Sep 01 #Python
python中List的sort方法指南
Sep 01 #Python
Python抓取京东图书评论数据
Aug 31 #Python
Python深入学习之内存管理
Aug 31 #Python
You might like
php数组相加 array(“a”)+array(“b”)结果还是array(“a”)
2012/09/19 PHP
深入file_get_contents函数抓取内容失败的原因分析
2013/06/25 PHP
PHP学习笔记之字符串编码的转换和判断
2014/05/22 PHP
CentOS下PHP安装Oracle扩展
2015/02/15 PHP
php强制用户转向www域名的方法
2015/06/19 PHP
PHP微信模板消息操作示例
2017/06/29 PHP
PHP使Laravel为JSON REST API返回自定义错误的问题
2018/10/16 PHP
PHP使用phpunit进行单元测试示例
2019/09/23 PHP
js 如何实现对数据库的增删改查
2012/11/23 Javascript
JavaScript的设计模式经典之代理模式
2016/02/24 Javascript
JavaScript数组合并的多种方法
2016/05/22 Javascript
详解Vue + Vuex 如何使用 vm.$nextTick
2017/11/20 Javascript
Vue多种方法实现表头和首列固定的示例代码
2018/02/02 Javascript
ECharts地图绘制和钻取简易接口详解
2019/07/12 Javascript
浅谈vuex的基本用法和mapaction传值问题
2019/11/08 Javascript
vue实现列表拖拽排序的功能
2020/11/02 Javascript
Python在groupby分组后提取指定位置记录方法
2018/04/20 Python
关于python写入文件自动换行的问题
2018/06/23 Python
详解flask入门模板引擎
2018/07/18 Python
python sqlite的Row对象操作示例
2019/09/11 Python
英国最受欢迎的手表网站:Watch Shop
2016/10/21 全球购物
Cecil Mode法国在线商店:女性时尚
2021/01/08 全球购物
网络安全方面的面试题
2016/01/07 面试题
武汉瑞得软件笔试题
2015/10/27 面试题
CSS实现fullpage.js全屏滚动效果的示例代码
2021/03/24 HTML / CSS
写给学生的新学期寄语
2014/01/18 职场文书
党员自我批评与反省材料
2014/02/10 职场文书
绩效考核实施方案
2014/03/18 职场文书
园林设计专业毕业生求职信
2014/03/23 职场文书
护理专业求职信
2014/06/15 职场文书
小学生一分钟演讲稿
2014/08/26 职场文书
农业项目投资意向书
2015/05/09 职场文书
高一军训感想
2015/08/07 职场文书
保护环境建议书作文300字
2015/09/14 职场文书
Redis数据结构之链表与字典的使用
2021/05/11 Redis
Python 可迭代对象 iterable的具体使用
2021/08/07 Python