python爬虫入门教程之点点美女图片爬虫代码分享


Posted in Python onSeptember 02, 2014

继续鼓捣爬虫,今天贴出一个代码,爬取点点网「美女」标签下的图片,原图。

# -*- coding: utf-8 -*- 

#--------------------------------------- 
#  程序:点点美女图片爬虫 
#  版本:0.2 
#  作者:zippera 
#  日期:2013-07-26 
#  语言:Python 2.7 
#  说明:能设置下载的页数 
#--------------------------------------- 
 
import urllib2
import urllib
import re
 
 
 
pat = re.compile('<div class="feed-big-img">\n.*?imgsrc="(ht.*?)\".*?')
nexturl1 = "http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3?page="
 
 
count = 1
 
while count < 2:
 
  print "Page " + str(count) + "\n"
  myurl = nexturl1 + str(count)
  myres = urllib2.urlopen(myurl)
  mypage = myres.read()
  ucpage = mypage.decode("utf-8") #转码
 
  mat = pat.findall(ucpage)
  
 
  
  
  
  if len(mat):
    cnt = 1
    for item in mat:
      print "Page" + str(count) + " No." + str(cnt) + " url: " + item + "\n"
      cnt += 1
      fnp = re.compile('(\w{10}\.\w+)$')
      fnr = fnp.findall(item)
      if fnr:
        fname = fnr[0]
        urllib.urlretrieve(item, fname)
    
  else:
    print "no data"
    
  count += 1

使用方法:新建一个文件夹,把代码保存为name.py文件,运行python name.py就可以把图片下载到文件夹。

Python 相关文章推荐
跟老齐学Python之眼花缭乱的运算符
Sep 14 Python
初步解析Python下的多进程编程
Apr 28 Python
Python基础篇之初识Python必看攻略
Jun 23 Python
Python Queue模块详细介绍及实例
Dec 27 Python
python写一个md5解密器示例
Feb 23 Python
为什么str(float)在Python 3中比Python 2返回更多的数字
Oct 16 Python
Python之循环结构
Jan 15 Python
OpenCV搞定腾讯滑块验证码的实现代码
May 18 Python
python爬虫学习笔记之pyquery模块基本用法详解
Apr 09 Python
使用python爬取抖音app视频的实例代码
Dec 01 Python
python利用appium实现手机APP自动化的示例
Jan 26 Python
68行Python代码实现带难度升级的贪吃蛇
Jan 18 Python
python爬虫入门教程之糗百图片爬虫代码分享
Sep 02 #Python
python批量同步web服务器代码核心程序
Sep 01 #Python
寻找网站后台地址的python脚本
Sep 01 #Python
python批量修改文件名的实现代码
Sep 01 #Python
python中List的sort方法指南
Sep 01 #Python
Python抓取京东图书评论数据
Aug 31 #Python
Python深入学习之内存管理
Aug 31 #Python
You might like
随时给自己贴的图片加文字的php代码
2007/03/08 PHP
利用static实现表格的颜色隔行显示的代码
2007/09/02 PHP
PHP企业级应用之常见缓存技术篇
2011/01/27 PHP
PHP基础学习之流程控制的实现分析
2013/04/28 PHP
PHP5中实现多态的两种方法实例分享
2014/04/21 PHP
ThinkPHP3.1基础知识快速入门
2014/06/19 PHP
PHP 5.3新增魔术方法__invoke概述
2014/07/23 PHP
实例讲解PHP表单
2020/06/10 PHP
php解析非标准json、非规范json的方式实例
2020/12/10 PHP
JavaScript使用IEEE 标准进行二进制浮点运算产生莫名错误的解决方法
2011/05/28 Javascript
JS通过相同的name进行表格求和代码
2013/08/18 Javascript
jquery阻止冒泡事件使用模拟事件
2013/09/06 Javascript
javascript自然分类法算法实现代码
2013/10/11 Javascript
js Dialog 去掉右上角的X关闭功能
2014/04/23 Javascript
使用EVAL处理jqchart jquery 折线图返回数据无效的解决办法
2015/11/26 Javascript
js判断价格,必须为数字且不能为负数的实现方法
2016/10/07 Javascript
js本地图片预览实现代码
2016/10/09 Javascript
玩转NODE.JS(四)-搭建简单的聊天室的代码
2016/11/11 Javascript
BootStrap Datetimepicker 汉化的实现代码
2017/02/10 Javascript
vue使用keep-alive实现数据缓存不刷新
2017/10/21 Javascript
JS构造一个html文本内容成文件流形式发送到后台
2018/07/31 Javascript
微信小程序顶部导航栏可滑动并选中放大
2019/12/05 Javascript
卸载vue2.0并升级vue_cli3.0的实例讲解
2020/02/16 Javascript
[02:20]2014DOTA2西雅图邀请赛 MVP外卡赛首胜采访
2014/07/09 DOTA
python实现微信跳一跳辅助工具步骤详解
2018/01/04 Python
详解DeBug Python神级工具PySnooper
2019/07/03 Python
python使用socket 先读取长度,在读取报文内容示例
2019/09/26 Python
详解python中groupby函数通俗易懂
2020/05/14 Python
Bally巴利中国官网:经典瑞士鞋履、手袋及配饰奢侈品牌
2018/10/09 全球购物
Liu Jo西班牙官网:意大利服装品牌
2019/09/11 全球购物
优秀的毕业生的自我评价
2013/12/12 职场文书
物控部经理职务说明书
2014/02/25 职场文书
股权投资意向书
2014/04/01 职场文书
卫生标语大全
2014/06/21 职场文书
优秀团员事迹材料1000字
2014/08/20 职场文书
优秀家长事迹材料(2016推荐版)
2016/02/29 职场文书