python爬虫入门教程之点点美女图片爬虫代码分享


Posted in Python onSeptember 02, 2014

继续鼓捣爬虫,今天贴出一个代码,爬取点点网「美女」标签下的图片,原图。

# -*- coding: utf-8 -*- 

#--------------------------------------- 
#  程序:点点美女图片爬虫 
#  版本:0.2 
#  作者:zippera 
#  日期:2013-07-26 
#  语言:Python 2.7 
#  说明:能设置下载的页数 
#--------------------------------------- 
 
import urllib2
import urllib
import re
 
 
 
pat = re.compile('<div class="feed-big-img">\n.*?imgsrc="(ht.*?)\".*?')
nexturl1 = "http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3?page="
 
 
count = 1
 
while count < 2:
 
  print "Page " + str(count) + "\n"
  myurl = nexturl1 + str(count)
  myres = urllib2.urlopen(myurl)
  mypage = myres.read()
  ucpage = mypage.decode("utf-8") #转码
 
  mat = pat.findall(ucpage)
  
 
  
  
  
  if len(mat):
    cnt = 1
    for item in mat:
      print "Page" + str(count) + " No." + str(cnt) + " url: " + item + "\n"
      cnt += 1
      fnp = re.compile('(\w{10}\.\w+)$')
      fnr = fnp.findall(item)
      if fnr:
        fname = fnr[0]
        urllib.urlretrieve(item, fname)
    
  else:
    print "no data"
    
  count += 1

使用方法:新建一个文件夹,把代码保存为name.py文件,运行python name.py就可以把图片下载到文件夹。

Python 相关文章推荐
python中如何使用朴素贝叶斯算法
Apr 06 Python
详解python里使用正则表达式的全匹配功能
Oct 19 Python
基于Django的ModelForm组件(详解)
Dec 07 Python
浅析python协程相关概念
Jan 20 Python
Django框架的中的setting.py文件说明详解
Oct 15 Python
python2与python3中关于对NaN类型数据的判断和转换方法
Oct 30 Python
python实发邮件实例详解
Nov 11 Python
使用python快速在局域网内搭建http传输文件服务的方法
Nov 14 Python
tensorflow之并行读入数据详解
Feb 05 Python
Python中pyecharts安装及安装失败的解决方法
Feb 18 Python
django xadmin 管理器常用显示设置方式
Mar 11 Python
python实现的web监控系统
Apr 27 Python
python爬虫入门教程之糗百图片爬虫代码分享
Sep 02 #Python
python批量同步web服务器代码核心程序
Sep 01 #Python
寻找网站后台地址的python脚本
Sep 01 #Python
python批量修改文件名的实现代码
Sep 01 #Python
python中List的sort方法指南
Sep 01 #Python
Python抓取京东图书评论数据
Aug 31 #Python
Python深入学习之内存管理
Aug 31 #Python
You might like
Windows2003下php5.4安装配置教程(Apache2.4)
2016/06/30 PHP
跟随鼠标旋转的文字
2006/11/30 Javascript
js 去掉空格实例 Trim() LTrim() RTrim()
2014/01/07 Javascript
nodejs分页类代码分享
2014/06/17 NodeJs
浅谈JavaScript中Date(日期对象),Math对象
2015/02/05 Javascript
JavaScript实现文字跟随鼠标特效
2015/08/06 Javascript
图文详解JavaScript的原型对象及原型链
2016/08/02 Javascript
微信小程序前端源码逻辑和工作流
2016/09/25 Javascript
js转html实体的方法
2016/09/27 Javascript
微信小程序 教程之注册页面
2016/10/17 Javascript
微信小程序实现顶部普通选项卡效果(非swiper)
2020/06/19 Javascript
微信小程序使用video组件播放视频功能示例【附源码下载】
2017/12/08 Javascript
Angular使用cli生成自定义文件、组件的方法
2018/09/04 Javascript
如何在微信小程序中使用骨架屏的步骤
2020/06/12 Javascript
在vue中使用Base64转码的案例
2020/08/07 Javascript
[51:26]VP vs VG 2018国际邀请赛小组赛BO2 第二场 8.19
2018/08/21 DOTA
Python模拟登录验证码(代码简单)
2016/02/06 Python
关于Python元祖,列表,字典,集合的比较
2017/01/06 Python
Python使用pylab库实现画线功能的方法详解
2017/06/08 Python
Python批量提取PDF文件中文本的脚本
2018/03/14 Python
cProfile Python性能分析工具使用详解
2019/07/22 Python
Pandas DataFrame中的tuple元素遍历的实现
2019/10/23 Python
Html5+CSS3+EL表达式问题小结
2020/12/19 HTML / CSS
世界领先的在线地板和建筑材料批发商:BuildDirect
2017/02/26 全球购物
蒂娜商店:Tiina the Store
2019/12/07 全球购物
最新远光软件笔试题面试题内容
2013/11/08 面试题
高级销售求职信
2014/02/21 职场文书
活动总结怎么写啊
2014/05/07 职场文书
新党章心得体会
2014/09/04 职场文书
整改落实自查报告
2014/11/05 职场文书
2015年基层党支部工作总结
2015/05/21 职场文书
读书笔记怎么写
2015/07/01 职场文书
欢迎新生标语2015
2015/07/16 职场文书
公务员岗前培训心得体会
2016/01/08 职场文书
MySQL基础(二)
2021/04/05 MySQL
Python使用mitmproxy工具监控手机 下载手机小视频
2022/04/18 Python