python爬虫入门教程之点点美女图片爬虫代码分享


Posted in Python onSeptember 02, 2014

继续鼓捣爬虫,今天贴出一个代码,爬取点点网「美女」标签下的图片,原图。

# -*- coding: utf-8 -*- 

#--------------------------------------- 
#  程序:点点美女图片爬虫 
#  版本:0.2 
#  作者:zippera 
#  日期:2013-07-26 
#  语言:Python 2.7 
#  说明:能设置下载的页数 
#--------------------------------------- 
 
import urllib2
import urllib
import re
 
 
 
pat = re.compile('<div class="feed-big-img">\n.*?imgsrc="(ht.*?)\".*?')
nexturl1 = "http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3?page="
 
 
count = 1
 
while count < 2:
 
  print "Page " + str(count) + "\n"
  myurl = nexturl1 + str(count)
  myres = urllib2.urlopen(myurl)
  mypage = myres.read()
  ucpage = mypage.decode("utf-8") #转码
 
  mat = pat.findall(ucpage)
  
 
  
  
  
  if len(mat):
    cnt = 1
    for item in mat:
      print "Page" + str(count) + " No." + str(cnt) + " url: " + item + "\n"
      cnt += 1
      fnp = re.compile('(\w{10}\.\w+)$')
      fnr = fnp.findall(item)
      if fnr:
        fname = fnr[0]
        urllib.urlretrieve(item, fname)
    
  else:
    print "no data"
    
  count += 1

使用方法:新建一个文件夹,把代码保存为name.py文件,运行python name.py就可以把图片下载到文件夹。

Python 相关文章推荐
Python编程之属性和方法实例详解
May 19 Python
详解Python中的元组与逻辑运算符
Oct 13 Python
python距离测量的方法
Mar 06 Python
win7 x64系统中安装Scrapy的方法
Nov 18 Python
Python之使用adb shell命令启动应用的方法详解
Jan 07 Python
深入理解Python异常处理的哲学
Feb 01 Python
简单了解python中对象的取反运算符
Jul 01 Python
在Pytorch中计算卷积方法的区别详解(conv2d的区别)
Jan 03 Python
python 双循环遍历list 变量判断代码
May 04 Python
python跨文件使用全局变量的实现
Nov 17 Python
scrapy redis配置文件setting参数详解
Nov 18 Python
tensorboard 可视化之localhost:6006不显示的解决方案
May 22 Python
python爬虫入门教程之糗百图片爬虫代码分享
Sep 02 #Python
python批量同步web服务器代码核心程序
Sep 01 #Python
寻找网站后台地址的python脚本
Sep 01 #Python
python批量修改文件名的实现代码
Sep 01 #Python
python中List的sort方法指南
Sep 01 #Python
Python抓取京东图书评论数据
Aug 31 #Python
Python深入学习之内存管理
Aug 31 #Python
You might like
php学习之function的用法
2012/07/14 PHP
PHP判断一个gif图片是否为动态图片的方法
2014/11/19 PHP
windows下安装php的memcache模块的方法
2015/04/07 PHP
JavaScript设置FieldSet展开与收缩
2009/05/15 Javascript
浅析JavaScript中的同名标识符优先级
2013/12/06 Javascript
js获取客户端网卡的IP地址、MAC地址
2014/03/26 Javascript
jQuery地图map悬停显示省市代码分享
2015/08/20 Javascript
轻松搞定jQuery.noConflict()
2016/02/15 Javascript
值得分享的bootstrap table实例
2016/09/22 Javascript
windows下vue-cli及webpack搭建安装环境
2017/04/25 Javascript
jQuery EasyUI的TreeGrid查询功能实现方法
2017/08/08 jQuery
JS数组交集、并集、差集的示例代码
2017/08/23 Javascript
vue中子组件调用兄弟组件方法
2018/07/06 Javascript
vue2.0 element-ui中el-select选择器无法显示选中的内容(解决方法)
2018/08/24 Javascript
微信小程序实现的一键连接wifi功能示例
2019/04/24 Javascript
使用webpack搭建vue项目及注意事项
2019/06/10 Javascript
微信小程序获取位置展示地图并标注信息的实例代码
2019/09/01 Javascript
详解JavaScript类型判断的四种方法
2020/10/21 Javascript
python类定义的讲解
2013/11/01 Python
关于你不想知道的所有Python3 unicode特性
2014/11/28 Python
由Python运算π的值深入Python中科学计算的实现
2015/04/17 Python
使用python实现unix2dos和dos2unix命令的例子
2019/08/13 Python
利用Python复制文件的9种方法总结
2019/09/02 Python
使用 Python 清理收藏夹里已失效的网站
2019/12/03 Python
python实现学生信息管理系统(精简版)
2020/11/27 Python
python3实现简单飞机大战
2020/11/29 Python
全面介绍python中很常用的单元测试框架unitest
2020/12/14 Python
纯CSS实现预加载动画效果
2017/09/06 HTML / CSS
加拿大最大的五金、家居装修和园艺产品商店:RONA
2017/01/27 全球购物
Bowflex美国官方网站:高级家庭健身器材
2017/12/22 全球购物
关于护士节的演讲稿
2014/05/26 职场文书
活着观后感
2015/06/03 职场文书
关于感恩老师的古诗句
2019/08/20 职场文书
一篇文章弄懂Python中的内建函数
2021/08/07 Python
Python爬虫入门案例之爬取二手房源数据
2021/10/16 Python
vue项目如何打包之项目打包优化(让打包的js文件变小)
2022/04/30 Vue.js