编程 Python

python爬虫入门教程之点点美女图片爬虫代码分享

Posted in Python onSeptember 02, 2014

继续鼓捣爬虫，今天贴出一个代码，爬取点点网「美女」标签下的图片，原图。

# -*- coding: utf-8 -*- 

#--------------------------------------- 
#  程序：点点美女图片爬虫 
#  版本：0.2 
#  作者：zippera 
#  日期：2013-07-26 
#  语言：Python 2.7 
#  说明：能设置下载的页数 
#--------------------------------------- 
 
import urllib2
import urllib
import re
 
 
 
pat = re.compile('<div class="feed-big-img">\n.*?imgsrc="(ht.*?)\".*?')
nexturl1 = "http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3?page="
 
 
count = 1
 
while count < 2:
 
  print "Page " + str(count) + "\n"
  myurl = nexturl1 + str(count)
  myres = urllib2.urlopen(myurl)
  mypage = myres.read()
  ucpage = mypage.decode("utf-8") #转码
 
  mat = pat.findall(ucpage)
  
 
  
  
  
  if len(mat):
    cnt = 1
    for item in mat:
      print "Page" + str(count) + " No." + str(cnt) + " url: " + item + "\n"
      cnt += 1
      fnp = re.compile('(\w{10}\.\w+)$')
      fnr = fnp.findall(item)
      if fnr:
        fname = fnr[0]
        urllib.urlretrieve(item, fname)
    
  else:
    print "no data"
    
  count += 1

使用方法：新建一个文件夹，把代码保存为name.py文件，运行python name.py就可以把图片下载到文件夹。

- Author -

junjie

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python编程之属性和方法实例详解

May 19 Python

详解Python中的元组与逻辑运算符

Oct 13 Python

python距离测量的方法

Mar 06 Python

win7 x64系统中安装Scrapy的方法

Nov 18 Python

Python之使用adb shell命令启动应用的方法详解

Jan 07 Python

深入理解Python异常处理的哲学

Feb 01 Python

简单了解python中对象的取反运算符

Jul 01 Python

在Pytorch中计算卷积方法的区别详解(conv2d的区别)

Jan 03 Python

python 双循环遍历list 变量判断代码

May 04 Python

python跨文件使用全局变量的实现

Nov 17 Python

scrapy redis配置文件setting参数详解

Nov 18 Python

tensorboard 可视化之localhost:6006不显示的解决方案

May 22 Python

python爬虫入门教程之糗百图片爬虫代码分享

Sep 02 #Python

python批量同步web服务器代码核心程序

Sep 01 #Python

寻找网站后台地址的python脚本

Sep 01 #Python

python批量修改文件名的实现代码

Sep 01 #Python

python中List的sort方法指南

Sep 01 #Python

Python抓取京东图书评论数据

Aug 31 #Python

Python深入学习之内存管理

Aug 31 #Python

You might like

php学习之function的用法

2012/07/14 PHP

PHP判断一个gif图片是否为动态图片的方法

2014/11/19 PHP

windows下安装php的memcache模块的方法

2015/04/07 PHP

JavaScript设置FieldSet展开与收缩

2009/05/15 Javascript

浅析JavaScript中的同名标识符优先级

2013/12/06 Javascript

js获取客户端网卡的IP地址、MAC地址

2014/03/26 Javascript

jQuery地图map悬停显示省市代码分享

2015/08/20 Javascript

轻松搞定jQuery.noConflict()

2016/02/15 Javascript

值得分享的bootstrap table实例

2016/09/22 Javascript

windows下vue-cli及webpack搭建安装环境

2017/04/25 Javascript

jQuery EasyUI的TreeGrid查询功能实现方法

2017/08/08 jQuery

JS数组交集、并集、差集的示例代码

2017/08/23 Javascript

vue中子组件调用兄弟组件方法

2018/07/06 Javascript

vue2.0 element-ui中el-select选择器无法显示选中的内容(解决方法)

2018/08/24 Javascript

微信小程序实现的一键连接wifi功能示例

2019/04/24 Javascript

使用webpack搭建vue项目及注意事项

2019/06/10 Javascript

微信小程序获取位置展示地图并标注信息的实例代码

2019/09/01 Javascript

详解JavaScript类型判断的四种方法

2020/10/21 Javascript

python类定义的讲解

2013/11/01 Python

关于你不想知道的所有Python3 unicode特性

2014/11/28 Python

由Python运算π的值深入Python中科学计算的实现

2015/04/17 Python

使用python实现unix2dos和dos2unix命令的例子

2019/08/13 Python

利用Python复制文件的9种方法总结

2019/09/02 Python

使用 Python 清理收藏夹里已失效的网站

2019/12/03 Python

python实现学生信息管理系统（精简版）

2020/11/27 Python

python3实现简单飞机大战

2020/11/29 Python

全面介绍python中很常用的单元测试框架unitest

2020/12/14 Python

纯CSS实现预加载动画效果

2017/09/06 HTML / CSS

加拿大最大的五金、家居装修和园艺产品商店：RONA

2017/01/27 全球购物

Bowflex美国官方网站：高级家庭健身器材

2017/12/22 全球购物

关于护士节的演讲稿

2014/05/26 职场文书

活着观后感

2015/06/03 职场文书

关于感恩老师的古诗句

2019/08/20 职场文书

一篇文章弄懂Python中的内建函数

2021/08/07 Python

Python爬虫入门案例之爬取二手房源数据

2021/10/16 Python

vue项目如何打包之项目打包优化（让打包的js文件变小）

2022/04/30 Vue.js