python爬虫入门教程之点点美女图片爬虫代码分享


Posted in Python onSeptember 02, 2014

继续鼓捣爬虫,今天贴出一个代码,爬取点点网「美女」标签下的图片,原图。

# -*- coding: utf-8 -*- 

#--------------------------------------- 
#  程序:点点美女图片爬虫 
#  版本:0.2 
#  作者:zippera 
#  日期:2013-07-26 
#  语言:Python 2.7 
#  说明:能设置下载的页数 
#--------------------------------------- 
 
import urllib2
import urllib
import re
 
 
 
pat = re.compile('<div class="feed-big-img">\n.*?imgsrc="(ht.*?)\".*?')
nexturl1 = "http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3?page="
 
 
count = 1
 
while count < 2:
 
  print "Page " + str(count) + "\n"
  myurl = nexturl1 + str(count)
  myres = urllib2.urlopen(myurl)
  mypage = myres.read()
  ucpage = mypage.decode("utf-8") #转码
 
  mat = pat.findall(ucpage)
  
 
  
  
  
  if len(mat):
    cnt = 1
    for item in mat:
      print "Page" + str(count) + " No." + str(cnt) + " url: " + item + "\n"
      cnt += 1
      fnp = re.compile('(\w{10}\.\w+)$')
      fnr = fnp.findall(item)
      if fnr:
        fname = fnr[0]
        urllib.urlretrieve(item, fname)
    
  else:
    print "no data"
    
  count += 1

使用方法:新建一个文件夹,把代码保存为name.py文件,运行python name.py就可以把图片下载到文件夹。

Python 相关文章推荐
python模拟登陆Tom邮箱示例分享
Jan 13 Python
通过5个知识点轻松搞定Python的作用域
Sep 09 Python
Python时间戳使用和相互转换详解
Dec 11 Python
浅谈django的render函数的参数问题
Oct 16 Python
Python定义函数功能与用法实例详解
Apr 08 Python
利用python如何在前程无忧高效投递简历
May 07 Python
Django用户认证系统 组与权限解析
Aug 02 Python
python for循环remove同一个list过程解析
Aug 14 Python
Python利用FFT进行简单滤波的实现
Feb 26 Python
python 发送邮件的示例代码(Python2/3都可以直接使用)
Dec 03 Python
Python实现Telnet自动连接检测密码的示例
Apr 16 Python
PyTorch中permute的使用方法
Apr 26 Python
python爬虫入门教程之糗百图片爬虫代码分享
Sep 02 #Python
python批量同步web服务器代码核心程序
Sep 01 #Python
寻找网站后台地址的python脚本
Sep 01 #Python
python批量修改文件名的实现代码
Sep 01 #Python
python中List的sort方法指南
Sep 01 #Python
Python抓取京东图书评论数据
Aug 31 #Python
Python深入学习之内存管理
Aug 31 #Python
You might like
PHP与MySQL开发的8个技巧小结
2010/12/17 PHP
php关于array_multisort多维数组排序的使用说明
2011/01/04 PHP
如何用PHP来实现一个动态Web服务器
2015/07/29 PHP
php常用正则函数实例小结
2016/12/29 PHP
学习ExtJS(二) Button常用方法
2009/10/07 Javascript
js面向对象设计用{}好还是function(){}好(构造函数)
2011/10/23 Javascript
jquery中的on方法使用介绍
2013/12/29 Javascript
通过隐藏iframe实现文件下载的js方法介绍
2014/02/26 Javascript
原生javascript实现拖动元素示例代码
2014/09/01 Javascript
Javascript中的Callback方法浅析
2015/03/15 Javascript
Jquery EasyUI实现treegrid上显示checkbox并取选定值的方法
2016/04/29 Javascript
AngularJS学习笔记之依赖注入详解
2016/05/16 Javascript
JQuery遍历元素的后代和同胞实现方法
2016/09/18 Javascript
浅析Node.js:DNS模块的使用
2016/11/23 Javascript
AngularJS表格添加序号的方法
2017/03/03 Javascript
微信小程序 首页制作简单实例
2017/04/07 Javascript
vue2+el-menu实现路由跳转及当前项的设置方法实例
2017/11/07 Javascript
轻量级JS Cookie插件js-cookie的使用方法
2018/03/22 Javascript
浅析node.js的模块加载机制
2018/05/25 Javascript
Vue源码探究之状态初始化
2018/11/14 Javascript
python多线程抓取天涯帖子内容示例
2014/04/03 Python
Python实现Logger打印功能的方法详解
2017/09/01 Python
elasticsearch python 查询的两种方法
2019/08/04 Python
python并发编程多进程之守护进程原理解析
2019/08/20 Python
python下对hsv颜色空间进行量化操作
2020/06/04 Python
如何在python中判断变量的类型
2020/07/29 Python
英国最大的女士服装零售商:Bonmarché
2017/08/17 全球购物
个人求职简历的自我评价
2013/10/19 职场文书
一封普通求职者的求职信
2013/11/20 职场文书
市政管理求职信范文
2014/05/07 职场文书
药品营销策划方案
2014/06/15 职场文书
妈妈活动方案
2014/08/15 职场文书
“四风”问题整改措施和努力方向
2014/09/20 职场文书
出纳岗位职责
2015/01/31 职场文书
新人入职感言
2015/07/31 职场文书
Python测试框架pytest核心库pluggy详解
2022/08/05 Golang