python爬虫入门教程之点点美女图片爬虫代码分享


Posted in Python onSeptember 02, 2014

继续鼓捣爬虫,今天贴出一个代码,爬取点点网「美女」标签下的图片,原图。

# -*- coding: utf-8 -*- 

#--------------------------------------- 
#  程序:点点美女图片爬虫 
#  版本:0.2 
#  作者:zippera 
#  日期:2013-07-26 
#  语言:Python 2.7 
#  说明:能设置下载的页数 
#--------------------------------------- 
 
import urllib2
import urllib
import re
 
 
 
pat = re.compile('<div class="feed-big-img">\n.*?imgsrc="(ht.*?)\".*?')
nexturl1 = "http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3?page="
 
 
count = 1
 
while count < 2:
 
  print "Page " + str(count) + "\n"
  myurl = nexturl1 + str(count)
  myres = urllib2.urlopen(myurl)
  mypage = myres.read()
  ucpage = mypage.decode("utf-8") #转码
 
  mat = pat.findall(ucpage)
  
 
  
  
  
  if len(mat):
    cnt = 1
    for item in mat:
      print "Page" + str(count) + " No." + str(cnt) + " url: " + item + "\n"
      cnt += 1
      fnp = re.compile('(\w{10}\.\w+)$')
      fnr = fnp.findall(item)
      if fnr:
        fname = fnr[0]
        urllib.urlretrieve(item, fname)
    
  else:
    print "no data"
    
  count += 1

使用方法:新建一个文件夹,把代码保存为name.py文件,运行python name.py就可以把图片下载到文件夹。

Python 相关文章推荐
python实现rsa加密实例详解
Jul 19 Python
Python实现将Excel转换为json的方法示例
Aug 05 Python
Python实现字符串与数组相互转换功能示例
Sep 22 Python
python生成随机图形验证码详解
Nov 08 Python
python的Tqdm模块的使用
Jan 10 Python
30秒轻松实现TensorFlow物体检测
Mar 14 Python
在python中,使用scatter绘制散点图的实例
Jul 03 Python
Python二次规划和线性规划使用实例
Dec 09 Python
Django 解决开发自定义抛出异常的问题
May 21 Python
Python爬虫入门有哪些基础知识点
Jun 02 Python
手把手教你配置JupyterLab 环境的实现
Feb 02 Python
如何用 Python 制作 GitHub 消息助手
Feb 20 Python
python爬虫入门教程之糗百图片爬虫代码分享
Sep 02 #Python
python批量同步web服务器代码核心程序
Sep 01 #Python
寻找网站后台地址的python脚本
Sep 01 #Python
python批量修改文件名的实现代码
Sep 01 #Python
python中List的sort方法指南
Sep 01 #Python
Python抓取京东图书评论数据
Aug 31 #Python
Python深入学习之内存管理
Aug 31 #Python
You might like
关于php fread()使用技巧
2010/01/22 PHP
PHP number_format() 函数定义和用法
2012/06/01 PHP
php实现网站顶踩功能的完整前端代码
2015/07/19 PHP
摘自织梦CMS的HTTP文件下载类
2015/08/08 PHP
一些mootools的学习资源
2010/02/07 Javascript
js中split函数的使用方法说明
2013/12/26 Javascript
详解JavaScript函数
2015/12/01 Javascript
jQuery获取剪贴板内容的方法
2016/06/16 Javascript
如何用js实现鼠标向上滚动时浮动导航
2016/07/18 Javascript
AngularJS表达式讲解及示例代码
2016/08/16 Javascript
通过bootstrap全面学习less
2016/11/09 Javascript
JS实现颜色梯度与渐变效果完整实例
2016/12/30 Javascript
javascript中json基础知识详解
2017/01/19 Javascript
JavaScript实现的前端AES加密解密功能【基于CryptoJS】
2018/08/28 Javascript
微信小程序实现商品属性联动选择
2019/02/15 Javascript
JavaScript定时器设置、使用与倒计时案例详解
2019/07/08 Javascript
详解Node.JS模块 process
2020/08/31 Javascript
Python数据结构之翻转链表
2017/02/25 Python
python计算阶乘和的方法(1!+2!+3!+...+n!)
2019/02/01 Python
Django框架自定义模型管理器与元选项用法分析
2019/07/22 Python
使用python批量修改文件名的方法(视频合并时)
2020/03/24 Python
Python3创建Django项目的几种方法(3种)
2020/06/03 Python
查看keras的默认backend实现方式
2020/06/19 Python
Numpy中np.random.rand()和np.random.randn() 用法和区别详解
2020/10/23 Python
Canvas引入跨域的图片导致toDataURL()报错的问题的解决
2018/09/19 HTML / CSS
比利时家具购买网站:Home24
2019/01/03 全球购物
L’Artisan Parfumeur官网:法国香水品牌
2020/08/11 全球购物
技校教师求职简历的自我评价
2013/10/20 职场文书
四个太阳教学反思
2014/02/01 职场文书
护士长竞聘书
2014/03/31 职场文书
希特勒经典演讲稿
2014/05/19 职场文书
小学生运动会通讯稿
2014/09/23 职场文书
python实现高效的遗传算法
2021/04/07 Python
python实战之用emoji表情生成文字
2021/05/08 Python
python使用tkinter实现透明窗体上绘制随机出现的小球(实例代码)
2021/05/17 Python
python办公自动化之excel的操作
2021/05/23 Python