python爬虫入门教程之点点美女图片爬虫代码分享


Posted in Python onSeptember 02, 2014

继续鼓捣爬虫,今天贴出一个代码,爬取点点网「美女」标签下的图片,原图。

# -*- coding: utf-8 -*- 

#--------------------------------------- 
#  程序:点点美女图片爬虫 
#  版本:0.2 
#  作者:zippera 
#  日期:2013-07-26 
#  语言:Python 2.7 
#  说明:能设置下载的页数 
#--------------------------------------- 
 
import urllib2
import urllib
import re
 
 
 
pat = re.compile('<div class="feed-big-img">\n.*?imgsrc="(ht.*?)\".*?')
nexturl1 = "http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3?page="
 
 
count = 1
 
while count < 2:
 
  print "Page " + str(count) + "\n"
  myurl = nexturl1 + str(count)
  myres = urllib2.urlopen(myurl)
  mypage = myres.read()
  ucpage = mypage.decode("utf-8") #转码
 
  mat = pat.findall(ucpage)
  
 
  
  
  
  if len(mat):
    cnt = 1
    for item in mat:
      print "Page" + str(count) + " No." + str(cnt) + " url: " + item + "\n"
      cnt += 1
      fnp = re.compile('(\w{10}\.\w+)$')
      fnr = fnp.findall(item)
      if fnr:
        fname = fnr[0]
        urllib.urlretrieve(item, fname)
    
  else:
    print "no data"
    
  count += 1

使用方法:新建一个文件夹,把代码保存为name.py文件,运行python name.py就可以把图片下载到文件夹。

Python 相关文章推荐
Python中的魔法方法深入理解
Jul 09 Python
用于统计项目中代码总行数的Python脚本分享
Apr 21 Python
pandas数值计算与排序方法
Apr 12 Python
基于Python pip用国内镜像下载的方法
Jun 12 Python
selenium+python实现自动化登录的方法
Sep 04 Python
Python 微信爬虫完整实例【单线程与多线程】
Jul 06 Python
浅谈numpy中np.array()与np.asarray的区别以及.tolist
Jun 03 Python
keras多显卡训练方式
Jun 10 Python
scrapy redis配置文件setting参数详解
Nov 18 Python
python3中celery异步框架简单使用+守护进程方式启动
Jan 20 Python
python的scipy.stats模块中正态分布常用函数总结
Feb 19 Python
python opencv常用图形绘制方法(线段、矩形、圆形、椭圆、文本)
Apr 12 Python
python爬虫入门教程之糗百图片爬虫代码分享
Sep 02 #Python
python批量同步web服务器代码核心程序
Sep 01 #Python
寻找网站后台地址的python脚本
Sep 01 #Python
python批量修改文件名的实现代码
Sep 01 #Python
python中List的sort方法指南
Sep 01 #Python
Python抓取京东图书评论数据
Aug 31 #Python
Python深入学习之内存管理
Aug 31 #Python
You might like
全国FM电台频率大全 - 10 江苏省
2020/03/11 无线电
详解PHP显示MySQL数据的三种方法
2008/06/05 PHP
基于jQuery实现的水平和垂直居中的div窗口
2011/08/08 Javascript
JavaScript通过RegExp实现客户端验证处理程序
2013/05/07 Javascript
jQuery随便控制任意div隐藏的方法
2013/06/28 Javascript
简述Matlab中size()函数的用法
2016/03/20 Javascript
Vue.js学习笔记之 helloworld
2016/08/14 Javascript
BootStrap实现带有增删改查功能的表格(DEMO详解)
2016/10/26 Javascript
Jquery UI实现一次拖拽多个选中的元素操作
2020/12/01 Javascript
深入理解jQuery.data() 的实现方式
2016/11/30 Javascript
Javascript面试经典套路reduce函数查重
2017/03/23 Javascript
jQuery 中msgTips 顶部弹窗效果实现代码
2017/08/14 jQuery
微信小程序仿淘宝热搜词在搜索框中轮播功能
2020/01/21 Javascript
vue引用外部JS的两种种方法
2020/01/28 Javascript
koa-passport实现本地验证的方法示例
2020/02/20 Javascript
微信小程序实现搜索功能
2020/03/10 Javascript
使用Python脚本来控制Windows Azure的简单教程
2015/04/16 Python
利用python代码写的12306订票代码
2015/12/20 Python
Python 描述符(Descriptor)入门
2016/11/20 Python
Python numpy实现数组合并实例(vstack,hstack)
2018/01/09 Python
详解PANDAS 数据合并与重塑(join/merge篇)
2019/07/09 Python
pytorch 输出中间层特征的实例
2019/08/17 Python
python使用rsa非对称加密过程解析
2019/12/28 Python
python3将变量输入的简单实例
2020/08/19 Python
python可视化 matplotlib画图使用colorbar工具自定义颜色
2020/12/07 Python
canvas实现按住鼠标移动绘制出轨迹的示例代码
2018/02/05 HTML / CSS
iHerb香港:维生素、补充剂和天然保健品
2017/08/01 全球购物
英国豪华针织品牌John Smedley的在线销售商:The Outlet by John Smedley
2018/04/08 全球购物
微软加拿大官方网站:Microsoft Canada
2019/04/28 全球购物
经济实惠的名牌太阳镜和眼镜:Privé Revaux
2021/02/07 全球购物
小学生自我评价范文
2014/01/25 职场文书
个人自查自纠材料
2014/10/14 职场文书
党的群众路线学习笔记
2014/11/06 职场文书
2019年二手房买卖合同范本
2019/10/14 职场文书
python实现简单反弹球游戏
2021/04/12 Python
uniapp开发打包多端应用完整方法指南
2022/12/24 Javascript