python抓取豆瓣图片并自动保存示例学习


Posted in Python onJanuary 10, 2014

环境Python 2.7.6,BS4,在powershell或命令行均可运行。请确保安装了BS模块

# -*- coding:utf8 -*-
# 2013.12.36 19:41 wnlo-c209
# 抓取dbmei.com的图片。
from bs4 import BeautifulSoup
import os, sys, urllib2
# 创建文件夹,昨天刚学会
path = os.getcwd()          # 获取此脚本所在目录
new_path = os.path.join(path,u'豆瓣妹子')
if not os.path.isdir(new_path):
 os.mkdir(new_path)

def page_loop(page=0):
 url = 'http://www.dbmeizi.com/?p=%s' % page
 content = urllib2.urlopen(url)
 soup = BeautifulSoup(content)
 my_girl = soup.find_all('img')   
    # 加入结束检测,写的不好....
 if my_girl ==[]:
  print u'已经全部抓取完毕'
  sys.exit(0)
 print u'开始抓取'
 for girl in my_girl:
  link = girl.get('src')
  flink = 'http://www.dbmeizi.com/' + link
  print flink
  content2 = urllib2.urlopen(flink).read()
  with open(u'豆瓣妹子'+'/'+flink[-11:],'wb') as code:   #在OSC上现学的
   code.write(content2)
 page = int(page) + 1
 print u'开始抓取下一页'
 print 'the %s page' % page
 page_loop(page)
page_loop().
Python 相关文章推荐
python实现文件路径和url相互转换的方法
Jul 06 Python
Python增量循环删除MySQL表数据的方法
Sep 23 Python
python实现连续图文识别
Dec 18 Python
Django框架模板介绍
Jan 15 Python
pycharm 实现显示project 选项卡的方法
Jan 17 Python
Django 多环境配置详解
May 14 Python
详解python中的index函数用法
Aug 06 Python
布隆过滤器的概述及Python实现方法
Dec 08 Python
python统计字符的个数代码实例
Feb 07 Python
详解用Python进行时间序列预测的7种方法
Mar 13 Python
django rest framework 自定义返回方式
Jul 12 Python
Python中读取文件名中的数字的实例详解
Dec 25 Python
python文件比较示例分享
Jan 10 #Python
python发送伪造的arp请求
Jan 09 #Python
python抓取京东价格分析京东商品价格走势
Jan 09 #Python
python实现电子词典
Apr 23 #Python
python中cPickle用法例子分享
Jan 03 #Python
使用python获取CPU和内存信息的思路与实现(linux系统)
Jan 03 #Python
Python群发邮件实例代码
Jan 03 #Python
You might like
windows7下安装php的imagick和imagemagick扩展教程
2014/07/04 PHP
PHP结合jQuery插件ajaxFileUpload实现异步上传文件实例
2020/08/17 PHP
JQuery 学习笔记 element属性控制
2009/07/23 Javascript
Jquery实战_读书笔记1—选择jQuery
2010/01/22 Javascript
jQuery 过滤not()与filter()实例代码
2012/05/10 Javascript
js设置function参数默认值(适合没有传参情况)
2014/02/24 Javascript
jquery实现html页面 div 假分页有原理有代码
2014/09/06 Javascript
Javascript MVC框架Backbone.js详解
2014/09/18 Javascript
jQuery实现平滑滚动页面到指定锚点链接的方法
2015/07/15 Javascript
jquery+CSS3实现淘宝移动网页菜单效果
2015/08/31 Javascript
深入解析JavaScript的闭包机制
2015/10/20 Javascript
Javascript中的Prototype到底是什么
2016/02/16 Javascript
javascript html5实现表单验证
2016/03/01 Javascript
JavaScript实现打开链接页面的方式汇总
2016/06/02 Javascript
JSP基于Bootstrap分页显示实例解析
2016/06/12 Javascript
AngularJS入门教程之Select(选择框)详解
2016/07/27 Javascript
JS 调试中常见的报错问题解决方法
2017/05/20 Javascript
vue2.0在没有dev-server.js下的本地数据配置方法
2018/02/23 Javascript
浅谈手写node可读流之流动模式
2018/06/01 Javascript
AngularJS实现动态切换样式的方法分析
2018/06/26 Javascript
使用react render props实现倒计时的示例代码
2018/12/06 Javascript
Angular7创建项目、组件、服务以及服务的使用
2019/02/19 Javascript
python中学习K-Means和图片压缩
2017/11/20 Python
python opencv minAreaRect 生成最小外接矩形的方法
2019/07/01 Python
Python assert关键字原理及实例解析
2019/12/13 Python
使用TensorFlow搭建一个全连接神经网络教程
2020/02/06 Python
Django-xadmin+rule对象级权限的实现方式
2020/03/30 Python
django 连接数据库出现1045错误的解决方式
2020/05/14 Python
Python多个装饰器的调用顺序实例解析
2020/05/22 Python
全球领先美式家具品牌:Ashley爱室丽家居
2017/08/07 全球购物
大客户销售经理职责
2013/12/04 职场文书
公积金单位接收函
2014/01/11 职场文书
解除财产保全担保书
2014/05/20 职场文书
机电一体化毕业生自荐信
2014/06/19 职场文书
八年级物理教学反思
2016/02/19 职场文书
《秦兵马俑》教学反思
2016/02/24 职场文书