python抓取豆瓣图片并自动保存示例学习


Posted in Python onJanuary 10, 2014

环境Python 2.7.6,BS4,在powershell或命令行均可运行。请确保安装了BS模块

# -*- coding:utf8 -*-
# 2013.12.36 19:41 wnlo-c209
# 抓取dbmei.com的图片。
from bs4 import BeautifulSoup
import os, sys, urllib2
# 创建文件夹,昨天刚学会
path = os.getcwd()          # 获取此脚本所在目录
new_path = os.path.join(path,u'豆瓣妹子')
if not os.path.isdir(new_path):
 os.mkdir(new_path)

def page_loop(page=0):
 url = 'http://www.dbmeizi.com/?p=%s' % page
 content = urllib2.urlopen(url)
 soup = BeautifulSoup(content)
 my_girl = soup.find_all('img')   
    # 加入结束检测,写的不好....
 if my_girl ==[]:
  print u'已经全部抓取完毕'
  sys.exit(0)
 print u'开始抓取'
 for girl in my_girl:
  link = girl.get('src')
  flink = 'http://www.dbmeizi.com/' + link
  print flink
  content2 = urllib2.urlopen(flink).read()
  with open(u'豆瓣妹子'+'/'+flink[-11:],'wb') as code:   #在OSC上现学的
   code.write(content2)
 page = int(page) + 1
 print u'开始抓取下一页'
 print 'the %s page' % page
 page_loop(page)
page_loop().
Python 相关文章推荐
linux下安装easy_install的方法
Feb 10 Python
Python对小数进行除法运算的正确方法示例
Aug 25 Python
python实现逆波兰计算表达式实例详解
May 06 Python
python requests 使用快速入门
Aug 31 Python
对pandas中Series的map函数详解
Jul 25 Python
Python设计模式之工厂方法模式实例详解
Jan 18 Python
Python3实现计算两个数组的交集算法示例
Apr 03 Python
如何使用Python标准库进行性能测试
Jun 25 Python
Python 微信爬虫完整实例【单线程与多线程】
Jul 06 Python
如何运行带参数的python脚本
Nov 15 Python
python 实现矩阵按对角线打印
Nov 29 Python
opencv python如何实现图像二值化
Feb 03 Python
python文件比较示例分享
Jan 10 #Python
python发送伪造的arp请求
Jan 09 #Python
python抓取京东价格分析京东商品价格走势
Jan 09 #Python
python实现电子词典
Apr 23 #Python
python中cPickle用法例子分享
Jan 03 #Python
使用python获取CPU和内存信息的思路与实现(linux系统)
Jan 03 #Python
Python群发邮件实例代码
Jan 03 #Python
You might like
php导入csv文件碰到乱码问题的解决方法
2014/02/10 PHP
PHP实现采集中国天气网未来7天天气
2014/10/15 PHP
PHP读取大文件的几种方法介绍
2016/10/27 PHP
PHP PDOStatement::execute讲解
2019/01/31 PHP
jQuery的写法不同导致的兼容性问题的解决方法
2010/07/29 Javascript
JSONP 跨域访问代理API-yahooapis实现代码
2012/12/02 Javascript
jQuery中$(function() {});问题详解
2015/08/10 Javascript
javascript下使用Promise封装FileReader
2016/02/19 Javascript
js阻止浏览器默认行为触发的通用方法(推荐)
2016/05/15 Javascript
JavaScript中ES6 Babel正确安装过程
2016/07/18 Javascript
浅谈jQuery操作类数组的工具方法
2016/12/23 Javascript
详解javascript表单的Ajax提交插件的使用
2016/12/29 Javascript
jQuery中的deferred对象和extend方法详解
2017/05/08 jQuery
React简单介绍
2017/05/24 Javascript
详解如何优雅地在React项目中使用Redux
2017/12/28 Javascript
vue.js前后端数据交互之提交数据操作详解
2018/04/24 Javascript
javascript实现点亮灯泡特效示例
2019/10/15 Javascript
优化Vue中date format的性能详解
2020/01/13 Javascript
JS document内容及样式操作完整示例
2020/01/14 Javascript
Python高效编程技巧
2013/01/07 Python
跟老齐学Python之print详解
2014/09/28 Python
用python写的一个wordpress的采集程序
2016/02/27 Python
Python 出现错误TypeError: ‘NoneType’ object is not iterable解决办法
2017/01/12 Python
fastcgi文件读取漏洞之python扫描脚本
2017/04/23 Python
Python实现二维曲线拟合的方法
2018/12/29 Python
python3中类的继承以及self和super的区别详解
2019/06/26 Python
发现世界上最好的珠宝设计师:JewelStreet
2017/12/17 全球购物
来自Ocado的宠物商店:Fetch
2018/07/10 全球购物
如何在Shell脚本中使用函数
2015/09/06 面试题
幼儿园实习生辞职信
2014/01/20 职场文书
料理师求职信
2014/01/30 职场文书
党支部承诺书范文
2014/03/28 职场文书
小学班干部竞选演讲稿
2014/04/24 职场文书
安全宣传标语
2014/06/10 职场文书
校园新闻稿范文
2015/07/18 职场文书
opencv 分类白天与夜景视频的方法
2021/06/05 Python