python抓取豆瓣图片并自动保存示例学习


Posted in Python onJanuary 10, 2014

环境Python 2.7.6,BS4,在powershell或命令行均可运行。请确保安装了BS模块

# -*- coding:utf8 -*-
# 2013.12.36 19:41 wnlo-c209
# 抓取dbmei.com的图片。
from bs4 import BeautifulSoup
import os, sys, urllib2
# 创建文件夹,昨天刚学会
path = os.getcwd()          # 获取此脚本所在目录
new_path = os.path.join(path,u'豆瓣妹子')
if not os.path.isdir(new_path):
 os.mkdir(new_path)

def page_loop(page=0):
 url = 'http://www.dbmeizi.com/?p=%s' % page
 content = urllib2.urlopen(url)
 soup = BeautifulSoup(content)
 my_girl = soup.find_all('img')   
    # 加入结束检测,写的不好....
 if my_girl ==[]:
  print u'已经全部抓取完毕'
  sys.exit(0)
 print u'开始抓取'
 for girl in my_girl:
  link = girl.get('src')
  flink = 'http://www.dbmeizi.com/' + link
  print flink
  content2 = urllib2.urlopen(flink).read()
  with open(u'豆瓣妹子'+'/'+flink[-11:],'wb') as code:   #在OSC上现学的
   code.write(content2)
 page = int(page) + 1
 print u'开始抓取下一页'
 print 'the %s page' % page
 page_loop(page)
page_loop().
Python 相关文章推荐
对Python新手编程过程中如何规避一些常见问题的建议
Apr 01 Python
python中管道用法入门实例
Jun 04 Python
20个常用Python运维库和模块
Feb 12 Python
Python读取本地文件并解析网页元素的方法
May 21 Python
使用python画个小猪佩奇的示例代码
Jun 06 Python
使用Python实现一个栈判断括号是否平衡
Aug 23 Python
Python+OpenCV实现旋转文本校正方式
Jan 09 Python
记一次pyinstaller打包pygame项目为exe的过程(带图片)
Mar 02 Python
使用Python-OpenCV消除图像中孤立的小区域操作
Jul 05 Python
用python获取txt文件中关键字的数量
Dec 24 Python
Django 实现jwt认证的示例
Apr 30 Python
详解Flask开发技巧之异常处理
Jun 15 Python
python文件比较示例分享
Jan 10 #Python
python发送伪造的arp请求
Jan 09 #Python
python抓取京东价格分析京东商品价格走势
Jan 09 #Python
python实现电子词典
Apr 23 #Python
python中cPickle用法例子分享
Jan 03 #Python
使用python获取CPU和内存信息的思路与实现(linux系统)
Jan 03 #Python
Python群发邮件实例代码
Jan 03 #Python
You might like
php自动注册登录验证机制实现代码
2011/12/20 PHP
PHP模块memcached使用指南
2014/12/08 PHP
php+mysqli使用预处理技术进行数据库查询的方法
2015/01/28 PHP
PHP动态柱状图实现方法
2015/03/30 PHP
PHP读取PPT文件的方法
2015/12/10 PHP
PHP加密技术的简单实现
2016/09/04 PHP
php使用PDO事务配合表格读取大量数据插入操作实现方法
2017/02/16 PHP
简单谈谈PHP面向对象之标识对象
2017/06/27 PHP
php给数组赋值的实例方法
2019/09/26 PHP
TP5框架使用QueryList采集框架爬小说操作示例
2020/03/26 PHP
document.documentElement && document.documentElement.scrollTop
2007/12/01 Javascript
ext 同步和异步示例代码
2009/09/18 Javascript
一个简单的弹性返回顶部JS代码实现介绍
2013/06/09 Javascript
关于JS Lodop打印插件打印Bootstrap样式错乱问题的解决方案
2016/12/23 Javascript
基于node.js依赖express解析post请求四种数据格式
2017/02/13 Javascript
js使用文件流下载csv文件的实现方法
2019/07/15 Javascript
layer.alert回调函数执行关闭弹窗的实例
2019/09/11 Javascript
JavaScript实现拖拽功能
2020/02/11 Javascript
js回调函数原理与用法案例分析
2020/03/04 Javascript
javascript实现倒计时关闭广告
2021/02/09 Javascript
在Python中操作时间之tzset()方法的使用教程
2015/05/22 Python
深入理解Python中字典的键的使用
2015/08/19 Python
在windows系统中实现python3安装lxml
2016/03/23 Python
python使用两种发邮件的方式smtp和outlook示例
2017/06/02 Python
关于python的list相关知识(推荐)
2017/08/30 Python
Python使用django框架实现多人在线匿名聊天的小程序
2017/11/29 Python
tensorflow通过模型文件,使用tensorboard查看其模型图Graph方式
2020/01/23 Python
如何真正的了解python装饰器
2020/08/14 Python
Python开发.exe小工具的详细步骤
2021/01/27 Python
用canvas画心电图的示例代码
2018/09/10 HTML / CSS
html5用video标签流式加载的实现
2020/05/20 HTML / CSS
Carrs Silver官网:英国著名的银器品牌
2020/08/29 全球购物
医大实习自我鉴定
2013/12/07 职场文书
护士节演讲稿开场白
2014/08/25 职场文书
网络营销实训总结
2015/08/03 职场文书
python异步的ASGI与Fast Api实现
2021/07/16 Python