python抓取网页中链接的静态图片


Posted in Python onJanuary 29, 2018

本文实例为大家分享了python抓取网页中链接的静态图片的具体代码,供大家参考,具体内容如下

# -*- coding:utf-8 -*- 
 
#http://tieba.baidu.com/p/2460150866 
#抓取图片地址 
 
from bs4 import BeautifulSoup 
import urllib.request 
from time import sleep 
 
html_doc = "http://tieba.baidu.com/p/2460150866" 
 
def get_image(url): 
 req = urllib.request.Request(url) 
 webpage = urllib.request.urlopen(req) 
 
 html = webpage.read() 
 soup = BeautifulSoup(html, 'html.parser') 
 
 #抓取图片地址 
 #抓取img标签且class为BDE_Image的所有内容 
 img_src=soup.findAll("img",{'class':'BDE_Image'}) 
 i = 1 
 for img in img_src: 
  img_url = img.get('src') #抓取src 
 # print(img) 
  req = urllib.request.Request(img_url) 
  u = urllib.request.urlopen(req) 
  data = u.read() 
  with open("AutoCodePng20180119-"+str(i)+".jpg", 'wb') as f: 
   sleep(2) 
   f.write(data) 
   i += 1 
 
def getImg(url): 
 html = urllib.request(url) 
 page = html.read() 
 soup = BeautifulSoup(page, "html.parser") 
 imglist = soup.find_all('img') #发现html中带img标签的数据,输出格式为<img xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx,存入集合 
 lenth = len(imglist) #计算集合的个数 
 for i in range(lenth): 
  print imglist[i].attrs['src'] #抓取img中属性为src的信息,例如<img src="123456" xxxxxxxxxxxxxxxx,则输出为123456

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python计算N天之后日期的方法
Mar 31 Python
Python多线程编程(一):threading模块综述
Apr 05 Python
Python使用openpyxl读写excel文件的方法
Jun 30 Python
教你学会使用Python正则表达式
Sep 07 Python
Python数据结构之顺序表的实现代码示例
Nov 15 Python
Python Json序列化与反序列化的示例
Jan 31 Python
vue.js实现输入框输入值内容实时响应变化示例
Jul 07 Python
Python使用Selenium模块实现模拟浏览器抓取淘宝商品美食信息功能示例
Jul 18 Python
pycharm打开命令行或Terminal的方法
Jan 16 Python
python tkinter实现界面切换的示例代码
Jun 14 Python
PyQt5 closeEvent关闭事件退出提示框原理解析
Jan 08 Python
简述python四种分词工具,盘点哪个更好用?
Apr 13 Python
Python实现识别手写数字 Python图片读入与处理
Mar 23 #Python
Python实现PS滤镜特效Marble Filter玻璃条纹扭曲效果示例
Jan 29 #Python
Python实现识别手写数字大纲
Jan 29 #Python
django文档学习之applications使用详解
Jan 29 #Python
Python实现PS滤镜Fish lens图像扭曲效果示例
Jan 29 #Python
python实现识别手写数字 python图像识别算法
Mar 23 #Python
Python实现简易版的Web服务器(推荐)
Jan 29 #Python
You might like
PHP数据库开发知多少
2006/10/09 PHP
一个程序下载的管理程序(一)
2006/10/09 PHP
php flush类输出缓冲剖析
2008/10/19 PHP
PHP 组件化编程技巧
2009/06/06 PHP
nginx+php-fpm配置文件的组织结构介绍
2012/11/07 PHP
微信公众号开发客服接口实例代码
2016/10/21 PHP
lib.utf.js
2007/08/21 Javascript
jquery ajax提交表单数据的两种方式
2009/11/24 Javascript
js实现select跳转功能代码
2014/10/22 Javascript
JavaScript的Polymer框架中dom-repeat与VM的相关操作
2015/07/29 Javascript
js生成随机数(指定范围)的实例代码
2016/07/10 Javascript
深入理解vue-router之keep-alive
2017/08/31 Javascript
nodeJs实现基于连接池连接mysql的方法示例
2018/02/10 NodeJs
深入浅析Vue中的slots/scoped slots
2018/04/03 Javascript
swiper在vue项目中loop循环轮播失效的解决方法
2018/09/15 Javascript
微信小程序实现顶部下拉菜单栏
2018/11/04 Javascript
VUE简单的定时器实时刷新的实现方法
2019/01/20 Javascript
微信小程序实现卡片左右滑动效果的示例代码
2019/05/01 Javascript
[59:44]2018DOTA2亚洲邀请赛 3.31 小组赛 B组 paiN vs iG
2018/03/31 DOTA
Python Deque 模块使用详解
2014/07/04 Python
菜鸟使用python实现正则检测密码合法性
2016/01/05 Python
python 调用HBase的简单实例
2016/12/18 Python
解决Python selenium get页面很慢时的问题
2019/01/30 Python
selenium+python自动化测试环境搭建步骤
2019/06/03 Python
Python Django2.0集成Celery4.1教程
2019/11/19 Python
CSS3新属性transition-property transform box-shadow实例学习
2013/06/06 HTML / CSS
东南亚冒险旅行与活动:Adventoro
2019/10/16 全球购物
怎样声明接口
2014/09/19 面试题
婚假请假条怎么写
2014/04/10 职场文书
学校就业推荐信范文
2014/05/19 职场文书
2014年党员承诺书范文
2014/05/20 职场文书
十佳好少年事迹材料
2014/08/21 职场文书
公司离职证明样本
2014/09/13 职场文书
工程资料员岗位职责
2015/04/13 职场文书
2015中学教师个人工作总结
2015/07/22 职场文书
浅谈Python列表嵌套字典转化的问题
2021/04/07 Python