python抓取网页中链接的静态图片


Posted in Python onJanuary 29, 2018

本文实例为大家分享了python抓取网页中链接的静态图片的具体代码,供大家参考,具体内容如下

# -*- coding:utf-8 -*- 
 
#http://tieba.baidu.com/p/2460150866 
#抓取图片地址 
 
from bs4 import BeautifulSoup 
import urllib.request 
from time import sleep 
 
html_doc = "http://tieba.baidu.com/p/2460150866" 
 
def get_image(url): 
 req = urllib.request.Request(url) 
 webpage = urllib.request.urlopen(req) 
 
 html = webpage.read() 
 soup = BeautifulSoup(html, 'html.parser') 
 
 #抓取图片地址 
 #抓取img标签且class为BDE_Image的所有内容 
 img_src=soup.findAll("img",{'class':'BDE_Image'}) 
 i = 1 
 for img in img_src: 
  img_url = img.get('src') #抓取src 
 # print(img) 
  req = urllib.request.Request(img_url) 
  u = urllib.request.urlopen(req) 
  data = u.read() 
  with open("AutoCodePng20180119-"+str(i)+".jpg", 'wb') as f: 
   sleep(2) 
   f.write(data) 
   i += 1 
 
def getImg(url): 
 html = urllib.request(url) 
 page = html.read() 
 soup = BeautifulSoup(page, "html.parser") 
 imglist = soup.find_all('img') #发现html中带img标签的数据,输出格式为<img xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx,存入集合 
 lenth = len(imglist) #计算集合的个数 
 for i in range(lenth): 
  print imglist[i].attrs['src'] #抓取img中属性为src的信息,例如<img src="123456" xxxxxxxxxxxxxxxx,则输出为123456

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python随机生成信用卡卡号的实现方法
May 14 Python
python的paramiko模块实现远程控制和传输示例
Oct 13 Python
Python2.X/Python3.X中urllib库区别讲解
Dec 19 Python
简单谈谈Python的pycurl模块
Apr 07 Python
详解python中的装饰器
Jul 10 Python
Python3.7实现中控考勤机自动连接
Aug 28 Python
pyqt 实现在Widgets中显示图片和文字的方法
Jun 13 Python
python pytest进阶之conftest.py详解
Jun 27 Python
python检测服务器端口代码实例
Aug 31 Python
Python requests.post方法中data与json参数区别详解
Apr 30 Python
CocosCreator ScrollView优化系列之分帧加载
Apr 14 Python
手把手教你使用TensorFlow2实现RNN
Jul 15 Python
Python实现识别手写数字 Python图片读入与处理
Mar 23 #Python
Python实现PS滤镜特效Marble Filter玻璃条纹扭曲效果示例
Jan 29 #Python
Python实现识别手写数字大纲
Jan 29 #Python
django文档学习之applications使用详解
Jan 29 #Python
Python实现PS滤镜Fish lens图像扭曲效果示例
Jan 29 #Python
python实现识别手写数字 python图像识别算法
Mar 23 #Python
Python实现简易版的Web服务器(推荐)
Jan 29 #Python
You might like
PHP求小于1000的所有水仙花数的代码
2012/01/10 PHP
解析linux下安装memcacheq(mcq)全过程笔记
2013/06/27 PHP
页面调用单个swf文件,嵌套出多个方法。
2011/11/21 Javascript
jQuery事件 delegate()使用方法介绍
2012/10/30 Javascript
Json序列化和反序列化方法解析
2013/12/19 Javascript
jQuery自定义事件的简单实现代码
2014/01/27 Javascript
基于jQuery实现二级下拉菜单效果
2016/02/01 Javascript
Bootstrap框架下下拉框select搜索功能
2020/03/26 Javascript
解析javascript图片懒加载与预加载的分析总结
2016/10/27 Javascript
AngularJS表单验证功能分析
2017/05/26 Javascript
vue初尝试--项目结构(推荐)
2018/01/30 Javascript
vue使用$emit时,父组件无法监听到子组件的事件实例
2018/02/26 Javascript
element-ui table span-method(行合并)的实现代码
2018/12/20 Javascript
监听element-ui table滚动事件的方法
2019/03/26 Javascript
关于AngularJS中几种Providers的区别总结
2020/05/17 Javascript
使用Element的InfiniteScroll 无限滚动组件报错的解决
2020/07/27 Javascript
[00:35]2016完美“圣”典风云人物:冷冷宣传片
2016/12/08 DOTA
Python装饰器入门学习教程(九步学习)
2016/01/28 Python
Python 十六进制整数与ASCii编码字符串相互转换方法
2018/07/09 Python
python多任务及返回值的处理方法
2019/01/22 Python
Python Process多进程实现过程
2019/10/22 Python
python用requests实现http请求代码实例
2019/10/31 Python
通过Turtle库在Python中绘制一个鼠年福鼠
2020/02/03 Python
8种常用的Python工具
2020/08/05 Python
菲律宾领先的在线时尚商店:Zalora菲律宾
2018/02/08 全球购物
Omio葡萄牙:全欧洲低价大巴、火车和航班搜索和比价
2019/02/09 全球购物
管道维修工岗位职责
2013/12/27 职场文书
实习生求职自荐信
2014/02/07 职场文书
经销商订货会主持词
2014/03/27 职场文书
青年教师师德演讲稿
2014/08/26 职场文书
乡镇机关党员民主评议表自我评价
2014/09/21 职场文书
专升本学生毕业自我鉴定
2014/10/04 职场文书
幼儿园小班个人工作总结
2015/02/12 职场文书
普希金的诗歌赏析(3首)
2019/08/20 职场文书
老生常谈 使用 CSS 实现三角形的技巧(多种方法)
2021/04/13 HTML / CSS
经典《舰娘》游改全新动画预告 预定11月开播
2022/04/01 日漫