python抓取网页中链接的静态图片


Posted in Python onJanuary 29, 2018

本文实例为大家分享了python抓取网页中链接的静态图片的具体代码,供大家参考,具体内容如下

# -*- coding:utf-8 -*- 
 
#http://tieba.baidu.com/p/2460150866 
#抓取图片地址 
 
from bs4 import BeautifulSoup 
import urllib.request 
from time import sleep 
 
html_doc = "http://tieba.baidu.com/p/2460150866" 
 
def get_image(url): 
 req = urllib.request.Request(url) 
 webpage = urllib.request.urlopen(req) 
 
 html = webpage.read() 
 soup = BeautifulSoup(html, 'html.parser') 
 
 #抓取图片地址 
 #抓取img标签且class为BDE_Image的所有内容 
 img_src=soup.findAll("img",{'class':'BDE_Image'}) 
 i = 1 
 for img in img_src: 
  img_url = img.get('src') #抓取src 
 # print(img) 
  req = urllib.request.Request(img_url) 
  u = urllib.request.urlopen(req) 
  data = u.read() 
  with open("AutoCodePng20180119-"+str(i)+".jpg", 'wb') as f: 
   sleep(2) 
   f.write(data) 
   i += 1 
 
def getImg(url): 
 html = urllib.request(url) 
 page = html.read() 
 soup = BeautifulSoup(page, "html.parser") 
 imglist = soup.find_all('img') #发现html中带img标签的数据,输出格式为<img xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx,存入集合 
 lenth = len(imglist) #计算集合的个数 
 for i in range(lenth): 
  print imglist[i].attrs['src'] #抓取img中属性为src的信息,例如<img src="123456" xxxxxxxxxxxxxxxx,则输出为123456

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Python的web框架中配置app的教程
Apr 30 Python
python统计文本文件内单词数量的方法
May 30 Python
python从入门到精通(DAY 3)
Dec 20 Python
Python编程实现输入某年某月某日计算出这一天是该年第几天的方法
Apr 18 Python
Python3导入CSV文件的实例(跟Python2有些许的不同)
Jun 22 Python
Django unittest 设置跳过某些case的方法
Dec 26 Python
python 3.6.7实现端口扫描器
Sep 04 Python
使用 Python 合并多个格式一致的 Excel 文件(推荐)
Dec 09 Python
matplotlib基础绘图命令之imshow的使用
Aug 13 Python
python 星号(*)的多种用途
Sep 21 Python
python 经纬度求两点距离、三点面积操作
Jun 03 Python
python的html标准库
Apr 29 Python
Python实现识别手写数字 Python图片读入与处理
Mar 23 #Python
Python实现PS滤镜特效Marble Filter玻璃条纹扭曲效果示例
Jan 29 #Python
Python实现识别手写数字大纲
Jan 29 #Python
django文档学习之applications使用详解
Jan 29 #Python
Python实现PS滤镜Fish lens图像扭曲效果示例
Jan 29 #Python
python实现识别手写数字 python图像识别算法
Mar 23 #Python
Python实现简易版的Web服务器(推荐)
Jan 29 #Python
You might like
php sprintf()函数让你的sql操作更安全
2008/07/23 PHP
解析php函数method_exists()与is_callable()的区别
2013/06/21 PHP
PHP中使用数组指针函数操作数组示例
2014/11/19 PHP
thinkPHP2.1自定义标签库的导入方法详解
2016/07/20 PHP
php mysql_list_dbs()函数用法示例
2017/03/29 PHP
去除链接虚线全面分析总结
2006/08/15 Javascript
WordPress 插件——CoolCode使用方法与下载
2007/07/02 Javascript
一些常用的JS功能函数(2009-06-04更新)
2009/06/04 Javascript
通过隐藏option实现select的联动效果
2009/11/10 Javascript
nodejs入门详解(多篇文章结合)
2012/03/07 NodeJs
js 阻止子元素响应父元素的onmouseout事件具体实现
2013/12/23 Javascript
LABjs、RequireJS、SeaJS的区别
2014/03/04 Javascript
JS输入用户名自动显示邮箱后缀列表的方法
2015/01/27 Javascript
JavaScript几种数组去掉重复值的方法推荐
2016/04/12 Javascript
下一代Bootstrap的5个特点 超酷炫!
2016/06/17 Javascript
JavaScript中获取时间的函数集
2016/08/16 Javascript
JavaScript面试题大全(推荐)
2016/09/22 Javascript
Vue.js常用指令汇总(v-if、v-for等)
2016/11/03 Javascript
基于vue-element组件实现音乐播放器功能
2018/05/06 Javascript
微信小程序用户位置权限的获取方法(拒绝后提醒)
2018/11/15 Javascript
JavaScript制作3D旋转相册
2020/08/02 Javascript
CKEditor扩展插件:自动排版功能autoformat插件实现方法详解
2020/02/06 Javascript
详解Swift中属性的声明与作用
2016/06/30 Python
Python中Django发送带图片和附件的邮件
2017/03/31 Python
浅谈Python 的枚举 Enum
2017/06/12 Python
python3 tkinter实现点击一个按钮跳出另一个窗口的方法
2019/06/13 Python
python turtle库画一个方格和圆实例
2019/06/27 Python
python实现复制大量文件功能
2019/08/31 Python
python爬虫 Pyppeteer使用方法解析
2019/09/28 Python
Python日志器使用方法及原理解析
2020/09/27 Python
Python数据模型与Python对象模型的相关总结
2021/01/26 Python
谈谈对css属性box-sizing的了解
2017/01/04 HTML / CSS
策划总监岗位职责
2014/02/16 职场文书
字典算法实现及操作 --python(实用)
2021/03/31 Python
详解CSS玩转图片Base64编码
2021/05/25 HTML / CSS
使用Python获取字典键对应值的方法
2022/04/26 Python