python抓取网页中链接的静态图片


Posted in Python onJanuary 29, 2018

本文实例为大家分享了python抓取网页中链接的静态图片的具体代码,供大家参考,具体内容如下

# -*- coding:utf-8 -*- 
 
#http://tieba.baidu.com/p/2460150866 
#抓取图片地址 
 
from bs4 import BeautifulSoup 
import urllib.request 
from time import sleep 
 
html_doc = "http://tieba.baidu.com/p/2460150866" 
 
def get_image(url): 
 req = urllib.request.Request(url) 
 webpage = urllib.request.urlopen(req) 
 
 html = webpage.read() 
 soup = BeautifulSoup(html, 'html.parser') 
 
 #抓取图片地址 
 #抓取img标签且class为BDE_Image的所有内容 
 img_src=soup.findAll("img",{'class':'BDE_Image'}) 
 i = 1 
 for img in img_src: 
  img_url = img.get('src') #抓取src 
 # print(img) 
  req = urllib.request.Request(img_url) 
  u = urllib.request.urlopen(req) 
  data = u.read() 
  with open("AutoCodePng20180119-"+str(i)+".jpg", 'wb') as f: 
   sleep(2) 
   f.write(data) 
   i += 1 
 
def getImg(url): 
 html = urllib.request(url) 
 page = html.read() 
 soup = BeautifulSoup(page, "html.parser") 
 imglist = soup.find_all('img') #发现html中带img标签的数据,输出格式为<img xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx,存入集合 
 lenth = len(imglist) #计算集合的个数 
 for i in range(lenth): 
  print imglist[i].attrs['src'] #抓取img中属性为src的信息,例如<img src="123456" xxxxxxxxxxxxxxxx,则输出为123456

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现的彩票机选器实例
Jun 17 Python
详解Python实现按任意键继续/退出的功能
Aug 19 Python
Python首次安装后运行报错(0xc000007b)的解决方法
Oct 18 Python
python如何为创建大量实例节省内存
Mar 20 Python
Python SVM(支持向量机)实现方法完整示例
Jun 19 Python
Python面向对象基础入门之设置对象属性
Dec 11 Python
python pcm音频添加头转成Wav格式文件的方法
Jan 09 Python
Python调用scp向服务器上传文件示例
Dec 22 Python
python基于opencv实现人脸识别
Jan 04 Python
python中用Scrapy实现定时爬虫的实例讲解
Jan 18 Python
Python使用Kubernetes API访问集群
May 30 Python
pycharm代码删除恢复的方法
Jun 26 Python
Python实现识别手写数字 Python图片读入与处理
Mar 23 #Python
Python实现PS滤镜特效Marble Filter玻璃条纹扭曲效果示例
Jan 29 #Python
Python实现识别手写数字大纲
Jan 29 #Python
django文档学习之applications使用详解
Jan 29 #Python
Python实现PS滤镜Fish lens图像扭曲效果示例
Jan 29 #Python
python实现识别手写数字 python图像识别算法
Mar 23 #Python
Python实现简易版的Web服务器(推荐)
Jan 29 #Python
You might like
表格展示无限级分类(PHP版)
2012/08/21 PHP
解析在PHP中使用全局变量的几种方法
2013/06/24 PHP
php生成不重复随机数、数组的4种方法分享
2015/03/30 PHP
简单谈谈php中的unicode和utf8编码
2015/06/10 PHP
php数组比较实现查找连续数的方法
2015/07/29 PHP
浅析Yii2 gridview实现批量删除教程
2016/04/22 PHP
在 Laravel 项目中使用 webpack-encore的方法
2019/07/21 PHP
js Math 对象的方法
2013/09/01 Javascript
javascript比较两个日期的先后示例代码
2014/12/31 Javascript
js密码强度校验
2015/11/10 Javascript
微信小程序 使用picker封装省市区三级联动实例代码
2016/10/28 Javascript
jquery Easyui Datagrid实现批量操作(编辑,删除,添加)
2017/02/20 Javascript
vue-video-player 通过自定义按钮组件实现全屏切换效果【推荐】
2018/08/29 Javascript
在vue项目中使用Jquery-contextmenu插件的步骤讲解
2019/01/27 jQuery
基于layui内置模块(element常用元素的操作)
2019/09/20 Javascript
JS判断数组四种实现方法详解
2020/06/29 Javascript
linux 下实现python多版本安装实践
2014/11/18 Python
Python构造自定义方法来美化字典结构输出的示例
2016/06/16 Python
python版简单工厂模式
2017/10/16 Python
Python开启线程,在函数中开线程的实例
2019/02/22 Python
python threading和multiprocessing模块基本用法实例分析
2019/07/25 Python
Python换行与不换行的输出实例
2020/02/19 Python
Python 多线程共享变量的实现示例
2020/04/17 Python
详解python内置模块urllib
2020/09/09 Python
HTML5时代CSS设置漂亮字体取代图片
2014/09/04 HTML / CSS
使用 CSS3 中@media 实现网页自适应的示例代码
2020/03/24 HTML / CSS
BONIA官方网站:国际奢侈品牌和皮革专家
2016/11/27 全球购物
简述使用ftp进行文件传输时的两种登录方式?它们的区别是什么?常用的ftp文件传输命令是什么?
2016/11/20 面试题
医药营销个人求职信范文
2014/02/07 职场文书
用人单位终止解除劳动合同证明书
2014/10/06 职场文书
2014年城管工作总结
2014/11/20 职场文书
会议简讯范文
2015/07/20 职场文书
详解JVM系列之内存模型
2021/06/10 Javascript
Python人工智能之混合高斯模型运动目标检测详解分析
2021/11/07 Python
MySQL为数据表建立索引的原则详解
2022/03/03 MySQL
TV动画《史上最强大魔王转生为村民A》番宣CM公布
2022/04/01 日漫