python抓取网页中链接的静态图片


Posted in Python onJanuary 29, 2018

本文实例为大家分享了python抓取网页中链接的静态图片的具体代码,供大家参考,具体内容如下

# -*- coding:utf-8 -*- 
 
#http://tieba.baidu.com/p/2460150866 
#抓取图片地址 
 
from bs4 import BeautifulSoup 
import urllib.request 
from time import sleep 
 
html_doc = "http://tieba.baidu.com/p/2460150866" 
 
def get_image(url): 
 req = urllib.request.Request(url) 
 webpage = urllib.request.urlopen(req) 
 
 html = webpage.read() 
 soup = BeautifulSoup(html, 'html.parser') 
 
 #抓取图片地址 
 #抓取img标签且class为BDE_Image的所有内容 
 img_src=soup.findAll("img",{'class':'BDE_Image'}) 
 i = 1 
 for img in img_src: 
  img_url = img.get('src') #抓取src 
 # print(img) 
  req = urllib.request.Request(img_url) 
  u = urllib.request.urlopen(req) 
  data = u.read() 
  with open("AutoCodePng20180119-"+str(i)+".jpg", 'wb') as f: 
   sleep(2) 
   f.write(data) 
   i += 1 
 
def getImg(url): 
 html = urllib.request(url) 
 page = html.read() 
 soup = BeautifulSoup(page, "html.parser") 
 imglist = soup.find_all('img') #发现html中带img标签的数据,输出格式为<img xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx,存入集合 
 lenth = len(imglist) #计算集合的个数 
 for i in range(lenth): 
  print imglist[i].attrs['src'] #抓取img中属性为src的信息,例如<img src="123456" xxxxxxxxxxxxxxxx,则输出为123456

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python进阶篇之字典操作总结
Nov 16 Python
Python3编码问题 Unicode utf-8 bytes互转方法
Oct 26 Python
使用python3构建文件传输的方法
Feb 13 Python
Python3.5模块的定义、导入、优化操作图文详解
Apr 27 Python
python3中类的继承以及self和super的区别详解
Jun 26 Python
wxPython色环电阻计算器
Nov 18 Python
Python基本类型的连接组合和互相转换方式(13种)
Dec 16 Python
Django通用类视图实现忘记密码重置密码功能示例
Dec 17 Python
Python实现桌面翻译工具【新手必学】
Feb 12 Python
Python通过zookeeper实现分布式服务代码解析
Jul 22 Python
详解Python中第三方库Faker
Sep 25 Python
Python四款GUI图形界面库介绍
Jun 05 Python
Python实现识别手写数字 Python图片读入与处理
Mar 23 #Python
Python实现PS滤镜特效Marble Filter玻璃条纹扭曲效果示例
Jan 29 #Python
Python实现识别手写数字大纲
Jan 29 #Python
django文档学习之applications使用详解
Jan 29 #Python
Python实现PS滤镜Fish lens图像扭曲效果示例
Jan 29 #Python
python实现识别手写数字 python图像识别算法
Mar 23 #Python
Python实现简易版的Web服务器(推荐)
Jan 29 #Python
You might like
一条久听不愿放下的DIY森海MX500,三言两语话神奇
2021/03/02 无线电
真正面向对象编程:PHP5.01发布
2006/10/09 PHP
使用php重新实现PHP脚本引擎内置函数
2007/03/06 PHP
Android ProgressBar进度条和ProgressDialog进度框的展示DEMO
2013/06/19 PHP
PHP生成迅雷、快车、旋风等软件的下载链接代码实例
2014/05/12 PHP
php将access数据库转换到mysql数据库的方法
2014/12/24 PHP
NodeJS制作爬虫全过程(续)
2014/12/22 NodeJs
javascript实现全角转半角的方法
2016/01/23 Javascript
laypage分页控件使用实例详解
2016/05/19 Javascript
微信小程序 教程之小程序配置
2016/10/17 Javascript
利用Ionic2 + angular4实现一个地区选择组件
2017/07/27 Javascript
利用JQUERY实现多个AJAX请求等待的实例
2017/12/14 jQuery
详解Vue 多级组件透传新方法provide/inject
2018/05/09 Javascript
webpack4之SplitChunksPlugin使用指南
2018/06/12 Javascript
js正则取值的结果数组调试方法
2018/10/10 Javascript
vue拖拽组件使用方法详解
2018/12/01 Javascript
vue + element-ui的分页问题实现
2018/12/17 Javascript
Vue项目中ESlint规范示例代码
2019/07/04 Javascript
JS实现点击发送验证码 xx秒后重新发送功能
2019/07/30 Javascript
vscode中eslint插件的配置(prettier配置无效)
2019/09/10 Javascript
javascript中可能用得到的全部的排序算法
2020/03/05 Javascript
JavaScript实现切换多张图片
2021/01/27 Javascript
jquery实现广告上下滚动效果
2021/03/04 jQuery
Python CSV模块使用实例
2015/04/09 Python
python实现按行分割文件
2019/07/22 Python
python实现的config文件读写功能示例
2019/09/24 Python
Python GUI库PyQt5样式QSS子控件介绍
2020/02/25 Python
使用HTML和CSS3绘制基本卡通图案的示例分享
2015/11/06 HTML / CSS
英国蛋糕装饰用品一站式商店:Craft Company
2019/03/18 全球购物
英国马莎百货印度官网:Marks & Spencer印度
2020/10/08 全球购物
宿舍打麻将检讨书
2014/01/24 职场文书
六一儿童节演讲稿
2014/05/23 职场文书
ktv好的活动方案
2014/08/15 职场文书
python实现腾讯滑块验证码识别
2021/04/27 Python
Python序列化与反序列化相关知识总结
2021/06/08 Python
MySQL transaction事务安全示例讲解
2022/06/21 MySQL