python抓取网页中链接的静态图片


Posted in Python onJanuary 29, 2018

本文实例为大家分享了python抓取网页中链接的静态图片的具体代码,供大家参考,具体内容如下

# -*- coding:utf-8 -*- 
 
#http://tieba.baidu.com/p/2460150866 
#抓取图片地址 
 
from bs4 import BeautifulSoup 
import urllib.request 
from time import sleep 
 
html_doc = "http://tieba.baidu.com/p/2460150866" 
 
def get_image(url): 
 req = urllib.request.Request(url) 
 webpage = urllib.request.urlopen(req) 
 
 html = webpage.read() 
 soup = BeautifulSoup(html, 'html.parser') 
 
 #抓取图片地址 
 #抓取img标签且class为BDE_Image的所有内容 
 img_src=soup.findAll("img",{'class':'BDE_Image'}) 
 i = 1 
 for img in img_src: 
  img_url = img.get('src') #抓取src 
 # print(img) 
  req = urllib.request.Request(img_url) 
  u = urllib.request.urlopen(req) 
  data = u.read() 
  with open("AutoCodePng20180119-"+str(i)+".jpg", 'wb') as f: 
   sleep(2) 
   f.write(data) 
   i += 1 
 
def getImg(url): 
 html = urllib.request(url) 
 page = html.read() 
 soup = BeautifulSoup(page, "html.parser") 
 imglist = soup.find_all('img') #发现html中带img标签的数据,输出格式为<img xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx,存入集合 
 lenth = len(imglist) #计算集合的个数 
 for i in range(lenth): 
  print imglist[i].attrs['src'] #抓取img中属性为src的信息,例如<img src="123456" xxxxxxxxxxxxxxxx,则输出为123456

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python 统计代码行数简单实例
May 04 Python
详解python的ORM中Pony用法
Feb 09 Python
pandas 取出表中一列数据所有的值并转换为array类型的方法
Apr 11 Python
转换科学计数法的数值字符串为decimal类型的方法
Jul 16 Python
浅述python中深浅拷贝原理
Sep 18 Python
selenium python 实现基本自动化测试的示例代码
Feb 25 Python
Python K最近邻从原理到实现的方法
Aug 15 Python
numpy求平均值的维度设定的例子
Aug 24 Python
Python3实现zip分卷压缩过程解析
Oct 09 Python
基于python修改srt字幕的时间轴
Feb 03 Python
Python 如何操作 SQLite 数据库
Aug 17 Python
Python中文分词库jieba(结巴分词)详细使用介绍
Apr 07 Python
Python实现识别手写数字 Python图片读入与处理
Mar 23 #Python
Python实现PS滤镜特效Marble Filter玻璃条纹扭曲效果示例
Jan 29 #Python
Python实现识别手写数字大纲
Jan 29 #Python
django文档学习之applications使用详解
Jan 29 #Python
Python实现PS滤镜Fish lens图像扭曲效果示例
Jan 29 #Python
python实现识别手写数字 python图像识别算法
Mar 23 #Python
Python实现简易版的Web服务器(推荐)
Jan 29 #Python
You might like
提问的智慧(2)
2006/10/09 PHP
smarty的保留变量问题
2008/10/23 PHP
关于php程序报date()警告的处理(date_default_timezone_set)
2013/10/22 PHP
php实现有序数组旋转后寻找最小值方法
2018/09/27 PHP
基于laravel-admin 后台 列表标签背景的使用方法
2019/10/03 PHP
jQuery 写的简单打字游戏可以提示正确和错误的次数
2014/07/01 Javascript
javascript产生随机数方法汇总
2016/01/25 Javascript
jquery对Json的各种遍历方法总结(必看篇)
2016/09/29 Javascript
jQGrid Table操作列中点击【操作】按钮弹出按钮层的实现代码
2016/12/05 Javascript
鼠标点击input,显示瞬间的边框颜色,对之修改与隐藏实例
2016/12/26 Javascript
JS库之Three.js 简易入门教程(详解之一)
2017/09/13 Javascript
在Vue组件中使用 TypeScript的方法
2018/02/28 Javascript
webstorm中vue语法的支持详解
2018/05/09 Javascript
后台使用freeMarker和前端使用vue的方法及遇到的问题
2019/06/13 Javascript
微信小程序 WXML节点信息查询详解
2019/07/29 Javascript
解决antd Form 表单校验方法无响应的问题
2020/10/27 Javascript
js实现简单的轮播图效果
2020/12/13 Javascript
用实例分析Python中method的参数传递过程
2015/04/02 Python
python BeautifulSoup设置页面编码的方法
2015/04/03 Python
python文件操作相关知识点总结整理
2016/02/22 Python
python3学习之Splash的安装与实例教程
2018/07/09 Python
Python+OpenCV实现图像融合的原理及代码
2018/12/03 Python
pandas read_excel()和to_excel()函数解析
2019/09/19 Python
修改Pandas的行或列的名字(重命名)
2019/12/18 Python
HTML5 对各个标签的定义与规定:body的介绍
2012/06/21 HTML / CSS
美国葡萄酒网上商店:Martha Stewart Wine Co.
2019/03/17 全球购物
教师求职信范文分享
2013/12/27 职场文书
设计师个人求职信范文
2014/02/02 职场文书
战略合作意向书范本
2014/04/01 职场文书
超市商业计划书
2014/05/04 职场文书
法制宣传月活动方案
2014/05/11 职场文书
2014年国庆标语
2014/06/30 职场文书
工作态度不端正检讨书
2014/10/04 职场文书
党员批评与自我批评总结
2014/10/15 职场文书
办公室主任岗位职责范本
2015/03/31 职场文书
redis缓存存储Session原理机制
2021/11/20 Redis