python抓取网页中链接的静态图片


Posted in Python onJanuary 29, 2018

本文实例为大家分享了python抓取网页中链接的静态图片的具体代码,供大家参考,具体内容如下

# -*- coding:utf-8 -*- 
 
#http://tieba.baidu.com/p/2460150866 
#抓取图片地址 
 
from bs4 import BeautifulSoup 
import urllib.request 
from time import sleep 
 
html_doc = "http://tieba.baidu.com/p/2460150866" 
 
def get_image(url): 
 req = urllib.request.Request(url) 
 webpage = urllib.request.urlopen(req) 
 
 html = webpage.read() 
 soup = BeautifulSoup(html, 'html.parser') 
 
 #抓取图片地址 
 #抓取img标签且class为BDE_Image的所有内容 
 img_src=soup.findAll("img",{'class':'BDE_Image'}) 
 i = 1 
 for img in img_src: 
  img_url = img.get('src') #抓取src 
 # print(img) 
  req = urllib.request.Request(img_url) 
  u = urllib.request.urlopen(req) 
  data = u.read() 
  with open("AutoCodePng20180119-"+str(i)+".jpg", 'wb') as f: 
   sleep(2) 
   f.write(data) 
   i += 1 
 
def getImg(url): 
 html = urllib.request(url) 
 page = html.read() 
 soup = BeautifulSoup(page, "html.parser") 
 imglist = soup.find_all('img') #发现html中带img标签的数据,输出格式为<img xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx,存入集合 
 lenth = len(imglist) #计算集合的个数 
 for i in range(lenth): 
  print imglist[i].attrs['src'] #抓取img中属性为src的信息,例如<img src="123456" xxxxxxxxxxxxxxxx,则输出为123456

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python搜索指定目录的方法
Apr 29 Python
python的Tqdm模块的使用
Jan 10 Python
Python多图片合并PDF的方法
Jan 03 Python
python实现文件助手中查看微信撤回消息
Apr 29 Python
python实现美团订单推送到测试环境,提供便利操作示例
Aug 09 Python
python pygame实现球球大作战
Nov 25 Python
selenium+python实现自动登陆QQ邮箱并发送邮件功能
Dec 13 Python
Python拼接字符串的7种方式详解
Mar 19 Python
Python figure参数及subplot子图绘制代码
Apr 18 Python
django教程如何自学
Jul 31 Python
Python实现我的世界小游戏源代码
Mar 02 Python
django 认证类配置实现
Nov 11 Python
Python实现识别手写数字 Python图片读入与处理
Mar 23 #Python
Python实现PS滤镜特效Marble Filter玻璃条纹扭曲效果示例
Jan 29 #Python
Python实现识别手写数字大纲
Jan 29 #Python
django文档学习之applications使用详解
Jan 29 #Python
Python实现PS滤镜Fish lens图像扭曲效果示例
Jan 29 #Python
python实现识别手写数字 python图像识别算法
Mar 23 #Python
Python实现简易版的Web服务器(推荐)
Jan 29 #Python
You might like
在线短消息收发的程序,不用数据库
2006/10/09 PHP
使用Xdebug调试和优化PHP程序之[1]
2007/04/17 PHP
PHP 数组实例说明
2008/08/18 PHP
PHP+ACCESS 文章管理程序代码
2010/06/21 PHP
PHP自动识别字符集并完成转码详解
2013/08/02 PHP
Json_decode 解析json字符串为NULL的解决方法(必看)
2017/02/17 PHP
jquery 学习笔记一
2010/04/07 Javascript
基于jquery实现的服务器验证控件的启用和禁用代码
2010/04/27 Javascript
javascript中bind函数的作用实例介绍
2014/09/28 Javascript
jQuery实现购物车计算价格功能的方法
2015/03/25 Javascript
jQuery插件Elastislide实现响应式的焦点图无缝滚动切换特效
2015/04/12 Javascript
基于jQuery滑动杆实现购买日期选择效果
2015/09/15 Javascript
非常实用的12个jquery代码片段
2015/11/02 Javascript
jQuery实现鼠标经过像翻页和描点链接效果
2016/08/08 Javascript
Node.js与MySQL交互操作及其注意事项
2016/10/05 Javascript
详解angularJS动态生成的页面中ng-click无效解决办法
2017/06/19 Javascript
js实现图片上传预览原理分析
2017/07/13 Javascript
react-native android状态栏的实现
2018/06/15 Javascript
JS逻辑运算符短路操作实例分析
2018/07/09 Javascript
nodejs异步编程基础之回调函数用法分析
2018/12/26 NodeJs
JS查找孩子节点简单示例
2019/07/25 Javascript
Python中使用Flask、MongoDB搭建简易图片服务器
2015/02/04 Python
Python常用小技巧总结
2015/06/01 Python
Python中使用bidict模块双向字典结构的奇技淫巧
2016/07/12 Python
numpy中以文本的方式存储以及读取数据方法
2018/06/04 Python
解决pip install的时候报错timed out的问题
2018/06/12 Python
python实现根据指定字符截取对应的行的内容方法
2018/10/23 Python
HTML5中使用json对象的实例代码
2018/09/10 HTML / CSS
美国折衷生活方式品牌:Robert Graham
2018/07/13 全球购物
10条PHP编程习惯
2014/05/26 面试题
森林防火工作方案
2014/02/14 职场文书
大一新生学期自我评价
2014/04/09 职场文书
中秋节活动总结
2014/08/29 职场文书
2014年工人工作总结
2014/11/25 职场文书
人口与计划生育责任书
2015/05/09 职场文书
2015年卫生院健康教育工作总结
2015/07/24 职场文书