python抓取网页中链接的静态图片


Posted in Python onJanuary 29, 2018

本文实例为大家分享了python抓取网页中链接的静态图片的具体代码,供大家参考,具体内容如下

# -*- coding:utf-8 -*- 
 
#http://tieba.baidu.com/p/2460150866 
#抓取图片地址 
 
from bs4 import BeautifulSoup 
import urllib.request 
from time import sleep 
 
html_doc = "http://tieba.baidu.com/p/2460150866" 
 
def get_image(url): 
 req = urllib.request.Request(url) 
 webpage = urllib.request.urlopen(req) 
 
 html = webpage.read() 
 soup = BeautifulSoup(html, 'html.parser') 
 
 #抓取图片地址 
 #抓取img标签且class为BDE_Image的所有内容 
 img_src=soup.findAll("img",{'class':'BDE_Image'}) 
 i = 1 
 for img in img_src: 
  img_url = img.get('src') #抓取src 
 # print(img) 
  req = urllib.request.Request(img_url) 
  u = urllib.request.urlopen(req) 
  data = u.read() 
  with open("AutoCodePng20180119-"+str(i)+".jpg", 'wb') as f: 
   sleep(2) 
   f.write(data) 
   i += 1 
 
def getImg(url): 
 html = urllib.request(url) 
 page = html.read() 
 soup = BeautifulSoup(page, "html.parser") 
 imglist = soup.find_all('img') #发现html中带img标签的数据,输出格式为<img xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx,存入集合 
 lenth = len(imglist) #计算集合的个数 
 for i in range(lenth): 
  print imglist[i].attrs['src'] #抓取img中属性为src的信息,例如<img src="123456" xxxxxxxxxxxxxxxx,则输出为123456

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用python分割TXT文件成4K的TXT文件
May 23 Python
Python正则表达式非贪婪、多行匹配功能示例
Aug 08 Python
Python数据分析之双色球统计单个红和蓝球哪个比例高的方法
Feb 03 Python
利用Python写一个爬妹子的爬虫
Jun 08 Python
详解TensorFlow查看ckpt中变量的几种方法
Jun 19 Python
浅谈django2.0 ForeignKey参数的变化
Aug 06 Python
python输出决策树图形的例子
Aug 09 Python
Python通过Manager方式实现多个无关联进程共享数据的实现
Nov 07 Python
Python实现从N个数中找到最大的K个数
Apr 02 Python
Python使用sqlite3模块内置数据库
May 07 Python
django在开发中取消外键约束的实现
May 20 Python
Python xmltodict模块安装及代码实例
Oct 05 Python
Python实现识别手写数字 Python图片读入与处理
Mar 23 #Python
Python实现PS滤镜特效Marble Filter玻璃条纹扭曲效果示例
Jan 29 #Python
Python实现识别手写数字大纲
Jan 29 #Python
django文档学习之applications使用详解
Jan 29 #Python
Python实现PS滤镜Fish lens图像扭曲效果示例
Jan 29 #Python
python实现识别手写数字 python图像识别算法
Mar 23 #Python
Python实现简易版的Web服务器(推荐)
Jan 29 #Python
You might like
博士208HAF收音机实习报告
2021/03/02 无线电
适用于php-5.2 的 php.ini 中文版[金步国翻译]
2011/04/17 PHP
php 生成文字png图片的代码
2011/04/17 PHP
php设计模式 FlyWeight (享元模式)
2011/06/26 PHP
php定时计划任务的实现方法详解
2013/06/06 PHP
destoon安全设置中需要设置可写权限的目录及文件
2014/06/21 PHP
CI框架整合smarty步骤详解
2016/05/19 PHP
PHP 实现文件压缩解压操作的方法
2019/06/14 PHP
使用jQuery操作Cookies的实现代码
2011/10/09 Javascript
jQuery随便控制任意div隐藏的方法
2013/06/28 Javascript
js中的push和join方法使用介绍
2013/10/08 Javascript
jquery实现弹出div,始终显示在屏幕正中间的简单实例
2014/03/08 Javascript
jQuery实现文本框邮箱输入自动补全效果
2015/11/17 Javascript
javascript实现九宫格相加数值相等
2020/05/28 Javascript
BootStrap栅格系统、表单样式与按钮样式源码解析
2017/01/20 Javascript
简单实现bootstrap导航效果
2017/02/07 Javascript
JavaScript实现移动端轮播效果
2017/06/06 Javascript
python实现进程间通信简单实例
2014/07/23 Python
Python实现的下载8000首儿歌的代码分享
2014/11/21 Python
Python判断文件和文件夹是否存在的方法
2015/05/21 Python
Python爬虫框架Scrapy实战之批量抓取招聘信息
2015/08/07 Python
Python验证文件是否可读写代码分享
2017/12/11 Python
numpy中的delete删除数组整行和整列的实例
2018/05/09 Python
python获取指定日期范围内的每一天,每个月,每季度的方法
2019/08/08 Python
在vscode中配置python环境过程解析
2019/09/28 Python
Python元组 tuple的概念与基本操作详解【定义、创建、访问、计数、推导式等】
2019/10/30 Python
Python urlopen()和urlretrieve()用法解析
2020/01/07 Python
详解Python中第三方库Faker
2020/09/25 Python
python中二分查找法的实现方法
2020/12/06 Python
python学习之使用Matplotlib画实时的动态折线图的示例代码
2021/02/25 Python
基于PyInstaller各参数的含义说明
2021/03/04 Python
Sephora丝芙兰菲律宾官方网站:购买化妆品和护肤品
2017/04/05 全球购物
设计模式的基本要素是什么
2014/04/21 面试题
Java Servlet API中forward() 与redirect()的区别
2014/04/20 面试题
员工培训邀请函
2014/02/02 职场文书
委托书英文
2015/01/28 职场文书