python抓取网页中链接的静态图片


Posted in Python onJanuary 29, 2018

本文实例为大家分享了python抓取网页中链接的静态图片的具体代码,供大家参考,具体内容如下

# -*- coding:utf-8 -*- 
 
#http://tieba.baidu.com/p/2460150866 
#抓取图片地址 
 
from bs4 import BeautifulSoup 
import urllib.request 
from time import sleep 
 
html_doc = "http://tieba.baidu.com/p/2460150866" 
 
def get_image(url): 
 req = urllib.request.Request(url) 
 webpage = urllib.request.urlopen(req) 
 
 html = webpage.read() 
 soup = BeautifulSoup(html, 'html.parser') 
 
 #抓取图片地址 
 #抓取img标签且class为BDE_Image的所有内容 
 img_src=soup.findAll("img",{'class':'BDE_Image'}) 
 i = 1 
 for img in img_src: 
  img_url = img.get('src') #抓取src 
 # print(img) 
  req = urllib.request.Request(img_url) 
  u = urllib.request.urlopen(req) 
  data = u.read() 
  with open("AutoCodePng20180119-"+str(i)+".jpg", 'wb') as f: 
   sleep(2) 
   f.write(data) 
   i += 1 
 
def getImg(url): 
 html = urllib.request(url) 
 page = html.read() 
 soup = BeautifulSoup(page, "html.parser") 
 imglist = soup.find_all('img') #发现html中带img标签的数据,输出格式为<img xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx,存入集合 
 lenth = len(imglist) #计算集合的个数 
 for i in range(lenth): 
  print imglist[i].attrs['src'] #抓取img中属性为src的信息,例如<img src="123456" xxxxxxxxxxxxxxxx,则输出为123456

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python自动调用IE打开某个网站的方法
Jun 03 Python
Python中asyncore异步模块的用法及实现httpclient的实例
Jun 28 Python
python+mongodb数据抓取详细介绍
Oct 25 Python
python 搭建简单的http server,可直接post文件的实例
Jan 03 Python
python+numpy实现的基本矩阵操作示例
Jul 19 Python
Python socket实现的文件下载器功能示例
Nov 15 Python
使用python创建生成动态链接库dll的方法
May 09 Python
解决pycharm导入本地py文件时,模块下方出现红色波浪线的问题
Jun 01 Python
sklearn线性逻辑回归和非线性逻辑回归的实现
Jun 09 Python
Python Excel vlookup函数实现过程解析
Jun 22 Python
读取nii或nii.gz文件中的信息即输出图像操作
Jul 01 Python
python爬虫用mongodb的理由
Jul 28 Python
Python实现识别手写数字 Python图片读入与处理
Mar 23 #Python
Python实现PS滤镜特效Marble Filter玻璃条纹扭曲效果示例
Jan 29 #Python
Python实现识别手写数字大纲
Jan 29 #Python
django文档学习之applications使用详解
Jan 29 #Python
Python实现PS滤镜Fish lens图像扭曲效果示例
Jan 29 #Python
python实现识别手写数字 python图像识别算法
Mar 23 #Python
Python实现简易版的Web服务器(推荐)
Jan 29 #Python
You might like
php 文件上传系统手记
2009/10/26 PHP
php实现和c#一致的DES加密解密实例
2017/07/24 PHP
YII2框架中actions的作用与使用方法示例
2020/03/13 PHP
js资料prototype 属性
2007/03/13 Javascript
网页源代码保护(禁止右键、复制、另存为、查看源文件)
2012/05/23 Javascript
如何阻止复制剪切和粘贴事件为了表单内容的安全
2013/05/23 Javascript
jquery异步跨域访问代码
2013/06/28 Javascript
用NodeJS实现批量查询地理位置的经纬度接口
2016/08/16 NodeJs
详解Vue2+Echarts实现多种图表数据可视化Dashboard(附源码)
2017/03/21 Javascript
layui弹出层效果实现代码
2017/05/19 Javascript
vue2.0 如何把子组件的数据传给父组件(推荐)
2018/01/15 Javascript
vue router 源码概览案例分析
2018/10/09 Javascript
jQuery实现的简单歌词滚动功能示例
2019/01/07 jQuery
JavaScript正则表达式验证登录实例
2020/03/18 Javascript
vue实现购物车的小练习
2020/12/21 Vue.js
[34:44]Liquid vs TNC Supermajor 胜者组 BO3 第二场 6.4
2018/06/05 DOTA
在Python中使用matplotlib模块绘制数据图的示例
2015/05/04 Python
python在文本开头插入一行的实例
2018/05/02 Python
pandas值替换方法
2018/07/10 Python
python 遍历目录(包括子目录)下所有文件的实例
2018/07/11 Python
python制作简单五子棋游戏
2019/06/18 Python
详解Python打包分发工具setuptools
2019/08/05 Python
Python利用matplotlib绘制约数个数统计图示例
2019/11/26 Python
Python使用QQ邮箱发送邮件报错smtplib.SMTPAuthenticationError
2019/12/20 Python
Python可以实现栈的结构吗
2020/05/27 Python
Kenneth Cole官网:纽约时尚优雅品牌
2016/11/14 全球购物
欧铁通票官方在线销售网站:Eurail.com
2017/10/14 全球购物
Currentbody澳大利亚:美容仪专家
2019/11/11 全球购物
物业公司采购员岗位职责
2013/12/31 职场文书
有关打架的检讨书
2014/01/25 职场文书
群教个人对照检查材料
2014/08/20 职场文书
房屋租赁协议书
2014/10/18 职场文书
2015年药店工作总结
2015/04/20 职场文书
python使用pymysql模块操作MySQL
2021/06/16 Python
python中的3种定义类方法
2021/11/27 Python
斗罗大陆八大特殊魂兽,龙族始祖排榜首,第五最残忍(翠魔鸟)
2022/03/18 国漫