利用Python2下载单张图片与爬取网页图片实例代码


Posted in Python onDecember 25, 2017

前言

一直想好好学习一下Python爬虫,之前断断续续的把Python基础学了一下,悲剧的是学的没有忘的快。只能再次拿出来滤了一遍,趁热打铁,通过实例来实践下,下面这篇文章主要介绍了关于Python2下载单张图片与爬取网页的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧。

一、需求分析

1、知道图片的url地址,将图片下载到本地。

2、知道网页地址,将图片列表中的图片全部下载到本地。

二、准备工作

1、开发系统:win7 64位。

2、开发环境:python2.7。

3、开发工具:PyCharm。

4、浏览器:Chrome。

三、操作步骤

A.知道图片的url地址,将图片下载到本地。

a1、打开Chrome,随意找到一个图片网站。

利用Python2下载单张图片与爬取网页图片实例代码

a2、打开开发者工具(f12键或者fn+f12键),选择第一张图片,可以看到它的src属性就是图片的地址,复制出来。

利用Python2下载单张图片与爬取网页图片实例代码

a3、编写代码。这里需要引用urllib库以及使用Python IO相关的知识。

# -*- coding:utf-8 -*
'''
知道图片地址,下载图片到本地
'''
import urllib
#图片url地址
url = 'http://p1.wmpic.me/article/2017/12/22/1513930326_ciDepIns_215x185.jpg'
#方法一
#获取图片数据
res = urllib.urlopen(url).read()
#文件要保存的路径名和文件名
path = "e:\dlimg\pic2.jpg"
#使用io写入图片
f = open(path , "wb")
f.write(res)
f.close()
#方法二
res2 = urllib.urlretrieve(url , 'e:\dlimg\pic3.jpg')

B.知道网页地址,将图片列表中的图片全部下载到本地。

b1、还是以上面的网页为爬取对象,在该网页下,图片列表中有30张照片,获取每张图片的src属性值,再来下载即可。

b2、利用BeautifulSoup解析网页,利用标签选择器获取每张图片的src属性值。

利用Python2下载单张图片与爬取网页图片实例代码

b3、编写代码。

# -*- coding: utf-8 -*-
import requests
import urllib
from bs4 import BeautifulSoup
url = 'http://www.wmpic.me/tupian/qingxin'
res = requests.get(url)
#使用BeautifulSoup解析网页
soup = BeautifulSoup(res.text , 'html.parser')
#通过标签选择器定位到图片位置(与css选择器差不多)
pic_list = soup.select('.item_box .post a img')
i = 0
for img_url in pic_list:
 #获取每个img标签的src属性
 url_list = img_url['src']
 #保存路径,后面是文件名
 save_path = 'E:\dlimg\\'+'downloadpic_'+str(i)+'.jpg'
 #解析图片,写入到本地
 pic_file = urllib.urlopen(url_list).read()
 f = open(save_path, "wb")
 f.write(pic_file)
 f.close()
 i = i+1

C.运行结果(红色框中pic2.jpg和pic3.jpg是A步骤运行结果,其余以downloadpic_*.jpg命名的图片是步骤B的运行结果)

利用Python2下载单张图片与爬取网页图片实例代码

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

Python 相关文章推荐
python输出指定月份日历的方法
Apr 23 Python
浅谈python为什么不需要三目运算符和switch
Jun 17 Python
判断网页编码的方法python版
Aug 12 Python
Python实现的HMacMD5加密算法示例
Apr 03 Python
Python利用splinter实现浏览器自动化操作方法
May 11 Python
Python实现的逻辑回归算法示例【附测试csv文件下载】
Dec 28 Python
深入浅析python3中的unicode和bytes问题
Jul 03 Python
Python 占位符的使用方法详解
Jul 10 Python
python Web flask 视图内容和模板实现代码
Aug 23 Python
Python绘制热力图示例
Sep 27 Python
django框架cookie和session用法实例详解
Dec 10 Python
PyQt5+Pycharm安装和配置图文教程详解
Mar 24 Python
Python实现生成随机数据插入mysql数据库的方法
Dec 25 #Python
python数据抓取分析的示例代码(python + mongodb)
Dec 25 #Python
Python实现生成随机日期字符串的方法示例
Dec 25 #Python
浅谈Python NLP入门教程
Dec 25 #Python
Python图形绘制操作之正弦曲线实现方法分析
Dec 25 #Python
关于Django显示时间你应该知道的一些问题
Dec 25 #Python
今天 平安夜 Python 送你一顶圣诞帽 @微信官方
Dec 25 #Python
You might like
c#中的实现php中的preg_replace
2009/12/21 PHP
php获取从百度搜索进入网站的关键词的详细代码
2014/01/08 PHP
关于php支持分块与断点续传文件下载功能代码
2014/05/09 PHP
PHP Hash算法:Times33算法代码实例
2015/05/13 PHP
PHP.ini安全配置检测工具pcc简单介绍
2015/07/02 PHP
php面向对象基础详解【星际争霸游戏案例】
2020/01/23 PHP
JavaScript 加号(+)运算符号
2009/12/06 Javascript
javascript验证上传文件的类型限制必须为某些格式
2013/11/14 Javascript
捕获和分析JavaScript Error的方法
2014/03/25 Javascript
Vue 框架之键盘事件、健值修饰符、双向数据绑定
2018/11/14 Javascript
Vue.js 使用v-cloak后仍显示变量的解决方法
2018/11/19 Javascript
7个好用的JavaScript技巧分享(译)
2019/05/07 Javascript
记一次用ts+vuecli4重构项目的实现
2020/05/21 Javascript
Python列表推导式、字典推导式与集合推导式用法实例分析
2018/02/07 Python
python爬虫获取多页天涯帖子
2018/02/23 Python
Python实现提取XML内容并保存到Excel中的方法
2018/09/01 Python
python爬取酷狗音乐排行榜
2019/02/20 Python
通过python3实现投票功能代码实例
2019/09/26 Python
JupyterNotebook 输出窗口的显示效果调整方法
2020/04/13 Python
python判断正负数方式
2020/06/03 Python
python 逆向爬虫正确调用 JAR 加密逻辑
2021/01/12 Python
WoolOvers澳洲官方网站:英国针织服装公司
2018/05/13 全球购物
联想西班牙官网:Lenovo西班牙
2018/08/28 全球购物
英国地毯卖家:The Rug Seller
2019/07/18 全球购物
税务专业毕业生自荐信
2013/11/10 职场文书
金融行业务员的自我评价
2013/12/13 职场文书
文秘档案管理岗位职责
2014/03/06 职场文书
医学生求职信
2014/07/01 职场文书
党章培训心得体会
2014/09/04 职场文书
2014年幼儿园国庆主题活动方案
2014/09/16 职场文书
2014年专项整治工作总结
2014/11/17 职场文书
毕业生自荐材料范文
2014/12/30 职场文书
浅谈Golang 嵌套 interface 的赋值问题
2021/04/29 Golang
MySQL悲观锁与乐观锁的实现方案
2021/11/02 MySQL
「海贼王」112.9万粉丝纪念图标公布
2022/03/21 日漫
Python 操作pdf pdfplumber读取PDF写入Exce
2022/08/14 Python