Python爬虫爬取一个网页上的图片地址实例代码


Posted in Python onJanuary 16, 2018

本文实例主要是实现爬取一个网页上的图片地址,具体如下。

读取一个网页的源代码:

import urllib.request
def getHtml(url):
  html=urllib.request.urlopen(url).read()
  return html
print(getHtml(http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip))

利用正则表达式爬取一个网页上的图片地址:

import re
import urllib.request
def getHtml(url):
  html=urllib.request.urlopen(url).read()
  return html
def getImg(html):
  r=r'"thumbURL":"(http://img.+?\.jpg)"' #定义正则
  imglist=re.findall(r,html)
  return imglist
html=str(getHtml("http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip"))
print(getImg(html))

运行结果:

Python爬虫爬取一个网页上的图片地址实例代码

总结

以上就是本文关于Python爬虫爬取一个网页上的图片地址实例代码的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
python实现系统状态监测和故障转移实例方法
Nov 18 Python
Python中文件操作简明介绍
Apr 13 Python
Python脚本获取操作系统版本信息
Dec 17 Python
Python图片转换成矩阵,矩阵数据转换成图片的实例
Jul 02 Python
python中ASCII码字符与int之间的转换方法
Jul 09 Python
Python3 获取一大段文本之间两个关键字之间的内容方法
Oct 11 Python
Ubuntu18.04中Python2.7与Python3.6环境切换
Jun 14 Python
使用python爬取微博数据打造一颗“心”
Jun 28 Python
django使用admin站点上传图片的实例
Jul 28 Python
python全局变量引用与修改过程解析
Jan 07 Python
Python环境管理virtualenv&virtualenvwrapper的配置详解
Jul 01 Python
使用Python+Appuim 清理微信的方法
Jan 26 Python
Python+Turtle动态绘制一棵树实例分享
Jan 16 #Python
Python实现七彩蟒蛇绘制实例代码
Jan 16 #Python
答题辅助python代码实现
Jan 16 #Python
python实现百万答题自动百度搜索答案
Jan 16 #Python
Python数据结构之双向链表的定义与使用方法示例
Jan 16 #Python
python+pillow绘制矩阵盖尔圆简单实例
Jan 16 #Python
Python面向对象编程之继承与多态详解
Jan 16 #Python
You might like
Zend Framework动作控制器用法示例
2016/12/09 PHP
javascript中的prototype属性实例分析说明
2010/08/09 Javascript
js不完美解决click和dblclick事件冲突问题
2012/07/16 Javascript
JQuery 图片滚动轮播示例代码
2014/03/24 Javascript
jquery+css实现绚丽的横向二级下拉菜单-附源码下载
2015/08/23 Javascript
JavaScript实现算术平方根算法-代码超简单
2015/09/11 Javascript
JavaScript文本框脚本编写的注意事项
2016/01/25 Javascript
基于jQuery的Web上传插件Uploadify使用示例
2016/05/19 Javascript
jQuery ajax全局函数处理session过期后的ajax跳转问题
2016/06/03 Javascript
jQuery 生成svg矢量二维码
2016/08/09 Javascript
从零开始学习Node.js系列教程六:EventEmitter发送和接收事件的方法示例
2017/04/13 Javascript
基于jQuery的表单填充实例
2017/08/22 jQuery
vue--点击当前增加class,其他删除class的方法
2018/09/15 Javascript
推荐15个最好用的JavaScript代码压缩工具
2019/02/13 Javascript
ES6 Promise对象的含义和基本用法分析
2019/06/14 Javascript
vue监听用户输入和点击功能
2019/09/27 Javascript
深入剖析Python的爬虫框架Scrapy的结构与运作流程
2016/01/20 Python
python实现获取Ip归属地等信息
2016/08/27 Python
如何用itertools解决无序排列组合的问题
2017/05/18 Python
利用selenium 3.7和python3添加cookie模拟登陆的实现
2017/11/20 Python
pandas使用apply多列生成一列数据的实例
2018/11/28 Python
python通过ffmgep从视频中抽帧的方法
2018/12/05 Python
python应用Axes3D绘图(批量梯度下降算法)
2020/03/25 Python
CSS超出文本指定宽度用省略号代替和文本不换行
2016/05/05 HTML / CSS
域名注册、建站工具、网页主机、SSL证书:Dynadot
2017/01/06 全球购物
拉斯维加斯城市观光通行证:Las Vegas Pass
2019/05/21 全球购物
科颜氏法国官网:Kiehl’s法国
2019/08/20 全球购物
JAVA代码查错题
2014/10/10 面试题
中间件的定义
2016/08/09 面试题
宾馆总经理岗位职责
2014/02/14 职场文书
保护环境的建议书
2014/03/12 职场文书
岗位明星事迹材料
2014/05/18 职场文书
离职报告格式
2014/11/04 职场文书
大学生求职意向书
2015/05/11 职场文书
管理者日常工作必备:22条企业管理流程模板!
2019/07/12 职场文书
win10+RTX3050ti+TensorFlow+cudn+cudnn配置深度学习环境的方法
2022/06/25 Servers