Python爬虫爬取一个网页上的图片地址实例代码


Posted in Python onJanuary 16, 2018

本文实例主要是实现爬取一个网页上的图片地址,具体如下。

读取一个网页的源代码:

import urllib.request
def getHtml(url):
  html=urllib.request.urlopen(url).read()
  return html
print(getHtml(http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip))

利用正则表达式爬取一个网页上的图片地址:

import re
import urllib.request
def getHtml(url):
  html=urllib.request.urlopen(url).read()
  return html
def getImg(html):
  r=r'"thumbURL":"(http://img.+?\.jpg)"' #定义正则
  imglist=re.findall(r,html)
  return imglist
html=str(getHtml("http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip"))
print(getImg(html))

运行结果:

Python爬虫爬取一个网页上的图片地址实例代码

总结

以上就是本文关于Python爬虫爬取一个网页上的图片地址实例代码的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
跨平台python异步回调机制实现和使用方法
Nov 26 Python
Python兔子毒药问题实例分析
Mar 05 Python
python中Flask框架简单入门实例
Mar 21 Python
python简单猜数游戏实例
Jul 09 Python
numpy中的高维数组转置实例
Apr 17 Python
python判断字符串或者集合是否为空的实例
Jan 23 Python
Python使用matplotlib实现交换式图形显示功能示例
Sep 06 Python
Pandas 缺失数据处理的实现
Nov 04 Python
关于Tensorflow 模型持久化详解
Feb 12 Python
Python tempfile模块生成临时文件和临时目录
Sep 30 Python
plt.figure()参数使用详解及运行演示
Jan 08 Python
requests在python中发送请求的实例讲解
Feb 17 Python
Python+Turtle动态绘制一棵树实例分享
Jan 16 #Python
Python实现七彩蟒蛇绘制实例代码
Jan 16 #Python
答题辅助python代码实现
Jan 16 #Python
python实现百万答题自动百度搜索答案
Jan 16 #Python
Python数据结构之双向链表的定义与使用方法示例
Jan 16 #Python
python+pillow绘制矩阵盖尔圆简单实例
Jan 16 #Python
Python面向对象编程之继承与多态详解
Jan 16 #Python
You might like
php数组函数序列之array_values() 获取数组元素值的函数与方法
2011/10/30 PHP
Yii数据库缓存实例分析
2016/03/29 PHP
php 微信公众平台开发模式实现多客服的实例代码
2016/11/07 PHP
微信开发之php表单微信中自动提交两次问题解决办法
2017/01/08 PHP
php制作基于xml的RSS订阅源功能示例
2017/02/08 PHP
thinkphp下MySQL数据库读写分离代码剖析
2017/04/18 PHP
分享8个Laravel模型时间戳使用技巧小结
2020/02/12 PHP
网页和浏览器兼容性问题汇总(draft1)
2009/06/01 Javascript
jquery多浏览器捕捉回车事件代码
2010/06/22 Javascript
JavaScript 打地鼠游戏代码说明
2010/10/12 Javascript
Jquery中CSS选择器用法分析
2015/02/10 Javascript
AngularJS ng-template寄宿方式用法分析
2016/11/07 Javascript
JS正则RegExp.test()使用注意事项(不具有重复性)
2016/12/28 Javascript
js 原型对象和原型链理解
2017/02/09 Javascript
jQuery模拟淘宝购物车功能
2017/02/27 Javascript
angular.js+node.js实现下载图片处理详解
2017/03/31 Javascript
Vue.js手风琴菜单组件开发实例
2017/05/16 Javascript
bootstrap paginator分页前后台用法示例
2017/06/17 Javascript
Angular 4.0学习教程之架构详解
2017/09/12 Javascript
js 显示日期时间的实例(时间过一秒加1)
2017/10/25 Javascript
详解webpack中的hash、chunkhash、contenthash区别
2018/01/05 Javascript
微信小程序中上传图片并进行压缩的实现代码
2018/08/28 Javascript
vue interceptor 使用教程实例详解
2018/09/13 Javascript
vue动态绑定class选中当前列表变色的方法示例
2018/12/19 Javascript
基于mpvue小程序使用echarts画折线图的方法示例
2019/04/24 Javascript
koa2服务端使用jwt进行鉴权及路由权限分发的流程分析
2019/07/22 Javascript
TypeScript的安装、使用、自动编译的实现
2020/04/10 Javascript
[36:09]Secret vs VG 2019国际邀请赛淘汰赛 败者组 BO3 第一场 8.24
2019/09/10 DOTA
Python实用日期时间处理方法汇总
2015/05/09 Python
Python 利用scrapy爬虫通过短短50行代码下载整站短视频
2018/10/29 Python
python传到前端的数据,双引号被转义的问题
2020/04/03 Python
请解释接口的显式实现有什么意义
2012/05/26 面试题
大专生自我鉴定怎么写
2014/09/16 职场文书
2014年个人师德工作总结
2014/12/04 职场文书
你喜欢篮球吗?Python实现篮球游戏
2021/06/11 Python
动画电影《龙珠超 超级英雄》延期上映
2022/03/20 日漫