Python爬虫爬取一个网页上的图片地址实例代码


Posted in Python onJanuary 16, 2018

本文实例主要是实现爬取一个网页上的图片地址,具体如下。

读取一个网页的源代码:

import urllib.request
def getHtml(url):
  html=urllib.request.urlopen(url).read()
  return html
print(getHtml(http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip))

利用正则表达式爬取一个网页上的图片地址:

import re
import urllib.request
def getHtml(url):
  html=urllib.request.urlopen(url).read()
  return html
def getImg(html):
  r=r'"thumbURL":"(http://img.+?\.jpg)"' #定义正则
  imglist=re.findall(r,html)
  return imglist
html=str(getHtml("http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip"))
print(getImg(html))

运行结果:

Python爬虫爬取一个网页上的图片地址实例代码

总结

以上就是本文关于Python爬虫爬取一个网页上的图片地址实例代码的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
python设置检查点简单实现代码
Jul 01 Python
Python工程师面试题 与Python Web相关
Jan 14 Python
python实现百万答题自动百度搜索答案
Jan 16 Python
pandas 获取季度,月度,年度首尾日期的方法
Apr 11 Python
解决tensorflow测试模型时NotFoundError错误的问题
Jul 27 Python
Python实现简单查找最长子串功能示例
Feb 26 Python
了解不常见但是实用的Python技巧
May 23 Python
Python 保持登录状态进行接口测试的方法示例
Aug 06 Python
下载官网python并安装的步骤详解
Oct 12 Python
python中的Elasticsearch操作汇总
Oct 30 Python
python的sys.path模块路径添加方式
Mar 09 Python
简单介绍一下pyinstaller打包以及安全性的实现
Jun 02 Python
Python+Turtle动态绘制一棵树实例分享
Jan 16 #Python
Python实现七彩蟒蛇绘制实例代码
Jan 16 #Python
答题辅助python代码实现
Jan 16 #Python
python实现百万答题自动百度搜索答案
Jan 16 #Python
Python数据结构之双向链表的定义与使用方法示例
Jan 16 #Python
python+pillow绘制矩阵盖尔圆简单实例
Jan 16 #Python
Python面向对象编程之继承与多态详解
Jan 16 #Python
You might like
PHP curl 抓取AJAX异步内容示例
2014/09/09 PHP
PHP获取HTTP body内容的方法
2018/12/31 PHP
javascript中html字符串转化为jquery dom对象的方法
2015/08/27 Javascript
Node.js重新刷新session过期时间的方法
2016/02/04 Javascript
js事件冒泡、事件捕获和阻止默认事件详解
2016/08/04 Javascript
JS给swf传参数的实现方法
2016/09/13 Javascript
Vue.js创建Calendar日历效果
2016/11/03 Javascript
Angular.js实现注册系统的实例详解
2016/12/18 Javascript
理解AngularJs篇:30分钟快速掌握AngularJs
2016/12/23 Javascript
jquery仿ps颜色拾取功能
2017/03/08 Javascript
js实现图片加载淡入淡出效果
2017/04/07 Javascript
深入理解vue-loader如何使用
2017/06/06 Javascript
jquery实现一个全局计时器(商城可用)
2017/06/30 jQuery
Webpack devServer中的 proxy 实现跨域的解决
2018/06/15 Javascript
Electron+vue从零开始打造一个本地播放器的方法示例
2020/10/27 Javascript
Python编程修改MP3文件名称的方法
2017/04/19 Python
Python基于plotly模块实现的画图操作示例
2019/01/23 Python
Python面向对象程序设计构造函数和析构函数用法分析
2019/04/12 Python
在python tkinter中Canvas实现进度条显示的方法
2019/06/14 Python
python解析xml文件方式(解析、更新、写入)
2020/03/05 Python
python使用OpenCV模块实现图像的融合示例代码
2020/04/10 Python
Python 代码调试技巧示例代码
2020/08/11 Python
基于python实现图片转字符画代码实例
2020/09/04 Python
python3中确保枚举值代码分析
2020/12/02 Python
手把手教你实现一个canvas智绘画板的方法
2019/03/04 HTML / CSS
STUBHUB日本:购买和出售全球活动门票
2018/07/01 全球购物
Molton Brown美国官网:奢华美容、香水、沐浴和身体护理
2020/09/02 全球购物
省委召开党的群众路线教育实践活动总结大会报告
2014/10/21 职场文书
2014年图书室工作总结
2014/12/09 职场文书
家长学校教学计划
2015/01/19 职场文书
2015年打非治违工作总结
2015/04/02 职场文书
消防演习通知
2015/04/25 职场文书
护士爱岗敬业心得体会
2016/01/25 职场文书
使用Oracle跟踪文件的问题详解
2021/06/28 Oracle
十大最帅动漫男主 碓冰拓海上榜,第一是《灌篮高手》男主角
2022/03/18 日漫
 Redis 串行生成顺序编码的方法实现
2022/04/03 Redis