Python爬虫爬取一个网页上的图片地址实例代码


Posted in Python onJanuary 16, 2018

本文实例主要是实现爬取一个网页上的图片地址,具体如下。

读取一个网页的源代码:

import urllib.request
def getHtml(url):
  html=urllib.request.urlopen(url).read()
  return html
print(getHtml(http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip))

利用正则表达式爬取一个网页上的图片地址:

import re
import urllib.request
def getHtml(url):
  html=urllib.request.urlopen(url).read()
  return html
def getImg(html):
  r=r'"thumbURL":"(http://img.+?\.jpg)"' #定义正则
  imglist=re.findall(r,html)
  return imglist
html=str(getHtml("http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip"))
print(getImg(html))

运行结果:

Python爬虫爬取一个网页上的图片地址实例代码

总结

以上就是本文关于Python爬虫爬取一个网页上的图片地址实例代码的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
跟老齐学Python之print详解
Sep 28 Python
Python解析网页源代码中的115网盘链接实例
Sep 30 Python
Python常用随机数与随机字符串方法实例
Apr 09 Python
Python使用pickle模块存储数据报错解决示例代码
Jan 26 Python
Jacobi迭代算法的Python实现详解
Jun 29 Python
python基于递归解决背包问题详解
Jul 03 Python
python Django里CSRF 对应策略详解
Aug 05 Python
在Python中使用turtle绘制多个同心圆示例
Nov 23 Python
Python属性和内建属性实例解析
Jan 14 Python
Python pip安装模块提示错误解决方案
May 22 Python
Python自动创建Excel并获取内容
Sep 16 Python
健身房被搭讪?用python写了个小米计时器助人为乐
Jun 08 Python
Python+Turtle动态绘制一棵树实例分享
Jan 16 #Python
Python实现七彩蟒蛇绘制实例代码
Jan 16 #Python
答题辅助python代码实现
Jan 16 #Python
python实现百万答题自动百度搜索答案
Jan 16 #Python
Python数据结构之双向链表的定义与使用方法示例
Jan 16 #Python
python+pillow绘制矩阵盖尔圆简单实例
Jan 16 #Python
Python面向对象编程之继承与多态详解
Jan 16 #Python
You might like
大师制作的中短波矿石收音机
2020/04/02 无线电
php实现将字符串按照指定距离进行分割的方法
2015/03/14 PHP
php关闭warning问题的解决方法
2016/05/17 PHP
javascript之更有效率的字符串替换
2008/08/02 Javascript
checkbox勾选判断代码分析
2014/06/11 Javascript
node.js中的console.time方法使用说明
2014/12/09 Javascript
JavaScript编程中容易出BUG的几点小知识
2015/01/31 Javascript
jquery实现动态改变div宽度和高度
2015/05/08 Javascript
常用的Javascript数据验证插件
2015/08/04 Javascript
JavaScript jQuery 中定义数组与操作及jquery数组操作
2015/12/18 Javascript
JS基于正则截取替换特定字符之间字符串操作示例
2017/02/03 Javascript
AngularJs 最新验证手机号码的实例,成功测试通过
2017/11/26 Javascript
微信小程序之swiper轮播图中的图片自适应高度的方法
2018/04/23 Javascript
Webpack devServer中的 proxy 实现跨域的解决
2018/06/15 Javascript
详解node字体压缩插件font-spider的用法
2018/09/28 Javascript
Python json 错误xx is not JSON serializable解决办法
2017/03/15 Python
Python中标准库OS的常用方法总结大全
2017/07/19 Python
Python实现可获取网易页面所有文本信息的网易网络爬虫功能示例
2018/01/15 Python
python定时检测无响应进程并重启的实例代码
2019/04/22 Python
Pyqt5自适应布局实例
2019/12/13 Python
tensorflow实现将ckpt转pb文件的方法
2020/04/22 Python
Python爬虫新手入门之初学lxml库
2020/12/20 Python
Html5+JS实现手机摇一摇功能
2015/04/24 HTML / CSS
澳大利亚优质的家居用品和生活方式公司:Bed Bath N’ Table
2019/04/16 全球购物
函授毕业生的自我鉴定
2013/11/26 职场文书
医院护士的求职信
2014/01/03 职场文书
先进集体获奖感言
2014/02/13 职场文书
建筑公司员工自我鉴定
2014/04/08 职场文书
房产协议书范本2014
2014/09/30 职场文书
2015年消费者权益日活动总结
2015/02/09 职场文书
求职自荐信范文(优秀篇)
2015/03/27 职场文书
预备党员党支部意见
2015/06/02 职场文书
2016廉洁从政心得体会
2016/01/19 职场文书
大学生社区义工服务心得体会
2016/01/22 职场文书
CentOS8.4安装Redis6.2.6的详细过程
2021/11/20 Redis
mybatis源码解读之executor包语句处理功能
2022/02/15 Java/Android