Python爬虫爬取一个网页上的图片地址实例代码


Posted in Python onJanuary 16, 2018

本文实例主要是实现爬取一个网页上的图片地址,具体如下。

读取一个网页的源代码:

import urllib.request
def getHtml(url):
  html=urllib.request.urlopen(url).read()
  return html
print(getHtml(http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip))

利用正则表达式爬取一个网页上的图片地址:

import re
import urllib.request
def getHtml(url):
  html=urllib.request.urlopen(url).read()
  return html
def getImg(html):
  r=r'"thumbURL":"(http://img.+?\.jpg)"' #定义正则
  imglist=re.findall(r,html)
  return imglist
html=str(getHtml("http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip"))
print(getImg(html))

运行结果:

Python爬虫爬取一个网页上的图片地址实例代码

总结

以上就是本文关于Python爬虫爬取一个网页上的图片地址实例代码的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
Python的Flask框架中web表单的教程
Apr 20 Python
详解Python的Django框架中的Cookie相关处理
Jul 22 Python
解决python 输出是省略号的问题
Apr 19 Python
pytorch 转换矩阵的维数位置方法
Dec 08 Python
python的几种矩阵相乘的公式详解
Jul 10 Python
解决jupyter notebook打不开无反应 浏览器未启动的问题
Apr 10 Python
pycharm不以pytest方式运行,想要切换回普通模式运行的操作
Sep 01 Python
详解Pycharm安装及Django安装配置指南
Sep 15 Python
Python安装Bs4的多种方法
Nov 28 Python
matplotlib绘制鼠标的十字光标的实现(内置方式)
Jan 06 Python
python实战之一步一步教你绘制小猪佩奇
Apr 22 Python
python munch库的使用解析
May 25 Python
Python+Turtle动态绘制一棵树实例分享
Jan 16 #Python
Python实现七彩蟒蛇绘制实例代码
Jan 16 #Python
答题辅助python代码实现
Jan 16 #Python
python实现百万答题自动百度搜索答案
Jan 16 #Python
Python数据结构之双向链表的定义与使用方法示例
Jan 16 #Python
python+pillow绘制矩阵盖尔圆简单实例
Jan 16 #Python
Python面向对象编程之继承与多态详解
Jan 16 #Python
You might like
php IP及IP段进行访问限制的代码
2008/12/17 PHP
PHP对XML内容进行修改和删除实例代码
2016/10/26 PHP
Laravel中获取路由参数Route Parameters的五种方法示例
2017/09/29 PHP
Laravel框架实现超简单的分页效果示例
2019/02/08 PHP
prototype class详解
2006/09/07 Javascript
取选中的radio的值
2010/01/11 Javascript
JS+CSS实现Li列表隔行换色效果的方法
2015/02/16 Javascript
JavaScript动态添加style节点的方法
2015/06/09 Javascript
微信开发 js实现tabs选项卡效果
2016/10/28 Javascript
jQuery使用siblings获取某元素所有同辈(兄弟姐妹)元素用法示例
2017/01/30 Javascript
移动设备手势事件库Touch.js使用详解
2017/08/18 Javascript
angularjs实现猜数字大小功能
2020/05/20 Javascript
浅谈React中组件间抽象
2018/01/27 Javascript
小程序识别身份证,银行卡,营业执照,驾照的实现
2019/11/05 Javascript
js实现橱窗展示效果
2020/01/11 Javascript
[01:08:09]DOTA2上海特级锦标赛主赛事日 - 1 胜者组第一轮#1Liquid VS Alliance第二局
2016/03/02 DOTA
Python爬虫模拟登录带验证码网站
2016/01/22 Python
Python操作MySQL模拟银行转账
2018/03/12 Python
Python使用matplotlib和pandas实现的画图操作【经典示例】
2018/06/13 Python
详解pandas库pd.read_excel操作读取excel文件参数整理与实例
2019/02/17 Python
Python实现列表中非负数保留,负数转化为指定的数值方式
2020/06/04 Python
Python读取yaml文件的详细教程
2020/07/21 Python
Python 列表反转显示的四种方法
2020/11/16 Python
美国知名的家庭连锁百货商店:Boscov’s
2017/07/27 全球购物
泰坦健身器材:Titan Fitness
2018/02/13 全球购物
string = null 和string = ''的区别
2013/04/28 面试题
影视动画专业个人的自我评价
2013/12/31 职场文书
护士试用期自我鉴定
2014/02/08 职场文书
淘宝店铺营销方案
2014/02/13 职场文书
《新型玻璃》教学反思
2014/04/13 职场文书
2014年会策划方案
2014/05/11 职场文书
病媒生物防治方案
2014/05/13 职场文书
安全演讲稿开场白
2014/08/25 职场文书
大学生入党自传2015
2015/06/26 职场文书
有关花店创业的计划书模板
2019/08/27 职场文书
Nginx+SpringBoot实现负载均衡的示例
2021/03/31 Servers