LRUCache的实现原理及利用python实现的方法


Posted in Python onNovember 21, 2017

简介

LRU(Least Recently Used)最近最少使用,最近有时间和空间最近的歧义,所以我更喜欢叫它近期最少使用算法。它的核心思想是,如果一个数据被访问过,我们有理由相信它在将来被访问的概率就越高。于是当LRU缓存达到设定的最大值时将缓存中近期最少使用的对象移除。LRUCache内部使用LinkedHashMap来存储key-value键值对,并将LinkedHashMap设置为访问顺序来体现LRU算法。

无论是对某个key的get,还是set都算做是对该key的一次使用。当set一个不存在的key,并且LRU Cache中key的数量超过cache size的时候,需要将使用时间距离现在最长的那个key从LRU Cache中清除。

LRU Cache实现

在Java中,LRUCache是通过LinkedHashMap实现的。鄙人照猫画虎,实现一个Python版的LRU Cache(可能和其他大神的实现有所区别)。

首先,需要说明的是:

LRU Cache对象内部会维护一个 双端循环链表 的 头节点

LRU Cache对象内部会维护一个dict

内部dict的value都是Entry对象,每个Entry对象包含:

  • key的hash_code(hash_code = hash(key),在本实现中,hash_code相同的不同key,会被当作一个key来处理。因此,对于自定义类,应该实现魔术方法:__hash__)
  • v - (key, value)对中的value
  • prev - 前一个对象
  • next - 后一个对象

具体实现是:

当从LRU Cache中get一个key的时候:

  • 计算该key的hash_code
  • 从内部dict中获取到entry
  • 将该entry移动到 双端循环链表 的 第一个位置
  • 返回entry.value

当向LRU Cache中set一个(key, value)对的时候:

计算该key的hash_code,

从LRU Cache的内部dict中,取出该hash_code对应的old_entry(可能不存在),然后根据(key, value)对生成一个new_entry,之后执行:

  • dict[hash_code] = new_entry
  • 将new_entry提到 双端循环链表 的第一个位置
  • 如果old_entry存在,则从链表中删除old_entry
  • 如果是新增了一个(key, value)对,并且cache中key的数量超过了cache size,那么将双端链表的最后一个元素删除(该元素就是那个最近最少被使用的元素),并且从内部dict中删除该元素

HashMap的实现原理

(面试过程中也经常会被问到):数组和链表组合成的链表散列结构,通过hash算法,尽量将数组中的数据分布均匀,如果hashcode相同再比较equals方法,如果equals方法返回false,那么就将数据以链表的形式存储在数组的对应位置,并将之前在该位置的数据往链表的后面移动,并记录一个next属性,来指示后移的那个数据。

注意:数组中保存的是entry(其中保存的是键值)

Python实现

class Entry:
 def __init__(self, hash_code, v, prev=None, next=None):
 self.hash_code = hash_code
 self.v = v
 self.prev = prev
 self.next = next

 def __str__(self):
 return "Entry{hash_code=%d, v=%s}" % (
  self.hash_code, self.v)
 __repr__ = __str__

class LRUCache:
 def __init__(self, max_size):
 self._max_size = max_size
 self._dict = dict()
 self._head = Entry(None, None)
 self._head.prev = self._head
 self._head.next = self._head

 def __setitem__(self, k, v):
 try:
  hash_code = hash(k)
 except TypeError:
  raise

 old_entry = self._dict.get(hash_code)
 new_entry = Entry(hash_code, v)
 self._dict[hash_code] = new_entry

 if old_entry:
  prev = old_entry.prev
  next = old_entry.next
  prev.next = next
  next.prev = prev

 head = self._head
 head_prev = self._head.prev
 head_next = self._head.next

 head.next = new_entry
 if head_prev is head:
  head.prev = new_entry
 head_next.prev = new_entry
 new_entry.prev = head
 new_entry.next = head_next

 if not old_entry and len(self._dict) > self._max_size:
  last_one = head.prev
  last_one.prev.next = head
  head.prev = last_one.prev
  self._dict.pop(last_one.hash_code)

 def __getitem__(self, k):
 entry = self._dict[hash(k)]
 head = self._head
 head_next = head.next
 prev = entry.prev
 next = entry.next

 if entry.prev is not head:
  if head.prev is entry:
  head.prev = prev
  head.next = entry

  head_next.prev = entry
  entry.prev = head
  entry.next = head_next

  prev.next = next
  next.prev = prev

 return entry.v

 def get_dict(self):
 return self._dict

if __name__ == "__main__":
 cache = LRUCache(2)
 inner_dict = cache.get_dict()

 cache[1] = 1
 assert inner_dict.keys() == [1], "test 1"
 cache[2] = 2
 assert sorted(inner_dict.keys()) == [1, 2], "test 2"
 cache[3] = 3
 assert sorted(inner_dict.keys()) == [2, 3], "test 3"
 cache[2]
 assert sorted(inner_dict.keys()) == [2, 3], "test 4"
 assert inner_dict[hash(2)].next.v == 3
 cache[4] = 4
 assert sorted(inner_dict.keys()) == [2, 4], "test 5"
 assert inner_dict[hash(4)].v == 4, "test 6"

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

Python 相关文章推荐
python获取文件版本信息、公司名和产品名的方法
Oct 05 Python
浅析Python基础-流程控制
Mar 18 Python
Python基于动态规划算法解决01背包问题实例
Dec 06 Python
TF-IDF与余弦相似性的应用(一) 自动提取关键词
Dec 21 Python
Python爬虫番外篇之Cookie和Session详解
Dec 27 Python
运用TensorFlow进行简单实现线性回归、梯度下降示例
Mar 05 Python
Python 2/3下处理cjk编码的zip文件的方法
Apr 26 Python
Python学习笔记之字符串和字符串方法实例详解
Aug 22 Python
Python数据处理篇之Sympy系列(五)---解方程
Oct 12 Python
python实现通过队列完成进程间的多任务功能示例
Oct 28 Python
python函数定义和调用过程详解
Feb 09 Python
pycharm部署django项目到云服务器的详细流程
Jun 29 Python
Python利用itchat对微信中好友数据实现简单分析的方法
Nov 21 #Python
python中is与双等于号“==”的区别示例详解
Nov 21 #Python
Python使用PIL模块生成随机验证码
Nov 21 #Python
Python3中条件控制、循环与函数的简易教程
Nov 21 #Python
Python3 循环语句(for、while、break、range等)
Nov 20 #Python
Python虚拟环境项目实例
Nov 20 #Python
Python插件virtualenv搭建虚拟环境
Nov 20 #Python
You might like
全国FM电台频率大全 - 11 浙江省
2020/03/11 无线电
php 定义404页面的实现代码
2012/11/19 PHP
关于Iframe如何跨域访问Cookie和Session的解决方法
2013/04/15 PHP
PHP与javascript实现变量交互的示例代码
2013/07/23 PHP
PHP 函数call_user_func和call_user_func_array用法详解
2014/03/02 PHP
php获得刚插入数据的id 的几种方法总结
2018/05/31 PHP
表单提交时自动复制内容到剪贴板的js代码
2007/03/16 Javascript
IE6下focus与blur错乱的解决方案
2011/07/31 Javascript
JS对文本框值的判断示例
2014/03/10 Javascript
jQuery中not()方法用法实例
2015/01/06 Javascript
JavaScript获取伪元素(Pseudo-Element)属性的方法技巧
2015/03/13 Javascript
JavaScript操作XML文件之XML读取方法
2015/06/09 Javascript
jQuery实现Email邮箱地址自动补全功能代码
2015/11/03 Javascript
Javascript获取图片原始宽度和高度的方法详解
2016/09/20 Javascript
jQuery autoComplete插件两种使用方式及动态改变参数值的方法详解
2016/10/24 Javascript
微信小程序  audio音频播放详解及实例
2016/11/02 Javascript
vue+webpack模拟后台数据的示例代码
2018/07/26 Javascript
vue组件挂载到全局方法的示例代码
2018/08/02 Javascript
vue-cli3 DllPlugin 提取公用库的方法
2019/04/24 Javascript
简单讲解Python中的字符串与字符串的输入输出
2016/03/13 Python
Python 文件处理注意事项总结
2017/04/10 Python
Python 2.7中文显示与处理方法
2018/07/16 Python
Django添加favicon.ico图标的示例代码
2018/08/07 Python
PyCharm鼠标右键不显示Run unittest的解决方法
2018/11/30 Python
基于tensorflow for循环 while循环案例
2020/06/30 Python
一篇文章带你搞定Ubuntu中打开Pycharm总是卡顿崩溃
2020/11/02 Python
CSS3实现粒子旋转伸缩加载动画
2016/04/22 HTML / CSS
CSS3 实现的缩略图悬停效果
2020/12/09 HTML / CSS
Desigual德国官网:在线购买原创服装
2018/03/27 全球购物
P D PAOLA意大利官网:西班牙著名的珠宝首饰品牌
2019/09/24 全球购物
质检部岗位职责
2013/11/11 职场文书
英语三分钟演讲稿
2014/08/19 职场文书
派出所班子党的群众路线对照检查材料思想汇报
2014/10/01 职场文书
实习介绍信模板
2015/01/30 职场文书
Python3.10的一些新特性原理分析
2021/09/15 Python
nginx共享内存的机制详解
2022/03/21 Servers