编程 Python

LRUCache的实现原理及利用python实现的方法

Posted in Python onNovember 21, 2017

简介

LRU(Least Recently Used)最近最少使用，最近有时间和空间最近的歧义，所以我更喜欢叫它近期最少使用算法。它的核心思想是，如果一个数据被访问过，我们有理由相信它在将来被访问的概率就越高。于是当LRU缓存达到设定的最大值时将缓存中近期最少使用的对象移除。LRUCache内部使用LinkedHashMap来存储key-value键值对，并将LinkedHashMap设置为访问顺序来体现LRU算法。

无论是对某个key的get，还是set都算做是对该key的一次使用。当set一个不存在的key，并且LRU Cache中key的数量超过cache size的时候，需要将使用时间距离现在最长的那个key从LRU Cache中清除。

LRU Cache实现

在Java中，LRUCache是通过LinkedHashMap实现的。鄙人照猫画虎，实现一个Python版的LRU Cache（可能和其他大神的实现有所区别）。

首先，需要说明的是：

LRU Cache对象内部会维护一个双端循环链表的头节点

LRU Cache对象内部会维护一个dict

内部dict的value都是Entry对象，每个Entry对象包含：

key的hash_code（hash_code = hash(key)，在本实现中，hash_code相同的不同key，会被当作一个key来处理。因此，对于自定义类，应该实现魔术方法：__hash__）
v - (key, value)对中的value
prev - 前一个对象
next - 后一个对象

具体实现是：

当从LRU Cache中get一个key的时候：

计算该key的hash_code
从内部dict中获取到entry
将该entry移动到双端循环链表的第一个位置
返回entry.value

当向LRU Cache中set一个(key, value)对的时候：

计算该key的hash_code，

从LRU Cache的内部dict中，取出该hash_code对应的old_entry（可能不存在），然后根据(key, value)对生成一个new_entry，之后执行：

dict[hash_code] = new_entry
将new_entry提到双端循环链表的第一个位置
如果old_entry存在，则从链表中删除old_entry
如果是新增了一个(key, value)对，并且cache中key的数量超过了cache size，那么将双端链表的最后一个元素删除（该元素就是那个最近最少被使用的元素），并且从内部dict中删除该元素

HashMap的实现原理

（面试过程中也经常会被问到）：数组和链表组合成的链表散列结构，通过hash算法，尽量将数组中的数据分布均匀，如果hashcode相同再比较equals方法，如果equals方法返回false，那么就将数据以链表的形式存储在数组的对应位置，并将之前在该位置的数据往链表的后面移动，并记录一个next属性，来指示后移的那个数据。

注意：数组中保存的是entry（其中保存的是键值）

Python实现

class Entry:
 def __init__(self, hash_code, v, prev=None, next=None):
 self.hash_code = hash_code
 self.v = v
 self.prev = prev
 self.next = next

 def __str__(self):
 return "Entry{hash_code=%d, v=%s}" % (
  self.hash_code, self.v)
 __repr__ = __str__

class LRUCache:
 def __init__(self, max_size):
 self._max_size = max_size
 self._dict = dict()
 self._head = Entry(None, None)
 self._head.prev = self._head
 self._head.next = self._head

 def __setitem__(self, k, v):
 try:
  hash_code = hash(k)
 except TypeError:
  raise

 old_entry = self._dict.get(hash_code)
 new_entry = Entry(hash_code, v)
 self._dict[hash_code] = new_entry

 if old_entry:
  prev = old_entry.prev
  next = old_entry.next
  prev.next = next
  next.prev = prev

 head = self._head
 head_prev = self._head.prev
 head_next = self._head.next

 head.next = new_entry
 if head_prev is head:
  head.prev = new_entry
 head_next.prev = new_entry
 new_entry.prev = head
 new_entry.next = head_next

 if not old_entry and len(self._dict) > self._max_size:
  last_one = head.prev
  last_one.prev.next = head
  head.prev = last_one.prev
  self._dict.pop(last_one.hash_code)

 def __getitem__(self, k):
 entry = self._dict[hash(k)]
 head = self._head
 head_next = head.next
 prev = entry.prev
 next = entry.next

 if entry.prev is not head:
  if head.prev is entry:
  head.prev = prev
  head.next = entry

  head_next.prev = entry
  entry.prev = head
  entry.next = head_next

  prev.next = next
  next.prev = prev

 return entry.v

 def get_dict(self):
 return self._dict

if __name__ == "__main__":
 cache = LRUCache(2)
 inner_dict = cache.get_dict()

 cache[1] = 1
 assert inner_dict.keys() == [1], "test 1"
 cache[2] = 2
 assert sorted(inner_dict.keys()) == [1, 2], "test 2"
 cache[3] = 3
 assert sorted(inner_dict.keys()) == [2, 3], "test 3"
 cache[2]
 assert sorted(inner_dict.keys()) == [2, 3], "test 4"
 assert inner_dict[hash(2)].next.v == 3
 cache[4] = 4
 assert sorted(inner_dict.keys()) == [2, 4], "test 5"
 assert inner_dict[hash(4)].v == 4, "test 6"

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对三水点靠木的支持。

LRUCache的实现原理及利用python实现的方法

- Author -

蒂米

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

ssh批量登录并执行命令的python实现代码

May 25 Python

Python实现基本数据结构中队列的操作方法示例

Dec 04 Python

Python模拟脉冲星伪信号频率实例代码

Jan 03 Python

获取python文件扩展名和文件名方法

Feb 02 Python

Python实现抢购IPhone手机

Feb 07 Python

tensorflow学习笔记之简单的神经网络训练和测试

Apr 15 Python

Python针对给定字符串求解所有子序列是否为回文序列的方法

Apr 21 Python

Python3的高阶函数map,reduce,filter的示例详解

Jul 23 Python

Python虚拟环境的创建和包下载过程分析

Jun 19 Python

python3.9实现pyinstaller打包python文件成exe

Dec 13 Python

Python入门之基础语法详解

May 11 Python

Python实战之疫苗研发情况可视化

May 18 Python

Python利用itchat对微信中好友数据实现简单分析的方法

Nov 21 #Python

python中is与双等于号“==”的区别示例详解

Nov 21 #Python

Python使用PIL模块生成随机验证码

Nov 21 #Python

Python3中条件控制、循环与函数的简易教程

Nov 21 #Python

Python3 循环语句(for、while、break、range等)

Nov 20 #Python

Python虚拟环境项目实例

Nov 20 #Python

Python插件virtualenv搭建虚拟环境

Nov 20 #Python

You might like

php中iconv函数使用方法

2008/05/24 PHP

php中实现记住密码自动登录的代码

2011/03/02 PHP

ThinkPHP之M方法实例详解

2014/06/20 PHP

php基于SQLite实现的分页功能示例

2017/06/21 PHP

js实现ASP分页函数 HTML分页函数

2006/09/22 Javascript

js修改table中Td的值(定义td的双击事件)

2013/01/10 Javascript

JQuery中根据属性或属性值获得元素(6种情况获取方法)

2013/01/17 Javascript

js/jquery去掉空格,回车,换行示例代码

2013/11/05 Javascript

JavaScript中instanceof运算符的用法总结

2013/11/19 Javascript

浅析JavaScript中的常用算法与函数

2013/11/21 Javascript

javascript中checkbox使用方法实例演示

2015/11/19 Javascript

javascript每日必学之循环

2016/02/19 Javascript

JavaScript 正则表达式中global模式的特性

2016/02/25 Javascript

jQuery实现右下角可缩放大小的层完整实例

2016/06/20 Javascript

js querySelector() 使用方法

2016/12/21 Javascript

微信小程序如何引入外部字体库iconfont的图标

2018/01/31 Javascript

jQuery实现每日秒杀商品倒计时功能

2019/09/06 jQuery

JavaScript 面向对象程序设计详解【类的创建、实例对象、构造函数、原型等】

2020/05/12 Javascript

Ant design vue中的联动选择取消操作

2020/10/31 Javascript

一篇文章看懂JavaScript中的回调

2021/01/05 Javascript

使用vue3重构拼图游戏的实现示例

2021/01/25 Vue.js

搞笑的程序猿：看看你是哪种Python程序员

2015/06/12 Python

Python操作Redis之设置key的过期时间实例代码

2018/01/25 Python

python 获取url中的参数列表实例

2018/12/18 Python

Python 获取ftp服务器文件时间的方法

2019/07/02 Python

Python之字典添加元素的几种方法

2020/09/30 Python

Jupyter安装链接aconda实现过程图解

2020/11/02 Python

python获取天气接口给指定微信好友发天气预报

2020/12/28 Python

Bibloo罗马尼亚网站：女装、男装、童装及鞋子和配饰

2019/07/20 全球购物

介绍一下HDLC(High-Level Data Link Control)高层数据链路协议

2012/01/21 面试题

青年创业培训欢迎词

2014/01/10 职场文书

小加工厂管理制度

2014/01/21 职场文书

推荐信怎么写

2014/05/09 职场文书

上课迟到检讨书300字

2014/10/15 职场文书

违章停车检讨书

2014/10/21 职场文书

2019已经过半，你知道年中工作总结该怎么写吗？

2019/07/03 职场文书