Python实现优先级队列结构的方法详解


Posted in Python onJune 02, 2016

最简单的实现
一个队列至少满足2个方法,put和get.
借助最小堆来实现.
这里按"值越大优先级越高"的顺序.

#coding=utf-8 
from heapq import heappush, heappop 
class PriorityQueue: 
  def __init__(self): 
    self._queue = [] 
 
  def put(self, item, priority): 
    heappush(self._queue, (-priority, item)) 
 
  def get(self): 
    return heappop(self._queue)[-1] 
 
q = PriorityQueue() 
q.put('world', 1) 
q.put('hello', 2) 
print q.get() 
print q.get()

 使用heapq模块来实现
下面的类利用 heapq 模块实现了一个简单的优先级队列:

import heapq

class PriorityQueue:
  def __init__(self):
    self._queue = []
    self._index = 0

  def push(self, item, priority):
    heapq.heappush(self._queue, (-priority, self._index, item))
    self._index += 1

  def pop(self):
    return heapq.heappop(self._queue)[-1]

下面是它的使用方式:

>>> class Item:
...   def __init__(self, name):
...     self.name = name
...   def __repr__(self):
...     return 'Item({!r})'.format(self.name)
...
>>> q = PriorityQueue()
>>> q.push(Item('foo'), 1)
>>> q.push(Item('bar'), 5)
>>> q.push(Item('spam'), 4)
>>> q.push(Item('grok'), 1)
>>> q.pop()
Item('bar')
>>> q.pop()
Item('spam')
>>> q.pop()
Item('foo')
>>> q.pop()
Item('grok')
>>>

仔细观察可以发现,第一个 pop() 操作返回优先级最高的元素。 另外注意到如果两个有着相同优先级的元素( foo 和 grok ),pop操作按照它们被插入到队列的顺序返回的。

 函数 heapq.heappush() 和 heapq.heappop() 分别在队列 _queue 上插入和删除第一个元素, 并且队列_queue保证第一个元素拥有最小优先级(1.4节已经讨论过这个问题)。 heappop() 函数总是返回”最小的”的元素,这就是保证队列pop操作返回正确元素的关键。 另外,由于push和pop操作时间复杂度为O(log N),其中N是堆的大小,因此就算是N很大的时候它们运行速度也依旧很快。

在上面代码中,队列包含了一个 (-priority, index, item) 的元组。 优先级为负数的目的是使得元素按照优先级从高到低排序。 这个跟普通的按优先级从低到高排序的堆排序恰巧相反。

index 变量的作用是保证同等优先级元素的正确排序。 通过保存一个不断增加的 index 下标变量,可以确保元素按照它们插入的顺序排序。 而且, index 变量也在相同优先级元素比较的时候起到重要作用。

为了阐明这些,先假定Item实例是不支持排序的:

>>> a = Item('foo')
>>> b = Item('bar')
>>> a < b
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unorderable types: Item() < Item()
>>>

如果你使用元组 (priority, item) ,只要两个元素的优先级不同就能比较。 但是如果两个元素优先级一样的话,那么比较操作就会跟之前一样出错:

>>> a = (1, Item('foo'))
>>> b = (5, Item('bar'))
>>> a < b
True
>>> c = (1, Item('grok'))
>>> a < c
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unorderable types: Item() < Item()
>>>

通过引入另外的 index 变量组成三元组 (priority, index, item) ,就能很好的避免上面的错误, 因为不可能有两个元素有相同的 index 值。Python在做元组比较时候,如果前面的比较以及可以确定结果了, 后面的比较操作就不会发生了:

>>> a = (1, 0, Item('foo'))
>>> b = (5, 1, Item('bar'))
>>> c = (1, 2, Item('grok'))
>>> a < b
True
>>> a < c
True
>>>

如果你想在多个线程中使用同一个队列,那么你需要增加适当的锁和信号量机制。 可以查看12.3小节的例子演示是怎样做的。

深入思考
函数 heapq.heappush() 和 heapq.heappop() 分别在队列 _queue 上插入和删除第一个元素, 并且队列_queue保证第一个元素拥有最小优先级(1.4节已经讨论过这个问题)。 heappop() 函数总是返回”最小的”的元素,这就是保证队列pop操作返回正确元素的关键。 另外,由于push和pop操作时间复杂度为O(log N),其中N是堆的大小,因此就算是N很大的时候它们运行速度也依旧很快。

在上面代码中,队列包含了一个 (-priority, index, item) 的元组。 优先级为负数的目的是使得元素按照优先级从高到低排序。 这个跟普通的按优先级从低到高排序的堆排序恰巧相反。

index 变量的作用是保证同等优先级元素的正确排序。 通过保存一个不断增加的 index 下标变量,可以确保元素按照它们插入的顺序排序。 而且, index 变量也在相同优先级元素比较的时候起到重要作用。

为了阐明这些,先假定Item实例是不支持排序的:

>>> a = Item('foo')
>>> b = Item('bar')
>>> a < b
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unorderable types: Item() < Item()
>>>

如果你使用元组 (priority, item) ,只要两个元素的优先级不同就能比较。 但是如果两个元素优先级一样的话,那么比较操作就会跟之前一样出错:

>>> a = (1, Item('foo'))
>>> b = (5, Item('bar'))
>>> a < b
True
>>> c = (1, Item('grok'))
>>> a < c
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unorderable types: Item() < Item()
>>>

通过引入另外的 index 变量组成三元组 (priority, index, item) ,就能很好的避免上面的错误, 因为不可能有两个元素有相同的 index 值。Python在做元组比较时候,如果前面的比较以及可以确定结果了, 后面的比较操作就不会发生了:

>>> a = (1, 0, Item('foo'))
>>> b = (5, 1, Item('bar'))
>>> c = (1, 2, Item('grok'))
>>> a < b
True
>>> a < c
True
>>>

如果你想在多个线程中使用同一个队列,那么你需要增加适当的锁和信号量机制。 可以查看12.3小节的例子演示是怎样做的。

heapq 模块的官方文档有更详细的例子程序以及对于堆理论及其实现的详细说明。

Python 相关文章推荐
最大K个数问题的Python版解法总结
Jun 16 Python
python 打印出所有的对象/模块的属性(实例代码)
Sep 11 Python
Python 制作糗事百科爬虫实例
Sep 22 Python
Python SQLite3数据库日期与时间常见函数用法分析
Aug 14 Python
python爬虫之urllib3的使用示例
Jul 09 Python
在Python中调用Ping命令,批量IP的方法
Jan 26 Python
pycharm 更改创建文件默认路径的操作
Feb 15 Python
python matplotlib 绘图 和 dpi对应关系详解
Mar 14 Python
python中for in的用法详解
Apr 17 Python
PyQt5通过信号实现MVC的示例
Feb 06 Python
Python中glob库实现文件名的匹配
Jun 18 Python
Python语言中的数据类型-序列
Feb 24 Python
KMP算法精解及其Python版的代码示例
Jun 01 #Python
Python缩进和冒号详解
Jun 01 #Python
Python注释详解
Jun 01 #Python
深入理解python try异常处理机制
Jun 01 #Python
python学习 流程控制语句详解
Jun 01 #Python
python+Django+apache的配置方法详解
Jun 01 #Python
python中函数默认值使用注意点详解
Jun 01 #Python
You might like
ci检测是ajax还是页面post提交数据的方法
2014/11/10 PHP
ThinkPHP中where()使用方法详解
2016/04/19 PHP
如何让PHP编码更加好看利于阅读
2019/05/12 PHP
文字幻灯片
2006/06/26 Javascript
JavaScript开发时的五个注意事项
2007/12/08 Javascript
JavaScript 高级语法介绍
2009/06/15 Javascript
有效的捕获JavaScript焦点的方法小结
2009/10/08 Javascript
使用javascript过滤html的字符串(注释标记法)
2013/07/08 Javascript
js导入导出excel(实例代码)
2013/11/25 Javascript
JavaScript中几种排序算法的简单实现
2015/07/29 Javascript
基于javascript代码实现通过点击图片显示原图片
2015/11/29 Javascript
jQuery Select下拉框操作小结(推荐)
2016/07/22 Javascript
详解使用angular-cli发布i18n多国语言Angular应用
2017/05/20 Javascript
react.js 父子组件数据绑定实时通讯的示例代码
2017/09/25 Javascript
JS设计模式之策略模式概念与用法分析
2018/02/05 Javascript
vue中如何实现后台管理系统的权限控制的方法示例
2018/09/19 Javascript
vue-cli 构建骨架屏的方法示例
2018/11/08 Javascript
jquery将信息遍历到界面上实例代码
2020/01/21 jQuery
[02:37]2018DOTA2亚洲邀请赛赛前采访-EG篇
2018/04/03 DOTA
python client使用http post 到server端的代码
2013/02/10 Python
使用Python的Scrapy框架编写web爬虫的简单示例
2015/04/17 Python
使用Python的Django框架实现事务交易管理的教程
2015/04/20 Python
Python 列表理解及使用方法
2017/10/27 Python
Python 利用scrapy爬虫通过短短50行代码下载整站短视频
2018/10/29 Python
Python3爬虫学习之MySQL数据库存储爬取的信息详解
2018/12/12 Python
Appium+python自动化之连接模拟器并启动淘宝APP(超详解)
2019/06/17 Python
python接口调用已训练好的caffe模型测试分类方法
2019/08/26 Python
Python做图像处理及视频音频文件分离和合成功能
2020/11/24 Python
Python爬虫自动化爬取b站实时弹幕实例方法
2021/01/26 Python
国际奢侈品品牌童装购物网站:Designer Childrenswear
2019/05/08 全球购物
劳动之星获奖感言
2014/02/01 职场文书
岗位职责怎么写
2014/03/14 职场文书
运动会演讲稿200字
2014/08/25 职场文书
会议邀请函
2015/01/30 职场文书
高中运动会前导词
2015/07/20 职场文书
分享几种python 变量合并方法
2022/03/20 Python