浅析python内置模块collections


Posted in Python onNovember 15, 2019

collections是Python内建的一个集合模块,提供了许多有用的集合类。

1、namedtuple

python提供了很多非常好用的基本类型,比如不可变类型tuple,我们可以轻松地用它来表示一个二元向量。

>>> v = (2,3)

我们发现,虽然(2,3)表示出了一个向量的两个坐标,但是,如果没有额外说明,又很难直接看出这个元组是用来表示一个坐标的。

为此定义一个class又小题大做了,这时,namedtuple就派上用场了。

>>> from collections import namedtuple
>>> Vector = namedtuple('Vector', ['x', 'y'])
>>> v = Vector(2,3)
>>> v.x
2
>>> v.y
3

namedtuple是一个函数,它用来创建一个自定义的tuple对象,并且规定了tuple元素的个数,并可以用属性而不是索引来引用tuple的某个元素。

这样一来,我们用namedtuple可以很方便地定义一种数据类型,它具备tuple的不变性,又可以根据属性来引用,使用十分方便。

我们可以验证创建的Vector对象的类型。

>>> type(v)
<class '__main__.Vector'>
>>> isinstance(v, Vector)
True
>>> isinstance(v, tuple)
True

类似的,如果要用坐标和半径表示一个圆,也可以用namedtuple定义:

>>> Circle = namedtuple('Circle', ['x', 'y', 'r'])
# namedtuple('名称', [‘属性列表'])

2、deque

在数据结构中,我们知道队列和堆栈是两个非常重要的数据类型,一个先进先出,一个后进先出。在python中,使用list存储数据时,按索引访问元素很快,但是插入和删除元素就很慢了,因为list是线性存储,数据量大的时候,插入和删除效率很低。

deque是为了高效实现插入和删除操作的双向链表结构,非常适合实现队列和堆栈这样的数据结构。

>>> from collections import deque
>>> deq = deque([1, 2, 3])
>>> deq.append(4)
>>> deq
deque([1, 2, 3, 4])
>>> deq.appendleft(5)
>>> deq
deque([5, 1, 2, 3, 4])
>>> deq.pop()
4
>>> deq.popleft()
5
>>> deq
deque([1, 2, 3])

deque除了实现list的append()和pop()外,还支持appendleft()和popleft(),这样就可以非常高效地往头部添加或删除元素。

3、defaultdict

使用dict字典类型时,如果引用的key不存在,就会抛出KeyError。如果希望Key不存在时,返回一个默认值,就可以用defaultdict。

>>> from collections import defaultdict
>>> dd = defaultdict(lambda: 'defaultvalue')
>>> dd['key1'] = 'a'
>>> dd['key1']
'a'
>>> dd['key2'] # key2未定义,返回默认值
'defaultvalue'

注意默认值是调用函数返回的,而函数在创建defaultdict对象时传入。

除了在Key不存在时返回默认值,defaultdict的其他行为跟dict是完全一样的。

4、OrderedDict

使用dict时,key是无序的。在对dict做迭代时,我们无法确定key的顺序。

但是如果想要保持key的顺序,可以用OrderedDict。

>>> from collections import OrderedDict
>>> d = dict([('a', 1), ('b', 2), ('c', 3)])
>>> d # dict的Key是无序的
{'a': 1, 'c': 3, 'b': 2}
>>> od = OrderedDict([('a', 1), ('b', 2), ('c', 3)])
>>> od # OrderedDict的Key是有序的
OrderedDict([('a', 1), ('b', 2), ('c', 3)])

注意,OrderedDict的key会按照插入的顺序排列,不是key本身排序

>>> od = OrderedDict()
>>> od['z'] = 1
>>> od['y'] = 2
>>> od['x'] = 3
>>> list(od.keys()) # 按照插入的Key的顺序返回
['z', 'y', 'x']

OrderedDict可以实现一个FIFO(先进先出)的dict,当容量超出限制时,先删除最早添加的key。

from collections import OrderedDict
class LastUpdatedOrderedDict(OrderedDict):
  def __init__(self, capacity):
    super(LastUpdatedOrderedDict, self).__init__()
    self._capacity = capacity
  def __setitem__(self, key, value):
    containsKey = 1 if key in self else 0
    if len(self) - containsKey >= self._capacity:
      last = self.popitem(last=False)
      print('remove:', last)
    if containsKey:
      del self[key]
      print('set:', (key, value))
    else:
      print('add:', (key, value))
    OrderedDict.__setitem__(self, key, value)

5、ChainMap

ChainMap可以把一组dict串起来并组成一个逻辑上的dict。ChainMap本身也是一个dict,但是查找的时候,会按照顺序在内部的dict依次查找。

什么时候使用ChainMap最合适?举个例子:应用程序往往都需要传入参数,参数可以通过命令行传入,可以通过环境变量传入,还可以有默认参数。我们可以用ChainMap实现参数的优先级查找,即先查命令行参数,如果没有传入,再查环境变量,如果没有,就使用默认参数。

下面的代码演示了如何查找user和color这两个参数。

from collections import ChainMap
import os, argparse
# 构造缺省参数:
defaults = {
  'color': 'red',
  'user': 'guest'
}
# 构造命令行参数:
parser = argparse.ArgumentParser()
parser.add_argument('-u', '--user')
parser.add_argument('-c', '--color')
namespace = parser.parse_args()
command_line_args = { k: v for k, v in vars(namespace).items() if v }
# 组合成ChainMap:
combined = ChainMap(command_line_args, os.environ, defaults)
# 打印参数:
print('color=%s' % combined['color'])
print('user=%s' % combined['user'])

没有任何参数时,打印出默认参数:

$ python3 use_chainmap.py 
color=red
user=guest

当传入命令行参数时,优先使用命令行参数:

$ python3 use_chainmap.py -u bob
color=red
user=bob

同时传入命令行参数和环境变量,命令行参数的优先级较高:

$ user=admin color=green python3 use_chainmap.py -u bob
color=green
user=bob

6、Counter

Counter是一个简单的计数器,例如,统计字符出现的个数:

from collections import Counter
>>> s = 'abbcccdddd'
>>> Counter(s)
Counter({'d': 4, 'c': 3, 'b': 2, 'a': 1})

Counter实际上也是dict的一个子类。

7、小结

collections模块提供了一些有用的集合类,可以根据需要选用。

以上所述是小编给大家介绍的python内置模块collections,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
python 字符串格式化代码
Mar 17 Python
python共享引用(多个变量引用)示例代码
Dec 04 Python
Python中的filter()函数的用法
Apr 27 Python
Python中asyncore异步模块的用法及实现httpclient的实例
Jun 28 Python
Python+django实现简单的文件上传
Aug 17 Python
浅谈function(函数)中的动态参数
Apr 30 Python
python 连接sqlite及简单操作
Jun 30 Python
python实现自动登录
Sep 17 Python
在OpenCV里实现条码区域识别的方法示例
Dec 04 Python
Python xlrd excel文件操作代码实例
Mar 10 Python
Python3爬虫mitmproxy的安装步骤
Jul 29 Python
Python3爬虫中pyspider的安装步骤
Jul 29 Python
Python树莓派学习笔记之UDP传输视频帧操作详解
Nov 15 #Python
Python numpy数组转置与轴变换
Nov 15 #Python
python修改文件内容的3种方法详解
Nov 15 #Python
Python实现基于socket的udp传输与接收功能详解
Nov 15 #Python
python根据文本生成词云图代码实例
Nov 15 #Python
解决django后台管理界面添加中文内容乱码问题
Nov 15 #Python
python中的TCP(传输控制协议)用法实例分析
Nov 15 #Python
You might like
编译问题
2006/10/09 PHP
ADODB的数据库封包程序库
2006/12/31 PHP
php Hex RGB颜色值互换的使用
2013/05/10 PHP
php-beanstalkd消息队列类实例分享
2017/07/19 PHP
tp5框架前台无限极导航菜单类实现方法分析
2020/03/29 PHP
一个简单的JS时间控件示例代码(JS时分秒时间控件)
2013/11/22 Javascript
使用jquery prev()方法找到同级的前一个元素
2014/07/11 Javascript
Node.js 应用跑得更快 10 个技巧
2016/04/03 Javascript
easyui validatebox验证
2016/04/29 Javascript
js流动式效果显示当前系统时间
2016/05/16 Javascript
jQuery给指定的table动态添加删除行的操作方法
2016/10/12 Javascript
vue.js实现表格合并示例代码
2016/11/30 Javascript
JavaScrpt判断一个数是否是质数的实例代码
2017/06/11 Javascript
jQueryeasyui 中如何使用datetimebox 取两个日期间相隔的天数
2017/06/13 jQuery
jackson解析json字符串,首字母大写会自动转为小写的方法
2017/12/22 Javascript
js replace 全局替换的操作方法
2018/06/12 Javascript
angular4中引入echarts的方法示例
2019/01/29 Javascript
vue与iframe之间的信息交互的实现
2020/04/08 Javascript
js 动态校验开始结束时间的实现代码
2020/05/25 Javascript
[04:30]显微镜下的DOTA2第五期——拉比克
2013/09/26 DOTA
python的Template使用指南
2014/09/11 Python
python 获取图片分辨率的方法
2019/01/08 Python
python程序运行进程、使用时间、剩余时间显示功能的实现代码
2019/07/11 Python
Python符号计算之实现函数极限的方法
2019/07/15 Python
Python使用xlrd实现读取合并单元格
2020/07/09 Python
如何解决pycharm调试报错的问题
2020/08/06 Python
丝芙兰美国官网:SEPHORA美国
2016/08/03 全球购物
中邮全球便购:中国邮政速递物流
2017/03/04 全球购物
企业管理专业个人求职信范文
2013/09/24 职场文书
培训自我鉴定
2014/01/31 职场文书
物流专员岗位职责
2014/02/17 职场文书
初中学生期末评语
2014/04/24 职场文书
党章培训心得体会
2014/09/04 职场文书
2014年银行信贷员工作总结
2014/12/08 职场文书
李强为自己工作观后感
2015/06/11 职场文书
nginx常用命令放入shell脚本详解
2021/03/31 Servers