浅析python内置模块collections


Posted in Python onNovember 15, 2019

collections是Python内建的一个集合模块,提供了许多有用的集合类。

1、namedtuple

python提供了很多非常好用的基本类型,比如不可变类型tuple,我们可以轻松地用它来表示一个二元向量。

>>> v = (2,3)

我们发现,虽然(2,3)表示出了一个向量的两个坐标,但是,如果没有额外说明,又很难直接看出这个元组是用来表示一个坐标的。

为此定义一个class又小题大做了,这时,namedtuple就派上用场了。

>>> from collections import namedtuple
>>> Vector = namedtuple('Vector', ['x', 'y'])
>>> v = Vector(2,3)
>>> v.x
2
>>> v.y
3

namedtuple是一个函数,它用来创建一个自定义的tuple对象,并且规定了tuple元素的个数,并可以用属性而不是索引来引用tuple的某个元素。

这样一来,我们用namedtuple可以很方便地定义一种数据类型,它具备tuple的不变性,又可以根据属性来引用,使用十分方便。

我们可以验证创建的Vector对象的类型。

>>> type(v)
<class '__main__.Vector'>
>>> isinstance(v, Vector)
True
>>> isinstance(v, tuple)
True

类似的,如果要用坐标和半径表示一个圆,也可以用namedtuple定义:

>>> Circle = namedtuple('Circle', ['x', 'y', 'r'])
# namedtuple('名称', [‘属性列表'])

2、deque

在数据结构中,我们知道队列和堆栈是两个非常重要的数据类型,一个先进先出,一个后进先出。在python中,使用list存储数据时,按索引访问元素很快,但是插入和删除元素就很慢了,因为list是线性存储,数据量大的时候,插入和删除效率很低。

deque是为了高效实现插入和删除操作的双向链表结构,非常适合实现队列和堆栈这样的数据结构。

>>> from collections import deque
>>> deq = deque([1, 2, 3])
>>> deq.append(4)
>>> deq
deque([1, 2, 3, 4])
>>> deq.appendleft(5)
>>> deq
deque([5, 1, 2, 3, 4])
>>> deq.pop()
4
>>> deq.popleft()
5
>>> deq
deque([1, 2, 3])

deque除了实现list的append()和pop()外,还支持appendleft()和popleft(),这样就可以非常高效地往头部添加或删除元素。

3、defaultdict

使用dict字典类型时,如果引用的key不存在,就会抛出KeyError。如果希望Key不存在时,返回一个默认值,就可以用defaultdict。

>>> from collections import defaultdict
>>> dd = defaultdict(lambda: 'defaultvalue')
>>> dd['key1'] = 'a'
>>> dd['key1']
'a'
>>> dd['key2'] # key2未定义,返回默认值
'defaultvalue'

注意默认值是调用函数返回的,而函数在创建defaultdict对象时传入。

除了在Key不存在时返回默认值,defaultdict的其他行为跟dict是完全一样的。

4、OrderedDict

使用dict时,key是无序的。在对dict做迭代时,我们无法确定key的顺序。

但是如果想要保持key的顺序,可以用OrderedDict。

>>> from collections import OrderedDict
>>> d = dict([('a', 1), ('b', 2), ('c', 3)])
>>> d # dict的Key是无序的
{'a': 1, 'c': 3, 'b': 2}
>>> od = OrderedDict([('a', 1), ('b', 2), ('c', 3)])
>>> od # OrderedDict的Key是有序的
OrderedDict([('a', 1), ('b', 2), ('c', 3)])

注意,OrderedDict的key会按照插入的顺序排列,不是key本身排序

>>> od = OrderedDict()
>>> od['z'] = 1
>>> od['y'] = 2
>>> od['x'] = 3
>>> list(od.keys()) # 按照插入的Key的顺序返回
['z', 'y', 'x']

OrderedDict可以实现一个FIFO(先进先出)的dict,当容量超出限制时,先删除最早添加的key。

from collections import OrderedDict
class LastUpdatedOrderedDict(OrderedDict):
  def __init__(self, capacity):
    super(LastUpdatedOrderedDict, self).__init__()
    self._capacity = capacity
  def __setitem__(self, key, value):
    containsKey = 1 if key in self else 0
    if len(self) - containsKey >= self._capacity:
      last = self.popitem(last=False)
      print('remove:', last)
    if containsKey:
      del self[key]
      print('set:', (key, value))
    else:
      print('add:', (key, value))
    OrderedDict.__setitem__(self, key, value)

5、ChainMap

ChainMap可以把一组dict串起来并组成一个逻辑上的dict。ChainMap本身也是一个dict,但是查找的时候,会按照顺序在内部的dict依次查找。

什么时候使用ChainMap最合适?举个例子:应用程序往往都需要传入参数,参数可以通过命令行传入,可以通过环境变量传入,还可以有默认参数。我们可以用ChainMap实现参数的优先级查找,即先查命令行参数,如果没有传入,再查环境变量,如果没有,就使用默认参数。

下面的代码演示了如何查找user和color这两个参数。

from collections import ChainMap
import os, argparse
# 构造缺省参数:
defaults = {
  'color': 'red',
  'user': 'guest'
}
# 构造命令行参数:
parser = argparse.ArgumentParser()
parser.add_argument('-u', '--user')
parser.add_argument('-c', '--color')
namespace = parser.parse_args()
command_line_args = { k: v for k, v in vars(namespace).items() if v }
# 组合成ChainMap:
combined = ChainMap(command_line_args, os.environ, defaults)
# 打印参数:
print('color=%s' % combined['color'])
print('user=%s' % combined['user'])

没有任何参数时,打印出默认参数:

$ python3 use_chainmap.py 
color=red
user=guest

当传入命令行参数时,优先使用命令行参数:

$ python3 use_chainmap.py -u bob
color=red
user=bob

同时传入命令行参数和环境变量,命令行参数的优先级较高:

$ user=admin color=green python3 use_chainmap.py -u bob
color=green
user=bob

6、Counter

Counter是一个简单的计数器,例如,统计字符出现的个数:

from collections import Counter
>>> s = 'abbcccdddd'
>>> Counter(s)
Counter({'d': 4, 'c': 3, 'b': 2, 'a': 1})

Counter实际上也是dict的一个子类。

7、小结

collections模块提供了一些有用的集合类,可以根据需要选用。

以上所述是小编给大家介绍的python内置模块collections,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
Python查询Mysql时返回字典结构的代码
Jun 18 Python
解析Python中的二进制位运算符
May 13 Python
python实现文件快照加密保护的方法
Jun 30 Python
Python编程中对文件和存储器的读写示例
Jan 25 Python
深入解答关于Python的11道基本面试题
Apr 01 Python
基于Python中capitalize()与title()的区别详解
Dec 09 Python
Django 限制用户访问频率的中间件的实现
Aug 23 Python
Python面向对象之反射/自省机制实例分析
Aug 24 Python
python实现电子产品商店
Feb 26 Python
Python使用numpy模块实现矩阵和列表的连接操作方法
Jun 26 Python
python实现定时发送邮件到指定邮箱
Dec 23 Python
python playwrigh框架入门安装使用
Jul 23 Python
Python树莓派学习笔记之UDP传输视频帧操作详解
Nov 15 #Python
Python numpy数组转置与轴变换
Nov 15 #Python
python修改文件内容的3种方法详解
Nov 15 #Python
Python实现基于socket的udp传输与接收功能详解
Nov 15 #Python
python根据文本生成词云图代码实例
Nov 15 #Python
解决django后台管理界面添加中文内容乱码问题
Nov 15 #Python
python中的TCP(传输控制协议)用法实例分析
Nov 15 #Python
You might like
新手学PHP之数据库操作详解及乱码解决!
2007/01/02 PHP
php缩放gif和png图透明背景变成黑色的解决方法
2014/10/14 PHP
php使用array_search函数实现数组查找的方法
2015/06/12 PHP
IE 当eval遇上function的处理
2011/08/09 Javascript
JS继承--原型链继承和类式继承
2013/04/08 Javascript
AngularJs bootstrap搭载前台框架——准备工作
2016/09/01 Javascript
微信小程序 触控事件详细介绍
2016/10/17 Javascript
Node.JS更改Windows注册表Regedit的方法小结
2017/08/18 Javascript
深入浅出webpack之externals的使用
2017/12/04 Javascript
微信小程序实现列表下拉刷新上拉加载
2020/07/29 Javascript
微信小程序支付前端源码
2018/08/29 Javascript
vue项目中使用Hbuilder打包app 设置沉浸式状态栏的方法
2018/10/22 Javascript
详解使用React.memo()来优化函数组件的性能
2019/03/19 Javascript
微信小程序实现点击效果
2019/06/21 Javascript
JS实现点击发送验证码 xx秒后重新发送功能
2019/07/30 Javascript
微信小程序 函数防抖 解决重复点击消耗性能问题实现代码
2019/09/12 Javascript
JS实现图片幻灯片效果代码实例
2020/05/21 Javascript
在Python中使用poplib模块收取邮件的教程
2015/04/29 Python
python后端接收前端回传的文件方法
2019/01/02 Python
Python实现去除图片中指定颜色的像素功能示例
2019/04/13 Python
python定时复制远程文件夹中所有文件
2019/04/30 Python
pandas 空数据处理方法详解
2019/11/02 Python
浅谈在django中使用redirect重定向数据传输的问题
2020/03/13 Python
python爬虫实现POST request payload形式的请求
2020/04/30 Python
什么是Python中的顺序表
2020/06/02 Python
python中有帮助函数吗
2020/06/19 Python
浅谈Html5中视频 音频标签 进度条的问题
2016/07/26 HTML / CSS
canvas学习和滤镜实现代码
2018/08/22 HTML / CSS
JOSEPH官网:英国奢侈时尚品牌
2018/01/31 全球购物
临床医学系毕业生推荐信
2013/11/09 职场文书
农村婚庆司仪主持词
2014/03/15 职场文书
精彩广告词大全
2014/03/19 职场文书
全国法制宣传日活动总结
2015/05/05 职场文书
教师节晚会主持词
2015/06/30 职场文书
大学生各类奖学金申请书
2019/06/24 职场文书
PyTorch梯度裁剪避免训练loss nan的操作
2021/05/24 Python