Python字典和列表性能之间的比较


Posted in Python onJune 07, 2021

Python列表和字典

  • 前面我们了解了 “大O表示法” 以及对不同的算法的评估,下面来讨论下 Python 两种内置数据类型有关的各种操作的大O数量级:列表 list 和字典dict。
  • 这是 Python 中两种非常重要的数据类型,后面会用来实现各种数据结构,通过运行试验来估计其各种操作运行时间数量级。

对比 list 和 dict 操作如下:

Python字典和列表性能之间的比较

List列表数据类型常用操作性能:

最常用的是:按索引取值和赋值(v=a[i],a[i]=v),由于列表的随机访问特性,这两个操作执行时间与列表大小无关,均为O(1)。

另一个是列表增长,可以选择 append() 和 “+”:lst.append(v),执行时间是O(1);lst= lst+ [v],执行时间是O(n+k),其中 k 是被加的列表长度,选择哪个方法来操作列表,也决定了程序的性能。

测试 4 种生成 n 个整数列表的方法:

Python字典和列表性能之间的比较

创建一个 Timer 对象,指定需要反复运行的语句和只需要运行一次的"安装语句"。

然后调用这个对象的 timeit 方法,指定反复运行多少次。

# Timer(stmt="pass", setup="pass")   # 这边只介绍两个参数
# stmt:statement的缩写,就是要测试的语句,要执行的对象
# setup:导入被执行的对象(就和run代码前,需要导入包一个道理) 在主程序命名空间中  导入
time1 = Timer("test1()", "from __main__ import test1") 
print("concat:{} seconds".format(time1.timeit(1000)))
time2 = Timer("test2()", "from __main__ import test2")
print("append:{} seconds".format(time2.timeit(1000)))
time3 = Timer("test3()", "from __main__ import test3")
print("comprehension:{} seconds".format(time3.timeit(1000)))
time4 = Timer("test4()", "from __main__ import test4")
print("list range:{} seconds".format(time4.timeit(1000))

结果如下:

Python字典和列表性能之间的比较

可以看到,4种方法运行时间差别挺大的,列表连接(concat)最慢,List range最快,速度相差近 100 倍。append要比 concat 快得多。另外,我们注意到列表推导式速度大约是 append 两倍的样子。

总结列表基本操作的大 O 数量级:

Python字典和列表性能之间的比较

我们注意到 pop 这个操作,pop()是从列表末尾移除元素,时间复杂度为O(1);pop(i)从列表中部移除元素,时间复杂度为O(n)。
原因在于 Python 所选择的实现方法,从中部移除元素的话,要把移除元素后面的元素,全部向前挪位复制一遍,这个看起来有点笨拙
但这种实现方法能够保证列表按索引取值和赋值的操作很快,达到O(1)。这也算是一种对常用和不常用操作的折中方案。

list.pop()的计时试验,通过改变列表的大小来测试两个操作的增长趋势:

import timeit

pop_first = timeit.Timer("x.pop(0)", "from __main__ import x")
pop_end = timeit.Timer("x.pop()", "from __main__ import x")
print("pop(0)          pop()")
y_1 = []
y_2 = []
for i in range(1000000, 10000001, 1000000):
    x = list(range(i))
    p_e = pop_end.timeit(number=1000)
    x = list(range(i))
    p_f = pop_first.timeit(number=1000)
    print("{:.6f}        {:.6f}".format(p_f, p_e))
    y_1.append(p_f)
    y_2.append(p_e)

结果如下:

Python字典和列表性能之间的比较

将试验结果可视化,可以看出增长趋势:pop()是平坦的常数,pop(0)是线性增长的趋势。

Python字典和列表性能之间的比较

字典与列表不同,是根据键值(key)找到数据项,而列表是根据索引(index)。最常用的取值和赋值,其性能均为O(1)。另一个重要操作contains(in)是判断字典中是否存在某个键值(key),这个性能也是O(1)。

Python字典和列表性能之间的比较

做一个性能测试试验来验证 list 中检索一个值,以及 dict 中检索一个值的用时对比,生成包含连续值的 list 和包含连续键值 key 的
dict,用随机数来检验操作符 in 的耗时。

import timeit
import random

y_1 = []
y_2 = []
print("lst_time         dict_time")
for i in range(10000, 1000001, 25000):
    t = timeit.Timer("random.randrange(%d) in x" % i, "from __main__ import random, x")
    x = list(range(i))
    lst_time = t.timeit(number=1000)
    x = {j: 'k' for j in range(i)}
    dict_time = t.timeit(number=1000)
    print("{:.6f}        {:.6f}".format(lst_time, dict_time))
    y_1.append(lst_time)
    y_2.append(dict_time)

结果如下:

Python字典和列表性能之间的比较
Python字典和列表性能之间的比较

  • 可见字典的执行时间与规模无关,是常数。
  • 而列表的执行时间则会随着列表的规模加大而线性上升。

更多 Python 数据类型操作复杂度可以参考官方文档:
https://wiki.python.org/moin/TimeComplexity

到此这篇关于Python字典和列表性能之间的比较的文章就介绍到这了,更多相关Python列表和字典内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python使用filetype精确判断文件类型
Jul 02 Python
Python迭代器定义与简单用法分析
Apr 30 Python
Python自定义函数实现求两个数最大公约数、最小公倍数示例
May 21 Python
python实现输入数字的连续加减方法
Jun 22 Python
python使用knn实现特征向量分类
Dec 26 Python
Python加密模块的hashlib,hmac模块使用解析
Jan 02 Python
jupyter notebook 参数传递给shell命令行实例
Apr 10 Python
numpy的Fancy Indexing和array比较详解
Jun 11 Python
django创建css文件夹的具体方法
Jul 31 Python
Python用来做Web开发的优势有哪些
Aug 05 Python
python中zip()函数遍历多个列表方法
Feb 18 Python
PyTorch dropout设置训练和测试模式的实现
May 27 Python
使用pycharm运行flask应用程序的详细教程
只用Python就可以制作的简单词云
python通过函数名调用函数的几种方法总结
Jun 07 #Python
Python爬虫实战之爬取京东商品数据并实实现数据可视化
Python实现的扫码工具居然这么好用!
Jun 07 #Python
忆童年!用Python实现愤怒的小鸟游戏
python单元测试之pytest的使用
Jun 07 #Python
You might like
用PHP开发GUI
2006/10/09 PHP
php cookie使用方法学习笔记分享
2013/11/07 PHP
CodeIgniter CLI模式简介
2014/06/17 PHP
PHP、Java des加密解密实例
2015/04/27 PHP
PHP生成短网址的思路以及实现方法的详解
2019/03/25 PHP
如何在PHP中使用AES加密算法加密数据
2020/06/24 PHP
csdn 博客中实现运行代码功能实现
2009/08/29 Javascript
JSON 数据格式介绍
2012/01/13 Javascript
js自动查找select下拉的菜单并选择(示例代码)
2014/02/26 Javascript
jquery 点击元素后,滚动条滚动至该元素位置的方法
2016/08/05 Javascript
Javascript 数组去重的方法(四种)详解及实例代码
2016/11/24 Javascript
jquery+ajax实现省市区三级联动效果简单示例
2017/01/04 Javascript
Vue使用枚举类型实现HTML下拉框步骤详解
2018/02/05 Javascript
vue elementui el-form rules动态验证的实例代码详解
2019/05/23 Javascript
用Python制作简单的朴素基数估计器的教程
2015/04/01 Python
Tensorflow 训练自己的数据集将数据直接导入到内存
2018/06/19 Python
pygame实现俄罗斯方块游戏
2018/06/26 Python
Python cv2 图像自适应灰度直方图均衡化处理方法
2018/12/07 Python
使用python接入微信聊天机器人
2020/03/31 Python
python3 打印输出字典中特定的某个key的方法示例
2019/07/06 Python
Django之使用内置函数和celery发邮件的方法示例
2019/09/16 Python
python使用matplotlib绘制雷达图
2019/10/18 Python
python实现输入任意一个大写字母生成金字塔的示例
2019/10/27 Python
解决Keras自带数据集与预训练model下载太慢问题
2020/06/12 Python
python用tkinter实现一个简易能进行随机点名的界面
2020/09/27 Python
python help函数实例用法
2020/12/06 Python
东方通信股份有限公司VC面试题
2014/08/27 面试题
类成员函数的重载、覆盖和隐藏区别
2016/01/27 面试题
英文简历自荐信范文
2013/12/11 职场文书
学期研究性学习个人的自我评价
2014/01/09 职场文书
运动会方阵解说词
2014/02/12 职场文书
小学生综合素质评语
2014/04/23 职场文书
学习雷锋演讲稿
2014/05/10 职场文书
体育专业自荐书
2014/05/29 职场文书
格列佛游记读书笔记
2015/06/30 职场文书
python开发飞机大战游戏
2021/07/15 Python