python列表生成式与列表生成器的使用


Posted in Python onFebruary 23, 2018

列表生成式:会将所有的结果全部计算出来,把结果存放到内存中,如果列表中数据比较多,就会占用过多的内存空间,可能会导致MemoryError内存错误或者导致程序在运行时出现卡顿的情况

列表生成器:会创建一个列表生成器对象,不会一次性的把所有结果都计算出来,如果需要获取数据,可以使用next()函数来获取,但是需要注意,一旦next()函数获取不到数据,会导致出现StopIteration异常错误,可以使用for循环遍历列表生成器,获取所有数据

需要视情况而定,如果数据量比较大,推荐使用生成器

 python2.7中就是range(生成式) 和 xrange(生成器)的区别

列表生成式是快速生成一个列表的一些公式

在列表中存放0~100的数:

普通的列表生成:

numbers=[] 
for x in range(0,101): 
  numbers.append(x) 
print(numbers)

用列表生成式生成列表:[要放入列表的数据    简单的表达式1   表达式2]

#x for x in range(0,101) for循环遍历出来的值,放入列表中 
numbers=[x for x in range(0,101)] 
print(numbers)

列表中存放0~100的偶数:

普通方法生成列表:

for x in range(0,101): 
  if x%2==0: 
    numbers.append(x) 
print(numbers)

用列表生成式生成列表:

#for循环遍历0~101的数字,如果数字对2取余==0,表示是偶数,x放在列表中 
numbers=[x for x in range(0,101)if x%2==0] 
print(numbers)

找出列表list1=['asd','adf','dafg','acbo']带有a的字符

普通写法:

rs_list=[] 
for s in list1: 
  if 'a' in s: 
    rs_list.append(s) 
print(rs_list)

列表生成式:

list2=[x for x in list1 if 'a' in x]

列表生成式支持双层for循环

list3=[x*y for x in range(0,10) for y in range(20)] 
print(list3)

生成器构造实例

# 使用类似列表生成式的方式构造生成器
g1 = (2*n + 1 for n in range(3, 6))

# 使用包含yield的函数构造生成器
def my_range(start, end):
  for n in range(start, end):
    yield 2*n + 1

g2 = my_range(3, 6)
print(type(g1))
print(type(g2))

输出结果:

<class 'generator'>
<class 'generator'>

生成器的调用方式

  1. 要调用生成器产生新的元素,有两种方式:
  2. 调用内置的next()方法
  3. 使用循环对生成器对象进行遍历(推荐)
  4. 调用生成器对象的send()方法

实例1:使用next()方法遍历生成器

print(next(g1))
print(next(g1))
print(next(g1))
print(next(g1))

输出结果:

7
9
11
Traceback (most recent call last):
  File "***/generator.py", line 26, in <module>
    print(next(g1))
StopIteration

print(next(g2))
print(next(g2))
print(next(g2))
print(next(g2))

输出结果:

7
9
11
Traceback (most recent call last):
  File "***/generator.py", line 31, in <module>
    print(next(g2))
StopIteration

可见,使用next()方法遍历生成器时,最后是以抛出一个StopIeration异常终止。

实例2:使用循环遍历生成器

for x in g1:
  print(x)

for x in g2:
  print(x)

两个循环的输出结果是一样的:

7
9
11

可见,使用循环遍历生成器时比较简洁,且最后不会抛出一个StopIeration异常。因此使用循环的方式遍历生成器的方式才是被推荐的。

需要说明的是:如果生成器函数有返回值,要获取该返回值的话,只能通过在一个while循环中不断的next(),最后通过捕获StopIteration异常

实例3:调用生成器对象的send()方法

def my_range(start, end):
  for n in range(start, end):
    ret = yield 2*n + 1
    print(ret)

g3 = my_range(3, 6)
print(g3.send(None))
print(g3.send('hello01'))
print(g3.send('hello02'))

输出结果:

7
hello01
9
hello02
11

print(next(g3))
print(next(g3))
print(next(g3))

输出结果:

7
None
9
None
11

结论:

  1. next()会调用yield,但不给它传值
  2. send()会调用yield,也会给它传值(该值将成为当前yield表达式的结果值)

需要注意的是:第一次调用生成器的send()方法时,参数只能为None,否则会抛出异常。当然也可以在调用send()方法之前先调用一次next()方法,目的是让生成器先进入yield表达式。

生成器与列表生成式对比

既然通过列表生成式就可以直接创建一个新的list,那么为什么还要有生成器存在呢?

因为列表生成式是直接创建一个新的list,它会一次性地把所有数据都存放到内存中,这会存在以下几个问题:

  1. 内存容量有限,因此列表容量是有限的;
  2. 当列表中的数据量很大时,会占用大量的内存空间,如果我们仅仅需要访问前面有限个元素时,就会造成内存资源的极大浪费;
  3. 当数据量很大时,列表生成式的返回时间会很慢;

而生成器中的元素是按照指定的算法推算出来的,只有调用时才生成相应的数据。这样就不必一次性地把所有数据都生成,从而节省了大量的内存空间,这使得其生成的元素个数几乎是没有限制的,并且操作的返回时间也是非常快速的(仅仅是创建一个变量而已)。

我们可以做个试验:对比一下生成一个1000万个数字的列表,分别看下用列表生成式和生成器时返回结果的时间和所占内存空间的大小:

import time
import sys

time_start = time.time()
g1 = [x for x in range(10000000)]
time_end = time.time()
print('列表生成式返回结果花费的时间: %s' % (time_end - time_start))
print('列表生成式返回结果占用内存大小:%s' % sys.getsizeof(g1))

def my_range(start, end):
  for x in range(start, end):
    yield x

time_start = time.time()
g2 = my_range(0, 10000000)
time_end = time.time()
print('生成器返回结果花费的时间: %s' % (time_end - time_start))
print('生成器返回结果占用内存大小:%s' % sys.getsizeof(g2))

输出结果:

列表生成式返回结果花费的时间: 0.8215489387512207
列表生成式返回结果占用内存大小:81528056
生成器返回结果花费的时间: 0.0
生成器返回结果占用内存大小:88

可见,生成器返回结果的时间几乎为0,结果所占内存空间的大小相对于列表生成器来说也要小的多。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
pyqt5简介及安装方法介绍
Jan 31 Python
解决pip install的时候报错timed out的问题
Jun 12 Python
使用tensorflow实现线性svm
Sep 07 Python
解决python3 HTMLTestRunner测试报告中文乱码的问题
Dec 17 Python
详解安装mitmproxy以及遇到的坑和简单用法
Jan 21 Python
python3实现高效的端口扫描
Aug 31 Python
基于TensorFlow常量、序列以及随机值生成实例
Jan 04 Python
Pytest mark使用实例及原理解析
Feb 22 Python
Python random库使用方法及异常处理方案
Mar 02 Python
Django中的AutoField字段使用
May 18 Python
Python类绑定方法及非绑定方法实例解析
Oct 09 Python
Python实现小黑屋游戏的完整实例
Jan 06 Python
1分钟快速生成用于网页内容提取的xslt
Feb 23 #Python
python使用xslt提取网页数据的方法
Feb 23 #Python
Python爬虫使用Selenium+PhantomJS抓取Ajax和动态HTML内容
Feb 23 #Python
python爬虫获取多页天涯帖子
Feb 23 #Python
Python即时网络爬虫项目启动说明详解
Feb 23 #Python
Python爬豆瓣电影实例
Feb 23 #Python
Python抓取聚划算商品分析页面获取商品信息并以XML格式保存到本地
Feb 23 #Python
You might like
php gd2 上传图片/文字水印/图片水印/等比例缩略图/实现代码
2010/05/15 PHP
PHP函数之error_reporting(E_ALL ^ E_NOTICE)详细说明
2011/07/01 PHP
基于curl数据采集之正则处理函数get_matches的使用
2013/04/28 PHP
解析web文件操作常见安全漏洞(目录、文件名检测漏洞)
2013/06/29 PHP
PHP_NETWORK_GETADDRESSES: GETADDRINFO FAILED问题解决办法
2014/05/04 PHP
php生成短网址示例
2014/05/05 PHP
php中error与exception的区别及应用
2014/07/28 PHP
PHP中mysql_field_type()函数用法
2014/11/24 PHP
php+ajax实现异步上传文件或图片功能
2017/07/18 PHP
PHP迭代与递归实现无限级分类
2017/08/28 PHP
安装PHP扩展时解压官方 tgz 文件后没有configure文件无法进行配置编译的问题
2020/08/26 PHP
Js 本页面传值实现代码
2009/05/17 Javascript
面向对象的Javascript之二(接口实现介绍)
2012/01/27 Javascript
基于javascript滚动图片具体实现
2013/11/18 Javascript
js 异步操作回调函数如何控制执行顺序
2013/12/24 Javascript
jQuery超简单选项卡完整实例
2015/09/26 Javascript
最全面的JS倒计时代码
2016/09/17 Javascript
bootstrap常用组件之头部导航实现代码
2017/04/20 Javascript
详解element-ui中form验证杂记
2019/03/04 Javascript
微信小程序 行的删除和增加操作实现详解
2019/09/29 Javascript
js实现视图和数据双向绑定的方法分析
2020/02/05 Javascript
[03:33]TI9战队采访 - Infamous
2019/08/20 DOTA
详解python如何调用C/C++底层库与互相传值
2016/08/10 Python
TensorFlow的权值更新方法
2018/06/14 Python
带你认识Django
2019/01/15 Python
PyInstaller运行原理及常用操作详解
2020/06/13 Python
Python pip 常用命令汇总
2020/10/19 Python
详解pandas apply 并行处理的几种方法
2021/02/24 Python
利用canvas实现图片下载功能来实现浏览器兼容问题
2019/05/31 HTML / CSS
关于VPN
2012/06/10 面试题
元旦晚会邀请函
2014/01/27 职场文书
党员大会主持词
2014/04/02 职场文书
软件项目开发计划书
2014/05/01 职场文书
装配车间主任岗位职责
2015/04/08 职场文书
重温经典:乔布斯在斯坦福大学的毕业演讲(双语)
2019/08/26 职场文书
Python包argparse模块常用方法
2021/06/04 Python