python列表生成式与列表生成器的使用


Posted in Python onFebruary 23, 2018

列表生成式:会将所有的结果全部计算出来,把结果存放到内存中,如果列表中数据比较多,就会占用过多的内存空间,可能会导致MemoryError内存错误或者导致程序在运行时出现卡顿的情况

列表生成器:会创建一个列表生成器对象,不会一次性的把所有结果都计算出来,如果需要获取数据,可以使用next()函数来获取,但是需要注意,一旦next()函数获取不到数据,会导致出现StopIteration异常错误,可以使用for循环遍历列表生成器,获取所有数据

需要视情况而定,如果数据量比较大,推荐使用生成器

 python2.7中就是range(生成式) 和 xrange(生成器)的区别

列表生成式是快速生成一个列表的一些公式

在列表中存放0~100的数:

普通的列表生成:

numbers=[] 
for x in range(0,101): 
  numbers.append(x) 
print(numbers)

用列表生成式生成列表:[要放入列表的数据    简单的表达式1   表达式2]

#x for x in range(0,101) for循环遍历出来的值,放入列表中 
numbers=[x for x in range(0,101)] 
print(numbers)

列表中存放0~100的偶数:

普通方法生成列表:

for x in range(0,101): 
  if x%2==0: 
    numbers.append(x) 
print(numbers)

用列表生成式生成列表:

#for循环遍历0~101的数字,如果数字对2取余==0,表示是偶数,x放在列表中 
numbers=[x for x in range(0,101)if x%2==0] 
print(numbers)

找出列表list1=['asd','adf','dafg','acbo']带有a的字符

普通写法:

rs_list=[] 
for s in list1: 
  if 'a' in s: 
    rs_list.append(s) 
print(rs_list)

列表生成式:

list2=[x for x in list1 if 'a' in x]

列表生成式支持双层for循环

list3=[x*y for x in range(0,10) for y in range(20)] 
print(list3)

生成器构造实例

# 使用类似列表生成式的方式构造生成器
g1 = (2*n + 1 for n in range(3, 6))

# 使用包含yield的函数构造生成器
def my_range(start, end):
  for n in range(start, end):
    yield 2*n + 1

g2 = my_range(3, 6)
print(type(g1))
print(type(g2))

输出结果:

<class 'generator'>
<class 'generator'>

生成器的调用方式

  1. 要调用生成器产生新的元素,有两种方式:
  2. 调用内置的next()方法
  3. 使用循环对生成器对象进行遍历(推荐)
  4. 调用生成器对象的send()方法

实例1:使用next()方法遍历生成器

print(next(g1))
print(next(g1))
print(next(g1))
print(next(g1))

输出结果:

7
9
11
Traceback (most recent call last):
  File "***/generator.py", line 26, in <module>
    print(next(g1))
StopIteration

print(next(g2))
print(next(g2))
print(next(g2))
print(next(g2))

输出结果:

7
9
11
Traceback (most recent call last):
  File "***/generator.py", line 31, in <module>
    print(next(g2))
StopIteration

可见,使用next()方法遍历生成器时,最后是以抛出一个StopIeration异常终止。

实例2:使用循环遍历生成器

for x in g1:
  print(x)

for x in g2:
  print(x)

两个循环的输出结果是一样的:

7
9
11

可见,使用循环遍历生成器时比较简洁,且最后不会抛出一个StopIeration异常。因此使用循环的方式遍历生成器的方式才是被推荐的。

需要说明的是:如果生成器函数有返回值,要获取该返回值的话,只能通过在一个while循环中不断的next(),最后通过捕获StopIteration异常

实例3:调用生成器对象的send()方法

def my_range(start, end):
  for n in range(start, end):
    ret = yield 2*n + 1
    print(ret)

g3 = my_range(3, 6)
print(g3.send(None))
print(g3.send('hello01'))
print(g3.send('hello02'))

输出结果:

7
hello01
9
hello02
11

print(next(g3))
print(next(g3))
print(next(g3))

输出结果:

7
None
9
None
11

结论:

  1. next()会调用yield,但不给它传值
  2. send()会调用yield,也会给它传值(该值将成为当前yield表达式的结果值)

需要注意的是:第一次调用生成器的send()方法时,参数只能为None,否则会抛出异常。当然也可以在调用send()方法之前先调用一次next()方法,目的是让生成器先进入yield表达式。

生成器与列表生成式对比

既然通过列表生成式就可以直接创建一个新的list,那么为什么还要有生成器存在呢?

因为列表生成式是直接创建一个新的list,它会一次性地把所有数据都存放到内存中,这会存在以下几个问题:

  1. 内存容量有限,因此列表容量是有限的;
  2. 当列表中的数据量很大时,会占用大量的内存空间,如果我们仅仅需要访问前面有限个元素时,就会造成内存资源的极大浪费;
  3. 当数据量很大时,列表生成式的返回时间会很慢;

而生成器中的元素是按照指定的算法推算出来的,只有调用时才生成相应的数据。这样就不必一次性地把所有数据都生成,从而节省了大量的内存空间,这使得其生成的元素个数几乎是没有限制的,并且操作的返回时间也是非常快速的(仅仅是创建一个变量而已)。

我们可以做个试验:对比一下生成一个1000万个数字的列表,分别看下用列表生成式和生成器时返回结果的时间和所占内存空间的大小:

import time
import sys

time_start = time.time()
g1 = [x for x in range(10000000)]
time_end = time.time()
print('列表生成式返回结果花费的时间: %s' % (time_end - time_start))
print('列表生成式返回结果占用内存大小:%s' % sys.getsizeof(g1))

def my_range(start, end):
  for x in range(start, end):
    yield x

time_start = time.time()
g2 = my_range(0, 10000000)
time_end = time.time()
print('生成器返回结果花费的时间: %s' % (time_end - time_start))
print('生成器返回结果占用内存大小:%s' % sys.getsizeof(g2))

输出结果:

列表生成式返回结果花费的时间: 0.8215489387512207
列表生成式返回结果占用内存大小:81528056
生成器返回结果花费的时间: 0.0
生成器返回结果占用内存大小:88

可见,生成器返回结果的时间几乎为0,结果所占内存空间的大小相对于列表生成器来说也要小的多。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python检测字符串中是否包含某字符集合中的字符
May 21 Python
python3.5使用tkinter制作记事本
Jun 20 Python
python特性语法之遍历、公共方法、引用
Aug 08 Python
python如何实现一个刷网页小程序
Nov 27 Python
基于pytorch的保存和加载模型参数的方法
Aug 17 Python
Python3简单爬虫抓取网页图片代码实例
Aug 26 Python
pytorch sampler对数据进行采样的实现
Dec 31 Python
python绘制动态曲线教程
Feb 24 Python
Python-jenkins模块之folder相关操作介绍
May 12 Python
五分钟带你搞懂python 迭代器与生成器
Aug 30 Python
如何使用python自带IDLE的几种方法
Oct 10 Python
讲解Python实例练习逆序输出字符串
May 06 Python
1分钟快速生成用于网页内容提取的xslt
Feb 23 #Python
python使用xslt提取网页数据的方法
Feb 23 #Python
Python爬虫使用Selenium+PhantomJS抓取Ajax和动态HTML内容
Feb 23 #Python
python爬虫获取多页天涯帖子
Feb 23 #Python
Python即时网络爬虫项目启动说明详解
Feb 23 #Python
Python爬豆瓣电影实例
Feb 23 #Python
Python抓取聚划算商品分析页面获取商品信息并以XML格式保存到本地
Feb 23 #Python
You might like
PHP 利用AJAX获取网页并输出的实现代码(Zjmainstay)
2012/08/31 PHP
神盾加密解密教程(三)PHP 神盾解密工具
2014/06/08 PHP
PHP微信公众号开发之微信红包实现方法分析
2017/07/14 PHP
PHP中register_shutdown_function函数的基础介绍与用法详解
2017/11/28 PHP
JavaScript中使用stopPropagation函数停止事件传播例子
2014/08/27 Javascript
JavaScript基于ajax编辑信息用法实例
2015/07/15 Javascript
js实现网页多级级联菜单代码
2015/08/20 Javascript
全面解析多种Bootstrap图片轮播效果
2016/05/27 Javascript
深入理解ECMAScript的几个关键语句
2016/06/01 Javascript
Bootstrap实现登录校验表单(带验证码)
2016/06/23 Javascript
Vue.js每天必学之构造器与生命周期
2016/09/05 Javascript
Nodejs下DNS缓存问题浅析
2016/11/16 NodeJs
ES6新特性之字符串的扩展实例分析
2017/04/01 Javascript
React Native如何消除启动时白屏的方法
2017/08/08 Javascript
关于vue中watch检测到不到对象属性的变化的解决方法
2018/02/08 Javascript
React组件内事件传参实现tab切换的示例代码
2018/07/04 Javascript
Vue中使用的EventBus有生命周期
2018/07/12 Javascript
ionic使用angularjs表单验证(模板验证)
2018/12/12 Javascript
vue实现行列转换的一种方法
2019/08/06 Javascript
openlayers 3实现车辆轨迹回放
2020/09/24 Javascript
[01:01:24]LGD vs Fnatic 2018国际邀请赛小组赛BO2 第一场 8.18
2018/08/19 DOTA
python多进程和多线程究竟谁更快(详解)
2017/05/29 Python
python实现决策树C4.5算法详解(在ID3基础上改进)
2017/05/31 Python
对pandas中to_dict的用法详解
2018/06/05 Python
python 用所有标点符号分隔句子的示例
2019/07/15 Python
python使用paramiko模块通过ssh2协议对交换机进行配置的方法
2019/07/25 Python
用python wxpy管理微信公众号并利用微信获取自己的开源数据
2019/07/30 Python
Python实现平行坐标图的绘制(plotly)方式
2019/11/22 Python
详解python 降级到3.6终极解决方案
2020/02/06 Python
python实现简单猜单词游戏
2020/12/24 Python
Monnier Frères美国官网:法国知名奢侈品网站
2016/11/22 全球购物
美国百年历史早餐食品供应商:Wolferman’s
2017/01/18 全球购物
南非最大的在线时尚商店:Zando
2019/07/21 全球购物
酒店管理毕业生自我鉴定
2014/03/02 职场文书
综合内勤岗位职责
2014/04/14 职场文书
小学生我的梦想演讲稿
2014/08/21 职场文书