python集合比较(交集,并集,差集)方法详解


Posted in Python onSeptember 13, 2018

python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算.

sets 支持 x in set, len(set),和 for x in set。作为一个无序的集合,sets不记录元素位置或者插入点。因此,sets不支持 indexing, slicing, 或其它类序列(sequence-like)的操作。

下面来点简单的小例子说明把。

>>> x = set('spam')
>>> y = set(['h','a','m'])
>>> x, y
(set(['a', 'p', 's', 'm']), set(['a', 'h', 'm']))
>>> x & y # 交集
set(['a', 'm'])
>>> x | y # 并集
set(['a', 'p', 's', 'h', 'm'])
>>> x - y # 差集
set(['p', 's'])

有网友提问怎么去除海量列表里重复元素,用hash来解决也行,只不过感觉在性能上不是很高,用set解决还是很不错的,示例如下:

>>> a = [11,22,33,44,11,22]
>>> b = set(a)
>>> b
set([33, 11, 44, 22])
>>> c = [i for i in b]
>>> c
[33, 11, 44, 22]

几行就可以搞定。

python集合

集合用于包含一组无序的对象。要创建集合,可使用set()函数并像下面这样提供一系列的项:

s = set([3,5,9,10])   #创建一个数值集合
t = set("Hello")     #创建一个唯一字符的集合

与列表和元组不同,集合是无序的,也无法通过数字进行索引。此外,集合中的元素不能重复。例如,如果检查前面代码中t集合的值,结果会是:

>>> t
set(['H', 'e', 'l', 'o'])

注意只出现了一个'l'。

集合支持一系列标准操作,包括并集、交集、差集和对称差集,例如:

a = t | s #t 和 s的并集

b = t & s #t 和 s的交集

c = t ? s #求差集(项在t中,但不在s中)

d = t ^ s #对称差集(项在t或s中,但不会同时出现在二者中)

python集合基本操作:

t.add('x') # 添加一项

s.update([10,37,42]) # 在s中添加多项

t.remove('H') 使用remove()可以删除一项:

len(s) set 的长度

x in s 测试 x 是否是 s 的成员

x not in s 测试 x 是否不是 s 的成员

测试是否 s 中的每一个元素都在 t 中

s.issubset(t)
s <= t

测试是否 t 中的每一个元素都在 s 中

s.issuperset(t)
s >= t

返回一个新的 set 包含 s 和 t 中的每一个元素

s.union(t)
s | t

返回一个新的 set 包含 s 和 t 中的公共元素

s.intersection(t)
s & t

返回一个新的 set 包含 s 中有但是 t 中没有的元素

s.difference(t)
s - t

返回一个新的 set 包含 s 和 t 中不重复的元素

s.symmetric_difference(t)
s ^ t

返回 set “s”的一个浅复制

s.copy()

请注意:union(), intersection(), difference() 和 symmetric_difference() 的非运算符(non-operator,就是形如 s.union()这样的)版本将会接受任何 iterable 作为参数。

相反,它们的运算符版本(operator based counterparts)要求参数必须是 sets。这样可以避免潜在的错误,如:为了更可读而使用 set('abc') & 'cbs' 来替代 set('abc').intersection('cbs')。从 2.3.1 版本中做的更改:以前所有参数都必须是 sets。

另外,Set 和 ImmutableSet 两者都支持 set 与 set 之间的比较。

两个 sets 在也只有在这种情况下是相等的:每一个 set 中的元素都是另一个中的元素(二者互为subset)。一个 set 比另一个 set 小,只有在第一个 set 是第二个 set 的 subset 时(是一个 subset,但是并不相等)。

一个 set 比另一个 set 打,只有在第一个 set 是第二个 set 的 superset 时(是一个 superset,但是并不相等)。

子 set 和相等比较并不产生完整的排序功能。例如:任意两个 sets 都不相等也不互为子 set,因此以下的运算都会返回 False:a<b, a==b, 或者a>b。因此,sets 不提供 __cmp__ 方法。

因为 sets 只定义了部分排序功能(subset 关系),list.sort() 方法的输出对于 sets 的列表没有定义。

返回增加了 set “t”中元素后的 set “s”

s.update(t)
s |= t

返回只保留含有 set “t”中元素的 set “s”

s.intersection_update(t)
s &= t

返回删除了 set “t”中含有的元素后的 set “s”

s.difference_update(t)
s -= t

返回含有 set “t”或者 set “s”中有而不是两者都有的元素的 set “s”

s.symmetric_difference_update(t)
s ^= t

向 set “s”中增加元素 x

s.add(x)

从 set “s”中删除元素 x, 如果不存在则引发 KeyError

s.remove(x)

如果在 set “s”中存在元素 x, 则删除

s.discard(x)

删除并且返回 set “s”中的一个不确定的元素, 如果为空则引发 KeyError

s.pop()

删除 set “s”中的所有元素

s.clear()

请注意:

非运算符版本的 update(), intersection_update(), difference_update()和symmetric_difference_update()将会接受任意 iterable 作为参数。从 2.3.1 版本做的更改:以前所有参数都必须是 sets。

这个模块还包含一个 union_update() 方法,它是 update() 方法的一个别名。包含这个方法是为了向后兼容。程序员们应该多使用 update() 方法,因为这个方法也被内置的 set() 和 frozenset() 类型支持。

关于更多python set集合比较内容请查看下面相关文章

Python 相关文章推荐
python的正则表达式re模块的常用方法
Mar 09 Python
Python中利用Scipy包的SIFT方法进行图片识别的实例教程
Jun 03 Python
Centos 升级到python3后pip 无法使用的解决方法
Jun 12 Python
Python I/O与进程的详细讲解
Mar 08 Python
Python3列表内置方法大全及示例代码小结
May 10 Python
Tensorflow模型实现预测或识别单张图片
Jul 19 Python
python GUI库图形界面开发之PyQt5多行文本框控件QTextEdit详细使用方法实例
Feb 28 Python
Python常用模块函数代码汇总解析
Aug 31 Python
解决PyCharm不在run输出运行结果而不是再Console里输出的问题
Sep 21 Python
python基于tkinter制作下班倒计时工具
Apr 28 Python
python调试工具Birdseye的使用教程
May 25 Python
Python趣味实战之手把手教你实现举牌小人生成器
Jun 07 Python
python中dict字典的查询键值对 遍历 排序 创建 访问 更新 删除基础操作方法
Sep 13 #Python
Python字典创建 遍历 添加等实用基础操作技巧
Sep 13 #Python
python单例模式获取IP代理的方法详解
Sep 13 #Python
如何利用python制作时间戳转换工具详解
Sep 12 #Python
Python get获取页面cookie代码实例
Sep 12 #Python
python读取和保存图片5种方法对比
Sep 12 #Python
python3 拼接字符串的7种方法
Sep 12 #Python
You might like
PHP编程 SSO详细介绍及简单实例
2017/01/13 PHP
php多进程并发编程防止出现僵尸进程的方法分析
2020/02/28 PHP
2007/12/23更新创意无限,简单实用(javascript log)
2007/12/24 Javascript
window.location和document.location的区别分析
2008/12/23 Javascript
JavaScript Date对象 日期获取函数
2010/12/19 Javascript
extjs4 treepanel动态改变行高度示例
2013/12/17 Javascript
扩展IE中一些不兼容的方法如contains、startWith等等
2014/01/09 Javascript
jquery实现文本框数量加减功能的例子分享
2014/05/10 Javascript
RequireJS使用注意细节
2016/05/15 Javascript
Node.js+Express配置入门教程
2016/05/19 Javascript
windows下vue-cli及webpack搭建安装环境
2017/04/25 Javascript
angularjs实现上拉加载和下拉刷新数据功能
2017/06/12 Javascript
解决微信二次分享不显示摘要和图片的问题
2017/08/18 Javascript
JS实现评价的星星功能
2017/08/20 Javascript
vue--点击当前增加class,其他删除class的方法
2018/09/15 Javascript
vue+axios 前端实现登录拦截的两种方式(路由拦截、http拦截)
2018/10/24 Javascript
小程序实现简单语音聊天的示例代码
2020/07/24 Javascript
antd Select下拉菜单动态添加option里的内容操作
2020/11/02 Javascript
Vue 打包的静态文件不能直接运行的原因及解决办法
2020/11/19 Vue.js
[01:38]【DOTA2亚洲邀请赛】Sumail——梦开始的地方
2017/03/03 DOTA
使用Python从零开始撸一个区块链
2018/03/14 Python
python中字符串的操作方法大全
2018/06/03 Python
python实现将读入的多维list转为一维list的方法
2018/06/28 Python
python编程使用协程并发的优缺点
2018/09/20 Python
对Django中static(静态)文件详解以及{% static %}标签的使用方法
2019/07/28 Python
python有序查找算法 二分法实例解析
2020/02/18 Python
Django+Celery实现动态配置定时任务的方法示例
2020/05/26 Python
纯CSS3实现的8种Loading动画效果
2014/07/05 HTML / CSS
浅谈html5 video 移动端填坑记
2018/01/15 HTML / CSS
《匆匆》教学反思
2014/02/22 职场文书
协议书怎么写
2014/04/21 职场文书
工程承包协议书
2014/04/22 职场文书
质量在我心中演讲稿
2014/09/02 职场文书
商超业务员岗位职责
2015/02/13 职场文书
小学生红领巾广播稿
2015/08/19 职场文书
《乌鸦喝水》教学反思
2016/02/19 职场文书