Python 的集合(set)运算

发表时间 ·

数学里集合运算在Python的set中也有对应运算。

子集⊆、真子集⊂

set的运算<对应于真子集⊂,<=对应于子集⊆

>>> A = {1, 2, 3}
>>> B = {1, 2, 3, 4, 5}
>>> A <= B  #判断是否子集
True
>>> A < B  #判断是否真子集
True
>>> A <= A
True
>>> B < A
False
>>>

set类型的内置函数issubset()同样可以判断是否子集:

>>> A.issubset(B)
True

超集/包含关系⊇、 ⊃

set的运算>对应于真包含⊃,>=对应于包含⊇,对应的内置函数是issuperset()

>>> A = {1, 2, 3}
>>> B = {1, 2, 3, 4, 5}
>>> B >= A
True
>>> B > A
True
>>> A >= A
True
>>> A > B
False
>>> A.issuperset(B)
False
>>> B.issuperset(A)
True
>>> 

不相交集

一个集合中的任何一个元素都不属于另一个集合,可以说这两个集合是不相交集(Disjoint sets),也就是说,交集为空 。判断函数是isdisjoint()

>>> A = {1, 2, 3}
>>> B = {1, 2, 3, 4, 5}
>>> A.isdisjoint(B)
False
>>> 

两集合的交集

set 的交集 的运算符号是&,采用这个符号是显然的,因为交集运算与位与(bit-wise AND)运算相似。对应的内置函数是intersection()

>>> A = {1, 2, 3, 4, 5}
>>> B = {4, 5, 6, 7, 8}
>>> A & B
set([4, 5])
>>> A.intersection(B)
set([4, 5])
>>> 

两集合的并集

set 的并集的运算符号是|,采用这个符号也是显然的,因为并集运算与位或(bit-wise OR)运算相似。对应的内置函数是union()

>>> A = {1, 2, 3, 4, 5}
>>> B = {4, 5, 6, 7, 8}
>>> A | B
set([1, 2, 3, 4, 5, 6, 7, 8])
>>> A.union(B)
set([1, 2, 3, 4, 5, 6, 7, 8])
>>> 

差集(减法)运算

set的差集运算,也就是从一个集合里减去另一个集合的所有元素,很直接的用减号表示,内置函数是difference()

>>> A = {1, 2, 3, 4, 5}
>>> B = {4, 5, 6, 7, 8}
>>> A - B
set([1, 2, 3])
>>> A.difference(B)
set([1, 2, 3])
>>> 

对称差集(异或)运算

数学上,两个集合的对称差(Symmetric difference)是只属于其中一个集合,而不被两个集合同时包含。 例如:集合{1,2,3}和{3,4}的对称差为{1,2,4}。集合论中的这个运算相当于布尔逻辑中的异或运算。所以在Python里使用了异或的符号(^)表示,内置函数为symmetric_difference()

>>> A = {1, 2, 3, 4, 5}
>>> B = {4, 5, 6, 7, 8}
>>> A ^ B
set([1, 2, 3, 6, 7, 8])
>>> A.symmetric_difference(B)
set([1, 2, 3, 6, 7, 8])
>>> 

集合内置函数的几个特点

上面介绍的集合内置函数里,有三个判断函数(is开头的函数)和四个运算函数(intersection, union, difference和symmetric_difference),表示运算的函数有下面几个特点:
1. 可以传递多个参数,表示连续运算
2. 可以传递除集合外的其他可递归类型(iterable)
比如

>>> A = {1, 2, 3, 4, 5}
>>> B = {4, 5, 6, 7, 8}
>>> C = {4, 5, 9, 0}
>>> A.intersection(B, C)    #连续交集运算
set([4, 5])
>>> A & B & C    #连续交集运算
set([4, 5])
>>> 
>>> A = [1, 2, 3, 4, 5]
>>> B = [4, 5, 6, 7, 8]
>>> set(A).union(B)    #和list作并集
set([1, 2, 3, 4, 5, 6, 7, 8])
>>> set('abc').symmetric_difference('cdef')    #字符串也是sequence的一种
set(['a', 'b', 'e', 'd', 'f'])
>>> 

集合运算的应用

利用set的运算,我们可以方便的判断两个sequence类型的集合关系:

>>> A = [1, 2, 3]
>>> B = [1, 2, 3, 4, 5]
>>> set(A) <= set (B)   # list转换类型为set
True
>>> set(A).issubset(B)   # list转换类型为set
True
>>> 

相关文章   欢迎到 留言板 写下你的看法。
  本页面内容采用 署名协议 CC-BY 授权。欢迎转载,请保留原文链接