数学里集合运算在 Python 语言的 set 数据类型中也有对应的运算。 子集⊆、真子集⊂ 判断真子集的 ⊂ 符号,在 Python 语言中,对应 set 类型的 < 运算,判断子集的 ⊆ 符号,对应 <= 比如下面的例子: A = {1, 2, 3} B = {1, 2, 3, 4, 5} A <= B # True A < B # True A <= A # True B < A # False 另外,set 类型的内置函数 issubset() 同样可以判断是否子集: A.issubset(B) # A <= B 超集/包含关系⊇、 ⊃ 表示真包含的 ⊃ 符号,对应 set 类型的 > 运算,表示包含的 ⊇ 符号,对应 set 类型的 >= 运算,和内置函数 issuperset() A = {1, 2, 3} B = {1, 2, 3, 4, 5} B >= A # True B > A # True A >= A # True A > B # False A.issuperset(B) # False B.issuperset(A) # True 两集合求交集 set 的交集 的运算符号是 & ,采用这个符号是显然的,因为交集运算与位与(bit-wise AND)运算相似。对应的内置函数是 intersection() A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7, 8} A & B # set([4, 5]) A.intersection(B) #set([4, 5]) 无交集 两个集合交集为空集,即任一个集合中的任何一个元素都不属于另一个集合,可以说这两个集合是不相交集(Disjoint sets)。判断函数是 isdisjoint() A = {1, 2, 3} B = {1, 2, 3, 4, 5} A.isdisjoint(B) # False 两集合的并集 set 的并集的运算符号是 | ,采用这个符号也是显然的,因为并集运算与位或(bit-wise OR)运算相似。对应的内置函数是 union() A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7, 8} A | B # set([1, 2, 3, 4, 5, 6, 7, 8]) A.union(B) # set([1, 2, 3, 4, 5, 6, 7, 8]) 差集(减法)运算 set的差集运算,也就是从一个集合里减去另一个集合的所有元素,理所应当的用减号表示,内置函数是 difference() A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7, 8} A - B # set([1, 2, 3]) A.difference(B) # set([1, 2, 3]) 对称差集(异或)运算 数学上,两个集合的对称差(Symmetric difference)的定义是: 只属于其中一个集合,但不被两个集合同时包含的元素集合 也就是并集减去交集。例如:集合{1,2,3}和{3,4}的对称差为{1,2,4}。 集合论中的这个运算相当于布尔逻辑中的异或运算。所以在Python里使用了异或的符号(^)表示,内置函数为 symmetric_difference() A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7, 8} A ^ B # set([1, 2, 3, 6, 7, 8]) A.symmetric_difference(B) # set([1, 2, 3, 6, 7, 8]) 集合内置函数的几个特点 上面介绍的集合 set 类型内置函数里,有三个判断函数(is开头的函数) issubset() issuperset() isdisjoint() 和四个运算函数 intersection() union() difference() symmetric_difference() 其中后面四个表示运算的函数有下面几个共同特点: 可以同时传递多个参数,表示连续运算 可以传递除集合外的其他可递归类型(iterable) 比如 # 连续交集运算 A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7, 8} C = {4, 5, 9, 0} A.intersection(B, C) # set([4, 5]) A & B & C # set([4, 5]) # list 类型求并集 A = [1, 2, 3, 4, 5] B = [4, 5, 6, 7, 8] set(A).union(B) # set([1, 2, 3, 4, 5, 6, 7, 8]) # 字符串也是属于 iterable,就是可以用 for 循环遍历的类型 set('abc').symmetric_difference('cdef') # set(['a', 'b', 'e', 'd', 'f']) 集合运算的应用 利用set的运算,我们可以方便的判断两个 sequence 类型 的集合运算关系,例如 list 类型 A = [1, 2, 3] B = [1, 2, 3, 4, 5] set(A) <= set (B) # True