Python语言之深入Python中的 Collections 模块-职坐标

Python语言之深入Python中的 Collections 模块

小职 2020-11-12 来源：https://developer.51cto.com/art/202011/631501.htm 阅读 1444 评论 0

摘要：Python中的collections模块是一个不用不知道，一用就上瘾的模块，本篇深入介绍Python中的Collections 模块，希望对Python的学习有所帮助。

Python中的collections模块是一个不用不知道，一用就上瘾的模块，本篇深入介绍Python中的Collections 模块，希望对Python的学习有所帮助。

Python语言之深入Python中的 Collections 模块

这里主要介绍OrderedDict类、defaultdict类、Counter类、namedtuple类和deque类。

collections

collections的常用类型有：

计数器(Counter)

双向队列(deque)

默认字典(defaultdict)

有序字典(OrderedDict)

可命名元组(namedtuple)

Counter

计数器(counter)以字典的形式返回序列中各个字符出现的次数，值为key，次数为value

Counter是对字典类型的补充，用于追踪值得出现次数。

import collections

counter = collections.Counter("My name is Runsen")

print(counter)

输出如下

Counter({' ': 3, 'n': 3, 'e': 2, 's': 2, 'M': 1, 'y': 1, 'a': 1, 'm': 1, 'i': 1, 'R': 1, 'u': 1})

取得元素重复次数的值

print(counter[' '])

elements()取得计数器中的所有元素。

注：此处非所有元素集合，而是包含所有元素集合的迭代器.

counter = collections.Counter('abcabcabcdabcdef')

print(counter)

# 输出如下

Counter({'a': 4, 'b': 4, 'c': 4, 'd': 2, 'e': 1, 'f': 1})

print(counter.elements())

# 输出如下

<itertools.chain object at 0x0000025B1477BF98>

print(list(counter.elements()))

# 输出如下

['a', 'a', 'a', 'a', 'b', 'b', 'b', 'b', 'c', 'c', 'c', 'c', 'd', 'd', 'e', 'f']

将Counter按照value从大到小排列，获取前N个元素，需要使用函数most_common

# most_common(N)数量从大到小排列，获取前N个元素

print(counter.most_common(3))

# 输出如下

[('a', 4), ('b', 4), ('c', 4)]

sorted将Counter中的key进行排序，返回的是所有key的列表

# sorted()列出所有不同的元素并排序

print(sorted(counter))

# 输出如下

['a', 'b', 'c', 'd', 'e', 'f']

将Counter转换成字符串，字符串的join方法可以解决。注意不是原来的模样。

# 转换成字符串

print(''.join(counter.elements()))

# aaaabbbbccccddef

print(''.join(list(counter.elements())))

update()更新计数器，其实在原本的counter更新计数器,如果原来没有，则新建key，如果有value则加一

# update()更新计数器，

d = collections.Counter('a')

counter.update(d)

print(counter)

# 输出如下

Counter({'a': 5, 'b': 4, 'c': 4, 'd': 2, 'e': 1, 'f': 1})

update()更新计数器，那么subtract()相减计数器的values，即原来的计数器中的每一个元素的数量减去后添加的元素的数量

counter.subtract('abdabcabcg')

print(counter)

# 输出如下

Counter({'a': 2, 'c': 2, 'b': 1, 'd': 1, 'e': 1, 'f': 1, 'g': -1})

deque

deque支持从任意一端增加和删除元素。更为常用的两种结构，就是栈和队列。

deque的常见操作

#定义一个空的双向队列

d = collections.deque()

#从右端增加元素

d.extend("Runsen")

d.append("Maoli")

d.append("Python")

d.append("king")

#从左端增加元素

d.appendleft('left')

print(d)

# 输出如下 (注意：extend和append的区别)

deque(['left', 'R', 'u', 'n', 's', 'e', 'n', 'Maoli', 'Python', 'king'])

# reverse()反转队列

print(d.reverse())

d.reverse()

print(d)

# 输出如下

None

deque(['king', 'Python', 'Maoli', 'n', 'e', 's', 'n', 'u', 'R', 'left'])

d.reverse()

d.extend(['qq','ww','ee'])

print(d)

# deque(['left', 'R', 'u', 'n', 's', 'e', 'n', 'Maoli', 'Python', 'king', 'qq', 'ww', 'ee'])

# count()计数

print(d.count('R'))

# 输出如下

# clear()清空队列

d.clear()

print(d)

# 输出如下

deque([])

# index()取得元素下标

print(d.index('Maoli'))

# 输出如下

# insert()指定位置插入元素

d.insert(1,'Runsen')

print(d)

# deque(['left', 'Runsen',R', 'u', 'n', 's', 'e', 'n', 'Maoli', 'Python', 'king', 'qq', 'ww', 'ee'])

OrderedDict

使用dict时要保持Key的顺序，可以用OrderedDict。

from collections import OrderedDict

dic = OrderedDict()

dic['k1'] = 'v1'

dic['k2'] = 'v2'

dic['k3'] = 'v3'

print(dic)

# 输出如下

OrderedDict([('k1', 'v1'), ('k2', 'v2'), ('k3', 'v3')])

# 字典所有的键

print(dic.keys())

# 输出如下

odict_keys(['k1', 'k2', 'k3'])

# 字典所有值

print(dic.values())

# 输出如下

odict_values(['v1', 'v2', 'v3'])

# items() 方法以列表返回可遍历的(键, 值) 元组数组

print(dic.items())

# 输出如下

odict_items([('k1', 'v1'), ('k2', 'v2'), ('k3', 'v3')])

#pop()方法，删除指定的键值

dic.pop('k1')

print(dic)

# 输出如下

OrderedDict([('k2', 'v2'), ('k3', 'v3')])

#popitem()方法，默认删除字典最后一个元素

dic.popitem()

print(dic)

# 输出如下

OrderedDict([('k2', 'v2')])

# update()更新字典

dic.update({'k1':'v1111','k10':'v10'})

print(dic)

# 输出如下

OrderedDict([('k2', 'v2'), ('k1', 'v1111'), ('k10', 'v10')])

OrderedDict和字典操作完全相同，区别在于OrderedDict的Key会按照插入的顺序排列，不是Key本身排序

>>> from collections import OrderedDict

>>> d = dict([('a', 1), ('b', 2), ('c', 3)])

>>> d # dict的Key是无序的

{'a': 1, 'c': 3, 'b': 2}

>>> od = OrderedDict([('a', 1), ('b', 2), ('c', 3)])

>>> od # OrderedDict的Key是有序的

OrderedDict([('a', 1), ('b', 2), ('c', 3)])

defaultdict

在使用字典的时候, 如果在使用不存在的key的时候发生KeyError这样的一个报错, 这时候就该defaultdict登场了。

defaultdict接受一个工厂函数作为参数来构造：dict =defaultdict( factory_function)这个factory_function可以是list、set、str等等，作用是当key不存在时，返回的是工厂函数的默认值，比如list对应[ ]，str对应的是空字符串，set对应set( )，int对应0，如下举例：

from collections import defaultdict

dict1 = defaultdict(int)

dict2 = defaultdict(set)

dict3 = defaultdict(str)

dict4 = defaultdict(list)

dict1[2] ='two'

print(dict1[1])

print(dict2[1])

print(dict3[1])

print(dict4[1])

# 输出如下

set()