在 Python 的标准库中,有一个非常有用的数据结构工具叫做 defaultdict。它是 collections 模块的一部分,提供了一种特殊的字典类型,可以在访问不存在的键时返回一个默认值。本文将介绍 defaultdict 的用法,包括其基本语法、常见用例。
1. 基本语法
defaultdict 类的构造函数与普通字典的构造函数类似,但需要传入一个默认工厂函数作为参数。默认工厂函数用于在访问不存在的键时返回一个默认值。以下是 defaultdict 的基本语法:
from collections import defaultdict
d = defaultdict(default_factory)
在上述代码中,default_factory 是一个函数对象,用于定义默认值的生成规则。
2. 常见用例
a. 计数器
一个常见的用例是使用 defaultdict 实现计数器。假设我们有一个列表,想要统计每个元素出现的次数。可以使用 defaultdict 来简化代码:
from collections import defaultdict
counter = defaultdict(int)
data = [1, 2, 3, 1, 2, 3, 4, 5, 4, 3, 2, 1]
for num in data:
counter[num] += 1
print(counter)
输出:
defaultdict(<class 'int'>, {1: 3, 2: 3, 3: 3, 4: 2, 5: 1})
解析:在上述代码中,我们创建了一个 defaultdict 对象 counter,并将 int 函数作为默认工厂函数。在遍历列表 data 时,我们对 counter[num] 进行自增操作,由于初始时 counter 中不存在键 num,defaultdict 会自动使用 int 函数生成一个默认值 0,然后执行自增操作。最终,我们得到了每个元素出现次数的统计结果。
b. 分组
另一个常见的用例是使用 defaultdict 进行分组。假设我们有一个包含学生姓名和对应班级的列表,想要按班级将学生分组。可以使用 defaultdict 来实现:
from collections import defaultdict
students = [('Alice', 'A'), ('Bob', 'B'), ('Charlie', 'A'), ('Dave', 'B')]
grouped_students = defaultdict(list)
for name, group in students:
grouped_students[group].append(name)
print(grouped_students)
输出:
defaultdict(<class 'list'>, {'A': ['Alice', 'Charlie'], 'B': ['Bob', 'Dave']})
解析:在上述代码中,我们创建了一个 defaultdict 对象 grouped_students,并将 list 函数作为默认工厂函数。在遍历学生列表 students 时,我们将每个学生的姓名 name 添加到对应班级 group 的列表中。由于初始时 grouped_students 中不存在键 group,defaultdict 会自动使用 list 函数生成一个空列表,然后将学生姓名添加到列表中。最终,我们得到了按班级分组的学生列表。
结论
defaultdict 是 Python 中一个非常实用的数据结构工具,可以在访问不存在的键时返回一个默认值。通过使用 defaultdict,我们可以简化代码,提高效率,并且使代码更加易读。它特别适用于计数器和分组等常见场景。