Python 中的 defaultdict 有什么用的?

开发 前端
defaultdict​ 是 Python 中一个非常实用的数据结构工具,可以在访问不存在的键时返回一个默认值。通过使用 ​defaultdict​,我们可以简化代码,提高效率,并且使代码更加易读。它特别适用于计数器和分组等常见场景。​

在 Python 的标准库中,有一个非常有用的数据结构工具叫做 defaultdict。它是 collections 模块的一部分,提供了一种特殊的字典类型,可以在访问不存在的键时返回一个默认值。本文将介绍 defaultdict 的用法,包括其基本语法、常见用例。

1. 基本语法

defaultdict 类的构造函数与普通字典的构造函数类似,但需要传入一个默认工厂函数作为参数。默认工厂函数用于在访问不存在的键时返回一个默认值。以下是 defaultdict 的基本语法:

from collections import defaultdict

d = defaultdict(default_factory)

在上述代码中,default_factory 是一个函数对象,用于定义默认值的生成规则。

2. 常见用例

a. 计数器

一个常见的用例是使用 defaultdict 实现计数器。假设我们有一个列表,想要统计每个元素出现的次数。可以使用 defaultdict 来简化代码:

from collections import defaultdict

counter = defaultdict(int)
data = [1, 2, 3, 1, 2, 3, 4, 5, 4, 3, 2, 1]

for num in data:
   counter[num] += 1

print(counter)

输出:

defaultdict(<class 'int'>, {1: 3, 2: 3, 3: 3, 4: 2, 5: 1})

解析:在上述代码中,我们创建了一个 defaultdict 对象 counter,并将 int 函数作为默认工厂函数。在遍历列表 data 时,我们对 counter[num] 进行自增操作,由于初始时 counter 中不存在键 num,defaultdict 会自动使用 int 函数生成一个默认值 0,然后执行自增操作。最终,我们得到了每个元素出现次数的统计结果。

b. 分组

另一个常见的用例是使用 defaultdict 进行分组。假设我们有一个包含学生姓名和对应班级的列表,想要按班级将学生分组。可以使用 defaultdict 来实现:

from collections import defaultdict

students = [('Alice', 'A'), ('Bob', 'B'), ('Charlie', 'A'), ('Dave', 'B')]

grouped_students = defaultdict(list)

for name, group in students:
   grouped_students[group].append(name)

print(grouped_students)

输出:

defaultdict(<class 'list'>, {'A': ['Alice', 'Charlie'], 'B': ['Bob', 'Dave']})

解析:在上述代码中,我们创建了一个 defaultdict 对象 grouped_students,并将 list 函数作为默认工厂函数。在遍历学生列表 students 时,我们将每个学生的姓名 name 添加到对应班级 group 的列表中。由于初始时 grouped_students 中不存在键 group,defaultdict 会自动使用 list 函数生成一个空列表,然后将学生姓名添加到列表中。最终,我们得到了按班级分组的学生列表。

结论

defaultdict 是 Python 中一个非常实用的数据结构工具,可以在访问不存在的键时返回一个默认值。通过使用 defaultdict,我们可以简化代码,提高效率,并且使代码更加易读。它特别适用于计数器和分组等常见场景。

责任编辑:武晓燕 来源: 科学随想录
相关推荐

2024-02-19 00:00:00

Python​starmap函数

2024-02-22 12:18:16

Python函数用法

2023-07-21 17:08:30

2024-08-28 11:58:02

2020-04-23 14:09:13

URI挖坑前端

2024-01-25 10:23:22

对象存储存储数据

2020-12-22 10:12:40

Python科学机器学习

2023-12-20 14:48:26

2022-05-05 07:38:32

volatilJava并发

2017-09-19 15:22:44

2009-06-17 15:51:55

java有什么用

2017-11-22 15:50:58

Netty微服务RPC

2020-08-10 07:44:13

虚拟内存交换内存Linux

2022-07-29 08:25:02

volatileC语言原子

2021-04-24 10:59:30

CSS伪类占位符

2021-02-21 23:49:45

比特币货币人民币

2019-10-14 10:29:42

Java消息队列

2023-05-20 17:48:39

Linux/tmp/var/tmp

2021-09-03 06:33:24

布隆过滤器高并发

2023-09-07 23:06:07

点赞
收藏

51CTO技术栈公众号