你严重低估了defaultdict的偷懒能力!

开发 后端
今天来和大家聊聊日常经常使用到的偷懒方法 --> defaultdict

字典作为日常使用频率较高的一种数据类型,常会遇到判断key是否在字典中的情况。

这时,我们是否按照如下代码写的:

d = dict()
if 'key' in d:
d['key'] += 1
else:
d['key'] = 0
print(d['key']) # 1

我们每次都需要判断后再进行相关操作。

但是,当我们使用了defaultdict后,就可以偷懒的简化if else 的格式了:

from collections import defaultdict
d = defaultdict(int)
d["key"] += 1
print(d['key']) # 1

关于defaultdict

大家日常使用到defaultdict的场景,绝大多数都是上述举例为了减少if else的判断。

当然除了默认的int初始化,还有列表追加 d = defaultdict(list) 的无脑append操作。

可是,我们是否有深挖过defaultdict的其他场景呢?来先看看它的源码:

源码注释中,只是简单说明了使用default_factory参数,可以让调用键不存在时生成新值。

def __init__(self, default_factory=None, **kwargs):  
# known case of _collections.defaultdict.__init__
"""
defaultdict(default_factory=None, /, [...]) -->
dict with default factory
The default factory is called without arguments to produce
a new value when a key is not present, in __getitem__ only.
A defaultdict compares equal to a dict with the same items.
All remaining arguments are treated the same as if they were
passed to the dict constructor, including keyword arguments.
# (copied from class doc)
"""
pass

就比如我们上面 defaultdict(int) 将key不存在时,value默认赋值0, d = defaultdict(list)  将key不存在时,value默认赋值空列表。

听起来功能就是如此了吧...

现在我们来换个场景,拿同学们打力扣周赛举个例子。

力扣周赛

每个人参加力扣周赛时,会根据我们的比赛结果进行评分。如果是第一次参加比赛,因为没有初始积分,从0分开始不太合适。

所以每位选手的初始基准分为1500分。这样就可以根据选手分数来考量本次比赛表现进行加分了。

先来看看默认字典的代码应该如何操作:

scores = dict()
add_score = 10
# 方法1
if 'xiaoming' in scores:
scores['xiaoming'] += add_score
else:
scores['xiaoming'] = 1500 + add_score
# 方法2
scores['xiaoming'] = scores.get('xiaoming', 1500) + add_score

现在我们想使用defaultdict,但defaultdict如果赋值int,就没办法提供这个基准分了,该如何是好?

此时我们应该深入理解下 default_factory ,它不仅仅支持我们传入默认的int、list,还支持我们使用自定义函数。

from collections import defaultdict
def diy_func():
print("init user score.")
return 1500
scores = defaultdict(diy_func)
scores['xiaoming'] += 10
print(scores['xiaoming'])
# init user score.
# 1510

我们通过自定义一个函数赋值给  default_factory, 帮我们初始化用户的分数。

但这个自定义的函数方法有些太过单一了,是否可以简化?此时我们应该考虑到lambda表达式啊!

scores = defaultdict(lambda: 1500)
scores['xiaoming'] += 10
print(scores['xiaoming'])

这样做是不是就更简洁方便了。有没有觉得这操作很nice?

然而,我们注意到defaultdict的 __init__ 方法是存在 **kwargs** 参数,我们还没有使用呢!

它还可以这么玩:

from collections import defaultdict
data = defaultdict(xiaozhang=1600, xiaowang=1700)
scores = defaultdict(lambda: 1500, data)
scores['xiaoming'] += 10
scores['xiaowang'] -= 15
print(scores.items())
# dict_items([('xiaozhang', 1600), ('xiaowang', 1685), ('xiaoming', 1510)])

所以,defaultdcit可以在 使用 default_factory 的基础上,导入初始的字典进行。是不更溜了?

关于default_dict的内容,今天就学到这里吧,希望对大家有所帮助。

责任编辑:庞桂玉 来源: 简说Python
相关推荐

2021-05-21 07:26:15

DataSource接口数据库

2023-02-14 07:50:30

Python模块

2020-11-30 22:50:48

AWS服务云计算

2021-04-21 09:19:44

装饰器Python

2013-01-14 09:36:54

程序员程序员价值

2020-10-04 11:34:28

JavaScript开发技术

2024-10-21 13:11:50

2009-12-21 10:05:00

2022-11-03 11:23:33

阿里云云计算

2017-05-08 11:02:59

TensorFlow神经网络深度学习

2022-08-01 14:57:24

元宇宙区块链元分析

2024-11-29 10:46:53

2023-06-21 11:19:21

2013-03-19 10:30:28

苹果三星Galaxy S4

2020-05-14 18:50:35

Chrome漏洞浏览器

2024-02-19 09:38:58

2021-03-29 12:57:31

漏洞OpenSSLDos

2020-10-09 17:38:12

开源开发技术

2018-08-07 16:21:27

计算机知识能力

2015-03-18 10:16:57

程序员程序员如何偷懒
点赞
收藏

51CTO技术栈公众号