你严重低估了defaultdict的偷懒能力！-偷懒也是一种能力

字典作为日常使用频率较高的一种数据类型，常会遇到判断key是否在字典中的情况。

这时，我们是否按照如下代码写的：

d = dict()
if 'key' in d:
   d['key'] += 1
else:
   d['key'] = 0
print(d['key']) # 1

我们每次都需要判断后再进行相关操作。

但是，当我们使用了defaultdict后，就可以偷懒的简化if else 的格式了：

from collections import defaultdict
d = defaultdict(int)
d["key"] += 1
print(d['key']) # 1

关于defaultdict

大家日常使用到defaultdict的场景，绝大多数都是上述举例为了减少if else的判断。

当然除了默认的int初始化，还有列表追加 d = defaultdict(list) 的无脑append操作。

可是，我们是否有深挖过defaultdict的其他场景呢？来先看看它的源码：

源码注释中，只是简单说明了使用default_factory参数，可以让调用键不存在时生成新值。

def __init__(self, default_factory=None, **kwargs):  
       # known case of _collections.defaultdict.__init__
       """
        defaultdict(default_factory=None, /, [...]) -->  
       dict with default factory
       The default factory is called without arguments to produce
       a new value when a key is not present, in __getitem__ only.
       A defaultdict compares equal to a dict with the same items.
       All remaining arguments are treated the same as if they were
       passed to the dict constructor, including keyword arguments.
       # (copied from class doc)
       """
       pass

就比如我们上面 defaultdict(int) 将key不存在时，value默认赋值0， d = defaultdict(list) 将key不存在时，value默认赋值空列表。

听起来功能就是如此了吧...

现在我们来换个场景，拿同学们打力扣周赛举个例子。

力扣周赛

每个人参加力扣周赛时，会根据我们的比赛结果进行评分。如果是第一次参加比赛，因为没有初始积分，从0分开始不太合适。

所以每位选手的初始基准分为1500分。这样就可以根据选手分数来考量本次比赛表现进行加分了。

先来看看默认字典的代码应该如何操作：

scores = dict()
add_score = 10
# 方法1
if 'xiaoming' in scores:
   scores['xiaoming'] += add_score
else:
   scores['xiaoming'] = 1500 + add_score
# 方法2
scores['xiaoming'] = scores.get('xiaoming', 1500) + add_score

现在我们想使用defaultdict，但defaultdict如果赋值int，就没办法提供这个基准分了，该如何是好？

此时我们应该深入理解下 default_factory ，它不仅仅支持我们传入默认的int、list，还支持我们使用自定义函数。

from collections import defaultdict
def diy_func():
   print("init user score.")
   return 1500
scores = defaultdict(diy_func)
scores['xiaoming'] += 10
print(scores['xiaoming'])
# init user score.
# 1510

我们通过自定义一个函数赋值给 default_factory，帮我们初始化用户的分数。

但这个自定义的函数方法有些太过单一了，是否可以简化？此时我们应该考虑到lambda表达式啊！

scores = defaultdict(lambda: 1500)
scores['xiaoming'] += 10
print(scores['xiaoming'])

这样做是不是就更简洁方便了。有没有觉得这操作很nice？

然而，我们注意到defaultdict的 __init__ 方法是存在 **kwargs** 参数，我们还没有使用呢！

它还可以这么玩：

from collections import defaultdict
data = defaultdict(xiaozhang=1600, xiaowang=1700)
scores = defaultdict(lambda: 1500, data)
scores['xiaoming'] += 10
scores['xiaowang'] -= 15
print(scores.items())
# dict_items([('xiaozhang', 1600), ('xiaowang', 1685), ('xiaoming', 1510)])

所以，defaultdcit可以在使用 default_factory 的基础上，导入初始的字典进行。是不更溜了？

关于default_dict的内容，今天就学到这里吧，希望对大家有所帮助。