Python3.9 刚刚发布不久,Python3.10 的第二个 alpha 版本也已于 11 月初发布。透过这个版本,我们或许可以一窥 Python 的未来改变。
Python3.10 第二个 alpha 版本的新功能包括以下三大部分:
类型注释扩展
为什么类型注释很重要
新方法和行为
类型注释扩展
Python3.9 版本对类型提示与注释进行了彻底的修改和清理。Python3.10 版本似乎延续了这一趋势,Python3.10 alpha 2 版本将类型注释功能进行了扩展。
从 Python 3.0 到 Python 3.10 类型注释的变化。
类型注释的延迟评估
类型注释的评估始终在函数定义时执行,这意味着类型注释以自上而下的方式逐行进行评估。这看似合乎逻辑,但存在两个问题:
引用尚未定义的类型(前向引用)的类型提示无效,必须以字符串形式表示。例如应该是「“int”」而不是「int」(尽管这仅适用于自定义类型,而不是内置 / 预定义类型)。
由于需要执行类型提示,模块导入的速度减慢。
因此,注释将被存储在 __annotations__,然后进行集中评估,即允许前向引用并首先执行模块导入(以减少初始化时间)。
Union 操作符类型
Python 3.10 引入了 | 操作符。在注释数据类型时,可以使用 | 作为 OR。例如,存在一个预计为 int 或 float 的变量,我们可以将其写作 int | float:
在 3.10 之前的版本中,等效运算符使用 type.Union 方法进行编写,例如 Union[int, float]。
TypeAlias 注释
回到前向引用问题,避免前向引用的常见解决方案是将它们作为字符串写入。
但是,将类型作为字符串编写,会在将这些类型分配给变量时出现问题,因为 Python 假设字符串文本类型注释只是一个字符串。
在使用类型注释的地方使用该类型注释变量将返回错误。例如:
我们正在尝试使用 MyType 作为类型的别名(alias),但是 MyType 将被读取为字符串值,而不是类型别名。
只要在后面的代码中定义了 ClassName,这就是有效的。目前,这将引发注释错误。
为了解决这个问题,该版本添加了一个显式地将 MyType 识别为类型别名的方法:
为什么类型注释很重要
Python 的强大之处在于它易于使用和掌握,原因之一就是我们不需要在整个代码中显式地定义类型。
这看似违背常理,但允许开发人员定义类型可以极大地增强代码库的可读性和可维护性。例如从 transformers 库的源代码中提取如下内容:
即使没有上下文,我们也可以读取这些代码,并了解应该向这些函数、类和方法提供哪些数据,以及应该返回哪些数据类型。
在复杂的代码库(甚至是简单的代码库)中,类型注释可以极大地提高可读性。同时,并不是每个开发者都想(或需要)使用类型注释,因此可选的、无异常的功能可以达到完美的平衡。
新方法和实现
除了类型注释方面的更改之外,3.10 alpha 2 版本对其他核心功能也进行了一些更新。
为 Zip 添加等长标记
第一个是 PEP 618,它为 zip() 函数添加了一个可选的 strict 标记。设置 strict = True,如果 zip 的两个输入长度不等,则会引发错误。
左侧无 strict=True 标记,没有引发错误,并且较长的列表被截断用于创建压缩生成器。如果设置 strict = True,就会引发错误。
整数的位计数
也叫做「总体计数」(population count)。这一新方法允许计算整数二进制表示中 1 的个数,只需写 int.bit_count() 即可:
字典视图映射
三种字典方法 dict.keys()、dict.values() 和 dict.items() 返回字典的不同视图。现在,将 mapping 属性添加到每个视图对象。
这一新属性是 types.MappingProxyType 对象,用来包装原始字典。如果在视图上调用它,则返回原始字典。