从功能强大的新任务语法到底层大更新,Python 3.8迈向更现代的Python代码库。
3.8是Python这个流行语言的***版本,适用于从自动化脚本编写、机器学习到Web开发的所有内容。现在可以获得官方测试版,Python 3.8带来了许多灵活的语法更改,内存共享,更高效的序列化和反序列化,修改后的词典等等。
当然,Python 3.8也***了各种性能改进。总体结果是让Python更快,更简洁,更一致,更现代化。以下是Python 3.8中***,最重要的内容。
赋值表达式
Python 3.8中最明显的变化是赋值表达式,它使用了酷似海象的运算符(:=)。赋值表达式允许在表达式的上下文中将值赋给变量,甚至是尚不存在的变量,而不是作为独立语句。
- while (line := file.readline()) != "end":
- print(chunk)
在此示例中,如果变量行不存在,则创建变量行,然后从file.readline()分配值。然后检查行以查看它是否等于“结束”。如果不是,则读取下一行,存储在行中,测试,等等。
赋值表达式遵循Python中可理解的简洁性的传统,包括列表推导。在这里,我们的想法是减少一些易于出现在某些Python编程模式中的繁琐样板。例如,上面的代码片段通常需要多于两行代码才能表达。
强制某些参数仅为位置
函数定义的新语法,仅位置参数,允许开发人员强制某些参数仅为位置。这消除了关于函数定义中哪些参数是位置的以及哪些是关键字参数的任何歧义。
仅限位置参数可以定义场景,例如,函数接受任何关键字参数但也可以接受一个或多个位置。 Python内置函数通常就是这种情况,因此为Python开发人员提供了一种方法,可以增强语言的一致性。
Python文档中的一个例子:
- def pow(x, y, z=None, /):
- r = x**y
- if z is not None:
- r %= z
- return r
/将位置与关键字参数分开; 在这个例子中,所有的参数都是位置的。在以前的Python版本中,z将被视为关键字参数。 给定上述函数定义,pow(2,10)和pow(2,10,5)是有效调用,但pow(2,10,z = 5)不是。
F字符串调试支持
f-string格式提供了一种方便(且性能更高)的方式来在同一表达式中打印文本和计算值或变量:
- x = 3
- print(f'{x+1}')
这将打印4。
在f字符串表达式的末尾添加=会打印f-string表达式本身的文本,后跟值:
- x = 3
- print (f'{x+1=}')
这将打印x + 1 = 4。
多处理模块共享内存
使用Python 3.8,多处理模块现在提供了一个SharedMemory类,允许在不同的Python进程之间创建和共享内存区域。
在以前的Python版本中,只能通过将数据写入文件,通过网络套接字发送或使用Python的pickle模块对其进行序列化来在进程之间共享数据。共享内存为在进程之间传递数据提供了更快的路径,使Python能够更有效地使用多个处理器和处理器内核。
共享内存段可以分配为字节的原始区域,或者它们可以使用不可变的类似列表的对象,这些对象存储Python对象的一小部分 - 数字类型,字符串,字节对象和None对象。
打字模块的改进
Python是动态类型的,但支持通过输入模块使用类型提示,以允许第三方工具验证Python程序。 Python 3.8为键入添加了新元素,以便更加可靠地进行检查:
- final decorator 和Final type annotation表明decorated/annotated 的对象不应在任何位置被覆盖,子类化或重新分配。
- Literal类型将表达式限制为特定值或值列表,不一定是相同类型。
- TypedDict类型允许创建字典,其中与某些键关联的值仅限于一个或多个特定类型。 请注意,这些限制仅限于在编译时可以确定的内容,而不是在运行时。
新版本的pickle协议
Python的pickle模块提供了一种序列化和反序列化Python数据结构的方法,例如,允许将字典原样保存到文件中并在以后重新加载。不同版本的Python支持不同级别的pickle协议,更新版本支持更广泛的功能和更高效的序列化。
使用Python 3.8引入的pickle第5版提供了一种新方法,来pickle实现Python缓冲区协议的对象,例如字节,内存视图或NumPy数组。新的pickle减少了必须为这些对象制作的内存副本数量。
像NumPy和Apache Arrow这样的外部库在他们的Python绑定中支持新的pickle协议。新的pickle也可以作为PyPI的Python 3.6和Python 3.7的附件提供。
可逆词典
Python中的字典完全用Python 3.6重写,使用PyPy项目提供的新实现。除了更快更紧凑外,词典现在还具有其元素的固有顺序;它们是在添加时订购的,就像列表一样。 Python 3.8允许在字典上使用reversed()。
性能改进
- 许多内置方法和函数已经加速了20%到50%,因为其中许多方法和函数不必要地转换传递给它们的参数。
- 新的操作码缓存可以加速解释器中的某些指令。但是,目前唯一实现的加速是针对LOAD_GLOBAL操作码,现在快40%。计划对更高版本的Python进行类似的优化。
- 文件复制操作(例如shutil.copyfile()和shutil.copytree())现在使用特定于平台的调用和其他优化来加速操作。
- 由于优化利用列表构造函数对象的长度(如果事先已知),现在新创建的列表现在平均比以前小12%。
- 在Python 3.8中,在新式类(例如,类A(对象))上写入类变量要快得多。
- operator.itemgetter()和collections.namedtuple()也有新的速度优化。
Python C API和CPython改进
在Python的***版本中,主要的工作是重构CPython中使用的C API,这是用C编写的Python的参考实现。到目前为止,这项工作只产生了增量变化,但它们正在加起来:
- 用于Python初始化配置的新C API允许对Python的初始化例程进行更严格的控制和更详细的反馈。 这样可以更轻松地将Python运行时嵌入到应用程序中,并以编程方式将启动参数传递给Python。 这个新API还旨在确保所有Python的配置控件都具有单一,一致的主页,以便将来更改(如Python的新UTF-8模式)更容易插入。
- 另一个用于CPython的新C API,即“vectorcall”调用协议,允许更快地调用内部Python方法,而无需创建临时对象来处理调用。API仍然不稳定,但已暂时可用。 计划是从Python 3.9开始最终确定它。
- Python运行时审计挂钩在Python运行时中提供了两个API,用于挂钩事件并使它们可以观察到外部工具,如测试框架或日志记录和审计系统。