毫无疑问,Python 是一门强类型语言。强类型语言。强类型语言!
这就意味着,不同类型的对象通常需要先做显式地类型转化, 然后才能进行某些操作。
下面以字符串和数字为例,看看强行操作会产生什么结果:
- >>> "Python猫" + 666
- Traceback (most recent call last):
- File "<stdin>", line 1, in <module>
- TypeError: can only concatenate str (not "int") to str
它报类型错误了(TypeError),说字符串只能连接(concatenate)字符串,不能连接 int 类型。 这正是强类型语言的基本约束。
但是,如果我们先把数字“转化”成字符串类型,再执行“+”操作,就不会报错了:
- >>> "Python猫" + str(666)
- 'Python猫666'
上面的这个例子,对读者们来说,应该并不难理解。
由此,我们要引出一个问题:如何在不作显式类型转化的情况下,进行字符串与数字类型的拼接呢?
在《详解Python拼接字符串的七种方式》这篇文章中,它梳理了七种拼接字符串的写法,我们可以逐个来试验一下。
几种字符串拼接方式:
1、格式化类:%、format()、template
2、拼接类:+、()、join()
3、插值类:f-string
为了节省篇幅,此处直接把可以顺利拼接的 4 种写法罗列如下:
- >>> "%s %d" % ("Python猫", 666)
- 'Python猫 666'
- >>> from string import Template
- >>> s = Template('${s1}${s2}')
- >>> s.safe_substitute(s1='Python猫',s2=666)
- 'Python猫666'
- >>> "Python猫{}".format(666)
- 'Python猫666'
- >>> num = 666
- >>> f"Python猫{num}"
- 'Python猫666'
第一种写法(即 % 格式化)来自古老的 C 语言,其中的“%d”是一个占位符,表示它将要接收一个整数,并格式化成字符串。
第二和第三种写法,它们是第一种写法的升级版,不同的是,它们的占位符是通用型的,不必指定“%s”、“%d”等等明确的类型。这两种写法中,数字类型的参数被传给特定的格式化方法(即 safe_substitute 与 format),在这些方法的内部,它们会作类型转化处理。
可以说,上述三种写法都不难理解,它们的意图都有迹可循。
但是,现在再看看最后一种写法,也就是 f-string 写法,似乎就不是那么明显了。
首先,在字符串内部,它并没有像“%格式化”那样指定占位符的类型;其次,所要拼接的数字并没有作为任何函数的参数来传递。
也就是说,在明面上根本看不出任何要作类型转化的意图。但是,由于我们已知 Python 是强类型语言,已知数字类型绝对不可能直接拼接到字符串里,因此,只能说明 f-string 语法在底层作了某种类型转化的操作!
那么,我们就可以再提出一个新的问题:f-string 语法在处理字符串与数字时,是如何实现数字的类型转化的呢?
也许有的读者会猜想它是调用了内置的 str() 或 repr()(或它们对应的魔术方法__str__() 与 __repr__()),从而实现类型转化,但是,答案并没有如此简单!
f-string 语法是在 Python 3.6 版本引入的。为了省事,我们直接找到 PEP-498 文档,在里面查阅看是否有关于实现原理的线索。
文档地址:https://www.python.org/dev/peps/pep-0498
PEP 里提到f-string 的语法格式是这样的:
- f'<text> { <expression> <optional !s, !r, or !a> <optional : format specifier> } <text> ...'
其中,花括号里的内容就是要作格式化的内容,除去可选的“optional”部分后,“expression”部分就是真正要处理的内容。对应前文的例子,数字 666 就是一个 expression。
expression 会按 __format__ 协议进行格式化,但是并不会直接调用 __format__() 这个方法。
文档上指出,实际的执行过程等效于type(value).__format__(value, format_spec)或者 format(value, format_spec) 。
事实上,字符串对象的 foramt() 方法跟 Python 内置的 foramt() 函数,它们都会调用__format__() 魔术方法,所以,f-string 其实是前文中 format() 格式化写法的升级版。
在默认情况下,format_spec 是一个空字符串,而format(value, "") 的效果等同于str(value) ,因此,在不指定其它 format_spec 的情况下,可以简单地认为 f-string 就是调用了 str() 来作的类型转化……
至此,我们看到了 f-string 的实现原理,明白了它在拼接字符串与数字时,效果等效于前文的 format() 格式化方法,也等效于使用 str() 进行类型转化。
本文转载自微信公众号「Python猫」,可以通过以下二维码关注。转载本文请联系Python猫公众号。