Python 对于初学者来说是一门优秀的语言,但这并不意味着就不会犯错误。 尤其是在学习编程的早期阶段,很容易编写出技术上正确但风格上很差的代码。
如果您要学习编码,那么学好它是至关重要的。 无论是在学术界还是工业界,代码的质量都很重要。 它不仅会影响您,还会影响将继续阅读和使用您的代码的每一个人。 也许更自私的是,它还会影响您的招聘前景。
在本文中,我将讨论介绍性 Python 程序员常犯的四个错误。 在我早期的 Python 时代学习这些陷阱对我非常有帮助,我希望它也能对你有用。
让我们开始吧。
布尔条件语句
这是入门程序员常犯的错误。 这也是不那么入门的程序员所犯的错误,他们缺乏正式的编程背景,因为他们只是将代码用作工具。 我在看着你,数据科学家。
Python 中的条件语句很有用,但并不总是必需的。 当您检查的条件已经包含布尔值(真或假)时,尤其如此。
让我用一个简单的例子来说明。 假设我们要编写代码来确定一个数据集是否已经被清理过。 对我们来说幸运的是,代码库包含一个名为 is_data_clean 的方便变量,它可以跟踪这一点。 我们需要做的就是检查它并返回正确的值。
作为第一次尝试,我们可能会编写如下内容:
这已经可以运行了,但它不必如此复杂。 你看到问题了吗? 仔细看。
变量 is_data_clean 已经是一个布尔值; 因此,它已经包含了您需要返回的值! 代码检查它是否为 True,然后返回 True,如果它不是 True(意味着它为 False),则代码返回 False。 这只是一大堆不必要的检查。
我们可以将函数中的代码简化为一行:
好多了。
手动求和、均值或其他内置操作
Python 具有比大多数人意识到的更多的内置功能。 仍然使用循环来手动计算总和的人数实在是太多了。
如果我们在 Python 中有一个数字列表,我们绝对不应该像这样计算总和:
请改用内置的求和函数:
需要最小值还或最大值? 全宇宙都禁止你写这样的代码:
这不是介绍性的计算机科学原理课程; 这是真实的世界。 停止重新发明轮子并使用内置的 min 和 max 函数:
有关内置函数的完整列表,请参阅 Python 文档
奖励:技术上不是内置的内置功能。
有些功能很难找到,但这并不意味着您不应该找到它们。
例如,如果我们需要一列数字的平均值(您可能会感觉到这是反复出现的主题),我们可以使用下面的第一个代码片段,但我们应该使用第二个:
通常,Python 会在模块中提供有用的函数。 定位我们需要的模块并导入函数可能需要一些额外的工作,但非常值得。
请记住 — Python 就是简单性和可读性。 内置函数是你的朋友。 与你的人类朋友不同,他们永远不会让人失望。
不做无意义的事情
在我教授的一门 Python 入门课程中,学生的第一个项目是编写一个简单的决策算法。 这主要是一个条件练习,要求学生定义一个问题和相关的评分系统,以确定某人有资格回答这个问题的可能性。
例如,有人可能会问,“我应该成为一名数据科学家吗?” 然后,该算法可能包含以下问题,所有这些问题都会根据答案从最终输出分数中增加或减少:
- 我是否有兴趣使用数据来深入了解世界?
- 我愿意学习 Python 吗?
- 我喜欢与多学科团队合作吗?
等等。
在编写算法的过程中,许多学生意识到在某些情况下,他们根本不想对总分做任何事情。 例如,他们可能会决定,如果有人愿意学习 Python,那么他们的总分会增加 10 分,但如果他们不愿意,则分数保持不变。
大多数学生使用以下代码实现它:
这是什么都不做的经典案例。 让我们分解一下 Python 在看到代码行 score += 0 时必须执行的所有操作:
- 它需要查找变量 score 的值。
- 它需要将 0 添加到该值。 这需要调用加法函数,传入两个参数(当前值和 0),并计算输出。
- 将 score 变量重新分配给新值(显然是相同的)。
所有这些代码什么都不做。
当然,这对计算机来说不是很大的工作量,也不会对代码的效率产生任何有意义的影响。 也就是说,它毫无意义,而且有些不干净,这是优秀 Python 代码所不具备的特征。
更好的解决方案是使用 Python 的 pass 关键字,它实际上告诉 Python 什么都不做,继续前进。 它填充了一行不需要的代码,但如果完全留空就会出错。 我们甚至可以添加一点评论以提供进一步的清晰度:
更干净、更清晰、更 Pythonic。
单一的条件变得疯狂
条件语句可以说是标准编程中最强大和一致的结构之一。 第一次学习它时,很容易忽略一个重要的微妙之处。
当我们要检查两个或多个条件时,就会出现这种情况。 例如,假设我们正在审查一项调查,以获取以下三种形式之一的回答:“Yes”、“No”或“Maybe”。
早期的 Python 程序员通常使用以下两种方式之一对此进行编码:
在这种情况下,这两个代码片段实际上是相同的。 它们的行为方式相同,理解起来并不特别混乱,并且它们实现了预期的目标。 当人们错误地认为上面的两个结构总是等价时,问题就出现了。
这是错误的。 上面的第二个代码片段是由多个部分组成的单个条件表达式,而第一个代码片段由三个独立的条件表达式组成,尽管它们看起来是相互关联的。
为什么这很重要? 因为每当 Python 看到一个全新的 if 关键字(即一个新的条件表达式开始)时,它就会检查关联的条件。 另一方面,如果当前条件表达式中的先前条件不满足,Python 只会输入 elif 或 else 条件。
让我们看一个例子,看看为什么这很重要。 假设我们需要编写代码,根据学生在某项作业中的分数给他们打分。 我们在Python 文件中写入以下代码:
运行此代码输出以下内容:
你看得到差别吗? 在第二种情况下,我们得到了意想不到的输出。 为什么? 因为 Python 将每个 if 语句作为一个新的条件来读取,所以如果一个分数恰好小于多个数字检查,则会为所有这些打印出相应的字母等级。
现在,有多种方法可以使用多个 if 语句; 例如,我们可以让条件检查范围而不仅仅是上限。 这个例子的重点不是争论一个例子优于另一个例子(尽管为了清楚起见,我个人倾向于使用 elif 和 else),而只是为了说明它们是不一样的。
确保你明白这一点。
最后的想法和回顾
这是您的 Python 初学者备忘单:
- 当您可以简单地直接返回布尔值时,不要为布尔值设置不必要的条件。
- 内置函数是您最好的朋友。
- 如果您需要告诉 Python 什么都不做,请使用 pass 关键字。
- 确保正确构造条件表达式,理解 if 、 elif 和 else 关键字的含义。
你决定学习 Python 真是太好了——我向你保证,这门语言会对你很好。