一文搞懂Python中的核心概念:导入,模块,包

开发 后端
Python作为一个解释器,一个程序,如果不导入任何外部模块或包,就做不了什么。理解Python如何导入模块和包将在几乎所有的场景中都很有帮助。

[[410523]]

本文转载自微信公众号「Python学会」,作者Huangwei AI。转载本文请联系Python学会公众号。

前言

Python作为一个解释器,一个程序,如果不导入任何外部模块或包,就做不了什么。理解Python如何导入模块和包将在几乎所有的场景中都很有帮助。

本文中的所有代码都是在Linux(Ubuntu)中应用和测试的,Windows和macOS应该(希望)是类似的。

当PIP安装一个包时会发生什么

当我们使用pip安装包时:

 

  1. pip install <pkg_name> 

包进入系统范围的文件夹

  1. /home/<user_name>/.local/lib/python3.x/site-packages 

这里的“系统范围”是指所有Python程序都可以访问已安装的软件包。

从哪里进口(import)

当使用import关键字导入包时,Python会循环sys. path中的路径列表。加载它的路径。

运行这个,查看路径列表:

  1. import sys 
  2. print(sys.path) 

这是我的。你的应该类似:

  1. ['''/usr/lib/python36.zip''/usr/lib/python3.6''/usr/lib/python3.6/lib-dynload''/home/andrewzhu/.local/lib/python3.6/site-packages''/usr/local/lib/python3.6/dist-packages''/usr/lib/python3/dist-packages''/usr/lib/python3.6/dist-packages'

第一个空的"表示当前文件夹,因此Python运行时(或import关键字)可以访问位于运行Python脚本的同一文件夹中的任何包。

通过了解这一点,下次如果您想部署一个定制包,而不是从pip或condo。你从Github上窃取/抓取的东西,想让所有Python程序都能访问它,不管它位于哪里。你知道把包裹放在哪里。

顺便说一下,要获取当前目录路径,请运行:

  1. import os 
  2. print(os.getcwd()) 

导入模块的最佳方法是什么

正如Python的禅宗所说:“显式比隐式好”。如果你给一些东西命名,比如i, td,几周后,即使是你,这个程序的作者也不明白这些变量的含义。

所以,

规则1:明确。

Python作为一种脚本语言已经相对较慢了,为了使你的程序更快,需要加载模块。

规则2:只需要导入。

如果您正在编写一个可能被其他程序调用的程序,请注意命名冲突。其他可能在下游程序中给出相同的名称,并且可能会受到“类型错误异常”的欢迎。

规则3:取正确的名字。

您可能会看到下面列出的许多导入样式,但是哪一种是最好的,哪一种应该避免?

  1. # style 1 
  2. import a_package  
  3. or style 2 
  4. import a_package as p 
  5. or style 3 
  6. from a_package import a_item 
  7. or style 4 
  8. from a_package import * 
  9. or style 5  
  10. from a_package import a_item as my_item 

样式1是可以的,但是它将导入这个包中的所有模块,在导入datetime的情况下。当你想要获得当前时间时,代码会像这样形成:

  1. import datetime  
  2. now_time = datetime.datetime.now() 

注意,有双日期时间,如果您正在阅读一个很长的代码文件,每当您看到日期时间,将使您认为它是哪个日期时间,它是一个模块或包?

样式2将在某种程度上解决这个问题,你可以给datetime一个新的名称,也许是一个唯一的名称,像这样:

  1. import datetime as az_datetime_pkg 
  2. now_time = az_datetime_pkg.datetime.now() 

az_的意思是,它来自Andrew Zhu, _pkg表示它是从某处导入的包。但是,每次都输入包名是很繁琐的。

样式3解决了繁琐的问题,通过从…import…样式,你可以直接调用函数。

  1. from datetime import datetime 
  2. now_time = datetime.now() 

如果你想尽量避免命名冲突,请使用样式5。

  1. from datetime import datetime as pkg_datetime_module 
  2. now_time = pkg_datetime_module.now() 

风格4 ?永远不要使用import *样式。因为样式4打破了上面列出的3个规则。

如果您计划构建一个供其他人使用的包,那么有一种方法可以减轻import *事故。

使用__all__。这是一个例子。在你的模块中。

  1. __all__ = ['pub_fun1','pub_fun2'
  2. def pub_fun1: 
  3.     return 'hey, this is pub_function1' 
  4. def pub_fun2: 
  5.     return 'hey, this is pub_function2' 
  6. def pub_fun3: 
  7.     return 'sorry, this function is private' 

通过这种方式,即使模块用户通过import *调用您的包,也只有pub_fun1和pub_fun2会被通配符导入。Pub_fun3将对调用者保密。

如果你的同事固执地坚持使用import *,你可以把下面他们import *的True和False颠倒过来,来说服他们:

  1. FalseTrue = TrueFalse # works only in python 2.x 

Python会颠倒True和False的含义,这就是为什么我们在命名和导入模块时需要小心的原因。

检查导入的模块

当你导入一个模块时,你如何知道这个模块的内部?当然,您可以查看文档,但如果您很懒,不想启动无聊的文档怎么办?Python提供了一种方便的方式来实现这一点。它是函数dir()。这个内置函数返回目标对象的第一层名称列表。

比方说,您导入了math模块。

  1. import math 

查看math模块中有哪些函数。

  1. dir(math) 

您将看到一个可供调用的变量和函数列表。

现在运行不带参数的dir()函数,看看当前模块中包含了什么。

  1. dir() 

您将在结果列表中看到导入的数学

  1.     ..., 
  2.     math, 
  3.     ... 

还有一件事,如果您想删除现有的模块,可以使用del来删除它。这里,让我们从当前运行的程序中删除数学。

  1. del math 

使用dir()进行检查,数学就消失了。

创建自己的Python包

在Python中,Function是变量和表达式的容器;类是函数、变量的容器;Module大致表示一个Python脚本文件,它是类、函数、表达式和变量的容器。Package是一个管理Python模块的解决方案。一个包是一个特殊的文件夹,包含多个模块和一个附加的__init__.py文件。

下面是一个示例包结构。如果使用Python 3.3+,可以省略__init__.py文件

  1. py_package/ 
  2.     - __init__.py 
  3.     - module1.py 
  4.     - module2.py 

在py_package文件夹内,创建两个名为module1.py和module2.py的文件。

在module1.py文件中,给出如下代码,在module2.py文件中,放入你喜欢的任何代码。

  1. # module1.py file 
  2. __all__ = ["module1_pub_func"
  3. def module1_pub_func(): 
  4.     print('hey, this is a public function from module1'
  5. def module1_pri_func(): 
  6.     print("hey, this is a private function from module1"

现在,在py_package文件夹所在的同一个文件夹中,放置test.py文件。

  1. - py_package/ 
  2.     - ... 
  3. - test.py 

在test.py文件中,调用新的烘培包。

  1. from py_package.module1 import *  
  2. module1_pub_func() 
  3. module1_pri_func() 

你会得到这样的结果,这里的错误消息是预期的,因为在你的__all__变量中,你只允许pub func被调用。

  1. hey, this is a public function from module1 
  2. --------------------------------------------------------------------------- 
  3. NameError                                 Traceback (most recent call last
  4. ~/az_git_folder/azcode/aznote/python/py_create_package/test.py in  
  5.       2 from py_package.module1 import * 
  6.       3 module1_pub_func() 
  7. ----> 4 module1_pri_func() 
  8.  
  9. NameError: name 'module1_pri_func' is not defined 

请注意,使用下面所示的代码导入包是行不通的。谷歌不会告诉你很多,但如果你不知道这个错误,可能会困惑你一段时间。

  1. # import the new created package won't works. don't do it.  
  2. import py_package import *  
  3. or 
  4. import py_package 

要调用这个包,您需要显式地包含module1关键字。

还有一件事要提。每个Python模块/程序都定义了一个__name__变量。如果该模块/程序是Python执行入口,则__name__将被分配给"__main__"。因此,我们可以使用__name__来检测程序是否直接执行或是否从其他程序中导入。在设计自定义包时特别有用。

  1. if __name__ == '__main__'
  2.     print('running by myself'
  3. else
  4.     print('I am being imported from other module'

 

 

责任编辑:武晓燕 来源: Python学会
相关推荐

2021-09-11 10:41:27

PythonPickle模块

2023-07-04 08:56:07

指针类型Golang

2024-04-12 12:19:08

语言模型AI

2022-03-24 08:51:48

Redis互联网NoSQL

2021-05-06 05:38:48

Python文件操作异常模块

2021-12-29 17:38:17

JavaScripttypeof前端

2021-11-06 10:18:30

Python变量常量

2021-01-06 13:52:19

zookeeper开源分布式

2023-05-31 13:32:08

Javalambda函数

2021-03-22 10:05:59

netstat命令Linux

2023-09-08 08:20:46

ThreadLoca多线程工具

2023-09-15 12:00:01

API应用程序接口

2021-12-01 11:40:14

Python 输入输出

2022-05-05 16:47:24

Docker网络空间容器

2024-09-26 07:27:27

2023-01-27 18:55:37

Python内置函数

2020-05-15 16:37:13

PowerBI数据分析

2023-08-24 16:50:45

2023-10-16 08:16:31

Bean接口类型

2022-08-15 15:39:23

JavaScript面向对象数据
点赞
收藏

51CTO技术栈公众号