NumPy 的 nan 如何理解?

开发 后端
None比较容易理解,就是一种空类型,但是使用过NumPy的肯定都会接触到nan这种类型,它的其他写法:NaN或NAN,查看其类型却发现是float类型

Python 中表示空数据使用 None,它是 NoneType 类型,如下所示:

  1. In [59]: type(None)             
  2. Out[59]: NoneType 

NoneType 类型没有对外公开属性和方法:

 

因此,None 比较容易理解,就是一种空类型。

但是使用过 NumPy 的肯定都会接触到 nan 这种类型,它的其他写法:NaN或 NAN,查看其类型却发现是 float 类型:

  1. In [63]: type(np.nan)                     
  2. Out[63]: float 

这不免让人心生疑惑,nan 不是空数据,而是浮点数,那么到底等于多少?

原来这并不是NumPy特有的数值,而是IEEE754规定的特殊浮点数之一。

特殊在哪里?

这就要知道计算机是如何表示浮点数的,IEEE754 标准中规定 float 单精度浮点数,在机器中表示用 1 位表示数字的符号,用 8 位表示指数,用 23 位表示尾数,即小数部分,如下图所示:

对于单浮点数,指数部分由8位组成,所以取值范围:0到255,而指数等于0,255 这两个值,IEEE754 标准有特别的规定:

  • 当指数等于0,并且小数点后所有位全为 0,则这个数为 0
  • 当指数等于255,并且小数点后所有位全为 0,则这个数为无穷,当符号位为0时正无穷 float('inf'),当符号位为1时负无穷 float('-inf')
  • 当指数等于255,并且小数点后至少一位不为 0,规定此浮点数为 nan,表达的含义:not a number ,不是一个数

以上就是 NumPy 中 nan 的解释,弄清楚本质后,再来看几个关于它的运算。

既然 nan 不是一个数,所以拿它与任何浮点数比较,返回结果都是 False:

  1. In [64]: np.nan < 0                     
  2. Out[64]: False 
  3.  
  4. In [65]: np.nan == np.nan                      
  5. Out[65]: False 
  6.  
  7. In [66]: np.nan < np.inf                      
  8. Out[66]: False 

找出 np.nan 出现的索引位置,可以使用 isnan 方法:

  1. In [67]: a = np.array([-9,np.nan,10,np.nan]) 
  2. # 找出np.nan出现的索引 
  3. In [68]: a.where(np.isnan(a))  
  4. # 返回结果 
  5. # (array([1, 3]),) 

 

责任编辑:赵宁宁 来源: Python与算法社区
相关推荐

2019-07-16 07:52:49

NumPyPython机器学习

2016-09-18 15:38:10

CMDB配置

2020-10-23 10:30:54

NumPyRNN神经网络

2020-08-23 11:32:21

JavaScript开发技术

2017-09-27 09:41:44

2009-06-16 15:17:38

JavaFX

2016-12-08 13:16:50

大数据用户反馈

2021-05-06 09:18:18

SQL自连接数据

2021-11-26 00:05:56

RabbitMQVirtualHostWeb

2021-12-17 08:27:55

NumpyPython 机器学习

2009-04-09 10:16:43

Oracle架构基础

2019-02-19 14:30:57

总线通讯协议多层模型

2021-05-26 16:12:20

区块链加密货币比特币

2021-05-27 09:00:00

Node.js开发线程

2010-01-19 15:47:05

C++Test

2009-07-07 17:10:57

JSP和Servlet

2018-10-10 21:00:50

2009-09-23 10:14:22

Hibernate

2009-04-27 09:41:01

C#WPFTemplate

2021-02-25 10:20:26

Java接口代码
点赞
收藏

51CTO技术栈公众号