NVIDIA禁止GeForce在数据中心运行?这回真的被“冤枉”了

新闻 数据中心
这几天,围绕着英伟达的一份使用禁令,国内的人工智能和科技圈展开了极其热烈的“讨论”,但随着昨天英伟达公布官方意见,这件事终于水落石出。结论只有一个——英伟达这次真的被“冤枉”了。重新审视 NVIDIA 新规,疑问究竟在哪里?

这几天,围绕着英伟达的一份使用禁令,国内的人工智能和科技圈展开了极其热烈的“讨论”,但随着昨天英伟达公布官方意见,这件事终于水落石出。结论只有一个——英伟达这次真的被“冤枉”了。重新审视 NVIDIA 新规,疑问究竟在哪里?

  首先我们先来重新“复盘”一下新规,以及此次整个事件的爆发。

  此次的新规定实际上来自于英伟达英文官网的 GeForce 驱动下载页面,用户在下载驱动之前必须勾选相应的许可协议(与安装软件之前必须勾选的那种相似)。

  这也意味着——所有使用 GeForce 驱动软件的用户,默认实际上是都同意了本许可协议。

  争议性的内容出现在“授权许可”部分中的“限制”项中,具体说法为“数据中心并不被许可使用该软件,除非数据中心在进行区块链运算。”

  这一内容最早被德国科技杂志 golem.de 发现并实时报道,随即被用户“booooomba”发上 Reddit 论坛,但在新闻的描述中却悄然发生了改变——

  “The new NVIDIA EULA prohibits Deep Learning applications to be run on GeForce GPUs.(新的 NVIDIA EULA 禁止在 GeForce GPU 上运行深度学习应用程序。)”

  究竟为什么“booooomba”会选择这个角度来诠释新规,我们不得而知,但这份新规的确带来了以下几个疑问:

  这项规定中所指的“数据中心”究竟是指什么?为什么区块链运算会被排除在外?

  “限制”条款中其他三项都是常见的产品权利,为什么会在第四条出现一条如此具体的规定?

  接下来,雷锋网就这三个主要疑问做进一步的解析。

关键疑问1:究竟 NVIDIA 想限制什么?

  昨天,NVIDIA 官方给雷锋网的回复中,可以明确得知一点——此次新规定针对的对象并不是普通的 GeForce 显卡用户,而是大型数据中心。而在拥有这些大型数据中心的,往往是各大商。

  NVIDIA 官方声明中是这样说的:“不鼓励用户在严苛的大规模企业环境中不恰当的使用我们的 GeForce 和 TITAN 产品”。

  同时 NVIDIA 还强调:“研究人员通常会将 GeForce 和 TITAN 产品用于非商业用途或其他不以数据中心规模运作的研究用途。NVIDIA 无意禁止这些用途。”

  通过这两条阐述,我们不难看出其中的两个、需要同时满足的关键界定标准:是否商业用途、数据中心规模。

  将这两个条件结合起来,我们能得到的就是目前正在向用户提供“GPU 云计算”服务的大中型云服务商们。

关键疑问2:为什么要“放”区块链一马?

  在很多之前的报道中,很多媒体都或多或少加入了一种“描述”:

  “NVIDIA 这次限制了数据中心,却放过了比特币挖矿!”,有的友媒甚至在标题上大大的写着“英伟达新禁令:不能随便用 GeForce 显卡跑深度学习(挖矿可以)”,但事实真的是如此么?

  首先需要澄清的第一点是,NVIDIA 从来就不支持 GeForce 系列产品用来挖矿。

  今年年中,NVIDIA 就曾在某显卡品牌活动上直接表示:“NVIDIA 不鼓励 GeForce 游戏显卡挖矿,不鼓励用户这么做,要挖矿请使用专门的挖矿显卡型号”。

  虽然截至目前这句话仍未写在任何规定当中,但 NVIDIA 在今年年中拿出的专用挖矿 GPU 就是最好的证明。

  今年 NVIDIA 推出的挖矿专用显卡代号“P106-100”,在消费级市场的 GeForce GTX1060 显卡“修改”而来,但不仅没有硬件图像输出接口,就连 Dirext 功能(微软的显示 API 软件,目前 Windows 上的各类游戏都需要此软件才能运作)也在物理层面上被阉割掉。

  如此大费周章的目的只有一个——尽可能保护消费级市场。

  在比特币曾经辉煌的 2013-2014 年,AMD 的 HD7000 系列也曾发生过长时间的断货现象。

  但随着 2014、2015 年比特币大幅降温,越来越多曾经用于挖矿的 AMD 显卡“重返”消费级市场,这一批经过挖矿“虐待”的产品极大地冲击了 AMD 的消费级产品市场,所带来的售后问题更是让 AMD 叫苦不迭。

  对于显卡挖矿潮这件事,NVIDIA 实际上一直有着警戒之心,今年早些时候由 ICO 带动的“挖矿潮”兴起时,国内很多 NVIDIA 显卡 OEM 厂商在产品包装外部专门贴上表示:

  “如果本产品被用于挖矿,我们将保留拒绝保修和维护的权利。”

  从 AMD 的前车之鉴、到 OEM 厂商生命、再到专门矿卡 P106-100 的推出,NVIDIA 躲挖矿还躲不及呢,怎么可能对它表示支持的态度呢?

  P106 矿卡的驱动实际上由 GeForce 驱动修改而来

  问题来了,为什么这次的规定中还会对区块链运算放一马呢?

  在一位显卡行业专业人士最终告诉其中的奥秘果——不是 NVIDIA 支持区块链,而是 GeForce 驱动实际上“间接”也用在挖矿专用显卡上。

  至于为什么不专门弄一个系列的驱动嘛,NVIDIA 没那个功夫,也不想花那个功夫。

关键问题3:NVIDIA 为什么要如此“突出”这项规定?

  虽然说驱动的用户协议通常大家都会点同意,但 NVIDIA 将其与众多的产品最基础规定放在一起,可见这项规定的重要性。

  为什么 NVIDIA 要如此“突出”这项规定?直接原因除了 NVIDIA 官方在声明中提到的产品适用性担忧之外,更重要的是 NVIDIA 对于明晰消费市场、企业市场区分的渴望。

  必须提前着重说明的是,这跟钱有关,但并不是简单的钱的问题。

  因为在整个半导体产品市场,这种情况也是普遍存在的,从 NVIDIA 的竞争对手 AMD,到 CPU 老大英特尔,实际上都有着自己的市场区隔。当然根源还是消费级市场和企业级市场的差异。

  消费级市场用户的用途往往比较简单,同时对于产品的需求也比较集中。

  例如 GPU,你只要图形性能好和运行稳定就可以了。

  但对于企业来说,只提供硬件是远远不够的,你还需要给他们开发各种软硬件接口,你需要对各种应用场景进行适配,你需要提供各种企业级服务,甚至是工程师到现场进行技术协助。

  这些羊毛自然应该出在羊身上,也就造成了价格差距。

  NVIDIA 针对不同 GPU 加速应用推出的解决方案

  如何分别对消费级市场、企业级市场这“两群羊”分别进行合理的收费,最终成为了半导体行业企业都必须面对的一个问题。

  而对能够产生商业收益、同时又需要更多产品服务的云服务商收更多钱,这本身就是“合乎常理”的。

  从另外一个角度来说,“消费级产品比企业级更便宜”甚至可以理解为“NVIDIA 合理地收取企业级市场费用,进而降低消费级市场的成本”。

  这不仅是公司整体策略的取舍,更是市场竞争法则最终选择出来的结果。

  附加说明:消费级产品真的不适用于企业级市场么?

  正如上面所说,消费级市场和企业级市场“天差地别”,其中一个最好的说明就是两者的使用环境差距:

  消费级市场 GPU 通常安装在机箱内,需要自己完成整个散热过程,同时使用时长较短、使用频次较低。

  企业级市场,GPU 通常都被“塞”进机架中,通常只装备散热器而依靠外部力量(风、液体)来完成散热过程,使用时长非常长、使用频次非常高、稳定性要求永远优先。

  这也让两个市场的产品在各方面差异性巨大,例如外形。

  以同样使用 GP102 核心(具体型号不同)及关键处理器参数十分接近的的 GeForce GTX1080Ti 和 Tesla P40 为例。前者和后者的外形是完全不一样的:

  GTX1080Ti 自带涡轮风扇,同时显卡散热器尾部并不可以流通空气,这种散热方式在消费级 PC 市场的使用环境中非常高效。

  而 Tesla P40 则采用了无风扇、头尾贯通的设计。可以数张紧密地排在服务器中,同时不影响散热效果。

  除了外观上的不同外,NVIDIA 实际还会花一些潜在的功夫。

  虽然 GPU 生产过程中用着相同的材料和工艺,但最终的成品往往还有一些细微差距。

  例如有些 GPU 能够在较低的电压下工作、有的 GPU 拥有更高的超频性能等等,这些细微的差距再加上 NVIDIA 在产品参数上的区别调校,最终形成了服务器产品的冗余性。

  主流云服务商用的就是企业级产品

  在结合众多因素考虑之后,相信你或许已经有了自己的判断,至少在雷锋网看来:

  这次新规只是 NVIDIA 对于自身产品业务的一次明晰,而“不幸”中招的企业,都是之前“不按云服务行业规矩”的公司。

  雷锋网就此还专门采访了国内的云服务巨头和腾讯云,其中阿里云表示不予置评。

  但根据雷锋网查询,阿里云实际上一直与 NVIDIA 保持着密切的合作,NVIDIA 最新的 Tesla V100 系列 GPU 也已经到了阿里云手中,正在部署之中。

  腾讯云给出的回应则更加直接:

  “用 GeForce GPU 打造企业级 IaaS(基础设施即服务)服务,然后来售卖这种做法,我们并不推荐。从企业级用户的需求来看,他们更看重稳定性。Telsa 系列稳定性,能效比的确有优势。”

  在询问道 NVIDIA 与其合作的价值时,腾讯云工程师表示:“NVIDIA 对我们硬件上的支持是非常迅速的。

  腾讯云在此基础上,通过深度开发,推出了多款产品满足用户的需求。”

  有趣的是,亚马逊 AWS 今年 10 月就已经引入了 NVIDIA 的 8 路 Tesla V100 GPU 加速器,并且作为全新的云服务提供给终端用户。

  这样看来,虽然用 GeForce 在账面上更划算,但这样去打造企业级服务的云服务商,其实只是行业“异类”。

  写在最后:吃水也要喂一口打井人

  作为并行计算、乃至人工智能时代的主要“动力源”,NVIDIA 的数款 GPU 利用自身不断提升的性能在带动着整个行业前进。

  而且 NVIDIA 做的并不仅仅是打造产品这一项,开发软硬件接口、提供应用解决方案、孵化创业公司、举办技术峰会等等。

  与其黑 NVIDIA“垄断”,倒不如说 NVIDIA 自身技术不断的“跃进”,造就了其产品和服务中的巨大优势。

  但因为一个企业在技术和市场方面发展快而去限制它,防止它“垄断”,是否又违背了技术发展和市场发展的本意,或者说那才是真正的“滥用”权利呢?

责任编辑:张燕妮 来源: 雷锋网
相关推荐

2018-01-02 08:31:56

NVIDIA数据中心环境

2017-04-25 10:29:12

数据中心网络堆叠技术

2023-04-10 15:56:19

用户隐私特斯拉

2011-07-13 15:33:19

Unix数据中心服务器

2013-01-16 14:16:17

EVI数据中心

2010-06-18 16:33:08

数据中心防雷

2022-10-18 15:49:12

2018-01-04 08:46:24

GeForceEULANVIDIA

2017-10-21 00:13:27

数据中心集成数据保护

2022-07-21 15:02:11

区块链数据中心安全

2013-08-19 16:37:59

虚拟化数据中心

2010-12-13 15:05:33

综合布线统一通信

2021-03-03 10:48:46

数据中心延时上电服务器

2013-08-14 09:26:13

虚拟化数据中心

2016-12-30 16:18:36

SDN数据中心网络

2017-10-17 10:34:16

数据中心混合存储

2013-01-09 15:41:30

数据中心网络优化网络应用

2017-10-17 21:27:03

数据中心机房漏水

2022-08-12 10:02:24

数据中心谷歌
点赞
收藏

51CTO技术栈公众号