
黄仁勋首提DeepSeek!英伟达蒸发的6000亿又回来了:市场误判了R1的影响,计算仍然重要! 原创
黄仁勋首度回应DeepSeek?其实不准确!
在采访中黄仁勋主动提及的DeepSeek,亲自下场灭火,并称赞到“(R1是)世界上第一个开源推理模型,这太令人兴奋了,全球对我们开源的反响不可思议”!
黄仁勋大胆总结说:(有人说R1出现后)我们不再需要进行任何计算了。实际上,情况正好相反!为啥呢?
在老黄看来,未来的AI仍然需要三方面的Scaling:
- 预训练“仍然需要严谨,数据量要大,(还要有)多模态数据”
- 后训练的相关学习范式有很多种,但计算需求依然密集
- 推理方面的算力消耗无上限:“推理越多,思考越多,效果就越好“
这也是黄仁勋想给投资者吃的“定心丸”,要知道在R1发布当日,英伟达股价单日曾暴跌16.9%。据Yahoo Finance数据,英伟达股价在1月24日收于每股142.62美元,而在接下来的周一(1月27日),股价迅速下跌至118.52美元。这一事件在短短三天内使英伟达市值蒸发了6000亿美元。
不过,英伟达的股价目前已经基本恢复,上周五,英伟达股价开盘报140美元。
在与DataDirect Networks(DDN)的联合创始人和首席执行官Alex Bouzari所进行的这次采访中,两人还提出了其他方面的观点,先来画个重点:
- 黄仁勋提到了,英伟达开发的开放式虚拟世界平台Omniverse,其理念与数字孪生有关,希望每个公司都能够拥有自己的数字双胞胎。这相当于有机会同时在多个宇宙中生活,“一旦我们进入数字世界,我们就可以同时进行1000个实验。”
- Alex谈到了AI推理+垂直行业可以开启各种可能性,因为人们可以将其与特定行业的数据结合起来,进行推理,比如生命科学、金融服务、自动驾驶等等。
- 黄仁勋说AI改变了人们看待软件的方式。未来AI是一个模型系统,你将有不同的AI相互合作,解决大型问题,坐落在你公司的数据智能层之上。
以下是经整理的采访原文,enjoy:
(有关DeepSeek的内容在采访第三部分)
英伟达是“加速器”:计算让AI变得可能
Alex Bouzari:欢迎来到《超越人工智能》。
黄仁勋:谢谢,能在这里真是太好了,亚历克斯。很高兴见到你,你看起来很好。
Alex Bouzari:谢谢,你看起来也不错,感谢你一如既往的支持。
黄仁勋:谢谢。
Alex Bouzari:好的,允许我必须告诉你,DDN是如何开始这个新产品的(Infina)。2017年,Nvidia说想要建立一个参考架构的超级集群,我们需要数据部分。
离开那次会议时,我说,如果黄仁勋的远见在未来十年内变为现实,就需要一种完全不同的架构。它必须是一个高效可扩展的训练架构,它必须具备低延迟,并且要在本地和多云环境中分布,负载不能移动,因为成本太高了,图像、视频等都太大了,因此它必须是元数据和标记等。
因此,这就是它(Infina)的起点,我在白板上画了它,我说这就是AI的架构应该是什么样的。大家看着我,都说,你完全疯了。你在谈论一些根本无法实现的事情。我说,我们换个角度来看,跳出问题的框架,忘掉我们要解决的东西,忘掉过去,忘掉文件系统等等,这花了七年时间。
黄仁勋:这就是两个工程师CEO聚在一起时发生的事情(笑)。我认为你刚刚描述的非凡旅程,从训练模型到现在我们利用这些前沿模型和AI模型,转向用于推理和解决大问题的AI应用。
人们常常忽视的一点是,在应用过程中需要的数据的重要性,而不仅仅是在训练时。因此,当然,你希望在海量数据上进行预训练,但在使用过程中,AI必须能够访问信息,而AI希望以信息的形式访问信息,而不是原始数据的形式。这就是为什么将对象存储和原始数据重新构建为数据智能的原因,这为DDN提供了新机遇,为全球企业提供数据智能,因为AI运行在这张信息网络之上。这是计算和存储的非凡重构,改变了我们之间的关系,以及你能向世界提供的产品类型。
Alex Bouzari:所以我们的看法是,必须要再说一次,这一切都是由你的愿景驱动的。你基本上创造了这个行业,为了让这个行业能够收获成果,它正在改变我们所做的一切,工作、娱乐、休闲、健康、安全等等。
这是深刻的全球性转变,是全球经济在各方面的一个转折。因此,为了让这一切发生,企业需要采用它,并且需要加快采用的步伐,这意味着投资回报率(ROI)必须能够实现。为了让ROI能够实现,应用层必须加速,而基础设施必须高效,这些基础设施驻留在数据中心或云中。我们已经完成了这一部分。我认为,最大的推动力和加速器是我们如何增强应用层,而你在这方面做得非常出色,尤其是在CUDA方面。
黄仁勋:感谢你使用“加速器”这个词,我认为在计算机科学的层面上,当然你我享受并观察到摩尔定律的好处,计算变得越来越快,计算以同样的价格和功耗变得更快,这意味着计算变得更加经济实惠。因此,在我们职业生涯的前30年中,我们享受到了这一点,但在过去15年中,我们确实看到了一种平稳期,因此摩尔定律在很大程度上已经结束。
我们对计算机行业的贡献,第一项根本贡献是使用完全不同的架构和算法重构,极限加速。我们在计算机科学层面上共同努力,将顺序处理转变为加速的并行处理。我们现在正在将计算加速到极限,这使我们能够为行业带来成本效益和能源效率,并加速工作负载。
在这个基础之上,我们发明了或使机器学习和人工智能成为可能。我们现在的计算是如此高效,以至于你可以进入极端版本的计算,让计算机自己找到洞察。
因此,在基础层面上,我们必须做的一件事,以及我们在这条新产品线中共同完成的伟大工作。
谈数字孪生:Omniverse将让人同时生活在百万个宇宙
黄仁勋:关于Infinia的事情是使用加速计算和人工智能,从你拥有的所有数据中学习,将原始数据转化为数据智能,将智能嵌入到模型中,从所有数据中提取其语义、智能和信息。现在,不再是服务原始数据,而是提供元数据、知识、智能和洞察力。令人难以置信的是,元数据、数据的语义层是高度压缩的。
Alex Bouzari:是的,为了实现这一点。因此,带有多模态元数据标记和移动元数据的能力变得至关重要,否则经济性根本无法实现。世界上没有足够的数据中心空间,也没有足够的电力来完成这样的事情。
因此,元数据属性非常关键,我们从Infinia开始,这就是我们关注的其中一项内容。我们说,必须有一个元数据丰富的基础设施,能够以非常低的延迟处理这些对象,这些对象需要被转化以获得洞察。因为归根结底,正如你所说,这就是数据智能。如果不从中获得洞察,不获得商业价值,也不为消费者提供休闲价值,将所有这些数据引入环境中训练模型又有什么意义呢?所以,这必须有效,必须产生好处。
黄仁勋:这是一种与公司数据交互的新方式。你知道,与其检索数据,不如弄清楚数据中有什么。你可能会修改并存储回去。在许多方面,你是在与公司的数据对话。你问公司的数据问题,你公司的数据回应你,告诉你需要知道的事情。你可能在公司原始数据中有相当多的洞察,现在以这种语义形式存在。你希望有AI代理与来自不同部门的数据互动,查询这些数据,生成报告,然后由另一个AI代理读取、理解,将其与其他数据和其他智能结合,最终生成一些结果。
Alex Bouzari:所以,基本上,这些代理都是领域专家,每个代理在特定领域都是专家。他们是顾问,组织现在可以利用这些顾问来提高竞争力,更快地开发更好的产品,为客户带来更多的价值,无论是产品还是服务。你将这些结合到Omniverse(注:Omniverse 是由 NVIDIA 开发的一个开放式虚拟世界平台,旨在支持实时协作和3D内容的创建、模拟和共享)中,我认为这是目前最了不起的东西。
与其在物理世界中做事情,你说,我要开发一种药物来解决某种疾病,但这非常昂贵,需要数十亿美元,耗时多年,还需要FDA(美国食品药品监督管理局)的批准。我不知道它是否会成功。我们有10种不同的途径需要探索,我们不能按顺序进行,也不能并行进行,所以我们将在Omniverse中将它们作为数字双胞胎启动,然后会得到反馈,告诉我们,如果你将路径1的这些属性与路径4的其他属性结合起来,将最大化成功的可能性,压缩将药物推向市场的时间,并最大化相关收益。
黄仁勋:对于正在观看这一切的观众来说,这真的很有趣。我们的旅程始于高性能计算和高性能计算训练基础模型和前沿模型。这是高性能计算的极限版本。因此,Nvidia和DDN通过这个起点建立了我们的友谊和长期合作关系。现在,我们希望在训练这些模型时,这些模型可以转向世界企业,将我们的所有数据从原始数据转化为数据智能,现在我们的世界正在共同进入企业。因此,我们从高性能计算到企业,从公有云到现在的私有云和公有云。当你进入所有这些公司时,最终他们希望生活在数字世界中,因为当我们生活在数字世界中,我们所做的一切都更快,这个Omniverse的理念使每个公司都能够成为数字双胞胎,这真是深刻的。
Alex Bouzari:这太不可思议了,我不太确定人们是否能够真正理解它的重要性。
黄仁勋:这是我们的旅程,也是下一步。所以我们已经从超级计算走到企业,现在我们要从企业走向企业的数字双胞胎。为了实现这一点,我们必须提取他们领域的数据,无论是3D数据、蛋白质、化学品、信息、时间序列,还是物理信息。我们希望提取所有这些数据,从中提取出表示和意义。一旦我们得到了它的表示,我们将在数字Omniverse中展示它。然后,全球的公司都可以在数字中拥有他们的表示。一旦我们进入数字世界,我们就可以同时进行1000个实验。
因此,一旦我们拥有Omniverse,我们将拥有多元宇宙Omniverse,我们可以尝试所有这些实验。
Alex Bouzari:这就像在百万个宇宙中同时生活。你选择一个结合这些不同生活的组合,这个组合对你是最优的。这适用于企业和组织,也适用于有主权AI的政府,以造福他们的公民。它同样适用于个人、消费者和健康。因此,你只需将所有这些内容分开并进行优化。
黄仁勋:我喜欢你能看到这一点。
Alex Bouzari:这正是正确的,但这非常深刻。第一次听你谈论Omniverse时,我想,哇,这就是AI引导我们的方向。
黄仁勋:AI需要将世界的原始数据提取出意义,在数字世界中进行表示。
Alex Bouzari:在数字双胞胎中,因为我们必须压缩时间,降低经济影响。因此,我们必须以更快的方式做到这一点。以数字双胞胎的方式做到这一点是更便宜的。
黄仁勋:别无他法。是的,我们在数字双胞胎中,一切都是这样。
Alex Bouzari:是的,这就是企业采用AI的加速过程。它帮助他们在这个旅程中,从而真正压缩时间并获得显著的好处。我们正处于这样的时刻。
谈推理进展:DeepSeek R1不代表计算已经终止
黄仁勋:现在我们已经构建了数据层,并在其上构建了一个智能层,这就是数据智能。在这个层的基础上,我们将构建一个代理层。在信息世界中,我们称它们为代理AI。在物理世界中,我们使用体现于机器人的物理AI。所以我们现在又有了一个层。
真正令人兴奋的是,你可能看到了DeepSeek发生的事情,这是世界上第一个开源推理模型,这太令人兴奋了,全球对我们开源的反响不可思议。
Alex Bouzari:为什么人们认为这可能是件坏事?我认为这是件好事。
黄仁勋:首先,我认为从投资者的角度来看,有一个心理模型认为世界是预训练的,然后进行推理,推理就是你问AI一个问题,它立刻给你一个答案,一次性回答。我不知道这是谁的错,但显然这个范式是错误的。这个范式是预训练,因为我们希望有基础。你需要对信息有基本的理解才能进行第二部分,即后续训练。
因此,预训练仍然需要严谨,数据量要大,(还有)多模态数据,正如你提到的。我们将从语言中学习,当然还有语言和图像、视频、声音,我们将把所有这些结合在一起形成我们的基础知识,而这将持续进行。
第二部分,这是智能中最重要的部分,我们称之为后续训练。但这是你学习解决问题的地方。你有基础信息,了解词汇、语法和基本数学是如何运作的。因此,你将这些基础知识应用于解决问题。我们称之为后续训练。
你可以使用强化学习和人类反馈。这是指使用人类示范的另一种说法。或者你可以使用自我练习的强化学习,或者你可以与另一个AI进行强化学习,一个教练,对吧?因此,与后续训练相关的学习范式有很多种。
在这个范式中,技术在过去五年中发生了巨大的变化,计算需求也非常密集。因此,人们认为,哦,天哪,预训练的负担要小得多。他们忘记了,后续训练实际上是相当密集的。
现在第三个扩展法则是,你在回答问题之前进行的推理越多,思考越多,效果就越好。当然,我们记住了很多事情。比如,64的平方根是多少?你只是记住了这个。你可以对其进行推理,但不必这样。因此,理想情况下,你已经记住了很多基本的事情,但大多数有价值的智能你仍然需要进行推理。因此,你必须应用第一原则,逐步分析。
也许你需要尝试很多不同的实验。根据一个实验的结果输出,它可能会为你下一个实验提供信息。因此,推理是一个相当计算密集的部分。因此,我认为市场对R1的反应是,哦,我的天,AI完成了。
你知道,它从天而降。(有人说)我们不再需要进行任何计算了。实际上,情况正好相反。
Alex Bouzari:这完全相反,因为DeepSeek正在做的是,它让每个人注意到,有机会让模型比我们认为可能的更高效,因此它正在扩大并加速AI的采用。
R1现在可以与智能信息进行交互以解决问题。我认为另一个极具赋能的东西是CUDA工具,我认为这开启了各种可能性,因为人们可以将其与特定行业的数据结合起来,进行推理,比如生命科学、金融服务、自动驾驶等等。你将所有这些结合在一起,并与模型的进步相结合,再次加速AI的采用,这对Nvidia来说是件美好的事情。我认为对DDN来说也是一件美好的事情,但这一切都是在应用层上发生的。是的,我认为我们需要继续改善你们在GPU上所做的事情,越来越快,降低功耗,推动数据中心和多云环境的经济效益。但这些都是结合在一起的。你知道,这个数据智能层,正如你所建议的,正在与数据中心的效率和应用层的加速相结合。
黄仁勋:真正令人惊讶的是,当你剥离一切时,这一切只是软件,但今天我们谈论软件的方式与十年前谈论软件的方式截然不同,真是不可思议。
一个问题,Alex,人们会问,企业应该构建自己的AI还是仅仅使用公共云中的AI?我认为答案是,都是。原因是,如果你能使用公共云AI,我绝对会从那里开始。因此,那里提供的东西对于许多个人使用来说,通用智能非常好,并且正在以指数速度增长。所以,真的非常适合入手。
然而,企业内部有许多不同的领域。例如,我们设计芯片的方式,我们编写软件的方式,我们的编程代码,我们的Vlog编程,供应链管理的方式,都是深度专业化的,我们在这些方面的专业知识显然是卓越的。因此,在这种情况下,我们倾向于构建自己的AI。我们拥有所有必要的工具包,从开源模型和开源工具包,如Nvidia的Nemo、Nvidia Nims,以及像Infina这样的数据智能层。所有这些技术组件都可以用于入驻并策划培训课程和训练自己的AI。因此,它将成为所有这些AI代理的策划。
公司将由自制的AI、合同AI、与第三方软件平台一起提供的AI以及公共云中的AI组成。在你的公司内部,你将会是AI的AI,而AI内部是一个模型系统。你将有AI相互合作,解决大型问题,坐落在你公司的数据智能层之上。因此,对于组织来说,情况就是这样。
Alex Bouzari:我认为,作为一个组织、一个企业,不论市场如何,你说得对,你的使命是什么?你的目的是什么?一旦你定义了这一点,你就必须进行差异化,而这种差异化只能来自AI在你特定组织中的专业应用。所以是的,你可以使用AI,但这只是消费而已。真正的价值是,作为生命科学组织、金融服务组织,你的生活目的是什么?那么,你如何进行差异化?这非常特别,这就是你需要Nvidia提供的专业NIMS能力的地方,这就是Nemo发挥作用的地方,这就是我认为DDN's Infina发挥作用的地方。它真的赋能了差异化,使其更具影响力并放大这种差异化。
黄仁勋:没错。
Alex Bouzari:我再次感谢你,作为一个出色的合作伙伴,向我们展示了方向,谢谢你,内部拥抱我们的技术和视频,这太棒了。对此我无以为报,感谢你。
本文转载自51CTO技术栈
