DeepSeek新AI模型有多震撼?外媒:相当于30美元iPhone降临

新闻 人工智能
DeepSeek(深度求索)再次推出新版开源AI模型,它的性能与美国最先进的AI模型虽然还有一些差距,但差距极小,成本低很多很多。

DeepSeek(深度求索)再次推出新版开源AI模型,它的性能与美国最先进的AI模型虽然还有一些差距,但差距极小,成本低很多很多。西方许多人认为,美国限制中国AI发展的企图遇挫,中国正在加速前进,以更高效率打造高端AI模型。

去年12月,杭州幻方量化推出DeepSeek V3开源大语言模型,它的性能与OpenAI 40和Anthropic Claude 3.5 Sonnet差不多,当时OpenAI和Anthropic正在开发下一代模型。按照描述,V3的成本只有560万美元!要知道OpenAI、谷歌、Anthropic为了搭建、训练模型花费数亿美元,未来可能达几十亿。

Andrej Karpathy曾经说过,V3的投资“低得有些荒谬”,在资源受限的条件下,无论是研究还是工程,都取得了令人惊叹的成就。

DeepSeek创始人、CEO、幻方量化创始人梁文锋去年曾说:“对我们而言钱不是问题,先进芯片受限却是一个问题。”

V3是用Nvidia H800芯片训练的,它比美国版本性能弱一些,之后美国连Nvidia H800也禁了,不能向中国出售。

有人将同一时间发布的DeepSeek-R1-Zero和DeepSeek-R1进行了对比:

——DeepSeek-R1-Zero的优势:它具备创造性推理能力,擅长独立发现独特、创造性的推理策略。拥有自我验证与反思能力,可以验证自己的推理,在处理时进行反思,能有效进行长链思维。

——DeepSeek-R1的优势:可读性高,精准,模型输出的结果是可读的,更精致,出错率低。性能方面有强大竞争力,与最顶级的OpenAI模型可以一较高下,无论是数学、编程还是逻辑推理,都不逊色。

——DeepSeek-R1-Zero的弱点:输出有时会重复,显得杂乱,对用户不够友好,有时很难解释输出的结果。

相比较而言,DeepSeek-R1给出的结果更精致、更可靠,更加具有一致性。DeepSeek-R1-Zero在AI研究领域具有突破性意义,它向我们证明,单靠增强学习就能学会推理,不需要人类引导,这对AI发展来说具有里程碑意义。

R1是以Zero作为基础开发的,它将SFT和SR结合在一起,在性能、与人类偏好保持一致两个方面达到了平衡,更适合现实应用。

接下来让我们看看外媒都是如何评价的:

Venturebeat:中国企业戏剧性后来居上

最新的DeepSeek-R1性能与OpenAI开发的o1差不多,无论是数学、编程还是推理,都很出色。最让人吃惊的依然是成本,DeepSeek-R1的成本比o1低90-95%。

DeepSeek-R1的出现标志着开源模型取得了重大进步。它告诉我们,开源模型与闭源模型的差距正在缩小,二者将同时向AGI迈进。

报告显示,DeepSeek-R1在AIME2024数学测试中取得79.8%的成绩,与OpenAI o1的79.2%水平相当。在Codeforces测试中达到了2029的评分,超过96.3%的人类程序员(o1约为96.6%)。

英伟达高级科学家Jim Fan第一时间发表评论称,OpenAI的目标本来是开发真正开源、具有前沿性的AI模型,但现在这一目标却被一家非美国企业达成,最戏剧性的结果可能已经出现。在X平台上,他的评论目前已经被阅读106万次。

OpenAI o1的每百万tokens输入成本约为15美元,每百万tokens输出成本为60美元,DeepSeek Reasoner(基于R1模型)分别只有0.55美元和2.19美元。

Arstechnica:在硬件上进行本地处理将会实现

R1模型与其它大语言模型有着不同的运行机制,用到了所谓的“Inference-time reasoning approach”,也就是在模型推理阶段进行逻辑推理,这种推理方式和人类极为相似,又叫“模拟推理”(SR)。虽然SR推理给出回应时会慢一点,多耗费一点时间,但面对数学、物理、科学任务时结果更好。

不只是DeepSeek,中国的阿里巴巴、Kimi也都发布可以媲美o1的模型。

乔治梅森大学(George Mason University)AI研究人员Dean Ball说:“DeepSeek的小模型(distilled model,也就是R1的小号版本)性能让人惊叹,未来将会出现一大批推理能力不错的模型,它们可以在本地硬件上完成处理。”

forexlive网站:相当于30美元的iPhone问世

回想2017年时苹果推出iPhone X,售价999美元,手机狂卖,让苹果生态系统迅猛扩张。我们假设一下,如果有一家公司,它推出一款手机和一个手机平台,各方面更强,但价格只有30美元,会怎样?

没错,今天的AI世界正在发生这种戏剧性的变化。中国DeepSeek开源模型的性能居然追上了o1,但成本却低很多。不只如此,你还可以下载,免费使用。

无论是规模还是效率,R1取得了巨大进步,它改变了我们预期。我们曾经认为AI革命需要大量算力和电力,现在看来并非如此。就在新模型发布前几小时,特朗普刚刚宣布要投资1000亿美元在美国建设数据中心,同时还宣布与三家科技巨头开展5000亿美元AI项目.

DeepSeek告诉我们,在训练基本模型时有完全不同的可行方法,它们的效果同样好,但成本低无数倍。R1的到来可以让更多应用程序落地,之前这些程序因为成本过高不能推向市场,未来AI会在实体经济中有更大规模的应用。(小刀)

责任编辑:庞桂玉 来源: 极客网
相关推荐

2010-07-15 10:34:54

微软苹果

2017-11-03 11:05:17

iPhone X

2010-09-13 15:47:56

保护数据

2010-08-10 14:47:55

宽带资费

2021-10-11 15:03:47

5G华为美国

2021-07-06 09:25:30

Terminal开发者应用程序

2024-11-14 14:20:00

生成式AI数据

2023-10-17 19:48:13

人工智能

2023-07-05 07:00:21

M2 UltraRTX4060TiWindows

2018-09-19 12:47:16

iPhone XSiPhone X苹果

2019-09-11 10:14:15

苹果iPhone价格

2010-11-18 09:37:03

2023-02-17 09:01:50

ChatGPT对话机器人

2012-09-10 17:04:49

iPhone版傲游

2016-12-27 08:45:02

2017-12-15 11:47:37

健康管家

2023-05-23 07:44:58

i7-13700K游戏本处理器

2017-05-08 10:30:42

眼科人工智能

2024-04-23 13:10:29

2017-11-13 08:44:19

Android Stu移动数据库Kotlin
点赞
收藏

51CTO技术栈公众号