前两天和几个朋友聚会,有个朋友说:“DeepSeek这么厉害,为什么要开源?美国人都知道了,拿着高端显卡一练,一下子就把你超了,开源就是昏招,你看人家OpenAI就不开源。”
我虽然当了很久的码农,也知道开源的巨大好处,但是他突然这么一说,我一时还不好反驳。
回来想了想,就写了这篇短文。
美国人走的是算力霸权的路子,高端显卡不允许出口,中国别想用,盟友也得分三六九等。
OpenAI再搞一个闭源的模型,就是把最先进的AI彻底垄断。
这个垄断中,软件部分是OpenAI,硬件是英伟达。
OpenAI+英伟达,会让你想到什么?
图片
对,就是Windows + Intel ,当年这哥俩儿在PC市场上“沆瀣一气”,呼风唤雨,把行业利润都吃光了,中国的那些PC厂商全是高级打工仔。
对WinTel联盟,大家恨得牙痒痒,也没有任何办法。
开源、免费的Linux异军突起,让业界看到希望,各个巨头纷纷采用,虽然没有抢下Windows的桌面市场,但把服务器端和移动端快吃光了!
当你弱小、落后,面对领先者的时候,开源是追上去最好的方案,因为可以吸引全世界开发者,让全世界和自己站在一起,然后快速迭代。
OpenAI和DeepSeek的最终目标都是AGI,但是实现它非常难,寻找AGI的过程就像一个刺激的大型寻宝游戏,没有人知道宝藏到底在哪里。
OpenAI率先入场,多探索了一大块区域,看到了更多的线索,祭出Scaling Law法宝,发现了不少好东西,但是它的方案也不一定能走到最后,找到AGI。
开源以后,全世界的人都会尝试,有人往东,有人往西,甚至有人会抛开很容易看到的线索,走上一条新路,例如DeepSeek。
这么多方尝试下来,肯定会有人找到突破口。
一旦开源在技术上超越闭源,闭源就完了,你一家公司怎么可能打败全世界呢?
但这里边的关键点是,你开源的不能是个烂东西,那就没人用了。
而DeepSeek恰恰开源了一个非常牛逼的东西,在达到OpenAI效果的情况下,价格便宜得吓人。这么厉害的东西,还不赶紧安排?
那些巨头虽然还在指责DeepSeek涉嫌抄袭,但动作却一点也不慢,微软、英伟达、亚马逊云科技转身就接入DeepSeek了。
要知道,微软可是在OpenAI上投了上百亿美元啊......
图片
就连一贯看中国不爽,封杀中国App的印度,也想着部署DeepSeek了,不但想部署,还跃跃欲试,准备搞IndiaAI,毕竟“你们看看DeepSeek做到了什么?仅用了550万美元,就开发出一个非常强大的模型......”
图片
DeepSeek 要戳破英伟达的泡沫了? - qileq
面对这种盛况,你就说OpenAI跟不跟吧?
如果不跟,全世界都在用低成本,高性能的DeepSeek,就不想付高额费用使用OpenAI了。
如果跟,无非两种选择:
第一,跟着DeepSeek走,那之前的算力霸权和闭源的路子就完了。
第二,自己搞一套全新的开源方案,但是能像DeepSeek那样便宜和高性能吗?
无论怎么搞,都是非常难受的。
所以OpenAI CEO 山姆・阿尔特曼最近也承认:“我们过去在开源方面一直站在历史错误的一边...... OpenAI需要‘弄清楚另一种开源战略’”。
OpenAI 首席产品官 Kevin Weil 也表示,该公司正在考虑开源较旧的 AI 模型。
其实,DeepSeek完全可以闭源,像OpenAI那样搭建一个网站/提供API 让大家用,但是它会遇到一个需要自证的问题:你不是用不到600万美元就搞了一个媲美OpenAI的大模型吗,如何证明?
现在好了,一开源,任何人都可以使用,复现,效果如何,自己练练就知道了。
这里必须得提一下,DeepSeek开源的是模型的权重,完整的训练框架、系统代码、训练数据并没有开源,这也是现在大模型主流的开源方法。
不过DeepSeek的论文里有详细的技术报告,公开了算法模型结构细节,训练框架的优化,基础设施的优化,所以全世界也掀起了复现的狂潮,Huggingface 推出Open-R1 项目,就是对 DeepSeek-R1 进行全开源复现。
开源还占据了道德的制高点:你OpenAI使用了全世界的数据做训练,然后拿出来卖钱,而我的东西端出来随便用,完全符合互联网的分享精神,两者孰高孰低,一目了然。
所以,别看DeepSeek是个140人的小公司,它的开源策略是非常厉害的,不但不是昏招,反而是非常绝妙的。
当然,DeepSeek CEO 梁文峰对开源有着更高追求:
在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。
我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,就是我们的护城河。