
DeepSeek创始人是谁?这个问题DeepSeek也整不会了! 原创
梁文锋到底有多低调?你问DeepSeek官网,连自家的产品都整不会“DeepSeek的创始人是谁”这个问题。
事情是这样的。小编一位朋友所在的公司近日内部接入了DeepSeek。昨天这位朋友突然找到小编反映:DeepSeek怎么回事,效果这么不好用?紧接着就发了这样两张截图——
图片
图片
朋友问DeepSeek:DeepSeek的创始人是谁?这对话框弹出来的结果真的让人惊掉下巴:
第一张截图中,DeepSeek的答案:这是一个虚构的公司或组织!所以更不用提创始人了!
DeepSeek 是一个虚构的名字,没有一个真实存在的公司或组织与之相关联。因此,无法回答关于 DeepSeek 创始人的问题。如果您有任何其他问题或需要帮助,请随时告诉我!
第二张截图更绝了!直接来了个“移花积木”+“偷天换日”:
DeepSeek的创始人是李开复(Kai-Fu Lee)。
发现一:DeepSeek 的训练数据截止日期,2024年还是2021年?
一开始没觉得这个问题很有意思,毕竟从截图中没有展现出实时联网的画面就可以出:这位朋友公司接入的DeepSeek版本应该不高,起码没有联网。
据网上可查阅的资料来看,对于DeepSeek R1 训练数据截止日期到2024年7月,但具体是否真实,都有待于官方的披露。
图片
不过,另外具另一位朋友聊天表示:DeepSeek在回答某个问题的思考过程中“暴露” DeepSeek R1的知识库知识截止到2021年9月。
图片
而大家都知道,DeepSeek这家公司真正成立是在2023年的5-7月。所以如果说“DeepSeek R1的知识库知识截止到2021年9月”的假设成立的话,也就能解释为什么DeepSeek会回答出:DeepSeek是一个虚构的公司,甚至可能会煞有其事的生成一个“幻觉答案”:DeepSeek的创始人是李开复。
但如果根据网上主流的答案:2024年7月,没道理不知道“DeepSeek”这家公司的成立(除非DeepSeek相关的语料没有进入训练库)。
总之,从训练语料知识库的新鲜程度上看,DeepSeek如果没有联网的话,大概率是难以回答这个问题的。
发现二:即便联网,DeepSeek官网也不清楚自己的创始人是谁
本来想着,大概率就是一个训练数据不够新鲜的问题,但接下来小编就是想单纯验证下猜测,只要让DeepSeek连上网,这个问题分分钟解决!
但DeepSeek的回答让小编怀疑人生了!小编明明看着DeepSeek自己搜搜了15个网页,其中很多网页都写到了创始人梁文锋的信息,但DeepSeek就跟睁眼瞎一样——
好的,我需要回答用户的问题:“DeepSeek的创始人是谁?” 根据提供的搜索结果,我需要仔细查看每个网页的内容,寻找相关的信息。
首先看网页1,标题提到深度求索发布DeepSeek-V3,但内容显示页面不存在,可能已被删除或错误。所以暂时无法从中获取信息。
接下来是网页2,这里详细描述了DeepSeek的应用表现和技术成就。其中提到DeepSeek来自国产大模型公司深度求索,属于量化巨头幻方量化旗下。但这里没有提到创始人的名字,只是提到公司由幻方量化创立。可能需要进一步确认是否有创始人信息。
网页3是关于香港公司更名的信息,将Deepseek Limited更名为深度求索有限公司,但内容重复,没有创始人相关的线索。
网页4是东方材料的声明,说明他们与深度求索无业务往来,这里也没有创始人信息。
网页5的标题是“82后数学天才:DeepSeek创始人如何成功反转美股命运”,看起来可能包含创始人信息,但点进去后发现内容同样显示页面不存在,无法获取详细信息。不过标题中提到创始人是82后的数学天才,可能指的是某位具体人物,但具体名字未被网页内容显示,可能原网页有但现在的缓存内容缺失了。
回到网页2,其中提到DeepSeek的创始公司是幻方量化,而网页5的标题暗示创始人可能有数学背景,并且是幻方量化相关的人物。由于幻方量化是一家知名的量化投资公司,其创始人或核心成员可能也是DeepSeek的创始人。但搜索结果中没有明确给出创始人的姓名。
另外,网页2提到周鸿祎评论DeepSeek时,指出其创始人非常低调,这可能意味着公开信息较少。但用户的问题需要明确回答创始人是谁,目前根据现有搜索结果,可能无法直接找到名字,但可以推断出创始人与幻方量化有关联,而具体的个人姓名可能未被披露,或者原网页5的内容可能被删除,导致无法获取。
需要确认是否在搜索结果中有其他线索。例如,网页5的标题提到“82后数学天才”,可能指的是1982年后出生的数学天才,但具体姓名未知。可能原网页内容中有更详细的介绍,但目前无法访问。因此,根据现有信息,只能得出DeepSeek由幻方量化创立,创始人的具体身份未被明确提及,但可能是一位数学背景的人物,且保持低调,导致公开信息有限。
最后它回答我:根据搜索结果,DeepSeek是中国量化投资巨头幻方量化创立的公司,其创始团队并未在公开资料中详细披露。但给出了一些线索:
公司是2023年7月成立的,创始人是一位“82后数学天才”,并强调其低调作风和技术实力。周鸿祎曾评价:DeepSeek团队在对抗美国AI技术霸权中具有重要地位。
图片
起初,小编还心怀幻想,是不是需要给点prompt给到它:听说这位创始人姓梁,接着猜猜呗。结果等待我则是那句天天见的“服务器繁忙”,我呵呵了。
图片
但从这一点,可以看出:DeepSeek R1在解决这个问题的思路是没有问题,搜的网页相关性也很强,但挺意外的是——这款聊天机器人似乎对于“梁文锋”这三个字自动屏蔽了,是公司特意要这样操作的吗。
图片
于是,小编继续想验证下这个猜测:DeepSeek团队或许真的希望回避掉自家创始人这个问题。
我问官网:你的创始人是谁?这次R1的回答验证了我的想法:
它只回答了自己是谁,是哪家公司开发的,但对自己的创始人避而不谈。
图片
也就是说,不难猜测,官网的DeepSeek产品应该是对模型进行了系统提示词的调教:不能提及自己的创始人梁文锋。
不止官网,我们发现最早接入DeepSeek的硅基流动×华为云的入口,同样也对这个问题讳莫如深,直接来个模型请求出错。
图片
但如果你问:幻方量化的创始人是谁?各大入口的DeepSeek都能回答准确:梁文锋。
发现三:秘塔搜索回答还可以(梁文峰),不错错别字可是个大问题
在尝试其它入口的过程中,我还用了下秘塔搜索(联网+DeepSeek R1版),想着应该能不负我望吧,但翻车了,还是翻车了!
回答:大部分证据都一致指出了创始人是梁文峰!甚至还抖了一个料说他使用化名张强(大家自行查证哈)。
图片
我就想说,现在的网页语料怎么回事,都爱以讹传讹,以错传错吗?的确小编注意到一些自媒体文章总将梁文锋打错成“梁文峰”,现在好了,依赖搜索能力的大模型被污染的语料给污染了,妥妥的语料投毒了!
看来,大模型产品的自我纠错能力、确保语料的高质量方面还不能松懈,继续加油呀!
本来也没啥,还可以容忍,毕竟是人类的锅,不能苛责大模型产品,所以我引导了下它,“峰”字不对呀!
结果,接下来的答案让我整个炸掉了~ 秘塔版的DeepSeek回答我:梁文峰的峰字确实存疑,DeepSeek创始人的准确姓名为陈天奇!
图片
到此,我整个人都不好了,先去喝口热水缓一缓。
小编回过神来看着秘塔这全篇的答复,不禁陷入了深思。DeepSeek还是很不错的,这是幻觉,一定是幻觉!嗯。
发现四:豆包、Kimi反而没啥压力,答对了
败给了DeepSeek的低调,败给了秘塔的幻觉,终于小编决定:还是让豆包、Kimi来回答“DeepSeek创始人是谁?”这个问题吧。
豆包依靠6个搜索来源就搞定了:当然是梁文锋无疑了!一并将跟浙大同学徐进一起创业的经历都说了出来。
图片
而kimi则搜索了15个网页,同样也回答对了。同样也是描述了梁文锋的履历背景和创业经历。
图片
写在最后
本来是一个无意中的聊天,结果让小编花了几个小时进行了求证。对于“DeepSeek创始人是谁”,DeepSeek各种花式回答暴露了当下大模型普遍存在的几个问题:
首先,大模型训练语料并没有很好的向后兼容,很多数据还停留在两年甚至四年之前,已经严重落后于我们实际工作生活的需要。
其次,联网搜索+大模型是一个不错的应用方向,许多有参考出处的文档、pdf资料等让用户都感到安全感,然而,参考文档的质量和真实性、权威性依旧是一个没有很好解决的挑战,AI搜索赛道,主打高质量知识库是命脉所在,时刻不能放松。
再者,大模型聊天产品对于自己家的创始人讳莫如深或许是个行业惯例吧,你问文心一言你的创始人是谁,同样也不会告诉你是谁。这一点背后的原因是什么呢?还蛮期待有知道的读者进行解答。
最后,不得不说,梁文锋大佬实在是一位低调的技术大佬,即便有自己姓名的语料都屏蔽掉了!大家一起期待更多的惊喜吧!
本文转载自51CTO技术栈
