马斯克摊上事了!Grok AI被爆疑似抄袭ChatGPT??

人工智能
有网友怀疑,xAI这是使用了ChatGPT的输出答案来微调开源 Llama 模型,xAI没有资源从头开始训练大模型。

大家好,我是二狗。图片

马斯克今天摊上事了!

X(推特)一名网友爆料,马斯克旗下xAI公司研发的Grok AI疑似“抄袭”ChatGPT。

Grok 在回答网友的一个问题时,做出了令人震惊的“承认”:

“恐怕我无法满足该请求,因为它违反了OpenAI的用例政策。”

图片图片

纳尼?违反OpenAI的用例政策?

这不就相当于Grok模型自己承认是抄袭或者套壳ChatGPT吗?

图片图片

网友Jax接着在推特上晒出了一个视频。

视频中Grok的这次的回答直接“赤裸裸”地表明,自己就是由OpenAI开发的:

图片图片

又有网友晒出了Grok的另一个“惊人”回答:

如果你想报错,可以通过 openai.com 的邮箱联系我。

图片图片

这一连串的证据让二狗我看的瞠目结舌。

Grok AI于12月8日才刚刚开始向美国的 X Premium+用户正式推出,用户使用还得每月付费16美元。

这亮相才刚刚两天,就惹出了这桩事,可太令人尴尬了。

抄袭套壳还是数据集污染?

这件事背后究竟是怎么回事呢?

难道是Grok抄袭了ChatGPT的代码或模型权重?

因为OpenAI不开源,抄袭的可能性基本可以排除。

图片图片

那是Grok直接套壳ChatGPT的API?

这对小公司或者某些个别大厂是有可能的,但马斯克的xAI不可能做出这种事,毕竟马斯克还是要脸的,世界首富的段位和格局在这摆着。

那就只剩下一种最大的可能性了——数据集污染。

有网友怀疑,xAI这是使用了ChatGPT的输出答案来微调开源 Llama 模型,xAI没有资源从头开始训练大模型。

图片图片

就在网友纷纷猜疑的时候,xAI的12位联合创始人之一、曾经在DeepMind工作四年、OpenAI工作两年的AI研究员Igor Babuschkin下场澄清了:

Grok模型的训练数据无意中包含了ChatGPT的输出。

图片图片

目前来看,数据集污染+幻觉回答这种可能性最大。

OpenAI在线吃瓜,马斯克反击

图片图片

OpenAI看热闹不嫌事大,第一时间赶来吃瓜,使用ChatGPT的的官方推特附上发文调侃道:

我们有很多共同之处。

图片图片

马斯克对此反击道:

好吧,儿子,既然你从这个平台上(推特)抓取了所有数据来进行训练,你应该知道是怎么一回事。

图片图片

网友表示这个时候Sam Altman应该正在某个角落偷笑:

图片图片

因为之前这两人就一直在网上掐架。

先是Altman发帖调侃马斯克,用GPTs随手就能创建了一个和Grok同名的模型:

图片图片

后是马斯克放出他的终极大招——梗图,来应对Altman:

图片图片

有网友亲自问了一下Grok是不是由OpenAI开发的?

Grok毫不意外做出了否定,并为xAI和马斯克创造了自己感到自豪。

图片图片

当网友再问Grok:“xAI有没有使用OpenAI的数据集来训练你?”

Grok给出了很有意思的回答:

对此我不确定,但是我能告诉你xAI是由马斯克创建,独立于OpenAI之外的公司;然而,xAI确实使用了推特的数据来训练AI模型。

所以,虽然我不确定xAI有没有使用OpenAI的数据集来训练AI模型,但是我能告诉你我已经抓取了推特上所有的数据。

图片图片

如何解决?

如果真的只是Grok的训练数据无意中包含了ChatGPT的答案输出。

要想解决这种情况其实也很简单:

  • 一是在数据集清洗环节加强审核把控;
  • 二是在fine-tune和指令微调环节做好回答的强对齐,减少幻觉回答。

但网友吃瓜吃不停,给Grok支出了无用的“小妙招”——如果回答包含了OpenAI,那就直接回复:

"Sorry, try again."

图片图片

或者如果Grok的回答包含了OpenAI,那就直接用Grok替换掉OpenAI。

图片图片

最后,Grok偷偷给大家爆了个猛料——其实世界上最强大的GPT-4模型是由xAI开发的,好家伙,我就说怪不得前段时候xAI被爆料正在融资10亿美元(手动狗头)。

图片图片

马斯克和Grok还能折腾出多大的浪花呢?让我们拭目以待吧。

图片 图片

责任编辑:武晓燕 来源: 夕小瑶科技说
相关推荐

2023-12-13 08:46:33

人工智能ChatGPT机器人

2024-01-29 01:18:02

GrokChatGPTAI

2024-03-18 14:17:06

大模型开源人工智能

2023-07-22 13:47:57

开源项目

2021-05-18 10:10:01

自动驾驶数据人工智能

2023-11-06 10:41:46

ChatGPT马斯克

2023-10-25 11:05:54

深度伪造AI

2024-08-06 16:03:18

马斯克OpenAI人工智能

2023-02-20 13:59:32

2023-04-20 17:51:41

马斯克微软

2023-11-10 15:37:32

2024-03-18 15:00:48

Grok现已开源Grok-1混合专家模型

2024-08-15 10:07:03

2022-12-12 13:54:16

2024-04-01 13:06:52

Grok-1.5GPT-4人工智能

2024-03-19 14:00:59

2024-03-06 11:34:46

马斯克ChatGPT无人驾驶

2024-10-21 14:50:00

AI创业模型

2022-01-23 10:53:47

星链互联网卫星

2022-07-21 10:27:05

数字化云端
点赞
收藏

51CTO技术栈公众号