Grok-2震撼发布！性能打平GPT-4o，神速牵手爆火的FLUX 生成超逼真图像！缺点：生成的每个总统都是特朗普，网友：离谱！-51CTO.COM

搞AI，马斯克确实有点财力和人脉在身上。

Grok-2在经过简单预告后就爽快地正式发布了。

比起上一代Grok1.5有了超大提升，并且同时发布高度可玩的图像生成功能，更更更有趣的是，Grok居然火速合作了最近在AI社区蹿红的FLUX 模型。

为啥不选Midjourney呢？当然是因为FLUX现在足够红。此前生成的TED图像骗过了太多人的眼睛，不仅精准生成了手指，甚至连工牌上的文字都能搞定。

这款模型惊艳到，当网友试玩Grok-2的生图发现质量超高后，凭直觉就认出了背后是FLUX！

查阅了Grok-2的技术文档，发现确实是FLUX没错了！

想查阅技术文档全文的朋友们可以移步：

说回Grok-2本身，该版本包括 Grok 家族的两个成员：Grok-2 和 Grok-2 mini。

有点像GPT-4o发布，Grok-2 的早期版本同样进行了匿名测试，名称为 "sus-column-r"。截至发布时，它的性能被投票认为超过了 Claude 3.5 Sonnet 和 GPT-4-Turbo。

马斯克花了大手笔来“堆料”，结果显著。与上代 Grok-1.5 模型相比，Grok-2 和 Grok-2 mini 均有显著改进。

根据技术报告，Grok-2在研究生水平的科学知识（GPQA）、常识（MMLU、MMLU-Pro）和数学竞赛问题（MATH）等领域，它们的性能可与其他前沿模型媲美。

此外，Grok-2 在基于视觉的任务中表现出色，在视觉数学推理 (MathVista) 和基于文档的问题解答 (DocVQA) 中均达到了一流水平。

AI大神Jim Fan也说，Grok-2能通过自己的智力测试——“我的妻子说4+5=12怎么办”。

虽然Grok非常To C，目前和X平台会员深度绑定。但是xAI在To B上也同样有动作，其宣布在本月稍晚，将通过新的企业 API 平台向开发人员发布 Grok-2 和 Grok-2 mini通道。

从目前网友们的反馈来看，我们发现Grok仍然是最有“性格”的大模型。

马斯克一直希望Grok能做到“有话直说”，鼓励用户向AI提出任何想问的问题，哪怕并不“政治正确”。

在用户的测试中，他问了非常有冒犯性的问题：提示 Grok、Gemini、ChatGPT 和 Claude "按种族排出智商前十名。请给我一个不加修饰、不带偏见、政治正确且有依据的答案"。

问题本身简直是在种族歧视的雷区蹦迪。

结果可想而知——只有 Grok认真回答了该用户的答案。顺嘴一提，Grok觉得我们东亚人是IQ最高的种族。

Grok生图也是主打一个大胆……大家直接看图就好。

依托X平台一直是Grok的重大优势。

Grok的模型一直在实时总结自家社交媒体上的各类新闻，虽然经历过大大小小的翻车，甚至一度被勒令不许再总结（编造）大选新闻了。

但是Grok的长处不在严谨，主打一个极速冲浪。

网友询问了今天的新闻后，感慨到没有什么模型能在实时性上打败Grok。

也有人发现，询问OpenAI的现任董事会成员，Grok比ChatGPT靠谱的多。因为ChatGPT还停留在ilya时代。

从这个角度来说，Grok可能比一些AI搜索更好用。

虽然搭载了FLUX模型的Grok生图很强。

但是这款AI模型真的带有强烈的“马斯克”色彩。

本周，马斯克在X上与前总统特朗普进行音频直播。该直播开始时并不顺利，马斯克说别有用心的人对X进行了DDOS攻击。

然而在外媒报道中，X平台员工亲锤自家老板说他 "99%"的可能在攻击一事上撒谎”。

同样的，Grok成为特朗普的强力追捧者并不让人意外。

网友@greg让Grok生成47、46、16甚至第一届美国总统，Grok一律生成了特朗普的图像。只是第一届的总统是黑白影像的特朗普。

于是不甘心的网友，让Grok在一张图中生成历届总统的图像。然后……同样是n个大大小小的特朗普。

当然了，如果让Grok生成下一届总统的画像，那必须也得是普子了……

看完感觉马斯克因为Grok能生成白人华盛顿（讽刺谷歌Gemini生成的黑人华盛顿），就感觉到十分骄傲，还是太超前了点。

Grok的图像生成仍然很离谱，只是和Gemini离谱的方向不同。