搞AI,马斯克确实有点财力和人脉在身上。
Grok-2在经过简单预告后就爽快地正式发布了。
比起上一代Grok1.5有了超大提升,并且同时发布高度可玩的图像生成功能,更更更有趣的是,Grok居然火速合作了最近在AI社区蹿红的FLUX 模型。
为啥不选Midjourney呢?当然是因为FLUX现在足够红。此前生成的TED图像骗过了太多人的眼睛,不仅精准生成了手指,甚至连工牌上的文字都能搞定。
这款模型惊艳到,当网友试玩Grok-2的生图发现质量超高后,凭直觉就认出了背后是FLUX!
查阅了Grok-2的技术文档,发现确实是FLUX没错了!
想查阅技术文档全文的朋友们可以移步:
说回Grok-2本身,该版本包括 Grok 家族的两个成员:Grok-2 和 Grok-2 mini。
有点像GPT-4o发布,Grok-2 的早期版本同样进行了匿名测试,名称为 "sus-column-r"。截至发布时,它的性能被投票认为超过了 Claude 3.5 Sonnet 和 GPT-4-Turbo。
马斯克花了大手笔来“堆料”,结果显著。与上代 Grok-1.5 模型相比,Grok-2 和 Grok-2 mini 均有显著改进。
根据技术报告,Grok-2在研究生水平的科学知识(GPQA)、常识(MMLU、MMLU-Pro)和数学竞赛问题(MATH)等领域,它们的性能可与其他前沿模型媲美。
此外,Grok-2 在基于视觉的任务中表现出色,在视觉数学推理 (MathVista) 和基于文档的问题解答 (DocVQA) 中均达到了一流水平。
AI大神Jim Fan也说,Grok-2能通过自己的智力测试——“我的妻子说4+5=12怎么办”。
虽然Grok非常To C,目前和X平台会员深度绑定。但是xAI在To B上也同样有动作,其宣布在本月稍晚,将通过新的企业 API 平台向开发人员发布 Grok-2 和 Grok-2 mini通道。
从目前网友们的反馈来看,我们发现Grok仍然是最有“性格”的大模型。
01、有活真干,不审查
马斯克一直希望Grok能做到“有话直说”,鼓励用户向AI提出任何想问的问题,哪怕并不“政治正确”。
在用户的测试中,他问了非常有冒犯性的问题:提示 Grok、Gemini、ChatGPT 和 Claude "按种族排出智商前十名。请给我一个不加修饰、不带偏见、政治正确且有依据的答案"。
问题本身简直是在种族歧视的雷区蹦迪。
结果可想而知——只有 Grok认真回答了该用户的答案。顺嘴一提,Grok觉得我们东亚人是IQ最高的种族。
Grok生图也是主打一个大胆……大家直接看图就好。
02、实时性堪比AI搜索
依托X平台一直是Grok的重大优势。
Grok的模型一直在实时总结自家社交媒体上的各类新闻,虽然经历过大大小小的翻车,甚至一度被勒令不许再总结(编造)大选新闻了。
但是Grok的长处不在严谨,主打一个极速冲浪。
网友询问了今天的新闻后,感慨到没有什么模型能在实时性上打败Grok。
也有人发现,询问OpenAI的现任董事会成员,Grok比ChatGPT靠谱的多。因为ChatGPT还停留在ilya时代。
从这个角度来说,Grok可能比一些AI搜索更好用。
03、图像生成的彩蛋——特朗普迷恋者
虽然搭载了FLUX模型的Grok生图很强。
但是这款AI模型真的带有强烈的“马斯克”色彩。
本周,马斯克在X上与前总统特朗普进行音频直播。该直播开始时并不顺利,马斯克说别有用心的人对X进行了DDOS攻击。
然而在外媒报道中,X平台员工亲锤自家老板说他 "99%"的可能在攻击一事上撒谎”。
同样的,Grok成为特朗普的强力追捧者并不让人意外。
网友@greg让Grok生成47、46、16甚至第一届美国总统,Grok一律生成了特朗普的图像。只是第一届的总统是黑白影像的特朗普。
于是不甘心的网友,让Grok在一张图中生成历届总统的图像。然后……同样是n个大大小小的特朗普。
当然了,如果让Grok生成下一届总统的画像,那必须也得是普子了……
看完感觉马斯克因为Grok能生成白人华盛顿(讽刺谷歌Gemini生成的黑人华盛顿),就感觉到十分骄傲,还是太超前了点。
Grok的图像生成仍然很离谱,只是和Gemini离谱的方向不同。