鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了精华

发布于 2024-6-21 13:33

浏览

0收藏

就在昨天，Anthropic深夜发布了下一代旗舰大模型Claude 3.5 Sonnet。

据称，Claude 3.5 Sonnet不仅在评估中胜过GPT-4o，还保持了作为「中杯」的最优性价比，超过了自家的Claude 3 Opus。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

如今，Claude 3.5 Sonnet已经面向全球开启免费试用了。

在费用上，Sonnet处理每百万输入token仅需3美元，每百万输出token仅为15美元。

对比之下，GPT-4o的每百万输入token收费5美元，每百万输出token为15美元，在价格上可以说是不相上下。正式对打时，各家可以说是已经都压低到了成本价。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

前OpenAI对齐团队负责人Jan Leike表示，我喜欢Sonnet新模型。我经常要求它向我解释ML论文。虽然不一定全对，但可能比我略读要好，而且速度也快得多。自动对齐研究越来越近了......

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

有网友同样表示，「我有一半的工作都可以由Claude 3.5 Sonnet来完成，我真是太兴奋了」。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

Anthropic的产品经理Michael Gerstenhaber将新模型称之为「世界上最智能的模型」。

他表示，「我们正处于这个行业寒武纪大爆发的开端」。

今年晚些时候，Claude 3.5 Haiku和最强版Claude 3.5 Opus将会陆续推出。

模型厂商们是彻底卷起来了！

网友实测

Claude 3.5 Sonnet发布之后，在全网掀起轩然大波，网友们纷纷上手开启一波测试。

10倍编码速度惊人

先来看看Claude 3.5 Sonnet写代码的速度有多可怕。

网友仅在一次对话中，就用threejs+cannonjs创建出一个3D太阳系模型，包含了物体和碰撞效果。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

另一个网友称，使用Claude 3.5 Sonnet进行编码比GPT-4，或任何其他大型语言模型效率高10倍。全新的Artifacts功能，可以在聊天旁边生成和运行代码，简直令人惊叹。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

没有什么比使用Claude 3.5 Sonnet一次性编写一个程序，来解密维吉尼亚密码更棒的事了。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

许多网友纷纷夸赞Claude 3.5 Sonnet速度快到起飞。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

2分钟一个小游戏

一位开发者直接用了不到2分钟，做出了一个戴着太阳镜的小狗吃骨头的游戏。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

另有人花了3分钟的时间，做出了马里奥克隆版，并且为角色提供了动画效果。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

还有另一款「原创」游戏Color Cascade。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

用2分钟创建一个蛇梯棋游戏。

网友表示，「我可以通过新的Artifacts功能实时查看代码并玩游戏。使用Claude的编码体验比GPT-4和Gemini好10倍」。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

这位网友用Sonnet做了一款乒乓球游戏。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

不像ChatGPT，它没有用到编码解释器。在这个过程中，我们可以制作文档、笔记和其他内容，其中一个选项的html/jss。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

神经网络可视化

有人还去做了可视化深度学习，不过因为消息限制，不得不暂停。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

下面是用动画效果解释反向传播的工作原理。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

重建3D「模拟矩阵」

Claude 3.5 Sonnet是第一个能在首次尝试中，重现电影《黑客》中「数据流」3D场景的模型。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

而且，在制作恐怖游戏上，Claude 3.5 Sonnet设计的3D结构比Opus更好。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

SVG效果图

Claude 3.5 Sonnet可以画出独角兽SVG图。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

它甚至可以生成芯片制造工艺流程示意图。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

「井字棋」游戏失败

OpenAI研究科学家，德扑之父使用新模型之后表示，

像GPT-4o（现在还有Claude 3.5 Sonnet）这样的前沿模型，在某些方面可能达到了「聪明的高中生」的水平，但它们在像「井字棋」这样的基本任务上无法完成。

人们曾希望原生的多模态训练能够有所帮助，但事实并非如此。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

Artifacts改变交互

从上文也可以看出，这次更新的一大亮点，就是Claude 3.5引入的超强实时交互功能Artifacts了。

这一功能，可以说是开启了交互式AI最有潜力的形式。

它标志着Claude从对话式AI向协作工作环境的转变。而在未来，Anthorpic的设想是，整个组织都能在共享空间中集中知识、文档、工作，而Claude会随时提供服务。

在沃顿商学院教授Ethan Mollick看来，Artifacts可以说是一个简化版的代码解释器。

他上手创建的，是这样一个螃蟹小游戏。

开始的版本是这样的，稍显平淡。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

教授直接问，能不能让游戏恐怖一点？然后氛围感瞬间就上来了。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

大家的直观感受是，使用Claude和Artifacts，就像在IDE中工作一样。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

这位日本网友介绍说，Artifacts简单来说，就是一个显示代码预览的功能。它很容易直观地理解，可以用于多种目的。

-网站创建

-形状

-图形

-文档

-简单游戏

它可以帮忙创建简单的网站。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

只要跟它说“制作一个计算器应用程序”，一个使用React的计算器应用程序预览就完成了。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

通过Artifacts，可以让Sonnet使用HTML创建简单的幻灯片材料。

这位网友发现，这个过程中可以向Sonnet展示设计图片，它们会把这些图片用作参考。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

Claude 3.5 Sonnet不仅编码效率比GPT-4o或任何其他LLMs都高10倍，而且因为Artifacts功能可以在聊天的旁边生成并运行代码，因而可以提供令人惊叹的用户体验。

比如让它用React生成一个贪吃蛇的游戏。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

随后，我们还可以用自然语言对游戏进行修改，比如做一个美观的背景，或者让蛇有一个化身。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

因为可以一边创建游戏，一边立刻在右侧窗口中玩这个游戏，Artifacts功能可以说是彻底贯彻了从对话式人工智能转向协同工作环境的想法。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

总的来说，Artifacts似乎是Claude长远远景的一个信号。

长期以来，Anthropic一直表示自己主要关注企业，并且计划将Claude变成一种工具，让企业「安全地」将他们的知识、文档和正在进行的工作集中在一个共享空间中。

听起来，这种概念更像是Notion或Slack，而不是ChatGPT。而在这种系统中，Anthropic的模型将处于整个系统的中心。

吊打GPT-4o，上一代2倍速

总的来说，Claude 3.5 Sonnet在生成速度方面，实现了飞升，是上一代超大杯Claude 3 Opus的2倍。

而且，在视觉方面的表现，新模型全面超越了GPT-4o。OpenAI上个月刚发布的新模型，没想到这么快被取而代之。

以下是官方博客中，做的一些基准测试。

从图中可以看出，Claude 3.5已经在多数基准中，领先GPT-4o、Gemini 1.5，以及Llama-400B的模型。

在代码基准中，Claude 3.5在零样本情况下，取得了92%的成绩。在数学上，零样本+CoT加持Claude 3.5还是有些落后于GPT-4o。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

在视觉基准上，Claude 3.5 Sonnet在视觉问答MMMU基准上，略逊于GPT-4o。

不过，视觉数学推理、科学表格、图表问答、文件问答上，都拿下了最高分。

Claude不仅能准确识别、转录图像中的文字内容，还结合了强大的代码生成能力，将多个模态真正集成在一起。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

与众不同的是，Claude 3.5 Sonnet并不像GPT-4o那样集成了语音助手，或者能够生成图像，而且Anthropic暂时也没有这一打算。

Anthropic联创兼总裁Daniela Amodei在接受彭博独家采访中提到，「我们的目标是使其成为所有企业业务的首选模型」。

超越GPT-4o，Claude 3.5一夜封王！10倍编码速度逆天，全网最全实测来了-AI.x社区

她继续称，从研究的角度来看，我们能够生成图像输出，但绘制一只「滑雪的猫」图像并不是我们的企业客户所要求的，所以我们并不优先考虑这一点。

目前，制药巨头Pfizer已经利用Claude模型，帮助发现新药物。

未来，模型越智能，就越有能力支持这种非常高水平的智力工作。显然，Anthropic正在努力为它想要瞄准的企业公司进一步差异化。

可以扩展Claude交互方式的新功能Artifacts，便是一个新的尝试。

Anthropic的改进速度，简直令人惊叹。

如今Anthropic的这一步，必将逼得其他竞争对手跟上。

要知道，Claude不像Gemini或ChatGPT那样受到更多关注，但它在比赛中却非常受欢迎。

本文转自新智元，作者：新智元

原文链接:https://mp.weixin.qq.com/s/kaui9TW9cBCupZnGHPK4gg

标签

赞

收藏

回复

举报

回复

相关推荐

超越GPT-4，斯坦福团队手机可跑的大模型火了，一夜下载量超2k

轻薄滴假象 • 2914浏览 • 0回复
超越GPT-4！最强大模型 Claude 3 完全解读

开发者阿橙 • 5494浏览 • 0回复
史上最丑AI生图一夜爆火！又一款妙鸭级爆品来了？

duhorse • 3030浏览 • 0回复
GPT-4o 的数学又双叕进步了？来 MathBench 看看新版 GPT-4o 到底强在哪！

恋恋青鸟 • 2827浏览 • 0回复
AutoCoder：性能超越GPT-4o的模型，居然只有33B，还是开源！

大语言模型论文跟踪 • 4567浏览 • 0回复
速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言

duhorse • 2832浏览 • 0回复
苹果一夜重塑iPhone！GPT-4o加持Siri，AI深入所有APP，库克：开启苹果AI下一章

Crystalcxt • 2795浏览 • 0回复
GPT-4o背后可能的语音技术

鱼虫子 • 2570浏览 • 0回复
Claude3.5突然发布！GPT-4o不香了

Crystalcxt • 2749浏览 • 0回复
首个多模态视频竞技场Video-MME来了！Gemini全面超越GPT-4o，Jeff Dean连转三次

duhorse • 2258浏览 • 0回复
开源模型王座一夜易主，GPT-4o被超越

duhorse • 1867浏览 • 0回复
终于来了，OpenAI测试GPT-4o高级语音模式！

Aceryt • 1917浏览 • 0回复
阿里开源多模态视觉语言模型，多项超越GPT4o与Claude 3.5-Sonnet

angel • 8620浏览 • 0回复
Fireworks AI 发布 f1：在硬编码、聊天和数学基准方面超过 GPT-4o 和 Claude 3.5 Sonnet

Halo咯咯 • 2065浏览 • 0回复
小模型界o1来了：微软推出Phi-4，数学推理能力太逆天！14B模型击败GPT-4o！还印证了AI墙的一个重要推断

51CTO技术栈 • 1896浏览 • 0回复
GitHub Copilot免费了，可无条件使用GPT-4o 和Claude 3.5 Sonnet等高级模型

Syrupup • 5280浏览 • 0回复
DeepSeek-R1-Distill-Qwen-1.5B 在某些基准测试中超越了 GPT-4o

Halo咯咯 • 9930浏览 • 0回复
Cline 3.2 重磅更新：免费调用 Claude Sonnet 3.5 和 GPT 4o，开发效率直接拉满！

凝固的雨_1 • 1.3w浏览 • 0回复
闲得没事，猜猜GPT-4o如何对图像编码

鲁班模锤1 • 1183浏览 • 0回复

这个用户很懒，还没有个人简介

觉得TA不错？点个关注精彩不错过

帖子

声望

粉丝

关注

最近发布

DeepSeek第五天开源猛料，3FS并行文件系统榨干SSD！6.6 TiB/s吞吐量堪比光速 2025-02-28 12:53:18发布
刚刚，DeepSeek开源DeepEP通信库，千亿MoE训推颠覆级创新！FP8狂飙，带飞GPU 2025-02-25 12:24:42发布

热门推荐

王炸！MCP 架构设计深度剖析 & 使用 Spring AI + MCP 四步教你实现 Agent 智能体开发 0回复

实操干货！MCP 全解析，手把手教你基于 MCP 开发 Agent 0回复

Dify从入门到高阶系列二：手把手教学！超详细的Dify知识库配置全攻略 0回复

从 Manus 到 DeepSearcher，2025年最值得关注的十大 Agent 智能体架构设计 0回复

MCP协议之MCP-server(sse方式)实践 0回复

上一篇： AI视频新霸主全网翻车，Ilya奥特曼老黄打起来了！动画出现诡异狗头网友笑疯

下一篇：打开黑盒神经网络！港大推出全新「会说话」的推荐系统大模型XRec，从黑盒预测到可解释

社区精华内容

目录

网友实测
10倍编码速度惊人
SVG效果图
「井字棋」游戏失败
Artifacts改变交互
吊打GPT-4o，上一代2倍速

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载