OpenAI新发布的canvas和Claude的Artifacts,哪个更好? 原创
整理 | 言征
出品 | 51CTO技术栈(微信号:blog51cto)
近日,OpenAI 推出了 canvas,这是一个可以在 ChatGPT 中直接编写和编码项目的新界面。许多人想知道它是否比 Claude Sonnet 3.5 Artifacts 更好。
答案是否定的。
原因也很明显:canvas 使用 GPT-4o,而4o模型的编码并不比 Claude Sonnet 3.5 好。虽然 canvas 为开发人员提供了一些很好的功能,例如用户协作和版本控制,但它缺乏代码预览等关键功能。
许多人现在都在使用 Claude 创建他们的第一个应用程序。其中包括只有少数人需要的小众应用程序、小公司的内部工具以及只是为了好玩的滑稽应用程序。
图片
例如,一位用户最近尝试可视化办公桌的双显示器设置,并比较显示器彼此相邻的配合情况。Claude 在短短几次交互中就为此目的创建了一个完全可用的应用程序。
该款应用程序虽然没有特别令人兴奋,但重点也恰恰在此——用户看来,让自己来编写这样一个没吸引力的应用的代码,根本不值得去花费时间和精力,但交给 Claude ,在不到 5 分钟的时间内就可以创建它,使其成为一个有价值的工具。
因此,AI 辅助创建应用程序,比拼的应该是为谁更快、谁更能提供个性化的解决方案。
1.Canvas 虽好,但 Artifacts 更香
除了在几分钟内构建软件外,用户还报告了 Claude Artifacts 如何帮助他们学习编码。一位努力学习如何编码的开发人员说,通过能够更彻底地看到项目实际上是如何组合在一起的,他开始获得许多以前难以理解的概念。
“至少对我来说,最困难的事情之一是自学,因为我是一个非常概念化的学习者。我需要能够理解整个想法并深入研究它。或者,我从一个部分开始,然后像知识的滚雪球一样构建,这通常是一种协作方法,因此很难完全靠自己完成。
“然而,和 Claude 一起,我度过了一段美好的时光,唯一的限制是我在给定时间里被限制了回复次数,”他补充道。
业内媒体AIM还试验了 Artifacts,我们能够创建一个板球测验游戏、Temple Run 和 Flappy Bird,所有这些都带有一行英语提示。“按需软件已经到来,”医疗保健工具公司 Flexpa 的首席技术官 Joshua Kelly 说。使用 Artifacts,他在短短 60 秒内就为他的跑步构建了一个简单的伸展时间应用程序。
借助 Artifacts,现在每个人都可以创建简单的应用程序,并且这些应用程序可以与用户共享。这意味着,我们正在慢慢迈向一个阶段,每个人都将成为应用程序开发人员,这一切都归功于 Artifacts。
即使我们不考虑 Artifacts,只考虑 Sonnet 3.5 进行编码,它也被证明是比大多数模型更好的选择。
2.Claude 3.5,开发者爱了
几周前,一位没有软件开发经验的电工使用 Claude 3.5 Sonnet 构建了一个多智能体JavaScript 应用程序。开发人员将这个称为 Panel of Expert (POE),它使用多个 AI 代理以多步骤的方式处理查询,所有这些都是通过以高级方式定义提示来完成的。
这只是一个例子。有多个用户称赞 Claude Sonnet 3.5 的编码功能。一位开发人员在 Reddit 上表示,这绝对是非凡的。“它的编码能力给我留下了深刻的印象。感觉过去几天我的工作效率提高了 3.5 倍。我对我设法运送的东西感到非常惊讶,这主要是由于 Claude,“他补充道。
拥有数十年经验的开发人员也称赞 Claude 的编程能力以及它如何有助于缓解大脑疲劳。一位拥有 40 多年经验的开发人员表示,拥有像 Claude 这样的设备是一个巨大的好处。
用户还反馈说,Claude Sonnet 是为数不多的可以处理大型项目的模型之一。因此,Sonnet 经常被比作具有无限内存的中级工程师。
图片
Claude Sonnet 不仅限于在几次互动中给出工作代码,而且在调试方面也被认为是最好的代码之一。来自奥地利的数据科学家 Liu Grey 在 X 上提到,Sonnet 立即修复了一个错误,然后继续改进她的渲染管道,并在不增加 CPU、GPU 或内存使用率的情况下将更新速率提高了一倍。
3.推理方面,o1
OpenAI o1 模型通常被认为是最好的推理模型之一。但是,几天前,一位在 Claude Sonnet 3.5 上使用反射技术的用户在推理方面取得了比 o1 更好的结果,情况发生了转变。
图片
值得注意的是,开发人员也在尽可能地推动 Claude。一个很好的例子是 Claude 的开源 VSCode 扩展,称为 Cline(以前称为 Claude Dev)。此扩展会定期更新。一位用户提到,在编码知识为零的情况下,他在短短一天内就成功地构建了一个 Web 应用程序。
现在情况很明朗。开发人员喜欢 Claude Sonnet,并正在围绕它开发解决方案。当然,OpenAI 也在努力为开发者受众赶上 canvas 等工具,但我们还没有看到影响。
另一方面,Anthropic 还专注于通过 Projects 和 Artifacts 等计划为开发人员受众带来最佳体验,使其成为开发人员和公司双赢的局面。
4.写在最后
Canvas 和 Artifacts 代表了 AI 聊天平台和助手发展的下一阶段。这场“界面大战”接下来的看点是,其他平台将开始探索如何将用户留在平台中,而非为不同的任务打开其他专用窗口。
本文转载自51CTO技术栈,作者:言征