鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 25年5月软考 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

账号设置退出

震撼发布！Claude 3.7 Sonnet 首创“双脑”思考模式：Sonnet & Code

作者：dev 2025-02-25 09:43:19

凭借这些升级，Claude 系列有望跻身当下最先进的大模型之列，也进一步加剧了人工智能领域的竞争。

Anthropic 最近正式发布了 Claude 3.7 Sonnet 以及 Claude Code，标志着其在 AI 推理、安全性与多模态处理能力方面迈出重要一步。凭借这些升级，Claude 系列有望跻身当下最先进的大模型之列，也进一步加剧了人工智能领域的竞争。

Claude 3.7 Sonnet 的核心亮点

更强的推理与上下文感知

提升了逻辑思考与问题解决能力，适合企业级应用、学术研究及内容创作等多种场景。

扩展的上下文长度

大幅增大的上下文窗口，可以更好地记录对话历史，并处理更长的文档内容。

强化的多模态能力

在文本与图像的综合处理上有显著提升，可以与 Gemini 1.5 一较高下。

更高的安全性和一致性

基于 Anthropic 的“宪法式 AI”框架（Constitutional AI），进一步减少偏见并改善 AI 在伦理上的表现。

让开发者受益的 Claude Code

随同新版本一起发布的 Claude Code，专为编程场景而生。它的主要特色包括：

更佳的代码生成

基准测试显示，在某些编码任务上，Claude Code 超越了此前版本的 Claude，甚至可与 OpenAI 的 GPT-4 Turbo 比肩或持平。

调试与重构辅助

该模型能帮助开发者排查 Bug、优化代码并用更易懂的方式解释复杂逻辑。

多语言支持

覆盖范围广泛的编程语言，适用于软件工程师、研究者以及 AI 开发者。

最新基准：Claude 3.7 与同类模型的对比

从近期发布的测试结果来看，Claude 3.7 Sonnet 与 Claude Code 都大幅领先此前版本，并在多项指标上接近或超越 GPT-4 Turbo、Gemini 1.5 等主流大模型：

MMLU（通用多任务语言理解）

Claude 3.7 Sonnet 比 Claude 3.5 提高了 5% 的得分，在法律推理、数学等专业领域上也稍胜 GPT-4 Turbo。

HellaSwag & ARC（常识与推理测试）

Claude 3.7 的逻辑一致性与问题解决能力表现出色，适合处理复杂的推理任务。

CodeBench（编码性能）

虽然在部分编程项目中 GPT-4 Turbo 仍小有优势，但 Claude Code 在代码生成、调试和多语言兼容方面取得了显著提升。

多模态 AI 能力

借助扩展的视觉功能，Claude 3.7 Sonnet 在图像分析与文本-图像推理上可与 Gemini 1.5 Pro 并驾齐驱。

总的来说，测试数据证明了 Claude 3.7 Sonnet 在逻辑推理、代码生成、多模态理解等方面都达到了当前一线水准。

责任编辑：姜华来源：大迁世界

Claude 3.7 Claude 人工智能

51CTO技术栈公众号

业务
速览

媒体

51CTO CIOAge HC3i

社区

51CTO博客鸿蒙开发者社区 AI.x社区

教育

51CTO学堂精培企业培训 CTO训练营