Claude 3.7 Sonnet重磅发布,Claude最牛逼的东西,还得是它的编程

人工智能
Claude 3.7 Sonnet 提高了单次会话的上下文长度,高达 128k tokens。我们可以一次性读写更多文本,修改更多的代码,彻底消除会话长度焦虑。
大家好,我是哪吒。

cursor公认的最强编程大模型Claude 3.5再次升级。

一、Claude 3.7 Sonnent发布

Anthropic 公司正式发布了其最新版本的人工智能模型Claude 3.7 Sonnet。

Claude 3.7 Sonnet 提高了单次会话的上下文长度,高达 128k tokens。我们可以一次性读写更多文本,修改更多的代码,彻底消除会话长度焦虑。

该模型被设计为采用混合推理策略,其核心在于融合传统的即时响应技术与深层逻辑推理机制,以应对复杂问题求解;在数学计算和编程任务中,其卓越表现已被充分验证。

近期编码基准测试中,SWE-bench Verified 的评测结果显示,Claude 3.7 Sonnet 所获得的得分明显超越了前代产品 Claude 3.5 Sonnet 以及 OpenAI 的 o3-mini 与 DeepSeek R1 模型,这一成果彰显了其在处理复杂代码库和高级工具应用中的优越性能。

在 TAU-bench 基准测试中,该模型亦表现出显著优势,其性能超越了 Claude 3.5 Sonnet 与 OpenAI 的 o1 模型,进一步验证了其在多模态信息处理和代理编码技术方面的创新实力。

二、Claude最牛逼的东西,还得是它的编程

非推理模型下的Claude 3.5 Sonnent,就能和OpenAI 最新模式o3-mini-high、671B的满血DeepSeek R1打的有来有回,甚至至今还是诸多大厂专家心中的编程No.1。

那么,深度思考加持的Claude 3.7,岂不是天下无敌,独孤求败了。

在只是问答、写作、编程、数学、推理、多模态等诸多表现都很牛逼,特别是加了“深度思考”之后,最新模型Claude 3.7 Sonnet可谓是牛气冲天,直接晋升大模型T0梯队。

配合 Anthropic 这次新推出的 Claude Code 工具,更能让开发者爽到飞起。它能直接帮你检索和编辑文件、编译运行、甚至提交代码到 GitHub,全程带你边玩边写。

三、编程专属Claude Code

前不久,Anthropic 在社交媒体上发布了一条令人振奋的推文,大致内容是:

Introducing Claude 3.7 Sonnet: our most intelligent model to date. It’s a hybrid reasoning model, producing near-instant responses or extended, step-by-step thinking. One model, two ways to think. We’re also releasing an agentic coding tool: Claude Code.

这则消息立刻引发了技术圈的热烈讨论。有网友在近期的网络文章中兴奋地形容:“Claude 3.7 Sonnet 就像升级版的 AI 导师,可以即刻回复你的小问题,也能深入剖析你的大疑惑,一次搞定两种思维模式。”

Claude 3.7 Sonnet 最核心的亮点,莫过于它的“混合推理”能力。简单来说,它可以在秒回模式和Thinking模式之间灵活切换:

秒回模式:适合处理那些不需要繁琐思考的日常问题,Claude 3.7 Sonnet 会在极短时间内给出答案,让你宛如跟一位健谈又机智的伙伴聊天。

Thinking模式:当你需要更深层次的思考或系统化的推理时,它又能像一位冷静缜密的逻辑大师,给你提供条分缕析的解决方案,让思路不再迷糊。

不少开发者在博客或技术论坛上分享了自己的“上手体验”,表示在面对复杂需求时,Claude 3.7 Sonnet 的思考过程异常清晰,几乎可以看作是一位加班不吃外卖、不打瞌睡的程序猿同事,真正让人省心不少。

如果说“混合推理”功能是给普通用户的高能助力,那么“Claude Code”就是程序员们的私人贴身外挂。它不仅能搜索、阅读并编辑代码,还能直接编写、运行测试,甚至一键提交并推送到 GitHub,连命令行工具都能熟练运用。

据一些抢先体验的用户分享:

感觉就像拥有了一个自动化的研发团队。

遇到难缠的 bug,Claude Code 能提供清晰的解决思路和操作指令。

再也不用凌晨三点查漏补缺,我先睡了,Claude Code 你先扛着。

这种“代理式”编程辅助,不仅能大幅提高开发效率,还能让团队协作更加顺畅:有了 Claude Code 帮忙抓漏补缺,写文档、跑测试的琐碎活儿就变得轻松许多,真正帮你把时间和精力释放到更具创造性的工作上。

四、混合推理实测

开启扩展模式

一句话搞定一个游戏。

一句话搞定一个大数据大屏预览。

在功能上,Claude Code 是一个积极的协作者,可以搜索和阅读代码、编辑文件、编写和运行测试、提交和推送代码到 GitHub,以及使用命令行工具。

我们来看下它的几个使用示例,比如解释项目结构:

编写测试:

构建应用:

五、如何使用Claude 3.7 Sonnent

推荐谷歌浏览器访问:https://claude.nezhagpt.cloud

无需魔法、个人独享、同时支持手机/电脑。

责任编辑:姜华 来源: 哪吒编程
相关推荐

2025-02-25 09:43:19

2025-02-25 10:20:00

2025-02-25 10:08:38

2024-12-26 14:42:23

2025-02-25 09:02:26

2024-12-27 09:50:00

模型数据测试

2024-06-24 12:25:22

2024-03-05 10:55:22

OpenAISOTAClaude 3

2025-02-19 15:40:00

OpenAI编程模型

2024-12-09 08:00:00

AI大模型人工智能

2025-02-25 08:15:09

2024-06-24 13:17:09

2024-09-19 17:52:47

2024-10-21 18:40:16

2025-02-25 09:13:16

2024-07-17 13:41:47

2017-03-22 13:59:19

搜索分析

2024-04-17 16:51:17

2025-02-25 11:59:44

2024-06-21 09:58:38

点赞
收藏

51CTO技术栈公众号