cursor公认的最强编程大模型Claude 3.5再次升级。
一、Claude 3.7 Sonnent发布
Anthropic 公司正式发布了其最新版本的人工智能模型Claude 3.7 Sonnet。
Claude 3.7 Sonnet 提高了单次会话的上下文长度,高达 128k tokens。我们可以一次性读写更多文本,修改更多的代码,彻底消除会话长度焦虑。
该模型被设计为采用混合推理策略,其核心在于融合传统的即时响应技术与深层逻辑推理机制,以应对复杂问题求解;在数学计算和编程任务中,其卓越表现已被充分验证。
近期编码基准测试中,SWE-bench Verified 的评测结果显示,Claude 3.7 Sonnet 所获得的得分明显超越了前代产品 Claude 3.5 Sonnet 以及 OpenAI 的 o3-mini 与 DeepSeek R1 模型,这一成果彰显了其在处理复杂代码库和高级工具应用中的优越性能。
在 TAU-bench 基准测试中,该模型亦表现出显著优势,其性能超越了 Claude 3.5 Sonnet 与 OpenAI 的 o1 模型,进一步验证了其在多模态信息处理和代理编码技术方面的创新实力。
二、Claude最牛逼的东西,还得是它的编程
非推理模型下的Claude 3.5 Sonnent,就能和OpenAI 最新模式o3-mini-high、671B的满血DeepSeek R1打的有来有回,甚至至今还是诸多大厂专家心中的编程No.1。
那么,深度思考加持的Claude 3.7,岂不是天下无敌,独孤求败了。
在只是问答、写作、编程、数学、推理、多模态等诸多表现都很牛逼,特别是加了“深度思考”之后,最新模型Claude 3.7 Sonnet可谓是牛气冲天,直接晋升大模型T0梯队。
配合 Anthropic 这次新推出的 Claude Code 工具,更能让开发者爽到飞起。它能直接帮你检索和编辑文件、编译运行、甚至提交代码到 GitHub,全程带你边玩边写。
三、编程专属Claude Code
前不久,Anthropic 在社交媒体上发布了一条令人振奋的推文,大致内容是:
Introducing Claude 3.7 Sonnet: our most intelligent model to date. It’s a hybrid reasoning model, producing near-instant responses or extended, step-by-step thinking. One model, two ways to think. We’re also releasing an agentic coding tool: Claude Code.
这则消息立刻引发了技术圈的热烈讨论。有网友在近期的网络文章中兴奋地形容:“Claude 3.7 Sonnet 就像升级版的 AI 导师,可以即刻回复你的小问题,也能深入剖析你的大疑惑,一次搞定两种思维模式。”
Claude 3.7 Sonnet 最核心的亮点,莫过于它的“混合推理”能力。简单来说,它可以在秒回模式和Thinking模式之间灵活切换:
秒回模式:适合处理那些不需要繁琐思考的日常问题,Claude 3.7 Sonnet 会在极短时间内给出答案,让你宛如跟一位健谈又机智的伙伴聊天。
Thinking模式:当你需要更深层次的思考或系统化的推理时,它又能像一位冷静缜密的逻辑大师,给你提供条分缕析的解决方案,让思路不再迷糊。
不少开发者在博客或技术论坛上分享了自己的“上手体验”,表示在面对复杂需求时,Claude 3.7 Sonnet 的思考过程异常清晰,几乎可以看作是一位加班不吃外卖、不打瞌睡的程序猿同事,真正让人省心不少。
如果说“混合推理”功能是给普通用户的高能助力,那么“Claude Code”就是程序员们的私人贴身外挂。它不仅能搜索、阅读并编辑代码,还能直接编写、运行测试,甚至一键提交并推送到 GitHub,连命令行工具都能熟练运用。
据一些抢先体验的用户分享:
感觉就像拥有了一个自动化的研发团队。
遇到难缠的 bug,Claude Code 能提供清晰的解决思路和操作指令。
再也不用凌晨三点查漏补缺,我先睡了,Claude Code 你先扛着。
这种“代理式”编程辅助,不仅能大幅提高开发效率,还能让团队协作更加顺畅:有了 Claude Code 帮忙抓漏补缺,写文档、跑测试的琐碎活儿就变得轻松许多,真正帮你把时间和精力释放到更具创造性的工作上。
四、混合推理实测
开启扩展模式
一句话搞定一个游戏。
一句话搞定一个大数据大屏预览。
在功能上,Claude Code 是一个积极的协作者,可以搜索和阅读代码、编辑文件、编写和运行测试、提交和推送代码到 GitHub,以及使用命令行工具。
我们来看下它的几个使用示例,比如解释项目结构:
编写测试:
构建应用:
五、如何使用Claude 3.7 Sonnent
推荐谷歌浏览器访问:https://claude.nezhagpt.cloud
无需魔法、个人独享、同时支持手机/电脑。