7 月 12 日消息,日前,Anthropic 发布了全新的 Claude 2 大语言模型。相比前代版本,Claude 2 性能有所提升,且能够实现更长文本的响应,在编程、数学、推理等方面都有大幅提升。
Claude 2 的新特性提升在如下几点:
- 编程、数学和推理方面相比前代产品有所改进:其在美国律师资格考试的多选题部分可以取得 76.5% 的正确率,前代 Claude 1.3 为 70%;在 GRE 阅读和写作测试中,Claude 2 的得分超过了 90% 的应届毕业生;在美国医师执照考试中,Claude 2 在 3 个科目中的分数都超过 60%,也就是取得了“ALL PASS”。
- 输入和输出长度明显增加:用户现可在每个 prompt 中输入多达 10 万的 token,意味其可以一次读取几百页的文件内容。同时,Claude 2 可以完成长达数千个 token 的各类文字工作,如撰写备忘录、信函乃至故事等。
值得注意的是,Claude 支持中文,当前 Anthropic 已经推出了一个 Beta 测试网站,不过仅供美国、英国注册使用。同时,Claude 2 也通过 API 向企业开放模型。
IT之家此前报道,Anthropic 是一家由前 OpenAI 员工创立的公司,总部位于旧金山。自 2022 年底以来,谷歌已向该公司投资了近 4 亿美元,Anthropic 现已宣布同谷歌 Cloud 建立正式合作伙伴关系。Anthropic 的拳头产品 Claude 于 2 月上线,其被认为是 ChatGPT 的主要竞争对手之一。
上一个版本的 Claude 1.3 目前已能学习并理解财务报告、芯片开发手册、识别文档及对话中存在的法律风险等。IT之家经过体验发现,Claude 不仅能基于上传的信息回答用户的问题,还能通过用户上传的文档完成具体任务,如调整 Excel 列表、使用 VBA 语言写作代码等。