Anthropic 公开了自家的模型“操作说明”,业界大赞:Nice,非常透明!

原创 精选
人工智能
尽管如此,Anthropic 发布 Claude 系统为其他 AI 公司指明了一条提高 AI 模型开发透明度的道路。它还向用户展示了他们的 AI 聊天机器人是如何设计的,从而让用户受益。​

编辑 | 星璇

出品 | 51CTO技术栈(微信号:blog51cto)

OpenAI 的竞争对手初创公司Anthropic昨天发布了其 Claude系列人工智能模型的系统提示(System  Prompt),并承诺未来将继续这样做,为快速发展的人工智能行业树立了新的透明度标准。

图片图片

1.系统提示为什么这么重要?

系统提示的作用很像大型语言模型(LLM)的操作说明,告诉模型在与用户交互时应该遵循的一般规则以及应该表现出的行为或个性,它们还倾向于显示 LLM 在训练期间学习到的信息的截止日期。

大部分 LLM 都有系统提示,但并不是每家 AI 公司都会公开发布。揭秘模型的系统提示甚至成了AI 越狱者的一种爱好。

但现在不用这些AI越狱者,Anthropic 直接“自曝”,在其网站的直接发布说明部分发布了其Claude 3.5 Sonnet、Claude 3 Haiku 和 Claude 3 Opus型号的操作说明。

此外,Anthropic 的开发者关系主管Alex Albert 在 X上发布了一项承诺,即让公众了解其系统提示的最新情况,他写道:“我们将记录对 Claude dot ai 和我们的移动应用程序上的默认系统提示所做的更改。”

2.Anthropic 的系统提示曝光了

针对 Claude 3.5 Sonnet、Claude 3 Haiku 和 Claude 3 Opus 这三个模型的系统提示揭示了每个模型的一些有趣细节、它们的能力和知识日期截止值以及各种性格怪癖。

Claude 3.5 Sonnet是最先进的版本,其知识库于 2024 年 4 月更新。它为复杂问题提供详细答案,为简单任务提供简洁答案,强调准确性和简洁性。该模型谨慎处理有争议的话题,呈现信息时不会明确将其标记为敏感或声称客观。此外,Claude 3.5 Sonnet 避免使用不必要的填充短语或道歉,并特别注意其处理图像识别的方式,确保它永远不会承认识别了任何人脸。

Claude 3 Opus的知识库更新至 2023 年 8 月,擅长处理复杂任务和写作。它旨在对简单查询提供简洁的回复,对更复杂的问题提供详尽的答案。Claude 3 Opus 通过提供广泛的视角、避免刻板印象和提供平衡的观点来解决有争议的话题。虽然它与 Sonnet 模型有一些相似之处,但它没有采用相同的详细行为准则,例如避免道歉或不必要的肯定。

Claude 3 Haiku是 Claude 系列中速度最快的模型,同样于 2023 年 8 月进行了更新。它经过优化,可以快速、简洁地回答简单问题,同时在需要解决更复杂的问题时仍能提供全面的答案。与 Sonnet 相比,Haiku 的提示结构更为直接,主要注重速度和效率,没有 Sonnet 模型中更高级的行为细微差别。

3.为什么 Anthropic 发布其系统提示很重要

生成式AI系统一直都被描述为一个人类难以理解的“黑匣子”,人们很难找出模型做出决定的原因和方式。黑匣子问题继而引发了对人工智能可解释性的研究,这是一种阐明模型预测决策过程的方法。公众对系统提示的访问是朝着稍微打开黑匣子迈出的一步,但仅限于人们了解人工智能公司为其创建的模型设定的规则的程度。

所以,AI 开发人员对 Anthropic 这一透明性决定大为赞赏,并认为:发布有关 Claude 系统提示和更新的文档将会令其在众多大模型独角兽中脱颖而出。

图片图片

一位从行业者称:这是一个伟大的变化,希望业界也都行动起来。

4.小遗憾:并非完全开源

发布Claude 模型的系统提示并不意味着 Anthropic 开放了该模型系列。运行模型的实际源代码以及训练数据集和底层“权重”(或模型设置)仍掌握在 Anthropic 手中。

尽管如此,Anthropic 发布 Claude 系统为其他 AI 公司指明了一条提高 AI 模型开发透明度的道路。它还向用户展示了他们的 AI 聊天机器人是如何设计的,从而让用户受益。

想了解更多AIGC的内容,请访问:

51CTO AI.x社区

https://www.51cto.com/aigc/

责任编辑:武晓燕 来源: 51CTO技术栈
相关推荐

2021-12-01 12:30:43

NiceUmiJS前端

2024-11-21 13:53:09

微软AI技术

2023-11-05 15:09:35

模型AI

2023-10-13 12:57:37

AI模型

2024-05-10 12:58:08

2024-06-21 09:58:38

2023-10-28 13:32:57

谷歌模型

2018-01-23 12:03:57

阿里双11超级工程

2010-03-01 16:20:04

Python

2024-04-19 07:55:57

Llama 3模型人工智能开源

2024-10-31 13:40:24

GitHubCopilot人工智能

2023-08-18 14:34:00

研究模型

2023-10-20 16:57:09

2024-04-11 13:34:37

大语言模型

2024-07-08 13:11:40

2023-12-04 09:55:58

AI大模型

2023-07-12 16:10:48

人工智能

2017-12-18 08:21:46

存储业界动态

2010-08-09 14:37:00

认证证书
点赞
收藏

51CTO技术栈公众号