OpenAI深夜推出五个模型更新，价格打骨折！-51CTO.COM

编辑 | 言征

当地时间，1月25日，OpenAI发布了新的模型，同时降低了GPT-3.5 Turbo的价格，并为开发人员引入了管理API密钥和了解API使用情况的新方法。

新模型包括：两个新的嵌入模型、一个更新的GPT-4 Turbo预览模型、一个升级的GPT-3.5 Turbo模型、一个新的文本审核模型。

模型默认情况下，发送到OpenAI API的数据将不会用于训练或改进OpenAI模型。

1、两个新嵌入模型，价格下降

OpenAI将引入两种新的嵌入模型：一种是更小、高效的 text-embedding-3-small 模型，另一种是更大、更强的text-embedding-3-large 模型。

embeddings使得机器学习模型和其他算法更容易理解内容之间的关系，并执行聚类或检索等任务。它们为ChatGPT和助手API中的知识检索等应用程序以及许多检索增强生成（RAG）开发工具提供了动力。

图片

text-embedding-3-small是新一代的高效嵌入模型，与2022年12月发布的前代text-embeeding-ada-002模型相比进行了重大升级，性能更强。相较而言，多语言检索常用基准（MIRACL）的平均得分从31.4%增加到44.0%，而英语任务常用基准（MTEB）的平均分数从61.0%增加到62.3%。

降价方面，与text-embedding-ada-002相比，text-embetting-3small的价格降低了5倍，从每1k代币的价格0.0001美元降至0.00002美元。

text-embedding-3-large是新的下一代更大的嵌入模型，可创建高达3072个维度的嵌入，它拥有更强的性能。

将text-embedding-ada-002与text-embeeding-3-large进行比较：在MIRACL上，平均得分从31.4%增加到54.9%，而在MTEB上，平均分数从61.0%增加到64.6%。

价格上，text-embedding-3-large定价为0.00013/1k tokens。

图片

值得一提的是，这个两个新的嵌入模型都原生支持缩短嵌入。

使用更大的嵌入，例如将它们存储在矢量存储中进行检索，通常会带来更高的成本，比如：消耗更多的计算、内存和存储等等。

这两个新嵌入模型都使用了这样一种技术进行训练，即允许开发人员权衡使用嵌入的性能和成本。具体来说，开发人员可以通过传递dimensions API参数来缩短嵌入（即从序列结尾移除一些数字），而不会丢失嵌入的概念表示属性。例如，在MTEB基准上，文本嵌入-3大嵌入可以缩短到256的大小，同时仍然优于1536大小的未缩减的text-embedding-ada-002。

这使得使用非常灵活。例如，当使用仅支持长度不超过1024个维度的嵌入的向量数据存储时，开发人员现在仍然可以使用我们最好的嵌入模型 text-embedding-3-large ，并为维度API参数指定1024的值，这将使嵌入从3072个维度缩短，牺牲一定的准确性来换取更短、更小的向量。

2、更新的GPT-3.5 Turbo型号和更低的定价

下周，OpenAI将推出一款新的GPT-3.5 Turbo型号GPT-3.5-Turbo-0125，并将第三次降低GPT-3.5 Turbo的价格。新模型的输入价格降低50%，降至0.0005美元/1K tokens，输出价格降低了25%，降至0.0015美元/1K tokens。

该模型还将有各种改进，包括以请求的格式响应的准确性更高，以及修复导致非英语函数调用的文本编码问题的错误。

使用固定gpt-3.5-turbo型号别名的客户将在该型号发布两周后自动从gpt-3.5-turbo-0613升级到gpt-3.5-durbo-0125。

3、更新GPT-4 Turbo预览

自GPT-4 API发布以来，超过70%的GPT-4客户请求已过渡到GPT-4 Turbo，因为开发人员利用了其更新的知识截止、更大的128k上下文窗口和更低的价格。OpenAI现在发布了一个更新的GPT-4 Turbo预览模型，GPT-4-0125-preview。

此模型比以前的预览模型更彻底地完成代码生成等任务，旨在减少模型无法完成任务的“懒惰”情况。

新模型还包括对影响非英语UTF-8代的错误的修复。对于那些想要自动升级到新的GPT-4 Turbo预览版本的人，还推出了一个新的GPT-1-Turbo-preview型号，它将始终指向最新的GPT4-Turbo预览型号。

OpenAI还声称计划在未来几个月内推出GPT-4 Turbo，并实现全面上市。

4、更新审核模型

免费的Moderation API允许开发人员识别潜在的有害文本。作为正在进行的安全工作的一部分，OpenAI将发布text-moderation-007，这是其迄今为止最强大的审核模型。

5、API使用和管理API密钥的新方法

OpenAI正在推出两项平台改进，以使开发人员能够更好地了解他们对API密钥的使用和控制。

首先，开发人员现在可以从API密钥页面为API密钥分配权限。例如，可以为密钥分配只读访问权限以为内部跟踪面板供电，或者将其限制为仅访问某些端点。

其次，使用情况仪表板和使用情况导出功能现在在启用跟踪之后公开API关键级别上的度量。这使得查看每个功能、团队、产品或项目级别的使用情况变得简单，只需为每个功能、小组、产品或工程级别分别提供单独的API键即可。

在接下来的几个月里，OpenAI计划进一步提高开发人员查看API使用情况和管理API密钥的能力。

原文链接：https://openai.com/blog/new-embedding-models-and-api-updates