OpenAI深夜推出五个模型更新,价格打骨折!

原创 精选
人工智能
新模型还包括对影响非英语UTF-8代的错误的修复。对于那些想要自动升级到新的GPT-4 Turbo预览版本的人,还推出了一个新的GPT-1-Turbo-preview型号,它将始终指向最新的GPT4-Turbo预览型号。

编辑 | 言征

当地时间,1月25日,OpenAI发布了新的模型,同时降低了GPT-3.5 Turbo的价格,并为开发人员引入了管理API密钥和了解API使用情况的新方法。

新模型包括:两个新的嵌入模型、一个更新的GPT-4 Turbo预览模型、一个升级的GPT-3.5 Turbo模型、一个新的文本审核模型。

模型默认情况下,发送到OpenAI API的数据将不会用于训练或改进OpenAI模型。

1、两个新嵌入模型,价格下降

OpenAI将引入两种新的嵌入模型:一种是更小、高效的 text-embedding-3-small 模型,另一种是更大、更强的text-embedding-3-large 模型。

embeddings使得机器学习模型和其他算法更容易理解内容之间的关系,并执行聚类或检索等任务。它们为ChatGPT和助手API中的知识检索等应用程序以及许多检索增强生成(RAG)开发工具提供了动力。

图片图片

text-embedding-3-small是新一代的高效嵌入模型,与2022年12月发布的前代text-embeeding-ada-002模型相比进行了重大升级,性能更强。相较而言,多语言检索常用基准(MIRACL)的平均得分从31.4%增加到44.0%,而英语任务常用基准(MTEB)的平均分数从61.0%增加到62.3%。

降价方面,与text-embedding-ada-002相比,text-embetting-3small的价格降低了5倍,从每1k代币的价格0.0001美元降至0.00002美元。

text-embedding-3-large是新的下一代更大的嵌入模型,可创建高达3072个维度的嵌入,它拥有更强的性能。

将text-embedding-ada-002与text-embeeding-3-large进行比较:在MIRACL上,平均得分从31.4%增加到54.9%,而在MTEB上,平均分数从61.0%增加到64.6%。

价格上,text-embedding-3-large定价为0.00013/1k tokens。

图片图片

值得一提的是,这个两个新的嵌入模型都原生支持缩短嵌入。

使用更大的嵌入,例如将它们存储在矢量存储中进行检索,通常会带来更高的成本,比如:消耗更多的计算、内存和存储等等。

这两个新嵌入模型都使用了这样一种技术进行训练,即允许开发人员权衡使用嵌入的性能和成本。具体来说,开发人员可以通过传递dimensions API参数来缩短嵌入(即从序列结尾移除一些数字),而不会丢失嵌入的概念表示属性。例如,在MTEB基准上,文本嵌入-3大嵌入可以缩短到256的大小,同时仍然优于1536大小的未缩减的text-embedding-ada-002。

图片

这使得使用非常灵活。例如,当使用仅支持长度不超过1024个维度的嵌入的向量数据存储时,开发人员现在仍然可以使用我们最好的嵌入模型 text-embedding-3-large ,并为维度API参数指定1024的值,这将使嵌入从3072个维度缩短,牺牲一定的准确性来换取更短、更小的向量。

2、更新的GPT-3.5 Turbo型号和更低的定价

下周,OpenAI将推出一款新的GPT-3.5 Turbo型号GPT-3.5-Turbo-0125,并将第三次降低GPT-3.5 Turbo的价格。新模型的输入价格降低50%,降至0.0005美元/1K tokens,输出价格降低了25%,降至0.0015美元/1K tokens。

该模型还将有各种改进,包括以请求的格式响应的准确性更高,以及修复导致非英语函数调用的文本编码问题的错误。

使用固定gpt-3.5-turbo型号别名的客户将在该型号发布两周后自动从gpt-3.5-turbo-0613升级到gpt-3.5-durbo-0125。

3、更新GPT-4 Turbo预览

自GPT-4 API发布以来,超过70%的GPT-4客户请求已过渡到GPT-4 Turbo,因为开发人员利用了其更新的知识截止、更大的128k上下文窗口和更低的价格。OpenAI现在发布了一个更新的GPT-4 Turbo预览模型,GPT-4-0125-preview。

此模型比以前的预览模型更彻底地完成代码生成等任务,旨在减少模型无法完成任务的“懒惰”情况。

新模型还包括对影响非英语UTF-8代的错误的修复。对于那些想要自动升级到新的GPT-4 Turbo预览版本的人,还推出了一个新的GPT-1-Turbo-preview型号,它将始终指向最新的GPT4-Turbo预览型号。

OpenAI还声称计划在未来几个月内推出GPT-4 Turbo,并实现全面上市。

4、更新审核模型

免费的Moderation API允许开发人员识别潜在的有害文本。作为正在进行的安全工作的一部分,OpenAI将发布text-moderation-007,这是其迄今为止最强大的审核模型。

5、API使用和管理API密钥的新方法

OpenAI正在推出两项平台改进,以使开发人员能够更好地了解他们对API密钥的使用和控制。

首先,开发人员现在可以从API密钥页面为API密钥分配权限。例如,可以为密钥分配只读访问权限以为内部跟踪面板供电,或者将其限制为仅访问某些端点。

其次,使用情况仪表板和使用情况导出功能现在在启用跟踪之后公开API关键级别上的度量。这使得查看每个功能、团队、产品或项目级别的使用情况变得简单,只需为每个功能、小组、产品或工程级别分别提供单独的API键即可。

在接下来的几个月里,OpenAI计划进一步提高开发人员查看API使用情况和管理API密钥的能力。

原文链接:https://openai.com/blog/new-embedding-models-and-api-updates

责任编辑:武晓燕 来源: 51CTO技术栈
相关推荐

2023-06-15 12:24:49

2024-01-26 15:25:27

GPT-4人工智能大模型

2024-08-07 12:34:29

2023-06-14 14:57:38

模型AI

2024-07-26 09:29:38

2023-06-14 11:21:04

2023-08-07 18:23:50

OpenAIChatGPT

2023-06-14 11:31:34

OpenAI聊天机器人

2023-06-14 10:18:08

大型语言模型LLM

2023-08-07 09:59:46

OpenAIGPT-5人类语音

2023-09-22 12:27:18

微软Windows 1

2024-05-17 08:33:33

视觉语言模型

2024-01-11 07:28:42

2023-10-12 10:12:28

OpenAIAI 模型

2023-06-21 13:21:49

2023-10-27 20:52:13

OpenAIJina AI开源

2024-02-19 09:19:54

OpenAIAI模型人工智能

2024-12-13 09:40:00

2018-07-26 08:55:53

谷歌Android开发者

2023-05-11 07:06:07

谷歌人工智能
点赞
收藏

51CTO技术栈公众号