编辑 | 言征
当地时间,1月25日,OpenAI发布了新的模型,同时降低了GPT-3.5 Turbo的价格,并为开发人员引入了管理API密钥和了解API使用情况的新方法。
新模型包括:两个新的嵌入模型、一个更新的GPT-4 Turbo预览模型、一个升级的GPT-3.5 Turbo模型、一个新的文本审核模型。
模型默认情况下,发送到OpenAI API的数据将不会用于训练或改进OpenAI模型。
1、两个新嵌入模型,价格下降
OpenAI将引入两种新的嵌入模型:一种是更小、高效的 text-embedding-3-small 模型,另一种是更大、更强的text-embedding-3-large 模型。
embeddings使得机器学习模型和其他算法更容易理解内容之间的关系,并执行聚类或检索等任务。它们为ChatGPT和助手API中的知识检索等应用程序以及许多检索增强生成(RAG)开发工具提供了动力。
图片
text-embedding-3-small是新一代的高效嵌入模型,与2022年12月发布的前代text-embeeding-ada-002模型相比进行了重大升级,性能更强。相较而言,多语言检索常用基准(MIRACL)的平均得分从31.4%增加到44.0%,而英语任务常用基准(MTEB)的平均分数从61.0%增加到62.3%。
降价方面,与text-embedding-ada-002相比,text-embetting-3small的价格降低了5倍,从每1k代币的价格0.0001美元降至0.00002美元。
text-embedding-3-large是新的下一代更大的嵌入模型,可创建高达3072个维度的嵌入,它拥有更强的性能。
将text-embedding-ada-002与text-embeeding-3-large进行比较:在MIRACL上,平均得分从31.4%增加到54.9%,而在MTEB上,平均分数从61.0%增加到64.6%。
价格上,text-embedding-3-large定价为0.00013/1k tokens。
图片
值得一提的是,这个两个新的嵌入模型都原生支持缩短嵌入。
使用更大的嵌入,例如将它们存储在矢量存储中进行检索,通常会带来更高的成本,比如:消耗更多的计算、内存和存储等等。
这两个新嵌入模型都使用了这样一种技术进行训练,即允许开发人员权衡使用嵌入的性能和成本。具体来说,开发人员可以通过传递dimensions API参数来缩短嵌入(即从序列结尾移除一些数字),而不会丢失嵌入的概念表示属性。例如,在MTEB基准上,文本嵌入-3大嵌入可以缩短到256的大小,同时仍然优于1536大小的未缩减的text-embedding-ada-002。
这使得使用非常灵活。例如,当使用仅支持长度不超过1024个维度的嵌入的向量数据存储时,开发人员现在仍然可以使用我们最好的嵌入模型 text-embedding-3-large ,并为维度API参数指定1024的值,这将使嵌入从3072个维度缩短,牺牲一定的准确性来换取更短、更小的向量。
2、更新的GPT-3.5 Turbo型号和更低的定价
下周,OpenAI将推出一款新的GPT-3.5 Turbo型号GPT-3.5-Turbo-0125,并将第三次降低GPT-3.5 Turbo的价格。新模型的输入价格降低50%,降至0.0005美元/1K tokens,输出价格降低了25%,降至0.0015美元/1K tokens。
该模型还将有各种改进,包括以请求的格式响应的准确性更高,以及修复导致非英语函数调用的文本编码问题的错误。
使用固定gpt-3.5-turbo型号别名的客户将在该型号发布两周后自动从gpt-3.5-turbo-0613升级到gpt-3.5-durbo-0125。
3、更新GPT-4 Turbo预览
自GPT-4 API发布以来,超过70%的GPT-4客户请求已过渡到GPT-4 Turbo,因为开发人员利用了其更新的知识截止、更大的128k上下文窗口和更低的价格。OpenAI现在发布了一个更新的GPT-4 Turbo预览模型,GPT-4-0125-preview。
此模型比以前的预览模型更彻底地完成代码生成等任务,旨在减少模型无法完成任务的“懒惰”情况。
新模型还包括对影响非英语UTF-8代的错误的修复。对于那些想要自动升级到新的GPT-4 Turbo预览版本的人,还推出了一个新的GPT-1-Turbo-preview型号,它将始终指向最新的GPT4-Turbo预览型号。
OpenAI还声称计划在未来几个月内推出GPT-4 Turbo,并实现全面上市。
4、更新审核模型
免费的Moderation API允许开发人员识别潜在的有害文本。作为正在进行的安全工作的一部分,OpenAI将发布text-moderation-007,这是其迄今为止最强大的审核模型。
5、API使用和管理API密钥的新方法
OpenAI正在推出两项平台改进,以使开发人员能够更好地了解他们对API密钥的使用和控制。
首先,开发人员现在可以从API密钥页面为API密钥分配权限。例如,可以为密钥分配只读访问权限以为内部跟踪面板供电,或者将其限制为仅访问某些端点。
其次,使用情况仪表板和使用情况导出功能现在在启用跟踪之后公开API关键级别上的度量。这使得查看每个功能、团队、产品或项目级别的使用情况变得简单,只需为每个功能、小组、产品或工程级别分别提供单独的API键即可。
在接下来的几个月里,OpenAI计划进一步提高开发人员查看API使用情况和管理API密钥的能力。
原文链接:https://openai.com/blog/new-embedding-models-and-api-updates