天下开发人员,苦OpenAI模型价格久矣。
路透爆料称,在11月6日首届开发者大会上,OpenAI将推出年度重磅更新:
在开发工具中增加内存存储(memory storage)功能,让API成本大幅降价95%。
也就是说,开发者苦等的福音终于来了,未来能够以更低成本、更快速度用GPT模型构建应用。
另外,OpenAI还计划推出「视觉」能力加持的全新开发工具。
这样,开发者可以构建「分析图像」和「描述图像」更强大的应用。
这些新功能的开放,最终指向着一个共同的目标:构建大模型加持的AI智能体。
OpenAI此举正沿着Sam Altman设想一步步推进,不仅在用户中打开市场,同时还要成为一个提供热门开发者平台的公司。
OpenAI把价格打下来了
去年11月,ChatGPT横空出世,吸引了全球数亿人使用,创下消费级应用用户数增长里程碑。
除了网页版,ChatGPT还推出了iOS版,以及安卓版程序。
这样客观的下载量,将为OpenAI带来一些盈利。内部高管预计,今年将带来2亿美元的收入,24年将有10亿美元到账。
可见,ChatGPT在消费者群里中已经打下了江山,但在开发圈子里,让开发者基于OpenAI技术构建业务,却面临重重挑战。
在首席执行官Altman看来,让OpenAI成为其他构建应用程序公司不可或缺的一部分,是公司的战略目标之一。
他与开发者会面,急切地表达基于OpenAI模型构建新生态系统的愿望。
目前,GPT模型能力已经融入到了,美版「饿了么」DoorDash、写作助手Jasper等无数应用程序中。
但,这还远远不够。
6月,Sam Altman在AI开发平台Humanloop的首席执行官采访中,曾透露了自家的未来产品路线图。
其中提到了一点是「有记忆的API」(Stateful API)——目前大部分token被浪费在上文的传输中,将来会有一个能够记住对话历史的API版本。
这恰恰与添加「内存存储」的想法不谋而合。增加这一功能可以优化成本的原因有以下几点:
- 新的缓存功能与LangChain的记忆链(Memory Chain)原理类似,可以将之前的对话历史转化为嵌入式向量进行存储。新的会话内容只需在增量标记中进行处理,而无需重新输入整个上下文。
- 预设的角色和功能也无需重新输入,只需进行相似性搜索即可。
- 在模型计算过程中,CUDA图形只需查看增量,而无需以历史聊天记录为基础,再次进行全局浏览。
简而言之,这将大大优化token数量。
所谓的「有记忆的API」的计划发布,能够使模型通过记住查询的对话历史,进而创建应用程序成本更低。
这可能会大大削减,开发人员需要支付API费用。
根据OpenAI官网上的定价,目前,用GPT-4处理一页文档可能需要10美分,具体取决于输入和输出的长度和复杂性。
另一个更新是视觉API,允许开发者构建可以分析图像的软件。
这也标志着,OpenAI继续向前推进多模态能力重要的一步,未来必定还会有音频、视频能力的加入。
抓住开发者, 在做了
为了吸引更多开发者,OpenAI也做出了很多努力。
去年,专门聘用了第一位负责建立OpenAI与开发者关系的工程师Logan Kilpatrick。
他常常会更新一些利好开发者的工具和内容。
微调用户界面现在支持在用户界面中进行端到端作业创建,无需代码即可启动作业。
还有,OpenAI即将发布OpenAI Python SDK的1.0版本。
发布API 使用情况仪表板的更新,有助于更清楚地了解哪些模型在推动使用情况,而且总体上应该更加可靠。
除此之外,可以看到OpenAI面向开发者,做了很多模型适配、用户界面等各种工作的优化。
而所有的这些,都是为了吸引更多开发者来付费使用OpenAI的模型。
根据PitchBook的数据,今年各家AI初创公司已经获得了超过200亿美元的投资。
虽然其中很多都依赖OpenAI提供的技术,但这些初创公司也在努力使它们使用的模型更加多样化,比如采用Llama这种开源方案。而这也使得OpenAI必须将自己与谷歌等资金雄厚的竞争对手区分开来。
据路透社报道,保持开发者的满意度一直是OpenAI的关注重点。
然而,即便ChatGPT在消费者中取得了巨大成功,但OpenAI在赢得其他公司或开发者的支持上,却并没有那么顺利。
比如备受期待的ChatGPT插件系统,在最初引发了一大波热潮之后,用户和开发者的兴趣便急剧下降。
随后Sam Altman也承认,插件并没有像想象中那样获得市场的认可。
价格一览
GPT-4
GPT-3.5 Turbo
微调模型