开发者终于可以定制自己的GPT-4o了！原创

51CTO技术栈

发布于 2024-8-22 13:40

浏览

0收藏

编辑 | 言征

出品 | 51CTO技术栈（微信号：blog51cto）

OpenAI终于又Open了一把！开发者可以免费定制自己的GPT-4o了！

当地时间8月20日，OpenAI 推出了GPT-4o微调功能，截至9月23日，所有开发者都可以使用自定义的数据集对GPT-4o进行微调，满足特定用例的需求。

具体而言，这项微调功能可以通过一个小型数据集（小到几十个示例），就能使模型能够自定义响应的结构和语气，或遵循复杂的特定领域指令，

1.首批尝鲜的定制者们

OpenAI的合作伙伴Cosine推出了AI软件工程助手Genie，可以帮自主识别和解决错误，构建和重构代码。它可以推理复杂的技术问题，并以更高的准确度和更少的token更改代码。

这里的Genie就是借助了微调后的GPT-4o的模型，并且Genie在SWE-bench测评榜上获得了SOTA的水平，位列第一。

开发者终于可以定制自己的GPT-4o了！-AI.x社区图片

text to SQL 也是业内一个很热的例子，Distyl也是通过微调GPT-4o的微调夺得了该领域BIRD-SQL的基准测试的第一名，执行准确率高达71.83%，除了在SQL生成方面一骑绝尘，同时在查询重构、意图分类、思维链和自我修正等任务重表现出色。

2.如何操作？

对新功能感兴趣的开发人员可以访问 OpenAI 的微调仪表板，单击“创建”，然后 gpt-4o-2024-08-06 从基础模型下拉菜单中进行选择。

开发者终于可以定制自己的GPT-4o了！-AI.x社区图片

不到一个月前，该公司允许开发人员对该模型的更小、更快、更便宜的版本 GPT-4o mini 进行微调，但它的功能不如完整版 GPT-4o。

OpenAI 技术人员 John Allard 和 Steven Heidel 在公司官方网站的博客文章中表示：“从编码到创意写作，微调可以对各个领域的模型性能产生巨大影响。”

3.即日起至 9 月 23 日提供免费tokens

OpenAI指出，开发人员仅使用训练数据中的几十个示例就能取得很好的效果。

为了启动这项新功能，OpenAI 将每天免费提供最多 100 万个tokens，供任何第三方组织（客户）用于微调 GPT-4o，截至 2024 年 9 月 23 日。

众所周知，tokens实际上就像 AI 模型的“母语”一样发挥作用，并且是 OpenAI 和其他模型提供商用来确定模型摄取（输入）或提供（输出）信息量的测量方法。

开发人员/客户对 LLM 或 LMM（例如 GPT-4o）进行微调前，需要将与组织、团队或个人用例相关的数据转换为它可以理解的tokens，即对其进行标记化，OpenAI 的微调工具提供这些功能。

然而，这是有代价的：通常对 GPT-4o 进行微调每 100 万个令牌的成本为 25 美元，而运行微调版本的推理/生产模型的成本为每百万个输入tokens3.75 美元，每百万个输出tokens 15 美元。

对于使用较小的 GPT-4o mini模型的用户，截至 9 月 23 日，每天有 200 万个免费训练tokens可用。

此项服务扩展到所有付费使用层的开发人员，确保广泛使用微调功能。

有媒体分析，OpenAI此举也是日益激烈的竞争环境中做出的决策，毕竟谷歌、Anthropic等其他闭源供应商，Nous Research 推出的Meta Llama3.1的新变体Hermes3等都纷纷打起了价格战。

不过，OpenAI有着自己独特的优势，开发人员可以不必再费心思去托管推理、也不必去他们的自己搭建的服务器上进行训练。开发者如果有需要，甚至可以将他们喜欢的服务器链接到OpenAI的API上。

4.微调是否会带来新的数据安全问题

OpenAI 强调，即使为开发人员扩展了定制选项，安全性和数据隐私仍然是首要任务。经过微调的模型可以完全控制业务数据，并且不存在输入或输出被用于训练其他模型的风险。

此外，该公司还实施了分层安全缓解措施，包括自动评估和使用情况监控，以确保应用程序遵守 OpenAI 的使用政策。

然而，研究表明，微调模型可能会导致它们偏离护栏和保障措施，并降低其整体性能。组织是否认为值得冒险取决于他们自己——然而，OpenAI 显然认为值得，并鼓励他们将微调视为一个不错的选择。

5.这只是一个开始

事实上，早在 4 月份，OpenAI 宣布为开发人员提供新的微调工具（例如基于 epoch 的检查点创建）时就表示，“我们相信，未来绝大多数组织将开发针对其行业、业务或用例个性化的定制模型。”

今天发布的全新 GPT-4o 微调功能凸显了 OpenAI 对这一愿景的持续承诺：每个组织都有自己的定制 AI 模型的世界。

正如OpenAI 官方博客中所说的：“这只是一个开始——我们将继续投资扩大开发人员的模型定制选项。”

本文转载自51CTO技术栈，作者：言征

标签

开发者

GPT-4o

Open

已于2024-8-22 14:50:52修改

相关推荐

GPT-4推理能力为0？开发者悬赏1万美金被打脸，神秘提示正确率直冲100%

duhorse • 1821浏览 • 0回复
全球开发者用GPT4都在做什么？这28种方法值得一看

51CTO技术栈 • 1409浏览 • 0回复
开发者的LlamaIndex入门指南

51CTO内容精选 • 1965浏览 • 0回复
OpenAI模型终于更新！强大视听能力的GPT-4o将面向所有用户，其前身正是神秘的gpt2！

51CTO技术栈 • 1853浏览 • 0回复
GPT-4o再秀神操作，“复现”OpenAI总裁讲课，网友当真了

Crystalcxt • 1394浏览 • 0回复
GPT-4o：实现跨越文本与视觉的智能交互

51CTO内容精选 • 2358浏览 • 0回复
GPT-4o 的数学又双叕进步了？来 MathBench 看看新版 GPT-4o 到底强在哪！

恋恋青鸟 • 1859浏览 • 0回复
GPT-4o做Code Review可行吗？

51CTO技术栈 • 1857浏览 • 0回复
现在，所有人都能免费用GPT-4o了！

duhorse • 2579浏览 • 0回复
GPT-4o背后可能的语音技术

鱼虫子 • 1303浏览 • 0回复
GPT-4o不香了

Crystalcxt • 1654浏览 • 0回复
探索GLM4-ALLTools：全能AI工具箱，释放开发者潜能

ermulong • 1917浏览 • 0回复
终于来了，OpenAI测试GPT-4o高级语音模式！

Aceryt • 851浏览 • 0回复
开发者福音！ChatGPT 输出现支持预定义！

51CTO技术栈 • 1154浏览 • 0回复
“我已经厌倦了给愚蠢的AI代码找bug！”一独立开发者彻底被无知的代码生成者逼疯！

51CTO技术栈 • 1374浏览 • 0回复
【智汇金秋创造季】智汇成海，致敬开发者的“超级码力”！

AI.x社区官方账号 • 32.8w浏览 • 148回复
Claude AI：开发者的秘密武器

丢翅膀的鱼 • 777浏览 • 0回复
LLM应用开发者新利好：再也不用写集成代码了！

51CTO技术栈 • 676浏览 • 0回复
DeepSeek-R1-Distill-Qwen-1.5B 在某些基准测试中超越了 GPT-4o

Halo咯咯 • 6665浏览 • 0回复

51CTO技术栈

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂