OpenAI 寻求合作伙伴生成用于训练 AI 模型的数据集

人工智能
OpenAI 称:“为了最终使 AI 变得更加安全且造福于全人类,我们希望 AI 模型能够深入理解所有主题、行业、文化和语言,这需要尽可能广泛的训练数据集。”

IT之家 11 月 10 日消息,OpenAI 发文宣布,将与组织合作生成用于训练 AI 模型的公共 / 私有数据集,数据合作伙伴关系旨在“让更多组织能够帮助引导 AI 的未来”并“从更有用的模型中受益”。

IT之家从博客获悉,OpenAI 称:“为了最终使 AI 变得更加安全且造福于全人类,我们希望 AI 模型能够深入理解所有主题、行业、文化和语言,这需要尽可能广泛的训练数据集。”

作为数据合作伙伴计划的一部分,OpenAI 表示,它将收集“反映人类社会”且目前不易在线访问的“大规模”数据集。虽然该公司计划跨多种模式开展工作,包括图像、音频和视频,但它特别寻求跨不同语言、主题和格式“表达人类意图”(例如长篇写作或对话)的数据

OpenAI 表示,如有必要,它将与组织合作,结合使用光学字符识别和自动语音识别工具,对训练数据进行数字化,并在必要时删除敏感或个人信息

OpenAI 希望创建两种类型的数据集:一个可供任何人在 AI 模型训练中使用的公开开源数据集,以及一组用于训练专有 AI 模型的私有数据集

OpenAI 表示,私有集适用于希望保持数据私密性但希望 OpenAI 的模型更好地理解其领域的组织;到目前为止,OpenAI 与冰岛政府和 Miðeind ehf 合作,提高了 GPT-4 说冰岛语的能力,并与自由法律项目合作,提高其模型对法律文件的理解。

责任编辑:姜华 来源: IT之家
相关推荐

2018-07-17 11:06:51

红帽生态系统

2018-10-27 23:20:45

微软合作伙伴平台

2015-03-26 17:12:25

合作伙伴大会四川合作伙伴华为

2013-02-28 11:58:31

Polycom全球合作伙伴

2020-11-19 18:10:46

格物钛

2023-11-21 14:06:36

CIO数字化

2024-10-08 10:53:23

2013-01-20 18:43:33

安捷信

2024-04-23 11:00:35

亚马逊云科技生成式AI

2024-04-03 08:00:00

数据中心

2021-07-01 16:47:37

NVIDIA

2014-03-19 13:01:09

甲骨文

2019-03-20 15:01:47

华为云

2015-11-17 16:04:03

青云QingCloud合作伙伴计划

2015-05-20 20:35:41

Ixia/信息安全

2015-10-12 17:11:12

腾讯云

2020-09-10 15:14:07

AWS合作伙伴APN

2023-09-01 14:23:35

人工智能AI

2023-08-08 09:44:01

OpenAIGPT 模型
点赞
收藏

51CTO技术栈公众号