2月18日消息,据外媒报道,OpenAI推出一款名为Sora的新款AI模型,据称该模型可以通过快速文本提示创建“逼真”和“富有想象力”的60秒视频。
OpenAI在一篇博客文章中表示,Sora能够根据文本指令生成长达60秒的视频,并能够提供包含多个角色、特定类型的动作和详细背景细节的场景。
“这个模型不仅能理解用户在提示中要求什么,还能理解这些东西在现实世界中是如何存在的。”博客文章说。
OpenAI表示,计划训练AI模型,使其能够“帮助人们解决需要现实世界互动的问题”。
市场研究公司ABI research的高级分析师Reece Hayden表示,尽管“多模态模型”并不新鲜,而且文本到视频的模型已经存在,但OpenAI声称Sora具有的长度和准确性使其与众不同。
Hayden表示,这些类型的人工智能模型可能会对数字娱乐市场产生重大影响,因为新的个性化内容将在各个渠道上传播。
“一个明显的用例是电视,创造简短的场景来支持叙事,”Hayden说,“虽然这种模式仍有局限性,但它显示了市场的方向。”
与此同时,OpenAI表示,Sora仍在开发中,存在明显的“弱点”,特别是在提示的空间细节方面。例如制作了一个视频,视频中有人咬了一口饼干,但之后没有咬痕。
目前,OpenAI的信息仍然集中在安全上。该公司表示,计划与一个专家团队合作测试最新模型,并密切关注包括错误信息、仇恨内容和偏见在内的各个领域。该公司表示,它还在开发帮助检测误导性信息的工具。
Sora将首先提供给被称为“红队”的网络安全教授,他们可以评估产品的危害或风险。它还向一些视觉艺术家、设计师和电影制作人提供访问权限,以收集关于创意专业人士如何使用它的反馈。