OpenAI推出新款大模型Sora，可根据文本生成视频-51CTO.COM

2月18日消息，据外媒报道，OpenAI推出一款名为Sora的新款AI模型，据称该模型可以通过快速文本提示创建“逼真”和“富有想象力”的60秒视频。

OpenAI在一篇博客文章中表示，Sora能够根据文本指令生成长达60秒的视频，并能够提供包含多个角色、特定类型的动作和详细背景细节的场景。

“这个模型不仅能理解用户在提示中要求什么，还能理解这些东西在现实世界中是如何存在的。”博客文章说。

OpenAI表示，计划训练AI模型，使其能够“帮助人们解决需要现实世界互动的问题”。

市场研究公司ABI research的高级分析师Reece Hayden表示，尽管“多模态模型”并不新鲜，而且文本到视频的模型已经存在，但OpenAI声称Sora具有的长度和准确性使其与众不同。

Hayden表示，这些类型的人工智能模型可能会对数字娱乐市场产生重大影响，因为新的个性化内容将在各个渠道上传播。

“一个明显的用例是电视，创造简短的场景来支持叙事，”Hayden说，“虽然这种模式仍有局限性，但它显示了市场的方向。”

与此同时，OpenAI表示，Sora仍在开发中，存在明显的“弱点”，特别是在提示的空间细节方面。例如制作了一个视频，视频中有人咬了一口饼干，但之后没有咬痕。

目前，OpenAI的信息仍然集中在安全上。该公司表示，计划与一个专家团队合作测试最新模型，并密切关注包括错误信息、仇恨内容和偏见在内的各个领域。该公司表示，它还在开发帮助检测误导性信息的工具。

Sora将首先提供给被称为“红队”的网络安全教授，他们可以评估产品的危害或风险。它还向一些视觉艺术家、设计师和电影制作人提供访问权限，以收集关于创意专业人士如何使用它的反馈。