鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

微软发布Mora视频模型，吊打Sora？

发布于 2024-11-25 16:15

浏览

0收藏

微软与理海大学合作开发的多智能体视频生成框架Mora，近日正式亮相，标志着人工智能在视频创造领域的一次重大突破。Mora的问世不仅是对闭源的Sora模型的成功复现和扩展，更是向我们展示了AI技术向“去中心化”发展的可能性，为未来的AI系统架构、管理和伦理问题的讨论打开了新的篇章。

体验网址：https://github.com/lichao-sun/Mora

Mora框架的核心是整合了多个先进视觉AI智能体，模拟了Sora展现的通用视频生成能力，包括文本到视频生成、基于文本的图像到视频生成、扩展已生成视频、视频到视频编辑、视频拼接以及模拟数字世界等任务。实验结果显示，Mora在这些任务中的表现已经接近了Sora的水平，在文本到视频生成任务中，Mora的表现更是超越了现有的开源模型，位列所有模型中的第二名，这一成绩足以证明Mora在视频生成领域的潜力。

微软发布Mora视频模型，吊打Sora？-AI.x社区

Mora的设计思想，即将视频生成过程分解为多个子任务，并为每个任务指派专门的智能体，这种多智能体协同工作的方式，提供了出色的编辑灵活性和视觉真实度，打开了视频创作的新视角。特别值得一提的是，Mora在推理过程中生成的中间图像或视频，保持了文本到图像模型中的视觉多样性、风格和质量，增强了编辑功能。Mora框架中的智能体可以分为五种基本类型，涵盖了从文本处理到视频拼接的整个视频生成流程，展现了从文本到视频的全流程生成能力。

微软发布Mora视频模型，吊打Sora？-AI.x社区

效果表现

在基于文本条件的图像生成任务中，尽管Sora的表现无疑是最完美的，但Mora的结果与之相差甚微。

微软发布Mora视频模型，吊打Sora？-AI.x社区

在视频到视频编辑以及视频拼接任务中，Mora同样展现出了接近Sora的实力。它不仅能够保持视觉和风格的连贯性，还能实现将不同视频进行无缝拼接。

微软发布Mora视频模型，吊打Sora？-AI.x社区

微软发布Mora视频模型，吊打Sora？-AI.x社区

在模拟数字世界的任务中，Mora同样展现出了创建虚拟环境世界的能力。尽管在质量方面与Sora相比仍有一定差距，但这一成果无疑为Mora在虚拟环境创建领域的应用奠定了基础。

微软发布Mora视频模型，吊打Sora？-AI.x社区

总而言之，Mora的问世是视频生成技术领域的一次重大进展，它不仅推动了视频生成技术的发展，也为未来的AI研究和应用探索了新的路径。随着技术的不断进步和研究的深入，我们有理由相信，Mora在视频生成领域的作用将越来越大，为我们打开通往更加丰富多彩数字世界的大门。

本文转载自百川智能AI，作者： glu

标签

赞

收藏

回复

举报

回复

相关推荐

微软新作「Mora」，复原了Sora

pangguiyu • 2165浏览 • 0回复
首个开源世界模型！百万级上下文，长视频理解吊打GPT-4，UC伯克利华人一作

duhorse • 2789浏览 • 0回复
Sora之后，OpenAI Lilian Weng亲自撰文教你从头设计视频生成扩散模型

轻薄滴假象 • 2172浏览 • 0回复
谷歌发布Veo：文生超1分钟、1080P视频，媲美Sora

Aceryt • 3732浏览 • 0回复
这家世界模型公司发布中国版Sora级视频生成大模型，走向世界模型打造新一代数据引擎

轻薄滴假象 • 2792浏览 • 0回复
媲美Sora，免费使用！带物理模拟的，文生视频模型

Aceryt • 3095浏览 • 0回复
OpenAI 再不发布 Sora，就晚了

51CTO技术栈 • 2274浏览 • 0回复
微软发布Florence-2：用于处理各种视觉任务的小模型

AIGC最前线 • 3720浏览 • 0回复
与Sora同架构，高效、连贯文生视频模型

Aceryt • 1856浏览 • 0回复
比肩Sora，免费试用！国外惊讶，中国文生视频模型超高质量！

Aceryt • 2754浏览 • 0回复
Open-Sora 1.1 解读：完全开源的高效复现类Sora视频生成方案！

angel • 2082浏览 • 0回复
超越Sora！全球首个带背景音乐，文生1080超高清视频模型

Aceryt • 2160浏览 • 0回复
比肩Sora！快手、北大开源，超高清10秒、24帧视频模型

Aceryt • 1708浏览 • 0回复
优雅谈大模型：一文读懂LoRA/DoRA/MoRA

鲁班模锤1 • 2917浏览 • 0回复
16帧1024×1024视频耗时仅16秒！64倍压缩助力高效视频生成：复旦&微软发布Reducio-DiT

angel • 2366浏览 • 0回复
OpenAI 发布 Sora：最受期待的 AI 视频生成工具

Halo咯咯 • 1594浏览 • 0回复
Sora来了！文字秒变视频，附技术细节

云原生AI百宝箱 • 1735浏览 • 0回复
像Sora一样，用物理模拟方式生成视频

Aceryt • 1401浏览 • 0回复
超越Sora！谷歌推出Veo 2，生成8秒超逼真视频

Aceryt • 394浏览 • 0回复

LV.6

5年连续创业者，融资超亿元｜ AI 大模型资深应用专家

觉得TA不错？点个关注精彩不错过

93

帖子

1010

声望

6

粉丝

关注

最近发布

探索Llama 3：迄今为止最强的开源大型语言模型！ 2024-11-12 15:33:16发布
深度比较：Kimi AI还是ChatGPT-4.0？ 2024-08-30 13:05:49发布

热门推荐

王炸！MCP 架构设计深度剖析 & 使用 Spring AI + MCP 四步教你实现 Agent 智能体开发 0回复

实操干货！MCP 全解析，手把手教你基于 MCP 开发 Agent 0回复

从 Manus 到 DeepSearcher，2025年最值得关注的十大 Agent 智能体架构设计 0回复

Dify从入门到高阶系列二：手把手教学！超详细的Dify知识库配置全攻略 0回复

MCP协议之MCP-server(sse方式)实践 0回复

上一篇：探索Llama 3：迄今为止最强的开源大型语言模型！

社区精华内容

目录

效果表现

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载