鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 25年5月软考 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理

发布于 2024-7-1 12:45

浏览

0收藏

一段AI生成的体操视频，引发近百万网友围观，LeCun等一众大佬还因为它吵起来了。

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

体操表演，emmmm怎么不算呢？

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

通过视频右上角的水印，此段视频正是由那个一度被认为是“下一代”文生视频的Dream Machine（来自Luma AI）生成的。

大伙儿看后纷纷坐不住，围绕此讨论的，是AI视频领域的一个熟悉的话题：AI是否理解物理规律。

LeCun直接开麦：

视频生成模型不理解基本物理知识。更不用说人体了。

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

华盛顿大学计算机科学教授Pedro Domingos看后也“摇了摇头”：

AGI可能并不会像一些人预期的那样即将到来。

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

畸变雀食离谱

自Sora问世以来，“AI是否理解物理规律”这个话题就被越来越多人关注。

下面这段Sora生成的“寄居蟹用灯泡当外壳的夜间场面”是个经典的例子，海浪与沙滩的互动非常细腻，寄居蟹腿上的纤毛也活灵活现。

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

对比真实拍摄的类似场景照片，也就灯泡没有电源不应该亮这一个明显破绽了。

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

最近Luma AI的Dream Machine也一样，生成的第一视角探废弃房子真实感拉满：

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

由此，不少人认为Sora、LUMA等的视频生成模型已经理解了简单的物理规律。

然鹅，这次被放出的视频着实有点太离谱。

不仅腿脚乱飞，频频上演大变活人：

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

就这高难度的空中悬浮翻跟头，也是牛顿都要被气活了的节奏：

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

以至于网友看后还表示，说恐怖大可不必，说搞笑还差不多。

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

如此抽象，LeCun直接评论视频生成模型不会懂物理。

他还进一步解释，Sora或者其它视频生成模型都有类似的问题，视频生成技术无疑也肯定会随时间推移而进步。

但：

真正理解物理的学习系统并不会具有生成性。就像鸟类、哺乳动物等比任何视频生成系统更了解物理。然而，它们都不能生成详细的视频。

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

类似还有另一种思考：

即使AI视频生成模型之后会进化的很好，生成的视频质量“完美”，那么就意味着它理解物理了？

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

LeCun等的观点，立马引起网友的质疑：

鸟和哺乳动物也会生成详细的视频，只不过是在大脑中生成无法将其具像化。

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

然鹅，这种反驳并未说服LeCun。

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

此外，还有不少人持反对意见。

例如，谷歌DeepMind/Brain团队研究员Lucas Beyer就指出：

这就像是展示一个由几年前的Dall·E mini生成的图像，然后称当前的图像生成方式注定失败一样。

毕竟，之前生图模型生成的图像be like：

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

至于模型会生成如此离谱的视频？

有网友认为是缺乏体操表演数据，还有网友认为是身体部位的模糊处理，使得模型无法理解人体结构，继而不能保证肢体动作的连贯性。

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

视频生成在计算上更为复杂，并且具有高度的上下文相关性，对详细标注的训练数据有更大的需求，这些需求现在还未得到充分满足。

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

前段时间SD 3翻车，同样对人体生成效果不好，网友也讨论过这一问题，过于严格的数据审核，可能误删了一些无害的成人图像，影响了模型对人体结构的理解。

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

One More Thing

除了Luma AI的Dream Machine生成体操视频大翻车，Runway的Gen-3也……

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

同款三头六臂：

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

同款空中悬浮绝活：

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理-AI.x社区

本文转自量子位，作者：量子位

原文链接: https://mp.weixin.qq.com/s/GCyyMCTEd8EJi7CNeqfFOg

标签

赞

收藏

回复

举报

回复

相关推荐

52个AIGC视频生成算法模型介绍

pangguiyu • 3147浏览 • 0回复
谷歌推出多模态视频模型，自动生成丰富动作视频

Aceryt • 1863浏览 • 0回复
Sora之后，OpenAI Lilian Weng亲自撰文教你从头设计视频生成扩散模型

轻薄滴假象 • 1000浏览 • 0回复
阿里巴巴AI研究团队打破视频生成技术壁垒，EasyAnimate实现高质量长视频生成

Syrupup • 2067浏览 • 0回复
带物理模拟的，文生视频模型

Aceryt • 1801浏览 • 0回复
史上首个实时AI视频生成技术：DiT通用，速度提升10.6倍

轻薄滴假象 • 1314浏览 • 0回复
视觉文本视频生成最强方案！Text-Animator效果确实好！

angel • 1138浏览 • 0回复
长视频生成速度提升100倍！新加坡国立提出Video-Infinity：分布式长视频生成

angel • 1185浏览 • 0回复
阿里「轨迹可控版Sora」，告别「抽卡」，让视频生成更符合物理规律

轻薄滴假象 • 949浏览 • 0回复
长视频生成又有重大突破！DreamFactory：一致、连贯且引人入胜的长视频生成框架

angel • 3296浏览 • 0回复
视频生成类大模型实现原理以及应用和难点

AI探索时代 • 1196浏览 • 0回复
长视频生成再突破！高质量连贯达600帧 | ConFiner：专家链加持的免训练长视频生成器

angel • 803浏览 • 0回复
Meta Movie Gen：新的 SOTA 视频生成模型-技术报告解读

amei2000go • 1272浏览 • 0回复
阿里商业级视频生成框架——轨迹控制版视频生成 Tora 重磅开源！

angel • 724浏览 • 0回复
16帧1024×1024视频耗时仅16秒！64倍压缩助力高效视频生成：复旦&微软发布Reducio-DiT

angel • 641浏览 • 0回复
艺术家泄露OpenAI Sora视频生成神器，附地址

云原生AI百宝箱 • 452浏览 • 0回复
OpenAI 发布 Sora：最受期待的 AI 视频生成工具

Halo咯咯 • 319浏览 • 0回复
腾讯的混源视频模型HunyuanVideo：大视频生成模型训练的系统框架

Halo咯咯 • 373浏览 • 0回复
视频编辑最新SOTA！港中文&Adobe等发布统一视频生成传播框架——GenProp

angel • 187浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

震撼！AI实时生成游戏，每秒20帧输出，DeepMind扩散模型最新突破一夜爆火 2024-08-29 13:37:43发布
AI给《黑神话：悟空》生成了一个宣传片…看完我沉默了 2024-08-21 09:17:27发布

热门推荐

Cursor账号过期了怎么办？一文教你如何永久使用Cursor技巧！ 1回复

谷歌AI发布Gemini 2.0 Flash：比Gemini 1.5 Pro快2倍的新AI模型 0回复

ChatGPT写作指南发布：12个案例助力高效学习 0回复

十个Cursor智能编程技巧，从小白到高手 0回复

生成式人工智能：2024年全面指南 0回复

上一篇：靠Scaling Laws炼出4D版视频生成模型，多伦多大学北交大等携手开源81K高质量数据集

下一篇： AI慢思考蒸馏进快思考，Llama2跃升至GPT-4水平，不写过程也能做对题

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载