像俄罗斯方块一样生成视频! 北大联合快手AI团队推出新框架VideoTetris实现跟随复杂指令的文生视频!
Paper:https:arxiv.orgabs2406.04277Code:https:github.comYangLing0818VideoTetrisProject:https:videotetris.github.io扩散模型在文本到视频(T2V)生成方面取得了巨大成功,视频生成模型正以飞快的速度发展。然而,现有的文生视频模型在应对复杂、细节丰富、多物体的指令时,仍存在一定的挑战。为了生成更精确的复杂视频,北京大学与快手AI团队推出了VideoTetris,定义了复杂组合指令生成任务,并...