比肩Sora!快手、北大开源,超高清10秒、24帧视频模型
快手、北京大学和北京邮电大学的研究人员联合开源了超高清视频模型——PyramidFlow。PyramidFlow仅通过文本就能生成最多10秒、1280x768分辨率和24帧视频,在光影效果、运动动作一致性、视频质量、文本语义还原、色彩搭配等方面非常优秀,生成的视频很棒。值得一提的是,PyramidFlow使用A100GPU在开源数据集上仅训练了20,700小时,其能耗和生成效率比市面上同类开源视频模型好很多,对于没有大量算力的中小企业和个人开发者来说...