谷歌“另辟蹊径”，展示AI视频生音频最新进展，效果惊艳！网友：但有一个缺点原创

51CTO技术栈

发布于 2024-6-19 14:53

浏览

0收藏

编辑 | 伊风

出品 | 51CTO技术栈（微信号：blog51cto）

最近几周，文生视频领域正卷的风生水起。

可灵和Dream Machine相继推出。而后者充满趣味性的文生视频功能更是开启一阵续写“meme”的狂潮。

谷歌“另辟蹊径”，展示AI视频生音频最新进展，效果惊艳！网友：但有一个缺点-AI.x社区

正当大家觉得文生视频的开路者Runway要一直沉寂下去的时候。

Runway突然上演了一波“王者归来”。展示了商用级别的生成视频，让人难辨是不是AI生成。

谷歌“另辟蹊径”，展示AI视频生音频最新进展，效果惊艳！网友：但有一个缺点-AI.x社区 "一个悲伤的中年秃头男人变得快乐起来，因为一顶卷发假发和太阳镜突然落在了他的头上"。

画质惊艳的Runway，速度也不逊色，生成10秒钟视频才需要1分半左右的时间。

Runway重回巅峰又再次改变了文生视频的格局。

谷歌“另辟蹊径”，展示AI视频生音频最新进展，效果惊艳！网友：但有一个缺点-AI.x社区图片

正在大家在这边卷得不急乐乎的时候。

谷歌突然站了出来，开始给大家汇报他们的视频生音频（V2A）进展。

谷歌“另辟蹊径”，展示AI视频生音频最新进展，效果惊艳！网友：但有一个缺点-AI.x社区图片

谷歌的V2A已经可以为无声片段添加与场景声学相匹配的声音，为屏幕上的动作等伴奏。

干巴巴的视频片段从此有了bgm！

虽然部分案例中使用了文字辅助，但仍然相当惊艳，能看到AI对于视频内容以及场景中的感受理解得比较到位。

画面中男人穿过废弃工厂般的走廊，音乐突出了惊悚和紧张的氛围：

谷歌“另辟蹊径”，展示AI视频生音频最新进展，效果惊艳！网友：但有一个缺点-AI.x社区

给狼配上一段孤独的长啸声：

谷歌“另辟蹊径”，展示AI视频生音频最新进展，效果惊艳！网友：但有一个缺点-AI.x社区音频提示："狼对月嚎叫"

音乐展现了落日骑马时，那种安逸与悠然的感觉：

谷歌“另辟蹊径”，展示AI视频生音频最新进展，效果惊艳！网友：但有一个缺点-AI.x社区草原上夕阳西下时悠扬的口琴声响起

海洋水母自在浮沉时，海洋的声音：

谷歌“另辟蹊径”，展示AI视频生音频最新进展，效果惊艳！网友：但有一个缺点-AI.x社区水母在水下跳动海洋生物海洋

鼓声和欢呼声让人身临其境：

谷歌“另辟蹊径”，展示AI视频生音频最新进展，效果惊艳！网友：但有一个缺点-AI.x社区音乐会舞台上的鼓手周围是闪烁的灯光和欢呼的人群"

谷歌的V2A的这股清流确实得到了网友的赞赏。

然而当一位网友询问，什么时候可以上手玩玩看的时候，被网友无情地回复道：等有人跳槽出来，把这个产品带出来我们就能玩啦！

谷歌“另辟蹊径”，展示AI视频生音频最新进展，效果惊艳！网友：但有一个缺点-AI.x社区图片

还有人说：这是谷歌，所以别再想着试一试了

谷歌“另辟蹊径”，展示AI视频生音频最新进展，效果惊艳！网友：但有一个缺点-AI.x社区图片

当前，观众的胃口已经越来越大。无法开箱即用的技术和产品将难以说服用户。

现在，无论OpenAI在社交平台上发布什么内容，都会收到无数用户“催更”GPT-5的消息。

但是，另一边。

早前OpenAI发布会上令人惊艳的GPT-4o多模态通话功能，甚至更遥远的Sora，都没有让广泛的普通用户上手。

苹果在刚刚过去的全球开发者大会中，发布的“苹果智能”被曝光分批上线，部分功能要到25年才能实现（更不用说大陆用户只会更晚）。

人们渴望AI的有趣与实用能够早一步的照进现实。否则，用户的期待会慢慢冷却，产品也终将沉于水中。

本文转载自51CTO技术栈，作者：伊风

标签

谷歌

视频

已于2024-6-20 13:42:57修改

相关推荐

一次性支持 200 万字无损上下文！Kimi智能助手玩了个大的——月之暗面「登月」最新进展!

pangguiyu • 3207浏览 • 0回复
第一个能听懂人类语气的AI火了，网友：感觉在和真人交谈

Crystalcxt • 2971浏览 • 0回复
两万字长文详解视频扩散模型的最新进展

angel • 4737浏览 • 0回复
DiT架构大一统：一个框架集成图像、视频、音频和3D生成，可编辑、能试玩

轻薄滴假象 • 2267浏览 • 0回复
一文详解多模态智能体（LMAs）最新进展（核心组件/分类/评估/应用）

angel • 4705浏览 • 0回复
Transformer在复杂推理任务中的新进展：多步逻辑推理中的匹配策略

xuxiangda • 4252浏览 • 0回复
Gptpdf：一个简单巧妙的复杂Pdf解析工具，提升RAG效果

Syrupup • 4847浏览 • 0回复
Still-Moving效果惊艳！无需定制视频数据，DeepMind让文生定制视频变得简单！

angel • 1999浏览 • 0回复
Still-Moving效果惊艳！无需定制视频数据，DeepMind让文生定制视频变得简单！

angel • 1627浏览 • 0回复
超全两万字长文详解视频扩散模型的最新进展

angel • 5428浏览 • 0回复
多智能体新进展 | 斯坦福大学提出新模型'Hypothetical Minds'，让AI更懂人类思维

AI论文解读 • 2564浏览 • 0回复
NVIDIA AI 推出 Fugatto：一个 25 亿参数的音频模型，可从文本和音频输入生成音乐、语音和声音

Halo咯咯 • 1687浏览 • 0回复
OpenCV 5：迈向计算机视觉新纪元的最新进展

sword_hero • 1994浏览 • 0回复
视频编辑最新SOTA！港中文&Adobe等发布统一视频生成传播框架——GenProp

angel • 1368浏览 • 0回复
贾佳亚团队新作MagicMirror：生成身份一致且高质量个性化视频，效果惊艳！

angel • 1613浏览 • 0回复
基于 Gemini AI 实现音频和视频解析

丢翅膀的鱼 • 1838浏览 • 0回复
Claude 3.7 Sonnet：AI推理的新进展，开发者与企业的智能助手

Halo咯咯 • 1394浏览 • 0回复
Wan2.1背后的技术：阿里发布全能框架VACE，一统视频生成与编辑，效果惊艳！

angel • 2056浏览 • 0回复
Muon优化器：AI模型训练算法的下一个里程碑？| 目前还不是业界焦点，但有潜力是重大基础创新

后向传播 • 695浏览 • 1回复

AI探索时代

LV.7

记录AI技术与应用场景的学习，分享与探索

觉得TA不错？点个关注精彩不错过

173

帖子

1583

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

谷歌“另辟蹊径”，展示AI视频生音频最新进展，效果惊艳！网友：但有一个缺点原创

51CTO

51CTO博客

51CTO学堂

谷歌“另辟蹊径”，展示AI视频生音频最新进展，效果惊艳！网友：但有一个缺点 原创

谷歌“另辟蹊径”，展示AI视频生音频最新进展，效果惊艳！网友：但有一个缺点原创