微软推出人工智能模型 CoDi,可互动和生成多模态内容

人工智能
微软设计 CoDi 的目标,旨在解决传统单一模态 AI 模型的局限性。以同步视频和音频为例,独立生成的信息流拼接在一起时可能存在不一致和对齐的问题。

 7 月 11 日消息,微软近日发布新闻稿,推出了名为可组合扩散模型(CoDi),这是一种独特的、基于可组合扩散的人工智能模型,其设计目标是互动和生成多模态内容。

微软设计 CoDi 的目标,旨在解决传统单一模态 AI 模型的局限性。以同步视频和音频为例,独立生成的信息流拼接在一起时可能存在不一致和对齐的问题。

CoDi 采用了独特的可组合生成策略,在扩散过程中对齐多模态,从而生成相互交织的模式,更重要的是,CoDi 能够处理任意输入模式并生成任意模态的内容。

CoDi 由 Microsoft Azure 认知服务研究团队与北卡罗来纳大学教堂山分校合作开发,也是 Microsoft 项目 i-Code 的一部分,该项目使用人工智能来增强人机交互。

IT之家在此附上 CoDi 项目官方介绍链接,感兴趣的用户可以深入阅读。

责任编辑:姜华 来源: IT之家
相关推荐

2018-03-08 18:19:24

微软Win10人工智能

2023-11-27 18:17:19

2023-09-08 16:20:48

人工智能

2024-06-11 08:01:22

2023-07-03 11:02:31

2023-11-02 07:57:44

聊天机器人LinkedIn

2017-12-18 12:03:28

Python微软谷歌

2024-04-08 09:00:00

人工智能

2014-12-04 17:08:44

2022-06-16 16:19:12

模型神经网络

2023-06-29 11:11:09

人工智能AI机器人

2021-10-29 23:05:20

人工智能机器人技术

2022-07-31 23:46:57

人工智能语言模型感知力

2023-09-11 11:27:48

人工智能算法

2023-03-06 09:15:38

ChatGPT人工智能

2024-03-13 09:48:03

人工智能

2023-05-05 14:02:59

人工智能聊天机器人

2019-10-10 10:23:55

人工智能医疗技术

2023-08-04 09:00:00

人工智能GPT-4语言模型
点赞
收藏

51CTO技术栈公众号