DeepSeek 再爆大招,Janus-Pro 炸裂出场!

发布于 2025-2-6 11:21
浏览
0收藏

没想到,DeepSeek 连续放出重磅消息,速度如此之快。

转眼间,DeepSeek 便推出了全新的多模态模型,统一多模态理解与生成。

Janus-Pro 多模态大模型震撼登场,采用 Transformer 架构,并未沿袭 Diffusion 方法,又一次颠覆了行业的认知,紧追 OpenAI 的脚步。

拥有高性能电脑的同学们可以开始尝试了,7B 版本已经能够超越 Stable Diffusion 和 DALL-E 3,强大到让人难以置信!

这个春节,真是激动人心。

见证国产 AI 的辉煌时刻。

Janus-Pro 多模态框架革新 AI 体验

DeepSeek团队再出新作,发布了创新性的多模态框架 Janus-Pro,这是一款能够同时处理多模态理解与生成任务的集成模型。该模型基于 DeepSeek-LLM-1.5b-base 和 DeepSeek-LLM-7b-base 打造,支持高达 384 x 384 分辨率的图像输入,并采用独特的 tokenizer 来实现图像生成。其最大的创新在于将视觉编码划分为独立通道,同时维持了单一的 Transformer 架构来进行处理

DeepSeek 再爆大招,Janus-Pro 炸裂出场!-AI.x社区

DeepSeek 再爆大招,Janus-Pro 炸裂出场!-AI.x社区

这种设计革新不仅解决了传统模型在视觉编码器功能上的冲突,还大大提升了系统的灵活性。在实际应用层面,Janus-Pro 的表现超越了以往的统一模型,甚至在某些任务上能够与专门的模型相媲美。在 GenEval 和 DPG-Bench 的基准测试中,它成功击败了 OpenAI 的 DALL-E 3 和 Stable Diffusion

DeepSeek 再爆大招,Janus-Pro 炸裂出场!-AI.x社区

DeepSeek 再爆大招,Janus-Pro 炸裂出场!-AI.x社区


该项目已根据 MIT 许可证开源,开发者可通过 GitHub 获取全套代码。DeepSeek 团队指出,Janus-Pro 的简洁设计及其卓越性能,预示着它可能成为下一代统一多模态模型的重要选项

GitHub 地址:https://github.com/deepseek-ai/Janus

Hugging Face 地址:https://huggingface.co/deepseek-ai/Janus-Pro-7B

论文地址:​https://arxiv.org/pdf/2501.17811​


本文转载自公众号玄姐聊AGI  作者:玄姐

原文链接:​​https://mp.weixin.qq.com/s/E_9Opfnu0gBAnTrE0bbUQg​

收藏
回复
举报
回复
相关推荐