鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 25年5月软考 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

Mistral开源首个多模态大模型—Pixtral 12B

发布于 2024-9-12 10:05

浏览

0收藏

法国著名开源大模型平台Mistral AI开源了，首个能够同时处理图像和文本的多模态大模型——Pixtral 12B。

Mistral AI开源的方式依然非常简单粗暴，直接上磁力链接，把所有模型权重都放出来了。

Mistral开源首个多模态大模型—Pixtral 12B-AI.x社区

「AIGC开放社区」已经试验了一下，大小在23.64G左右，这个在多模态模型中属于比较小的了，估计能耗和部署方面会方便很多。

Mistral开源首个多模态大模型—Pixtral 12B-AI.x社区

下载速度也是满载状态，说明这个模型还是相当受欢迎。如果你是千M光纤，估计几分钟就下完了。

Mistral开源首个多模态大模型—Pixtral 12B-AI.x社区

不少网友对Mistral AI开源的新模型相当满意，再一次拉动了大模型开源领域向多模态进军。

Mistral开源首个多模态大模型—Pixtral 12B-AI.x社区

Mistral开源首个多模态大模型—Pixtral 12B-AI.x社区

Mistral刚刚发布了一个24G的重磅炸弹，迫不及待想看看这个多模态野兽能干点啥啦。

Mistral开源首个多模态大模型—Pixtral 12B-AI.x社区

据悉，Pixtral有120亿参数，是在Mistral的一个文本模型Nemo 12B基础之上开发而成，与Anthropic的Claude系列和OpenAI的GPT-4o等其他多模态模型类似，能理解、回答任意大小图像的问题。

架构方面，40层、14,336个隐藏维度大小和32个注意力头，配备了400M的专用视觉编码器，支持1024x1024图像尺寸和 24个隐藏层的高级图像处理。词汇量大，其词汇表中大约有 13万个独特的标记，可实现细致入微的语言理解和生成。

此外，根据数据评测显示，Pixtral 12B在MMMU、Mathvista、ChartQA、DocVQA基准测试平台的数据比Phi-3、 Qwen-2 7B等知名多模态模型更好。

Mistral开源首个多模态大模型—Pixtral 12B-AI.x社区

模型权重下载地址：magnet:?xt=urn:btih:7278e625de2b1da598b23954c13933047126238a&dn=pixtral-12b-240910&tr=udp%3A%2F%http://2Ftracker.opentrackr.org%3A1337%2Fannounce&tr=udp%3A%2F%http://2Fopen.demonii.com%3A1337%2Fannounce&tr=http%3A%2F%http://2Ftracker.ipv6tracker.org%3A80%2Fannounce

huggingface地址：https://huggingface.co/mistral-community/pixtral-12b-240910

本文转自 AIGC开放社区，作者：AIGC开放社区

原文链接:https://mp.weixin.qq.com/s/N3j8WBHhIxCnLq3pQUtz2w

标签

赞

收藏

回复

举报

回复

相关推荐

开源大模型Stable LM 2-12B

Aceryt • 2299浏览 • 0回复
Mistral开源8X22B大模型，OpenAI更新GPT-4 Turbo视觉，都在欺负谷歌

轻薄滴假象 • 1173浏览 • 0回复
抱抱脸团队（HF）发布多模态大模型Idefics2，8B参数

AIGC最前线 • 2127浏览 • 0回复
Mistral开源首个22B代码模型破记录，支持80+编程语言

duhorse • 1910浏览 • 0回复
什么是多模态大模型？为什么需要多模态大模型？

AI探索时代 • 2808浏览 • 0回复
多模态与伪多模态大模型

AI探索时代 • 994浏览 • 0回复
Llama3.2开源：Meta发布1B和3B端侧模型、11B和90B多模态模型

NLP工作站 • 2534浏览 • 0回复
Meta开源多模态模型——Llama 3.2

Aceryt • 1455浏览 • 0回复
Aria: 第一个多模态MoE | Pixtral 12B | AI教学新突破：DataEnvGym让模型自我进化

sbf_2000 • 965浏览 • 0回复
IBM重磅发布Granite 3.0秒杀同级别大模型|全球首个39语言多模态大模型开源，告别"英语霸权"

sbf_2000 • 853浏览 • 0回复
多模态大模型：基础架构

鲁班模锤1 • 981浏览 • 0回复
最强开源多模态模型 Pixtral Large！

Aceryt • 785浏览 • 0回复
Pixtral Large：124B的最强开源多模态大模型

kede96 • 1256浏览 • 0回复
多模态RAG利器，带你跑通Qwen2-VL-7B-Instruct大模型

小虎哦哦 • 1181浏览 • 0回复
多模态RAG利器，带你跑通Qwen2-VL-7B-Instruct大模型

AI科技论谈 • 1315浏览 • 0回复
12个真实世界机器人任务成功率超OpenVLA 24.17% | EMMA-X：7B具身多模态动作模型

angel • 1263浏览 • 0回复
Infinigence AI 发布 Megrez-3B-Omni：3B 设备上开源多模态大语言模型 MLLM

Halo咯咯 • 625浏览 • 0回复
EarthMarker：首个视觉提示遥感多模态大模型

AIRoobt • 1158浏览 • 0回复
上交&哈佛提出FluxSR：首个基于12B+大模型的单步扩散真实世界超分模型

angel • 947浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

刚刚，OpenAI发布NextGenAI，彻底颠覆传统教育 1天前发布
中科院、百度提出新架构：突破参数限制，实现高效推理 2天前发布

热门推荐

OpenAI发布GPT-4.5：功能非常特殊，推理很贵 0回复

带你一文读懂爆火的 DeepSeek-R1 新模型技术，为何震动了全球 AI 圈 1回复

4090单卡部署满血 671B DeepSeek，本地部署“成本骤降32倍”！！！ 0回复

国家队出手！DeepSeek上线国家超算互联网平台，免注册开箱即用！ 0回复

VLLM 与 Ollama：如何选择合适的轻量级 LLM 框架？ 0回复

上一篇：专用于法律的两个开源大模型，最高1410亿参数

下一篇：刚刚，OpenAI发布史上最强模型-o1，推理能力超人类博士！

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载