吴泳铭预告的旗舰推理模型更了！阿里重磅推出QwQ-Max预览版，Agent或成正式版王炸！原创

51CTO技术栈

发布于 2025-2-25 12:45

浏览

0收藏

编辑 | 伊风

出品 | 51CTO技术栈（微信号：blog51cto）

吴泳铭亲自预告过的，阿里旗舰推理模型，新消息来了。

刚刚，它的预览版正式发布和上线体验——就是这个QwQ-Max-Preview！

一眼看去，我愿称之为最萌的推理模型，看blog主页的名称，感觉思维链中的模型正在很努力的思考中……

吴泳铭预告的旗舰推理模型更了！阿里重磅推出QwQ-Max预览版，Agent或成正式版王炸！-AI.x社区图片

Qwen Chat 中已经可以体验预览版模型：https://chat.qwen.ai/

点进模型的blog，发现这里有一个隐藏彩蛋，内容是由QwQ-Max-Preview自己写的，我们可以看到AI做自我介绍时的思维链：

首先，该模型属于 Qwen 系列，是基于 Qwen2.5-Max 构建的。这是一个预览版，所以他们可能希望强调它是在正式发布前的 抢先体验。它的主要优势包括深度推理、数学、编程、通用领域任务，以及在 Agent 相关任务中的出色表现。他们还提到了未来的更新以及计划以 Apache 2.0 许可证开源。

吴泳铭预告的旗舰推理模型更了！阿里重磅推出QwQ-Max预览版，Agent或成正式版王炸！-AI.x社区图片

blog地址：https://qwenlm.github.io/blog/qwq-max-preview/

预览版已经来了，QwQ-Max正式版还会远吗？我们先来看一波预览版的抢先体验够不够精彩：

官方给的栗子1：编写一个脚本，在一个球体内模拟 100 个弹跳的黄色小球，确保正确处理碰撞检测。让球体缓慢旋转，并确保小球始终保持在球体内部。

效果已经很惊艳，如果要挑刺的话，那就是有几个小球的运动速度略显奇怪：

吴泳铭预告的旗舰推理模型更了！阿里重磅推出QwQ-Max预览版，Agent或成正式版王炸！-AI.x社区

官方给的栗子2：做个俄罗斯方块和 2048 结合的游戏。（PS：Grok 3发布时也测了一个类似的例子，是把俄罗斯方块和宝石迷阵相结合的。）

你别说，看上去还挺好玩，就是感觉难度有一点点大：

吴泳铭预告的旗舰推理模型更了！阿里重磅推出QwQ-Max预览版，Agent或成正式版王炸！-AI.x社区

此外，QwQ-Max-Preview 将配备多种Agent，例如推理生图、火车票查找、代码解释器等等。

看这几个Agent的细分程度，盲猜QwQ-Max在Agent会有很大的动作，而且下图中的Tools工具似乎可以在一次询问中多选，让人对正式版的使用效果期待拉满了。

吴泳铭预告的旗舰推理模型更了！阿里重磅推出QwQ-Max预览版，Agent或成正式版王炸！-AI.x社区图片

官方也给了一个推理画图的例子，还顺便画了个淘宝二维码。扫了一下果然就跳转成功了：

吴泳铭预告的旗舰推理模型更了！阿里重磅推出QwQ-Max预览版，Agent或成正式版王炸！-AI.x社区

1.一手实测：QwQ-Max-Preview回答R1热门问题，是否各有千秋？

到实测这个Part，小编觉得如果还是测一把“草莓”和“9.9＞9.11”，就有点太无聊了。

毕竟DeepSeek R1之所以如此出圈，不是因为能答对这几个案例，而是真的能帮助用户解决生活中的问题，甚至解答人生中的困惑。

吴泳铭预告的旗舰推理模型更了！阿里重磅推出QwQ-Max预览版，Agent或成正式版王炸！-AI.x社区上图：虽说如此，但还是测了这个案例，QwQ-Max-Preview轻松通关

然后在小红书看看，用户都在使用DeepSeek R1问些什么吧。

我们就以有1w+笔记的“如何当父母才不累”，以及第二名“普通人如何利用信息差搞钱”这两个问题来横向比较下两个推理模型吧。

吴泳铭预告的旗舰推理模型更了！阿里重磅推出QwQ-Max预览版，Agent或成正式版王炸！-AI.x社区图片

使用如何“如何当父母才不累”这个话题进行实测，QwQ-Max-Preview能够分析用户的具体情况、深层需求，并提供实用建议，进行了完整的思考。

吴泳铭预告的旗舰推理模型更了！阿里重磅推出QwQ-Max预览版，Agent或成正式版王炸！-AI.x社区图片

两个模型在输出的内容上大概方向一致，QwQ-Max-Preview更注重提供建议。此外，R1在思维链中特别指出要“保持口语化”，提供的答案更有“情绪”一些也相对详细。

吴泳铭预告的旗舰推理模型更了！阿里重磅推出QwQ-Max预览版，Agent或成正式版王炸！-AI.x社区上图：两个模型都提到了“接受不完美”

而在第二个问题上，QwQ-Max-Preview同样能完成接地气、具有逻辑的思考。同时千问还不忘和自家的产品“梦幻联动”一把，提供了“拼多多进货，批量采购后在淘宝加价卖出”“闲鱼搜索‘倒闭库存’”等建议。

吴泳铭预告的旗舰推理模型更了！阿里重磅推出QwQ-Max预览版，Agent或成正式版王炸！-AI.x社区图片

在这个回答上，R1做的稍微好的一点是区分了“低门槛起步方式”“进阶变现模式”等层次，看起来更有操作性。

当然，QwQ-Max-Preview毕竟只是预览版，从实测体验上，其回答问题更加流畅丝滑。不会像R1那样需要等待才开始思考，也不会提心吊胆会弹出“服务器繁忙”。

对了，千问团队今天宣布，QwQ-Max也是要做APP的（推特消息是面向海外用户的，不知道国内是更新通义上，还是也单做APP ?）。期待正式版的QwQ-Max，能在输出问题的格式和口语化方面继续进步，继续缔造AI应用的传奇！

吴泳铭预告的旗舰推理模型更了！阿里重磅推出QwQ-Max预览版，Agent或成正式版王炸！-AI.x社区图片

2.旗舰推理模型的基座——Qwen2.5-Max

这里在帮朋友们回顾下QwQ-Max-Preview的基座，Qwen2.5-Max。

Qwen2.5-Max在除夕夜发布，是阿里家的超大规模MoE模型，采用超过20万亿tokens的预训练数据。

该模型在多个基准测试中超越DeepSeek V3、GPT-4o等领先AI，支持指令模型和基座模型。

也就是说QwQ-Max的推理模型，其基座是强于DeepSeek R1的基座V3的。

另外，今天推出的预览版并非阿里首个推理模型。

去年通义就有了QwQ系列，不过是一个32B小模型的预览版。

https://huggingface.co/Qwen/QwQ-32B-Preview

吴泳铭预告的旗舰推理模型更了！阿里重磅推出QwQ-Max预览版，Agent或成正式版王炸！-AI.x社区图片

3.写在最后

这周的大模型更新已经到了神仙打架的级别了。

从预览版来看，QwQ-Max正式版绝对值得一看，尤其是正式版后开放的Agent功能，期待能给智能体的市场带来一些颠覆性的创新。

本文转载自51CTO技术栈，作者：伊风

标签

吴泳铭

QwQ-Max

社区头条

相关推荐

这款Linux发行版发起AI禁令！生成代码质量堪忧！阿里也被大模型幻觉愚弄了！网友：人比生产力更重要！

51CTO技术栈 • 1113浏览 • 0回复
GitHub 推出AI原生开发环境Copilot Workspace，4大核心功能，预览版已发布！

51CTO技术栈 • 2481浏览 • 1回复
阿里「轨迹可控版Sora」，告别「抽卡」，让视频生成更符合物理规律

轻薄滴假象 • 1180浏览 • 0回复
别缴“对齐税”了，未审查/对齐的模型更受欢迎！用户：纯粹版比受限版有用！

51CTO技术栈 • 2435浏览 • 0回复
4090单卡可跑，6秒直出电影级画质，智谱版Sora正式开源！

duhorse • 839浏览 • 0回复
英伟达出手即王炸！重磅开源Nemotron大模型：击败GPT-4o、仅次于o1！

51CTO技术栈 • 633浏览 • 0回复
LightRAG开源了！轻巧、强大，GraphRAG的进化版

老蛀虫 • 1355浏览 • 0回复
Kimi 我的神，它终于更新了！这个探索版，有点牛！

wsp_ping • 1326浏览 • 0回复
VLM版o1超越一众开源和闭源模型！LLaVA-o1：多阶段自主推理（北大&清华&阿里等）

angel • 956浏览 • 0回复
雷军、周鸿祎、张朝阳、吴泳铭这些巨头大佬都释放了哪些信号？

51CTO技术栈 • 668浏览 • 0回复
解密o1推理过程！DeepSeek-R1-Lite预览版上线

kede96 • 1368浏览 • 0回复
阿里重磅开源QwQ-32B：自我思考、纠正，数学能力击败o1模型

Aceryt • 3265浏览 • 0回复
阿里巴巴Qwen团队发布QwQ-32B-Preview：包含320亿参数的开放模型，专为解决高级推理任务而设计

Halo咯咯 • 1423浏览 • 0回复
击败99.9%的程序员！o3来了！AGI测试实现跃升！网友：推理scaling law太炸了！一文回顾OpenAI直播带货12天

51CTO技术栈 • 1593浏览 • 0回复
Kimi深夜炸场：满血版多模态o1级推理模型！OpenAI外全球首次！Jim Fan：同天两款国产o1绝对不是巧合！

51CTO技术栈 • 441浏览 • 0回复
大推理模型DeepSeek-R1深度解读：成本降低95%，推动语言模型推理效率新高度

风云2002_1 • 7822浏览 • 0回复
8卡32B模型超越o1预览版、DeepSeek V3，普林斯顿、北大提出层次化RL推理新范式

轻薄滴假象 • 305浏览 • 0回复
4090单卡跑满血版DeepSeek-R1，清华团队开源项目再破大模型推理门槛

Crystalcxt • 486浏览 • 0回复
阿里重回伟大！吴泳铭财报讲话全文曝光：开发者会天然选择阿里云，发布旗舰推理模型！

51CTO技术栈 • 343浏览 • 0回复
推理模型+Multi-Agent，可能就是Deep Research的全貌！

探索AGI • 10浏览 • 0回复

51CTO技术栈

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂