昨夜通义千问团队扔出“王炸”——开源模型QwQ32B,用两阶段强化学习狂点技能树:先靠“代码实战批改式训练”练就理科状元级思维,再通过规则验证器拓展全能天赋。结果。。。这款仅有320亿参数的模型,在数学、代码、通用能力等核心场景里,已经几乎跟满血版DeepSeekR1(6710亿参数)不相上下了。当行业还在比拼千亿参数集群时,阿里用320亿参数完成了对巨头的弯道超车。这一突破颠覆了“参数规模决定性能上限”的传统认知,更...
2025年3月4日,智谱开源模型CogView4震撼发布,这直接把中文图片生成技术推向了新的高度。以往的文生图模型中文提示词理解较差,导致很多图片文字“惨不忍睹”CogView4终结此痛点,作为首个支持汉字生成的开源文生图模型,将中文图片生成技术推向新高度。用GLM4双语编码器结合双语图文对训练,中英文描述皆能精准成图,海报、短视频创作都适用。它在DPGBench测试中综合评分第一,遵循Apache2.0协议。例如输入“国潮奶茶海报,篆...
3月3日深夜,腾讯元宝逆袭超越DeepSeek,登顶苹果中国区免费应用榜。2月13日,腾讯元宝就有重大更新:同时支持混元与DeepSeek模型,让DeepSeek能理解图片,混元快速响应,“双引擎”满足多元需求。营销上,腾讯更是豪掷数亿投流,借助微信生态精准触达用户,放大技术优势从产品创新层面来看,腾讯元宝基于现有技术架构的模块化创新,创造了差异化价值。大胆预测一下:未来AI核心竞争力或许会聚焦三个方面:一是垂直领域,当下AI...
今天,Anthropic搞出了个大动静,推出首个混合推理模型、堪称AI编程霸主的Claude3.7Sonnet,还连带发布智能编码命令行工具ClaudeCode。Claude3.7Sonnet作为混合推理模型,打破传统AI单一模式,有标准和扩展思维两种模式。标准模式下能秒回信息,扩展模式则擅长深度反思、分步思考,面对数学、编码等复杂任务不在话下,给用户更多使用场景选择。和上一代比,它数学、编码能力暴增10%以上,多项基准测试刷爆纪录,实力碾压同类。...
2025-02-25 18:38:00 379浏览 0点赞 0回复 0收藏