鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

解密o1推理过程！DeepSeek-R1-Lite预览版上线

发布于 2024-11-27 14:48

浏览

0收藏

GPT-o1通过强化学习训练优化决策策略，并模拟人类思维链以深入理解问题，提供更准确的答案，在多个推理任务相关的榜单上实现了巨大的突破。而o1的思维过程是隐藏的。幻方旗下国产大模型公司DeepSeek近期预发布了R1模型，使用了强化学习训练，回复里包含大量反思和验证，思维链长度可达数万字，并且没有像o1一样隐藏思维链。

Demo: https://chat.deepseek.com

[模型和技术报告将会开源]

DeepSeek R1

DeepSeek R1 系列模型采用强化学习进行训练，具备深度反思和验证能力，能够构建长达数万字的思维链。在数学、编程和复杂逻辑推理等任务上，该系列模型展现出与o1-preview相媲美的推理能力，同时向用户展示了o1未公开的完整思考路径。

DeepSeek-R1-Lite预览版在包括美国数学竞赛（AMC）中最具挑战性的AIME以及全球顶尖编程竞赛（Codeforces）在内的多个权威评测中表现突出，成绩显著优于GPT-4o等知名模型。以下是DeepSeek-R1-Lite在这些评测中的得分情况：

解密o1推理过程！DeepSeek-R1-Lite预览版上线-AI.x社区

DeepSeek-R1-Lite的推理过程不仅长，还涵盖了广泛的反思和验证步骤。下面的图表清晰地展示了该模型在数学竞赛中的得分与其允许的思考长度之间存在密切的正相关关系。

解密o1推理过程！DeepSeek-R1-Lite预览版上线-AI.x社区

红色实线展示了模型所能达到的准确率与所给定的推理长度呈正相关；相比传统的多次采样+投票，增加模型思维链长度似乎性价比更高。

正式版 DeepSeek-R1 模型将完全开源，技术报告也会公开。

思维链效果展示：

解密o1推理过程！DeepSeek-R1-Lite预览版上线-AI.x社区

解密o1推理过程！DeepSeek-R1-Lite预览版上线-AI.x社区

本文转载自公众号思源数据科学作者：思源Source

原文链接：https://mp.weixin.qq.com/s/t9ErNbwsyeptsjJ2As1jYQ

标签

赞

收藏

回复

举报

回复

相关推荐

OpenAI o1推理模型基础入门

51CTO内容精选 • 1808浏览 • 0回复
OpenAI o1：用内部思维链进行复杂推理

shizhi02 • 1943浏览 • 0回复
VLM版o1超越一众开源和闭源模型！LLaVA-o1：多阶段自主推理（北大&清华&阿里等）

angel • 1924浏览 • 0回复
阿里发布类o1模型QWQ，可自我反思纠错，实测数学推理远超o1、DS-R1，人人免费

51CTO技术栈 • 2064浏览 • 0回复
开源版o1！中国大模型让国外陷入疯狂，成本猛降90%

Aceryt • 2392浏览 • 0回复
Kimi深夜炸场：满血版多模态o1级推理模型！OpenAI外全球首次！Jim Fan：同天两款国产o1绝对不是巧合！

51CTO技术栈 • 1272浏览 • 0回复
DeepSeek R1横空出世，超越OpenAI o1，教你用Ollama跑起来

小虎哦哦 • 1.4w浏览 • 0回复
DeepSeek-R1 + RooCline：极佳的强化学习AI编码代理！对标o1、蒸馏小模型本地部署

老蛀虫 • 2788浏览 • 0回复
DeepSeek-AI 发布 DeepSeek-R1-Zero 和 DeepSeek-R1

Halo咯咯 • 2922浏览 • 0回复
OpenAI o3-mini 干翻了 DeepSeek R1？

PyTorch研习社 • 1409浏览 • 0回复
DeepSeek R1 Vs OpenAI o1！全球顶级推理模型训练技术对比大解密！

51CTO技术栈 • 3895浏览 • 0回复
8卡32B模型超越o1预览版、DeepSeek V3，普林斯顿、北大提出层次化RL推理新范式

轻薄滴假象 • 1355浏览 • 0回复
4090单卡跑满血版DeepSeek-R1，清华团队开源项目再破大模型推理门槛

Crystalcxt • 1583浏览 • 0回复
DeepSeek-R1-Zero激发了推理Scaling Law

ceesoft • 1471浏览 • 0回复
OpenAI揭示o3的推理过程，以弥合与DeepSeek-R1的差距

51CTO内容精选 • 1286浏览 • 0回复
马斯克发布Grok 3，赶超OpenAI o1和Deepseek R1！

AI博物院 • 1117浏览 • 0回复
o1模型医学推理惊人，超过人类医生

Aceryt • 1139浏览 • 0回复
Vision-R1：多模态领域的DeepSeek R1-Zero，7B参数比肩OpenAI O1

Syrupup • 1154浏览 • 0回复
音乐界的DeepSeek来了！全球首个音乐推理大模型Mureka O1上线，音乐领域要迎来大变革了？

算家计算 • 741浏览 • 0回复

LV.2

这个用户很懒，还没有个人简介

觉得TA不错？点个关注精彩不错过

22

帖子

187

声望

0

粉丝

关注

最近发布

Jina CLIP v2：为多模态RAG设计的向量模型 2024-11-27 14:50:27发布
Pixtral Large：124B的最强开源多模态大模型 2024-11-27 14:45:54发布

热门推荐

暴论：2025年，程序员必学技能就是 MCP 1回复

实操干货！MCP 全解析，手把手教你基于 MCP 开发 Agent 0回复

从 Manus 到 DeepSearcher，2025年最值得关注的十大 Agent 智能体架构设计 0回复

MCP协议之MCP-server(sse方式)实践 0回复

王炸！MCP 架构设计深度剖析 & 使用 Spring AI + MCP 四步教你实现 Agent 智能体开发 0回复

上一篇： Pixtral Large：124B的最强开源多模态大模型

下一篇： Jina CLIP v2：为多模态RAG设计的向量模型

社区精华内容

目录

DeepSeek R1

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载