外网夸爆DeepSeek开源周！今天一口气开源3个重磅！压轴戏期待拉满，R2、V4、被提名原创

发布于 2025-2-27 12:28

浏览

0收藏

好家伙！DeepSeek是真的OpenAI啊！

在第四天的开源日中，竟然一口气放出三个重磅的优化并行策略代码库，而且又是V3/R1模型中的干货：

DualPipe：一种优化的双向流水线并行算法，旨在优化V3/R1模型训练中的计算和通信重叠。稍微解释一下，通常在分布式训练中，计算和通信要有两次耗时，而DualPipe通过设计并行算法来处理这两者之间的重叠，可谓是训练界的时间管理大师！

EPLB (Expert-Parallel Load Balancer)：这是一个用于V3/R1的专家并行负载均衡器。负载均衡是分布式训练非常重点的优化方向了，EPLB通过智能地分配计算任务，确保各个计算节点的“工作量”适中，避免某些节点成为瓶颈，进一步提高训练效率。

https://github.com/deepseek-ai/eplb

Computation-Communication Overlap Analyzer：这个工具帮助分析V3/R1模型中的计算和通信重叠部分。DeepSeek这波授人以渔，给模型开发者一个分析工具，让人直接看到在哪些操作上，计算和通信之间的重叠不够高，从而继续优化。

https://github.com/deepseek-ai/profile-data

有了这些优化技术，“卡脖子”好像真的不存在了！

就像评论区一位网友说的这样，DeepSeek改变了游戏规则！

“这是一场改变游戏规则的创新。DualPipe 和 EPLB 使大型语言模型的训练变得更快、更便宜、更可持续，同时保持顶级性能。DeepSeek 的策略交响乐可能会重新定义我们构建 AI 的方式，证明你不需要最大的乐队就能奏出最好的音乐。”

外网夸爆DeepSeek开源周！今天一口气开源3个重磅！压轴戏期待拉满，R2、V4、被提名-AI.x社区图片

讲完了DeepSeek今天开源的这些牛逼的技术，我们发现，评论区更期待的，还是明天最重磅的压轴戏！

1.DeepSeek重磅压轴戏将至，网友期待值拉满

昨天，关于R2提前发布的消息吊起了大家的胃口。

据媒体报道，幻方量化相关人士已经回复了“DeepSeek新一代AI模型R2提前发布”的消息，回应称：以官方消息为准。

虽然如此，却挡不住网友对R2的热情。一位网友更大胆猜测，第5天就有R2了，是真的吗？

外网夸爆DeepSeek开源周！今天一口气开源3个重磅！压轴戏期待拉满，R2、V4、被提名-AI.x社区图片

另一个网友也在线许愿，梦了票大的。除了R2以外，她还期待新一代基础多模态模型V4发布。最后，她还说希望DeepSeek进军文生视频领域，推一款能超过Veo2（Google DeepMind推出的一款先进的AI视频生成模型）的模型。

外网夸爆DeepSeek开源周！今天一口气开源3个重磅！压轴戏期待拉满，R2、V4、被提名-AI.x社区图片

一位网友说“真正的OpenAI，我希望明天会有大消息。无论怎样，你们太棒了！”

外网夸爆DeepSeek开源周！今天一口气开源3个重磅！压轴戏期待拉满，R2、V4、被提名-AI.x社区图片

更有网友用DeepSeek式的浪漫进行了夸夸。

称DeepSeek的开源善举是“鲸鱼分享他的海洋恩惠，引领所有的鱼儿在他的浪潮中”。

外网夸爆DeepSeek开源周！今天一口气开源3个重磅！压轴戏期待拉满，R2、V4、被提名-AI.x社区图片

2.DeepSeek API官宣非高峰超低价，鼓励错峰使用

最近两天，DeepSeek才重启了官方的API充值服务。

距离DeepSeek因服务器过爆停止了API充值过去了整整19天，相信许多想接入DeepSeek服务的人感到度日如年。

而昨天，DeepSeek又官宣了一波非高峰期的折扣！

感觉DeepSeek真的把自己的优化思维贯彻始终了，集中在闲时用更便宜的价格使用，怎么不算一种人类智能呢？

外网夸爆DeepSeek开源周！今天一口气开源3个重磅！压轴戏期待拉满，R2、V4、被提名-AI.x社区图片

基于北京时间的错峰优惠价，可以直接看下面的这张表：

外网夸爆DeepSeek开源周！今天一口气开源3个重磅！压轴戏期待拉满，R2、V4、被提名-AI.x社区图片

有人问道，我不太懂，这个价格是高还是低：

外网夸爆DeepSeek开源周！今天一口气开源3个重磅！压轴戏期待拉满，R2、V4、被提名-AI.x社区图片

热心网友1：低的要死了

外网夸爆DeepSeek开源周！今天一口气开源3个重磅！压轴戏期待拉满，R2、V4、被提名-AI.x社区图片

热心网友2：OpenAI的10%吧

外网夸爆DeepSeek开源周！今天一口气开源3个重磅！压轴戏期待拉满，R2、V4、被提名-AI.x社区图片

3.写在最后

DeepSeek开源周的操作让人眼前一亮！

比起OpenAI长达12天的挤牙膏，DeepSeek每次都是干货的前沿技术！

从小编的体感看，最近几天的交互，算力紧张的问题明显缓解。而这波API的闲时降价，则让更多人都能分享到其强大的技术优势。

随着开源周最后一天的临近，大家的期待值也在不断攀升，国内外的关注度达到了巅峰。未来越来越好，我们有理由相信，这只蓝鲸鱼能继续引领全球AI的潮流。

本文转载自51CTO技术栈

标签

DeepSeek

开源

已于2025-2-27 12:28:54修改

社区头条

相关推荐

YOLO v4：物体检测的最佳速度和精度

mb61e52f0ac174a • 2440浏览 • 0回复
Octopus v4：八爪鱼来袭，整合各开源大模型一起玩耍，取长补短！

PaperAgent • 5001浏览 • 0回复
老黄一口气解密三代GPU！粉碎摩尔定律打造AI帝国，量产Blackwell解决ChatGPT全球耗电难题

duhorse • 1468浏览 • 0回复
DeepSeek Coder V2开源发布，首超GPT4-Turbo代码能力

Aceryt • 5160浏览 • 0回复
微软重磅开源 GraphRAG：新一代 RAG 技术来了！

玄姐聊AGI • 3969浏览 • 0回复
Midjourney V6.1再进化！人像逼真细节拉满，摄影级画面秒生成

duhorse • 1043浏览 • 0回复
清华唐杰团队新作：一口气生成2万字，大模型开卷长输出

Crystalcxt • 820浏览 • 0回复
中科大重磅开源StableV2V：专注于「人机交互一致性」的视频编辑方法

angel • 829浏览 • 0回复
Suno AI v4：音乐创作人的饭碗正逐渐被提示词所取代

lintoms • 1086浏览 • 0回复
DeepSeek的V3，爆火了

51CTO技术栈 • 3767浏览 • 0回复
Cline 3.2 重磅更新：免费调用 Claude Sonnet 3.5 和 GPT 4o，开发效率直接拉满！

凝固的雨_1 • 6848浏览 • 0回复
一文读懂 DeepSeek-V3 技术报告

xuxiangda • 2395浏览 • 0回复
带你一文读懂爆火的 DeepSeek-R1 新模型技术，为何震动了全球 AI 圈

玄姐聊AGI • 3804浏览 • 1回复
DeepSeek又开源R1部署最佳实践！

探索AGI • 353浏览 • 0回复
这个开源项目厉害了：一键部署DeepSeek R1！

NLP前沿1 • 864浏览 • 0回复
DeepSeek开源周“第一刀”砍向算力！重磅开源FlashMLA，挑战H800算力极限，网友直呼：极致的工程设计！

51CTO技术栈 • 423浏览 • 0回复
DeepSeek开源周，第三弹， DeepGEMM来袭！

NLP前沿1 • 328浏览 • 0回复
DeepSeek R2要提前发布！这是有关R2的几个传闻：100%国产算力部署！能耗降低25%，多模态模型！

51CTO技术栈 • 614浏览 • 0回复
DeepSeek一口气开源3个项目，还有梁文锋亲自参与，昨晚API大降价

轻薄滴假象 • 587浏览 • 0回复

51CTO技术栈

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂