速度2.6倍提升,TencentOS 支持满血版DeepSeek

业界
TencentOS Server AI全面支持满血版DeepSeek R1,在双机16卡的硬件环境上,分别在短输入场景(如知识问答)以及长输入场景(如企业私有信息的检索增强生成)均获得超过2.6倍的推理性能提升!

TencentOS Server AI全面支持满血版DeepSeek R1,在双机16卡的硬件环境上,分别在短输入场景(如知识问答)以及长输入场景(如企业私有信息的检索增强生成)均获得超过2.6倍的推理性能提升!

本性能评估采用2台8卡服务器,显存总量共1536GB,部署TencentOS Server AI版,2台服务器采用RDMA高速网络互联,测试样本采用通用的数据集。分别测试输入200tokens/输出500tokens以及输入6144tokens/输出1024tokens下的吞吐能力,测试结果如下:

TencentOS Server AI是腾讯云发布的一款针对AI场景的操作系统,提供了从基础架构到AI框架以及模型的全栈式AI环境,一方面简化部署,另一方面通过高性能的AI框架,实现大模型如DeepSeek推理效率成倍的增加。


责任编辑:企业资讯
相关推荐

2025-02-27 09:17:41

DeepSeekPythonAI

2025-02-26 10:24:47

2025-02-25 08:20:50

AI程序员DeepSeek

2025-02-17 00:00:05

IDEADeepSeek

2009-12-24 09:30:38

Opera性能测试

2017-05-11 11:30:43

MySQL查询速度

2009-03-29 09:47:24

苹果Iphone移动OS

2024-04-10 08:00:00

PostgresNoSQL

2024-06-06 18:56:34

2017-05-10 16:09:12

MySQL数据库查询

2025-02-27 00:00:05

2022-10-14 17:30:59

Windows 11微软

2025-02-26 04:00:00

百度文心智能体平台

2024-03-19 14:43:17

自动驾驶激光

2024-01-19 13:41:00

AI模型

2024-11-13 09:29:41

SpringCRaCCRIU
点赞
收藏

51CTO技术栈公众号