企业培训

鸿蒙开发者社区

WOT技术大会

IT证书

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

夜行神鱼

LV.1

这个用户很懒，还没有个人简介

帖子 4

声望 54

关注 0

粉丝 0

社区头条作者

私信

关注

主帖 4

回帖

企业部署DeepSeek的AI基础设施方案建议

原创

社区头条

要成功实现DeepSeek大模型的私有化部署，绝非易事，从模型选型到基础设施搭建，再到推理部署工程优化，每一个环节都需要精心规划与考量。接下来，让我们深入探讨企业私有化部署DeepSeek的关键要点与策略。1DeepSeek模型选型在企业进行deepseek大模型私有化部署时，模型选型是至关重要的第一步，它直接关系到后续的应用效果与成本投入。通过业务场景适配性分析确定合适的模型，能让企业充分发挥大模型的价值。DeepSeek提供了多种...

8天前 565浏览 0点赞 0回复 0收藏

大模型部署解决方案之TorchServe+vLLM

TorchServe是PyTorch中将模型部署到生产环境的一个解决方案。它用HTTP或HTTPSAPI封装模型，可以处理多种任务，包括为部署模型分配workers、负责客户端和服务器之间通信等。10月份发布的TorchServe0.12增加了对GenAI的支持，简化了大语言模型的部署，增加了对主流模型引擎的内置支持，如vLLM和TRTLLM。vLLM引擎是目前执行LLM的最佳方式之一，TorchServe为vLLM部署到生产环境中提供了必要的一些功能，比如自定义metric、模型版本...

2024-11-12 09:29:13 1106浏览 0点赞 0回复 0收藏

大模型训练集群的存储设计

原创

存储系统在分布式LLM训练中扮演着关键角色，需要满足几个关键要求。应与GPU的计算能力相匹配，以最大限度地利用其性能，避免因存储瓶颈造成的资源浪费。应支持大规模结构化和非结构化训练数据集的存储，并在分布式处理环境中具备可扩展性。模型checkpoint的存储和检索在LLM训练中也带来了挑战，需要系统满足模型大小和训练时长所决定的读写带宽要求。满足传统企业级要求，例如数据保护、高可用性和安全性。本文参考了论文Llama3...

2024-10-30 15:22:37 1394浏览 0点赞 0回复 0收藏

不依赖CUDA的大模型推理已经实现

原创

在过去的十年中，CUDA已经成为深度学习模型推理领域的核心技术。NVIDIA的CUDA技术优化了GPU的性能，提高了数据处理的速度和效率。然而，CUDA的主导地位也带来了对NVIDIA硬件的依赖，这限制了在非NVIDIA平台上进行高效推理的可能性。为了应对这一挑战，近年来，开源社区和企业开始寻求开发不依赖于特定供应商的推理技术。Triton的崛起OpenAI开发的Triton编程语言应运而生，旨在为广泛的硬件设备提供高效的并行编程方式。它允许开...

2024-09-25 10:41:08 1356浏览 0点赞 0回复 0收藏

获得成就

已积累 1148 人气

获得 0 个点赞

获得 0 次收藏