鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 25年5月软考 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

如何基于一台MacBook搞定企业级大模型知识库部署

发布于 2024-10-14 16:07

浏览

0收藏

1、为什么要在 MacBook 上搭建知识库？

最核心最重要的是我们手上的文档资料出于安全要求，不能随便上传到云服务，也就无法实际验证知识库的实际效用。另外对于 IT 同学来说，自己亲手搭建一个完整的方案、能灵活调整和对接各种不同的模型、评测各种模型不同的表现，也是出于对技术的探索本能使然。

使用的 MacBook 配置如下，对大模型经过量化处理（比如：int8）后，可以流畅运行。

如何基于一台MacBook搞定企业级大模型知识库部署-AI.x社区

2、知识库的架构设计

基于一台 MacBook 搭建部署的架构设计如下图，在这套架构设计中，我们采用了实力排上游、并且对企业和学术都友好的国产开源大模型 ChatGLM3-6B。

如何基于一台MacBook搞定企业级大模型知识库部署-AI.x社区

并采用了基于 m3e-base 模型的 embedding search RAG 方案。基于这两个模型封装和 ChatGPT 兼容的 API 接口协议；通过引入 One API 接口管理 & 分发系统，形成统一 LLM 接口渠道管理平台规范，并把封装好的接口协议注册进去；搭建与 Dify.ai 齐名开源大模型知识库平台管理系统 FastGPT，实现集私有知识数据源预处理、嵌入检索、大模型对话一体的完整知识库应用流程。

麻雀虽小五脏俱全，最终形成一套既满足商用标准、又能在 MacBook 跑起来的的方案。虽然智能程度和实际需求还有一定差距，但至少我们在不用额外购买显卡或云服务的情况下，以最小成本部署运行、并且能导入实际业务数据（如：设计文档、业务流程文档、项目管理文档、技术分享文档等等）进行实操验证，值得每位工程师都来动手尝试一下。

3、知识库的部署设计

基于 MacBook 的部署方案分为四个主要环节、14个具体步骤，只要一步步实操下去，每位 IT 同学都可以在自己的 MacBook 上拥有属于自己的私有大模型知识库系统，步骤清单如下：

如何基于一台MacBook搞定企业级大模型知识库部署-AI.x社区

部分步骤可以简单地通过 Docker 镜像一键部署完成，但本着对细节一杆子插到底的部署思路，还是采取了纯手工作业的方法。

本文转载自公众号玄姐聊AGI 作者：玄姐

原文链接：https://mp.weixin.qq.com/s/E1QncnXUm6BGdL6a7Sq0cg

标签

赞

收藏

回复

举报

回复

相关推荐

“企业级AI元年”已至，AI如何更好赋能企业发展？

liutao988 • 1676浏览 • 0回复
怎么看大模型、RAG、Agent、知识库、向量数据库、知识图谱、AGI的区别和联系？

玄姐聊AGI • 3287浏览 • 0回复
一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI的区别和联系！！

玄姐聊AGI • 9149浏览 • 0回复
爆火的本地知识库项目是什么？什么是RAG？本地知识库与大模型的关系

AI探索时代 • 2902浏览 • 0回复
打造智能私有知识库：开源工具AnythingLLM全解析及实操指南，RAG企业级解决方案

AIGC观察者 • 1.4w浏览 • 1回复
RAG 企业级应用落地框架细节差异对比

玄姐聊AGI • 3343浏览 • 0回复
基于Llama 3.1和一台MacBook搭建商用级知识库

玄姐聊AGI • 1442浏览 • 0回复
企业级智能知识库搜索问答技术与应用

51CTO技术栈 • 1085浏览 • 0回复
Agentic RAG Golden-Retriever：显著提升企业知识库问答准确性、检索效率！

PaperAgent • 1301浏览 • 0回复
一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI的区别和联系！！

玄姐聊AGI • 1738浏览 • 0回复
搭建大模型知识库流程，以及基于Langchain实现大模型知识库案例

AI探索时代 • 1827浏览 • 0回复
爆火的本地知识库项目是什么？什么是RAG？本地知识库与大模型的关系

AI探索时代 • 1487浏览 • 0回复
#AIGC创新先锋者征文大赛#企业级智能知识库搜索问答技术与应用

澜舟科技 • 910浏览 • 0回复
关于大模型在企业级应用中的选择问题疑问回复

AI探索时代 • 674浏览 • 0回复
【AI开源项目】FastGPT - 快速部署FastGPT以及使用知识库的两种方式！

唐克 • 6268浏览 • 0回复
怎么解决大模型知识库的检索问题，RAG检索增强之ReRank(重新排序)

AI探索时代 • 1218浏览 • 0回复
手把手教你如何用扣子（COZE）打造一个企业级的知识库机器人

风云2002_1 • 2021浏览 • 0回复
Chatbot 不是“万金油”：企业级生成式 AI 如何真正创造价值

Baihai_IDP • 770浏览 • 0回复
Deepseek 671B + Milvus 重新定义知识库搭建！

玄姐聊AGI • 1904浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

一文搞懂 DeepSeek 的蒸馏技术和案例实践 8天前发布
DeepSearcher 开源：告别传统 RAG，私有数据+DeepSeek，打造本地版 Deep Research 2025-02-19 14:58:15发布

热门推荐

带你一文读懂爆火的 DeepSeek-R1 新模型技术，为何震动了全球 AI 圈 1回复

4090单卡部署满血 671B DeepSeek，本地部署“成本骤降32倍”！！！ 0回复

手把手教你在本地部署 DeepSeek R1，并集成到 Dify 中，建议收藏！ 0回复

低成本+高性能+超灵活！Deepseek 671B + Milvus 重新定义知识库搭建！ 0回复

DeepSeek 惊艳背后的技术架构创新剖析 0回复

上一篇： OpenAI重磅发布交互界面canvas，让ChatGPT成为编程和写作利器

下一篇： Google 最新推出的RAG替代方案--RIP

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载