鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 25年5月软考 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

基于Llama 3.1和一台MacBook搭建商用级知识库

发布于 2024-8-2 12:42

浏览

0收藏

1、为什么要在 MacBook 上搭建知识库？

最核心最重要的是我们手上的文档资料出于安全要求，不能随便上传到云服务，也就无法实际验证知识库的实际效用。另外对于 IT 同学来说，自己亲手搭建一个完整的方案、能灵活调整和对接各种不同的模型、评测各种模型不同的表现，也是出于对技术的探索本能使然。

使用的 MacBook 配置如下，对大模型经过量化处理（比如：int8）后，可以流畅运行。

基于Llama 3.1和一台MacBook搭建商用级知识库-AI.x社区图片

2、知识库的架构设计

基于一台 MacBook 搭建部署的架构设计如下图，在这套架构设计中，我们采用了实力排上游、并且对企业和学术都友好的最新开源大模型 Llama 3.1。

基于Llama 3.1和一台MacBook搭建商用级知识库-AI.x社区

并采用了基于 m3e-base 模型的 embedding search RAG 方案。基于这两个模型封装和 ChatGPT 兼容的 API 接口协议；通过引入 One API 接口管理 & 分发系统，形成统一 LLM 接口渠道管理平台规范，并把封装好的接口协议注册进去；搭建与 Dify.ai 齐名开源大模型知识库平台管理系统 FastGPT，实现集私有知识数据源预处理、嵌入检索、大模型对话一体的完整知识库应用流程。

麻雀虽小五脏俱全，最终形成一套既满足商用标准、又能在 MacBook 跑起来的的方案。虽然智能程度和实际需求还有一定差距，但至少我们在不用额外购买显卡或云服务的情况下，以最小成本部署运行、并且能导入实际业务数据（如：设计文档、业务流程文档、项目管理文档、技术分享文档等等）进行实操验证，值得每位工程师都来动手尝试一下。

3、知识库的部署设计

基于 MacBook 的部署方案分为四个主要环节、14个具体步骤，只要一步步实操下去，每位 IT 同学都可以在自己的 MacBook 上拥有属于自己的私有大模型知识库系统，步骤清单如下：

基于Llama 3.1和一台MacBook搭建商用级知识库-AI.x社区

部分步骤可以简单地通过 Docker 镜像一键部署完成，但本着对细节一杆子插到底的部署思路，还是采取了纯手工作业的方法。

本文转载自公众号玄姐聊AGI 作者：玄姐

原文链接：https://mp.weixin.qq.com/s/5IMtWfcObJYU2Uu9ygJUoQ

标签

赞

收藏

回复

举报

回复

相关推荐

怎么看大模型、RAG、Agent、知识库、向量数据库、知识图谱、AGI的区别和联系？

玄姐聊AGI • 2306浏览 • 0回复
一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI的区别和联系！！

玄姐聊AGI • 7493浏览 • 0回复
爆火的本地知识库项目是什么？什么是RAG？本地知识库与大模型的关系

AI探索时代 • 2197浏览 • 0回复
打造智能私有知识库：开源工具AnythingLLM全解析及实操指南，RAG企业级解决方案

AIGC观察者 • 4639浏览 • 1回复
企业级智能知识库搜索问答技术与应用

51CTO技术栈 • 820浏览 • 0回复
Agentic RAG Golden-Retriever：显著提升企业知识库问答准确性、检索效率！

PaperAgent • 1106浏览 • 0回复
基于Llama 3、Ollama、Milvus、LangChain，快速搭建本地RAG

小虎哦哦 • 2023浏览 • 0回复
一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI的区别和联系！！

玄姐聊AGI • 1321浏览 • 0回复
搭建大模型知识库流程，以及基于Langchain实现大模型知识库案例

AI探索时代 • 1192浏览 • 0回复
爆火的本地知识库项目是什么？什么是RAG？本地知识库与大模型的关系

AI探索时代 • 1009浏览 • 0回复
大模型检索增强(RAG)技术之——GraphRAG，知识库产品必不可少的技术

AI探索时代 • 1106浏览 • 0回复
#AIGC创新先锋者征文大赛#企业级智能知识库搜索问答技术与应用

澜舟科技 • 755浏览 • 0回复
如何基于一台MacBook搞定企业级大模型知识库部署

玄姐聊AGI • 786浏览 • 0回复
【AI开源项目】FastGPT - 快速部署FastGPT以及使用知识库的两种方式！

唐克 • 4945浏览 • 0回复
GraphRAG新增文件对已有知识库影响有多大？缓存又是何时失效？一文带你探究到底

水晶花雨_32 • 457浏览 • 0回复
RAG与本地知识库，向量数据库，以及知识图谱的联系与区别

AI探索时代 • 1423浏览 • 0回复
本地知识库优化，让 AI 回答更精准

wsp_ping • 690浏览 • 0回复
怎么解决大模型知识库的检索问题，RAG检索增强之ReRank(重新排序)

AI探索时代 • 605浏览 • 0回复
手把手教你如何用扣子（COZE）打造一个企业级的知识库机器人

风云2002_1 • 856浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

AI Agent 智能体开发工作手册详细指南 1天前发布
Coze，Dify，FastGPT，哪个更强？全方位对比分析来了！ 3天前发布

热门推荐

谷歌刚刚发布AI Agent智能体白皮书，2025年AI Agent时代已到来！ 0回复

寻找乐子人｜ “多语言、精准定位”上海导游智能体搭建方案 2回复

人工智能智能体(AI Agent)发展趋势2024年总结与2025年展望 0回复

谷歌AI发布Gemini 2.0 Flash：比Gemini 1.5 Pro快2倍的新AI模型 0回复

生成式人工智能：2024年全面指南 0回复

上一篇：最强大模型 Llama 3.1-405B 架构设计剖析

下一篇： RAG 开发四大痛点及解决方案

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载