通过我们的指南了解如何为您的企业释放人工智能的力量。了解 RAG 和 CRAG 集成、矢量嵌入、LLM 和提示工程。非常适合负责任地拥抱人工智能的企业。
为企业打造AI-Ready平台
企业在引入生成式人工智能时,会遇到许多需要战略管理的业务风险。这些风险通常是相互关联的,范围从导致合规问题的潜在偏见到缺乏领域知识。主要问题包括声誉损害、遵守法律和监管标准(尤其是与客户互动有关)、知识产权侵权、道德问题和隐私问题(尤其是在处理个人或可识别数据时)。
建议采用检索增强生成(RAG)等混合策略来应对这些挑战。RAG提高了人工智能生成内容的准确性和相关性,为企业人工智能计划提供了更安全、更可靠的框架。该策略不仅解决了缺乏知识和错误信息等紧迫问题,而且遵守法律和道德规范,防止声誉受损和合规违规行为。
了解检索增强生成 (RAG)
检索增强生成(RAG)是一种先进方法,通过集成企业知识库中的信息来提高人工智能内容创建的准确性和可靠性。将 RAG 视为一位大厨,他依靠与生俱来的天赋、全面的培训和创意天赋,所有这些都得到了对烹饪基础知识的透彻理解的支持。当需要使用不寻常的香料或满足对新颖菜肴的要求时,厨师会查阅可靠的烹饪参考资料,以确保成分得到最佳利用。
正如大厨可以烹制出各种菜肴一样,GPT和 LLaMA-2 等人工智能系统也可以创建各种主题的内容。然而,当他们需要提供具体和准确的细节时,特别是在新奇美食等复杂主题或浏览大量企业数据时,他们会使用特殊的工具来实现精度和深度。
如果 RAG 的检索阶段不充分怎么办?
Corrective-RAG(CRAG)介入以增强 RAG 设置的稳健性。CRAG 使用 T5 来评估检索到的文档的相关性。如果来自企业来源的文档被认为不相关,则可能会默认通过网络搜索来填补空白。
企业级生成人工智能解决方案的架构注意事项
架构从根本上是围绕三个核心支柱构建的:数据摄入、查询和智能检索、生成提示工程和大语言模型。
数据摄入:第一步是将公司文档的内容转换为易于查询的格式。此转换是使用嵌入模型完成的,遵循以下操作序列
- 数据分段:来自企业知识源(例如 Confluence、Jira 和 PDF)的各种文档被提取到系统中。此步骤涉及将文档分解为可管理的部分,通常称为“块”。
- 嵌入模型:然后将这些文档块传递给嵌入模型。嵌入模型是一种神经网络,它将文本转换为表示文本语义的数字形式(向量),使其能够被机器理解。
- 索引块:然后对嵌入模型产生的向量进行索引。索引是以有利于高效检索的方式组织数据的过程。
- 矢量数据库:将所有矢量嵌入保存在矢量数据库中。并将每个嵌入表示的文本保存在不同的文件中,确保包含对相应嵌入的引用。
查询和智能检索:推理服务器收到用户的问题后,就会通过嵌入过程将其转换为向量,该过程使用相同的模型在知识库中嵌入文档。然后,向量数据库进行搜索,以识别与用户意图密切相关的向量,并将其提供给大型语言模型 (LLM) 以丰富上下文。
5.查询:从应用程序和API层进行查询。该查询是用户或其他应用程序在搜索信息时输入的内容。
6.嵌入查询检索:利用生成的 Vector.Embedding 在矢量数据库的索引中开始搜索。选择您想要从矢量数据库中检索的矢量数量;这个数字将与您计划编译和用于解决问题的上下文数量成正比。
7.向量(相似向量):该过程识别相似向量,这些向量表示与查询上下文相关的文档块。
8.检索相关向量:
从向量数据库中检索相关向量。例如,在厨师的背景下,它可能相当于两个相关向量:食谱和准备步骤。相应的片段将被收集并随提示一起提供。
9.检索相关块:系统获取与被识别为与查询相关的向量相匹配的文档部分。一旦评估了信息的相关性,系统就会确定后续步骤。如果信息完全一致,它会根据重要性进行排列。如果信息不正确,系统会将其丢弃并在线查找更好的信息。
生成提示工程和LLMs:生成提示工程对于指导大型语言模型给出正确答案至关重要。它涉及创建考虑到任何数据差距的清晰而精确的问题。这个过程是持续进行的,需要定期调整以获得更好的响应。确保这些问题合乎道德、没有偏见并避免敏感话题也很重要。
10. 提示工程:然后将检索到的块与原始查询一起使用以创建提示。该提示旨在有效地将查询上下文传达给语言模型。
11. LLM(大型语言模型):工程提示由大型语言模型处理。这些模型可以根据收到的输入生成类似人类的文本。
12. 答案:最后,语言模型使用提示提供的上下文和检索到的块来生成查询的答案。然后,该答案通过应用程序和 API 层发送回用户。
结论
本博客探讨了将人工智能集成到软件开发中的复杂过程,强调了受 CRAG 启发建立企业生成人工智能平台的变革潜力。通过解决即时工程、数据管理和创新检索增强生成 (RAG) 方法的复杂性,我们概述了将人工智能技术纳入业务运营核心的方法。未来的讨论将进一步深入探讨智能开发的生成式人工智能框架,研究最大限度地利用人工智能的具体工具、技术和策略,确保更智能、更高效的开发环境。
作者 | Venkat Rangasamy