RAG真正的难点不是向量数据库,而是实时企业数据管道!这家公司做到了 原创
编辑 | 言征
出品 | 51CTO技术栈(微信号:blog51cto)
企业部署GenAI需要RAG,而RAG需要向量数据库,向量数据库已经成为企业部署人工智能的核心要素。但这还远远不够,企业级别的RAG要复杂得多。
1.向量数据库并非真正的难点
克里斯·拉蒂默(Chris Latimer)是初创公司Vectorize的首席执行官兼联合创始人,他曾在DataStax工作数年,期间协助领导了该数据库供应商的云端工作。他反复遇到的一个问题是,对于实现企业RAG而言,向量数据库并非真正的难点所在。问题的难点在于,如何将以各种方式存在的非结构化数据优化并导入向量数据库,以便为生成式人工智能(AI)提供良好的支持。
正因如此,拉蒂默仅在十个月前创立了Vectorize,旨在帮助解决这一挑战。
现在,该公司声称在由True Ventures领投的种子轮融资中筹集了360万美元。与此同时,该公司还宣布其企业RAG平台已正式推出。Vectorize平台能够实现代理式RAG方法,提供近乎实时的数据能力。
Vectorize专注于AI的数据工程方面。该平台帮助公司为在向量数据库和大型语言模型中使用数据做好准备并进行维护。Vectorize平台还通过直观的界面,使企业能够快速构建RAG数据管道。另一项核心功能是RAG评估功能,它允许企业测试不同的方法。
“我们不断看到人们在他们的生成式AI项目开发周期结束时发现,项目并未取得良好效果,”Vectorize的联合创始人兼首席执行官克里斯·拉蒂默在接受VentureBeat独家采访时表示。“他们为向量数据库获取的上下文对大型语言模型来说并非最有用的,它仍在产生幻觉或误解数据。”
2.Vectorize如何融入企业RAG架构
Vectorize本身并不是一个向量数据库。相反,它是一个将非结构化数据源连接到现有向量数据库(如Pinecone、DataStax、Couchbase和Elastic)的平台。
拉蒂默解释说,Vectorize会吸收并优化来自不同源的数据,以供向量数据库使用。该平台将提供一个生产就绪的数据管道,负责数据摄取、同步、错误处理以及其他数据工程的最佳实践。
Vectorize本身也不是一种向量嵌入技术。将数据(无论是文本、图像还是音频)转换为向量的过程,就是向量嵌入的全部内容。Vectorize帮助用户评估不同的嵌入模型和数据分块方法,以确定最适合企业特定用例和数据的配置。
拉蒂默解释说,Vectorize允许用户从任意数量的不同嵌入模型中进行选择。这些不同的模型可能包括OpenAI的ada,甚至是Snowflake正在采用的Voyage AI嵌入。
“我们确实会考虑将数据向量化的创新方法,以确保您获得最佳结果,”拉蒂默说,“但最终,我们认为其价值在于为企业和开发人员提供一个生产就绪的解决方案,让他们不必再担心数据工程方面的问题。”
3.利用代理式AI驱动企业RAG落地
Vectorize的一项关键创新是其“代理式RAG”方法。该方法将传统的RAG技术与AI代理功能相结合,使应用程序能够更自主地解决问题。
代理式RAG也并非一个假设性的概念。Vectorize的早期用户之一、AI推理硅芯片初创公司Groq就已经在使用它。Groq最近筹集了6.4亿美元资金。Groq正在利用Vectorize的代理式RAG功能来驱动一个AI支持代理。该代理可以自主利用Vectorize数据管道提供的数据和上下文来解决客户问题。
“如果客户的问题之前已经被问过并得到了回答,那么我们希望这个代理能够解决客户的问题,而无需人类介入,”拉蒂默说,“但如果代理无法解决问题,我们希望有一个人类参与的环节,以便进行升级处理。因此,代理能够通过推理来解决问题的理念,正是AI代理架构背后的整体理念。”
4.为什么实时数据管道对企业RAG至关重要
企业使用检索增强生成的一个主要原因是连接到其自身的数据源。但同样重要的是确保数据的实时性。
“陈旧的数据会导致陈旧的决策,”拉蒂默说。Vectorize提供了实时和近乎实时的数据更新能力,客户可以根据自身对数据陈旧度的容忍度进行配置。
“我们实际上允许用户根据对数据陈旧度的容忍度和对实时数据的需求来配置平台,”他说,“因此,如果您只需要将管道设置为每周运行一次,我们可以满足您的需求;而如果您需要实时运行,我们也可以满足,并且您可以在数据可用时立即获得实时更新。”
参考链接:https://venturebeat.com/ai/vectorize-debuts-agentic-rag-platform-for-real-time-enterprise-data/
本文转载自51CTO技术栈,作者:言征