GPT-4o 系列 AI 模型加持,微软 LlamaParse 文档解析能力全面升级

人工智能
微软于 11 月 26 日发布博文,宣布在其 LlamaParse 中集成 Azure OpenAI 端点,利用 GPT-4o 系列模型,增强提取非结构化数据和解析多模态文档,并无缝衔接 Azure AI Search 向量数据库,构建完整的检索增强生成(RAG)工作流程。

11 月 28 日消息,微软于 11 月 26 日发布博文,宣布在其 LlamaParse 中集成 Azure OpenAI 端点,利用 GPT-4o 系列模型,增强提取非结构化数据和解析多模态文档,并无缝衔接 Azure AI Search 向量数据库,构建完整的检索增强生成(RAG)工作流程。

LlamaParse 简介

微软 LlamaParse 是一个专为生成式人工智能(GenAI)设计的文档解析器,其主要目标是解析和清理各种文档数据,在传递给下游大型语言模型 (LLM) 之前,确保数据质量。

新增 Azure OpenAI 端点(endpoints)

微软 LlamaParse 在本次集成后,可以让用户调用 Azure OpenAI 的 GPT-4o 系列模型,提取非结构化数据和文档转换。此次集成充分发挥了双方优势,LlamaParse 负责高效解析,Azure OpenAI 则提供强大的语言模型能力,最终实现更精准、更智能的文档处理。

IT之家援引该媒体报道,附上本次更新内容如下:

  • 直接连接到 Azure OpenAI 的 GPT-4o 和 GPT-4o-mini 等模型
  • LlamaParse 中的多模态文档解析,通过 Azure OpenAI 的多模态支持
  • LLM 优化的输出,用于增强检索和语义搜索
  • 通过 LlamaIndex 无缝摄取到 Azure AI Search 的向量存储库中
  • 企业级安全性和合规性,适用于敏感工作负载

用户可以利用 LlamaCloud、Azure AI Search 和 Azure OpenAI 构建一个完整的 RAG 工作流程,具体步骤包括:

  • 解析与丰富: 使用 LlamaParse Premium 和 Azure OpenAI 进行高级文档提取,生成 Markdown、LaTeX 和 Mermaid 图表等多种格式的 LLM 优化输出。
  • 分块和嵌入: 使用 Azure AI Search 作为向量存储,并利用 Azure AI 模型目录中的嵌入模型,对解析后的内容进行分块、嵌入和索引。
  • 搜索与生成: 利用 Azure AI Search 的查询重写和语义重新排序功能,提升检索质量。最终,通过 Llamaindex 编排 Azure AI Search 和 Azure OpenAI,构建生成式 AI 应用。
责任编辑:庞桂玉 来源: IT之家
相关推荐

2024-06-05 13:09:26

2024-05-14 11:29:15

2024-08-14 09:13:28

2024-05-21 12:23:17

2024-06-05 08:29:35

2024-06-11 07:26:28

2024-06-11 14:47:23

2024-08-13 13:50:00

数据模型

2024-08-05 08:46:00

模型测评

2024-05-15 17:34:15

2024-05-14 07:30:56

OpenAIGPT-4oGPT-4

2024-05-14 19:16:52

ChatGPTGPT-4oOpenAI

2024-05-24 14:04:04

2024-07-23 12:32:11

2024-05-14 10:14:12

2024-05-21 13:07:38

2024-09-06 13:00:29

2024-05-14 08:23:27

GPT-4oAI技术

2024-06-21 09:51:17

2024-07-31 13:20:14

点赞
收藏

51CTO技术栈公众号