搜索引擎+GraphRAG+智能体,打造AI智能搜索

发布于 2024-9-10 11:29
浏览
0收藏

最近,人工智能领域涌现的新搜索引擎MindSearch正成为行业的新宠。这款开源的搜索引擎具备卓越的信息处理能力,能够在几分钟内完成人类需要数小时才能做到的工作,充分展现出AI在信息检索和整合方面的惊人潜力。

本文带读者了解MindSearch的核心特性,看其如何领先于竞争对手;同时,文章中还会提供指南,指导如何在本地搭建这款AI搜索引擎。

1 MindSearch简介

MindSearch是由上海人工智能实验室联合研发团队推出的开源AI搜索框架,擅长大规模信息的收集与整理。

借助InternLM2.5 7B对话模型,MindSearch能够在短时间内从300多个网页中提取关键信息,完成这项通常人类需要3小时的任务。

MindSearch采用多代理框架模拟人类思考过程,先规划然后执行搜索,从而确保信息的精确度和全面性。

该项目完全开源,用户可以免费体验并进行本地部署。

2 MindSearch优势

MindSearch由两大核心组件构成:WebPlanner和WebSearcher。

WebPlanner将用户问题细化为搜索任务,并智能规划搜索路径,整个过程通过图结构呈现。WebSearcher则负责执行分层搜索,精准地收集所需信息。

MindSearch的独到之处在于其高效的复杂问题处理和信息提取能力。借助多代理架构,它能在几分钟内完成人类三小时的工作量,确立了其在AI搜索领域的领先地位。

3 MindSearch更胜一筹

MindSearch之所以能超越ChatGPT和Perplexity.ai,关键在其模仿人类思维的多代理框架。

搜索引擎+GraphRAG+智能体,打造AI智能搜索-AI.x社区

在实际应用中,MindSearch的性能表现十分出色。它能够迅速从众多网页中搜集并整合信息,面对复杂的查询任务,如“本季《王者荣耀》哪位射手表现最佳?”,它不仅分析赛季特点和射手性能指标,还能综合多方数据,提供全面而精确的答案,效率远超人类专家。在与ChatGPT-web和Perplexity的对比测试中,MindSearch的表现尤为突出。

4 本地部署MindSearch

步骤1:安装依赖

  • 打开终端或命令提示符,准备输入安装命令。
  • 从GitHub克隆MindSearch仓库,将所需文件下载到本地:

git clone https://github.com/InternLM/MindSearch
  • 进入克隆后的MindSearch目录:

cd MindSearch
  • 安装项目所需的Python包,仓库中包含requirements.txt文件,列出了所有必需的包。运行以下命令进行安装:

pip install -r requirements.txt

步骤2:设置MindSearch API

要启动MindSearch API,需要运行一个Python模块。命令有几个选项:

  • 使用--lang en参数设置模型语言为英语,若需使用中文,可将en改为cn。
  • 通过--model_format参数指定模型格式,例如使用internlm_server来优化中文的InternLM2.5-7b-chat模型,或选择gpt4来使用GPT-4模型。

接下来,启动FastAPI服务器,根据配置调整命令参数:

  • 对于开源模型,使用命令:

python -m mindsearch.app --lang en --model_format internlm_server
  • 若要使用GPT-4模型,首先需要在项目文件中修改API模型配置,将'YOUR OPENAI API KEY'替换为你的OpenAI实际API密钥:

gpt4 = dict(type=GPTAPI,
            model_type='gpt-4-turbo',
            key=os.environ.get('OPENAI_API_KEY', 'YOUR OPENAI API KEY'))

然后,确保启动服务器的命令正确指向GPT-4模型格式:

python -m mindsearch.app --lang en --model_format gpt4

步骤3:搭建MindSearch前端界面

  • 启动Gradio界面

确保进入 Gradio 脚本所在的 MindSearch 项目根目录,并在终端中使用以下命令启动 Gradio 界面:

python frontend/mindsearch_gradio.py
  • 运行Streamlit应用

使用以下命令运行 Streamlit 应用程序。 Streamlit 会自动在默认网络浏览器中打开网络应用程序.方便你进行操作和使用。

streamlit run frontend/mindsearch_streamlit.py

5 总结

MindSearch以其简洁而强大的功能,为信息检索和整合领域带来了突破性的解决方案。它独有的多代理框架,融合了大型语言模型的认知优势和搜索引擎的数据广度,使其在众多现有工具中脱颖而出。

通过细化查询、有效管理上下文信息以及实施分层检索策略,MindSearch大幅提升了网络信息检索的精确性和全面性。它能够迅速处理大量网页数据,为用户提供了快速而准确的信息获取渠道,从而支持用户做出更加明智的决策。

本文转载自​ AI科技论谈​,作者: AI科技论谈

收藏
回复
举报
回复
相关推荐