上篇文章我们介绍了一个使用RAG进行SQL生成的项目(RAG做SQL生成处理表格,一个10.1k※的开源工具vanna)。这篇文章我们介绍一个使用LangChain实现SQLagent的方法,LangChain直接内置了自己的SQLagent实现-—SQLDatabaseChain。这个方法使用 SQL Alchemy 与数据库交互。感兴趣的可以考虑一下这两个方案是否可以融合,这样保证SQL的准确性从而提升最终结果的准确率。下面将介绍今天主要内容的实现步骤:
实现步骤
首先,我们得有一个数据库。这里我们用的是ClickHouse,一个开源的、面向列的SQL数据库管理系统,特别适合大数据分析。安装起来超级简单,一行命令就搞定。
接下来,我们得让Agent学会和ClickHouse交流。这里就需要用到clickhouse-sqlalchemy这个包了。安装它之后,我们就可以建立数据库连接,然后初始化我们的Toolkit。这个Toolkit就像是我们的Agent的工具箱,里面装满了有用的工具。
现在,让我们来创建一个SQLDatabaseChain的Agent。这个Agent可以直接和数据库交互,回答问题。我们只需要定义一些工具,比如查询表结构、执行SQL查询等。然后,我们就可以快速创建并运行这个Agent了。
环境搭建
今天用到的主要安装包如下,其它可以根据提示安装:
# 安装 clickhouse-sqlalchemy 包来连接 ClickHouse
pip install clickhouse-sqlalchemy langchain
运行代码
代码大概是这样的:
from langchain.agents import AgentExecutor, AgentType
from langchain.sql_database_toolkit import SQLDatabaseToolkit
# 设置数据库连接
uri = 'clickhouse+native://localhost/ecommerce'
db = SQLDatabase.from_uri(uri)
# 初始化工具箱
toolkit = SQLDatabaseToolkit(db=db, llm=OpenAI(temperature=0))
# 创建并运行基于 OpenAI 函数的 Agent
agent_executor = create_sql_agent(
llm=ChatOpenAI(temperature=0.1, model='gpt-4-1106-preview'),
toolkit=toolkit,
verbose=True,
agent_type=AgentType.OPENAI_FUNCTIONS
)
# 运行 Agent,回答数据相关问题
agent_executor.run("我们有多少来自上海的活跃客户?")
运行这段代码后,Agent就会根据我们的问题去数据库里找到答案,然后告诉我们。比如,它会告诉我们有多少来自上海的活跃客户。这个Agent的好处在于,它可以直接理解我们的问题,然后去数据库里找到答案。我们不需要自己写SQL查询,也不需要担心查询的语法问题。Agent会帮我们搞定一切。
如果对内容有什么疑问和建议可以私信和留言,也可以添加我加入大模型交流群,一起讨论大模型在创作、RAG和agent中的应用。