鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

浅看大模型用于Text2SQL的综述原创

大模型自然语言处理

发布于 2024-12-5 14:34

浏览

0收藏

前言

我们来看看大模型在text2sql上的一篇综述，大模型的发展，出现了一系列新方法，主要集中在提示工程（prompt engineering）和微调（fine-tuning）上。这篇综述提供了LLMs在Text-to-SQL任务中的全面概述，讨论了基准数据集、提示工程、微调方法和未来的研究方向。

Text2SQL

浅看大模型用于Text2SQL的综述-AI.x社区

利用大型语言模型（LLMs）解决文本到SQL任务的方法，主要包括提示工程和微调两大类。

1.提示工程

浅看大模型用于Text2SQL的综述-AI.x社区

浅看大模型用于Text2SQL的综述-AI.x社区

提示工程通过设计结构化的提示，使LLMs能够理解任务需求并生成相应的SQL查询。提示工程分为三个阶段：预处理、推理和后处理。

预处理：包括问题描述和数据库模式的格式化和布局，以及引入额外的SQL知识或外部知识。问题描述可以采用Openai模板或"Create Table"布局，样本数据可以帮助LLM更好地理解数据库内容。

浅看大模型用于Text2SQL的综述-AI.x社区

浅看大模型用于Text2SQL的综述-AI.x社区

推理：在接收到用户问题和数据库模式后，生成相应的SQL查询。推理过程可以设计特定的工作流，如Chain-of-Thought和Least-to-Most方法，也可以使用Demonstrations来增强SQL生成能力。
后处理：对生成的SQL进行优化，提高其性能和稳定性。常见的后处理方法包括自校正（Self-Correction）和一致性方法（Self-Consistency和Cross-Consistency）。

2.微调

浅看大模型用于Text2SQL的综述-AI.x社区

微调通过在特定任务数据上训练LLMs来提升其性能。微调过程包括数据准备、预训练模型选择、模型微调和模型评估。

数据：可以通过整合现有数据集或构建新数据集来获取训练数据。新数据集可以通过半自动或全自动的方法生成。
预训练模型选择：选择适合的预训练模型进行微调，考虑模型参数规模、预训练语料库和计算能力等因素。
模型微调：采用全量微调和参数高效微调等方法。参数高效微调通过仅微调少量模型参数来提高训练效率。
模型评估：通过综合指标分析、分类分析和基于LLM的分析评估来衡量模型性能。常用的评估指标包括精确集匹配准确率（EM）、执行准确率（EX）、测试集准确率（TS）和有效效率得分（VES）。

参考文献

A Survey on Employing Large Language Models for Text-to-SQL Tasks，https://arxiv.org/pdf/2407.15186v3

本文转载自公众号大模型自然语言处理作者：余俊晖

原文链接：https://mp.weixin.qq.com/s/UxDDIF63j8R2yozJ8XtDQw

©著作权归作者所有，如需转载，请注明出处，否则将追究法律责任

标签

已于2024-12-6 09:54:51修改

赞

收藏

回复

举报

回复

相关推荐

大模型与数据分析：探索Text-to-SQL

pangguiyu • 7318浏览 • 0回复
综述：大语言模型在信息抽取上的应用

xuxiangda • 4451浏览 • 0回复
微软发布Florence-2：用于处理各种视觉任务的小模型

AIGC最前线 • 3706浏览 • 0回复
大语言模型知识冲突的综述

sbf_2000 • 3912浏览 • 0回复
一篇大模型NL2SQL全栈技术最新综述

PaperAgent • 5370浏览 • 0回复
综述 | 大模型的可控文本生成

NLP工作站 • 3120浏览 • 0回复
NL2SQL：基于LLM的解决方案是最好的吗？

大语言模型论文跟踪 • 4901浏览 • 0回复
【人工智能】10分钟解读-深入浅出大语言模型（LLM）——从ChatGPT到未来AI的演进

唐克 • 4754浏览 • 0回复
Text2SQL 新一代解决方案Tool-SQL，基于LLM和Agent智能体实现，效果提升显著

AI博物院 • 4143浏览 • 0回复
浅看引入智能信息助理提升大模型处理复杂推理任务的潜力-AssisTRAG

大模型自然语言处理 • 1758浏览 • 0回复
DB-GPT-Hub:text2sql的微调框架及基准测试套件

大模型自然语言处理 • 2029浏览 • 0回复
阿里巴巴研究院推出 XiYan-SQL：用于Text-to-SQL的多生成器集成人工智能框架

Halo咯咯 • 5312浏览 • 0回复
低资源场景下Text2SQL方法

大模型自然语言处理 • 1696浏览 • 0回复
Hugging Face 发布 SmolVLM：用于设备端推理的 2B 参数视觉语言模型

Halo咯咯 • 1571浏览 • 0回复
Google 发布了用于视频生成的最先进的“Veo 2”和用于图像创建的“Improved Imagen 3”

Halo咯咯 • 1736浏览 • 0回复
Text2SQL 已过时？TAG 如何一统 AI 与数据库江湖！

AIGC前沿技术追踪 • 2549浏览 • 0回复
小红书 NoteLLM-2：用于推荐的多模态表征

amei2000go • 1535浏览 • 0回复
小模型借 FEATHER-SQL，在 NL2SQL 领域掀翻天

AIGC前沿技术追踪 • 804浏览 • 0回复
大语言模型增强的文本到 SQL 生成：综述

AIGC前沿技术追踪 • 537浏览 • 0回复

大模型自然语言处理

LV.4

这个用户很懒，还没有个人简介

觉得TA不错？点个关注精彩不错过

53

帖子

418

声望

1

粉丝

关注

最近发布

Kimi-VL开源多模态大模型结构、训练方法、训练数据浅析 1天前发布
十大PDF解析工具在不同文档类别中的比较研究 2025-04-07 06:31:37发布

热门推荐

王炸！MCP 架构设计深度剖析 & 使用 Spring AI + MCP 四步教你实现 Agent 智能体开发 0回复

实操干货！MCP 全解析，手把手教你基于 MCP 开发 Agent 0回复

从 Manus 到 DeepSearcher，2025年最值得关注的十大 Agent 智能体架构设计 0回复

Dify从入门到高阶系列二：手把手教学！超详细的Dify知识库配置全攻略 0回复

MCP协议之MCP-server(sse方式)实践 0回复

上一篇：参数高效微调-Prefix Tuning、Adapter Tuning、LoRA

下一篇：文档截图嵌入统一多模态检索方法原理

社区精华内容

目录

前言
Text2SQL
1.提示工程
2.微调
参考文献

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载