鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

一文读懂LLMs的幻觉问题和对策

数字化助推器

发布于 2024-11-14 15:50

1877浏览

0收藏

什么是大模型幻觉（LLM Hallucination）

指大语言模型在生成文本时，给出似是而非、虚构或不准确信息的现象，简单来说就是一本正经的胡说八道。

要点：

大模型幻觉包括生成的文本与事实矛盾、上下文矛盾、与prompt不一致、编造事实和荒谬回复等问题
幻觉产生的原因有数据质量问题、多样性缺乏、训练过拟合、生成过程随机性、提示工程不足和微调过程控制不当
幻觉会带来严重后果,阻碍大模型应用

1）. 事实性幻觉 (Factuality Hallucination)
🐞 事实不一致
✍️ 事实捏造
2）. 忠实性幻觉 (Faithfulness Hallucination)
💬 指令不一致
📜 上下文不一致
🧮 逻辑不一致

产生幻觉的原因
🗣️ 内容生成的机制
📚 训练数据的局限
🤔 上下文误导

应对幻觉的方法
1）. 🏖️ 依赖模型能力的增强（什么都不用做！）
2）. 🔍 交叉验证信息
3）. 📖 设置明确的上下文-

大模型幻觉从哪儿来？

1️⃣来自数据

- 将虚假的相关性(如位置接近或高度共现的关联误解为事实知识

- LLM偏向于肯定测试样本，LLMs容易复制甚至放大这种幻觉行为。

- 存在一些导致幻觉的训练数据·

2️⃣大模型有时会高估自己的能力

3️⃣在 SFT 阶段，有问题的对齐过程可能会误导大模型产生幻觉

4️⃣LLM采用的生成策略，如现在常见的 top-k、top-p 等方法，其实是一种局部最优解，不能确保全局最优。这意味着搜索空间变小了，因此可能引发幻觉问题

大模型幻觉如何评估？

1、生成事实陈述评估

2、判别式基准评估

3、基于问答对的评估

合理解决方法

1️⃣预训练数据问题

2️⃣微调新知识

3️⃣幻觉检测

4️⃣基于采样的检测

5️⃣未知知识的校准

一文读懂LLMs的幻觉问题和对策-AI.x社区

一文读懂LLMs的幻觉问题和对策-AI.x社区

一文读懂LLMs的幻觉问题和对策-AI.x社区

一文读懂LLMs的幻觉问题和对策-AI.x社区

一文读懂LLMs的幻觉问题和对策-AI.x社区

一文读懂LLMs的幻觉问题和对策-AI.x社区

一文读懂LLMs的幻觉问题和对策-AI.x社区

一文读懂LLMs的幻觉问题和对策-AI.x社区

一文读懂LLMs的幻觉问题和对策-AI.x社区

一文读懂LLMs的幻觉问题和对策-AI.x社区

一文读懂LLMs的幻觉问题和对策-AI.x社区

一文读懂LLMs的幻觉问题和对策-AI.x社区

一文读懂LLMs的幻觉问题和对策-AI.x社区

一文读懂LLMs的幻觉问题和对策-AI.x社区

一文读懂LLMs的幻觉问题和对策-AI.x社区

本文转载自公众号数字化助推器作者：天涯咫尺TGH

原文链接：https://mp.weixin.qq.com/s/DBKUwNTV-gbQIKCXYQBgFw

标签

赞

收藏

回复

举报

回复

相关推荐

一文读懂大模型协作策略：Merge、Ensemble、Cooperate！

PaperAgent • 4055浏览 • 0回复
一文读懂OpenGVLab带来的最新视觉预训练框架

鲁班模锤1 • 1810浏览 • 0回复
一文读懂：从RAG到多模态RAG

kede96 • 3477浏览 • 0回复
一文读懂GraphRAG大模型知识图谱

数字化助推器 • 3279浏览 • 0回复
优雅谈大模型：一文读懂LoRA/DoRA/MoRA

鲁班模锤1 • 2902浏览 • 0回复
一文读懂 DeepSeek-V3 技术报告

xuxiangda • 4011浏览 • 0回复
带你一文读懂爆火的 DeepSeek-R1 新模型技术，为何震动了全球 AI 圈

玄姐聊AGI • 6121浏览 • 1回复
一文搞懂 DeepSeek - 强化学习和蒸馏

玄姐聊AGI • 2557浏览 • 0回复
一文读懂 PPO 与 GRPO：LLM 训练的关键算法

鸿煊的学习笔记 • 4744浏览 • 0回复
一文搞懂 DeepSeek 的蒸馏技术和案例实践

玄姐聊AGI • 5223浏览 • 0回复
一文读懂AI智能体的原理类型、功能优势和最常见使用场景

数字化助推器 • 4046浏览 • 0回复
别慌一文读懂AI智能体常见的九种设计模式

数字化助推器 • 1806浏览 • 0回复
一文读懂 RAG 中的 embedding model

鸿煊的学习笔记 • 2017浏览 • 0回复
一文读懂 DeepSeek使用的 MoE 架构到底是什么

九歌AI大模型 • 1647浏览 • 0回复
一文读懂AI智能体：概念、特性、类型与应用全解析

Halo咯咯 • 2416浏览 • 0回复
一文读懂 15 种注意力机制

智驻未来 • 1901浏览 • 0回复
AI Agents-4 | 一文读懂 AI 智能体的多元类型

Halo咯咯 • 785浏览 • 0回复
一文读懂AI智能体融合与数据隐私安全问题

数字化助推器 • 786浏览 • 0回复
一文读懂 DeepSeek-R1 的 “最强外挂” GRPO 算法

鸿煊的学习笔记 • 683浏览 • 0回复

这个用户很懒，还没有个人简介

觉得TA不错？点个关注精彩不错过

帖子

声望

粉丝

关注

最近发布

忘掉 Manus 模型上下文协议MCP 正在重新定义智能体的未来 1天前发布
AI大模型如何存储海量数据？一文读懂数据重删和数据压缩 3天前发布

热门推荐

王炸！MCP 架构设计深度剖析 & 使用 Spring AI + MCP 四步教你实现 Agent 智能体开发 0回复

实操干货！MCP 全解析，手把手教你基于 MCP 开发 Agent 0回复

从 Manus 到 DeepSearcher，2025年最值得关注的十大 Agent 智能体架构设计 0回复

Dify从入门到高阶系列二：手把手教学！超详细的Dify知识库配置全攻略 0回复

MCP协议之MCP-server(sse方式)实践 0回复

上一篇： AI Agent落地电商典型应用实践

下一篇： LLM大模型在金融行业入口实践

社区精华内容

目录

什么是大模型幻觉（LLM Hallucination）
大模型幻觉从哪儿来？
大模型幻觉如何评估？
合理解决方法

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载