鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 25年5月软考 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

Entropix，终于找到了真正解决幻觉的方法了

发布于 2024-10-15 15:06

浏览

0收藏

最近，神秘大佬开源一个框架entropix, 2周不到收获2.4k star。

Entropix，终于找到了真正解决幻觉的方法了-AI.x社区

Entropix的核心思想是通过量化模型的不确定性，来做出更多的“思考”，从而获得更好的效果。

当大模型在预测下一个词时，模型会为每个词分配一个可能的概率。如果模型特别笃定的那个token的概率都很低，也就是不确定性很高的时候，熵越高。

很多时候，想减少模型的幻觉时，可能会将模型的采样超参数如temperature设为 0。但是这样做并不一定能提高模型不产生幻觉输出的概率，只是迫使它对相对于其他单词而言的一个单词赋予更高的概率。

但是在 Entropix 和之前google的内置cot研究验证了，事实恰恰相反，采用贪婪解码，反而可能会让结果变得更坏。

google的研究，前不久发的推文：cot-decoding，谷歌把o1的底裤都开源了

那如何衡量结果不确定性呢？在这个google的研究中使用的是top1和top2的token概率的差值。在Entropix中用到的是entropy和varentropy，varentropy是衡量entropy的方差的，提供了一个关于跨不同token不确定性的度量。

低varentropy意味着模型的不确定性在token间是恒定的，高则意味着token间不确定性很大。

Entropix，终于找到了真正解决幻觉的方法了-AI.x社区

Entropix 方法中的采样过程如下，核心思想是根据模型的不确定性调整其选择策略：

当模型有信心（低entropy和低varentropy）时，它就会按常规进行。
当模型不确定（高entropy和/或高varentropy）时，它会探索替代标记或推理路径。

Entropix，终于找到了真正解决幻觉的方法了-AI.x社区

这种自适应方法是在模拟思维链过程，当模型不确定时，它会“更努力的思考”，从而可能产生更准确连贯的输出。

本文转载自 NLP前沿，作者：热爱AI的

标签

赞

收藏

回复

举报

回复

相关推荐

CVPR 2024 | 多模态大模型幻觉原因找到了！

zhangyannni • 3377浏览 • 0回复
AI重塑社交，谁才是C端叙事正解？

liutao988 • 792浏览 • 0回复
除了RAG，还有这五种方法消除大模型幻觉

51CTO技术栈 • 3265浏览 • 0回复
比Transformer更快更省，Mamba终于卷到网络领域了

arnoldzhw • 4411浏览 • 0回复
如何解决模型的灾难性遗忘问题？清华大学提出新方法！

AI论文解读 • 3005浏览 • 0回复
开发者终于可以定制自己的GPT-4o了！

51CTO技术栈 • 1000浏览 • 0回复
解决大型多模态模型的幻觉问题，新方法AITuning助力AI更可靠

AI论文解读 • 1191浏览 • 0回复
RAG真正的难点不是向量数据库，而是实时企业数据管道！这家公司做到了

51CTO技术栈 • 890浏览 • 0回复
Kimi 我的神，它终于更新了！这个探索版，有点牛！

wsp_ping • 1370浏览 • 0回复
【智汇金秋创造季】智汇成海，致敬开发者的“超级码力”！

AI.x社区官方账号 • 32.8w浏览 • 148回复
Auto-RAG开源，复杂多跳问题就这么解决了！

PaperAgent • 1168浏览 • 0回复
Agent驱动的AI编程，终于找到了PMF！

探索AGI • 566浏览 • 0回复
LangChain实战 | Tool Calling ：让AI真正动起来的关键技术

AI取经路 • 1302浏览 • 0回复
什么是神经网络—终于把梯度下降搞明白了！

人工智能训练营 • 620浏览 • 0回复
减少LLM幻觉的五大技巧和方法

51CTO内容精选 • 590浏览 • 0回复
什么是神经网络-终于把神经网络参数更新搞明白了！

人工智能训练营 • 436浏览 • 0回复
复旦大学 METASQL：NL2SQL终于有候选排序了

AIGC前沿技术追踪 • 452浏览 • 0回复
什么是自然语言处理——NLP，其解决了什么问题？

AI探索时代 • 665浏览 • 0回复
什么是神经网络-终于把神经网络参数更新搞明白了反向传播详解

人工智能训练营 • 341浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

DeepSeek开源周，第三弹， DeepGEMM来袭！ 5天前发布
这个开源项目厉害了：一键部署DeepSeek R1！ 2025-02-18 11:50:42发布

热门推荐

带你一文读懂爆火的 DeepSeek-R1 新模型技术，为何震动了全球 AI 圈 1回复

4090单卡部署满血 671B DeepSeek，本地部署“成本骤降32倍”！！！ 0回复

手把手教你在本地部署 DeepSeek R1，并集成到 Dify 中，建议收藏！ 0回复

国家队出手！DeepSeek上线国家超算互联网平台，免注册开箱即用！ 0回复

低成本+高性能+超灵活！Deepseek 671B + Milvus 重新定义知识库搭建！ 0回复

上一篇：现实再次给大模型带来沉重打击

下一篇： RAG遇上知识冲突，Google祭出终极大招！

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载