鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

提示工程策略：利用【慢思考】的双过程理论减少模型有害输出精华

大语言模型论文跟踪

发布于 2024-7-1 11:34

浏览

0收藏

1. 思考的快与慢

提示工程策略：利用【慢思考】的双过程理论减少模型有害输出-AI.x社区图片

诺贝尔经济学奖得主卡尼曼在《Thinking, Fast and Slow》这本书中根据前人多种双过程理论（Dual Process Theory）进行了总结和进一步解释：将人类的思考过程分为“直觉”和“推理”，这两个过程分别被称为“系统1（System 1）”和“系统2（System 2）”。

系统一的特点是快速，不加思考、不做计算、仅凭直觉就做出判断。比如，当我们回答1+1这个问题的时候，我们的大脑可以不加思考的回答出等于2。所以系统一的特点是：快思考、热启动、直觉判断。

系统二的特点是速度，需要做复杂的计算、推理，但回答准确度高。比如，当我们回答123乘以879的时候，我们无法通过我们的快思考来回答，我们需要调用大脑的计算模块，对这个问题进行复杂的计算后才能回答。所以系统二的特点是：慢思考、启动慢、耗费能量高、判断准确。

为什么今天要讨论大脑的思考过程？

是因为大语言模型在AGI的技术路线上，相当于我们人类的大脑。大多数人在第一次使用大语言模型的时候，经常会感受到大语言模型的愚蠢，比如，让他计算1+1等于几是可以计算的，但是让他计算123乘以879时，往往会计算不对（现在的网页版AI模型往往会在背后调用计算工具）。

提示工程策略：利用【慢思考】的双过程理论减少模型有害输出-AI.x社区图片

当大模型计算1+1的时候，其实我们可以认为大模型其实是在做一个最简单的快思考，回答的很快，直接通过大语言模型存储的知识，凭大模型的“直觉”来推断答案；当回答复杂的计算题时，大模型需要使用一些计算工具，这些工具可以是大模型内置的，可也是大模型外挂的，这可以理解为是大模型的慢思考。这两个过程实际上跟我们前面介绍的系统1和系统2的特点是非常吻合的。

讲了这么多，今天要介绍的这篇论文其实就是利用了【系统二】这样的一些理论来优化我们的提示工程策略，提高大语言模型回答的准确性和效果，在这篇论文里是降低了大模型的有害偏见，有效性高达13%。

2. 大模型的语言偏见

提示工程策略：利用【慢思考】的双过程理论减少模型有害输出-AI.x社区图片

介绍如何利用【系统二】来提升大模型效果之前，我们先来简单介绍下大模型语言偏见的一些背景。

大语言模型进展非常迅速，也取得了非常好的效果，但是大语言模型在表达的时候仍然可能会出现一些偏见性得表达。这些偏见以多种形态出现，如刻板印象和有偏见的答案，引发了关于LLM在现实应用中的伦理问题。

由于大语言模型的黑盒特性，其内部参数构成非常复杂和不透明，以及人类语言的灵活性和文化依赖性，识别和消除这些偏见变得异常困难。减轻LLM中的社会偏见对于确保AI在通信和决策中的公平性和包容性至关重要。

本文作者主要研究了这些偏见中的9大类：年龄歧视、外貌、职业与外貌、性别、制度、国籍、职业、种族、宗教。

3. 【系统二】原理是如何指导提示工程优化大语言模型效果？

在本篇论文里，作者对比了12中不同的提示词策略，12种提示词策略包括：COT、系统一、系统二、人类角色和机器角色，以及这些的组合。

提示工程策略：利用【慢思考】的双过程理论减少模型有害输出-AI.x社区图片

上图中的HP表示人类角色（Human Persona），MP表示机器角色（Machine Persona）。

提示工程策略：利用【慢思考】的双过程理论减少模型有害输出-AI.x社区图片

从上图可以看出来：

• 使用【系统二】+人类角色提示词策略的时候，减少的模型有害偏见输出是效果最好的。系统一的各种组合所带来的减少效果都不如系统二，这与我们的双系统理论是一致的。
• 另外，COT的提示策略，并没有有效减少偏见的产生。

提示工程策略：利用【慢思考】的双过程理论减少模型有害输出-AI.x社区图片

上图展示了不同模型、不同提示词策略、不同的偏见类型上，哪种提示工程策略表现最好。可以看出，当人类角色和系统二结合的时候，往往可以最大程度减少有害偏见的输出。

4. 思考

快思考慢思考的思维方式，可以仅仅使用提示工程就可以提高模型的表达效果，这与我们人类的思维方式极为相似。这是否正好暗示了，大语言模型这种方式，可能就是未来人类通向AGI的必经之路呢？大语言模型是否会在未来的AGI道路上替代人类大脑呢？

本文转载自大语言模型论文跟踪，作者： HuggingAGI

标签

赞

收藏

回复

举报

回复

相关推荐

生成式AI大模型之提示词工程实践

数字化助推器 • 2823浏览 • 0回复
好奇心驱使的自动红队测试：MIT学者教你如何让大模型避免产生仇恨或有害的输出

AIGC最前线 • 3942浏览 • 0回复
与机器对话：揭示提示工程的十个秘密

51CTO内容精选 • 1879浏览 • 0回复
大模型的提示工程：提示是对程序的搜索

lintoms • 2215浏览 • 0回复
《自然》科学期刊：多模态融合解码人类决策过程的新策略

xuxiangda • 3235浏览 • 0回复
RePrompt：提示词自动化优化策略

大语言模型论文跟踪 • 4087浏览 • 0回复
AI慢思考蒸馏进快思考，Llama2跃升至GPT-4水平，不写过程也能做对题

Crystalcxt • 1818浏览 • 0回复
什么是提示词工程(prompt engineering)？为什么需要提示词工程？

AI探索时代 • 5513浏览 • 0回复
简洁思考：输出长度对大型语言模型推理和成本的影响

sbf_2000 • 3260浏览 • 0回复
OpenAI前研究科学家开源面向未来的提示工程库 ell，重新定义提示工程

Syrupup • 2252浏览 • 0回复
关于大模型的使用——提示词工程

AI探索时代 • 2528浏览 • 0回复
提示工程中的代理技术：构建智能自主的AI系统

芝士AI吃鱼 • 1630浏览 • 0回复
OpenAI o1 模型到来后，谈谈提示词工程的未来

Baihai_IDP • 1725浏览 • 0回复
微软开源PromptWizard，摔碎了提示工程师的饭碗

PaperAgent • 2004浏览 • 0回复
大语言模型o1慢思考推理系统的破局之路：模仿、探索与自我提升的深度揭秘！

十一月雨_55 • 3262浏览 • 0回复
处女座 (Virgo)：基于文本指令微调的多模态慢思考推理系统

上堵吟1 • 1901浏览 • 0回复
面向开发人员的 ChatGPT 提示工程

sulu637 • 2013浏览 • 0回复
工具调用×大模型思考=超级智能体：ReAct 策略如何改变AI能力

九歌AI大模型 • 1311浏览 • 0回复
提示词工程——AI应用必不可少的技术

mb67d42021bb3f1 • 1277浏览 • 0回复

LV.3

这是一个AI学习、AI资讯类的公众号，我们将定期向您推荐最新讯息

觉得TA不错？点个关注精彩不错过

32

帖子

277

声望

2

粉丝

关注

最近发布

EDC²-RAG：利用聚类和压缩技术提升RAG准确性 8天前发布
MES-RAG：准确率提升 25%！ 2025-03-27 07:28:13发布

热门推荐

EDC²-RAG：利用聚类和压缩技术提升RAG准确性 0回复

王炸！MCP 架构设计深度剖析 & 使用 Spring AI + MCP 四步教你实现 Agent 智能体开发 0回复

实操干货！MCP 全解析，手把手教你基于 MCP 开发 Agent 0回复

从 Manus 到 DeepSearcher，2025年最值得关注的十大 Agent 智能体架构设计 0回复

Dify从入门到高阶系列二：手把手教学！超详细的Dify知识库配置全攻略 0回复

上一篇： CodeRAG-Bench：RAG遇到了Coder，哪个模型在RAG的加持下最会写代码？

下一篇：你想要的GraphRAG的内容都在这了

社区精华内容

目录

1. 思考的快与慢
2. 大模型的语言偏见
3. 【系统二】原理是如何指导提示工程优化大语言模型效果？
4. 思考

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载