别缴“对齐税”了，未审查/对齐的模型更受欢迎！用户：纯粹版比受限版有用！原创

51CTO技术栈

发布于 2024-8-6 12:49

浏览

0收藏

编辑 | 言征

出品 | 51CTO技术栈（微信号：blog51cto）

1.未经对齐的模型很重要

审查模型的主要缺点之一是所谓的“对齐税”。这是指当模型被过度调整以符合特定的道德准则时，性能会下降。

但缺点远不只是性能，经过了几番教训后，Nidum.AI 联合创始人Arjun Reddy认为：“未经审查的模型没有任何人为的偏见，当你在LLM的基础上构建产品时，使用无偏见的模型非常重要。”（即，对齐/审查≈新的偏见）

Reddy进一步提到，由于偏见，该公司避免使用Llama，而是使用Dolphin Llama。这表明了为什么无偏见的LLM对于在LLM的基础上构建产品很重要。

一位名为hardmaru的Reddit用户观察到，在引入额外限制后，ChatGPT的响应质量有所下降。最终，在一些测试中，未经审查的LLM比对齐的模型表现更好。

别缴“对齐税”了，未审查/对齐的模型更受欢迎！用户：纯粹版比受限版有用！-AI.x社区图片

另一位在Reddit上被称为BThunderW的用户提到，越狱版的ChatGPT-3.5比受限版本产生了更多信息，这表明与对齐的模型相比，你可以从未经审查的模型中挤出多少。

别缴“对齐税”了，未审查/对齐的模型更受欢迎！用户：纯粹版比受限版有用！-AI.x社区图片

2.你可以使用对齐的模型，但是...

当然，你可以训练一个对齐的模型（比如Meta的Llama），但使用这种被审核禁锢过、带有biasness的模型是相当困难的，最终会尝到苦头。 Reddy提到，使用无人为偏见的LLM就像使用空白画布，可以很容易地根据特定需求训练LLM。

每个主流模式都试图保持一致，对齐以促进平等。当然，促进平等并没有错，但对于LLM来说，它直接影响了产出。例如，几个月前，Gemini试图成为一个觉醒的人工智能模型，但结果大家看到了，适得其反，翻车后惨淡收场。

有偏见的人工智能系统可能会导致歧视性做法，例如基于种族或性别偏见拒绝贷款。这不仅影响个人，也破坏了人们对人工智能技术的信任。

DataRobot的一份报告强调，42%的使用人工智能的组织非常担心偏见的人工智能系统造成的声誉损害。

LLM，如OpenAI的GPT-3.5和Meta的Llama 2，是在庞大的数据集上训练的，这些数据集也反映了社会中存在的偏见。这些偏见可能以有害的方式表现出来，强化刻板印象，使歧视永久化。

例如，联合国教科文组织委托进行的一项研究发现，LLM表现出明显的性别偏见，将女性名字与“家庭”和“孩子”等传统角色联系起来。相比之下，男性名字与“职业”和“管理”有关。

3.因为纯粹，所以盛行

用户比以往任何时候都更喜欢未经审查的型号。Sakana AI的联合创始人之一David Ha在X上提到，WizardLM-13B-Uncensored已成为他最喜欢的开源模型。

如果你正在寻找一个没有任何强制“对齐”或“道德化”审查的聊天LLM，我推荐今天刚刚发布的“WizardLM-13B-Uncensored”。

整个上午都在玩它。到目前为止，这是我最喜欢的开源聊天模式。

加州大学公共卫生学院蛋白质研究中心教授Lars Juhl Jensen赞扬了X上未经审查的LLM的数据是如何未经过滤的。“要听到真相，可以问一个孩子、一个酒鬼或一个未受审查的人，”他补充道。

虽然像Reddy这样的企业家已经在利用未经审查的LLM并在社区中越来越受欢迎，但可以肯定地说，我们可能很快就会看到大规模平台上采用未受审查的LLMs。

本文转载自51CTO技术栈，作者：言征

©著作权归作者所有，如需转载，请注明出处，否则将追究法律责任

标签

模型

LLMs

LLM

相关推荐

聊一聊生成式视角下的实体对齐

mb5f8eba9bdb0af • 1795浏览 • 0回复
“音乐版Sora”首批演示泄露，网友：比写《宫保鸡丁》的Suno好10倍

Crystalcxt • 1473浏览 • 0回复
“音乐版Sora”服务器挤爆！功能比Suno丰富还能生成脱口秀，每人每月1200首免费畅玩

Crystalcxt • 1250浏览 • 0回复
这款Linux发行版发起AI禁令！生成代码质量堪忧！阿里也被大模型幻觉愚弄了！网友：人比生产力更重要！

51CTO技术栈 • 1029浏览 • 0回复
英伟达开源大模型对齐框架—NeMo-Aligner

Aceryt • 1347浏览 • 0回复
在对齐 AI 时，为什么在线方法总是优于离线方法？

轻薄滴假象 • 804浏览 • 0回复
比Transformer更快更省，Mamba终于卷到网络领域了

arnoldzhw • 3867浏览 • 0回复
Flames 安全评测基准：大语言模型的对齐效果如何？

恋恋青鸟 • 1804浏览 • 0回复
ICML 2024：AI对齐与可变和可影响奖励函数

AIGC最前线 • 1057浏览 • 0回复
数据合成方法-让模型自己说出用了哪些指令对齐数据

NLP工作站 • 2075浏览 • 0回复
ICML 2024 Spotlight | 在解码中重新对齐，让语言模型更少幻觉、更符合人类偏好

轻薄滴假象 • 1362浏览 • 0回复
数据合成方法-让模型自己说出用了哪些指令对齐数据

NLP工作站 • 1233浏览 • 0回复
OpenAI发布最新大模型安全对齐奖励方法——RBR

Aceryt • 1025浏览 • 0回复
阿里「轨迹可控版Sora」，告别「抽卡」，让视频生成更符合物理规律

轻薄滴假象 • 977浏览 • 0回复
为什么AI内容检测器在2024年如此受欢迎？

51CTO内容精选 • 743浏览 • 0回复
LightRAG开源了！轻巧、强大，GraphRAG的进化版

老蛀虫 • 1169浏览 • 0回复
Kimi 我的神，它终于更新了！这个探索版，有点牛！

wsp_ping • 1149浏览 • 0回复
什么是多模态AI 如何融合和对齐？

数字化助推器 • 1744浏览 • 0回复
LLM解决时间序列问题之语言模型+时序模型的对齐与融合建模

海因斯DK • 513浏览 • 0回复

51CTO技术栈

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

别缴“对齐税”了，未审查/对齐的模型更受欢迎！用户：纯粹版比受限版有用！原创

1.未经对齐的模型很重要

2.你可以使用对齐的模型，但是...

3.因为纯粹，所以盛行

目录

51CTO

51CTO博客

51CTO学堂

别缴“对齐税”了，未审查/对齐的模型更受欢迎！用户：纯粹版比受限版有用！ 原创

1.未经对齐的模型很重要

2.你可以使用对齐的模型，但是...

3.因为纯粹，所以盛行

目录

别缴“对齐税”了，未审查/对齐的模型更受欢迎！用户：纯粹版比受限版有用！原创