人工智能检测器工作原理综述-51CTO.COM

译者 | 刘涛

审校 | 重楼

您可能已经使用过一些AI写作检测器，但是现在您想知道AI检测是如何工作的，对么?我不是AI研究专家。但是，我可以从数据科学的角度来解释这个问题。

我将讲述：

什么是AI检测
在训练这些模型时，需要用到哪些技术
谁需要使用它们
其他重要的常见问题

什么是AI检测？

AI检测是利用复杂的机器学习和自然语言处理模型，实现对人工文本与机器文本的区分。它包括使用人工智能检测软件，该软件在已建立的文本库中进行训练，从而开发预测算法，这种算法能够从新的测试材料中识别出模式。然后，您会获得一个概率分值，用于判断该被评估的材料是通过人工创建还是自动创建的。

为什么AI文本检测很重要？

人工智能文本检测对于确保信息的可靠性非常重要，在搜索引擎优化(SEO)、学术界和法律领域也能发挥关键作用。

AI内容生成器无疑很有用，而且在竞争中必不可少。但它们同样也是出了名的不可靠。因此，无论是谷歌，还是学校，以及客户，都想要确定内容，您不能不加审核就把原创内容发出去。

您能想象如果人们被允许:

不经事实核实就写有关金钱和生活的话题（YMYL）
发表的期刊文章中“同行评议”这一术语不再具有任何价值
提供通用的AI智能生成的法律建议

信任将不复存在。

这也是为什么您要用到这些工具的原因，因为在大部分时间里，人们并不知道它们之间的区别。

AI文本检测是如何工作的

我们再深入看下这些工具有那些不同的工作方式。

但这里有两个主要概念：

语言分析：检查句子结构以寻找语义或重复。
对比分析：与训练数据集进行比较，寻找与先前识别的实例的相似性。

这些是训练模型以使用上述两个概念来检测 AI 内容时使用的更常见的一些技术。

分类器：AI检测的分类帽

分类器有点像哈利波特中的分类帽，将数据分到预先确定的类中。

使用机器或深度学习模型，这些分类器检查各种特征，如用词、语法、风格和语气，以区分AI生成的文本和人工书写的文本。

想象一个散点图，其中每个数据点都是一个文本条目，这些特征将形成坐标轴。

那么，假设我们有两个类：

AI文本
人工文本

您所测试的任何文本都将属于这两个集群中的一个。下面是我制作的图形，方便您看到。

分类器的工作是形成一个边界来分隔这两个类。

根据使用的分类器模型，一些示例包括：

逻辑回归
决策树
随机森林
支持向量机（SVM）
K-最近邻(KNN)

注意：您不需要知道它们是什么，只需知道它们是以不同方式对数据进行排序的算法。

该边界可能是一条线、曲线或其他一些随机形状。

当您测试一个新文本（数据点）时，分类器会简单地将它们放在这些类中的任何一个中。

嵌入：单词的DNA

如果每个单词都有自己的秘密代码，就像我们在看一些惊心动魄的间谍电影一样，会怎么样？

在人工智能（AI）和语言理解方面，这正是发生的情况。

这些代码被称为嵌入式编码（Embeddings）。本质上，它们是单词唯一的DNA。通过捕捉每个术语背后的核心含义，并理解每个术语在上下文中如何与其他术语相关，这些嵌入式编码形成了一个语义网络。

这是通过将每个单词表示为N维空间中的向量并运行一些高级计算来实现的。它可以是2D、3D或302934809D。

注意：向量是一个同时具有大小和方向的量。但是对于这个解释，只需把它当作是图表上的坐标即可。

但是为什么是向量呢？

因为计算机无法理解单词。令人震惊，但这是现实。因此，必须通过向量化将单词首先转换为数字。以下是一个表格示例：

注意：向量化的文本数值可以具有广泛的取值范围，不仅仅是二进制的1或0。我只是为了更容易地可视化而做出了这样的表格。

这是另一个在二维图形上绘制向量的例子：

我确信您能够想象三维物体的外观，但请不要让我描绘四维物体，因为没人知道会是什么样。然而，通过数学算法，计算机可以使用数学魔法来呈现出四维物体。

这正是谷歌运作的方式。您在搜索栏中输入内容，却能获得与其惊人相关的结果，这是如何实现的呢？

但是，如何区分人工生成的文本与使用 AI 生成的文本呢？

我们将所有文本转换为它们各自的嵌入式向量，然后将它们输入机器学习模型进行训练。

模型即使不知道任何实际的措辞，也会形成所有这些连接，并找出与 AI 生成文本常见的所有“代码”。

但是，如何区分人工生成的文本与使用 AI 生成的文本呢？

我们将所有文本转换为它们各自的嵌入式向量，然后将它们输入机器学习模型进行训练。

模型即使不知道任何实际的措辞，也会形成所有这些连接，并找出与 AI 生成文本常见的所有“代码”。

困惑度（Perplexity）：AI 生成文本的试金石

困惑度是一个衡量概率分布或语言模型能够预测样本精度的指标。

在 AI 生成内容检测的背景下，困惑度作为衡量 AI 生成文本的试金石。困惑度越低，文本由 AI 生成的概率越大。

这就像侦探使用指纹匹配来识别嫌疑人一样。

以下的表格对此进行了详解：

困惑度等级	解释	举例
低（接近1）	语言模型对其预测非常自信。这就像一个博览群书的书评家准确地预测小说中的下一个单词。	在医学文献上训练的语言模型来预测医学教科书中术语。
中	语言模型对其预测有些自信。这就像一个偶然的读者对小说中的下一个单词做出一些准确和不准确的预测。	在普通英语文学中训练的语言模型来预测科幻小说中术语。
高	语言模型对其预测没有信心。这就像初学者试图预测复杂哲学文本中的下一个单词。	在体育文章上训练的语言模型来预测法律文件中的术语。

爆发度（Burstiness）：AI 生成文本的标志性特征

爆发度是由 AI 模型生成的句子长度和复杂程度的变化。

想象一下您在一家餐厅里，现场充斥着各种对话，有些大声喧哗，有些安静私密。与这些对话相似，由人写出的句子有很多细微差别，因此常常让人难以预料。

但是，AI 模型产生的结果通常在长度和复杂性上更趋于一致，而人类写作则表现出更多的多样性或者说“爆发性”。如果 AI检测器注意到句子的长度、结构和节奏的细微差异，它们也会将文本标记为潜在的 AI生成文本。

以下表格中的一些例子：

文本类型	举例	爆发度
人工生成	“我喜欢去公园。新鲜的空气、鸟儿的鸣叫声和孩子们玩耍的景象总是让我精神振奋。这是一个我可以放松和休息的地方，远离城市生活的喧嚣。”	高（句子长度和复杂性的变化）
AI生成	“我喜欢这个公园。它很漂亮。空气新鲜且有很多鸟。孩子们在那里玩耍。它让人感到很放松。”	低（句子长度和复杂程度相似）

AI 检测的准确性如何？

我会直截了当地告诉您，即使分数为100%，它也永远不会是100%准确的。

那只是模型的置信度。

当 AI 检测器分析文本时，它通常会基于所给材料的显著特征计算每种分类的分数或概率，而不仅仅由人类编写或 AI 生成的内容之间的区别所决定。

例如，假设我们使用 AI 检测器对某些文本进行了分析，它为“AI”和“人类”分别给出了0.7和0.3的分数。

这些数字表示我们的检测器已经大致判断出，我们的材料属于同种类型和非同种类型的概率之比为7:3（70%对30%）。

因此，最终决定是否适用某种类型变得非常容易。

与其把事物划分为“人类”与“AI”，倒不如给它们分配概率度量，这样才能更深入地了解预测的可信度。除了把文字归类成两类外，还需要考虑许多因素来决定文字是由人写的还是由AI写的。

如果所使用的评估方法涉及计算概率得分，则这些得分之间的差距程度可能会影响 AI 模型对预测的确定性。

例如，如果分配给 AI 生成的作品和人工完成的作品的分数之间没有太大的差异（例如得分分别为0.51和0.49），那么检测它们的来源将比它们的概率差距很大的情况更具挑战性（例如获得0.9和0.1的概率差距）。

因此，尽管产生二进制结果，但这个决定包括详细的分析，很大程度上依赖于概率得分之间的差异。

注意：您可能会看到其他文章讨论 AI 检测器如何通过计算每个单词成为下一个预测单词或温度参数（temperature：指一种用于控制生成文本的随机性和创造性的参数，通常使用softmax函数实现）的概率值来工作。这是指 AI 作者的工作方式，而不是 AI 检测器。那些文章完全搞错了搜索意图。

这是一个相当长的段落，但这是我能够最好地解释它的方式。

AI内容检测的前景如何？

随着我们见证人工智能的进一步发展，机器生成内容的复杂程度也在不断增加，这给有效检测此类内容带来了独特的挑战。因此，所有参与其开发过程的人都需要努力创建更加先进和准确的工具，以跟上应对这种复杂性的能力。

准确检测由AI生成的虚假信息对于维护在线信息的可信度至关重要，这将是有效应对这些威胁的唯一途径。

此外，我们需要特别关注与隐私侵犯、违背意愿和潜在的滥用这种强大技术相关的道德考虑。

谁使用AI检测？

以下是一些最受益于使用AI检测的群体：

学校：防止学生滥用AI写作软件。

企业：摆脱垃圾邮件、虚假评论或虚假新闻。

执法机构：消除冒充、身份欺诈和网络欺凌等犯罪活动。

社交媒体平台：清除散布和鼓吹不实信息的机器人和虚假账号。

媒体和新闻组织：识别虚假新闻和宣传，甚至替换过度依赖AI的作家。

政府组织：根除虚假信息的运动和宣传。

常见问题

AI内容检测工具是否存在限制或缺陷？

AI内容检测工具确实存在一些限制和缺陷。随着人工智能产生的内容不断增多，人们越来越难分辨出这些文字是否是由人类产生的，因此它们的准确性并不总是完美的。

此外，AI检测器可能难以识别那些被特意设计成不可被检测出的AI生成内容。未来AI生成和检测技术的发展将共同决定AI检测的局限性程度。

为什么要在SEO中使用AI检测？

尽管谷歌在最近的更新中表示，如果AI生成的内容有价值，就不再会被视为垃圾内容，但关于谷歌是否能够检测到AI生成的内容，仍然有争议。您永远无法真正知道谷歌何时或是否会改变立场而对您进行惩罚。因此，大多数SEO（搜索引擎优化）仍会使用AI检测来确保安全。

AI检测的准确性如何？

AI检测只能准确判断所检测文本与其训练数据的相似程度。它提供的是置信度评分，而不是简单的是或否的结果。

结论

我已经介绍了您需要了解的有关AI检测的所有内容。从为什么需要它，训练这样一个模型背后的真正过程，到它的准确性以及它的前景。

我希望这可以帮助您更好地了解这个话题。

译者介绍

刘涛，51CTO社区编辑，某大型央企系统上线检测管控负责人。

原文标题：A Detailed Overview of How AI Detectors Work，作者：Brendan Aw

人工智能检测器工作原理综述​