你想过你是如何描述一个颜色的吗?最新研究表明人类使用离散符号来记录一个区域的颜色,在细化颜色过程中又增添其他信息。这背后有什么道理吗?Facebook用两个神经网络的实验现象告诉你。
尽管人类世界拥有数千种语言,但是使用词语来表示不同颜色的方式是非常一致的。
例如,许多语言有两个截然不同的单词表示红色和橙色,但没有一种语言有许多截然不同的常用单词表示橙色的各种调性(橘子的橙色和橘子的橙色)。
比如这么多口红色号,如果每一个都分配一个独特的颜色名称,那可能记忆起来会十分吃力。
语言学研究人员利用数学工具表明,颜色名称的这种一致性是因为人类优化语言是为了平衡精确交流的需要和最小化记忆需要。
如果使用额外的颜色词会增加复杂性,但不会显著改善人们之间的沟通能力。
Facebook 最近的AI研究表明,当两个人工神经网络被要求创造一种方式来互相交流他们看到的颜色时,AI也会像人一样平衡复杂性和准确性。
除此之外,Facebook研究团队还发现为了准确描述连续的颜色空间,只有使用离散的「颜色语言」才可以。
这就引出了一个关于如何交流的有趣的推测。是不是「离散」的符号语言更适合交流,而不是动物类的「连续」叫声?
模型实现过程
首先建立两个神经网络,一个负责说(speaker)和一个负责听(listener),并建立一个「沟通游戏」:在游戏的每一轮中,speaker从一个连续的颜色空间中看到一个颜色,然后输出一个符号(可以被认为是一个「单词」)。listener可能看到相同或不同的颜色,作为噪声输入。
listener接收到由speaker输出的单词,然后尝试输出正确的颜色片段。最初,说话人随机生成单词,等到训练结束时,每个单词都代表了颜色空间的一个连续部分。
研究团队多次重复这个实验,同时通过使目标颜色和噪声颜色的相似度发生变化,以此来改变任务的难度。这些变化产生了许多不同的颜色命名「词汇表」。
在训练结束时,研究人员分析了这些词汇,发现AI生成的的颜色词与人类语言的性质相似。此外,这两种类型的语言都接近于正式定义复杂性和准确性之间可能的最佳平衡集合的边界(图中的黑线)。
在后续实验中,研究人员发现,至关重要的是,当允许神经网络使用连续的符号而不是离散的符号进行交流时,复杂性和准确性之间的最佳平衡就不复存在了。
两个神经网络虽然仍然可以通信,但是他们的交流效率变得很低。
语言也许是人类最独特的特征,我们在日常中经常使用,但却不了解它。
Facebook的研究表明,先进的人工智能模型,不仅对实际应用有用,而且还可以作为实验工具,回答有关人类语言(以及一般认知)的科学问题。