从心理语义学维度看人脸识别-人脸情绪识别算法

人们在日常生活中经常需要识别不同的面孔，其中既包括我们所熟悉的亲属、朋友、同事及知名人士等的面孔，也包括陌生人的面孔。人脸识别是一项非常复杂的任务，值得众多学科研究。俄罗斯心理语言学研究表明，视角、光色、情感、心理和言语行为等都影响人脸识别。此外，随着人的成长和衰老，头部、面部的结构和特征也会发生变化，皮肤、轮廓以及毛发颜色等都是人脸识别的参考因素。因此，在探讨人脸识别问题的过程中，学界需要不断创新研究方法，从不同角度挖掘人脸识别机制。

[[356837]]

多视角思考人脸识别机制

人脸识别的本质是复杂的，其研究是现代认知科学的关键构成要素之一。人工智能研究者和心理语言学家都试图了解如何从心理图像角度来探讨人脸识别问题。了解面部表情背后的心理运作机制有助于深入认识人类的大脑是如何处理、存储相关信息的。人类所拥有的识别陌生人脸的能力涉及许多复杂的问题，目前科学家所开发出的最好的人脸识别算法也还无法完全解答所有的相关问题。

因为，每个个体的面孔都是特殊的，承载着不同人物的心理、生理和社会背景等诸多层面的信息。人类的人脸识别能力可以让我们的大脑处理众多人脸识辨问题，远超现有各类机器对单个对象的识辨能力。可以说人脸识别意味着对面孔进行感知编码，并将此特定代码存储在人脑中，有时甚至无需参考姓名、身份、国籍等社团族群信息。

由于其所涉及的问题较为复杂多样，在人脸识别研究方面，不同领域的专家学者会使用不同的研究方法。心理学领域的学者研究人脸识别问题，主要从人脸感知所涉及的心理和神经生理机制视角来进行，如对参与者健康状况的认知研究、对新生儿及青少年的发育情况、神经心理和精神病学研究等，当然也涉及大脑成像技术、计算机模拟比较研究、鉴定物种同源物等实际应用领域。神经影像学相关技术让科学家们对人脑的结构、功能有了更深层次的了解。俄罗斯心理语言学界近年来的大量实证研究表明，人脸识别是其关注的焦点问题。

有关学者进行了许多尝试，利用心理学、神经学数据来修改、优化自动面部识别系统。近年来，在俄罗斯普通心理学、社会心理学、心理生理学、心理语言学和临床心理学等领域，人脸识别研究得到了长足发展。信息学、神经科学、人类学、医学和美学等学科的学者也对这个问题表现出了很大的兴趣。

深度挖掘人脸识别的心理维度

人的面部和表情特征等与主体的性格、身份、自我意识直接相关，可传递复杂的个体情感和社会文化特征。在人类的大脑内部有专门负责人脸识别的区域，只在进行人脸识别时才会被激活。视觉研究人员和心理学家都试图揭示出这种特殊的视觉工作机制，以了解应该如何创建科学的人脸识别系统。而掌握和理解面部识别机制，提高人工智能的面部识别质量，也是人工智能研究人员所关注的问题，因此，心理学家在此领域所获得的研究数据，经常会被应用到人工智能研究者的工作中。

从心理学角度看，人脸识别是人在感知事物时为特殊对象创建心理图像，然后在处理信息时将其替换为另一对象物的过程。因此，这种心理图像是客观世界的反映。学界普遍称之为“心理意向”，将其视为准感知体验。它一般在没有外部刺激的情况下发生，在一定程度上起到了心理表征作用。心理学研究者早已对视觉图像的思维属性有所涉猎，认为心理或大脑中存在的图片形式表征是由心理图像引起的。通常图像体验与主体过去的真实感知体验相呼应。

重视人脸识别语义微分实验

人类在交际过程中主要通过观察对话者的脸部特征信息，来评估其性格和情绪。知觉主体将对话者视为一个独立统一体，窥探情绪符号和个人特征。此外，在交流过程中，交际各方会不断透过面部表情等读取人的内心世界。因此，一些研究人员将其与文字进行比较。当交际参与者“阅读”彼此的脸时，我们对人的心理印象会发生变化。人在观察到他人的面部特征信息后对其看法可能会发生根本改变。实际上，一个物理对象替代另一个物理对象或演变成为某事物时，人脑中会产生相应的符号交替。

人脸也是一种物理对象，可以表现出个体的内部心理活动。交际过程中，个体信息的主要来源是观察。对他人心理肖像及情绪感知的判断，不仅涉及观察者所看到的对话者的面部特征和结构，还涉及主体智力、情感和意志等因素。因此，面部可以被认为是由不同的“生理层”组成的多维、多层次结构实体。人脸的状态反映了特定情况下人的情绪状态，但也存在影响脸部稳定的因素，如岁月流逝造成的变形、褶皱等。

俄罗斯心理语言学界进行了一系列实验来探寻面部感知涉及的心理语义机制。这种人脸识别的实验实质是语义微分实验的变体。实验受试者往往被限定在某一社团群体中，男女比例大致相等。所有受访者均来自特定国家，其人数足以使用语义微分法，一般使用人的脸部图像作为实验材料。研究人员使用从互联网上搜集到的真实人物面部照片(受试者一般不认识这些人物)，对其进行编辑，去掉除头部图像以外的所有部分;同时另外选取现实生活中存在的某个社会团体的典型代表形象。

实验的受试者一般都是同一母语承载者，在看到、感知、记忆人像后，他们会被要求填写表格以评估心理语义等级，一般是从-3到3。其中负数表示负面特征，正数表示正面特征。具体来讲，如果受试者认为图片中的人是“邪恶的”就用负数，如果想表示“他是好人”则用正数，而0表示不持有心理语义等级或看不出其面部折射的心理语义特征，也就是说0可以表示“非善非恶”。通过这种由负到正的递归可以建构受试者的心理语义等级，这就是人脸识别过程中语义刻度微分的缩影。

实验后研究人员会使用数据分析方法和统计软件处理从受访者处获得的数据。这种方法起源于心理语言学先驱、美国心理学家查尔斯·埃杰顿·奥斯古德的语义微分研究，多用于测量词义。它以双极形容词的通用性和简单性特征为基础，在俄罗斯心理语言学界颇受欢迎。

当然，感知图像和记忆图像之间存在差异。一部分受试者收到图片，并被要求在填写问卷的同时仍要保留图片;另一部分受试者则被要求审视给定图片1分钟，然后将图片上交，凭借记忆回答问题。结果证明，人的心理图像特征因其理解方式而异。人的面部视觉特征本身具有阐释力，可刺激形成心理图像。受试者不仅会判断所看到的人脸外观，也会根据外貌来描绘人物的性格。这说明人类的大脑不仅可以准确存储个体图像特征，还可处理心理和外表特征，优化存储并提取此类信息。

综上所述，笔者认为，从包括心理语义学的跨学科的视角，开展综合性的广泛研究，将有助于人脸识别研究的发展。