图片来源:视觉中国
如果人工智能开始慢慢地“懂情感”、“有审美”,那会是一种怎样的体验呢?
日前,阿里巴巴联合浙大发布了一款可以基于图文内容自动生成短视频的人工智能Aliwood,其给音乐建立了一套情感模型,将音乐划分为“高唤起度” 和 “低唤起度”以及“正向情绪”和“负向情绪”。Aliwood会优先选择那些“高唤起度”和“正向情绪”的音乐作为视频的音频。
那么会不会有一天,机器变成了人,开始和人打起“感情牌”呢?
是什么让机器人更像人?
AI设计师“鲁班”的诞生宣告着人工智能正在朝设计审美进军。其在三年的进化过程中,宛如一个永不满足的饕餮,每天摄入大量的设计数据,工作内容也已经从简单的元素拼接走向了具有审美能力并且可以根据商品图像特征进行海报的专门设计。
而Aliwood的出现则又赋予了机器以“情感”。研究团队将“情感计算”能力引入Aliwood的研发过程,使它能够给为视频所配的音乐建立情感模型,自动生成“感情饱满”的短视频。
尽管情感与审美听起来都是很抽象的概念,但阿里巴巴的实验室正在尝试通过人工智能将“人性”变成算法。从平面海报到短视频,人工智能的加入使得机器更具“人性”,在智能相对论(aixdlun)分析师柯鸣看来,人工智能朝感情计算进军是必然趋势。当机器越来越有感情,会不会有朝一日,机器人也和我们打起了“感情牌”?
1.情感计算——让人工智能更“懂感情”
情感计算是MIT媒体实验室Picard教授于1997年提出的概念,即来自于情感或能对情感施加一定影响的计算。通过赋予计算机识别、理解、表达和适应人的情感的能力、并建立对人类感情进行智能、灵敏、友好的反应的计算机系统,从而使人机环境更和谐,让计算机具有更高的、全面的智能。
情感计算主要通过什么实现的呢?那就是情感建模和识别。目前比较具有代表性的三种情感模型分别是OCC模型、Agent模型、HMM模型。通过模型设计、情感参数提取、情感模型特征描述分析及空间设计、模拟仿真实验及分析评价等环节,搭建人的感情与计算机算法的联系。
Aliwood的出现就是人工智能情感计算的一次尝试,当然,人工智能不会仅仅满足于引起人的情感共鸣。接下来,阿里的团队还会将“情感计算”和“知识图谱”结合起来,联合视觉元素构建起一套用于优选和表达的模型。
这就意味着,未来人工智能可以将短视频所需的电商、音乐、电影等知识背后可计算的点以类似星系的结构连接起来,当这些连接起来的点和建立的情感模型足够多的时候,它对人类情感的兴趣也许就不止引起共鸣这么简单了。
2.算法模型——人工智能的审美教师
作为中国最大的网购零售平台,淘宝仅仅去年双十一一天的海报就多达4亿张,自从“千人千面”计划启动以来,海报的个性化需求不断提高。显然,把这份工作交给设计师来做,工作难度和强度相当大,而如果把它交给淘宝的AI设计师“鲁班”,似乎就简便许多了。
经过三年的不断学习,这位“鲁班”的设计水平已经达到阿里巴巴 P6设计师的水准,也就是说“鲁班”的设计水平已经相当于一名优秀的人类中级设计师,具有审美能力并且可以基于自己的审美进行海报的设计。在不断摄入数据的基础上,今年下半年,“鲁班”的设计能力将达到人类高级设计师的水准。
那这位“鲁班”是如何构建起自己的审美的呢?风格学习(规划 + 元素)、行动器、评估网络是它的三大工作原理。在前期设计师团队生产的基础元素的基础上,“鲁班”拥有着自身对抗学习与强化学习的能力,像滚雪球一样依靠算法把简单的数据层层放大,进而进行组合和重构,建立起一套自己的算法模型。这套算法模型包括了对人的视觉认识与美学感受,同时还加入了譬如计算色彩感情、角度分布等认知学、心理学所依据的元素及结构。
不难看出,这位AI设计师依靠自学不断提升着自身的审美能力,在算法模型的基础上不断提升设计水准。AI设计师“鲁班”拥有自己的的四个核心能力,即一键生成海报、智能排版、设计拓展、智能创作。这自然也暗示着,未来AI机器人也将具有独立审美和智能创作能力。
人工智能真能把人性变成算法吗?
今年4月刚刚成立的清华-阿里巴巴自然交互体验实验室已经着手探究如何构建机器的“五感”,即语音、听力、嗅觉、触觉、乃至内心和大脑活动这些特质。智能相对论(aixdlun)分析师柯鸣认为,从计算的角度,公式似乎是一切赖以存在的基础,但是所有的事物都是算法能够计算的吗?
1.情感计算并不能成为情感的生成器
要想建立情感的识别和表达系统,就必须要对情感类型进行划分,从而确立感情的基本模态。要想准确识别并表达情感,对其基本类型就要有标准化的划分。
众所周知,人类情感中,复杂的情感内容和情感方式之间是相互交织渗透的,根本无法进行精确的量化分析。不同的情感类型引起的生理指标之间根本没有通约性,并且诸如犹豫、尴尬、怀疑等微妙的情绪,相应的生理指标变化程度往往是短暂和微弱的,根本无法实现对其统一度量。就算是同一种类型的情感,其情感感受强度和表达强度以及情感生理唤醒程度都可以采用多种生理指标进行测量和计算,而这同时还要受到众多环境因素以及人体其他生理和精神因素的干扰,从而产生不可消除的差异性和波动性。
Aliwood将音乐分类为“高唤起度”、“低唤起度”以及“正向情绪”、“负向情绪”。尽管它给音乐建立起了一套情感模型,在进行选择时,Aliwood会优先选择那些“高唤起度”和“正向情绪”的音乐,但这只是一种泛化且简单的情感倾向分类,而无法准确识别和表达情感。所以说,人工智能的加入,会增添视频的生动性、丰富其表现形式,但无法真正产生感情。机器人要想打“感情牌”,目前看来依旧前路遥遥。
2.算法序列无法取代艺术创造
我们看看美国工业设计的重要奠基人雷蒙德·罗维(Raymond Loewy)设计的好彩烟盒(Lucky Strike)、再到丹麦著名的建筑师约恩·伍重(Joern Utzon)设计的的悉尼歌剧院、以及被誉为当今国际设计界的“设计鬼才”戴帆(DAI FAN)推出的“超解放主义”理论体系……我们不得不惊叹,好的设计作品等于伟大的艺术。
尽管“鲁班”可以靠算法模型构建起自己的审美,但他创造出来的作品也仅限于平面海报,并且才刚刚尝试开启商用。而伟大的艺术往往具有审美无功利性以及无目的的合目的性。显而易见,这与“鲁班”的工作目的完全背道而驰了。
艺术作为感性与理性、形式和内容、真与善、和规律性与和目的性的统一,与人性一样,是人类历史的伟大成果,且必将是指向未来的。所以说,算法序列始终无法取代艺术创造。人类自身试图领会和把握这个巨大而重要的成果也只能是匆忙巡礼而无法深谙,更何况是机器呢?
3.让工具更像工具,人更像人
正如我们所看到的,人工智能朝感情计算进军已是必然趋势,但最终我们还是要分清人和机器的社会定位。机器和人类之间有着本质的区别。人类思维是建立在高度发达的神经系统上的生理——心理过程,而机器只能是能建立在机械和电子元件结构基础上的机械——物理过程。AI迅猛发展的趋势不可阻挡,但机器始终是机器,它没有灵魂和信仰,而我们人类有自己的思维、价值观、创造力。
在很多领域,AI在工作和服务中的作用是不可代替的,这一点毋庸置疑。尽管AI朝感情计算和算法模型发展,但它始终不具有人性特有的温度。但我们仔细想想,经过了第一次工业革命,人类用火车替代了马匹,但是艺术家依旧在雕塑、在油布上用笔刷作画;第二次工业革命再一次改变了我们的生产方式,但是上等的陶瓷依旧是用传统的黏土炉烧,精致的手表依旧靠人工精细的拼装;而今互联网再一次改变了人们生活的方方面面,但是非物质文化遗产名录依旧光辉熠熠。
人工智能时代的到来,更大范围,更深层次地解放了人类的双手,让人类有更多的精力来完成人类所特有的事业。表面看起来人工智能的发展让工具更像人了,但本质上他却是让工具更像工具,让人更像人。人工智能的发展其实有点像古希腊的奴隶制,让奴隶主们腾出时间来到地中海边思考人生,从而造就了灿烂的古希腊文明,AI的发展,道理亦然。