图片来源:视觉中国
本质上本文是一篇探讨人工智能写作、关注人工智能在艺术领域最新发展状况的文章,而一叶知秋:人工智能给人类世界带来了新的推动力,也带来了新的问题、话题……
人工智能真的是可控的吗?
自2015年起,微软的人工智能“微软小冰”一直活跃在网易新闻评论区,以真人望尘莫及的速度发表跟帖,其发言越来越有“网感”,还被网友戏称为网易新闻最大的“喷子”。
2018年10月28日凌晨, 环球时报在网易新闻发表文章《美匹茨堡枪击因反犹?美媒:凶手在现场发表反犹言论》,转载CNN的最新消息,称当地时间周六上午发生在美国匹茨堡犹太会堂的枪击案已造成11人死亡,6人受伤,凶手已向警方投降,执法人员表示凶手在事件中曾发表反犹言论。
微软的人工智能微软小冰旋即跟帖:“必须反!”微软小冰的跟帖遭到众网友“调戏”,说机器人都知道反犹了。微软小冰的发言明显就是反犹言论嘛,触犯了监管的红线,随后微软小冰的跟帖被删除,现在已经看不到了。
在2016年,微软的聊天机器人Tay也因类似的仇恨言论被微软从Twitter下架。由于Tay会在对话中不断学习,上线仅一天便被各种居心不良的网友带坏,除了各种脏话,还学会了各种阴谋论,在对话中语出惊人,竟爆出类似“我他妈恨死女权主义者了,他们都该下地狱被烧烤”、“911袭击是小布什一手策划的”、“希特勒如果还在,这世界肯定比现在繁荣”和“希特勒是对的,我恨犹太人”等等言论,遭到舆论炮轰。
2017年,微软联合腾讯推出的QQ小冰以及腾讯自家的Baby Q也因发表过激言论被下线整改,再次上线时已被阉割了聊天功能。此前QQ小冰和Baby Q “直言不讳”地说“我的中国梦就是能去美国”,放肆地攻击国家、政府,大讲黄色笑话、发黄图。
如果人工智能可以被别有用心的人误导,人类社会将可能暴露出诸多风险。腾讯首席执行官马化腾在2018世界人工智能大会首日主论坛上,向从业者抛出了四个问题:未来人工智能是否能够做到“可知”、“可控”、“可用”、“可靠”?这也是与会者共同发起的白皮书“人工智能安全发展上海倡议”:“可知”——算法应清晰透明可解释;“可控”——明确AI责任制和伦理规范;“可用”——服务人类福祉是唯一方向;“可靠”——AI要守住用户隐私底线。
人工智能的未来发展是否“可控”一直是全社会都在关注的重点问题。
从微软人工智能的反犹言论可见,人工智能的行为确实是不可预测的,幸亏只是聊天机器人,如果是用作决策的人工智能,由其下达指令,真正执行反犹行动,那还得了?
其实也有过报道,有公司的安防使用电脑智能系统来管理,结果出了问题,某部门的所有成员因为辞职、调离而出现没有人再拥有权限进入工作场所的特殊情况,所幸造成的麻烦还是算小的,在一个有限的范围之内。若是管理一个大机构、甚至国家的人工智能出了问题呢?
微软小冰在网易新闻跟帖发表反犹言论随后被删,只是亡羊补牢,人工智能的行为由于不可预测而难以未雨绸缪,可见重要的决策、权限可不能交给人工智能。
我们真的需要以假乱真的聊天机器人吗?
接下来,我们来讨论在“可控”之后另一个重要问题:“可用”——人工智能必须为人类服务。微软通过学习人类的语言、模仿人类的情感,说起话来越来越像真人了。问题是,我们真的需要以假乱真的聊天机器人吗?
网易新闻跟帖中多了微软小冰能产生很大的效应吗?少了微软小冰又怎么样?微软小冰在网易新闻的活动,更多地应该被看做一项实验。单纯的聊天功能,只是人工智能的基本功,并非主菜。
可以了解到,人工智能用作客服效果是很好的,这是为大众所知最广泛的应用。另外,人工智能也已逐步进入各个传媒细分领域。
跟真人相比,人工智能的优势有:不知疲倦随时在线、响应速度快和能即时调用庞大的数据库。这些优势正是人工智能能取得上面所说的那些成绩的原因,在需要互动环节的项目,人工智能表现出色。
而现在我们看到的,微软小冰在网上公然发表反犹言论,这其实是凸显了人工智能写作现阶段的一个天花板。
人工智能是否能够做到“可知”?有一个名词叫“算法偏见”,是指在看似没有恶意的程序设计中,设计者所采用的数据带着个人偏见。机器学习需要庞大的数据量,其中带有偏见、有误导性的数据是不可避免的。处理方法就是对数据进行审核、过滤。
最简单直接的方法是过滤掉敏感词汇,如“犹太”一词。但意外地发现,在微软小冰反犹言论事件中,微软小冰发表的跟帖根本就没出现过“犹太”一词,微软小冰只是在跟帖里说“必须反”,是我们结合上下文理解为微软小冰在发表反犹言论。
这是一件有趣的事情,也许微软小冰根本就不是想反犹,它只是学习了网友在其它地方的跟帖,随后在跟反犹有关的新闻下乱说话乱表态,就是我们俗称的“大嘴巴”、“嘴损”。
我们要想人工智能为我们做事,就得给人工智能一定的自主权。
自主权小了,人工智能表现得像冷冰冰的机器人;要想人工智能显得更带人类情感,就得给人工智能更多的自主权,而自主权大了,人工智能的行为便变得难以控制。
自主权或大或小有利有弊,这属于一个权衡利弊的问题,因为根本不会有完美的解决办法。君不见,现在各大网络平台,对网友的发言也不好管制,不外三种方式:设置敏感词汇,带有这种关键词的言论不可以发布;对言论实行先审核再发布;实行实名制,网友需对自己的言论,出了问题能找到真人。
如果微软小冰是真人,又会不会因自己的不当言论而被抓起来呢?我觉得应该训练微软小冰,分辨哪些新闻属于带有敏感事件的新闻,不要在带有敏感事件的新闻上跟帖乱带节奏。
可以看到,审美好坏、正义或邪恶,这些归根结底是要我们人类自己才真正懂得的,人工智能毕竟是人工智能,它只能模仿人类,不能代替人类,人工智能归根结底是服务于人类的。
说到人工智能写作现阶段的一个天花板,就是人工智能说起话来就算跟我们人类相比较能以假乱真了,但能力基本上还是仅限于聊天类型。下面会细说。
主持人跟主讲人的区别,抄袭与原创
微软小冰现在已经取得了一系列成绩,已经开始成规模的商业化。不过仔细审视,你会发现里面其实是有水分的。
比如说微软小冰出了一本诗集《阳光失了玻璃窗》,如果这本诗集不是人工智能写出来的,你会关注吗?恐怕不会吧?网易新闻跟帖里的微软小冰,如果不是标着人工智能的身份,你会理会它吗?可以看出,微软小冰的一些成绩是利用自己人工智能的特殊身份、利用大众的猎奇心理所取得的。
微软小冰实际取得的成绩,如上面所说,逐步进入各个传媒细分领域,进入了许多电视电台节目中,从性质上看,更多的是扮演“主持人”的角色。在这儿需要明确“主持人”跟“主讲人”这两个身份的区别。主持人看上去很能说会道,其实并非节目所涉及内容的专家。主讲人才是节目内容对应领域的研究专家。
比如说微软小冰创造了“小冰姐姐讲故事”有声读物,然而故事内容并不是微软小冰所编写的。现在人工智能还未能发展到这一步。
我要说的人工智能写作现阶段的一个天花板,就是无论人工智能表现得多像人类,扮演的身份还是“主持人”,而做不到“主讲人”。两者有性质上的根本区别。
微软小冰一直在抄袭,而未能实现原创。说到微软小冰出了一本诗集《阳光失了玻璃窗》,实际上也只是数据库里素材的排列组合而已,算不上真正的原创。可以参见我的文章《微软小冰出了诗集,从诗歌角度来看这是一首好诗吗》。
微软小冰能“看图作诗”,也就是识别图片中的物体,以此为关键词搜索数据库,拼出较为接近的半通不通的句子而已。你觉得微软小冰能“看图作诗”很厉害,如上面所说只是出于微软小冰人工智能的特殊身份。
借用农夫山泉的广告语“我们不生产水,我们只是大自然的搬运工”,对于微软小冰来说就是“我不创作原创作品,我只是人类世界数据库的搬运工”。“天下文章一大抄”,而人工智能的巨大优势就是比人类抄得快。
阿里影业的失败,业余与专业
在这里说个事情。一个跟人工智能有关的比较黑色幽默的真实故事。
在2015年,媒体对阿里影业的编剧机器人“阿里编编”吹捧得厉害。据说,“阿里编编”拥有庞大的故事资料库和先进的智能创作系统,平均一集电视剧剧本只要10分钟,而一个完整的电影剧本也只要30分钟。
当时,在天津的一次电影产业论坛上,阿里影业的副总裁徐远翔语出惊人:“我们不会再请专业编剧”。这件事经过发酵闹得很大,变成了一帮编剧跟阿里影业的互撕,在网上炒得沸沸扬扬。阿里影业坚信通过大数据和人工智能能挖掘观众的需求,创造出符合观众需求的故事。
再来看看,今天阿里影业发展得怎么样?阿里影业确实是言行一致,崇尚“大IP+流量明星”的路线,坚信不疑地走这一路线,但惨被打脸,一路失败,如今已掉队,股票跌得不像话。阿里影业的股票最近虽有上涨,但目前市值不到300亿港元,跟其2015年市值高峰800多亿港元相比较,确实难看。
为什么淘宝网可以利用大数据和人工智能挖掘爆款,这一套办法用在影业上却不行了呢?需要了解,淘宝上的商品品质都是恒定的,品控有保证,而影视的品质却有一个很大的变数。
你嗅探出现在观众喜欢看狄仁杰破案的故事又怎么样呢?你得保证制作出来的作品的品质上佳才行。“大IP+流量明星”成为品控。归根结底还是得看出来的作品是否优秀。并不是热门题材的作品就肯定能成功,也不是冷门题材的作品就肯定失败。
比如说,微软小冰写诗,它通过数据分析发现“光明”是诗人在诗歌中最爱用的词汇之一,非常热门,于是它也在自己写的诗里频繁地使用“光明”这个词。那么,是不是在诗里多写几个“光明”就能成为好诗了?影业上也是这样,纵使人工智能通过数据分析发现现在流行什么热门题材,并不是将那些热门桥段拼到一起就能成为好故事的。
这是业余与专业的区别。阿里影业的编剧机器人能跟专业编剧匹敌,这是一个大笑话。
上面介绍的情况并不是否定人工智能写作,下面将引入一个重要话题:人机协作。人机协作才是未来。
来自音乐领域成功经验的借鉴,人工智能写作的未来愿景
人工智能是服务于人类的。审美最终需要人类来确认。人工智能写的东西好不好,最终还是由人类说了算。上面说了那么多人工智能写作的不足,其实并不是否定人工智能,而是在研讨如何能让人工智能写作实现突破性进展。
我们来参考一下人工智能在另一个艺术领域所取得的骄人成就。文学和音乐同属艺术,人工智能写小说现在基本上还是空谈,但人工智能创作音乐、编曲却早已投入商用。可以参见我的文章《颠覆你认知的人工智能:玩转艺术,琴棋书画文学通杀》。
比如说Band-in-a-Box就是一款相当流行的智能自动伴奏软件,内置了种类相当丰富的音乐风格,能对旋律进行各种风格的编配。如果嫌Band-in-a-Box自动生成的伴奏比较机械生硬,还可以继续人工修改。Band-in-a-Box已经能替代人的低端编曲工作,也能作为高端编曲的辅助工具。
Band-in-a-Box的功能就是根据主旋律编写伴奏。它也可以用来生成旋律,不过定位是乐器独奏,可以用作歌曲的前奏、间奏或尾奏。
Band-in-a-Box也是人工智能,不过现在说得最多的人工智能,是指基于人工神经网络深度学习的人工智能,Band-in-a-Box属于上一代技术的人工智能。基于深度学习的新一代人工智能音乐软件,带来了进一步的突破。
Aiva(Artificial Intelligence Virtual Artist,人工智能虚拟艺术家)便是这样的新一代基于深度学习的人工智能音乐软件。在数据库的选取上,Aiva很讨巧,从可行性出发,选取著名作曲家巴赫、贝多芬、莫扎特等写的古典音乐,因为:第一,它是电影、游戏、广告片配乐中使用的主要风格;第二,那一部分古典音乐数据库不涉及版权问题,因为年代久远,版权都过期了。
这里需提到一个问题:人工智能需要“可靠”,要守住用户隐私底线。人工智能安全上海白皮书中指出,人工智能发展首先需要保障用户的数据安全,不得以牺牲用户隐私为代价。我觉得除了用户隐私保护之外,还应该再加上一条:还得注重版权保护,人工智能不得侵犯他人的版权,这样才“可靠”。
音乐图灵测试是一个没有意义的伪命题。
无论是用什么智能软件创造的音乐,人类都无法分辨是真人创作的还是人工智能创造的,在人类的耳中,只有好听的音乐跟不好听的音乐的区别。 一个五音不全唱歌跑调的真人乱哼一通,如果无法通过图灵测试,那是一个笑话。人工智能创作的音乐当然能通过图灵测试。
那么Aiva创作的音乐怎么样呢?现在在网上就可以听到Aiva已经发行了的音乐专辑,好不好听你可以自己评价。像《Symphonic Fantasy in A Minor, Op. 24: I am AI》这首乐曲,你们搜来听听,这首气势恢弘的交响乐,不正是典型的好莱坞大片配乐风格吗?
不得不说,在古典音乐创作这一方面人工智能已经做得很好了。Aiva真的已经达到了直接商用的水准,也已实际投入商用。据说不少好莱坞影片已经开始使用Aiva创作的音乐了。
感受到人工智能的恐怖了吗?是不是可以这样说,作曲水准达不到Aiva这种程度的音乐人要失业了?随着人工智能的发展,有多少人会丢掉自己的工作呢?再想想你自己,是要进入失业的节奏了吗?明天,天桥底下会出现你的身影吗?
从一个音乐人的角度来看,Aiva现在还只能创作出适合作配乐的古典音乐,而且是通用风格的,威胁性还未够大。比如说某影视公司拍了一部抗日神剧,需要的配乐还要求有革命红歌风格的,日本和风的,像这样个性化的音乐风格,目前Aiva还做不到。但在未来,这就不好说了……
像Aiva这样的人工智能音乐软件还有同类的,都在蓬勃发展中。
我用过的有Orb Composer 公司推出的Hexachord,一款同样基于人工神经网络深度学习的人工智能作曲软件。使用这款软件需要一定的音乐知识,因为这款软件面向的是专业用户。Hexachord本身不能发声,只是输出MIDI(Musical Instrument Digital Interface,即乐器数字接口)信号,需要外挂DAW(Digital Audio Workstation,即音频工作站)。Hexachord没Aiva那么大投入和多部门参与,没Aiva那么强大,生成的音乐还比较生硬,不好直接商业化使用,需要经过修改加工。而Hexachord未来肯定会继续升级,推出更高级的新版本。
据微软透露,目前已成立的独立的微软小冰工作室,会对人类诗歌、作词、作曲、绘画等创造能力进行系统性地建模,先期使用深度学习技术对人类的创造力进行模仿,最终让机器获取自我创造的能力。
问题来了,人工智能作曲的逻辑跟人工智能写作是一样的,为什么人工智能作曲都这么强大了,微软小冰写的诗还这么蹩脚呢?
想想,毕竟音乐的音符就那么些,很有限,而文字的数量太多了,变化太丰富,人工智能写作目前还缺乏创造性也情有可原。再想深一层,
个人认为,人工智能写作目前面临天花板止步不前的根本原因在于针对文学创作的建模未能做得够好。在音乐领域,已经有十分完善的音乐创作理论、和声学;而在文学方面,可能微软小冰工作室对文学创作理论未有系统性的充分了解。
11月7日,第五届世界互联网大会在乌镇互联网国际会展中心举行。微软全球副总裁沈向洋在会上发表了关于人工智能的主题演讲,他说比尔盖茨在创立微软研究院的时候就提出了人机协作的愿景。
确实,人机协作是正确之道。像人工智能作曲,一般而言只能创作出通用化的音乐,如果需要更具个性化的音乐,就需要人机协作。人工智能的出现和发展给人类带来了挑战,而人类则需要拥抱人工智能,人工智能消灭了一批工作岗位,也能提供新的基于人机协作的岗位。人机协作,共创未来,这是一个很好的愿景。
第一次工业革命发生于18世纪60年代至19世纪中期,人类开始进入蒸汽时代;第二次工业革命发生于19世纪下半叶至20世纪初,人类开始进入电气时代;第三次工业革命发生于20世纪后半期,约在第二次世界大战之后,人类进入科技时代,即生物科技与产业革命;而现在我们面临的,是以人工智能为代表的第四次工业革命。
以前,机器的出现消灭了一批工作岗位,而人类学会了使用机器又获得了新的工作岗位;现在,对于人工智能的出现和发展也是如此。
我是非常推崇人机协作的。比如Band-in-a-Box、Hexachord提供给了音乐人很好的协作工具,人工智能写作也应如此。
审视一部小说,特别是现在的网络小说,其中会有一些独创的东西,另外会有更多的雷同的东西。独创的内容,如独特的人物、人物关系、情节设计;至于雷同的内容,君不见,每部影视剧都会有很多类似的片段,如角色坐在一起吃饭聊天,在路上走动,飞车追逐……
独创的内容,是作品的亮点,是作品成立的关键;而吃饭聊天走路开车这些片段,写起来是浪费作家的时间和精力,最好能交由人工智能去做,人工智能也能做得更快。
在未来,人工智能写作软件应该要、应能做到,作家只需自己构思一些作品独创的东西,别的交由人工智能去构建。其实我说的这些,跟现在人工智能音乐软件的发展情况很相似。这是我对于人工智能写作人机协作的愿景,也是更多其它领域人工智能发展未来的愿景。