在过去的几年里,机器学习(ML)和人工智能(AI)的专家们一直致力于研究一些算法,这些算法可以用以前认为人类完全可以写的方式撰写文章和其他类型的内容。
前段时间,一位学生用编程语言让电脑写了一篇文章在外网火了,网友都看不出来那篇文章出自AI之手。随着这些技术越来越先进,我们正逐渐接近一个时代,在这个时代,机器可以比人类更好地编写内容。
但是,我们离拥有比人类更好的机器编写器还有多远?那未来会是什么样子呢?
人工智能写作面临的主要挑战
让我们从人工智能的一些局限性开始。机器学习和人工智能在少数几个不同的应用程序上都非常出色,但是有一些关键的挑战阻碍了它们在更广泛的环境中的应用。
在写作方面,人工智能开发者面临着几个不同的挑战:
自然语言处理。人工智能写作要克服的最大障碍之一是自然语言处理(NLP)。近年来,在各种应用程序中,NLP的功能出现了爆炸式增长,其中最明显的就是数字助理的兴起。多亏了自然语言识别,Siri和Alexa这样的助手已经非常擅长学习"理解"人类的基本语言,即使是以会话的方式。有些助手甚至和人类语言识别器一样好。然而,学习识别人类的命令和尝试编写人类语言是两个完全不同的任务,而且训练一个算法以一种可理解的方式编写是非常困难的。这是传统的SEO链接构建被自然语言处理所抹杀的一种方式。
信息处理。在一个人工智能写作算法可以写一篇关于某个特定主题的文章之前,它必须以某种方式"理解"这个主题。没有有意识的学习或理解正在进行,但算法必须寻找、消化、分析和重新处理来自其他来源的信息,以便写出准确的材料。在某些情况下,这是微不足道的;算法可以很容易地查找当前股票价格并报告它们。在其他情况下,这几乎是不可能的;算法无法判断颗粒状视频的事件。
创意。人类写作的许多形式都依赖于创造力;作家必须想出独特的想法或独特的角度,并以某种令人信服的方式呈现给观众。人类创造力的火花产生了新奇的想法,但还没有被任何一种机器形式复制。一个程序员如何尝试复制人类思维的这一特性是不确定的。
声音和主观诉求。我们发现书籍、文章和其他形式的内容吸引人的原因多种多样,包括作者的声音和内容的整体主观吸引力。这对市场营销行业从小说写作到文案写作都很重要。虽然算法可能很容易被训练来收集和重写某些类型的信息,但它们可能很难精确地找出如何以一种主观上有吸引力的方式来构建信息。
意见和经验。有些文章依赖于观点的表达,尤其是在政治报道或建议文章之类的上下文中。另一些人因为人类的经验而被赋予了独特的视角;作者经历了一些个人经历,这些经历给了他们无法用另一种方式收集到的信息。算法很难创造出看起来很现实的新的人类经验和观点;它们只能模仿已经呈现的内容。
人工智能的优势
相较于存在的这些缺点,那么人工智能在哪里表现出色呢?
人工智能对于可预测、可重复和客观可测量的任务特别有用。在这种情况下,人工智能算法可以以人类无法达到的规模,以惊人的速度重复给定的任务或解决简单的问题。在写作方面,这意味着可预测的、公式化的写作对于人工智能算法来说是非常容易的,而且这种水平的文章可以用一种算法比用一个人类作家快上千倍。
人工智能的另一个关键优势是它的学习和适应能力,这将使它在写作时进入一个新的领域;随着时间的推移,可以训练算法来根据许多不同的因素来评估其输出的质量。如果有足够的时间和资源,算法可以学会写更复杂的,可以说是创造性的作品。
人工智能写作的现状
人工智能算法已经在努力制作内容。很有可能,你读过很多由算法编写的文章,你甚至没有意识到。几年来,各大新闻机构一直依赖于在后台工作的算法来制作专为简单报道而设计的文章;例如,算法经常用于报道体育比赛或股市波动的最新情况。
有些算法试图更进一步,把机器的能力推向极限。例如,一些程序员创造了一些算法,旨在复制著名作家和诗人的形式和写作风格,创造出与人类原创作品难以区分的全新作品。当然,这些先进的算法仍处于实验阶段,尚未看到广泛使用甚至一致的结果。
在线文章和搜索引擎优化(SEO)
在线营销和搜索引擎优化(SEO)是人工智能写作领域中最有希望发展的领域之一。内容营销已经成为世界上最流行的营销策略之一,因为它能够同时在多个不同的渠道上产生流量。虽然最好的内容通常需要人类的创造力、观点和情感,但人工智能目前无法模仿的大量已发布的在线内容在不久的将来可以由机器编写。
当然,即使是低层次的内容营销素材也比报道体育或股票更为复杂;要开发出在可理解性和风格上能够与人类作家相媲美的节目还需要时间。
书籍和创意作品
当人工智能算法在创造性写作、处理短篇小说、小说和诗歌方面取得突破时,它将更加令人印象深刻。算法在学习识别语音方面有着非凡的技能,而一些特殊的算法也很擅长识别语音模式,包括当地方言和语体。当这些算法足够先进时,它们可能能够准确而一致地复制著名作家的风格,甚至可能将不同的风格混合在一起,就像Deepfakes可以令人信服地在录制的视频中伪造特定人的存在一样。
尽管如此,算法可能还需要一段时间才能产生真正独特的想法;当第一个一致的创造性写作算法出现(它们几乎肯定很快就会出现),它们可能会专注于从先前成功的作品中产生的创意。换句话说,他们更善于模仿现有的好主意,而不是想出新点子。
人类情感与主观视角
阻碍人工智能编写算法的一个重要障碍是找到一种获取人类情感、观点和主观经验的方法。有一些理由相信这是可以实现的;例如,一些为企业开发的聊天机器人能够根据互动的词汇和语调来检测人类情绪的变化。其他聊天机器人是为治疗目的而开发的,可以有效地模仿人类的某些情绪。将这些概念更好地集成到编写算法中可能只是时间问题。
人工智能的不断发展
很难说人工智能写作的未来走向。目前,由于主题足够简单和易于理解,算法能够写出与人类写作无法区分的文章。在不久的将来,算法可能被用于在线营销、新闻业,甚至是创造性写作的进步。然而,在可预见的未来,基于人工智能的写作算法仍然会有缺点,因为它们无法复制人类的情感,处理复杂主题的能力有限,缺乏"自然"的创造力。