相逢缥缈,窗外又拂晓.长忆清弦弄浅笑,只恨人间花少. *菊不待清尊,相思飘落无痕.风雨重阳又过,登高多少黄昏.
这首《清平乐.*菊》的作者是一台计算机,比我写的好,十分佩服。且平仄、押韵十分工整,没有明显的句法错误,没有读着别扭的句子,风格婉约,伤感悲秋。这还是一台CPU 1.83GHz,内存512M计算机么?看完《一种宋词自动生成的遗传算法及其机器实现》这篇论文后,我对诗人、艺术家们十分同情,会有一天他们下岗的。
除了对人类未来的担忧,我感兴趣的是研究者们解决问题的思路。我们这样分析:
1. 基于统计学的词库。虽说汉语常用词汇不过3千个,可是这些词放在不同的上下文中所能表达的意思确千差万别。登山则情满于山,观海则意溢于海,人类的语言是 人类情感的抒发。我认为要让计算机写诗,最基础的工作就是建立一个包含情感类别、语义、音韵等要素的元数据库。
2. 填词的过程是搜索的过程。回想高中学写宋词的时候,总是安装词牌的要求一个一个词的填写,这是从大脑中搜索的过程,对于计算机而言是一个类似的过程。我们 可以采用启发式搜索,使得搜索总是沿着较优的方向前进。可以根据词法等相关概念,从词库挑选一系列备用词,沿着计算出来的评价(打分)进行搜索。
这篇论文和我前段时间读的人工鱼模拟的的论文类似,在解决搜索问题上都使用了遗传算法。遗传算法(Genetic Algorithm)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法(引:百度百科)。
这是一篇很有意思的论文,所以我写了些自己的想法。语义分析我不懂也不是很感兴趣,但是,通过读论文来开拓视野,长长见识,推荐大家多逛逛相关网站:)
【编辑推荐】