LoGAN设计出来的几个标识(logo)
图片来源:马斯特里赫特大学
【51CTO.com快译】生成式对抗网络(GAN)是一种分两部分的神经网络,包括生成样本的生成器(generatorr)和试图辨别生成样本与真实样本的鉴别器(discriminator)。GAN应用于众多领域,比如发现新药物、做出栩栩如生的汉堡和蝴蝶照片,并生成脑部肿瘤的合成扫描。正如荷兰马斯特里赫特大学发表的一篇新论文揭示的那样,GAN在设计标识方面同样也不错。
在发表于预印本服务器Arxiv.org上的研究报告(《LoGAN:用颜色方面调节的生成式对抗神经网络设计标识》,https://arxiv.org/pdf/1810.10395.pdf)中,科学家们描述了一种名为LoGAN的人工智能(AI)系统,可以用12种不同的颜色设计标识。
他们写道:“对任何设计师来说设计标识是一个漫长、复杂而费钱的过程。然而,最近生成式算法方面的进步提供了模型,有望给出一种可行的解决方案。LoGAN的结果首次展示了人工智能如何用于帮助设计师进行创作,为未来指明了大有前景的方向,比如包括描述性更强的标签,从而有望提供一种更详尽、更易使用的系统。”
研究人员解释道,这种GAN的问题在于,它们并不总是获得美观的结果。它们的解决方案是使用最显眼的颜色来定义标识:黑色、蓝色、棕色、青色、灰色、绿色、橙色、粉红色、紫色、红色、白色和黄色。
该团队拿LDD-icons数据集来训练系统,该数据集由486777个小图标组成,这些小图标的尺寸是32 x32像素。每个小图标中的主颜色用算法加以提取,并由RGB值转换成颜色词。同时,系统中的第三个神经网络(除了生成器和鉴别器外)对样本图像进行分类。
那么,LoGAN会怎么做?尽管生成的标识很模糊(归咎于源图像的低分辨率),有些标识还是相当逼真。馈入颜色关键字后,LoGAN设法给出不规则的形状、圆形和方形按钮,甚至给出类似谷歌Chrome标识的外观。
有趣的是,白色和灰色是12个颜色类别中最常见的三种颜色组合之一。在橙色类别中,棕色是神经网络的首选,而在黄色类别中,它通常采用蓝色。
研究人员认为,像LoGAN这样的AI系统可以处理标识设计中一些比较单调的工作,让设计师能够集思广益。在将来的工作中,他们希望将系统对单词的语义理解扩大到颜色之外的关键字,比如形状和焦点。
他们写道,经过改进的系统可以拿两个不同的数据集来训练:一个数据集包含有着明显几何形状的标识,另一个数据集包含非规则形状的标识。它还可能使用一个嵌入模型,最常用的单词描述标识以“提高可解释性”。
研究人员写道:“虽然生成的标识其分辨率非常低,但它们可以用作最终标识的初稿,或为设计师赋予灵感。如果馈以某个关键字(在我们的例子中包括标识中最显眼的颜色),提议的模型就能成功地设计出标识。这一类关键词可以被认为是描述性的,因为它提供了人类易于区别的标识属性。”
值得一提的是,利用AI的强大功能来制作美工不是什么新想法。Botnik Studios从亚马逊的Alexa Accelerator计划出来,最近教一个神经网络制作一张讽刺性的科切拉音乐节(Coachella)海报,海报上列出了一系列虚构的乐队名称。Prisma这款流行的智能手机应用软件使用名为风格转换(style transfer)的机器学习技术,让照片看起来如同油画。而游戏设计AI初创公司Promethean AI使构建虚拟景观和室内设计的过程实现了自动化。
原文标题:Pick a color and this AI system will craft a logo,作者:Kyle Wiggers
【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】