2018 年 4 月,京东Y事业部对外发布全球首款全自动智能图片合成处理软件——么么照。么么照可实现“发丝级”识别精度的全自动抠图效果,能够满足于买家秀、社交、海报制作等应用场景,未来还将覆盖邀请函、电子名片、直播等静态图片及动态视频的应用。给用户带来更丰富有趣的玩法及全新的互动体验。
么么照以人像抠图为核心,可实时更换背景/贴纸,并支持全身效果合成,由来自京东美国硅谷的研发团队提供了领先的 AI 及 AR 技术,可创造出内容更加丰富的创意表达。极低的学习门槛可轻松上手进行创作。目前么么照已发布 iOS 及 Android 版本,用户可前往应用商店下载体验。
“发丝级”全自动抠图,让创意信手拈来
相比目前市面上种类繁多的图片美化软件,大部分的抠图 App 软件,几乎都是半自动化的,需要用户手动框出人物区域,用户们在选取人物或其他对象时经常有不小的麻烦,需要消耗一定的时间。
么么照解决了用户这一烦恼,规避了其他半自动抠图软件效果差不好控制的问题。采用人工智能算法,将人与复杂背景自动分割,智能识别人体部位与动作,达到发丝级识别精度,用户可通过使用 app 内置主题背景或自由上传背景,实现万千虚拟场景自由更换,赋予用户沉浸式的深入体验,让图片处理变得富有创意。
(照片经模特周芝伊授权)
么么照在抠图方面采用 state of art 的深度学习算法对照片进行语义分割,可精准分割出人像与背景,并返回一个由浮点数组成的字符串,字符串内的每个浮点数对应原图的一个像素,浮点数的值代表相应的像素是否在人体轮廓内的置信度。
为了使用户获得***的用户体验,么么照针对手机端和服务器端分别采用了轻量级网络和高精度网络来做上百万的数据训练,做到了既精准又轻量化的效果。利用深度学习中的 Encoder-decoder 模型结合提取到的全局和局部特征,能够对每个像素进行人体、背景分类,得到高精度的人体分割,***组合多种后处理方法,对神经网络得到的人体模型,做进一步的细节优化,简单背景下深知可做到 PhotoShop 级别的精度。
为了增加图片的趣味性,么么照还在抠图选取过程中加入了人体关键点检测,如当检测到图像中人体肩膀的位置,可自动搭配翅膀等梦幻元素,还可自动更换背景、识别背景颜色。同时通过后台算法可以检测到图像中服装属性、背景图元素,根据提取的标签信息智能匹配语料,未来可一秒钟写好配图文章。此项技能作为 AI 技术在图片领域的拓展,能够提取用户全身照片里服装风格信息,可用于用户喜好数据平台的搭建。
进击的娱乐化趋向,动态视频实现一键抠图
根据 2015 CNNIC 数据显示,截止 2015 年底,在中国 30 岁以下的网民占比超过一半(54%),20 岁以下网民占比 24.1%,互联网娱乐继续向低龄群体渗透。这些崛起的 90 后是各大平台都无法忽视的新兴消费势力,日益成为影响中国互联网未来发展的关键力量。从供需两端看,90 后最关注的行业是文娱,而短视频又是对文娱类产业影响***的部分,深入到产品层面的改变,在产品设计及运营策略等方面各大企业也都在迎合着 90 后,么么照正是抓住了年轻群体娱乐化的需求,在市面上静态抠图尚不精准的情况下率先进行了动态视频抠图处理的研发。
么么照能够检测到图像中所包含人体中脸的各个关键点位置,捕捉用户脸部姿态,进行人脸实时视频抠图,完成 82 个人脸关键点定位检测深度模型,服务器 GPU 可达 322 fps,手机端(iphone7)GPU 为 33 fps。[H1]在动态抠图方面,后台算法会根据视频输入的每一帧计算出一张二值掩蔽图,通过对大批量视频进行分割训练,保证帧之间的连续性,加上对沙漏型分割网络架构的改进,能够提高并解决视频在手机端的速度问题。
么么照在动态抠图过程中可以识别到点头、摇头、手势等动作,使用神经网络能够做到毫秒级的动效跟踪和贴纸展示,此外在移动中拍摄识别依旧准确。作为全身视频的新颖玩法,适用于体感游戏在短视频平台上的应用,能够让用户真实体验线下 Cosplay,同时可以进行一键分享社交圈,实时互动传播。
未来通过与 AR 技术结合,么么照针对用户对于照片效果美化的需求,还将加入“人脸关键点检测”萌颜+实时抠图功能,并通过美颜与滤镜赋予萌颜效果,不管是静态图片还是动态视频都能达到***的用户视觉效果。
助力京东买家秀,用数据看懂你的美
么么照一方面可满足用户对照片美化处理的个性化需求外,将作为京东在买家秀上的重要基础工具来提供入口,消费者可通过么么照的处理对商品进行更个性话的评价展示,增强B端与C端的互动,提高转化率。同时么么照通过对用户穿衣风格的识别可不断积累用户对服装搭配,色彩偏向等数据,在与京东用户数据打通后,可围绕数据标签展开精准且具有针对性的营销活动,提供给用户更多个性化推荐,以及更适合的活动策略。