本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。
AI技术的研究正在从2D走向更高难度的3D。12月3日,记者获悉,阿里技术团队研发了全新3D AI算法,可基于2D图片精准搜索出相应的3D模型,准确率大幅提升10%,可降低3D打印、VR看房、场景导购等领域的门槛。该研究成果已被AI顶会NeurIPS 2020收录。
尽管3D打印、VR等应用场景逐渐成熟,但以3D搜索为代表的3D智能技术依旧处于早期研究阶段。例如,受限于2D图片颜色、纹理信息和3D模型形状信息之间的差异,传统AI方法模型匹配的准确率较低。过去几年,包括卡耐基梅隆大学、MIT、斯坦福大学等顶级机构都纷纷投入该领域的研究。
(阿里3D AI算法可基于2D图片,从海量数据集中精准找到匹配的3D模型)
国际AI顶会NeurIPS 2020官方显示,阿里技术团队率先提出了3D搜索的全新方法,即让AI先学习大量复杂2D图片样本,从而弱化纹理等干扰信息,使AI网络更聚焦于几何细节的学习,从而让AI更好地理解2D图片及3D模型之间的差异。
实验结果显示,训练完成后的算法模型能更高效地和3D模型数据集进行匹配,在不同数据集上的准确率提高约10%,例如用一张家具照片,可直接找到该家具的3D模型。
该论文作者、阿里淘系技术算法专家付欢表示,“3D搜索和3D重建、3D显示都是3D领域基础技术, 未来,随着算法和3D数据集的不断强大,通过搜索引擎可以搜索出万物的3D模型。”
据悉,阿里技术团队在3D重建、3D搜索等技术领域已实现多项突破,相关技术已应用在淘宝3D购、躺平设计家等场景中。今年3月,阿里巴巴与多所国际知名学者合作开源业界首个饱含纹理细节的大型3D家具数据集(3D-FUTURE),吸引了斯坦福大学、加州大学伯克利分校、清华大学、香港中文大学等高校及苹果、Facebook等企业进行学术和应用的前沿研究。