Transformer解码真实场景!Meta推出70M参数SceneScript模型
精华
抛弃传统方法,只采用Transformer来解码真实场景!近日,来自Meta的研究人员推出了SceneScript,只需要70M参数,仅采用编码器解码器架构,就能将真实世界的场景转化为几何表示。论文地址:https:arxiv.orgpdf2403.13064.pdfSceneScript是一种用于表示和推断场景几何图形的方法,使用自回归结构化语言模型和端到端学习。SceneScript可以助力AR和AI设备理解物理空间的几何形状,比如下面这个演示,利用Aria眼镜拍摄的素材,SceneS...