Facebook AI 研究院于日前开源由 Python 语言编写的基于深度学习框架 Caffe2 的物体识别框架 Detectron。其中包含多个重要且热门的目标检测算法,Detectron 能够根据电脑视觉的任务,自动产生适合的模型。
脸书在去年 F8 大会上大秀 AR/VR 应用,尤其展示了多种在生活场景叠加图片的 AR 技术,今日开源的目标检测框架Detectron,可以快速在影片或图片中辨别出物体的形状或边缘,方便叠加影像。
Detectron 项目于 2016 年 7 月启动,当时的目标就是要在深度学习框架Caffe2上,创造一个快速且具有弹性的目标检测系统,后来进入预览的开发阶段。在过去一年半的时间里,Detectron已经成熟并可以支持FAIR多数的项目,包括Mask R-CNN 、Focal Loss for Dense Object Detection,它们分别在2017年ICCV 获得 Marr 奖和***学生论文奖。这些由 Detectron 支持的算法为重要的计算机视觉任务(例如实例分割(Instance segmentation))提供了直观的模型,除此之外,Detectron对于一些视觉感知系统也会有很大的帮助。
在脸书AI研究院内部,Detectron已经用在多个项目中,像是Feature Pyramid Networks for Object Detection、Mask R-CNN、Detecting and Recognizing Human-Object Interactions、Focal Loss for Dense Object Detection、Non-local Neural Networks, Learning to Segment Every Thing和Data Distillation: Towards Omni-Supervised Learning。
而脸书 AI 研究院将 Detectron 开源的目的是,能够让 FAIR 的研究与大家分享,来加速全世界的研究成果。除了研究之外,脸书团队用Detectron,为不同的重要应用,训练出定制化的模型,模型训练完成后,即可通过轻量级且模块化的 Caffe2 部署于云端、行动装置,脸书期望 Detectron 能够帮助发展出下一代的目标检测技术。
此外,Ross Girshick表示,脸书AI研究院也在模型动物园(Model Zoo)中,发布超过70个已用Detectron训练过的模型,提供开发者下载,创造出自己的目标检测系统。