基于在视频处理、人脸识别、语音识别上的长期技术积累,致力于为广大开发者提供媒体相关整体解决方案的百度公司日前又有“硕果”发布——百度媒体云宣布,正式推出人脸识别服务,同时,面向开发者的申请平台正式开启。
据了解,百度媒体云人脸识别服务依托百度业界领先的人脸识别算法,通过提供一系列HTTP Restful API及跨终端平台SDK,实现人脸检测、五官定位、人脸属性检测、人脸识别等诸项功能。
人脸识别技术的难点在于,人脸是具有复杂结构的三维可变形生物体,因此影响人脸识别效果的因素主要有以下几个(参考文献1):
姿态:人脸图像的变化,如在三维到二维人脸的成像过程中,由于相关的照相机-脸姿
(正面的、45 度、侧面、颠倒的)导致的不同,一些脸部特征如眼睛或鼻子可能部分被遮挡;
组件的影响:面部的特征如胡须和眼镜等可能存在也可能不存在,这些组件包括形状、颜色和大小;
面部表情:人脸为可变形物体,人脸表情的变化直接影响人脸图像的模式;
图像的方向:照相机光轴的旋转不同可直接引起人脸图像的变化;
图像的条件:当图像产生时,一些因素如光和照相机的特性(传感器的响应、透镜影响人脸的外观)。
百度媒体云人脸识别服务针对以上难点进行针对性研发及优化,取得了突破。首先,通过“人脸检测技术”来提供“人脸及五官几何位置定位”,从而轻松锁住姿态变化。
图1:人脸检测
其次,百度媒体云人脸识别服务支持人脸图像的性别、表情等人脸属性分析功能;同时支持常用图片格式,能应对复杂的光照场景,并支持多种人脸姿态——这就是“人脸属性检测”功能。
图2:人脸属性检测
同时百度媒体云人脸识别服务为开发者提供了极大便利:支持REST API方式调用,为开发者带来最为灵活、跨平台的使用方式;提供了ANDROID、iOS、WP7、JAVA及PHP多种平台的SDK封装,帮助开发者缩短开发周期;配以专门的服务控制台支持详细的服务统计查询及服务使用频次管理,方便开发者掌握服务使用情况及变化趋势。
图:3:统计信息
开发者只要通过以下步骤,即可进入媒体云人脸识别服务管理控制台:1.登录新版开发者中心的“管理控制台”;2.在应用列表中选择使用媒体云服务的应用,或者根据向导创建新的应用;3. 点击左侧边栏中的“媒体云”,选择“人脸识别服务”页面。
而在第一次使用人脸识别服务时,需要申请开启服务——点击“申请开启服务”开始申请步骤,在弹出的抽屉浮层中填写使用场景及申请理由,申请提交后,百度后台工作人员会查看申请并予以通过或拒绝,审核的结果会通过开发者中心的消息中心通知开发者。另外,在人脸识别控制台页面也可以查看到审核状态。
图4:申请开启服务界面
另据了解,目前媒体云人脸识别服务已经在百度云网盘、百度相册、百度魔拍、百度内部移动办公应用和有缘网等平台上实现了成功应用。
百度媒体云人脸识别服务相关负责人称,人脸识别服务将进行持续的功能和性能优化,更多更酷的人脸技术将会逐步释放,随时欢迎有创意的开发者们进行深度合作。让我们拭目以待吧。