人工智能作为计算机科学行业的顶尖技术之一,从1956年达特茅斯会议上正式提出开始就一直备受各行业关注。在图灵测试中,对人工智能的认定和评判是以人为唯一参照物的,基本的思维出发点仍然是仿生学。这里隐含着一个推论,即人是AI无限趋近但又永远达不到天花板。但实际上在AI问世后的几十年里似乎并没有沿此路径去演进。今天我们已经可以看到在某些细分领域AI的能力已完全超出人类的对应水平。
一、艰难探索:功能简单、经验宝贵
实际上2016年初甚至更早,在大量行业存在潜在需求并且拥有巨大空白市场的情况下,智能作为前沿命题已经出现在很多大大小小的安防公司的ppt甚至是具体产品上。但是受限于当时的显示芯片算力、采集终端技术、后端算法技术以及整体方案成熟度,这个时间段推广的算法大多属于早期开荒用途,绝大多数算法落地到实际部署时效果差强人意。这个时期算法大多以物体/人体模型检测为主,基本功能都是最简单的周界入侵、拌线告警、逆行检测等事件类检测,业务功能和实现机制相对简单。
现在看来,那个时期的算法、业务功能以及配套方案大多不好用,甚至相对比较落后。但那个时期在智能算法落地上的探索对之后深度学习算法在安防行业的蓬勃发展提供了大量的工程化经验,无论是各类算法分析严格的场景限制、算法部署时工勘的多样化技巧和注意事项都是前期算法探索者遗留的宝贵经验。
二、时代浪潮:安防是AI最好的栽培土
2016年注定是人工智能行业不平凡的一年。这一年,作为GPU行业的绝对领导者英伟达发布了基于人工智能深度优化的全新Pascal架构,并在GTC2016上正式发布了基于完整P100大核心的Tesla系列显卡、TeslaP40及TeslaP4,并在同年发布了针对深度学习神经网络设计的嵌入式芯片 NVIDIA Jetson TX1。无论是作为服务器级GPU卡的P4/P40,还是作为嵌入芯片元老的TX1,这两类GPU推出后,在人工智能高速发展的几年内长期提供着海量的算力支撑,即使在今年依然能在很多项目中见到其身影。
2016年初,Google开源了TensorFlow源代码,使得深度学习的训练系统第一次暴露在公众视野中,并随之引爆了整个人工智能算法行业。仅仅在发布的第一年里,TensorFlow就帮助超过百万的研究人员、工程师、艺术家、学生以及其他行业人员取得了巨大研究进展。基于TensorFlow及包含加州伯克利分校的caffe以及微软的CNTK网络等框架,大量人工智能算法如雨后春笋般涌现,也点燃了新一轮人工智能的探索高潮。人脸识别、行为分析、图像结构化分析、OCR识别等复杂的图像信息处理及提取技术和算法得到了质的提升,从原来的探索前行逐渐演变成成熟可靠的方案,并且通过大量的实际应用部署获取到大量样本训练,反向为算法本身的演进提供了海量的数据支撑。
人工智能任何算法想要变成成熟方案并且能广泛推广都离不开海量数据的训练以及实战获取的经验。当其他行业正苦于没有足够的资源来进行更进一步提升时,同样还是2016年,这一年国家正式发布“十三五”建设规划,要求在“十三五”期间基本完成视频图像基础设施及应用系统建设,全面构建视频图像资源综合应用体系,整合各类视频图像资源并进行智能化解析处理,安全有效利用社会视频资源,实现视频图像汇聚、共享、解析与应用,使安全与运维能力大幅提升,为公安机关各部门、警种、政府其他部门及社会提供视频图像信息综合服务。同时,在视频图像信息解析系统中也明确提出了海量的解析需求,包括视频内容(实时流+录像流)进行结构化分析、信息提取,以及对视频图像信息按预定策略比对、碰撞、深层次、大区域、多维数据挖掘和研判。
由于“十三五”规划对视频图像分析算法有着明确要求,所以在“十三五”建设期间涌现了无数算法建设的需求。针对各级用户的需求,包括基于人工智能的人脸、视频结构化、ReID等深度学习算法和相关应用落地“试验田”进行实地部署和演练,通过大量的合作联合实战实验室等方式获取夯实的资源支撑。随着“十三五”建设的深入,除传统安防企业外,越来越多的互联网公司也加入人工智能的前进浪潮中,人工智能也因此得到了爆发式的增长。
归功于海量算力带来的底层夯实支撑,各种开源架构以及探索者们提供的技术基础以及国家“十三五”等政策的利好,在如今时代,安防行业无疑是人工智能最好的“栽培土”。在这期间孕育出无数的算法公司,只要你能想得到,任何智能分析需求都会有人来响应。而同样在算法应用上,依赖人脸识别算法实现的“刷脸”登录、“刷脸”开门甚至情绪、疲倦识别等一系列应用在整个安防行业内不断衍生。用户愿意花钱,厂家愿意投入研究,这是人工智能最好的时代。
三、困境:人工智能重新定义安防
好的AI=算力+算法/样本,这是大家对人工智能的传统认知。对于AI本身来说,海量算力配合充足的正负样本,加上大量训练和调优后的算法就基本可以交出一个满意的答卷。在第一轮人工智能的建设浪潮中,大家都在追求更高的指标、更多的标签以及更高的性能,为了极致的指标投入大量人力物力。而随着项目逐渐开始落地,当算法投入实战,当整个安防行业正式向前迈进时,人们也逐渐发现一个无法绕过的问题:人工智能到底是单纯的部件化产品还是一个系统性的方案?在回答这个问题之前,我们先回过头看一下深度学习算法本身,从“聪明”程度来区分的话,人工智能可以简单的分为弱人工智能、强人工智能以及超人工智能。
弱人工智能是指能以智能的方式高效完成特定领域内的工作,不具备真正的思考能力,如人脸识别、AlphaGo。当行业里人工智能热度逐渐冷却,大家也认识到当前的人工智能实际还是在弱人工智能等级上。人工智能算法可以在满足要求的图像上做到很高的精度,而一旦图片质量无法满足要求,指标就会急剧下降。安防行业的图像数据无论是图片还是视频流基本都是由前端摄像机提供,因此人脸识别对传统前端整个体系都提出了挑战。
而人脸识别想要顺利落地并为用户提供最优解决方案,所面对的挑战不止这些。人工智能落地需要端到端系统中每一类组件的重新适配,人工智能重新定义了安防,对每个节点上的设备都提出了新的挑战。回到前面的问题,人工智能应该是一个单纯的部件化产品还是一个系统性的方案?答案显而易见,在安防行业,抛开落地谈产品都是空中楼阁。人工智能算法是一个对前端、存储、大数据以及算法算力调度乃至协议标准都有着严格配套要求的系统方案,而安防行业的实施配套要求,如机房、电费、人工等一系列产品之外的成本也无疑对人工智能的整套方案TCO提出了更高的要求。
四、卷土重来:注重落地与应用
现如今,人工智能依然是行业内最火热的话题。但是用户已经不像初遇人工智能时那么迷信算法,很多时候用户更愿意让算法验证一下可行性,或者干脆与算法厂家以合作实验的形式来确定算法是否可用。而各个厂家以及算法公司也在项目实践中发现了单纯靠人工智能、深度学习、大数据这些实际是不够的,例如宇视提出“场景定义算法”“AI工程化”等更加注重算法落地和实际应用的理念。与此同时,通过新一轮算法的不断PK以及“十三五”建设的格局洗牌,有实力、有经验的厂家也逐渐改变了自己的探索方向,不断投入到算法的落地、智能分析整体方案的拉通以及用户应用的完整闭环和流程简化中。
人工智能算法作为最核心的技术,依然需要不断投入和探索,这是永恒不变的真理。另一方面,各个算法厂家已经不再把算法指标作为最重要的竞争力,而是把多算法解决方案、应用生态配套作为最关键的亮点。原本单一算法可能无法实现的业务,现在通过不同算法协同检索比对可以很轻松实现,这种组合应用的整体方案已然成为新的建设热点。
五、未来:探索无止境
未来,一方面随着算法和业务的高度融合,势必会在各个行业形成行业属性凸出的专用业务及解决方案,人脸识别的建设和发展重点也会逐渐有针对性地对各个行业业务场景进行调整;另一方面随着算法的不断推陈出新和同质化及GA/T1400标准(中华人民共和国公共安全行业标准)的不断优化,算法正在向着标准化组件演进。就像当年IP相机经历过的一样,人脸在内的各种深度学习算法都终将成为标准的交付件,而管理算法的多算法服务框架平台势必会成为下一波平台建设的新高潮。