物联网继续在许多行业引起轰动并被广泛应用。围绕物联网的讨论主要集中在设备上——智能电视、冰箱、汽车、可穿戴设备等精巧的小玩意。但对于企业而言,物联网的最终价值不仅仅在于设备,还在于他们产生的数据。要真正释放物联网的价值,您需要驯服这些数据。
物联网技术正日益成为许多企业的关键任务工具。汽车制造商利用物联网开发自动驾驶汽车,最终将成为一个数万亿美元的产业。但是这些设备共同产生大量数据,如果管理和监控不当,可能导致物联网应用崩溃,并导致潜在的致命错误。
想象一辆充满物联网设备和互联技术的自动驾驶汽车,如果其中一个设备发生故障(例如雷达传感器),车辆可能会撞毁,甚至会造成人员伤亡。为了解决这个问题,汽车制造商正在采用一种称为异常检测的方法,该异常检测可实时分析大量物联网数据,以查找任何异常活动。当物联网设备开始表现出异常行为时,这种方法会提醒司机,允许他们在设备故障之前将其带去修理或更换。这使汽车制造商能够保证安全并加速自动驾驶汽车的采用。
另一个很好的使用案例来自制造业,在制造业,工业物联网(IIoT)正受到越来越多的关注。这里,IIoT用于自动化各种流程和机械,这包括您在装配线上可能会发现的任何东西,比如传送带、高架起重机和叉车。在IIOT设置中,这些机器会产生大量传感器数据,与上面的自动驾驶汽车示例一样,异常检测的使用可以确定这些机器中的一台何时发生故障,从而允许企业快速采取行动来修理或更换它。此外,这些数据可用于执行预测性维护,在这种维护中,企业会检测某些模式,这些模式显示机器在实际发生故障之前可能需要修理或更换的时间。
在这两个例子中,只有当数据被正确捕获和处理时,物联网技术才能实现其全部价值。这项技术产生了大量的流数据,有太多企业甚至没有制定一个计划来处理他们将产生的大量数据——这需要考虑他们的分析引擎从数据中得出结论的速度,以及快速处理大量数据需要的网络带宽,甚至需要考虑存储数据的方式和位置,以进行后期分析。结果,他们的物联网部署存在缺陷并且表现不佳。企业可能会迁怒于硬件,但责任在于他们无法正确处理数据。
当然,物联网数据也不容易收集、存储和分析,它以高速、大量和不同的格式出现,所有这些变量都会根据设备和用例而变化。再比如监测病人心跳的设备将不断产生大量数据,这些数据需要实时处理。此外,用于抓取和分析这些数据的系统非常复杂,这些包括用于收集数据的流存储,例如Kafka或HBase,以及用于解析数据的处理组件,例如Spark of Flink。存储组件必须在精巧的编排中有效地与处理组件协调,以使其全部工作。这些系统经常遭受数据分区不当、将传入数据发送到流存储的错误位置、资源争用问题,导致瓶颈或配置不匹配,最终导致崩溃和错误。
为了找出在这些场景中出了什么问题,唯一的选择是梳理大量的原始系统和应用程序日志,并尝试理解它们。这通常需要专家级别的经验,即便如此,这也是耗时且低效的。要真正理解物联网数据,您需要一个自动化的大数据应用程序管理软件,该软件能够快速查明物联网应用程序的哪个部分工作不正常,甚至提供如何修复这些错误的建议。
在过去的20年里,每家公司基本上都变成了一家科技公司——如果他们不接收科技,他们就没有希望在现代经济中竞争。同样,如今,每家公司都在成为一家数据公司。允许数据累积而不实际挖掘数据的企业将错失关键洞察力,并危及他们可能投入巨资的各种部署,包括物联网。