人工智能驱动的机器视觉每天都变得越来越强大和广泛。机器视觉和人工智能的新应用正在快速发展,尤其是在医疗保健、自动车辆、制造业、农业和安全等领域。
在医疗保健领域,机器视觉被用来快速分析成千上万的X光片、CAT扫描和其他医学图像。它通过优先考虑医院急诊室的病人治疗来挽救生命。在交通运输行业,人工智能驱动的机器视觉系统使自主车辆能够发现障碍物并安全地在道路上行驶。
机器视觉通过自动缺陷检测在制造业中也发挥着关键作用,数字农业领域的快速扩展部署了计算机视觉系统来限制甚至消除农药的使用,同时持续增加产量。
与机器视觉系统一样有用的是,它们是大量非结构化数据的来源。国际数据中心(IDC)的研究显示,它们越来越受欢迎是推动全球数据收集量激增的一个重要因素,预计到2025年,全球数据收集量将继续上升至163zettabytes。
由于人工智能驱动的机器视觉的所有这些用途和所有这些数据,它为企业创造了许多数据管理的含义。今天,大多数组织都面临着相互冲突的数据管理需求。
大多数数据源于边缘,但计算和存储基础设施通常集中在几个大型数据中心或公共云上。将数据移动到集中的位置会带来与传输和存储数据相关的重大延迟和成本。
对速度的需要
根据Gartner的数据,到2025年,大约75%的企业生成的数据将在传统数据中心或云之外创建和处理。目前,在边缘捕获的大多数数据都被移动到一个集中的位置进行处理,用于人工智能模型开发。
在实现机器视觉技术时必须考虑到这一点。对于任何捕获和集中PB级非结构化数据(无论是视频、图像还是传感器数据)的企业来说,这些负载大大减慢了机器学习算法的训练过程。这种集中的数据处理方法延迟了人工智能开发管道和生产模型的调整。在工业环境中,这可能会导致遗漏产品缺陷,可能会给企业带来巨额损失,甚至危及生命。
为了解决这个问题,越来越多的企业开始转向分布式、去中心化的体系结构。这意味着大多数数据都在边缘保存和处理,以解决延迟和延迟问题,并解决与数据处理速度相关的问题。边缘分析和联合机器学习技术的部署在解决集中式系统固有的安全性和隐私不足的同时带来了显著的好处。
例如,一个不断捕捉视频片段的大型监控网络会汇编大量原始数据,以备日后分析。要有效地从视频中训练ML模型,就必须对其进行检查,以区分视频中的特定对象。只需要检测到新事物的镜头,而不是可能捕捉到空无一人的建筑或街道的冗长的不改变的视频。通过在边缘对数据进行预分析,只将必要的镜头移到一个集中点,企业可以节省时间、带宽和成本。
虽然分布式体系结构有许多优点,但它们也带来了额外的复杂性。在边缘选择和部署适当的存储和计算基础架构以及集中化的管理是至关重要的,它会显著影响总体系统效率和拥有成本。
分层存储
许多收集的图像和视频主要用于人工智能模型训练,应永久性地存储在不同的目的。例如,在高级驾驶员辅助系统和自动驾驶车辆中,人工智能根据实时收集的数据做出决策。然而,如果一个问题出现——可能是几个月或几年之后——企业需要能够回去分析发生了什么。尽管这种存储对安全至关重要,但它的成本却很高——据Gartner统计,平均每TB每年需要3351美元。当您考虑到平均每小时自动测试车辆捕获两TB的数据时,很容易看出成本是如何增加的。
许多存储大量非结构化数据的企业通常依赖于网络连接存储设备或公共云存储。但是,采用分层数据存储体系结构可以显著节省成本。在分层系统中,在处理和分析数据的活动期间,内容被放在快速存储上,而备份副本则被存储和归档在成本较低的存储上,如磁带或对象存储。低成本存储的规模可以低至每TB50美元。在许多部门,包括自动驾驶车辆,大多数收集的数据需要无限期保存,但很少使用,可以以最低的成本存储。
非结构化数据存储解决方案和边缘分析的新发展不断冲击市场。为了利用这些优势,企业应该从头到尾地实施模块化数据管理,以便在发布时能够将元素交换为更先进的技术。
利用机器视觉寻找新机会
即使有了最好的技术和服务,成功地传输、处理和存储为机器视觉用例捕获的大量数据仍将继续挑战各种垂直领域的企业。
然而,存储的数据也提供了一个新的机会。例如,可以重用图像和视频来开发新的用例。因此,存储的数据将成为企业新的收入来源,而不是成本。同样,当更先进的分析技术出现时,许多企业可以重用现有的存档数据来开发自己的新产品。一些公司,尤其是汽车制造商,已经开始意识到这一潜力。这些潜在的新收入流和数据使用是现在开始优先考虑智能高效的数据处理和存储的绝佳理由。