数字房地产公司Interxion的营销和业务总监PatrickLastennet审视了人工智能创新加速所面临的障碍。其认为,从一开始就为AI部署制定强大的基础设施战略非常重要。
人们对人工智能的需求正在增长。每个行业的企业都在探索如何利用人工智能加速创新,并提供强大的竞争优势。然而,设计人工智能基础设施是复杂且难以承受的,因此,76%的企业认为基础设施是人工智能成功的障碍。
不过,这不是放慢进展的借口。随着越来越多的企业积极追求或至少落后于人工智能,那些等待的企业只会更加落后。
最近一项针对8个欧洲国家IT决策者的调查发现,近三分之二的企业(62%)目前正在部署或测试AI,另有17%计划在2020年使用AI。
受访者指出,许多基础设施障碍限制了人工智能的大规模部署,从缺乏资源,如资金、人员和物理基础设施,到不明确的企业战略没有考虑到人工智能。
由于人工智能部署对于许多企业来说是一个缓慢的构建过程,因此在已进入部署阶段的企业和尚未开始规划的企业之间将形成巨大的技术差距。不愿投资人工智能的企业将错失获得竞争优势的机会。
这就是为什么从一开始就为AI部署制定一个强大的基础设施战略,这非常重要。以下是需要考虑的问题。
成功的障碍
通常,领先重大AI研发的公司都没有来自IT部门的重要初始投入。结果,团队不幸地产生了影子AI——在IT的雷达下创建的AI基础设施,这是成功操作的挑战,最终是无效的。企业可以通过制定专门针对AI优化的基础设施战略来避免影子AI。
调查强调,不可估量的成本是首要问题(21%)。从对人员和设备的新投资需求,到人工智能设计和部署之间曲折道路上不可预见的成本,再到技术需求的快速创新和转变,人工智能投资可能是巨大的,很难预测。此外,如果企业未能部署该技术,IT和AI开发之间的内部脱节会导致低投资回报率。
缺乏内部专家人员也是一个重大挑战。企业通常需要聘请专业的开发人员,这可能成本高昂,且需要时间让新员工学习业务,以满足AI设计和组织目标。
IT设备的不足也阻碍了企业设想人工智能如何融入其运营。根据这项调查,许多企业担心其目前的基础设施没有优化到支持人工智能的程度,并担心数据中心已达到满负荷运转。
战略阶段的障碍在各行业中基本相似,但具体的基础设施决策可能因行业而异。法律或合规要求,如GDPR,以及涉及的数据类型和工作流程,都将影响AI基础设施决策。
该研究发现,39%的跨行业企业使用主要的公共云——其中大多数是寻求灵活性和高速的制造商。与此同时,29%的受访者更倾向于获得顾问支持的内部解决方案——通常是金融、能源和医疗保健公司,这些企业希望将其个人身份信息(PII)数据置于严密的安全和更好的控制之下。
成功的人工智能基础设施的要素
由于许多企业都是从零开始,所以从一开始就制定明确的战略是非常必要的,因为之后重新架构会花费大量的时间、金钱和资源。要成功地大规模启用人工智能,企业需要检查几个方面。
首先,企业需要能够确保其拥有正确的基础架构,以支持为AI工作负载准备的数据集所需的数据采集和收集。特别是,必须注意从AI推理运行的边缘或云设备收集数据的有效性和成本。理想情况下,这需要在全球多个地区实现,同时利用高速连接并确保高可用性。这意味着企业需要可提供以下优势的网络结构支持的基础架构:
接近AI数据:企业数据中心的5G和固定线路核心节点将来自现场设备、办公室和制造设施的AI数据带入区域互联数据中心,以沿着多节点架构进行处理。
直接云访问: 提供对云超规模环境的高性能访问,以支持人工智能训练或推理工作负载的混合部署。
地理规模:通过将其基础设施置于位于战略地理区域的多个数据中心,企业可以在全球范围内实现低成本的数据获取和高性能的AI工作负载交付。
当企业考虑训练人工智能/深度学习模型时,必须考虑一个数据中心合作伙伴,该合作伙伴能够在长期内适应支持GPU加速计算的必要电源和冷却技术,这需要:
高机架密度:为了支持AI工作负载,企业需要从其数据中心的每个机架获得更多的计算能力。这意味着更高的功率密度。事实上,大多数企业需要将其最大密度至少扩大三倍,以支持AI工作负载,并为未来更高的级别做好准备。
数量和规模:利用人工智能优势的关键是大规模实施。在大规模硬件(GPU)上运行的能力能够实现大规模计算的效果。
通往人工智能的现实之路
大多数本地企业数据中心无法处理这种规模的数据。与此同时,公共云提供了阻力最小的路径,但由于高成本或延迟问题,其并不总是大规模训练AI模型,或将其部署到生产环境的最佳环境。
那么,对于那些想要设计支持AI工作负载的基础设施的企业而言,最好的方法是什么呢?通过研究已经从人工智能中获得价值的企业如何选择部署其基础设施,可吸取重要的经验教训。
Google、Amazon、Facebook和Microsoft等超大规模企业成功地利用自己的核心和边缘基础设施大规模部署了人工智能,这些基础设施通常部署在高度连接的高质量数据中心。他们在全球大量使用托管,因为他们知道托管可以支持其所需的规模、高密度和连接性。
通过利用这些人工智能领导者的知识和经验,企业将能够在人工智能方面规划自己的命运。