“红帽秉持开源精神,100%的开源。”
近日,在红帽“以开源的方法将AI带入企业”媒体沟通会上,面对“未来AI是开源还是闭源?”这一问题,红帽全球副总裁兼大中华区总裁曹衡康斩钉截铁地给出了红帽的选择。
作为开源技术的积极倡导者,红帽坚信开源模式是促进技术创新和普及的有效途径。在人工智能领域,红帽一如秉承这一理念,通过开源的协作模式,协助企业以更高效、更创新的方式利用AI技术,充分释放其业务潜力,实现价值的最大化。
AI是开源,也是混合
在媒体沟通会之前,红帽也对参会媒体发起了小调查,面对“现在AI领域有‘开源派’和‘闭源派,您’挺‘哪一派?”这一问题,50%的媒体朋友选择了“开源派”,结果与当日媒体沟通会的主题不谋而合。
其实,开源派与闭源派之争由来已久,体现的是不同的开发哲学。两者各有利弊,实践中往往需要找到平衡点。
在红帽看来,开源AI的核心优势在于其对技术创新和社区协作的促进作用。开源模式打破了传统闭源软件的限制,使得全球的开发者、研究者和企业能够共同参与到AI技术的开发和完善中。这种开放的环境不仅加速了AI技术的发展,还促进了新想法和解决方案的快速迭代。正如曹衡康所指出的,开源AI能够快速响应安全问题,因为整个社区都会参与到问题的发现和解决中,这种集体智慧是闭源模式难以比拟的。
此外,红帽还认为在“多云”环境实现AI的落地。曹衡康先生强调,AI的部署不应当局限于单一的云平台,而应当跨越公有云、私有云以及边缘计算设备,形成一个多维度的计算网络。这种混合云策略赋予了企业更大的自主性和选择性,使它们能够根据业务需求、成本效益和安全标准来定制AI解决方案。
在混合云架构下,AI应用可以更接近数据源进行部署,减少了数据传输的延迟和成本,提高了处理速度和效率。同时,企业也能够更好地控制数据的存储和访问,满足了数据隐私和安全的要求。混合云还支持了AI应用的可扩展性。随着业务需求的增长,企业可以轻松地在云端扩展AI应用的计算资源,而无需担心基础设施的瓶颈。这种弹性伸缩能力确保了AI应用能够灵活应对不同的工作负载,保持高性能和稳定性。
曹衡康强调,AI并非仅仅关于模型,而是一个涉及基础架构、应用层和模型的综合体系。因此,红帽的AI解决方案旨在提供一个全面的、开源的、混合的环境,以支持企业在各个层面上的AI需求。
AI落地,看见冰山下的问题
“很多企业在谈到AI实施时跟我说的第一件事情就是,你们红帽能帮忙买到GPU卡吗?”红帽大中华区解决方案架构部高级总监王慧慧笑称,许多企业在构建AI基础设施时面临GPU卡获取难题。
企业需要GPU卡来训练模型,而缺乏这些硬件会严重阻碍AI项目的发展。王慧慧介绍,红帽不能帮助企业购买GPU卡,但是红帽通过云服务,将智算中心的算力“池化”提供共享的算力资源,并以公有云或混合云的形式,使企业能够按需访问这些资源,克服AI基础架构建设的障碍,避免了企业自行建立成本高昂的小型计算中心。
当然,实施AI远不止买GPU或者选择模型那么简单,冰山之下暗藏诸多问题。企业需要评估AI应用场景,并运用AI专业知识来为特定场景选择适当的模型并且还必须处理AI实施过程中的各项显著难题,加上AI学科高门槛和人才的稀缺性,使得情况更为复杂。红帽总结了企业在实施AI创新时的六大挑战:
- 安全性与合规性(Security & Compliance):企业在AI应用中需要处理数据泄露风险和数据隐私侵犯问题,同时要满足行业和政府的高监管要求,避免违反数据主权风险。
- 成本(Cost):AI实施中的成本问题,尤其是GPU硬件昂贵且难以购置,增加了企业实施AI的财务负担。
- 复杂性(Complexity):AI模型的训练与调优过程复杂,导致回报率低和周期长,时间成本高。此外,工具和框架的选择多样,架构复杂,业务目标实现困难。
- 投资回报(ROI):从AI项目中获得的回报可能不如预期,存在回报周期长和时间成本高的问题。
- 协作(Collaboration):企业在使用AI模型为企业应用赋能时,可能面临协作效率低下的问题,包括数据科学和AI人才的稀缺,以及缺乏知识技能导致的学习曲线陡峭。
- 人才(Talent):数据科学家难以招聘,企业数据训练和模型调优的协作效率低,组织AI技术更新可能落后于技术趋势。
“三步走”,构建企业AI应用
为了帮助企业更好地构建和部署AI应用,红帽提出了“三步走”策略,为企业提供了一套清晰、高效的解决方案。
首先,在项目初期,企业利用红帽的InstructLab工具在桌面环境中进行小数据集的初步模型训练。这一步骤旨在快速验证AI模型的概念和功能,同时降低资源消耗。InstructLab的易用性和灵活性使AI模型的初步开发变得更为便捷高效。
当模型通过初步测试后,企业进入第二步,即生产级模型训练阶段。王慧慧介绍,红帽的RHEL AI平台能提供了一个稳定、安全的环境,支持利用合成数据生成技术扩充数据集,并采用“教师-学生”模型训练方法提升模型性能。通过基础模型(教师)指导新模型(学生),实现模型的快速迭代和优化。RHEL AI还提供了模型调优所需的工具和平台,帮助企业解决数据、工具和模型短缺的问题。
最后,在模型经过生产级训练并验证其有效性后,企业需将其部署到大规模分布式集群中,以实现更广泛的应用和更高的性能。红帽的OpenShift AI平台在此阶段发挥了重要作用。作为一个强大的AI平台级产品,OpenShift AI不仅支持MLOps实践,包括模型的创建、调整、对齐和服务监控,还能在混合云环境中高效部署AI应用。该平台能够管理和调度多种异构GPU资源,如NVIDIA、AMD、英特尔等,确保模型的高效运行。此外,OpenShift AI还提供了完整的DevOps平台功能,支持AI应用的开发、测试、部署和运行。
红帽的“三步走”策略为企业提供了一套完整的AI应用构建和部署流程,并通过其产品如InstructLab、RHEL AI和OpenShift AI,提供了强大的技术支持和平台服务。这一策略不仅简化了AI应用的开发和部署过程,还帮助企业克服了AI实施过程中的技术和资源挑战,加速了企业数字化转型的步伐。
生态共建,以开源反哺开源
开源社区一直被视为AI技术创新的重要引擎。红帽公司深谙此道,推出了如OpenShift AI和InstructLab等一系列前沿的开源工具。当企业选择参与并贡献于这一生态时,它们不仅为开源社区注入了宝贵的资源和活力,同时也在这一过程中深化了对AI领域的理解,增强了自身的竞争实力。通过开源贡献,企业能够跨越地域的界限,与全球的开发者携手合作,共同解决难题,推动AI技术的边界不断拓宽。
持续的创新和优化始终是开源生态的核心动力。随着越来越多的企业和开发者加入这一大家庭,AI技术得以不断演进和完善。红帽的开源工具和平台正是这一持续创新的坚实基石,它们帮助企业紧跟技术潮流,保持行业领先地位,实现业务目标与技术创新的和谐共进。通过共同建设开源生态,红帽携手全球的开发者和企业,共同塑造AI技术的未来。