12月23日,由中国信息通信研究院主办,以“打造超弹性无损智算IP广域网,加速迈向智能时代”为主题的智算IP广域网产业交流会在北京成功举办。会上,浙江联通建设发展部总经理汤滢琪受邀发表了《打造高通量、高性能、高智能算网一体的算力智联网,探索存算拉远服务新模式》的主题演讲,深入分享了浙江联通在算力智联网AINet建设方面的阶段性创新成果及实践经验。
汤滢琪介绍到,当前AI智算需求旺盛,海量样本数据处理过程中存在两大挑战:一是数据多存储于企业端,部分安全性要求较高的数据不便外迁;二是样本数据量激增,AI智算中心在具备强大算力的同时,还需额外配备存储资源,显著提升了建设成本。
针对上述挑战,业内对实现“存算分离拉远、样本随训随拉”的需求迫切。存算分离技术是指将存储数据的仓库和对数据进行计算的加工厂独立开来,在训练时远端存储设备中的样本数据通过广域网,直接被传送到智算中心的智算服务器内存中进行计算,而不需要先存储到本地的磁盘里再进行处理,可以有效保证用户数据的安全性和一致性。
汤滢琪接着分享到,在联通服装制造军团“衣瞳行业模型”训练场景中,原始数据主要基于服装多模态数据,服装生产厂家使用“衣瞳行业模型”可实现实时检测,但是很多服装厂家的服装数据需要产权保护不愿公开,而基于存算分离的创新训练模式,刚好完美契合了用户需求。
针对这种AI敏感数据的本地存储异地训练的场景,浙江联通提出了创新的业务模式。基于中国联通全新的算力智联网AINet,依托“网络+平台”两大基础底座和高通量、高性能、高智能的“三高”核心能力,同时采用华为下一代路由器系列产品,浙江联通成功在杭州与金华两地间实施了业界首次30TB样本数据的跨200公里存算分离拉远训练,经过实际测算,训练效率高达97%。本次存算拉远测试项目取得的主要创新成果包括:
首先,以跨地市AI大模型训练能力创新重构智算训练模式。传统的智算集中训练模式,需要用户将样本上传到智算中心进行落盘训练,但是部分用户对隐私样本落盘存在安全顾虑。浙江联通通过IP广域无损方案,实现了杭州存、金华训的“数据不落盘”拉远训练,以算网协同的能力,为企业用户隐私样本训练探索出了一条新路。
其次,样本数据总量达30TB,传输距离超200公里,计算拉远效率大于97%。通过联通服装制造军团“衣瞳行业模型”的AI训练存算分离现网测试。充分验证了针对AI训练业务存算拉远的技术可行性,未来有相关数据敏感业务需求的用户可通过运营商算力服务,完成隐私样本不出园区的拉远训练,实现成本与安全的最佳平衡。
最后,汤滢琪表示,浙江联通将继续深化数字融合战略,持续推动传统产业转型升级,特别是打造“高通量、高性能、高智能”的算力智联网AINet,积极探索弹性带宽、任务式服务、数据快递、无损传输等创新服务模式。通过这些创新服务模式,赋能千行百业的数字化转型升级,为构建AI智能时代的新生态贡献力量。