“深度学习框架是智能时代的操作系统。百度飞桨深度学习平台正在推动人工智能的快速发展,加快中国的产业智能化进程。”6月28日,百度首席技术官王海峰应邀参加2019中国国际软件博览会,发表了题为《飞桨深度学习平台加速产业智能化》的演讲。王海峰在演讲中分享了深度学习技术推动人工智能发展的思考,介绍了百度飞桨(PaddlePaddle)深度学习平台的优势以及助力产业智能化的成果。
王海峰表示,迄今为止人类经历的三次工业革命,分别以机械技术、电气技术和信息技术为核心驱动力,而这些技术都表现出很强的通用性。当前,我们身处以人工智能为核心驱动力量的新一轮科技革命和产业变革大潮,人工智能正在将人类社会带入智能时代。
过去的60多年时间里,人工智能的发展经历了人工规则、机器学习和深度学习三个典型阶段。以OCR和自然语言处理技术为例,深度学习的通用性优势,使得其效果大幅提升,广泛应用于各行各业。
深度学习技术的广泛应用,得益于深度学习框架。王海峰指出,在智能时代,深度学习框架起到承上启下的作用,下接芯片,上承各种应用,具有重要价值,是“智能时代的操作系统”。
现场,王海峰介绍了中国开源开放、功能完备的深度学习平台——百度飞桨。飞桨的核心框架,包括开发、训练和预测,以及涵盖推荐、视觉、自然语言处理、语音等在内的丰富模型库。同时,飞桨提供了包括迁移学习、强化学习、自动化网络结构设计、弹性深度学习计算、图神经网络等在内的工具组件。而在服务平台层面,它提供了零基础定制化训练和服务平台EasyDL、一站式实训开发平台AI Studio和端计算模型生成平台EasyEdge等。飞桨以完备的框架、工具和服务,帮助广大开发者和企业利用工具化、平台化的方式进一步降低深度学习应用门槛,加速推动产业智能化变革。
飞桨已开源70多个经过真实业务场景验证的官方模型,涵盖视觉、NLP、推荐等 AI核心技术领域,成为官方支持模型较多的深度学习平台。例如,面向工业应用的中文NLP工具集PaddleNLP,在应用任务层提供了中文词法分析、文本情感分析、短文语义匹配等能力,在基础网络层则纳入了当前业内效果较好的中文语义表示模型——ERNIE,大幅增强了模型语义表示能力,达到工业级的应用效果;而前不久刚刚发布的视频识别工具集,则覆盖了主流实用的序列建模算法与端到端视频识别模型,为开发者提供视频分类、视频定位等一系列应用技术方案。同时,飞桨具备适用大规模数据场景的分布式训练能力,从优化算力的角度为深度学习的应用提供支撑。
据悉,针对大规模稀疏特征,飞桨设计并开放了大规模稀疏参数服务器,适用于超大规模数据、海量特征和自膨胀、高频率模型迭代的业务场景。同时,针对工业级数据处理,飞桨开放了一系列数据处理技术服务于工业应用。
开发和训练后,将模型部署到各种应用场景下是非常关键的一步。飞桨提供包括底层硬件、推理引擎、多种程序设计语言、方案与服务工具在内的端到端全流程部署方案,已经在助力产业开发者实现应用的快速落地。
灵活、高效、易用是产业开发者应用深度学习技术进行开发的诉求。以往,传统神经网络的结构设计是由人根据经验设计,并不断地进行调参训练获得更优结果,这个过程较为复杂和费时费力。而飞桨开源的AutoDL Design自动化网络结构设计,是用深度学习设计深度学习,目前已经全面超过人类专家设计的网络效果,且自动化程度更高,效果更好。而针对没有深度学习技术基础的开发者,百度飞桨提供了定制化训练和服务平台EasyDL,让他们可以基于自身业务需求和数据,快速训练定制化AI模型。
王海峰以自动提取农耕地块为例,介绍了飞桨的实际应用效果。基于飞桨的农作物地块识别,在遥感影像数据的基础上,实现了地块提取准确率80%,处理效率相对人工提升数万倍,可以高效辅助作物生长、灾害监测、估产等,显著减少人力投入,对农业生产有非常重大的意义,是真正用深度学习技术实现利国利民。
现阶段,深度学习技术不断发展突破,加速与产业融合,持续提升各行各业的商业增值潜力,加速产业智能化。王海峰表示:“百度飞桨深度学习平台将携手中国的广大开发者一起,为推动中国的产业智能化发展做出更多贡献。”