美国时间10月20-23日,2019年运筹学和管理科学研究协会年会(2019 INFORMS Annual Meeting)在西雅图召开,会上滴滴凭借基于强化学习的网约车派单解决方案获国际运筹学领域的顶级实践奖项--2019年度瓦格纳运筹学杰出实践奖(Daniel H. Wagner Prize)。这也是瓦格纳运筹学杰出实践奖创建22年以来,中国公司第一次被授予该奖项。
(滴滴AI Labs团队提出的基于强化学习的网约车派单解决方案在入围项目中脱颖而出,获得2019年度Daniel H. Wagner奖)
INFORMS是全世界公认的运筹学 (OR)、管理科学 (MS) 和商业分析领域最具影响力的专业学会,每年年会及年会上颁发的瓦格纳运筹学杰出实践奖都备受关注。瓦格纳奖设立于1998年,作为国际运筹学领域的顶级实践奖项之一,其每年评选一次,旨在向全球表彰运筹学研究实践方面的杰出成果,看重分析的质量和连贯性,解决方案的独创性和数学应用,以及成功的实践,每年获奖项目也被认为是代表了运筹学领域内的最前沿应用。往届获奖项目来自康奈尔大学、佐治亚理工学院、美国疾病控制与预防中心、福特汽车、麻省理工学院、杜克大学、智利大学、美国海岸警卫队、英特尔、IBM和普林斯顿大学等。
今年INFORMS2019共吸引了全球6000余位知名学者、行业专家和学生积极参与。而瓦格纳奖评审委员会对来自全球的众多申请项目进行了筛选,最终仅有五项获得决赛提名,相关论文均收录于INFORMS Journal on Applied Analytics期刊。经过在INFORMS2019大会上的决赛轮答辩,滴滴AI Labs团队提出的基于强化学习的网约车派单解决方案,凭借其创新性和实践影响力,得到由学术和工业界组成的评审委员会一致认可,最终从入围项目中脱颖而出,获得2019年度瓦格纳运筹学杰出实践奖。
滴滴AI Labs对网约车派单问题进行半马可夫过程建模,提出基于强化学习的泛化决策迭代框架,创新有效的结合了深度强化学习,时间差学习和传统组合优化方法,在确保乘客出行体验的同时进一步提升司机的收入,体现了广泛的应用能力和影响力。
评审委员会指出,滴滴解决方案中的半马可夫过程和深度强化学习方法非常前沿,首次成功应用在派单场景。通过将数学、机器学习及仿真问题进行了创新性结合,滴滴非常新颖地应对了一个运筹学难题。
(在滴滴AI Labs强化学习团队负责人秦志伟看来,滴滴运用前沿AI技术结合传统优化来解决运筹学难题,是获得评委会青睐的关键)
本次瓦格纳奖评审委员会由IBM、马里兰大学、谷歌、微软、美国海军研究所等的研究人员和教授组成。其他决赛入围团队分则别来自于伦敦大学学院、哈佛大学、佐治亚理工学院、哥伦比亚大学等世界顶级高校,项目包括利用实时数据分析优化伦敦希斯罗机场的运营、Hopeful Journey教育中心的天级补习排班支持、系统优化丹佛公立学校校车运营、可轮转备件的定价分析等。
(INFORMS 2019现场展示2019年Daniel H. Wagner Prize决赛入围名单,滴滴凭借提出的基于强化学习的网约车派单解决方案最终脱颖而出获得第一名)