如果全世界的计算机编程高手同台竞技,中国位列第几?日前,在伦敦闭幕的EMI数据科学黑客马拉松大赛上,来自上海盛大网络公司“盛大创新院”的技术团队,力克来自剑桥大学、牛津大学、密歇根大学的一流数据分析团队,一举获得冠军。由他们设计的智能推荐系统,可以根据每个用户的个性化偏好,从十几万首歌曲库中向特定用户推荐符合其口味的歌曲,推荐精度位列各队之首。
何谓智能推荐系统?众所周知,网民的性格、阅历、职业、爱好各不相同,对互联网内容也有各自的偏好,例如喜欢的歌曲风格、书籍、电影等。对于内容提供商(如音乐、电影或文学类网站等)来说,如果有一款智能推荐系统,可以根据用户个人信息,推荐符合对方口味的音乐、视频和书籍,对于提高网站的用户黏度乃至提升自身竞争力都非常关键,这也正是目前数据挖掘界的热点之一。此次科学黑客马拉松大赛,就是由EMI百代唱片公司发起,要求参赛团队在24小时内,根据海量的用户个人信息,如年龄、性别、地区、收入情况、听音乐的时间等,设计一款面向十几万用户的智能推荐歌曲系统,能够聪明地“猜出”每个用户的音乐口味,并推荐合适的歌曲。
任务听上去简单,区别就在于哪家的算法和模型对用户偏好挖掘得更深入、更精准。盛大创新院团队的5名成员均毕业于复旦、上海交大等名校的计算机系。在一天一夜的比赛时间里,他们目不转睛守候在电脑前,各自有不同的模型开发任务,然后汇总、测试,再根据评估结果进行改进。最刺激的是,各支参赛队伍都在不断改进自己的系统,比赛评审系统也会不断对各支参赛队伍提交的算法运行结果进行打分,并实时公布排名情况。比赛刚开始,盛大团队就位居第一,5名小伙子兴奋地击掌欢庆。可兴奋劲还没过去,实力强劲的对手已经发起反超,盛大团队一度被挤到第五名,还遭遇系统死机等意外情况。最后关头,他们想到了一个新的改进方案,可以明显提升系统推荐的准确率。在颁奖大会上,不少数据挖掘界的“牛人”纷纷向他们竖起大拇指,“中国的程序员真棒!我们下次比赛再一决高低!”