【51CTO综合报道】微软“编程之美全国挑战赛”日前在北京落下帷幕。本次大赛以“大数据的可视化处理”为主题,共吸引了来自全国50多所高校的3850名同学参加,经过几轮激烈的角逐,最终有10位幸运者获得了微软的实习机会。
2012年6月6日,记者有幸在北京中关村微软亚太研发集团大厦内见到了这些出类拔萃的参赛者和他们的作品。根据参赛要求,他们需要在规定时间内,完成对相应数据量的处理和分析。整个过程只限定大数据可视化处理的大方向,其他细节不做更多限制。
活动当天,记者观看了几位参赛者的大数据处理DEMO,发现不少同学的集中点是放在大数据信息的图形化展示上,或者对数据的初步筛选。虽然在后期综合分析处理的思路上有所欠缺,但已初见大数据处理的雏形。
IEEE标准协会董事Ted Olsen先生与51CTO记者一同观看Demo
IEEE标准协会董事Ted Olsen先生在与51CTO记者同时观看一位参赛者的DEMO时,对于大数据方面的进步表现得非常激动。Ted先生说:“我年轻时做过Coder,在我写代码的那个年代,需要将不同的代码按照不同的颜色进行分类,数据也是如此。现在,即使是海量数据都已经可以做到瞬间处理完成。大数据技术在类似能源、交通领域的应用将潜力巨大。”
当51CTO记者与上海交通大学的黄偲进行交流时,发现他的大数据可视化处理Demo有其独特之处。首先,黄同学的Demo除了有简单的图标分析外,还有不同用户的相似度分析。比如B75号用户喜好的论文作者,与B156号用户的喜好类似。那么在B75号用户的界面,就能看到一些跟他喜好相似的用户提示。这有点类似SNS网站中的好友推荐功能。尽管这个功能不是什么新鲜事物,但能够想到并设计出权值计算公式来完成,确实有其与众不同的地方。
其次,在Demo中,黄同学还应用了学术圈的概念,论文作者最终会形成一个类似集群的组织。作者之间会有自己的联系线,这些线产生的原因是他们都在研究相似的科学命题。最终在黄同学的学术圈逻辑图上,我们能看到一个学术圈总会有一个“核心”人物,也就是我们常识中的大牛。他的研究与其他人都有很强的联系。而不同的学术圈,会通过一到两个跨学术领域的个人联系起来。这样的数据分析,有点大数据最终数据挖掘的味道了。不出所料,黄偲同学摘得大赛桂冠,获得了赴美参加电气电子工程师学会(IEEE)大会和前往微软总部参观的机会。
类似黄同学这样具备很强发散思维和奇思妙想的青年人,会成为未来大数据领域的新动力。大赛评委会主席邹欣认为,此次参赛选手技术能力强,功底深厚,思维灵活,并能将各学科知识融会贯通,在软件开发方面潜力巨大。他特别指出:“希望未来的参赛选手能更具有冒险精神,勇于挑战难度较高的竞赛题目。现代软件开发已经进入团队协作的时代,同学们需要增强自己学习和理解已有程序代码的能力,这将有助于他们更快地成长。”
大数据尽管被提出的时间不短,但相关实践还更多的集中在萌芽阶段。51CTO已经关注到类似Google Bigquery这样的大数据实际应用。但考虑到未来大数据技术的发展,我们期待更多类似微软“编程之美全国挑战赛”这样的活动来挖掘更多的青年力量。