腾讯打破2016 Sort Benchmark 4项纪录,98.8秒完成100TB数据排序

企业动态
11月10日,具有计算奥运会之称的Sort Benchmark全球排序竞赛公布2016年最终成绩,腾讯云大数据联合团队用时不到99秒(98.8秒)就完成100TB的数据排序,打破阿里云去年创造的329秒的纪录。在更早前,百度创造的纪录是716秒,Hadoop的纪录是4222秒。

11月10日,具有计算奥运会之称的Sort Benchmark全球排序竞赛公布2016年最终成绩,腾讯云大数据联合团队用时不到99秒(98.8秒)就完成100TB的数据排序,打破阿里云去年创造的329秒的纪录。在更早前,百度创造的纪录是716秒,Hadoop的纪录是4222秒。

在这次竞赛中,腾讯云数智分布式计算平台,夺得Sort Benchmark大赛GraySort和MinuteSort的冠军,总共创造四项世界纪录,将去年阿里云的纪录整体提高2倍到5倍。腾讯名列全球大数据***梯队领军企业,这也是全球大数据性能进化史的重要里程碑。 

每年全球***公司和学术机构都会来参加该赛事,以评估软硬件系统架构能力及***研究成果。这项赛事包括四项比赛,腾讯云大数据联合团队参加的是含金量***的GraySort和MinuteSort两项排序竞赛,重点评测大规模分布式系统的软硬件架构能力及平台的计算效率,以上两项比赛均包括Indy(专用目的排序)和Daytona(通用目的排序)两个子项。数智一举夺得上述四个子项的冠军,总体将去年的纪录提高2倍到5倍。 

GraySort竞赛比拼的是如何在最短的时间内,将总共100TB,一共1万亿条无序的100字节纪录,按照从小到大的顺序进行排序。数智用时98.8秒完成100TB的数据排序,即每分钟完成60.7TB的数据排序,去年冠军的纪录为18.2TB/分钟。MinuteSort竞赛,比拼的是在1分钟之内能够完成多少数据量的排序。数智的成绩为1分钟完成55TB的排序,去年冠军的纪录是11TB,数智将这一数据量提升5倍。Sort Benchmark通过排序竞赛考量一家公司或机构大规模计算能力的综合实力,通过排序这个最基本的计算问题,不仅全面评测分布式系统软件架构能力(如海量数据分布式存储、计算任务切片调度、节点通信协调同步、数据计算监控容灾等性能),也评测了硬件架构能力(如服务器硬件选配、网络架构调优、IDC规划建设能力等)。在这次排序竞赛中,腾讯云大数据联合团队在基础架构上采用了512台IBM的OpenPOWER服务器和迈络思公司的100Gb互联技术,这也让腾讯云大数据产品的性能取得进一步提升。

腾讯云副总裁、腾讯数据平台部总经理蒋杰表示,全球企业正在进入企业数据和社会数据的全融合时代,从浩瀚的大数据中寻找新业务航向,甚至建立全新的商业模式,正在成为这个时代企业的生存和发展***,腾讯云全面开放腾讯18年海量大数据处理经验,为企业在最短的时间内,用最少的资源提供精准的计算,建立核心商业竞争优势。

此次参赛的腾讯云大数据联合团队由腾讯云存储产品中心、腾讯数据平台部组成,这个团队在大数据技术和应用管理上有非常丰富的实践经验,尤其是腾讯数据平台部一直在管理的腾讯大数据集群,是世界上***的大数据集群之一。此前,这个团队一直苦练内功,多年技术积累让他们在全球计算奥运会上取得非常瞩目的成绩。

在对微信每天160亿级别的多维分析场景中,数智能够做到6秒返回结果;数智是腾讯云在互联网海量数据处理经验之上,结合开源Hadoop生态和自研组件服务,对外提供的一站式数据分析与挖掘平台,已在政府、传统企业和互联网企业中被深度应用。

业内人士评价,今年评测的结果显示,腾讯在大数据的技术积累超出了业界想象,未来腾讯持续向中国企业输出大数据和云计算能力,将会让中国更大范围的参与全球的商业竞争,提升中国经济在全球经济的市场占有率。

Sort Benchmark排序竞赛官网公布的结果:http://sortbenchmark.org/ 

 

 

责任编辑:润月 来源: 51cto
相关推荐

2016-11-14 17:32:50

腾讯云大数据

2015-10-28 16:54:07

阿里云云计算

2015-11-04 15:07:43

阿里云云计算飞天

2018-03-27 15:10:35

机械盘无限寿命

2017-09-25 10:27:37

阿里云POLARDB数据库

2017-09-22 09:22:55

阿里云POLARDB实现

2022-11-23 17:44:10

HadoopHDFS

2018-03-27 17:38:49

硬盘

2023-02-02 13:22:40

AICIFAR数据集

2014-12-15 10:34:14

2015-12-22 10:03:00

开源Apache Spar开源项目

2019-07-18 11:17:53

数据

2017-10-12 10:39:54

阿里云POLARDB存储

2016-11-18 11:39:59

Sort Benchm

2009-05-19 15:49:43

开源数据记录

2012-06-19 09:27:37

IBM超级计算机

2020-08-21 17:17:30

腾讯云公有云人工智能

2023-10-05 06:02:52

计数排序Counting

2022-09-26 11:51:47

电信机房光纤连接

2018-09-26 11:02:04

华为云
点赞
收藏

51CTO技术栈公众号