5月23日消息,在2017国际知识发现与数据挖掘大会(KDD)全球论文投稿中,阿里集团和蚂蚁金服共有5篇论文被大会收录,这是继年初阿里云获得KDD Cup 2017举办权之后,阿里巴巴在国际数据挖掘顶会KDD学术成果上的又一次突破。
图 KDD 2017 官网图片
KDD的英文全称是Knowledge Discovery and Data Mining,即知识发现与数据挖掘,由美国计算机协会ACM下的数据挖掘分会举办,是国际数据挖掘领域的***会议,每年有大量来自世界各地的学术界和工业界人士参与此盛会。KDD 2017共吸引全世界1144篇论文投递,收录216篇,包括清华、中科院、阿里在内的中国大陆学术界和工业界共被收录25篇。今年8月,KDD 2017大会将在加拿大港口城市哈利法克斯召开,被称为大数据领域奥运会的KDD Cup也会同期举办。
据了解,阿里巴巴本次被收录论文涵盖深度学习、大规模图计算、商品智能排序等多个研究领域,基于真实的业务场景或数据样本,文中部分方法结论已经在业务中运用。如深度学习语义建模研究中提出了一种新的文本语义编码算法conv-RNN,该模型在参考了较为常用的文本语义编码模型循环神经网络与卷积神经网络的同时,进行了进一步的文本语义编码优化,实现更为精准的文本分类和问答匹配并已应用于阿里智能问答系统中。
作为全球***的互联网科技企业,过去一年阿里电商整体规模超过3.7万亿人民币,记录数亿的活跃用户购买行为数据、数十亿的商品多维特征的刻画数据,有EB级别的数据沉淀。拥有海量数据的阿里在年初就发布NASA计划,目的为“为了解决10年、20年后的困难”,另外还正在与国内外***学术机构中科院、SIGIR、ASPLOS等拓展合作,不久前,阿里iDST负责人金榕就受邀担任国际计算机学会中国理事会常务理事。在部分领域阿里已经实现突破,如联合中科院研制出中国首台光量子计算机,单位体积内的计算能力提升10倍的液冷服务器也计划2018年大规模商用。