【51CTO 3月8日外电头条】微软数年之前就抛出了代号为Trinity的图形数据库研究项目,但从那以来我就没听到过任何跟进信息。恰逢TechFest研究展会开幕之际,对于该项目颇为关注的我们自然不能放过这个好机会。
一位读者朋友(特此鸣谢Gregg Le Blanc)发给我一条链接—— 一个代号为Trinity的微软研究报告 。用官方的话来说,这是一款“图形数据库及计算平台”。
由于本周是微软TechFest内部研究展会向员工开放的时段(而三月六号微软则允许指定媒体及嘉宾参与展会参观),因此我们一定得把握好这个时机,对该研究项目一探究竟。
以下是微软对代码Trinity的研究项目给出的说明:
“ Trinity是一款图形数据库及图形化计算平台 ,以分布式内存云为设施基础。Trinity项目的核心是以内存为基础的分布式键值存储机制,而完全以内存搭建的键值存储体系使得Trinity能够为随机数据访问提供高速响应。这一特色使得Trinity在处理大规模图形化任务时具有其它项目难以企及的天然优势。Trinity是一款立足于数据管理层视角的图形类数据库,并在图形分析领域扮演着并行图形计算平台的角色。作为一款数据库,它具备包括数据检索、并行查询处理、并行控制等诸多功能。而作为一款计算平台,它又能够为大型图形提供以顶点为基础的并行图形计算能力。”
以下是该项目的基本构架图:
Trinity立足于分布式内存存储层之上,也就是所谓“内存云”。Trinity所提供的实用工具包括一款“高速十亿级图形节点生成器”、Trinity Shell以及一系列其它管理工具。
根据Trinity官方报告的说法,Trinity项目的代码目前只能通过微软企业内部网获取。这样一个还未彻底公布的项目到底有什么吸引力呢?
首先,Trinity可以帮助我们完成网络搜索工作。Trinity应用程序报告展示了这样一个例子,在Facebook这样的“网络级社交站点”中搜索相关信息。微软的Bing搜索引擎能够检索用户的Facebook网络,以找出与搜索对象相关的提示信息,但这一过程工作量无疑是巨大的,同时又要求迅速反馈出结果。
在展示过程中,工作人员以某个拥有130位好友的Facebook账户为例,结果在Trinity的强大处理能力之下,两段式查询的执行时间被控制在10毫秒以内。研究人员表示,三段式查询也只需要耗时100毫秒左右。
Trinity应用程序的另一大亮点则是Probase——另一个微软研究项目,其设计目的在于改善设备与人类直接沟通的能力。Probase的***发布版于2011年5月开放下载,而Trinity正是为Probase提供知识储备的底层基础设施。
Trinity上手指南0.06版 已经于2012年1月开放下载,而且我刚刚听说,原来从2011年8月开始,Trinity的Hanselminutes播客 也已经上线了。感兴趣的朋友不妨以后多多关注。
鉴于微软对大数据及相关分析业务的日益关注,像Trinity这样的项目似乎很可能成为微软产品阵营中又一个影响深远的分支。
原文:Microsoft's Trinity: A graph database with web-scale potential
【编辑推荐】