Facebook 平台有6年历史了,公司借用它的开放图谱正在不断扩张,如今有900万个应用借助这个开放图谱在社交网络平台上分一杯羹,而最近Viddy、SocialCam、VEVO等借助开放图谱获得大量用户,也说明了开放图谱的价值。
开放图谱介绍:
1. 本质上,开放图谱是一种方式,它抓取Facebook用户在第三方服务上的数据,然后反馈给Facebook 机器。这样它就可以向所有在线的朋友分享全部的信息。比如数字音乐服务Spotify, 你跟你Facebook的朋友分享你喜欢的Spotify音乐,这些小碎片全部汇集到Facebook动态更新, 然后到Facebook时间线,最后这个碎片会影响你的其它Facebook朋友。
Facebook超过9亿用户每天都会产生大量数据,但Facebook不能把所有的信息碎片显示在你的新闻动态中,开放图谱让应用和网站开发者构建他们的数据,这样Facebook机器可以重新分类并有目的性的利用这些数据。
2. Facebook的开放图谱总负责人Mike Vernal表示:“我们可以借助传统的文本分析来得出结果, 但最后还是决定建立一个构架:开发者能够明确告诉我们他应用的相关信息,这样方便我们快速提炼出更有趣,更直观的信息。”
应用开发者在自己的网站上构建数据库,Facebook就在开放图谱上构建这些应用。前Myspace母公司Fox Interactive员工Adrian Aoun认为:“Facebook之所以能打败Myspace, 就是因为它能够有效地管理数据,而且条理清楚。”
在开放图谱怎样甄选数据:
Facebook储存着两种数据:目标数据和描述目标数据关系的数据;
1. “在系统的顶层我们支持开发者定义他们的目标数据,然后像整理一般用户信息一样对开发者目标数据进行归类。”
系统主要从两部分工作:1. 分析什么内容能让Facebook听众感兴趣。2. 基于第一个分析出的结果分析什么内容对你是特别重要的。然后我们汇总这两个分析,决定新闻动态系显示什么,时间线显示什么,其他相关的系统显示什么。
2. “在网页上,我们试图分析你在寻找什么, 比如Obama有3000万粉丝, 如果你访问他的主页,我们会提示你的哪些朋友也喜欢他,我们做这个只需要几毫秒。”
当用户在Facebook上这里点击,那里点击的时候, 软件平台Scribe正在实时记录这些数据,另外一个接入Scrible的平台正在进行实时分析,得出什么是最受欢迎的,什么是最不受欢迎的。这些记录会被储存在另一个数据库里,然后显示在新闻动态,时间线里。Vernal 表示,数据从一个系统移到另一个系统耗时20-30秒,每个小时有数亿的转移行为在发生。所以才保证了Facebook这个开放图谱的高速运行。
【编辑推荐】