研究数据库技术的计算机科学家Michael Stonebraker声称,Facebook正运行着一个复杂而庞大的MySQL实现,相当于面临“比死亡还糟的命运”,唯一的出路是重新一切代码。他表示社交巨人的困境在网络创业者中很常见。
Stonebraker称,Facebook将其MySQL数据库分割成4,000个shards,以处理网站巨大的数据量;运行9000个 memcached实例,以跟上数据库的事件处理量。Facebook共有1800台MySQL专用服务器,805台memcached服务器。
【编辑推荐】
【延伸阅读】
Facebook喜欢按钮:数据金矿
社交网络巨头Facebook使用喜欢按钮和其它社交插件来记录其成员的历史访问记录,并可能将这些数据用于自己网站或第三方网站的广告定位。
据Facebook一位发言人表示,每当登录用户在第三方网站查看喜欢按钮或社交插件时,无论他们是否与之互动,该公司都会创建一个印象日志。这一记录与用户的唯一ID绑定在一起,主要包括IP地址、网址、日期、时间和浏览器等信息,并且会保留90天。
Facebook坚持公司没有将这些日志用于定位广告,并表示目前也没有计划这么做。但是,其插件在大多数主要在线出版商之间的广泛使用已经可以让Facebook构造非常全面和详细的的行为资料。正如行为定位或分析供应商在网页或广告中放置cookie追踪用户一样,Facebook通过其插件以类似的方式收集数据。
然而,行为定位公司往往会因为可以访问用户数据而补偿出版商,但Facebook却没有。Say Media主席特洛伊(Troy)表示,这取决于出版商,看他们是否认为从插件中获得的价值是否值得拿他们的观众数据来交换。“出版商一直都面临这一问题。出版业的无数厂商用数据来交换价值,而Facebook就拥有数据,而且也带来了流量。问题是,从长期来看,如果数据的价值超过了出版商内容或环境的价值呢?”他说。
虽然Facebook目前尚未使用这些收集的行为信息,但这些信息对广告客户来说是无价的,而且也能为该社交网站带来丰厚的利润。例如,如果该社交网络在十个与运动鞋相关的博客中记录了某用户的历史浏览记录,那么某鞋类零售商可能会支付溢价费用,通过在Facebook上投放广告来吸引那个用户。
在另一种情况下,Facebook有可能利用从插件及自身网站中获取的数据,推出自己的广告网络,或选择将观众数据出售给出版商,以帮助他们更好地利用广告库存赚钱。
但是,目前Facebook发言人重申,在未经其许可的情况下,没有出售用户数据,或通过插件将数据传送给第三方的情况发生;也不会与广告客户共享用户的个人信息。然而,营销人员还是可以根据用户个人资料中所写的喜好和兴趣、用户与喜欢按钮等插件的互动进行广告定位。
【编辑推荐】