2013年4月26日-27日,由51CTO传媒集团旗下WOT(World Of Tech)品牌主办的2013大数据全球技术峰会在北京富力万丽酒店召开。本次峰会将围绕大数据基础架构与上层应用的生态系统,解决大规模数据引发的问题,探索大数据基础的解决方案,激发数据挖掘带来的竞争力,让数据发出声音。51CTO作为本次峰会的主办方,将全程视频、图文直播报道这场数据的盛宴,更多内容请点击专题:2013大数据全球技术峰会。
在27日下午的互联网与大数据专场中,优酷土豆数据平台架构师傅杰发表了主题为“集团化企业开放数据平台构建之路”的演讲。演讲中,傅杰解析了开放数据平台构建的方法,并介绍了优酷土豆集团的开放数据平台。
优酷土豆数据平台架构师傅杰
他谈到,企业集团化带来了物理孤岛和逻辑孤岛,物理孤岛带来重复造轮和资源浪费,逻辑孤岛带来数据关联问题和数据标准问题。优酷土豆解决物理孤岛是从集中存储、统一采集和开放计算的方式。他指出,要把Hadoop平台开放出去,但要解决身份问题、数据权限问题、灾备和安全问题,要保证Hadoop安全开放,要集成Kerheros,解决用户身份认证问题;自定义用户组;监控报表;开放注册用户。
在建设过程中,也遇到了许多问题,例如,System out、机房迁移(jaas bug)、公平调度器故障、JobTracker堆栈满等。
在解决逻辑孤岛方面,是从数据易用,封装数据服务,打造数据产品三方面入手,形成开放的数据平台。
之后,傅杰介绍了优酷土豆集团的开放数据平台的具体情况,优酷土豆的数据平台辐射范围包含推荐、搜库、广告、分层、运营、拍客、指数,数据平台的架构、平台的服务等。
以上是51CTO.com记者从一线为您带来的精彩报道。后续我们还有更加精彩的独家报道,敬请关注。