2013年4月26日-27日,由51CTO传媒集团旗下WOT(World Of Tech)品牌主办的2013大数据全球技术峰会在北京富力万丽酒店召开。本次峰会将围绕大数据基础架构与上层应用的生态系统,解决大规模数据引发的问题,探索大数据基础的解决方案,激发数据挖掘带来的竞争力,让数据发出声音。51CTO作为本次峰会的主办方,将全程视频、图文直播报道这场数据的盛宴,更多内容请点击专题:2013大数据全球技术峰会。
在27日Hadoop生态系统及分布式架构设计专场论坛中,Carbonite China CTO&Architech 卢亿雷发表了主题为“大数据分布式系统并行设计与I/O优化”的演讲。演讲中,卢亿雷介绍了分布式并行系统定义,分布式并行系统的特点和分布式并行系统的设计,并解析了单台机器并行设计的方法,分布式并行I/O优化的方法和单台机器分布式化的设想。
Carbonite China CTO&Architech 卢亿雷
他谈到,分布式并行系统是多个系统的集合,子系统并行的相互作用,具有很好的依赖性和透明性,它具备高可靠性、高可用性、高扩展性、高性能和高性价比。其中,分布式并行架构须包含WEB集群、计算集群、DFS集群和DB集群。
在分布式并行系统设计模式方面,可用主从结构和全对等结构,其中主从结构更加简单有效,结构清晰,但有单点失效问题,而全对等结构则无中心节点,不会出现单点失效,但很难保证数据一致性。
之后,卢亿雷在现场分析了分布式文件系统、分布式服务架构、LVS的相关案例。
在单台机器并行设计方面,需要考虑CPU、内存、磁盘、网卡、文件系统等因素。
分布式并行系统I/O优化方面,可以从操作系统优化,网络I/O策略优化,缓存策略优化,同步锁机制优化,多路复用I/O优化,TCP选项优化、内存操作优化等方面考虑。
以上是51CTO.com记者从一线为您带来的精彩报道。后续我们还有更加精彩的独家报道,敬请关注。