HortonworksTed Yu:中国参与国际交流正在加速

原创
网络
语言和时差都是次要问题,关键是要有信心用英语把技术问题描述清楚。此外写代码也要规范,这样才能够被北美主流的开发员和公司所接受。

   【51CTO.com原创稿件】2016年11月25-26日,WOT2016大数据峰会在北京粤财JW万豪酒店召开,50多位大数据领域一线专家、数据技术先行者齐聚现场,在围绕数据智能、大数据商业、区块链、实时计算、系统架构、NoSQL等前沿技术话题展开深度交流和沟通探讨的同时,分享大数据领域***实践和最热门的行业应用。

  在WOT2016大数据技术峰会的上午KeyNote主题专场,Hortonworks高级技术成员HBase核心贡献者Ted Yu发表了演讲,会后记者采访了他,请他为大家分享了他的技术感悟。

[[177125]]

  Ted Yu告诉记者,他演讲的题目是TinyLFU,它用很多办法来减少对于原数据的内存化应用,能够在占用非常小内存的情况下,达到比较高的性能。

  一点都不宅的技术分享者

  Ted Yu说话的语速很快,又夹杂着大量英文技术术语。在他演讲时,坐在记者身边的一位听众和别人小声讨论,赞叹他的思维逻辑缜密。在采访中记者也发现,Ted Yu很善于交谈,作为一个在大数据行业非常活跃的技术研发者,Ted Yu身上丝毫没有技术宅男不善言辞的标签。

  对此Ted Yu的解释是,这是历史原因造成的。他接触HBase比较早,迄今已经六年了。近几年他开始回国参加一些行业讨论活动。通过交流他发现,国内近几年在大数据方面成长非常快,Hadoop技术传入中国后得到技术人员的追捧,此外国内的技术人员把开源的技术理解得十分透彻,并且产生了自己的技术,不止一个大数据的平台,这是非常可喜的现象。“我回国也希望将大数据方面新的动向带给大家,同时也同国内同行取经。”

  反馈社区的必备前提

  在开源社区,很多人都坦言中国技术人员对社区的回馈较少。对Ted Yu有不同的看法。他说像Hadoop、HBase国外发起的这些开源项目,不论编程还是交流都是英文,国内的技术人员英文水平参差不齐,有人很难用英文去表述清楚自己的思想,这样就带来了一定的局限性。但是Ted Yu也认为,这几年,这种情况正在逐渐改善。

  Ted Yu还用Apache HBase作为示例,他表示Apache HBase管理非常民主,当有人提出解决技术的方案时,需要用英语表明这个方案要解决什么问题、这个方案是怎么设计的、有哪些长处和短处。其他人来看提议时,会结合自己的实际经验。大家还更看重这个解决方案在解决问题的同时,能否兼顾别人的需求。

  “如果不能的话,大家会更担心引入这个技术方案会不会使整体的稳定度下降。像Hadoop、HBase、Spark相对于成熟的产品来讲,一般不能允许出现稳定性下降的。” Ted Yu表示,这就需要程序员花相当多的时间和社区沟通,对于中国程序员而言又存在时差问题,所以沟通可能没有那么及时。

  当然,Ted Yu也承认,语言和时差都是次要问题,关键是要有信心用英语把技术问题描述清楚。此外写代码也要规范,这样才能够被北美主流的开发员和公司所接受。

  Hbase的今年和明年

  当记者问及Ted Yu所研发领域的动态时,Ted Yu表示数据随着时间的流逝不停有新的数据进来,为了减少compaction i/o放大,现在已经进入production。另外在读路径上,HBase是用JAVA写的,不管用CMS,都会面临GC调优问题。对于不同的workload都会有不同的参数。最终解决办法把很多数据存放下JAVA堆下面。去年主要做的是读路径上,包括小米还有英特尔的开发员在做写路径,写路径上offheap明显是难了。“但是我觉得到明年还是有望解决的,这个好处就是,如果你用HBase在后台支持你的业务的话,稳定性会明显提高。”

  此外Ted Yu还介绍到,HBase在读路径上堆到JAVA下面,他参与的是备份层面。在关系数据库大家做的容灾就是定期把数据进行备份,如果出现容灾的话,再把备份的数据返回到异地机群,他希望在今年12月能够提交到master branch。

  采访***,Ted Yu从自己关注的领域与大家分享了他对大数据的理解。“个人精力有限,我最多还是关注HBase、Phoenix是和HBase直接相关的项目,主要有HBase、Phoenix、Spark、Flink这四个项目,我觉得这四个项目在2016年发展很快,进入2017年,Spark在SQL查询上能够在性能上迅速地拉近和Hive的差距,大有在很多方面替代Hive的趋势。”

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】

责任编辑:周雪 来源: 51CTO
相关推荐

2017-03-20 09:48:01

东软汽车信息安全标注国际标准

2015-02-11 16:23:37

2012-11-16 14:33:13

2012-06-06 10:01:19

网宿科技CDN

2009-11-10 13:25:33

天河一号HPC

2017-07-03 19:03:18

2010-01-05 10:59:27

服务外包信息安全

2019-01-02 14:35:10

区块链安全风险国际监管

2012-08-29 10:53:25

2012-11-13 10:47:59

大数据HBaseHadoop

2010-08-17 17:01:14

华为认证

2011-11-02 13:06:39

2018-03-12 14:15:32

华为

2017-10-24 10:10:59

华为

2010-05-07 21:22:46

QAICMMI体系深信服科技

2023-11-20 14:10:29

NEC

2017-04-05 15:14:29

物联网世界
点赞
收藏

51CTO技术栈公众号