HBase核心贡献者Ted Yu:参与开源比收入更重要

云计算
Ted Yu目前在eBay带领着Hadoop团队,并成为了Apache HBase的PMC成员,目前在PMC中只有23名成员。Apache项目按照贡献度“论资排辈”,只有作出足够的核心贡献才能进入PMC。日前,CSDN对其进行了采访,畅谈了自己的成长故事。

Ted Yu出生在一个计算机科学氛围浓重的家庭,父母都是计算技术方面的工程师。受父母的影响,Ted在高中毕业后选择了清华技术及科学专业。目前,和许多清华的同学一样,Ted在做着一份工程师的工作。几年前,Ted在上一家公司CarrierIQ接触到了HBase。Ted特别感谢当时的主管Rahul,他给了足够的空间。当Hadoop一发布出来,Ted就敏锐的判断出这是一个新的趋势。因为Hadoop可以真正实现云计算,在未来的大有前途。目前,Ted供职于ebay,领导着Haddop的工程师团队。

 

[[97888]]

 

图:eBay Hadoop团队负责人Ted Yu

采访Ted是通过邮件进行的,尽管有时差的因素,每次往来没有超过一天的时间。强烈的时间观念、严谨的回答,没有多余的废话,这一切也许归咎于学生时期的训练或者父母的言传身教。Ted提出需要用英文进行答复,也许这是另外一种严谨的表现。在采访中,Ted告诉我,他非常幸运能走进开源的世界,并为此而自豪。在CarrierIQ,Ted很早就接触了HBase,并将其应用了生产环境中。这为他打下了良好的基础,目前Ted已经进入HBase项目的团队成员(PMC),只有参与核心代码贡献的开发者才能成为团队成员。除Ted以外,另外22名成员中还有2名华人,分别供职于Cloudera和Facebook,国内公司只有华为在其中。

Ted说,他非常高兴看到越来越的中国公司和开发者参与到开源软件中,这可以让开发者接触到公司以外的聪明人沟通学习。以下为采访全文:

记者:Ted,先做个自我介绍吧。

Ted:我拥有14年软件开发经验,以及超过两年的HBase开发经验,2011年成为HBase代码提交者和PMC的成员。最近参与了HBase 0.96项目的开发,具体包括:用Protobuf序列化重写RPC引擎;引入Write-Ahead-Log接口,使得能够加载多种WAL实现;开发表的快照功能等。同样他还密切关注HDFS、Zookeeper和MRv2。

记者:你如何走上工程师这条路的,哪些人、书籍、经历影响了你?

Ted:我的父母同在一家计算机技术机构做工程师。他们的工作自然而然的对我产生了帮助和影响,我进入清华大学并选择了计算机专业。目前,我大部分的大学同学都在做工程师的工作。

记者:如何与团队中的伙伴更好的协作,如果你可以选择队友,哪些品质是你看重的?

Ted:团队协作是获得成功非常重要的因素。我现在的团队负责eBay的Haddop架构,团队非常可靠,他们非常热爱自己的工作,并从各种角度作出贡献。一些伙伴喜欢脚本语言,并专注自动部署和排错。另外一些伙伴在Hadoop的基础代码的理解非常深入。发挥每个成员的长处,让我们达成目标。

记者:14年的开发工作,哪些回忆和伙伴给你留下了深刻印象,经历了哪些成功和挫折?

Ted:我很幸运的从事了开源软件开发工作。这要感谢我的前任主管Rahul,他给了我空间专注HBase。我此前供职的公司在生产中部署了HBase,所以需要实现高性能和稳定性。为开源项目工作可以和公司以外的聪明人交换意见。

在我的职业生涯中,我总是认真对待短暂的挫折,从中我可以反思。大部分情况下,困难并不是技术性的。只要我的目标与团队的目标一致,观点的差异总是可以解决的。

记者:为什么选择Hadoop/HBase成为自己的研究方向,怎么在短期价值(收入、获得团队和公司的认可)和长远价值(个人兴趣、技术学习积累)作出平衡?

Ted:几年前,我知道了Hadoop。我意识到,这将帮助大规模实现云计算。我之前供职的公司CarrierIQ很早就支持了Hadoop。在CarrierIQ的平台中使用了HBase,我们发现了大量的问题。作为一个开发者,在HBase各个方面,我作出了大量有价值的贡献。

帮助解决社区上的问题比提高当前的收入更重要。我非常高兴的看到越来越多的中国的公司使用并贡献HBase。我愿意为他们提供帮助,这将对HBase产生巨大的影响。

记者:Impala引起许多关注,是否花时间来研究?

Ted:Impala在其发布了吸引了大量的关注。我会把它和Hive以及Apache Drill做对比。如果Cloudera将其定位于Apache开源项目,那么它将会有非常广泛的支持者。

采访最后,Ted告诉记者,他最近参与了HBase 0.96项目的开发,月底在北京举行的Hadoop与大数据技术大会上,将会有Keynote演讲,自然要介绍HBase新版本的特性,其中包括:用Protobuf序列化重写RPC引擎;引入Write-Ahead-Log接口,使得能够加载多种WAL实现;开发表的快照功能等等。

责任编辑:王程程 来源: CSDN
相关推荐

2013-04-26 15:13:26

Ted YuHBase大数据全球技术峰会

2011-07-01 09:26:12

2013-09-09 12:35:54

MongoDB

2019-01-21 08:00:00

谷歌开源数据

2023-09-22 14:41:02

OceanBase数据库

2022-03-26 10:18:26

GoogleRust获奖者

2019-12-18 23:11:24

TF架构网络连接

2015-07-22 16:08:46

OpenStack开源贡献代码

2021-09-02 18:36:18

网络配置审计网络数据流

2024-05-13 07:58:52

开源项目PR

2020-06-18 11:14:53

微软谷歌开源

2021-10-22 10:18:51

鸿蒙HarmonyOS应用

2018-07-06 15:39:49

技术

2010-05-14 11:00:01

桌面虚拟化节约

2020-04-07 23:31:17

边缘计算云计算IT

2020-09-21 13:41:11

Cloudops

2023-09-27 08:47:19

北明软件

2016-02-01 09:24:24

Quora排行算法

2018-07-22 22:21:00

物联IOT数据
点赞
收藏

51CTO技术栈公众号