然而Twitter确实承载着大量极具价值的大数据专业知识——前提是我们知道要在哪里找到它们。与其它社交平台一样,Twitter有时候同样嘈杂而毫无实际价值。如果再加上“大数据”这个时髦词汇,这里的混乱与繁杂又将上升到新的高度。因此,我们到底该如何寻获可资借鉴的有价值信息?
如果大家不太过纠结于“大数据”这一专业词汇,那么找到的信息往往更具参考意义。“通常情况下,那些最热心的大数据讨论者们往往根本不是什么‘大数据专家’,”MongoDB公司营销、业务发展以及集团战略副总裁MattAsay表示。
Asay与其他一些对大数据领域有着深刻见解的专家为我们带来了Twitter上那些最值得关注的发布对象,这些发布者带来的新闻、主张以及网络等等足以充实学习者的大脑。当然,我们也从中进行了第二轮甄选,最终提出十位在Twitter上最值得关注的大数据专家。当然这只是一个起点——大家完全可以为自己列出一条更长的关注名单(稍后我们会进一步阐述)。说到他们位列推荐榜的共同特征,这些专家都成功地在140个字母的严苛限制下完成了大数据知识传播这一高难度任务。
这无疑是件好事。任何人都可以轻松在自己的推文或者其它通信方式中加入“大数据”或者其它相关技术术语,但这并不意味着这些家伙真当得起“专家”的名头——这正如我可以在推文中讨论美味糕点的制作方法,但这并不代表我本人是位技艺出众的大厨。因此即使是在相关术语之外谈论其它技术领域——例如开源——虽然从表面上看大数据的契合程度并不紧密,但同样有可能与之保持高度相关性。请大家在选择关注对象时牢牢记住这一前提,否则很可能被花里胡哨的内容搅乱了心神。
Asay还指出,有时候直奔特定信息类型的来源也是很有效的学习方式。“我通常倾向于PewResearch这类能够直接获取重要信息的关注对象,而不愿通过他人引述的方式了解情况。”
我们之前曾经在《Twitter上值得关注的IT领导者》一文中探讨过此类选择标准,这些规则在大数据领域自然也同样适用、只不过需要在细节上作出调整。我们并不会以特定的工作职级或者岗位作为评判标准,只要工作内容上有所关联即可过关。(在这里我们只考虑发布信息的个人,组织或者企业并不在考量范围之内。)
我们还除非了那些与大数据方案的销售、市场推广以及其它类似事务有关的发布者。Asay本人就是个很好的例子——虽然他发布的内容同样值得关注,但由于在“营销、业务拓展以及企业战略”方面身负要职,因此我们不会将他纳入名单。我们对关注对象的现有关注者数量方面没有提出硬性要求,毕竟更重要的是所发布信息的质量与一致性、而非人气高低(不过本次上榜者当中确实有一些已然拥有大量关注者)。
让我们再次回到榜单本身:本次选择错过了哪些理想关注对象?我们认为这份名单本身非常优秀,但它仅仅算是个开端而并非最终成果。根据个人取向的不同,大家也可以拥有与众不同的个人选择。为什么一定要固守在圈子、学习与现有网络的束缚之下,社交平台的本质在于共享,因此不要被太多不必要因素阻碍了手脚。大家不妨在评论中写下自己喜爱的大数据技术大师,从而让他们的真知灼见能为更多人带来启发。
Gartner公司IT分析师,MervAdrian(@merv)
MongoDB公司的Asay力荐Adrian,此外Gartner同僚SvetlanaSicular与RedMonk公司的StephenO’Grady(同样位列此份榜单)也得到了他的肯定。Asay表示,这几位都是帮助他了解大数据情报的好伙伴。原因之一:三个人从来不会搞炒作、推噱头。“每一位都能帮助大家更清晰地勾勒出大数据宏观框架,同时又不至于被层出不穷的热门消息搞得应接不暇,”Asay指出。Adrian的推文通常以Hadoop、NoSQL以及微软等为主要话题。
RedMonk公司分析师StephenO’Grady(@sogrady)
O’Grady是Asay推荐的大数据三巨头中的另一位,喜欢直接通过搜索热门词语——也就是“大数据”——进行查找的朋友很容易与他失之交臂。他的推文与博文涉及各类软件与开发话题,而且并不局限于此。这里要提醒洋基队的球迷:O’Grady是位新英格兰人,所以有时候会发布一些关于红袜队的消息——而且往往与IT技术相关。
Gartner公司研究主管SvetlanaSicular(@Sve_Sic)
作为Asay推荐的大数据三巨头第三名,Sicular的推文围绕着大数据、分析、商务智能、数据仓库、数据架构以及Hadoop等相关话题展开。她还会在推文中提到大数据领域的特定供应商,例如Cloudera,并分享她本人在Gartner研究工作中了解到的报告信息,例如:到2015年,便于25%的大型企业将配备“首席数据官”职位。
乔治梅森大学数据科学家、天体物理学与计算机科学教授KirkBorne(@KirkDBorne)
大家千万别被“火箭科学家”这类称谓吓破了胆,Borne经常会在自己的Twitter上发表一些建议,同时定期为我们带来与大数据及相关话题相关的新闻与链接。在MongoDB公司的Asay看来,Borne的推文相当于一份业界消息必读清单——这一论断也得到了技术人员们的广泛认可。Borne“会定期发布及转发与大数据及数据科学紧密相关的文章链接,”Revolution分析公司执行长DavidSmith表示。“我喜欢看他以科学视角品评这类传统的、面向业务的文章。”
KDNuggets.com网站编辑GregoryPiatetsky(@kdnuggets)
Piatetsky所供职的KDNuggets网站(其中KD是指‘KnowledgeDiscovery’,即知识探索)堪称一座满载大数据、数据挖掘以及分析信息的宝库。他的推文除了关注以上重点内容之外,也经常涉及网络上流传广播的各类大数据指导性消息。各位求职者们请格外注意:KDNuggets网站还地定期发布与数据技术工作岗位相关的最新情报。
数据科学家兼新闻工作者LillianPierson(@BigDataGal)
对于一位身兼数据科学家与新闻工作者两双身份的从业人员,我们有什么不理由不发自内心地表示喜爱?Pierson通过自己的Data-Mania网站与多家客户保持着密切合作,她的推文则带来大量大数据相关新闻、数据可视化讨论、对于数据相关厂商的见解以及其它主题。
Analytical-Solution公司创始人CarlaGentry(@data_nerd)
作为一位职业数据科学家,Gentry以自己锐利的视角观察新闻与发展趋势,并在推文中对这些有可能影响业务走向的因素加以剖析。她往往能够快拿出自己的评判结论,例如数据科学与大数据并非同义词——事实上前者的出现时间远远早于后者。
Fitzgerald公司公司创始人兼总裁JaimeFitzgerald(@jaimefitzgerald)
Fitzgerald与华尔街银行及其它一些企业保持着密切的合作关系,旨在共同开发出量化且由数据驱动的业务发展战略。他的推文主要讨论分析、大数据对基准业绩的影响、业务重大活动、数据科学以及其它一些议题。
Ovum公司IT分析师TonyBaer(@TonyBaer)
作为一位在分析业界广受赞许的从业者,Baer在Ovum公司领导着大数据研究工作的进行。他在推文中经常提及一系列大数据话题,包括开放数据与数据管理;Cloudera、MongoDB、Cloudant以及HortonWorks等相关厂商与平台;再加上其它一些相关话题。他在之前的职业生涯中还从事过新闻工作,并曾在包括InformationWeek在内的多家知识企业担任过职务。
Spark战略业务解决方案公司CTOMarcusBorba(@marcusborba)
如果大家对于如何将大数据转化为实实在在的业务绩效——换言之、变成金钱——感兴趣,那么Borba的推文可绝对不能错过。除了定期发布与大数据及分析事务相关的推文之外,Borba还会分享一些来自其他关注对象的意见与建议。