向磊:Hadoop落地为何如此之难

原创
数据库 Hadoop
Hadoop落地之所以难,是因为有一下几点问题:1. Hadoop集群部署管理难,麻烦;2. 想办法在工作上偷懒才是王道;3. 解决的问题和为人民服务。

  2013年4月26日-27日,由51CTO传媒集团旗下WOT(World Of Tech)品牌主办的2013大数据全球技术峰会在北京富力万丽酒店召开。本次峰会将围绕大数据基础架构与上层应用的生态系统,解决大规模数据引发的问题,探索大数据基础的解决方案,激发数据挖掘带来的竞争力,让数据发出声音。51CTO作为本次峰会的主办方,将全程视频、图文直播报道这场数据的盛宴,更多内容请点击专题:2013大数据全球技术峰会

 

2013大数据全球技术峰会专题

Hadoop落地之所以难,是因为有一下几点问题:1. Hadoop集群部署管理难,麻烦;2. 想办法在工作上偷懒才是王道;3. 解决的问题和为人民服务。

在安装方面的问题:

安装问题一:熟悉Linux和Shell吗?Hadoop需要在Linux或者Unix下运行,且涉及SSH,防火墙等具体细节的操作

安装问题二:3台跟30台及300台的区别?完全Linux命令行操作,费时间,易出错。安装配置3台很好办,熟练工10分钟一台,半小时。安装配置30台有点费时间,大约5小时搞定。300台,50小时?还是找10个人每人5小时?

Puppet还是别的什么工具?Puppet是不错的玩意,但是我要说但是了。需要安装Ruby,需要学习Puppet配置脚本,但仍不失为后期维护的好工具。某些商业Hadoop Manager 数千刀 / Node / 年,或者只能用他发行版的Hadoop。

安装问题三:集群实时监控,日志跟踪?几十数百台服务器,监控和日志跟踪是个问题
Cacti Ganglia 使用RRD绘图。不足的地方在于:RRD无法实时监控和自动刷新服务器信息,无法随时查看日志,必须登录服务器

在Hive方面的问题

Hive问题一:数据分析师会用Linux命令行吗?SQL != CLI

Hive问题二:Hive语言不熟悉,管理困难。MANAGED,EXTERNAL表很头痛、要映射HDFS路径、设置编解码器、增减字段,表改名...等问题。

以上是51CTO.com记者从一线为您带来的精彩报道。后续我们还有更加精彩的独家报道,敬请关注。

责任编辑:张伟 来源: 51CTO
相关推荐

2018-01-15 11:06:10

程序员编程Erlang

2012-04-24 14:41:15

HTML5

2019-05-20 14:37:31

5G基带芯片毫米波

2022-11-28 09:00:03

编程bug开发

2024-03-22 11:27:54

电缆管理数据中心

2022-05-06 17:34:27

安全代码软件漏洞

2021-08-25 23:08:52

微服务编程IT

2014-08-08 15:36:58

2021-01-26 16:21:46

边缘计算5GIoT

2015-01-08 15:38:34

Fire Phone

2009-12-04 09:46:02

Linux操作系统

2024-09-18 05:30:00

GPU内存人工智能

2012-05-10 10:23:10

技术人员开发

2009-09-17 13:06:24

2022-06-08 13:11:35

比特币挖矿区块链

2010-07-16 16:06:11

求职

2021-08-30 14:23:41

身份验证隐私管理网络安全

2024-02-26 00:00:00

JavaScript单线程高效

2013-07-16 09:31:11

2024-10-31 11:16:19

高并发并发集JDK
点赞
收藏

51CTO技术栈公众号