大数据初创公司 InfoChimps已经被IT专业服务巨头CSC收购,InfoChimps从2009年开始进入大数据市场,不过这家位于德克萨斯州奥斯丁的创业公司,在2012年2月份就从数据市场转型为大数据平台提供商,当然,这是一个非常明智的决策。虽然本次收购(特别是买家的表现)让人感觉非常突然,但也不是太震惊。
GigaOM的记者Derrick Harris表示非常喜欢InfoChimps的团队,也希望他们能有更好的运气。虽然本次收购的金额并没有对外公布,但是可以推断出应该是一次成功的交易(因为InfoChimps的***执行官Jim Kaskade公司告诉Derrick,股东们对价格相当满意)。无论价格多少,这笔交易让两家公司达到了双赢:CSC得到下一代的大数据技术和知识,这会满足自身客户群的更多需求,毕竟CSC也想拓展自己的云计算业务,而Infochimps初始就被设计成可以运行于公有云平台,也可以部署在一些大公司的私有云平台之上。
InfoChimps平台架构
数据收集:InfoChimps提供了多种方式来将数据导入到系统之中,集成连接器几乎涵盖了所有的数据体积、速度以及类型。无论是从数据库批量的读取,或者是从数据源做实时的收集。集成连接器包括了HTTP posts或流式,或者各种收集机器日志数据的方法。
大数据云:这是InfoChimps帮助用户进行管理、托管以及支持的底层设施。Cloud::Streams进行实时的流数据分析,并确保数据能够交付给Cloud::Hadoop、Cloud::Queries,或者是其他目标(诸如数据库、Hadoop集群和应用程序等等)。
数据处理:用户可以使用传统的方式与Hadoop进行交互,比如Java MapReduce,高级语言Pig、Hive等等。同时用户也可以利用Storm的原生API(使用Trident)。除此之外,还可以使用Wukong(一个基于Ruby的命令行界面,开发者可以编写大数据应用调用Data Delivery Service或Hadoop,使用的语法也非常简单,开发者无需学习MapReduce或者Flume),无论是流处理环境,还是批处理环境,Wukong脚本都可以工作。
数据查询:在API层还包括许多原生的API,还有一些InfoChimps为所有的数据库和Hadoop集群提供的接口。
控制中心:基于Web的图形用户界面,用于控制和监视InfoChimps的云应用程序和数据流。
此外,根据Kaskade在周二发表的博文来看,貌似InfoChimps的团队也将继续保留,并作为CSC的子公司进行运营,这就像Salesforce.com在2010年买下PaaS平台Heroku时的交易模式。
其实大多数初创公司都有自己的目标,或者至少能够获得一笔丰厚的资金收购回报。但很不幸的是,很多IT创业公司都在这个“硝烟弥漫,遍地残垣”的市场苦苦煎熬。现在大数据已经被过度的“炒作”,企业也不愿意为那些没有潜在价值的公司注资。如果没有什么特别之处,也很难吸引买家的眼球。