【爱分析专访】蒋步星：超越Oracle必须颠覆原有技术体系，数据计算是第一步-51CTO.COM

在数据可视化的概念兴起前，所谓数据的展现主要就是报表，当时中国各行业均处于信息化起步阶段，而中国报表非常复杂、统计困难，很多国际巨头软件厂商都无法解决。

此时，有一家中国厂商横空出世，以其***的非线性报表模型解决了中国报表问题，实现对国外厂商的超越，这就是蒋步星和他的润乾。

蒋步星曾被称为“数学天才”，是中国***国际数学奥利匹克竞赛团体冠军成员。从清华毕业后，先后供职于清华紫光和长天科技，于2001年创建润乾。最初靠行业软件养活团队，但蒋步星一直想做的是通用软件，不想做集成商卖别人的产品。

[[205270]]

2002年底，蒋步星将报表工具作为切入点，研究了数千张报表，依靠深厚的数学功底，发现其中规律，一举解决中国报表问题，大大提升IT人员制作报表的效率。

蒋步星没有因为报表工具的成功而停止脚步，当时有两条路可以选择，一条路是向前端发展，做BI、可视化工具，很多国内厂商选择这条路，另一条是向后端发展，解决数据计算问题。

蒋步星认为，向前端走又会回到定制化的老路，还是要坚持做通用软件的路线，因此选择了更难的一条路，做数据计算。

过去，数据计算主要依赖Oracle等数据库产品实现，Hadoop的崛起，试图去解决大规模数据计算问题，而中小规模的数据计算问题并没有得到太多的关注，还是需要昂贵的数据库产品来解决。

蒋步星将这个方向作为切入点，一方面这个问题是客户刚需，能够节省大量成本，另一方面也可以与报表产品结合起来，将底层数据处理问题解决好，有助于提升数据展现效果。

[[205271]]

经过几年潜心研发，润乾在2015年发布数据计算产品——集算器，解决了数据计算在描述和实施上的效率问题。

对蒋步星而言，集算器只是一个开始，帮助润乾从报表市场切入到数据计算这个更大的市场，替换Oracle等成为企业的数据仓库和数据库，才是***目标。

近期爱分析对蒋步星进行专访，他分享了自己对报表软件行业、数据计算行业的看法，现将精彩内容分享。

坚持做软件厂商，不做定制开发

爱分析：润乾从2001年创立，到现在也是经历了十几年发展，都经历了哪些阶段?

蒋步星： 2001年初我从长天出来，2001年-2003年底，这是一个阶段，这个阶段其实我们在做行业软件，主要是帮助其他高校做信息系统。

我一直想做通用软件，这是在长天、紫光受了刺激，我觉得我们费老劲当集成商，***都在卖Oracle的数据库，打来打去***都是人家厂商挣钱，我们不停地在出差。所以我们一定要把自己做到厂商的位置去，但找不到方向。

到2002年底，我们感觉到做报表工具是一个挺好的方向，国外势力没那么强，而且用户有需求。所以，我们从2002年底开始做， 2004年初推出报表3版本。到2005年，这个业务就已经盈亏平衡。

然后我立刻把教务系统那部分业务卖掉了。我的逻辑链在于，一定要做厂商，一定要拿光盘换支票，不要做定制开发，不要到用户那里做项目，产品永远都是标准化的，这样才能零成本复制。

2005年至2010年应该是报表业务发展比较好的阶段，差不多翻了10倍。2011年至2015年，我们内部管理层有业务分歧，这使得公司资源消耗比较严重，业务基本没有增长，而且明显感到竞争对手发展起来了。

2015年底，我们内部做了调整，原来分歧的声音消除掉了。2016年相当于重建了经营队伍，会是一个新阶段。

现在，我们把经营重点主要放在数据计算上了，我们2月份刚做了报表工具的降价，我降了30倍。公司内外要营造一个气氛，润乾现在要开拓新业务，报表这个标签就会产生障碍，我们现在想做数据计算业务。

[[205272]]

爱分析：为什么润乾做报表这项业务时，没碰到什么竞争对手?

蒋步星：国外厂商是不会做报表的，几方面原因：***，中国市场相对全球市场太小，国外厂商不会专门为中国企业开发相关产品的，只会把国外现成产品拿过来用;第二，中国人的报表需求非常复杂。

这个事情之所以被解决，这是我们擅长的，也是润乾这公司的基因。我们自己发明了一套理论体系，研究了几千张报表找规律。

爱分析：整个团队现在有多少人?人员结构是什么样的?

蒋步星：我们现在有70多人，人员还在扩。去年主要是磨合新的经营团队，磨合差不多了，今年就会扩张团队。我们应该主要是两部分，研发和销售。我们研发有25人，销售会多一些。

爱分析：下一步如果扩团队的话，会主要增加哪部分人员?

蒋步星：研发人员今年可能不会增加了，售前人员会增加多一些，因为我们现在这个新产品，需要有足够技术背景才能给客户讲清楚。

爱分析：所以这个产品在研发投入上不需要太多人?

蒋步星：坦白地说，我认为做这些事情都不需要很多人。我们现在20多人研发团队，下半年就可以发布数据库产品，另外我们还做了数据挖掘产品。主要是我们不需要太多交付人员，交付工作都交给集成商伙伴来做，这是我们的原则。

报表工具面向IT人员，更贴近客户业务

爱分析：相比BI产品，报表产品会与客户的业务更加贴近?

蒋步星：有各方面原因，一个是客户没有那么强烈的分析需求，他也不知道具体分析什么，另一个是数据相对混乱，不是那么整齐，要做多维分析，数据质量还是要求很高。还有就是做多维分析要事先建模，但是客户的业务还很不稳定时，就没办法事先建模。

但报表这个产品，客户总需要看他。而且中国人的报表设计得很丰富，一张报表能反映很多信息。所以，业务人员还是乐意看这个，使用比较简单，输入参数后我想看到的信息都在报表上有体现。

我见过很多上BI平台的，有可视化、用户自助出报表，但其实用得***，久经考验的还是那些固定报表。·

爱分析：国内外企业在使用报表产品方面有哪些区别?

蒋步星：国内大部分用户可以支付得起定制化的成本，花50万就会有人来做项目开发了，可以做出非常适合用户需求的系统。这种场景下，国外BI厂商的产品就比不上这些定制开发的。

因此，国内用户更加需要可集成的工具，比如我们做报表工具，其实是中间件，并非直接面向终端用户，需要开发人员二次开发将我们集成进去，这时候集成商就愿意用我们这种产品。

在国外，由于人工太贵，用户一般支付不起这种定制开发的费用，只能购买这种接近成品的软件，从这个角度来看，国外BI产品就有它合理之处了。

爱分析：其实，报表这个产品一般来说不会直接面向终端用户?

蒋步星：是的，终端用户看报表，但做报表的是集成商的程序员，我们其实是协助开发商，让他更快地做报表。原先程序员写代码做报表可能需要一两周，使用我们的产品可能只需要一天时间，极大提高效率，而且降低对程序员的要求。

爱分析：所以，从收费来说，我们是跟终端用户收费还是集成商?

蒋步星：我们主要收入还是来自终端，我们与集成商配合，将产品做到解决方案中。其实，像数据库这些产品也类似，终端用户可能根本不会安装Oracle，但他却在买单，因为这是整个解决方案体系中的一个环节。

爱分析：现在来看，报表这块儿的市场空间应该不大，几个厂商加起来也就是几亿规模?

蒋步星：这个市场规模不大有很多原因，***，相比之前，做报表的厂商更多了，竞争更加激烈;第二，移动端快速发展，使得客户对报表的复杂性要求在弱化。这些是我们必须转型的原因。倒不是说，市场需求消失了，但市场的增长在放缓，甚至出现停止增长。

另外，报表可以算是可视化的一种基本技术，现在出现了大量开源的可视化技术，这就使得从营收角度来看，市场规模在变小，用户发现使用开源技术也能实现类似需求，就不愿意再花钱购买报表产品了。

做数据库从数据计算开始，替代Oracle计算能力

爱分析：数据库市场是不是仍然以Oracle为主导?

蒋步星：销售额是这样的，去“IOE”中， EMC是最容易被去掉，IBM的小型机除了大型银行的交易系统外，都可以被替代掉，就是数据库很难去掉。

Oracle的确做得很好，各个数据库的SQL语法不太一样，那些不同的地方虽然不多，但是很关键。因为大量程序是数据处理是用数据库的存储过程来写的，想复制出完全一样的几乎不可能，还不如彻底替换掉，但Oracle的优化的确做得很好，不光是国产数据库，放眼全球也很难比肩的。

爱分析：用新型Hadoop架构开发的数据库有望超越Oracle么?

蒋步星：其实我们就是要做数据库，做新型数据仓库，我们会先从做计算开始，做集算器。

我个人认为国产数据库没什么机会超越，国产数据库厂商的确有不少优秀人才，但Oracle同样很优秀，而且资金雄厚。除非Oracle犯错误，要不然没有机会。

但是，就算Oracle犯错误，顶上来的也未必国产数据库，因为国外还有很多巨头公司，不可能轮到排名10以外的厂商。因此，想超越Oracle必须要颠覆他，跟随技术永远没希望。

想超越Oracle不能再用那个技术体系，那个体系被Oracle做了40多年，怎么可能有机会。

Hadoop这边有一定可能性，但现在说还为时过早。数据库功能大体分为两部分：OLTP，这部分目前还只有关系数据库能搞定;另一部分是OLAP，做计算分析的，这部分Hadoop有一些优势的。

Hadoop优势是建立在比较便宜的PC集群上，不像Oracle需要高端机，Hadoop这个体系相对要廉价一些，而且横扩能力强，很多用户都将Hadoop作为未来方向。

Hadoop如果用来做AI等迭代式计算是有优势的。做数据仓库其实和传统数据库没差别，MPP并不了太多机器，Hadoop做SQL也同样如此，。

另外，Hadoop设计规模是面向超大集群，而非中小集群规模，但传统数据仓库的用户没有那么多数据，用Hadoop有点杀鸡用牛刀。所以，我们也没用Hadoop体系，选择自己做。

爱分析：那我们做集算器是如何构建的?

蒋步星：我们开始做报表，数据展现的确很头疼，我们用非线性报表模型解决了展现问题。但发现做报表还是很头疼，数据准备比展现还麻烦，原始数据与报表数据相差很远，要写很复杂的运算。当时业界没有什么好办法，大家都是要写程序。

所以，我们打算做产品解决这个问题，数据准备就是数据计算，因此，我们做了一个数据计算引擎，自己设计一套程序语言，能让写这种计算比SQL、JAVA更容易一些，开始作为报表工具的辅助模块。

后来我们发现，计算本身就是更大市场，比数据展现应用面广很多。所以，我们从技术把计算引擎独立出来，在这个基础上我们还可以发展数据库、数据仓库这些业务。

集算器这个产品就是想替代数据库的计算能力，提供不依赖数据库的计算能力。当然，这需要一段时间，目前我说服用户彻底不用数据库是有难度，所以集算器这个产品作为计算引擎出现，是不太涉及存储的，因此原始数据还可以放在原先的数据库，集算器只是解决计算，原先客户除了数据库没有什么特别好的计算工具，现在多了一个选择，不一定非得用数据库。

爱分析：所以集算器与报表服务客群是类似的?

蒋步星：其实是一样的，跟报表也比较容易集成，因为很多时候计算就是为展现而服务的，而且我们现在都不忌讳集算器可以给竞争对手的报表产品提供数据。