2017年3月28日晚,清华大数据“技术·前沿”系列讲座——“结构化数据计算的新模式”专场在清华大学FIT楼成功举办。本期演讲嘉宾为润乾软件创始人、***科学家蒋步星,蒋步星先生就作为数据库基础理论的关系代数面对当今日益增长的数据量及更为复杂的计算需求时所出现的种种弊端,提出了自己潜心研究多年的结构化数据的新的计算模式,这一颠覆性的创新研究吸引了线下近200位大数据从业者和爱好者来到现场,同时1500位线上直播观众同步观看,现场掀起多次讨论高潮。
得主,清华大学计算机系硕士。2001年创建润乾软件,著有《非线性报表模型原理》,取得多项软件发明专利。 2015年,润乾软件被福布斯中文网站评为“2015福布斯中国非上市潜力企业100强”,2016年,蒋步星入围中国电子信息产业发展研究院评选的“2016年中国软件和信息服务业十大领军人物”。他目前致力于大数据计算引擎研究,并在此基础上开发自主理论体系的云数据库和数据仓库产品。
讲座伊始,蒋步星先生认为时下数据库的计算封闭性给用户带来不便,用户不得不为了获得计算能力而去部署多余的数据库或者扩容数据库,这样无形之中就给用户增加了许多不必要的成本。如果能实现不依赖于数据库的计算引擎,提供更开放的计算能力,用户在设计应用架构时就能更得心就手,节省许多不必要的麻烦,把数据库资源的利用率***化。
接着蒋步星先生讲到,关系数据库带给程序员的另一个问题就是运算很难写,这是由于它的理论基础关系代数体系造成的,关系代数理论已经发明了四十多年,期间几乎没有进行过实质性的变革和改进,然而随着科技的发展,这种古老的理论体系已经难以适应当今复杂的计算模式了。业界需要新的理论来顺应时代的进步。基于这些目标,蒋步星先生提出了离散数据集模型,它采用新的语法体系,集合了SQL和高级语言的优势,大大减少了编程人员的工作量,提高了工作效率,进而降低了成本。
随后,蒋先生站在大数据角度,讲到在新代数体系框架内很多计算问题都可以得到大幅度的简化,从而降低计算的复杂度,这将大大提高计算性能,解决当前大数据时代所面临的最棘手问题。
***,蒋先生讲到了数据库和数据仓库,介绍了二者的区别及应用,以及未来将面临的问题;润乾软件目前正在研发的数据库和数据仓库将是一种全新的模式,从理论上到实际应用都不同于目前在用的数据库,功能和性能将更上一个台阶。
在讲座之后的提问环节,观众们积极地就新的数学体系中的一些技术难点进行提问。蒋步星先生耐心解答,深入探讨,使大家受益匪浅。讲座结束后,观众们热情不减,继续就新的数学体系与实际的应用场景之间的适应性问题进行了深入探讨。