尽管可视化不是数据分析中最有技术挑战的一部分,但无疑它是最重要的。
存储、数据库、查询处理和算法都是非常重要的,但是在以数据为驱动的世界中,他们都是基础层。如果你要从大量高度复杂的数据集中发现新东西,或者给人们提供分析即使是最简单数据的能力,那么展现这些数据和展现这些数据如何被利用,就是很关键的。
以下是笔者认为从根本上改变了数据可视化方式的六家初创公司,有些在表面之下是高度复杂的,有些是并不完美的,但是他们都在通过自己的行动让我们重新思考数据、通过图表的方式让我们看到事实。
Ayasdi
网络图表的想法并不新鲜,但是Ayasdi的方法倒是挺新鲜的。在后台,有一个HBase数据库,一项被成为拓扑数据分析的技术,数百台机器学习算法以处理复杂的数据集,找到数据点之间的相似性。不过对于终端用户来说,有一个数据集的地图,看上去很像是网络图表,突出相关数据点的集群,让分析师可能进行进一步研究。
BeyondCORE实际是在和Ayasdi相同的前提下运行的——为用户展示重要的相关性,这样他们就不必思考没有覆盖到的查询——但那是他采用一些不同的技术去达到目的。BeyondCORE采用一个不同的可视化方法,它坚持使用标准图表,但通过软件发现的相关性,提供在虚拟实境中互动地呈现一个谈话用户的选项。
ClearStory
ClearStory有一款非常特别的产品——尽管他们对很多细节秘而不宣,而且在发布前所有截屏都是带锁的。不过,从本质上讲,它试图通过可视化展现一切细节,显示大量数据来源,当源数据改变的时候自动更新,并且调用协作和社交理念。
Datahero
与很多初创数据公司不同的是,Datahero并没有试图招揽那些已经对业务智能软件或者从Hadoop数据中心获得见解已经厌倦了的人们。相反,Datahero让那些有简单的业务数据或者个人数据的人们获得一些简单的表格,既不用安装Excell功能,也不用过多地担心表格的格式对不对。在早期,Datahero的可视化仍然是相当普遍的,但它的易用性是很独特的。
Platfora
Platfora试图分析保存在Hadoop集群中的大量数据,像分析自己Stripe数据那样简单。这是基于Hadoop和大规模并行队列处理的,但是以一种类似HTML5的方式展现,例如有拖拽、删除、视觉切割和数据切割等操作。后者的能力,实际上在拥有比以往更多数据点的大数据世界中是很关键的。
Zoomdata
Zoomdata不是唯一一家支持移动设备的分析公司,但是笔者所知的少数几家专门为移动设备而设计的公司之一。Zoomdata连接到标准业务数据源,但是利用触摸屏和D3.js可视化来提供可视化的图表,而且这些图表的设计就像是艺术家的调色板一样有趣。