数据可视化是指利用数据分析工具增加数据的视觉化效果,表达对数据信息的见解。商业领域是使用数据分析最多的地方,销售人员利用可视化数据向客户展示不同的产品,分析人员通过数据画像研究客户的偏好,企业的管理者也需要根据企业经营状况的绩效指标推算经营目标。然而,在大数据时代里,不少人对数据可视化存在一定的误解,一些数据分析人员在工作中难免出现各种各样的错误,这会降低商业分析的价值,甚至产生误导。无论你是可视化数据的使用者,还是提供数据可视化服务的数据分析员,都需要避开以下三种误区。
数据可视化(Data Visualizaion)
第一,商业数据可视化的首要问题是明确数据可视化的工作为谁而作。不同的角色想要看到的数据结果完全不同,客户最需要关于产品的详细信息,企业中层人员需要对每一类产品或者一个地区的产品采购、加工、销售及服务情况有具体了解,而CEO会利用更加宏观的数据来完成决策。在数据可视化中,有一点非常重要——不要分析那些无关紧要的数据,尽管每个数据分析人员都希望为他人呈现一分详尽的数据报告,但是没有人想把时间浪费在不相关的信息上,所以分析人员也不应力求面面俱到。对于广大客户而言,无论获得的可视化数据有多少,关注最需要关注的数据就足够了。
第二,商业数据可视化的分析也不是利用各种不同类的图表,把工作内容做成一件艺术品。一般来说,条形图适合比较单个变量大小,而柱状图适合表达数据群的规模,散点图能显示两个变量之间的联系。每种图表有适合的分析对象,而很多分析人员为了美观清晰,会把各种类型的图表用遍,繁杂的图表只会给他人带来主次不分的感觉,忽视掉数据信息的重要地位。例如在分析宏观经济对产品的影响中,一般需要表示出GDP(国内生产总值)的总量变化及增长率,这样的信息完全可以由条形图或柱状图完成,如果设计出散点图、嵌套饼图,就脱离了数据分析的实质,这种过分追求美观的做法只是一厢情愿。
第三,商业数据可视化需要“干净”的数据。美国乔治亚大学数据分析与创新教授Subhashish Samaddar认为,“一旦数据分析中存在缺失和偏见,经验不足的人很可能会上当受骗”。商业数据可视化往往会对商业决策起到重要参考作用,在选择数据的过程中如果出现隐瞒异常数据或者造假的情况,很可能对结论的分析产生灾难性后果,可以说害人又害己。在日常利用数据可视化工具的同时,我们应该仔细思考数据的来源是否正规,是否只是看到了自己想看到的数据。尤其是在金融投资中,不要被精美的图表所迷惑,一定要学会辨别数据的真实性,关注数据变化背后的内在原因。