大数据来了,受益于便宜的硬件存储、强大的计算机技术和云计算技术,企业手中获取了越来越多的数据。对大多数企业来说,数据分析不是可有可无,而是一个生存问题。但是面对大数据,我们有什么问题呢?本文作者赛仕软件研究开发(北京)有限公司总经理@刘政-SAS,在微博上分享的大数据的10个核心问题,中国统计网做个整理汇总,希望大家一起来交流讨论。
大数据十大核心问题:
1、大数据的分析模式
大数据分析与传统分析的区别,特点是什么?
2、分析速度
分析速度是否能够跟上数据量和数据格式变化的速度,是否能达到实时分析?
3、多种格式数据的分析技术
声频、视频、图片、文本等等格式,如何混合分析?
4、存储问题,存储和分析成本
无条件存储,还是有选择性存储?如何进行选择性存储?投入产出比。随着数据量的不断增加,存储技术要不断创新。
5、法律条款的更新
个人隐私,国家机密保护等。数据的归属权问题。我通过开放的数据,分析出了国家机密,是不是违规、犯罪?
6、数据安全和真实性
数据是否会被窃取,篡改,伪造等,如何保护?
7、数据流分析
给进数据,输出分析结果,实时改变,是物联网实用化的基础。如何实现?
8、数据关联性
如何提取关联性数据和有用数据?看起来简单,其实在浩瀚的数据中查找关联性是挺难的。
9、大数据能否引申出科学***?
例如,骰硬币可以引出概率论。
10、大数据对其他学科的影响
对大数据的分析仅仅是得到分析结果吗?应该说世界上所有的东西都可以归结到数据里。那么我们能由此对世界有更深的了解吗?有了基因数据,人体数据能绘出人体机能吗?