什么是数据挖掘
专家会告诉你,数据挖掘是使用自动化技术在企业斥资获得的数据库中建立有用的趋势/信息。一旦得到了,这个信息就会被用来改进商业操作或制定更好的商业决策。涉及的技术有很多,包括联合分析、集群、分类、模糊逻辑、神经网络和数据清理等。然后这些技术与可视化工具联系在一起,这些可视化工具包括报表、图表、OLAP和其它的工具。
有专家来进行数据挖掘是很好,但是其它人群(占99%),那些既不懂数据挖掘又没有时间和资金来获得专业数据挖掘工具用于他们的数据库的人们该怎么办呢?他们能够做什么?
为什么不使用流行的Microsoft Access工具而不是新工具来探究我们的数据库呢?首先,Access与Microsoft Office/Excel中的图表工具紧密集成在一起(见图1)。Access所使用的图表工具和Excel所使用的工具很类似;主要的不同是Access使用查询而Excel使用单元。其次,Access支持工业级SQL查询,并且其通过Links可以被任何种类的数据库——从文本文件、电子数据表、SharePoint Lists、SQL server、Oracle、MySQL等等——当作一个客户端应用程序。在它之上,设计良好的表单和VBA可以帮助你建立一个界面,从而为你的用户提供便利,使得他们能够开始靠他们自己研究他们的数据。
在Access 2007中有一些创新,这些创新将帮助人们探究他们的数据。这包括在Access 2007和Excel 2007中的非常类似的数据过滤界面;在用户界面上透视图、透视表是非常有用的,而交互过滤器现在在Access报表中也可以使用了。
在查询和表单中过滤数据
所以我们怎样将Access当作一个数据挖掘工具呢?事实是随着Access 95的问世,它为表和查询提供了Filter By Selection和Filter by form,从而就有了一组基本的数据探究工具可用在查询和表格里。
例如,Filter by Selection是一个演示你可以怎样探究数据的主要示例。右键单击年份(比如2008)并选择Filter by Selection,你将只显示这个月的销售。Filter by Selection是最重要的数据挖掘技术中很基本的一个——一个向下钻取。它是到这个框架之中,在Access 2007中对用户界面进行过滤来匹配Excel数据过滤而做的改变使得Access成为了一个更加通用的工具。这在图3中做了说明,显示了新的过滤界面。
图3 – 现在在Access 2007中的过滤和Excel非常类似
在查询中添加总计
如果你想过滤数据,那么这有一个非常新的创新,它将回答你的大多数数据问题,它就是Totals。当你打开一个查询,在Home Ribbon中你将找到一个Totals按钮。点击它就会有一个额外的记录添加到你的查询中,如图4所示。现在你可以右键单击这个新的记录并添加Sums或Averages或Counts之类的东西。这个创新真的很有用,因为以前总是在过滤之后复制黏贴到Excel中去计算总和。
图4 – 添加一个Totals记录到一个Access查询中会降低对额外报表或复制到Excel的需求
通过上文的介绍相信大家对于使用Access 2007开始数据挖掘已经有所了解,希望大家再接再厉,熟练掌握这项技术。
【编辑推荐】