使用Access 2007開始數(shù)據(jù)挖掘(一)
什么是數(shù)據(jù)挖掘
專家會告訴你,數(shù)據(jù)挖掘是使用自動化技術在企業(yè)斥資獲得的數(shù)據(jù)庫中建立有用的趨勢/信息。一旦得到了,這個信息就會被用來改進商業(yè)操作或制定更好的商業(yè)決策。涉及的技術有很多,包括聯(lián)合分析、集群、分類、模糊邏輯、神經網絡和數(shù)據(jù)清理等。然后這些技術與可視化工具聯(lián)系在一起,這些可視化工具包括報表、圖表、OLAP和其它的工具。
有專家來進行數(shù)據(jù)挖掘是很好,但是其它人群(占99%),那些既不懂數(shù)據(jù)挖掘又沒有時間和資金來獲得專業(yè)數(shù)據(jù)挖掘工具用于他們的數(shù)據(jù)庫的人們該怎么辦呢?他們能夠做什么?
為什么不使用流行的Microsoft Access工具而不是新工具來探究我們的數(shù)據(jù)庫呢?首先,Access與Microsoft Office/Excel中的圖表工具緊密集成在一起(見圖1)。Access所使用的圖表工具和Excel所使用的工具很類似;主要的不同是Access使用查詢而Excel使用單元。其次,Access支持工業(yè)級SQL查詢,并且其通過Links可以被任何種類的數(shù)據(jù)庫——從文本文件、電子數(shù)據(jù)表、SharePoint Lists、SQL server、Oracle、MySQL等等——當作一個客戶端應用程序。在它之上,設計良好的表單和VBA可以幫助你建立一個界面,從而為你的用戶提供便利,使得他們能夠開始靠他們自己研究他們的數(shù)據(jù)。
在Access 2007中有一些創(chuàng)新,這些創(chuàng)新將幫助人們探究他們的數(shù)據(jù)。這包括在Access 2007和Excel 2007中的非常類似的數(shù)據(jù)過濾界面;在用戶界面上透視圖、透視表是非常有用的,而交互過濾器現(xiàn)在在Access報表中也可以使用了。
在查詢和表單中過濾數(shù)據(jù)
所以我們怎樣將Access當作一個數(shù)據(jù)挖掘工具呢?事實是隨著Access 95的問世,它為表和查詢提供了Filter By Selection和Filter by form,從而就有了一組基本的數(shù)據(jù)探究工具可用在查詢和表格里。
例如,F(xiàn)ilter by Selection是一個演示你可以怎樣探究數(shù)據(jù)的主要示例。右鍵單擊年份(比如2008)并選擇Filter by Selection,你將只顯示這個月的銷售。Filter by Selection是最重要的數(shù)據(jù)挖掘技術中很基本的一個——一個向下鉆取。它是到這個框架之中,在Access 2007中對用戶界面進行過濾來匹配Excel數(shù)據(jù)過濾而做的改變使得Access成為了一個更加通用的工具。這在圖3中做了說明,顯示了新的過濾界面。
  
圖3 – 現(xiàn)在在Access 2007中的過濾和Excel非常類似
在查詢中添加總計
如果你想過濾數(shù)據(jù),那么這有一個非常新的創(chuàng)新,它將回答你的大多數(shù)數(shù)據(jù)問題,它就是Totals。當你打開一個查詢,在Home Ribbon中你將找到一個Totals按鈕。點擊它就會有一個額外的記錄添加到你的查詢中,如圖4所示?,F(xiàn)在你可以右鍵單擊這個新的記錄并添加Sums或Averages或Counts之類的東西。這個創(chuàng)新真的很有用,因為以前總是在過濾之后復制黏貼到Excel中去計算總和。
  
圖4 – 添加一個Totals記錄到一個Access查詢中會降低對額外報表或復制到Excel的需求
通過上文的介紹相信大家對于使用Access 2007開始數(shù)據(jù)挖掘已經有所了解,希望大家再接再厲,熟練掌握這項技術。
【編輯推薦】















 
 
 





 
 
 
 