SQL Server 2008的BI組件SSAS使用詳解
SSAS是用于SQL Server 2008 數(shù)據(jù)庫用于BI的組件,通過SSAS可以創(chuàng)建多維數(shù)據(jù)庫,并在之上進行數(shù)據(jù)挖掘操作。本文我們主要介紹一些關于SSAS數(shù)據(jù)分析的知識。接下來就讓我們來一起了解一下吧。
商業(yè)智能提供的解決方案能夠從多種數(shù)據(jù)源獲取數(shù)據(jù)并且能夠把各種數(shù)據(jù)轉化成同一格式數(shù)據(jù)進行存儲,最終達到讓用戶可以快速訪問解讀數(shù)據(jù),為用戶分析和制定決定提供有效的數(shù)據(jù)支持。可以人為的把商業(yè)智能分為以下幾層:
數(shù)據(jù)源層:公司日常工作中會存在多種格式的數(shù)據(jù),如文本文檔,excel文件,access數(shù)據(jù)庫文件,SQL Server數(shù)據(jù)庫文件等。
數(shù)據(jù)轉換層:由于數(shù)據(jù)源存在多樣化,為了方便分析,需要對它們進行一定的加工,使其數(shù)據(jù)格式相同,最終存入數(shù)據(jù)存儲系統(tǒng)。
數(shù)據(jù)存取層:關系數(shù)據(jù)庫管理系統(tǒng)(RDBMS)中創(chuàng)建數(shù)據(jù)倉庫,保存數(shù)據(jù)。
數(shù)據(jù)分析層:多維聯(lián)機分析處理數(shù)據(jù)庫做為數(shù)據(jù)分析層,負責把數(shù)據(jù)轉換成信息。
數(shù)據(jù)表示層:表示層的應用程序可以直接訪問數(shù)據(jù)倉庫或多維聯(lián)機分析處理數(shù)據(jù)庫等,可以用不同風格(表格、圖形等)展示數(shù)據(jù)的魅力??梢杂肊XCEL來秀數(shù)據(jù),也可以用adomd.net開發(fā)asp.net(winform)等來秀數(shù)據(jù),總之,熟悉后,可以根據(jù)實際需求想怎么秀就怎么秀。
度量值
在商業(yè)智能中,用來監(jiān)控公司運行的可概括的數(shù)值被稱作度量值(measure)。如“SalesAmount”、“OrderQuantity”都被稱作度量值。如圖
“SalesAmount”標簽被稱為元數(shù)據(jù),“100”為銷售數(shù)量。如果沒有“SalesAmount”這個元數(shù)據(jù),“100”將只是一個數(shù)值而且這個數(shù)值將顯得毫無意義。
屬性
看下面一張產(chǎn)品屬性表,
“產(chǎn)品”、“模型”、“顏色”、“尺寸”被稱為屬性,而“Mountain-500”、“Road-750”、“Hitch Rack”被稱為屬性“模型”的成員,同樣,“黑色”和“銀色”也是“顏色”屬性的成員。“產(chǎn)品”屬性被稱為關鍵屬性,因為它可以唯一地確定其他屬性(顏色,尺寸等),在上表“產(chǎn)品“屬性列中也是唯一的,不存在重復值。如“Mountain-500 Black,40“就可以準確的定位到上表第一行,但是”模型“屬性成員”Mountain-500“在上表中不能確定具體是哪個產(chǎn)品。
看下面這個銷售報表,
這份報表中每種模型都有該模型下的相關產(chǎn)品銷售額的總和或者叫聚合(aggregation)。“模型“屬性和”產(chǎn)品“屬性以層次結構(hierarchy)進行組織,“模型”屬性的成員作為層次結構高層,“產(chǎn)品”屬性的成員作為底層。有了層次結構,我們可以選擇查看模型級的銷售額或者產(chǎn)品級的銷售額。
維度
相同的產(chǎn)品可以在兩個不同的州銷售,所以可以得到如下報表
這份報表有兩個“州”屬性成員,三個“模型”屬性成員,五個“月份”屬性層次結構構成的成員。所有值的最大可能數(shù)為:州數(shù)目*模型數(shù)目*月份數(shù)目=2*3*5=30。
報表中獨立屬性和層次結構稱作報表的維度,維度(dimension)包括屬性和層次結構。如上圖報表,州屬性屬于地理維度,模型屬性屬于產(chǎn)品維度,月屬性層次結構屬于日期維度。一個維度可能不止一個屬性,但每個維度只有一個關鍵屬性。其他與關鍵屬性相關的屬性都屬于同一維度。由于屬性屬于維度,那么屬性成員也即維度成員。維度中可以包含層次結構,用于創(chuàng)建層次結構的屬性必須屬于同一維度,同時該層次結構也屬于該維度。如,模型和產(chǎn)品構成的層次結構由產(chǎn)品維度中的屬性組成,而該層次結構也屬于產(chǎn)品維度。維度是相關屬性和層次結構進行分組的有效方法。
事實表和維度表
在維度數(shù)據(jù)倉庫中,維度存儲在維度表中,度量值被稱作事實并存儲于事實表中。事實表是存儲度量值的詳細值或事實的表。如圖,
這個事實表中,前三列(州鍵、產(chǎn)品鍵、月份鍵)是鍵列。鍵列的值將事實表每行中的事實和每個維度表中的一行聯(lián)系起來。剩下的兩列(銷售量和銷售額)包含了數(shù)值事實,是這張事實表的兩個度量值。和事實表相關的維度被稱作事實表的維數(shù)(dimensionality)。
許多維度屬性可用來對維度記錄進行分組,并可以對每組相關的事實表中的度量值進行匯總。
如上圖Product維度表中的記錄可被分為自行車和配件兩類,每種分組的銷售量都能計算出來。可以創(chuàng)建分組的屬性是可聚合的,如類別屬性、顏色屬性等,不可聚合的屬性稱為成員屬性,如價格,因為根據(jù)價格分組出來的數(shù)據(jù)沒什么太大的意義 。
度量值組
事實表中包含數(shù)據(jù)的列對應于維度模型中的度量值,因此,每張事實表都包含一組度量值。
分析服務用一組稱作度量值組的邏輯結構組織信息,度量值組與單個事實表及其相關的維度相對應。度量值組不但包含了每個維度的列以及每個度量值的列而且還包含了每個維度中的成員的每個可能的組合所對應的行。與事實表不同的是,事實表只包含單個細節(jié)的數(shù)據(jù),而度量值組不但包含單個細節(jié)的數(shù)據(jù),而且還包含更高級細節(jié)的聚合數(shù)據(jù)。如圖
上表中只有最后一行和事實表中的某行對應,該行包含了和事實表相同級的詳細信息。其他行都不會出現(xiàn)在事實表中,每行中都至少有一個維度層次結構中更高級別的成員。在具有更高級別成員的每一行中,通過累加低級細節(jié)數(shù)據(jù)使事實數(shù)據(jù)被聚合。上表只是列出了很小一部分的可能值。
關于SSAS的知識就介紹到這里了,希望本次的介紹能夠帶給您一些收獲!
【編輯推薦】