SQL Server 2008數(shù)據(jù)集成服務(wù)簡(jiǎn)介
將企業(yè)數(shù)據(jù)轉(zhuǎn)化為有意義的和可操作信息的能力,是企業(yè)在當(dāng)今商業(yè)世界中獲得競(jìng)爭(zhēng)優(yōu)勢(shì)的***最重要的來(lái)源。通過(guò)控制數(shù)據(jù)爆炸來(lái)更好地了解過(guò)去并獲得未來(lái)的發(fā)展方向,已成為全球范圍內(nèi)企業(yè)的信息技術(shù)部門(mén)所面臨的最富挑戰(zhàn)性的風(fēng)險(xiǎn)之一。與數(shù)據(jù)集成相關(guān)的問(wèn)題可劃分為三個(gè)大類:
◆技術(shù)挑戰(zhàn)
◆組織問(wèn)題
◆經(jīng)濟(jì)挑戰(zhàn)
在本文中,我們將詳細(xì)探討這些挑戰(zhàn)并討論如何使用 Microsoft® SQL Server™ 2008 Integration Services (SSIS) 解決它們。首先,讓我們先看一個(gè)真實(shí)世界案例中存在的這些挑戰(zhàn)。
真實(shí)世界案例
一家大型的全球型運(yùn)輸公司利用其數(shù)據(jù)倉(cāng)庫(kù)來(lái)分析運(yùn)營(yíng)績(jī)效和預(yù)測(cè)其計(jì)劃交貨中存在的差異。
數(shù)據(jù)源
這家公司的主要數(shù)據(jù)來(lái)源包括基于 DB2 的訂單輸入系統(tǒng)的訂單數(shù)據(jù),基于 SQL Server 的客戶關(guān)系管理(CRM)系統(tǒng)的客戶資料,以及基于 Oracle 的 ERP 系統(tǒng)的供應(yīng)商數(shù)據(jù)。除了來(lái)自這些主要系統(tǒng)的數(shù)據(jù)以外,也有從跟蹤“特別”事件的電子表格合并到數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù),這些數(shù)據(jù)由發(fā)貨管理員手動(dòng)輸入。目前,該公司在合并各種來(lái)源的文本文件(如天氣信息、交通狀況和供應(yīng)商詳細(xì)資料(針對(duì)轉(zhuǎn)包交付)等外部數(shù)據(jù))時(shí)存在延遲。
數(shù)據(jù)使用
不僅這些數(shù)據(jù)的來(lái)源多種多樣,消費(fèi)者的需求和他們的地理位置也多種多樣。這種多樣性導(dǎo)致了本地系統(tǒng)的擴(kuò)張。信息技術(shù)部門(mén)的主要工作之一就是,至少要為客戶資料建立一個(gè)“真實(shí)的單一版本”。
數(shù)據(jù)集成要求
鑒于數(shù)據(jù)、業(yè)務(wù)需求和用戶需求的多樣性,信息技術(shù)部門(mén)已指定了以下一組數(shù)據(jù)集成要求:
◆他們提供的從各種內(nèi)部和外部來(lái)源合并的歷史數(shù)據(jù)和當(dāng)前數(shù)據(jù)必須可靠且一致。
◆為減少數(shù)據(jù)采集的滯后問(wèn)題,來(lái)自提供者和供應(yīng)商的數(shù)據(jù)必須能夠通過(guò) Web 服務(wù)或一些其他直接機(jī)制(如 FTP)獲取 。
◆他們需要清理及刪除重復(fù)的數(shù)據(jù)以確保數(shù)據(jù)質(zhì)量。
【編輯推薦】