偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

「數(shù)倉面試」如何確定主題域?

大數(shù)據(jù)
簡單說,一個(gè)主題對應(yīng)一個(gè)分析對象。分析對象就是在決策、分析時(shí)重點(diǎn)關(guān)注的東西,這個(gè)東西其實(shí)是非常主觀的,在不同的企業(yè),或者企業(yè)的不同發(fā)展時(shí)期,所關(guān)注的點(diǎn)會不一樣,從而影響有些主題可能存在或者不存在。

大家好,我是一哥,前幾天跟一個(gè)朋友聊了一些數(shù)據(jù)中臺建設(shè)的內(nèi)容,針對數(shù)據(jù)倉庫中主題域如何劃分這個(gè)話題聊了很多。其實(shí)數(shù)據(jù)倉庫建設(shè)的理論大家已經(jīng)都知道了不少,也看過不少書,那么在實(shí)際建設(shè)數(shù)據(jù)倉庫中,我們還是會遇到各種問題。

前段時(shí)間招人,面試了幾個(gè)簡歷上都寫了有3年以上數(shù)倉開發(fā)的,當(dāng)我問他“如何確定主題域?”,他卻說“我來公司的時(shí)候已經(jīng)都搞好了……”,再問他“如果進(jìn)入一個(gè)新領(lǐng)域,從0到1搭建數(shù)倉,怎么確定主題域呢?” 他就蒙了……

今天一哥帶你一起聊聊主題域如何劃分?

01什么是主題

主題是在較高層次上將企業(yè)信息系統(tǒng)中的數(shù)據(jù)進(jìn)行綜合、歸類和分析利用的一個(gè)抽象概念,每一個(gè)主題基本對應(yīng)一個(gè)宏觀的分析領(lǐng)域。在邏輯意義上,它是對應(yīng)企業(yè)中某一宏觀分析領(lǐng)域所涉及的分析對象。

簡單說,一個(gè)主題對應(yīng)一個(gè)分析對象。分析對象就是在決策、分析時(shí)重點(diǎn)關(guān)注的東西,這個(gè)東西其實(shí)是非常主觀的,在不同的企業(yè),或者企業(yè)的不同發(fā)展時(shí)期,所關(guān)注的點(diǎn)會不一樣,從而影響有些主題可能存在或者不存在。

數(shù)據(jù)倉庫是面向主題的應(yīng)用,主要功能是將數(shù)據(jù)綜合、歸類并進(jìn)行分析利用。數(shù)據(jù)倉庫模型設(shè)計(jì)除橫向的分層外,通常還需要根據(jù)業(yè)務(wù)情況縱向劃分主題域。主題域是業(yè)務(wù)對象高度概括的概念層次歸類,目的是便于數(shù)據(jù)的管理和應(yīng)用。

02如何劃分主題

劃分主題域方法

在業(yè)務(wù)調(diào)研之后,可以進(jìn)行主題域的劃分。劃分主題域,需要分析各個(gè)業(yè)務(wù)模塊中有哪些業(yè)務(wù)活動(dòng)。通常我們按照以下方法劃分主題域,可以按照用戶企業(yè)的部門劃分,也可以按照業(yè)務(wù)過程或者業(yè)務(wù)板塊中的功能模塊劃分。

按照系統(tǒng)劃分:業(yè)務(wù)系統(tǒng)有幾種,就劃分為幾類

按業(yè)務(wù)過程劃分:比如業(yè)務(wù)系統(tǒng)中有商品、交易、物流等

按部門規(guī)劃:比如公司內(nèi)的生產(chǎn)、供應(yīng)鏈、研發(fā)、銷售等

目前有些成熟的行業(yè),比如電信、銀行,他們也是最早用數(shù)據(jù)倉庫的行業(yè),已經(jīng)形成了一些規(guī)范,可以直接按照規(guī)范來就行了。其中IBM金融數(shù)據(jù)模型數(shù)據(jù)存儲模型FSDM,是金融行業(yè)應(yīng)用極為廣泛的數(shù)據(jù)模型,可以作為我們構(gòu)建企業(yè)級數(shù)據(jù)倉庫主題域模型劃分的重要依據(jù)。

=

對于新興的一些行業(yè),或者業(yè)內(nèi)沒有形成標(biāo)準(zhǔn)的話,那么就可以參照上面的幾類方法,進(jìn)行分類,先從邊界清晰的系統(tǒng)入手進(jìn)行建設(shè),形成經(jīng)驗(yàn)后逐步推到各個(gè)系統(tǒng)中。

個(gè)人比較推薦通過業(yè)務(wù)系統(tǒng)來進(jìn)行一級主題域劃分,這樣邊界就會很明顯,數(shù)據(jù)倉庫開發(fā)過程中不會因?yàn)槟P椭黝}的歸屬“扯皮”,然后根據(jù)各個(gè)系統(tǒng)中的業(yè)務(wù)過程劃分二級主題域目前我參與過的兩個(gè)數(shù)據(jù)倉庫建設(shè)項(xiàng)目也都是這樣搞的。

主題域的核心

為保障整個(gè)體系的生命力,主題域需要抽象提煉,并長期維護(hù)更新,但不輕易變動(dòng)。劃分?jǐn)?shù)據(jù)域時(shí),需滿足以下兩點(diǎn):

  • 能涵蓋當(dāng)前所有的業(yè)務(wù)需求。
  • 能在新業(yè)務(wù)進(jìn)入時(shí),無影響地被包含進(jìn)已有的主題域中和擴(kuò)展新的主題域。

一次能劃分好主題域嗎

首先,主題域是無法一次劃分完整的,一般是一次先建立幾個(gè)明確的主題,在大多數(shù)數(shù)據(jù)倉庫的設(shè)計(jì)過程中都有一個(gè)主題域的選擇過程。業(yè)務(wù)是一直發(fā)展的,因此設(shè)計(jì)之初不要想著一次把所有主題全部劃分完整。我們可以遵循上面說的劃分主題域的兩個(gè)要點(diǎn),后續(xù)采用迭代的方式補(bǔ)充。

03總結(jié)

數(shù)據(jù)倉庫建設(shè)是一套方法論,但并不是一個(gè)“定理”,可能不會有完全符合你實(shí)際公司業(yè)務(wù)的“公式”,我們需要學(xué)習(xí)這些方法論,然后結(jié)合自己公司實(shí)際的業(yè)務(wù)場景來實(shí)現(xiàn),只要能有序的把數(shù)據(jù)管控起來,同時(shí)又能高效的幫助數(shù)據(jù)分析,實(shí)現(xiàn)業(yè)務(wù)價(jià)值就好了,不必一味的追求“行業(yè)標(biāo)準(zhǔn)”。

本文轉(zhuǎn)載自微信公眾號「數(shù)據(jù)社」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請聯(lián)系數(shù)據(jù)社公眾號。

 

責(zé)任編輯:武曉燕 來源: 數(shù)據(jù)社
相關(guān)推薦

2021-08-30 07:49:34

數(shù)據(jù)庫數(shù)倉Doris

2023-03-08 07:50:57

企業(yè)數(shù)據(jù)治理

2022-12-08 10:16:58

數(shù)據(jù)模型

2021-09-01 07:21:41

數(shù)倉RFM模型

2021-01-31 23:54:23

數(shù)倉模型

2022-08-22 17:46:56

虛擬數(shù)倉Impala

2021-09-28 07:12:08

數(shù)倉開發(fā)工具

2023-02-16 07:30:38

引用計(jì)數(shù)算法

2021-01-04 05:42:48

數(shù)倉模型設(shè)計(jì)

2022-07-26 15:38:58

數(shù)據(jù)倉數(shù)據(jù)治理數(shù)據(jù)團(tuán)隊(duì)

2023-01-03 17:43:39

網(wǎng)易郵箱數(shù)倉

2021-06-11 07:26:16

數(shù)據(jù)倉庫機(jī)器學(xué)習(xí)

2022-03-01 17:16:16

數(shù)倉建模ID Mapping

2025-06-11 02:45:00

2021-12-02 08:41:30

數(shù)倉建模設(shè)計(jì)

2023-11-23 16:53:56

數(shù)據(jù)倉庫大數(shù)據(jù)

2022-02-18 09:02:04

數(shù)據(jù)倉庫治理

2022-04-01 12:38:32

cookie代碼面試

2024-03-06 14:48:54

云原生

2025-06-11 08:35:00

數(shù)據(jù)倉庫數(shù)倉分層架構(gòu)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號