偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

數(shù)倉指標體系搭建實戰(zhàn)

大數(shù)據(jù) 數(shù)據(jù)倉庫
建模流程主要是從業(yè)務視角指導工程師對需求場景涉及的指標進行主題抽象,歸類,統(tǒng)一業(yè)務術(shù)語,減少溝通成本,同時避免后續(xù)的指標重復建設(shè)。

指標體系

1. 痛點分析

 主要從業(yè)務、技術(shù)、產(chǎn)品三個視角來看:

  • 業(yè)務視角業(yè)務分析場景指標、維度不明確;頻繁的需求變更和反復迭代,數(shù)據(jù)報表臃腫,數(shù)據(jù)參差不齊;用戶分析具體業(yè)務問題找數(shù)據(jù)、核對確認數(shù)據(jù)成本較高。
  • 技術(shù)視角指標定義,指標命名混亂,指標不唯一,指標維護口徑不一致;指標生產(chǎn),重復建設(shè);數(shù)據(jù)匯算成本較高;指標消費,數(shù)據(jù)出口不統(tǒng)一,重復輸出,輸出口徑不一致;
  • 產(chǎn)品視角缺乏系統(tǒng)產(chǎn)品化支持從生產(chǎn)到消費數(shù)據(jù)流沒有系統(tǒng)產(chǎn)品層面打通;

2. 管理目標

  • 技術(shù)目標   統(tǒng)一指標和維度管理,指標命名、計算口徑、統(tǒng)計來源唯一, 維度定義規(guī)范、維度值一致
  • 業(yè)務目標   統(tǒng)一數(shù)據(jù)出口、場景化覆蓋
  • 產(chǎn)品目標   指標體系管理工具產(chǎn)品化落地;指標體系內(nèi)容產(chǎn)品化落地支持決策、分析、運營例如決策北極星、智能運營分析產(chǎn)品等

3. 模型架構(gòu)

圖片圖片

業(yè)務線 

業(yè)務板塊定義原則:業(yè)務邏輯層面進行抽象、物理組織架構(gòu)層面進行細分,可根據(jù)實際業(yè)務情況進行層級分拆細化,層級分級建議進行最多進行三級分拆,一級細分可公司層面統(tǒng)一規(guī)范確定,二級及后續(xù)拆分可根據(jù)業(yè)務線實際業(yè)務進行拆分。

例如滴滴出行領(lǐng)域業(yè)務邏輯層面兩輪車和四輪車都屬于出行領(lǐng)域可抽象出行業(yè)務板塊(level一級),根據(jù)物理組織架構(gòu)層面在進行細分普惠、網(wǎng)約車、出租車、順風車(level二級),后續(xù)根據(jù)實際業(yè)務需求可在細分,網(wǎng)約車可細分獨乘、合乘,普惠可細分單車、企業(yè)級。

規(guī)范定義 

  • 數(shù)據(jù)域

指面向業(yè)務分析,將業(yè)務過程或者維度進行抽象的集合。其中,業(yè)務過程可以概括為一個個不拆分的行為事件,在業(yè)務過程之下,可以定義指標;維度,是度量的環(huán)境,如乘客呼單事件,呼單類型是維度。為了保障整個體系的生命力,數(shù)據(jù)域是需要抽象提煉,并且長期維護更新的,變動需執(zhí)行變更流程。

  • 業(yè)務過程

指公司的業(yè)務活動事件,如呼單、支付都是業(yè)務過程。其中,業(yè)務過程不可拆分。

  • 時間周期

用來明確統(tǒng)計的時間范圍或者時間點,如最近30天、自然周、截止當日等。

  • 修飾類型

是對修飾詞的一種抽象劃分。修飾類型從屬于某個業(yè)務域,如日志域的訪問終端類型涵蓋APP端、PC端等修飾詞。

  • 修飾詞

指的是統(tǒng)計維度以外指標的業(yè)務場景限定抽象,修飾詞屬于一種修飾類型,如在日志域的訪問終端類型下,有修飾詞APP、PC端等。

  • 度量/原子指標

原子指標和度量含義相同,基于某一業(yè)務事件行為下的度量,是業(yè)務定義中不可再拆分的指標,具有明確業(yè)務含義的名稱,如支付金額。

  • 維度

維度是度量的環(huán)境,用來反映業(yè)務的一類屬性,這類屬性的集合構(gòu)成一個維度,也可以稱為實體對象。維度屬于一個數(shù)據(jù)域,如地理維度(其中包括國家、地區(qū)、省市等)、時間維度(其中包括年、季、月、周、日等級別內(nèi)容)。

  • 維度屬性

維度屬性隸屬于一個維度,如地理維度里面的國家名稱、國家ID、省份名稱等都屬于維度屬性。

  • 指標分類主要分為原子指標、派生指標、衍生指標
  1. 原子指標    基于某一業(yè)務事件行為下的度量,是業(yè)務定義中不可再拆分的指標,具有明確業(yè)務含義的名稱,如呼單量、交易金額
  2. 派生指標    是1個原子指標+多個修飾詞(可選)+時間周期,是原子指標業(yè)務統(tǒng)計范圍的圈定。派生指標又分以下二種類型:
  3. 事務型指標:是指對業(yè)務過程進行衡量的指標。例如,呼單量、訂單支付金額,這類指標需要維護原子指標以及修飾詞,在此基礎(chǔ)上創(chuàng)建派生指標。

     存量型指標:是指對實體對象(如司機、乘客)某些狀態(tài)的統(tǒng)計,例如注冊司機總數(shù)、注冊乘客總數(shù),這類指標需要維護原子指標以及修飾詞,在此基礎(chǔ)上創(chuàng)建派生指標,對應的時間周期一般為“歷史截止當前某個時間”。

  1. 衍生指標是在事務性指標和存量型指標的基礎(chǔ)上復合成的。主要有比率型、比例型、統(tǒng)計型均值 

模型設(shè)計 

主要采用維度建模方法進行構(gòu)建,基礎(chǔ)業(yè)務明細事實表主要存儲維度屬性集合和度量/原子指標;分析業(yè)務匯總事實表按照指標類別(去重指標、非去重指標)分類存儲,非去重指標匯總事實表存儲統(tǒng)計維度集合、原子指標或派生指標,去重指標匯總事實表只存儲分析實體統(tǒng)計標簽集合。

指標體系在數(shù)倉物理實現(xiàn)層面主要是結(jié)合數(shù)倉模型分層架構(gòu)進行指導建設(shè),滴滴的指標數(shù)據(jù)主要存儲在DWM層,作為指標的核心管理層。

圖片圖片

 維度管理 

包括基礎(chǔ)信息和技術(shù)信息,由不同角色進行維護管理。

  • 基礎(chǔ)信息對應維度的業(yè)務信息,由業(yè)務管理人員、數(shù)據(jù)產(chǎn)品或BI分析師維護,主要包括維度名稱、業(yè)務定義、業(yè)務分類。
  • 技術(shù)信息對應維度的數(shù)據(jù)信息,由數(shù)據(jù)研發(fā)維護,主要包括是否有維表(是枚舉維度還是有獨立的物理維表)、是否是日期維、對應code英文名稱和中文名稱、對應name英文名稱和中文名稱。如果維度有維度物理表,則需要和對應的維度物理表綁定,設(shè)置code和name對應的字段。如果維度是枚舉維,則需要填寫對應的code和name。維度的統(tǒng)一管理,有利于以后數(shù)據(jù)表的標準化,也便于用戶的查詢使用。

 指標管理 

包括基礎(chǔ)信息、技術(shù)信息和衍生信息,由不同角色進行維護管理。 

  • 基礎(chǔ)信息對應指標的業(yè)務信息,由業(yè)務管理人員、數(shù)據(jù)產(chǎn)品或BI分析師維護,主要包括歸屬信息(業(yè)務板塊、數(shù)據(jù)域、業(yè)務過程),基本信息(指標名稱、指標英文名稱、指標定義、統(tǒng)計算法說明、指標類型(去重、非去重)),業(yè)務場景信息(分析維度,場景描述);
  • 技術(shù)信息對應指標的物理模型信息,由數(shù)據(jù)研發(fā)進行維護,主要包括對應物理表及字段信息;
  • 衍生信息對應關(guān)聯(lián)派生或衍生指標信息、關(guān)聯(lián)數(shù)據(jù)應用和業(yè)務場景信息,便于用戶查詢指標被哪些其它指標和數(shù)據(jù)應用使用,提供指標血緣分析追查數(shù)據(jù)來源的能力。

原子指標定義歸屬信息 + 基本信息 + 業(yè)務場景信息派生指標定義時間周期 + 修飾詞集合 + 原子指標修飾類型主要包含類型說明、統(tǒng)計算法說明、數(shù)據(jù)源(可選) 

5. 指標體系建設(shè)流程 

 建模流程 

建模流程主要是從業(yè)務視角指導工程師對需求場景涉及的指標進行主題抽象,歸類,統(tǒng)一業(yè)務術(shù)語,減少溝通成本,同時避免后續(xù)的指標重復建設(shè)。

圖片圖片

分析數(shù)據(jù)體系是模型架構(gòu)中匯總事實表的物理集合,業(yè)務邏輯層面根據(jù)業(yè)務分析對象或場景進行指標體系抽象沉淀。滴滴出行主要是根據(jù)分析對象進行主題抽象的,例如司機主題、安全主題、體驗主題、城市主題等。指標分類主要是根據(jù)實際業(yè)務過程進行抽象分類,例如司機交易類指標、司機注冊類指標、司機增長類指標等。 基礎(chǔ)數(shù)據(jù)體系是模型架構(gòu)中明細事實表和基礎(chǔ)維度表的物理集合,業(yè)務邏輯層面根據(jù)實際業(yè)務場景進行抽象例如司機合規(guī)、乘客注冊等,還原業(yè)務核心業(yè)務過程。

 開發(fā)流程 

開發(fā)流程是從技術(shù)視角指導工程師進行指標體系生產(chǎn)、運維及質(zhì)量管控,也是數(shù)據(jù)產(chǎn)品或數(shù)據(jù)分析師和數(shù)倉研發(fā)溝通協(xié)調(diào)的橋梁。

圖片圖片

6. 指標體系圖譜建設(shè)

 指標體系圖譜概述 

指標體系圖譜也可稱為數(shù)據(jù)分析圖譜主要是依據(jù)實際業(yè)務場景抽象業(yè)務分析實體,整合梳理實體涉及的業(yè)務分類、分析指標和維度的集合。 建設(shè)方法:主要是通過業(yè)務思維、用戶視角去構(gòu)建,把業(yè)務和數(shù)據(jù)緊密關(guān)聯(lián)起來,把指標結(jié)構(gòu)化分類組織。 

建設(shè)目的:

  • 對于用戶:便于用戶能夠快速定位所需指標和維度,同時通過業(yè)務場景化沉淀指標體系,能夠快速觸達用戶數(shù)據(jù)訴求。
  • 對于研發(fā):利于后續(xù)指標生產(chǎn)模型設(shè)計、數(shù)據(jù)內(nèi)容邊界化、數(shù)據(jù)體系建設(shè)迭代量化和數(shù)據(jù)資產(chǎn)的落地。

 指標體系圖譜模型 

圖片圖片

 指標體系圖譜實例 

圖片圖片

指標體系產(chǎn)品化

圖片圖片

指標體系涉及的產(chǎn)品集主要是依據(jù)其生命周期進行相應建設(shè),通過產(chǎn)品工具打通數(shù)據(jù)流,實現(xiàn)指標體系統(tǒng)一化、自動化、規(guī)范化、流程化管理。因為指標體系建設(shè)本質(zhì)目標是服務業(yè)務,實現(xiàn)數(shù)據(jù)驅(qū)動業(yè)務價值,所以建設(shè)的核心原則是“輕標準、重場景,從管控式到服務式”。通過工具、產(chǎn)品、技術(shù)和組織的融合提高用戶使用數(shù)據(jù)效率,加速業(yè)務創(chuàng)新迭代。

其中和指標體系方法論強相關(guān)產(chǎn)品就是指標字典工具的落地,其產(chǎn)品的定位及價值:

  • 支撐指標管理規(guī)范從方法到落地的工具,自動生成規(guī)范指標,解決指標名稱混亂、指標不唯一的問題,消除數(shù)據(jù)的二義性
  • 統(tǒng)一對外提供標準的指標口徑和元數(shù)據(jù)信息

工具設(shè)計流程 (方法論->定義->生產(chǎn)->消費)工具設(shè)計流程 (方法論->定義->生產(chǎn)->消費)

指標定義指標定義

指標生產(chǎn)

結(jié)束語

文章整體介紹了指標體系建設(shè)方法論&實踐和工具產(chǎn)品的建設(shè)情況,指標字典和開發(fā)工具已實現(xiàn)流程打通,與數(shù)據(jù)消費產(chǎn)品的打通后續(xù)會通過DataAPI方式提供數(shù)據(jù)服務。

責任編輯:武曉燕 來源: 五分鐘學大數(shù)據(jù)
相關(guān)推薦

2022-06-20 09:08:00

數(shù)據(jù)體系搭建

2023-04-28 07:34:39

數(shù)據(jù)指標數(shù)據(jù)治理

2020-08-31 16:19:26

IT治理建立績效體系

2025-06-12 02:55:00

數(shù)據(jù)指標體系

2024-07-11 11:52:24

數(shù)據(jù)指標體系

2023-10-30 08:14:14

數(shù)據(jù)指標體系

2025-05-09 02:22:00

數(shù)據(jù)指標體系

2022-09-20 09:42:54

數(shù)據(jù)指標

2024-04-24 08:15:40

數(shù)據(jù)模型大模型AI

2024-05-29 12:41:33

2023-02-16 18:20:01

電商搜索數(shù)據(jù)

2023-04-27 07:39:39

科技運營指標信息

2024-11-14 11:07:15

2011-09-22 14:20:38

中國軟件評測中心

2024-01-26 07:26:58

梳理數(shù)據(jù)指標體系業(yè)務

2012-11-30 15:08:16

指揮城市IT解決方案H3C

2024-04-02 07:56:41

2025-08-06 03:11:00

監(jiān)控運營量化管理

2024-10-29 08:09:18

2024-07-16 08:38:17

點贊
收藏

51CTO技術(shù)棧公眾號