數據治理小劇場
月初,信息中心的報表專員小王收到了“集團領導前來視察,需要體現一下上半年的生產訂單完成情況”的通知。根據生產管理部門的提供的指標需求,小王需要從MES、ERP、APS等系統中獲取“生產訂單計劃完成時間”、“生產訂單實際完成時間”等信息,來計算生產訂單完工及時率指標。
報表專員小王:李部長,我正在統計"上半年計劃完成的訂單數量"和“上半年按期完成的訂單數量”,遇到一個問題。 MES的派工單中有個“生產任務單號”、PM的項目表單中有個“工作爺號”、ERP的生產計劃單中有個"生產訂單號”是一回事嗎 ?
生產李部長:你算是問對人了,在做MES、PM、APS打通的廠商也在問啊。它們三個其實是一回事,只是不同系統中,叫法不同啊。
報表專員小王:那咱們有必要用到的時候就把他們的名字統一一下啊,要不然總被搞混啊。
生產李部長:目前都是靠個人理解吧。不過聽說信息中心這次在做企業級經營管控的時候也在梳理這些數據標準呢,上次還找我們調研了。具體怎么落地的,去問問他們吧。
報表專員小王:太好了!如果統一用到數據的時候,能夠清楚的知道每張表中每個字段的含義,能省不少事啊,主要是能為統計結果的準確性負責啊!
當前越來越多的企業認識到了數據的重要性,數據倉庫提供了一個統一支撐數據分析和決策的數據視圖。如何設計和落地數據元標準,進行規范化數倉建設,是做數據分析類項目需要重視的問題之一。
01、標準范圍怎么定:大而全VS業務導向
各業務系統的庫表數量過萬,字段數量近百萬……需要全部都制定標準嗎?全部進行數據元標準梳理需求花費大量的資源且很難落地,任何一個企業建設數據標準都不是為了建標準而建標準,而是為了服務于業務。從核心價值鏈出發,梳理重點業務活動所涉及的對象及屬性。在實際項目中,我們通常建議:一方面,企業以支撐指標計算的業務分析應用為牽引進行相關業務域的標準化制定及落地工作。另一方面,以業務系統間的共享為導向確定數據元標準的范圍。同時,數據標準工作任重而道遠,需要企業持續關注,并不斷擴展。
02、數據元標準應該落地在數倉哪一層?
在項目建設的實際過程中,ODS(數據緩沖區) 的數據結構直接從業務系統同步過來,與源系統保持一致,故該層往往不強調模型設計;DW層和DM層是需要基于工具或平臺重點進行模型設計與落地。尤其是作為公共模型層,DW層模型具有更多的可復用性和穩定性,因此,更需要實現標準化落地。
03、數據元標準在數倉中的落地方式
數據中臺系統,可以有效地幫助企業建立統一的數據元標準,消除數據的不一致性;同時將數據元標準落地到數倉建設中去。
【數據元標準】
在設計DW層模型時,平臺可根據選擇的數據元自動回填字段名稱、數據類型、業務定義等,保證該字段的規范性。
【引用數據元標準】
數倉作為統一的數據管理中心,在模型設計之初就需要引用標準來確保數據倉庫建設的科學性,進而才能達到數據資產的可管、可用、可查的目標。