對于任何從事數據治理的相關人員來說,首先需要明白一個道理,即數據治理在任何企業都是一件非常困難的事情,其往往有著極大的失敗的可能。失敗的原因往往可能是治理團隊給出的建議或者流程對既有的業務產生非常大的影響(業務滿意度);數據治理并沒有解決當下的數據質量的問題,數據質量問題依舊存在(數據質量問題)問題等;甚至可能是因為公司高層不知道數據治理最終成果,導致數據治理工作被叫停(治理成果不明確)等。
同時數據治理是一項長期的工作,即數據治理團隊可能在企業中進行長期的數據治理相關的工作,那么可能由于各種原因導致數據治理團隊的工作與業務團隊相距甚遠,給團隊或者外部產生很長時間沒有成果的錯覺,最后導致數據治理工作的失敗。
根據筆者過往項目的經驗,在數據治理項目中一定要把握如下6個核心的準則,分別是確定范圍、融入團隊、由點到面、團結業務、主動溝通、定期匯報成果,它們對數據治理項目的成功提供一定的幫助。這6個核心準則形成如圖1所示的數據治理核心準則。

圖1數據治理核心準則
這6個準則互相依賴,缺一不可,構成數據治理成功的關鍵。
1.確定范圍
確定范圍主要是指確定進行數據治理的范圍,它包括兩個方面的意思。其一是企業中需要進行數據治理的范圍,即如果某個企業需要進行數據治理的時候應該依托于企業的業務模式確定需要被治理的范圍。舉個例子,如果針對跨國企業的供應線進行數據治理,那么可能涉及該企業在全球的任何組織。其二是企業中涉及中被治理數據的范圍,即根據業務模式確定組織的治理范圍(業務部門或者事業線),然后確認需要被治理的數據范圍。
在確定需要被治理的組織以及數據之后,需要明確具體特定組織的不同數據所被要求的嚴苛程度并不是一致的。因為在企業相同的業務場景下中往往存在不同類型的數據,例如某些數據是全球的、國家層面的或者本地的。所以不同級別的組織架構的數據重要程度往往也是不一樣的。如果要求所有的數據都按照一種標準進行要求,無論是對于數據治理的團隊還是對于企業來說都是不太現實的,所以在確定具體的范圍之后一定要分清所需要進行數據治理的數據重要程度。
2.融入團隊
按照筆者過往的經驗,往往企業80%的業務可能主要集中在企業數據的50%甚至更少的數據中(這些數據往往跟主數據息息相關),并且90%的問題可能都是因為這50%的數據帶來的。如果從數據治理的成果來看,需要集中資源去解決產生絕大多數問題的關鍵數據。那么就需要數據治理的團隊去深入到一線中,去了解產生以及使用這些數據的技術人員或者業務人員所遇到的痛點,并從組織、數據標準或者流程等層面去解決類似的問題。
融入團隊可能是數據治理核心準則之一。因為一個企業或者部門需要進行數據治理的原因往往是該企業或者部門中存在產生數據問題的因素。這些因素可能是因為技術原因導致上游下發數據不及時或者不準確,或者是因為進行數據錄入過程中沒有按照制定的流程或者規范進行。這些問題往往并不是一個簡單的流程規范就可以解決的,為此需要切實地觀察技術團隊以及業務團隊日常運行的工作,發現其中關鍵的因素并加以解決。很多時候,問題并不是因為技術導致的。
筆者曾遇到某位業務人員抱怨某個系統數據初始化無法在早上6點左右完成,因為數據不全導致其無法在6點進行系統操作(其他業務人員往往都是在工作時間的時候進行操作),技術團隊進行數據優化依然無法滿足該要求。數據治理團隊融入團隊與其溝通之后才了解到,其一般7:30左右要送其孩子上學,往往到公司都會晚到,所以需要早起進行系統操作。之后系統中開發一個定時執行某些預設操作的功能之后,該問題得以解決。
很多時候一個看似合理的業務需求,背后往往可能是一個需要我們去探究的原因。如果單純地按照業務用戶的要求進行數據跑批優化的話,那么往往依舊無法滿足業務的需求,為此需要探究該用戶真正的需求,這也是融入團隊的核心。
3.由點到面
很多團隊在開展數據治理項目的時候,往往都是全面鋪開,將數據治理的團隊的成員融入到各個團隊中擬進行相應的治理工作。但是這樣做往往面臨著各種各樣的阻力,例如數據治理團隊似乎干擾正常的業務流程、團隊成員似乎并沒有提供有效的幫助等。這些聲音一方面會打擊數據治理團隊內部的信心,一方面會提高數據治理團隊推進相關政策的阻力。
為此在融入團隊收集業務背后真實訴求或者原因之后,數據治理團隊應該收集整理這些信息,結合數據治理的范圍統籌分析,找準一個關鍵的業務痛點進行治理。這個痛點可能是企業內部收到外部監管的部分或者核心的業務流程中的某個環節等。
依托這個痛點之后進行治理之后,然后重新分析當前企業內部不同的關鍵信息之后,再次治理,在運動中完成數據治理的工作。當然很多時候這個過程目標可能會發生變化或者調整,這些都是非常正常的事情。但是無論怎么看數據治理都應該以一個核心痛點作為一個起點,然后逐步擴大被治理的范圍。
4.團結業務
數據治理并不是一個技術驅動型的工作,其更多往往需要得到企業內部的業務人員的認可,即它能否切實地提高企業業務的運行效率,減少企業運行中的風險等。所以這個時候需要相應的業務人員進行背書,來肯定數據治理團隊的成果。
為此當數據治理團隊在某個特定的領域獲得階段性的成果的過程中,需要團結該領域所在的業務人員去針對該成果進行定性,即肯定數據治理團隊的工作成果。
這個過程有兩方面直接的益處,一方面可以證明數據治理團隊工作的價值,鼓舞數據治理團隊的士氣(因為數據治理團隊往往收到的質疑大于收到的肯定);另一方面可以通過這個機會增進與業務方的關系,增強數據治理團隊的非職權影響力,方便后續的數據治理團隊經驗在不同團隊的推廣。
5.主動溝通
數據治理團隊將在某個部門或者具體項目上的經驗總結形成具體的規范或者標準之后,必然面臨將該規范或者標準推廣到其他部門或者團隊的過程。這個過程往往是數據治理過程中相對最漫長、最耗費心神以及可能與其他部門沖突最激烈的過程。
為此數據治理團隊依然需要融入被推廣的部門或者組織中,去發現該組織與其他部門之間的共性與個性,找出該部門中的核心人物,這個核心人物往往是團隊中最具有影響力的人,這個人比較了解團隊實際情況,但其可能不會最直接的領導(往往也是如此)。數據治理團隊可以與其主動溝通,充分汲取他(她)的意見之后,并更新迭代相關標準或者規范,然后逐步推廣落地。
企業中往往有新成立的部門或者存在很久的業務部門,針對同一規范部門的反映可能是不一樣的。如果規范的內容是從舊部門中產出的,那么相應的這個規范就可能更容易推廣,反之可能就不一樣。當然如果是新成立的部門收到更高層的直接領導或者支持,那么情況也可能發生改變,為此數據治理團隊一定要因地制宜地找出關鍵人物,然后與他溝通推廣數據治理的成果。
6.定期匯報成果
數據治理團隊的成功往往依賴于團隊成員的非職權影響力,為此需要通過成果去提高自身的影響力,進而保證數據治理的成功。那么很明顯在團結業務以及主動溝通之后,在組織層面向高層數據治理團隊的成果,用來提高高層對于數據治理的信心,進而提高其的支持力度是數據治理可以順利進行的關鍵之一。
但是需要注意的是,定期匯報成果的材料以及與會人員必然是需要進行準備以及思考的。因為既然數據治理團隊需要提高高層的信心,那么匯報內容就必須與高層關心的方向相匹配,并在匯報的過程中反復強調。此外需要進行數據治理的企業往往是具有一定規模的,那么其內部不同的業務部門之間相互往來程度也不完全一樣,匯報的相關方需要與下個階段數據治理的工作相關聯,例如在匯報成果的會議上描繪一個與下一個治理部門相關數據應用場景,用來動員相應的業務部門,這無疑也會提升數據治理團隊工作的順利程度。
當然不同的企業的情況差距相對較大,數據治理的團隊需要具體問題具體分析。在不同的階段,不同的準則的作用是不一樣的,這也需要數據治理團隊靈活地掌握。當然基于這些準則并不能保證數據治理一定成功,所以需要科學的數據治理流程或者框架來盡可能提高數據治理的成功。
這些具體的流程在《企業級數據架構》一書都有這更加詳細的介紹。
關于作者:
李楊,資深數據架構師,在數據相關領域有10年以上工作經驗。頭部保險資管公司科技平臺交易系統團隊開發組負責人,負責多個應用以及數據平臺的建設、優化以及遷移工作。曾擔任某數據公司技術合伙人,負責多個金融機構的數據倉庫或數據平臺相關的工作。《企業級數據架構:核心要素、架構模型、數據管理與平臺搭建》作者。