品質數據管理中心 數據質量管理

數據質量管理(品質數據管理中心)
是企業數字化轉型的核心要素,大數據建設的目標是為了融合組織數據,增加組織的洞察力和競爭力,實現業務創新和產業升級 。而數據能發揮價值的大小依賴于其數據的質量高低 。

品質數據管理中心 數據質量管理


如果沒有良好的數據質量,大數據將會對決策產生誤導,甚至產生有害的結果,比如:
在金融企業中,因數據質量問題導致的信用卡欺詐失察在2008年即造成48億美元的損失;
在商業上,美國零售業每年僅因標價錯誤就損失25億美元;
在經濟損失上,數據錯誤每年對美國工業界造成的經濟損失約占GDP的6%;
在醫療事故上,美國醫療委員會統計表明,由于數據錯誤引起的醫療事故僅在美國每年就導致高達98000名患者喪生;
在電信產業上,數據錯誤經常導致故障排除的延誤、多余設備租用和服務費收取錯誤,損害了企業信譽甚至會因此失去很多用戶;
在數倉建設上,50%的數據倉庫因數據質量而被取消或延遲……
提高數據質量是為了鞏固大數據建設成果,因此,高質量的數據是企業業務能力的基礎 。今天小億就來為大家說說什么是數據質量管理?數據質量問題產生的原因是什么?以及我們該如何做好數據質量管理?
一、什么是數據質量管理?
1.數據質量
數據質量在業務環境下,數據符合數據消費者的使用目的,數據質量需要滿足業務場景具體的需求 。數據質量包含兩個方面:數據自身的質量和數據的過程質量 。
數據自身的質量很好理解,比如數據必須真實準確地反映實際發生的業務,任何業務操作的數據都沒有被遺漏,數據存在各種約束條件,這種約束條件不能自相矛盾等等 。
數據的過程質量就是數據的使用過程符合標準規范,比如數據存儲:數據是否被安全的存儲到了合適的介質上,能夠保證數據不受外來因素的破壞 。當然數據存儲只是數據使用過程的一個環節,除此之外還包括獲取、傳輸、應用和刪除等一系列的使用過程,這其實也是數據生命周期的各個階段 。
2.數據質量管理
數據質量管理指對數據在每個階段里可能引發的各類數據質量問題進行識別、度量、監控、預警等一系列管理活動,并通過改善和提高組織的管理水平確保數據質量的提升 。
換句話說,數據質量管理是一個集方法論、管理、技術和業務為一體的解決方案,不是一時的數據治理方法,是一個不斷循環的管理過程 。一方面反映出企業數據很難一次性就達到使用的標準規范,畢竟數據治理是一個相對漫長的過程;另一方面也反映出數據質量的重要性以及數據質量工作的零散性和瑣碎性 。
3.數據質量評估
至于如何去評估數據質量管理的過程的好壞,我們可以從以下五個維度來進行數據質量評估:
品質數據管理中心 數據質量管理


(1)完整性:描述信息的完整程度,如電話號碼是否有空值;
(2)準確性:描述數據和客觀實體的特征是否相一致,如數據庫中記錄的電話和實際電話不一致;
(3)有效性:數據是否滿足用戶定義條件、內容規范約束等,如年齡為-32歲,違反常理;
(4)一致性:描述同一個信息主體在不同數據集中的屬性是否相同,如崗位名稱在CRM系統中和人力系統中不一致;
(5)及時性:描述從業務發生到相關數據能夠被使用的及時程度,如實時查看用戶行為相關數據 。
五個維度共同構成了數據質量評估的基本框架,每個維度都可以通過設置評估問卷隨機抽取一些問題然后收集相應的數據;注意收集數據的時候可以采用不同的方式,訪談、發放鏈接、隨機抽檢等等 。

推薦閱讀