美國退伍軍人事務部應對大數(shù)據(jù)挑戰(zhàn)的七種方式
ZDNet存儲頻道 發(fā)表于:13年07月24日 14:32 [轉載] DOIT.com.cn
大數(shù)據(jù)一定要讓人大傷腦筋?
美國退伍軍人事務部(簡稱VA)在大數(shù)據(jù)方面遇上了大難題。
作為弗吉尼亞州數(shù)據(jù)管理與分析事務助理部長兼分析師,Dat Tran在本周于美國馬薩諸塞州坎布里奇市的麻省理工學院第七屆年度信息質量研討會上擔任主講嘉賓。VA是美國國內第二大聯(lián)邦機構,其需要打理的數(shù)據(jù)量超過11PB。然而根據(jù)Tran的表述,問題在于數(shù)據(jù)的質量實在是參差不齊。重復數(shù)據(jù)項大量存在,不同系統(tǒng)之間缺乏互操作性,而且沒有“權威人士”負責打理客戶記錄。
不過Tran和他的技術團隊近來正著手對整個VA機構的大規(guī)模數(shù)據(jù)質量進行調整,希望借此改變當前的被動狀況。這里我們一同來看看Tran在實踐工作中的經(jīng)驗教訓。
1.對數(shù)據(jù)進行細致觀察
他們認為解決問題的第一步在于正確識別當前問題。Tran在處理VA事務時也確實遵循了這一理念。
在主題演講中,他首先表述了VA數(shù)據(jù)生態(tài)系統(tǒng)是如何孤立且凌亂。除了VA數(shù)據(jù)本身的龐大規(guī)模——共包含980萬條醫(yī)療登記記錄、206萬條家庭貸款記錄以及4900萬條退役年金主文件記錄——容納數(shù)據(jù)的各系統(tǒng)之間往往也嚴重脫節(jié)、根本無法彼此交互。最重要的是,數(shù)據(jù)捕捉與存儲各自采取不同方式,這不僅引發(fā)大量潛在錯誤、還迫使工作人員不得不以手動方式加以處理。
“我們缺乏一套全局視角,用以觀察客戶(也就是退伍軍人)、軍人家庭成員以及現(xiàn)役人員如何使用VA提供的福利或服務,”Tran總結道。
2.將數(shù)據(jù)映射至業(yè)務流程
Tran指出,識別重復數(shù)據(jù)條目的最佳方式在于后退一步,將數(shù)據(jù)的捕捉與存儲機制與各業(yè)務流程線加以映射。
“每當客戶來到服務臺前,我們首先要問自己的是‘我們需要收集該客戶的哪些信息?這些信息應被保存在哪種系統(tǒng)當中?又該將其提交給哪種處理系統(tǒng)?’”
Tran表示,機構在推動數(shù)據(jù)質量項目時可能犯下的最大錯誤就是純粹從“數(shù)據(jù)及系統(tǒng)的角度”審視數(shù)據(jù)。相反,管理者應該從更為宏觀的視角進行觀察,識別不同數(shù)據(jù)在日常工作中會被哪些業(yè)務流程所使用。他認為,這樣技術人員才能準確把握整個機構的數(shù)據(jù)流,并更好地找出哪部分流程最容易發(fā)生錯誤或出現(xiàn)重復條目。
3.不要把數(shù)據(jù)與信息混淆起來
Tran指出,他們在VA數(shù)據(jù)質量項目中獲得的最寶貴經(jīng)驗之一在于,數(shù)據(jù)與信息二者并不是一回事、定義也不盡相同。數(shù)據(jù)只有在準確并獲得及時更新的情況下才能與實際信息相符。如果二者不相符,那么這部分數(shù)據(jù)根本沒有保存的價值。
Tran舉例稱,VA保存有“成千上萬”條社保號碼,并從小到大進行排序。然而事實證明這些數(shù)字并無意義,社會保障管理局稱他們從未以這種方式對參保人加以排列。
“僅在系統(tǒng)中承載數(shù)據(jù)還遠遠不夠,”Tran解釋稱。“大家需要確認這些數(shù)據(jù)是否實際有效。”
4. 采用管理者易于接受的表達方式
Tran強調稱,數(shù)據(jù)質量并不僅僅屬于IT難題。業(yè)務部門同樣應該為其劃撥資源,IT則負責將高質量數(shù)據(jù)中的價值傳遞給管理者及決策者。
不過一旦采用這樣的處理方式,請大家千萬不要在溝通過程中涉及太多技術因素。系統(tǒng)或者架構層面的數(shù)據(jù)質量問題應該是技術人員內部討論的對象,而面向管理者時,我們必須將數(shù)據(jù)質量簡化為業(yè)務事務而非技術事務。
“我知道很多同行喜歡討論架構方面的話題,”Tran表示。“但通過多年工作實踐,我發(fā)現(xiàn)一旦脫離表層、開始轉向架構,業(yè)務部門的同事們就會抓狂甚至當場爆發(fā)。”
5.任命一位首席數(shù)據(jù)官
要想確保管理者真正理解高質量數(shù)據(jù)反應出的價值,最好的辦法是在IT與業(yè)務部門之間設立一個全新角色,充當二者的溝通橋梁。根據(jù)Tran的理解,這個角色就是首席數(shù)據(jù)官(簡稱CDO),一位精于技術同時又能與機構高層順暢交流的多面手。
“大家必須設立這樣一個職位,”Tran建議道。“就我個人看來,CDO有點像是身兼技術與業(yè)務兩種職責的通才。我認為一名合格的首席數(shù)據(jù)官必須深刻理解業(yè)務部門的需求,而不能僅僅屬于技術人員或者數(shù)據(jù)分析師。總之,掌握數(shù)據(jù)的實際使用過程非常關鍵。”
6.別把數(shù)據(jù)管治當成“項目”
在與高層管理者談論數(shù)據(jù)管治或者質量倡議問題時,請避免使用“項目”這類術語,Tran提醒道。對于非技術人員,我們最好不要為其劃分明確起點與終點。數(shù)據(jù)管治應被看作一套常備機制,一種機構內所遵從的處理措施。
“大家不要把數(shù)據(jù)管治描述為項目級別的管理工作,因為所謂項目必然擁有起點與終點。如果大家希望把數(shù)據(jù)質量或者信息質量作為文化推廣開來,那么相關努力應當始終持續(xù),”Tran進一步解釋稱。“因此不要套用項目的概念,因為人們聽到這樣的字眼就會誤以為這項工作擁有明確的終點,達到預定目標事情就結束了。”
7.讓商務智能與創(chuàng)新攜手
在面對商務智能工作時,Tran提出了兩點建議:保持流程簡潔,不要被條條框框束縛了思維。
他認為,一旦商務智能措施太過復雜、涉及大規(guī)模數(shù)據(jù)集或者嘗試同時解答大量問題,那么執(zhí)行過程往往會錯誤百出。相反,Tran建議我們每次只回答一個問題。
“大家希望回答哪個政策問題?大家打算解決哪項難題?在商務智能領域,這才是我們最需要提出的問題,”Tran解釋道。
他同時補充稱,不要在商務智能與創(chuàng)意的結合方面畏首畏尾,而且盡量別把自己束縛在單一商務智能或者分析工具身上。盡管這樣的結論聽起來有些出乎意料,但Tran提醒稱“沒有哪種商務智能解決方案足以搞定全部問題。”