DAMA數據治理CDGA/CDGP認證考試備考經驗分享
數據學堂 2021-09-24 06:30
2021年9月5日,筆者在北京藍調莊園參加了 DAMA 中國舉行的 CDGP(數據治理專家)考試。這次參加考試,距離今年6月通過 CDGA 時間不算長,複習倉促,沒有太大把握,考後心情尤為忐忑。孰料17日獲知成績,居然通過了,欣喜之餘又頗覺慶幸。
畢竟參加 CDGP 考試的感覺和 CDGA 又有很大不同,幾道主觀論述題答得滿頭大汗。這次能通過,確有幾分運氣成分在內。考試不易,在此對兩次考試的經驗做一個小小的總結,希望能對後續有志於參與DAMA中國CDGA/CDGP考試的朋友有所幫助。
0. 關於DAMA中國和CDGA/CDGP考試
國際數據管理協會(DAMA國際)是一個全球性的專業組織,由數據管理和相關的專業人士組成,非營利性機構,廠商中立。協會自1980年成立以來,一直致力於數據管理和數字化的研究、實踐及相關知識體系的建設,先後發行了《DAMA 數據管理字典》和《DAMA數據管理知識體系》等。該知識體系目前已被廣泛使用,並已成為業界的標杆和權威。
為緊貼國內數據治理和數字化的發展趨勢,2020年10月起,國際數據管理協會中國分會(DAMA中國)對DAMA國際數據管理專業人員認證( CDMP )的考試語言、考試形式、考試內容、證書類型等進行了適當本地化重構。重構後認證考試分為數據治理工程師—CDGA( Certified Data Governance Associate)和數據治理專家—CDGP( Certified Data Governance Professional )。 DAMA中國承擔認證考試命題工作,並定期組織中文考試,對考試通過者由DAMA中國頒發認證證書。
中文版的CDGA、CDGP和英文版的CDMP證書國際通用,行業認可,是數據管理領域最專業的職業認證之一。
以上内容引自DAMA中国官方公众号文章(链接:https://mp.weixin.qq.com/s/VyQjNo3ePP90JIs79lRI4Q)
了解更多DAMA认证考试内容,点击阅读:一文读懂DAMA数据治理工程师认证考试(内含福利)
1. 个人情况
近二十年IT从业经验,一直在软件研发领域的项目。目前主要从事信息系统项目管理及系统分析设计类工作,但没有专门从事数据治理项目的经验。
2021年初了解到 DAMA 中国的认证,为拓展知识领域及项目的需要,6月份报名参加了入门级 CDGA 考试,成绩81分。通过后于9月再报 CDGP 并通过,成绩72分。
2. CDGA 考試總結
2.1 我的複習方法
主要方式就是看書,包括《DAMA-DMBOK2 數據管理知識體係指南》和《穿越數據的迷宮:數據管理執行指南》,這兩本書在網絡都有售賣。
其中後者可以看作是前者的簡化版本,便於從宏觀上掌握 DMBOK2 的綱要,主要的還是靠DAMA-DMBOK2 來學習,對這本教材我一共看了四遍:
通讀教材,了解基本內容和不同知識領域自己的掌握情況,做到心中有數
精讀教材,結合筆記、思維導圖系統梳理知識點,這一遍時間最長
結合了數貝(廈門數貝信息科技有限公司提供的“databok數據課”,可以在微信中搜索到小程序“數貝”)提供的練習題進行模擬訓練,對訓練過程中出錯的題目反向查找知識點進行強化學習,加深理解
查漏補缺,快速過一遍教材
當然,實際的學習過程可沒有說起來這麼輕鬆,建議大家還是投入相當的時間和精力去學習。
2.2 心得體會
1、對於 CDGA 考試,全是單選題,個人覺得最重要的就是對概念的清晰理解和把握,因此許多東西確實是要“背”的。對於重要章節,如數據治理、數據架構、建模與設計、元數據、數據質量、數據安全、數據倉庫和商務智能等,應該較為全面的學習;而對於其它次重要章節,則一定要重視語境關係圖,把每個知識領域的目標、原則、輸入、活動、交付成果、參與人員、方法、工具、度量指標等搞清楚。這些知識點相當零碎,要想全背誦下來,還是不太現實的,但多看幾遍你就會找到一些語感,考試時憑直覺不會犯重大錯誤。
2、正因為無法做到精確背誦,在考試時有些模糊的題目,我盡量做到以第一感覺為主,不想太多。
3、做模擬題有一定的作用,確實有一些題目會押中,但比例不大,還是要靠學習為主,模擬題主要是幫助進行知識點回顧。
4、如果有一些信息系統相關的經驗,有些題目對你來說就很簡單了。例如數據建模相關的。
5、務必注意考試時間,我是等最後快沒時間了才做完(畢竟有些題目還是舉棋不定,耽誤了時間,100道題目100分鐘,需要快速做決定),後面十幾分鐘手忙腳亂地填塗答題卡,沒有多少時間檢查。
6、現在看,CDGA 還是相對簡單的,相關概念清楚,配合一些經驗和常識,即使沒見過,也有一定的機率“蒙”對,但為了提高這個機率,還是努力看書吧!
3.CDGP 考試心得
3.1 我的複習方法
對於 CDGP,我絲毫不敢掉以輕心。一方面是參加 CDGA 時發現自己確實掌握得不牢固,另一方面也知道CDGP 不像 CDGA 題目類型簡單,有10道單選題,15道多選題,後面幾道大題內容和出題方式都未知。因此在初期的複習是有些茫然的,所幸參加了數貝提供的公開培訓,了解了 CDGP 考試的相關情況,當時還做了一些要點記錄:
1、CDGP考試論述題內容
重點包括架構設計、邏輯模型設計、性能問題解決方案、數據質量、元數據問題解決方案等;
題型包括知識點類(如數據質量問題的來源)、活動排序類(如數據科學、主數據等活動超過七個的知識領域)、開放類(結合經驗論述,如集成外部數據時如何做到標準化);
尤其應當關注數據倉庫與BI、大數據領域的架構設計案例、架構圖;
模型設計可能包括關係模型或維度模型。
2. 答題要點
寫字工整;
寫出要點,不需要長篇大論;
只要言之有理就可能得分;
有些題目可能會有些繞彎,需要認真辨析題義。
這些內容雖然和後續我參加考試的體會並不是完全一致的(畢竟DAMA中國的老師們也在對考試進行不斷迭代),但它確實驅散了眼前 CDGP 考試的一部分迷霧,為我修訂自己的複習方法提供了信息支持:
我再次系統地看了一遍書,就當自己從來沒看過。這一遍居然看出了不少新的體會,逐步在頭腦中形成了一個整體框架,甚至可以靠回憶來把知識體系串起來了。
我手動把DMBOK2中所有認為重要的圖表都畫了一遍,以應對可能出現的“畫圖”題目。尤其是數據倉庫和商務智能中的那兩個架構圖(CIF和數倉棋子視圖),反反复复畫了好幾遍,直到可以“默寫”,後來考試雖然沒用上這兩張圖,但它讓我對數據倉庫的架構加深了理解,事實上題目中也確實有數據倉庫架構類的題目。
3. 擴展閱讀,我給自己制訂了一個書目。不過需要注意的是,這些大部頭要想在短短一兩個月全部啃下來是不可能的,一方面有些書我以前已經讀過了,另一方面,我主要是將這些外圍知識與 DMBOK2 中的知識體系連接起來,不到於有枝無葉,所以更多是快速瀏覽學習。
圖書較多,就不附鏈接了,書名如下:
《穿越數據的迷宮:數據管理執行指南》
《數據倉庫》
《數據治理:工業企業數字化轉型之道》
《數據倉庫工具箱:維度建模權威指南》
《大數據架構詳解:從數據獲取到深度學習》
《主數據驅動的數據治理》
《中台實戰:數字化轉型方法論與解決方案》
《中台戰略:中台建設與數字商業》
《數據治理:如何設計、開展和保持有效的數據治理計劃》
《數據中台架構:企業數據化最佳實踐》
《數據中台:讓數據用起來》
《數字化轉型方法論:落地路徑與數據中台》
《Hadoop構建數據倉庫實踐》
《NoSQL數據庫入門與實踐》
《數據治理與數據安全》
《大數據分析:數據倉庫項目實戰》
3. 把各知識領域的語境關係圖打印出來裝訂成了一個小本,有空就拿出來看看,幾乎快背下來了(主要是想應付上文所說的“排序題”,不過也沒用上,只是這回碰到單選題,幾乎不用猶豫了)。
4. 最後,非常關鍵的一點,把數據建模與設計的知識重點複習了一下。從數貝的培訓老師那裡了解到,CDGP 建模是必考題,也就是針對特定的業務場景建立邏輯數據模型。作為信息系統的分析與設計人員,建模對我來說並不算陌生,但是對信息工程表示法(也就是鴨掌模型)我並不太熟悉,因此特地找了一些相關資料來學習,事實證明,用上了。
3.2 心得體會
整體上,感覺 CDGP 考試的壓力還是很大的,由於有 CDGA 考試的教訓,怕時間不夠,我已經相當注意控制每道題的解答時間,但時間還是在不知不覺中流逝了,等我做到最後一道題目時,時間也就剩下40分鐘左右,然而最後一道題目還需要建立較為複雜的數據模型,我強迫自己冷靜下來,先完成了初稿,然後趕緊回去把選擇題給檢查了一遍,填寫答題卡,然後回頭又根據最後一題題意進行了模型的細節完善。時間總算還夠用,謝天謝地。
關於解題的心得如下:
1、關於單選題,沒什麼可說的,概念清晰的話,這些題目感覺就是送分來的。
2、多選題,有相當的難度。尤其需要注意的是,不能完全依賴於語境關係圖,它會涉及知識領域的一些細節。印像中有一道題目,是關於主數據管理的關鍵處理步驟的,其中第四步“實體解析和標識符管理”的“匹配流程/協調類型”包括“重複標識匹配規則”、“匹配鏈接規則”、“匹配合併規則”。這個知識點我完全沒想到會出現在考試中,其結果是選錯了。另外還有一小部分是關於業務前沿概念的,比如數據交易、OneData / OneID等,這就需要平時有一定的涉獵和應用才行了。總之,深度和廣度都必須到位,否則這一部分內容是很容易失分。
3、終於說到論述類題目了,本次 CDGP 考試牽涉到的幾道題目大意如下:
衛生健康委擁有海量的醫療相關數據為何不願意公開提供服務?出於哪些考慮,如何解決?
你作為首席專家如何開展某企業的數據管理成熟度評估項目的工作?
一家擁有多分支機構的跨國企業應如何選擇合適的數據治理模式?
民政局的婚姻登記數據如何在半小時內就能通過接口提供給數據需求方,需要什麼樣的架構?
對電影院訂票系統數據建模(原題較長,其實可以參考淘票票或其它訂票APP)
看到了嗎?沒一道題目是讓你直接回答知識點的,全部都是理論聯繫實際的題目。自認為把書背得還可以的我當時看到這些題目有點蒙,不過冷靜下來之後發現這些題目也沒有跑出複習的範圍,上面這幾道題目不就是對應了數據安全、成熟度評估、數據治理、數據倉庫和商務智能(大數據)、數據建模與設計等相關章節的知識嗎?關鍵看你怎麼應用這些知識點了。
相信大家看到這已經明白,CDGP 考試的命題者們真的是用心良苦,他們並不希望我們通過死記硬背的方式通過考試——那還能稱得上“數據治理專家”嗎?這必然要求你有實踐經驗,且能把經驗上升到理論高度才能得分的。這時候,多年從事信息系統研發的經驗總算派上用場了,雖然沒有絕對把握,每道題至少有自己的見解可以發表。
關於前幾道論述題,大家完全可以在書上找到相關的知識點,這裡只分享一下最後一道建模題,我的解答方法:
1)快速通讀業務場景描述,用筆劃出論述中的名詞,在大腦中建立一個概念模型(也就是牽涉到的實體,不考慮它們的屬性),並且你需要考慮一下你畫圖的佈局,畢竟你是在用筆劃圖而不是用電腦,無法方便地修改模型的位置。把這些實體的名稱按你預想的位置畫到答題紙上,先不要畫屬性,根據預估留出空白。
2)結合材料對概念模型進行完善,把屬性加上,注意一部分是實體本身的屬性,另一部分是用於建立關聯的外鍵屬性。只要想到了就寫上,對於主鍵標上PK,外鍵標上FK。
3)對實體之間的關係繪圖,可能需要根據業務邏輯建立一些用於關聯的實體,這些實體原文中是沒有的。把實體用線聯接,並把關係的元數做好標記。
4)檢查模型,完善後封口,把實體變成完整的矩形。
5)在實際操作中,這個過程需要快速思考和設計,我畫的時候出現了好幾次考慮不周,把畫好的實體又添加上屬性的情況,不過時間太緊張,也算情有可原吧。有同考的伙伴建議可以拿准考證當草稿紙,先把概念模型佈局給畫上,這樣正式畫圖之前會胸有成竹一些,可惜當時我沒想到這一點,否則模型的佈局就不會太凌亂了,大家可以參考此做法。
4. 總結
1、多看幾遍書是非常必要的,儘管 DMBOK2 這本書很厚,知識點繁雜,很容易讓人感覺千頭萬緒。但是世上本沒有路,走的次數多了,也就踩出了一條路。
2、類似建模這些技能,是真的有必要練習的,因為你不僅要會,而且要快。
3、CDGA 重在釐清概念,CDGP 重理論應用,這的確是一個逐步深入的過程,如果能把這個學習的過程與工作結合起來,真正形成解決問題的技能而不是僅僅應付考試,豈不更好?
4、有時候,考前開一瓶紅牛真的很重要。