[分享] 銀行大數據平台如何搭建和發揮價值?

數據達人

江蘇銀行是在江蘇省內無錫、蘇州、南通等10家城市商業銀行基礎上,合并重組而成的現代股份制商業銀行,是江蘇省唯一一家省屬地方法人銀行。江蘇銀行有營業機構510多家,其中,省內下轄12家分行,在南京地區擁有23個營業網點,在省外開設了北京、上海、深圳、杭州4家分行,全行現有員工1.4萬餘人。

本文是江蘇銀行科技部朱妍在帆軟銀行大會上的演講,這裡整理成文。

2016年,作為大數據平台的組成構建,帆軟數據多維分析平台BI系統平台正式在江蘇銀行啟動運行。大數據平台為數據多維分析平台提供了優質、多維的數據以及高性能數據處理的底層。

數據多維分析平台的數據基礎

江蘇銀行大數據平台,整合、清洗了大量內部、外部數據,為數據多維分析做好了數據準備,也就是為「巧婦」準備了充足的「好米」。

引入的數據主要分三大類。第一類是企業生產數據,比如煙草、電力、電商、運營商等數據,這部分數據重點雙方合作,直接接入數據;第二類是政府機構等公共數據,比如公積金、地稅、法院、工商、社保、醫保、海關等數據,這部分主要藉助的是政府對大數據產業的推動,積極對接數據,不過數據清洗和對接工作量比較大;第三部分是偏向個人身份數據,比如學習、戶籍、房價、房產、商戶驗證等數據。這部分數據主要用來做身份識別和校驗以及個人信用評級。整體三部分的數據提供了充分的個人信用評級數據和企業信用評級數據,為開展開展風控業務,以及創新產品「稅E融」提供了數據分析決策的基礎。

數據多維分析平台的產生背景

大數據平台的搭建提供了充足的分析數據,但同時也形成了巨大的挑戰。銀行1萬4千多名員工,現已開發900多張報表,在用將近700張,這些報表的數據來源多達49個,一年的報表開發需求量,達到了開發一個新報表系統的量級。

過去以往的數據分析流程是業務部門提出需求 ——科技部分析需求 ——雙方溝通口徑 ——科技部試取數據——業務部修改口徑 ——科技部再次試取數據…… 如此往複幾輪,完成報表製作。但製作的報表並不完全滿足需求,業務部門需要Excel加工。這樣業務部門看不到基礎數據,只能依賴科技部來做個性化定製取數,造成統計周期特別長,分析數據十分不靈活。

現在業務發展迅猛,數據分析需求繼續採用之前的報表開發流程已經無法滿足業務快速發展的需求。現在預計一年的數據分析需求,完全換算成單獨報表,要超過5千張。因為龐大的工作量,之後採用了新的數據分析方式。採用業務部和科技部預先商議數據分析主題,然後科技部定製數據分析主題包。也就是將業務部門的需求劃分成若干主題,針對每一個主題,預先匯總、關聯、轉義好數據,讓業務人員能有一目了然的看到他所需要的數據,需要分析,只需要拖拽形成圖和表格即可。當然,這裡面是需要解決許可權分配、大並發、高性能數據處理等方面帶來的問題。這塊通過數據多維分析平台和大數據平台結合,已經解決。

數據多維分析平台的效果展示

數據多維分析平台,可以讓業務人員自助進行數據分析,無需了解資料庫,無需學習技術語言,甚至不需要懂太多的數據分析的理論以及數理統計知識。只要是了解業務的人員,經過10分鐘培訓,都可以自助拖拽進行分析。這大大減輕了科技部的工作,同時業務部門可以靈活定製分析,對數據準確度也提高了信任,不再輕易懷疑科技部對數據做了什麼手腳。

當然,數據分析功能雖然是開放的,但是數據許可權是嚴格把控的。什麼人能看哪些數據,什麼人能看哪些欄位,一部分是科技部這邊做一個高層級的許可權劃分,而細粒度的許可權劃分是可以分配給多個不同的管理員,讓業務部門自行把控低層級的許可權。

在具體的應用上,江蘇銀行實施了領導視圖、卡部報表、零售部報表、Excel數據導入、串串盈報表等。

下圖是行領導視圖中的一張,領導打開電腦或者手機,就可以看到行內核心機構分布、優質分行的客戶數排行等。領導關注這些數據,同時會對其中的不特定的機構進行詳細鑽取,深入了解特定機構的經營狀況。所有的數據都是關聯打通的,所以,只要需要其他維度的信息,領導都可以直接點擊或者拖拽,就能直觀看到。

下圖是對各機構的盈利分析,在關注不同機構的盈利佔比同時,又關注排名前10的優質機構盈利狀況。然後不斷嘗試根據數據分析結果來推出新的產品,統計利潤排名靠前的產品就是我行的明星產品,分析目的是保持明星產品的高效持續運營,及時下架盈利不佳的產品,及時止損,同時對分行盈利能力做排名對比分析。例如下面的表格是根據上面的分行排名數據聯動,是分行的明細經營數據。根據明細,可以基本定位是分行的什麼產品線出了問題。

2016年12月,科技部推出串串盈行銷雲平台,串串盈平台是面向行內外用戶的兼具趣味遊戲、行銷活動展示、賺豆任務發布、蘇銀豆商城等功能和板塊的新平台。不光基於數據分析推出了這個平台,還用數據分析來驅動平台的運營。我們對用戶行為、用戶操作時間分布和用戶獎勵發放做重點分析。用戶行為分析是指具體分析不同操作類型及操作種類的參與人數和頻數。通過人數和頻數,我們確定這個操作對應的活動的受歡迎程度,及時調整活動細節。用戶操作時間分析,主要是分析抽獎、種豆等用戶操作的時間集中分布區間。比如我們看活動轉發時間分布,主要是早上6點到8點。那麼這個數據就可以用來在推送其他活動信息時,借鑒參考。另外,用戶獎勵發放分析。我們以蘇銀豆的形式發放獎勵,通過監測分析蘇銀豆的發放情況,既把控活動熱度,又可以適度預測活動未來走勢。

行動端應用重點在於方便靈活,具體的數據分析內容和PC上是可以相同的,我們選的這個數據分析工具是支援PC、IPAD、PC、大屏自適應的,所以一般來說無需為行動端額外開發一些報表。不過也有例外情況。有些報表領導一般不再PC上看,只在手機上查看,所以這種情況可以單獨定製一下行動端的分析頁面。我們在行動端的分析應用主要是面向產品挖掘的。使用場景是,領導在碰頭會議中或者直接手機批註,下達指示。這種手機端的應用是比PC上更為靈活的。隨時隨地可以擺出數據做簡單會議。

原文網址:https://t17.techbang.com/topics/46781?page=1