DOIT 發(fā)表于:14年07月17日 11:30 [綜述] DOIT.com.cn
大數(shù)據(jù)時代的到來,已經(jīng)引起了世界各國政府的高度重視。2012年3月,美國政府發(fā)布《大數(shù)據(jù)研究發(fā)展行動計劃》,強調(diào)要提高從海量數(shù)據(jù)中提取知識和見解的能力,幫助加速科技研究的進展,加強國家安全和相關(guān)教育。具有異曲同工之妙的是:2012年4月,中國政府推出的《軟件和信息技術(shù)服務業(yè)“十二五”發(fā)展規(guī)劃》中也提出,面向日益增長的數(shù)據(jù)處理需求,積極發(fā)展數(shù)據(jù)編輯、整理、分析、挖掘等數(shù)據(jù)加工處理服務。
大數(shù)據(jù)對每個行業(yè)都會產(chǎn)生影響,而金融業(yè)無疑是受此影響最大的行業(yè)之一。這是因為首先,金融業(yè)本身就是一個信息密集型的服務產(chǎn)業(yè),隨著互聯(lián)網(wǎng)的應用普及和種類繁多的網(wǎng)絡金融產(chǎn)品的推出,金融信息化程度迅速深化。其次,現(xiàn)代金融企業(yè)普遍大量投資信息化基礎設施,建立了龐大的數(shù)據(jù)庫系統(tǒng),一直擁有著質(zhì)量較高的數(shù)據(jù)資源。再次,其實也是最重要的是:銀行利率市場化進程的加快,壽險費率徹底市場化政策的逐步落實,以支付寶的“余額寶”、微信的“財付通”為代表的新型金融產(chǎn)品對傳統(tǒng)金融業(yè)構(gòu)成一浪高過一浪的沖擊波等行業(yè)大環(huán)境因素的影響,使中國金融業(yè)的行業(yè)競爭日趨激烈,催化了企業(yè)進行產(chǎn)品和服務創(chuàng)新的迫切需求。
不難發(fā)現(xiàn),大數(shù)據(jù)在金融業(yè)發(fā)展的進程中扮演著更為積極的角色。諸如客戶行為特征分析、精準營銷、客戶滿意度模型、風險管控、需求預測、精益化流程、六西格瑪質(zhì)量水平、卓越運營、數(shù)據(jù)驅(qū)動的決策之類的名詞越來越多地出現(xiàn)在各級工作報告和會議交流上,而探索性數(shù)據(jù)分析、決策樹、回歸、聚類分析、神經(jīng)網(wǎng)絡、關(guān)聯(lián)規(guī)則、數(shù)據(jù)挖掘、時間序列分析等分析術(shù)語也越來越頻繁地被行業(yè)內(nèi)各類人士提及。
但不幸的是,“如何讓這些先進而又時髦的管理理念和技術(shù)落地,實實在在地讓從業(yè)人員體驗到大數(shù)據(jù)的價值”卻不是那么容易的事,常常可以在企業(yè)內(nèi)部可以聽到這樣的抱怨:公司花重金搭建了數(shù)據(jù)倉庫,高薪聘請了海歸的分析專家,但數(shù)據(jù)分析團隊對業(yè)務部門提出的分析需求響應速度很慢,好不容易出來個模型,業(yè)務人員卻看都看不懂,更談不上應用了。這一切不由地讓人感嘆:金融業(yè)大數(shù)據(jù),聽上去很美,做起來……
其實,大數(shù)據(jù)在為金融業(yè)帶來新機遇的同時也帶來了新挑戰(zhàn),先不說數(shù)據(jù)來源的復雜化、安全性等基礎架構(gòu)問題,在最終應用階段的數(shù)據(jù)分析“傻瓜化”(即易學易用性)也比以往顯得更為重要。這是因為在大數(shù)據(jù)時代,數(shù)據(jù)分析已經(jīng)不再僅僅是少數(shù)統(tǒng)計學家手中的專利了,數(shù)據(jù)化運營需要全體員工的參與。企業(yè)中的數(shù)據(jù)分析與挖掘項目也呈現(xiàn)出多元性,有的項目需要分析部門和業(yè)務部門的共同配合與協(xié)作,花費較長時間精雕細刻地完成,有的項目則要求業(yè)務部門能夠在較短時間內(nèi)獨立完成,快速響應客戶要求和市場變化。
從不少領先一步的國內(nèi)外知名金融企業(yè)的應對之道中可以發(fā)現(xiàn):數(shù)據(jù)可視化Data Visualization和交互式分析Interactive Analysis是將大數(shù)據(jù)從“精英化”轉(zhuǎn)變成“平民化”的兩種最重要的信息技術(shù)。JMP(全球最大的統(tǒng)計學軟件公司SAS的產(chǎn)品)是在強調(diào)數(shù)據(jù)挖掘權(quán)威性基礎上能夠發(fā)揮交互式可視化分析的大數(shù)據(jù)分析平臺,下面我們就借助這個軟件工具,用一個案例來簡要說明金融業(yè)大數(shù)據(jù)分析應該如何落地。
某保險公司的汽車保險部門為了降低理賠風險和理賠成本,提高盈利能力,想利用現(xiàn)有的數(shù)據(jù)資源(包含客戶購買及理賠記錄的龐大數(shù)據(jù)庫)進行一些深入的客戶特性分析,以此得到一些改進思路,制定一些“快贏”方案。然而面臨的困難有:
1 公司的IT部門正在從事一些重大IT項目,無暇顧及該業(yè)務部門的分析需求;
2 本部門內(nèi)部的業(yè)務人員大多是文科背景出身,沒有一個是計算機、數(shù)學或統(tǒng)計背景出身的,數(shù)據(jù)分析基礎非常薄弱。
但是,也有一些有利的因素,如:
1 這些業(yè)務人員的從業(yè)經(jīng)驗都很豐富,能夠在數(shù)據(jù)分析之前在數(shù)據(jù)庫中大膽且比較準確地選擇一些潛在因素;
2 公司已為各個業(yè)務部門配置了交互式可視化分析的大數(shù)據(jù)分析平臺JMP,使非統(tǒng)計人士也可以快速地從“工具學習”階段進入到“業(yè)務分析”階段。
因此,該部門領導決定揚長避短,結(jié)合行業(yè)經(jīng)驗,運用先進分析工具開展一次“Analyze DIY(自助式分析)”。分析的過程比想象的要輕松很多,在幾次鼠標點擊之后,一個以交互式圖形展現(xiàn)出來的汽車保險用戶風險模型就在業(yè)務人員邊討論邊分析的過程中誕生了。從數(shù)據(jù)挖掘的專業(yè)角度講,這個分析用到了“決策樹”的高級分析技術(shù)。雖然,當時沒有人懂決策樹的理論和計算公式,但這絲毫不影響分析業(yè)務人員的分析效率,或者說業(yè)務人員的分析效率反而比以往得到了大幅提升。
因為在下面這個圖形化的模型中,我們可以看到以往復雜冗長的統(tǒng)計分析報告無法直觀揭示的結(jié)論:在眾多候選因素中,年齡等級(Age Class)、城市居民與否(City(Y/N))、信用等級(Rating Class)是影響理賠風險最大的三個關(guān)鍵因素。進一步來看,年長、非城市居民、信用等級為A和B的細分人群絕對是汽車保險營銷的最佳目標群體!因為他們將來的理賠概率只有3%~4%,遠遠低于近20% 的整體市場平均水平。
用JMP軟件交互式可視化技術(shù)生成的汽車保險用戶風險模型
分析到這里,會議室里的氣氛立刻活躍了起來。因為所有成員通過圖形化的決策樹模型中都一致地找到了合理客戶分群的線索,而且這個線索與他們的實際工作經(jīng)驗也非常吻合,解決問題的方案也就隨之產(chǎn)生了。再經(jīng)過一段時間的具體實施和后續(xù)跟蹤,事實證明了該解決方案確實是有效的。
所以說,金融業(yè)大數(shù)據(jù)不僅僅“聽上去很美”,它完全可以落地實現(xiàn),關(guān)鍵還要看你是采用什么方法來處理大數(shù)據(jù)。“業(yè)務人員只提分析需求,分析人員只管搭建模型”的傳統(tǒng)工作模式已經(jīng)越來越無法適應當前的工作節(jié)奏,“既能夠提供業(yè)務參考意見,又能夠勝任常見數(shù)據(jù)分析工作”的復合型人才將會越來越受到金融企業(yè)的青睞。