[討論] 資料挖掘在金融風險預警中的應用

leohope

摘要: 金融風險預警是金融資料挖掘中的一個重要研究方向,由於金融資料具有類型多樣、關係複雜、資料動態性、資料量大等一般特徵,此外還有高噪音、非 正態等特徵。因此,金融風險預警更有挑戰性。運用資料挖掘技術能夠從海量 ...
金融風險預警是金融資料挖掘中的一個重要研究方向,由於金融資料具有類型多樣、關係複雜、資料動態性、資料量大等一般特徵,此外還有高噪音、非 正態等特徵。因此,金融風險預警更有挑戰性。運用資料挖掘技術能夠從海量的金融資料中發現隱藏在其背後的規律,有效地降低金融機構的運營風險。因此資料挖 掘在金融風險預警有著廣闊的應用價值和市場前景。

金融風險管理

金融風險指任何可能導致企業或機構財物損失的風險,是企業未來收益的不確定性與波動性。按照金融風險產生根源可將金融風險分為靜態與動態兩類;按風險涉及 範圍可分為微觀金融風險與宏觀金融風險;按照金融機構類別可分為銀行風險、證券風險、保險風險與信託風險等。通過對風險的衡量與認識,採取相應措施與處置方案使得風險最低和利潤最大化。可見,金融風險管理是調節金融投資安全性與收益性均衡的一種金融管理方法。

認識資料挖掘

1. 資料挖掘概念

資料挖掘是從大量資料中提取或「挖掘」知識。在大量的資料中發現有趣的模式,其中資料是可以存放在資料庫、資料倉庫或其他信息庫中。資料挖掘是一個年輕的 跨學科領域,源於諸如資料庫系統、資料倉庫、統計學、機器學習、資料可視化、信息檢索和高性能計算。其他的貢獻領域包括神經網路、模式識別、空間資料分析、圖像資料庫、信號處理和許多應用領域,如商務、經濟學和生物信息學。

2.資料挖掘流程

(1)信息收集:根據確定的資料分析對象,抽象出在資料分析中所需要的特徵信息,然後選擇合適的信息收集方法,將收集到的信息存入資料庫。對於海量資料,選擇一個合適的資料存儲和管理的資料倉庫是至關重要的。

(2)資料集成:把不同來源、格式、特點性質的資料在邏輯上或物理上有機地集中,從而為企業提供全面的資料共享。

(3)資料規約:如果執行多數的資料挖掘演算法,即使是在少量資料上也需要很長的時間,而做商業運營資料挖掘時資料量往往非常大。資料規約技術可 以用來得到資料集的規約表示,它小得多,但仍然接近於保持原資料的完整性,並且規約後執行資料挖掘結果與規約前執行結果相同或幾乎相同。

(4)資料清理:在資料庫中的資料有一些是不完整的(有些感興趣的屬性缺少屬性值)、含雜訊的(包含錯誤的屬性值),並且是不一致的(同樣的信息不同的表示方式),因此需要進行資料清理,將完整、正確、一致的資料信息存入資料倉庫中。不然,挖掘的結果會差強人意。

(5)資料變換:通過平滑聚集、資料概化、規範化等方式將資料轉換成適用於資料挖掘的形式。對於有些實數型資料,通過概念分層和資料的離散化來轉換資料也是重要的一步。

(6)資料挖掘過程:根據資料倉庫中的資料信息,選擇合適的分析工具,應用統計方法、事例推理、決策樹、規則推理、模糊集,甚至神經網路、遺傳演算法的方法處理信息,得出有用的分析信息。

(7)模式評估:從商業角度,由行業專家來驗證資料挖掘結果的正確性。

(8)知識表示:將資料挖掘所得到的分析信息以可視化的方式呈現給用戶,或作為新的知識存放在知識庫中,供其他應用程序使用。

資料挖掘分析方法
表2.1 資料挖掘常用分析方法

資料挖掘在金融風險預警中的應用

金融資料挖掘流程

資料挖掘在金融風險預警中典型應用

(1)信用風險評估
資料挖掘對信用風險的評估包括銀行信用卡風險評估和貸款信用評估等。信用風險是由於不可抗拒因素和惡性欺詐等使得債務人無法或不願意履行已簽的合約而給銀 行造成的損失。銀行對個人和企業的財務狀況發生變化的過程往往不能及時了解或者說被循環信用掩蓋。而通過資料挖掘技術對客戶信用的影響因素進行挖掘,如地 區差異、個人知識層次、收入高低、經濟環境狀況、社會職務等,可以快速建立起用戶信用等級,進而給予不同的信用額度;也可以透徹地揭示信用風險的蘊含關係和特徵,增強對信用違約預測的準確性。

(2)公司財務危機預警分析
財務危機的實質是財務風險規模化、高強度化的集中爆發,主要表現為財務狀況極度惡化,發生支付危機甚至破產倒閉。這些公司都不同程度出現以下狀況: 無力償還到期債務、巨額投資無收益、現金流量入不敷出、產品銷路不暢、存貨大量積壓,主營業務發生嚴重萎縮等。

財務危機預警模型的建立能夠對企業經營失敗和財務管理失誤現象進行預警和早期控制,為決策者、投資者和債權人提供重要信息。資料挖掘中的主成分分析、 Logistic回歸、線性回歸和神經網路等方法被國內外學者用來建立財務危機預警模型。首先根據主成分分析的特徵向量與主成分貢獻率計算出對於財務狀況影響最大的財務指標,接著根據該分析的結果,把預測期公司的財務狀況分為兩類作為預測的目標變數,然後運用Logistic回歸方法和決策樹方法等進行公司財務狀況進行預測。最後把每家公司綜合評分作為目標變數,運用線性回歸方法和神經網路方法進行公司財務危機預警分析。

(3)供應鏈風險評估
良好的供應鏈管理可通過資金流、物流和信息流的優化為企業帶來巨大效益,可以使企業有效節約運營成本和縮短反應時間,進而使其服務水平和競爭能力得到提高。供應鏈中任何一個環節的「斷裂」都可能引起鏈上企業的連鎖反應,給企業帶來巨大損失。根據行為主體的不同,供應鏈風險可劃分為供應商風險、生產商風險、物流服務商風險、批發商風險、零售商風險等。

供應商風險作為供應鏈風險的最大起因,常被選為供應鏈風險評估的切入點。通常做法有利用資料挖掘演算法確定有效的指標評價體系,建立模糊矩陣,進行聚類分析或BP神經網路等方法建立供應鏈金融風險評估模型,為供應鏈合作夥伴的選擇提供依據,降低供應鏈風險。

結語
資料挖掘作為深層次的資料分析方法,具有傳統評價方法無法具備的對於各種因素之間隱藏的內在聯繫的全面分析。此技術應用於金融風險管理無疑非常有益,可提供風險預警,讓管理者提前做好準備,為決策提供參考信息,因而使企業極大地降低風險和提高競爭力,為企業的長足發展作出貢獻。

4500+企業選擇FineReport報表與 BI 商業智慧工具【免費下載】
opensource開發,類excel設計,全方位異質資料庫整合,資料填報、Flash列印、權限控制、行动應用、客制化、交互分析、報表協同作業管理系統。
分享自:《產業與科技論壇》

原文網址:https://t17.techbang.com/topics/37423-application-of-data-mining-in-financial-risk-early-warning?page=1