期刊VIP學術指導 符合學術規范和道德
保障品質 保證專業,沒有后顧之憂
摘 要:隨著全球經濟的快速發展以及資本市場的壟斷,無論是企業的發展還是人們超前消費觀念的提前到來,貸款已成為企業和個人解決經濟問題的一種重要手段。對于銀行業或者小貸機構而言,信用卡以及信貸服務是高風險和高收益的業務,如何通過用戶的海量數據挖掘出用戶潛在的信息即信用評分,并參與審批業務的決策從而提高了風險防控措施,該過程不僅提高了業務的審批效率而且給予了關鍵的決策,同時風險防控如果沒有監測到位,對于銀行業來說會造成不可估量的損失,因此這部分的工作是至關重要的。通過某銀行脫敏的信用卡客戶數據,通過建立現階段比較熱門的機器學習Logistic模型來研究客戶信用的關鍵指標對模型的作用,從而對信用卡用戶的違約情況進行提前預測分析。個人貸款違約預測模型的建立以及后期的關鍵指標的探索,在銀行業或者小貸機構的貸前審批以及貸中的管理決策中都有很好的指導作用,并且具有很強的實踐性和意義。
關鍵詞:python;Logistic模型;違約
1 引言
本文建立個人貸款違約預測模型的目的是利用銀行脫敏的數據進行描述性統計分析,來提前預測客戶在貸款期間的違約概率,從而幫助銀行的業務人員明確客戶的更多有意義的指標變量,及早發現貸款的潛在損失。本章主要對項目的背景與選題來源,國內外發展狀況,以及研究意義和目的,相關研究成果進行大致說明,并討論了創新點。
1.1 項目背景與選題來源
目前,在經濟快速發展的時代,貸款的風險審批是商業銀行面臨的首要問題。貸款中風險的產生,不僅在貸款審查階段出現,而且貫穿整個貸款流程中:在實際貸款審批流程中,大多數的審貸過程并非十分嚴謹和周全,因此不良貸款的概率會日漸飆升,在這樣的背景下,建立一個科學有效、有解釋力度的模型對貸款客戶的信用進行評估與判定,從而將違約的風險降到最低并將利潤最大化是刻不容緩的事情。對信用風險的識別與防控是商業銀行風險管理研究的重要內容,是金融機構不可回避的核心問題,也是各國政府與金融機構風險管理的焦點。因此,為了更好解決風險管理中的問題,本文涉及的數據包含銀行客戶的交易數據,而且涉及大部分貸款信息與眾多信用卡的數據,通過分析這些數據可以獲取與銀行服務相關的業務知識,例如,提供增值服務的銀行客戶經理,希望明確客戶有更多的業務需求,而風險管理的業務人員可以及早發現貸款的潛在損失。
1.2 國內外發展現狀
21世紀大數據信息和互聯網金融得到了前所未有的巨大發展,個人消費經濟市場空間也得到了拓展,與此同時,人們提前消費經濟觀念的轉變導致全球個人信貸規模急劇擴大,我國的一些大城市居民債務比率已經達到甚至超過美國等發達國家的平均水平,為有效應對這一趨勢的發展,我國已經采取措施對商業銀行加強信用風險管理,并改進管理技術。截至2006年底我國已經全面實現了金融業對外開放,面對全球的激烈競爭,我國若想要保住全球的經濟地位并使之發揚壯大,需要自身依靠內部評級體系的建設和發展。然而近幾年,我國涌現出了很多研究數據科學的高端人才,對于模型的建立和探索已經在國內外取得了不小的成就,在未來的數據科學以及商業應用中,預測模型也會應用到我們生活中的方方面面,并且會得到空前的發展和巨大的進步。
1.3 本論文的創新點
相較于傳統模型而言,本文采用了機器學習中的邏輯回歸模型(logistic regression),該模型是基于現階段國內外發展狀況和項目背景以及相關業務場景的探索研究,該模型屬于概率型非線性回歸模型,它是研究二分類觀察結果(被解釋變量)與一些影響因素(解釋變量)之間關系的一種多變量分析方法。如果用線性回歸分析,由于應變量Y是一個二值變量(通常取值1或0),不滿足應用條件,尤其當各因素都處于低水平或高水平時,預測值Y值可能超出0~1范圍,出現不合理都現象。用logistic回歸分析則可以較好的解決上述問題。
2 相關技術介紹
數據科學是一個發現和解釋數據中的模式,并用于解決問題的過程。
2.1 數據科學過程
數據科學中的過程,主要分為以下幾個步驟:相關數據和主題結合生成信息,信息通過規則的加工生成知識,知識通過業務經驗的豐富生成相關管理人員的決策和行動,這些步驟在業務場景中的流程如圖1所示。
2.2 模型的實際應用過程
分析建模人員通過分析數據建立模型,在該過程中主要是找出隱藏在數據背后的模式,這些模式能把數據轉化為知識,而這些已發現的知識就是我們所謂的模型,業務人員把模型用在實際數據上,從而預測未來的行為,在這個過程中主要是部署,即應用已發現的知識達成實用的目的。
2.3 數據科學實施路線圖
在數據科學中,數據挖掘的實施路線圖貫穿整個數據建過程中,如圖2所示為數據科學實施路線圖。
3 個人貸款違約預測模型的創新點介紹
個人貸款違約預測模型的建立包括:業務理解、數據獲取、數據清洗與處理、數據建模等過程,每個過程的創新點在后面會展開討論。
3.1 業務理解
業務理解是數據建模中關鍵的環節,若業務理解不到位則直接關系到業務目標的偏離,從而導致最后的模型預測不準確,不僅浪費較長的時間人力成本,而且會對公司的經營狀況造成巨大的損失,因此好的業務理解對數據建模起到關鍵性的作用。
本文涉及的數據業務是在銀行場景下進行個人客戶業務分析和數據挖掘進行的,筆者希望明確哪些客戶有更多的業務需求,而風險管理的業務人員可以及早發現貸款的潛在損失,那么根據客戶的貸款屬性、交易信息、狀態信息怎樣預測客戶的貸款違約行為呢?這是本文需要重點探索的問題。
推薦閱讀:《新疆財經大學學報》(季刊)2001年創刊。本刊為綜合性學術期刊,堅持社會主義辦刊方向,堅持質量及時的原則,立足新疆,面向全國,以“求實、創新、科學、民主”為辦刊方針。