中小企業融資評分,是把企業的財務報表、銀行往來、稅務與經營行為等資料,透過統計與機器學習模型,轉換成一個信用分數與對應的違約機率(PD)。它讓授信決策從仰賴承辦人員的個人經驗,轉向有一致標準、可被稽核、也能規模化的量化判斷。對放款方而言,這代表更快的審件速度與更穩定的資產品質;對借款的中小企業而言,則代表更透明、更有依據的核貸結果。
什麼是中小企業融資評分
中小企業是台灣經濟的主體,卻也是授信時資訊最不對稱的一群。許多中小企業財報揭露有限、規模波動大,放款方難以單憑一兩張報表判斷還款能力。傳統做法高度依賴分行經理的經驗與往來關係,結果就是審件速度慢、標準因人而異,事後也難以檢討究竟是哪個環節誤判。
融資評分把「這家企業會不會如期還款」這個問題,拆解成一組可以量化的風險因子,再用模型綜合計算出分數。分數背後對應的是一個具體的違約機率,讓額度試算、利率定價與覆審頻率都能有客觀依據。國內企業與個人的信用資料,多數彙整於 財團法人金融聯合徵信中心(JCIC);金融機構在設計評分與授信政策時,也需遵循 金融監督管理委員會 的相關規範。
導入評分制度的第一個好處是一致性。同樣條件的兩家企業,無論由哪位人員經手,得到的分數應該相近。第二個好處是可追溯,每一筆核准或婉拒,都能回溯到當初的分數與關鍵變數,方便事後檢討與法遵稽核。第三個好處是規模化,評分模型可以在數秒內處理大量件數,把人力留給真正需要人工判斷的灰色地帶案件。
評分卡與違約機率 PD 的關係
很多人會把「信用評分」與「違約機率」混為一談,兩者其實是一體兩面。違約機率(Probability of Default,簡稱 PD)指的是企業在未來一段期間,通常是十二個月內,無法如期履行債務的機率,數值介於 0 到 1 之間。評分卡則把這個機率,換算成比較好溝通的分數區間,例如 300 到 850 分,分數越高代表違約機率越低。
PD 之所以重要,是因為它是後續所有計算的基礎。授信定價、預期損失提列、資本計提,都直接用到 PD。依照 巴塞爾銀行監理委員會(BIS) 的內部評等法架構,銀行衡量信用風險時會用到三個核心參數:違約機率(PD)、違約損失率(LGD)與違約曝險額(EAD),三者相乘即為預期損失。評分模型的任務,就是把 PD 估得既準確又穩定。
準確,指的是模型預測的違約機率,要貼近實際發生的違約率。穩定,指的是同一群企業在景氣沒有劇烈變化時,分數不應該大幅跳動。這兩個目標有時會互相拉扯,後面談驗證與校準時會再說明如何取得平衡。
評分模型用哪些資料與變數
評分模型的品質,一半以上取決於資料。一個成熟的中小企業評分模型,通常會整合以下幾類資料來源:
- 財務報表資料:資產負債表、損益表與現金流量表衍生的財務比率,例如負債比、流動比、利息保障倍數、營業利益率與現金流量穩定度。這類變數能反映企業的償債能力與獲利結構。
- 銀行往來行為:存款波動、票據往來、過去的逾期紀錄與動用額度的習慣。行為資料往往比靜態財報更早反映企業的資金壓力。
- 稅務與營業資料:營業稅申報、開立發票金額與趨勢,可交叉驗證企業實際營運規模,降低財報美化的影響。
- 基本與產業資料:成立年數、產業別、員工數與所在區域。同樣的財務比率,在不同產業代表的風險並不相同,因此產業別是重要的調整因子。
- 替代資料:對於財報不完整的微型企業,可改用交易流水、供應鏈往來、甚至負責人的個人信用,建立替代評分模型,補足傳統財報的缺口。
值得提醒的是,再多的資料來源,如果品質不佳也無法支撐好的模型。缺漏值、格式不一致、單位混亂都會嚴重干擾結果,這也是為什麼資料治理會是建模的前置工程。關於如何把分散雜亂的原始資料整理成可分析的地基,可以延伸閱讀我們的大數據資料清理與資料倉儲一文。
建模六步驟:從資料到上線
一套可以實際上線的評分系統,從資料到部署大致會走過六個階段:
- 一、定義違約與觀察期:先明確界定什麼叫違約,例如逾期超過九十天,並設定觀察期與表現期。定義模糊,後面整套模型都會失準。
- 二、資料整備:蒐集、清理、串接各來源資料,處理缺漏與異常值,確保每一筆樣本的標籤正確。
- 三、特徵工程:把原始欄位轉換成具有預測力的風險因子。實務上常用證據權重(WOE)轉換,讓變數與違約之間的關係單調且可解釋。
- 四、模型訓練:選擇邏輯斯迴歸或機器學習方法估算 PD,並切分訓練集與驗證集避免過度配適。
- 五、驗證與校準:以 AUC 與 KS 值衡量模型的區辨力,再用校準曲線確認預測機率貼近實際違約率。AUC 越接近 1、KS 值越高,代表好壞客戶被分得越開。
- 六、部署與監控:把模型嵌入核貸流程,並建立定期監控機制,追蹤族群穩定度指標(PSI),一旦資料分布漂移就提早預警。
區辨力與校準是兩個不同的概念,常被混淆。區辨力問的是模型能不能把違約與非違約客戶分開;校準問的是模型給出的 70% 違約機率,實際是不是真的接近七成違約。一個區辨力好但校準差的模型,排序沒問題,但用來定價就會出錯。
評分卡與機器學習怎麼選
評分卡多以邏輯斯迴歸為核心,優點是高度可解釋。每一個變數對分數的貢獻都看得到,婉拒客戶時也能明確說明原因,符合法遵與消費者溝通的需求。缺點是對於變數之間複雜的交互作用,捕捉能力有限。
梯度提升樹等機器學習模型,則能自動學習非線性與交互效果,在資料量足夠時通常有更高的區辨力。代價是黑箱程度較高,需要額外搭配 SHAP 等可解釋工具,才能說明每筆預測的依據。
實務上的選擇,取決於用途與監理要求。對外的核貸決策,因為要能向客戶與主管機關交代,許多機構仍以評分卡為主,機器學習作為輔助與交叉驗證;對內的早期預警、催收優先順序排序這類不直接對客戶的場景,則可以更大膽採用機器學習。把機器學習導入既有系統的完整流程,可參考企業導入 AI 量化模組的完整流程。
從分數到利率:風險定價
評分的價值不只在於決定核准或婉拒,更在於決定價格。風險定價的核心觀念是,違約機率越高的客戶,理應承擔越高的利率,以反映放款方承受的風險。把這個觀念制度化,常用的工具是風險調整後資本報酬率(RAROC)。
簡單來說,一筆放款的合理利率,要能覆蓋三件事:資金成本、預期損失,以及股東要求的資本報酬。當評分模型把 PD 估準了,預期損失就能算得準,定價也才公平。這種做法的好處是讓信用良好的企業享有較低利率,同時讓高風險案件付出對應的成本,整體資產組合的風險與報酬達到平衡。
導入時常見的三個誤區
第一個誤區是只追求 AUC 數字。模型在歷史資料上表現亮眼,上線後卻一路下滑,往往是因為用了未來才會知道的資訊,或樣本期間剛好避開景氣循環。驗證時務必保留一段時間外樣本(out-of-time)測試。
第二個誤區是建好模型就不管了。市場、產業與客群會隨時間漂移,模型的區辨力會自然衰退。健全的做法是建立監控儀表板,定期檢視 PSI 與實際違約率,並排定重新校準與重訓的時程。
第三個誤區是忽略可解釋性。當客戶或主管機關詢問為什麼被婉拒,如果系統答不出來,再準的模型也難以落地。把可解釋性納入設計,而非事後補救,才是穩健的選擇。
常見問題 FAQ
中小企業融資評分需要哪些資料?
主要包含財務報表、銀行往來明細、稅務與營業資料、產業別與成立年數,以及負責人信用等。資料越完整、品質越好,模型的區辨力越高;財報不完整的微型企業,也可改用交易流水等替代資料建模。
違約機率(PD)是什麼?
PD 指企業在未來一段期間(通常為十二個月)無法如期償債的機率,數值介於 0 到 1。它是巴塞爾資本規範與授信定價的核心參數,評分卡則把 PD 換算成比較好溝通的分數區間。
AUC 與 KS 值代表什麼?
兩者都是衡量模型區辨力的指標。AUC 越接近 1,代表模型把違約與非違約客戶分得越開;KS 值衡量好壞客戶累積分布的最大差距,數值越高越好。但區辨力好不等於校準準,定價前還需確認預測機率貼近實際違約率。
評分模型多久要更新一次?
建議至少每年重新校準一次,並透過族群穩定度指標(PSI)持續監控。當景氣循環、產業結構或客群明顯變化時,就應提前重訓,避免模型區辨力衰退。
沒有完整財報的微型企業也能評分嗎?
可以。透過交易流水、供應鏈往來、發票金額趨勢與負責人個人信用等替代資料,能建立替代評分模型,補足傳統財報的缺口,讓更多微型企業有機會取得合理的授信評估。
導入評分系統一定要用機器學習嗎?
不一定。對外核貸因需要向客戶與主管機關說明理由,許多機構仍以可解釋的評分卡為主,機器學習作為輔助;對內的早期預警與催收排序,則可較大膽採用機器學習以提升準確度。