プロジェクト背景
某株式制銀行は、与信審査およびコンプライアンス審査の分野で大きな課題に直面していました。従来の与信審査は、借り手の資料、信用報告書、財務データの手動確認に依存しており、1件あたり3日を要し、リスク見逃し率は3%でした。また、規制関連のコンプライアンス文書は膨大で頻繁に更新されるため、コンプライアンスチームは効率的に文書分析とリスク特定を行うことが困難でした。同行はデータセキュリティに厳格な要件を課しており、すべての業務データは外部送信を禁止し、AI推論は必ずローカル環境で行う必要がありました。
主な課題
ソリューション
オンプレミス大規模モデル展開
銀行ローカルのGPUクラスター(8×A100)にQwen2.5-72B大規模言語モデルを展開し、vLLM推論フレームワークを使用してスループットを最適化。すべてのモデル推論とデータフローは銀行内部ネットワークで完結し、データ漏洩ゼロを実現。中国銀行保険監督管理委員会(CBIRC)のデータセキュリティ規制を完全に満たします。
与信リスク管理のためのインテリジェント審査
大規模言語モデルに基づいて与信リスク管理審査アシスタントを構築し、借り手の資料、信用報告書、財務諸表を自動解析し、情報の一貫性をクロスバリデーションし、潜在的リスクを特定して審査レポートを生成します。審査時間は3日から4時間に短縮され、リスク見逃し率は3%から0.5%に低下しました。
コンプライアンス文書のインテリジェント分析
コンプライアンス文書のインテリジェント分析システムを開発し、規制文書の自動解釈、内部制度のコンプライアンスチェック、政策変更の影響評価などの機能を提供。コンプライアンスチームを反復的な読解・分析作業から解放します。
効果データ
| 指標 | 導入前 | 導入後 | 改善率 |
|---|---|---|---|
| 与信審査時間 | 3日間 | 4時間 | 83% |
| リスク見逃し率 | 3% | 0.5% | 83% |
| コンプライアンス文書分析時間 | 2日/件 | 2時間/件 | 88% |
| データ漏洩リスク | 第三者依存あり | 漏洩ゼロ | 100% |
技術スタック
Qwen2.5-72B、vLLM推論フレームワーク、NVIDIA A100 GPUクラスター、LangChain、Python、Kubernetes、銀行内ネットワーク隔離環境への展開