Предыстория проекта
Один акционерный банк сталкивается с серьезными вызовами в области кредитного рассмотрения и комплаенс-проверок. Традиционный процесс кредитного рассмотрения зависит от ручной проверки данных заемщика, кредитных отчетов и финансовой информации; на одну заявку уходит 3 дня, а уровень пропуска рисков достигает 3%. Одновременно с этим объем нормативных и комплаенс-документов огромен и часто обновляется, что делает сложным для команды комплаенс эффективный анализ документов и выявление рисков. Банк предъявляет строгие требования к безопасности данных: все бизнес-данные запрещено передавать за пределы внутренней сети, вывод ИИ-моделей должен выполняться локально.
Основные проблемы
Решение
Локальное развертывание большой модели
Большая модель Qwen2.5-72B развернута на локальном GPU-кластере банка (8×A100) с использованием фреймворка инференса vLLM для оптимизации пропускной способности. Весь инференс и передача данных происходят во внутренней сети банка, обеспечивая нулевую утечку данных и полностью соответствуя требованиям Комиссии по регулированию банковской и страховой деятельности Китая (CBIRC) по безопасности данных.
Интеллектуальная проверка кредитных рисков
На основе большой модели создан помощник по проверке кредитных рисков, который автоматически анализирует данные заемщика, кредитные отчеты и финансовую отчетность, перекрестно проверяет согласованность информации, выявляет потенциальные риски и генерирует отчет о проверке. Время рассмотрения сократилось с 3 дней до 4 часов, уровень пропуска рисков снизился с 3% до 0,5%.
Интеллектуальный анализ комплаенс-документов
Разработана система интеллектуального анализа комплаенс-документов, которая поддерживает автоматическую интерпретацию нормативных документов, проверку соответствия внутренним политикам, оценку влияния изменений в регулировании и другие функции, освобождая команду комплаенс от рутинной работы по чтению и анализу документов.
Данные об эффективности
| Показатель | До внедрения | После внедрения | Улучшение |
|---|---|---|---|
| Время рассмотрения кредита | 3 дня | 4 часа | 83% |
| Уровень пропуска рисков | 3% | 0,5% | 83% |
| Время анализа комплаенс-документов | 2 дня/документ | 2 часа/документ | 88% |
| Риск утечки данных | Зависимость от третьих лиц | Нулевой | 100% |
Технологический стек
Qwen2.5-72B, фреймворк инференса vLLM, кластер GPU NVIDIA A100, LangChain, Python, Kubernetes, изолированное развертывание во внутренней сети банка