中芸汇科技
ФинансыИИЛокальное развертываниеАвтоматизацияКитай

Частное развертывание большой модели и применение в управлении рисками в акционерном банке

Частное развертывание большой модели и применение в управлении рисками в акционерном банке

Предыстория проекта

Один акционерный банк сталкивается с серьезными вызовами в области кредитного рассмотрения и комплаенс-проверок. Традиционный процесс кредитного рассмотрения зависит от ручной проверки данных заемщика, кредитных отчетов и финансовой информации; на одну заявку уходит 3 дня, а уровень пропуска рисков достигает 3%. Одновременно с этим объем нормативных и комплаенс-документов огромен и часто обновляется, что делает сложным для команды комплаенс эффективный анализ документов и выявление рисков. Банк предъявляет строгие требования к безопасности данных: все бизнес-данные запрещено передавать за пределы внутренней сети, вывод ИИ-моделей должен выполняться локально.

Основные проблемы

  • Низкая эффективность кредитного рассмотрения: На одну заявку уходит 3 дня, что серьезно сказывается на клиентском опыте и масштабах бизнеса
  • Высокий уровень пропуска рисков: При ручной проверке уровень пропуска составляет 3%, что несет значительный риск безнадежной задолженности
  • Большой объем работы по комплаенс-анализу: Тысячи комплаенс-документов требуют ручного анализа, что отнимает много времени и ресурсов
  • Нулевая толерантность к утечке данных: Регуляторы требуют, чтобы все данные не покидали внутреннюю сеть банка
  • Решение

    Локальное развертывание большой модели

    Большая модель Qwen2.5-72B развернута на локальном GPU-кластере банка (8×A100) с использованием фреймворка инференса vLLM для оптимизации пропускной способности. Весь инференс и передача данных происходят во внутренней сети банка, обеспечивая нулевую утечку данных и полностью соответствуя требованиям Комиссии по регулированию банковской и страховой деятельности Китая (CBIRC) по безопасности данных.

    Интеллектуальная проверка кредитных рисков

    На основе большой модели создан помощник по проверке кредитных рисков, который автоматически анализирует данные заемщика, кредитные отчеты и финансовую отчетность, перекрестно проверяет согласованность информации, выявляет потенциальные риски и генерирует отчет о проверке. Время рассмотрения сократилось с 3 дней до 4 часов, уровень пропуска рисков снизился с 3% до 0,5%.

    Интеллектуальный анализ комплаенс-документов

    Разработана система интеллектуального анализа комплаенс-документов, которая поддерживает автоматическую интерпретацию нормативных документов, проверку соответствия внутренним политикам, оценку влияния изменений в регулировании и другие функции, освобождая команду комплаенс от рутинной работы по чтению и анализу документов.

    Данные об эффективности

    ПоказательДо внедренияПосле внедренияУлучшение
    Время рассмотрения кредита3 дня4 часа83%
    Уровень пропуска рисков3%0,5%83%
    Время анализа комплаенс-документов2 дня/документ2 часа/документ88%
    Риск утечки данныхЗависимость от третьих лицНулевой100%

    Технологический стек

    Qwen2.5-72B, фреймворк инференса vLLM, кластер GPU NVIDIA A100, LangChain, Python, Kubernetes, изолированное развертывание во внутренней сети банка

    Частное развертывание позволяет нам пользоваться преимуществами ИИ и при этом полностью соответствовать регуляторным требованиям. Эффективность рассмотрения выросла на 83%, результаты превзошли ожидания.