Large Language Models (LLMs) vs. Small Language Models (SLMs) для финансовых учреждений: практическое руководство по ИИ 2025 года
В 2025 году финансовые учреждения столкнутся с необходимостью интеграции ИИ-технологий для повышения операционной эффективности и улучшения обслуживания клиентов. В этом контексте важно понимать различия между большими языковыми моделями (LLMs) и малыми языковыми моделями (SLMs) и их применение в финансовом секторе.
1. Регуляторные и рисковые аспекты
Финансовые услуги подлежат строгим стандартам управления моделями. В США действуют правила, касающиеся всех моделей, используемых для бизнес-решений, включая LLMs и SLMs. Это означает необходимость валидации, мониторинга и документирования, независимо от размера модели. В Европе действует Закон о ИИ, который требует соблюдения строгих стандартов для высокорисковых систем, таких как кредитный рейтинг.
Ключевой момент: высокорисковые применения требуют жесткого контроля, независимо от параметров модели. Оба типа моделей требуют прослеживаемой валидации и соблюдения норм безопасности данных.
2. Возможности против затрат, задержки и объема
SLMs (3–15 миллиардов параметров) обеспечивают высокую точность для специализированных задач, особенно после дообучения. Новые SLMs, такие как Phi-3 и FinBERT, отлично справляются с извлечением данных и классификацией, сокращая задержку до 50 мс и позволяя самохостинг для строгого соблюдения требований к размещению данных.
С другой стороны, LLMs открывают возможности для синтеза данных из разных документов и работы с длинными контекстами (более 100 000 токенов). Специализированные LLMs, такие как BloombergGPT, превосходят общие модели по финансовым показателям и задачам многократного рассуждения.
Ключевой момент: короткие, структурированные задачи лучше подходят для SLMs, тогда как для глубокого синтеза и работы с длинными контекстами необходимо учитывать бюджет на LLMs.
3. Компромиссы в области безопасности и соблюдения норм
Оба типа моделей подвержены рискам, таким как инъекции запросов и утечка данных. SLMs предпочтительнее для самохостинга, что минимизирует юридические риски, связанные с трансграничными передачами данных. LLMs, использующие API, могут создавать риски концентрации и зависимости от поставщиков.
Для высокорисковых применений требуется прозрачность и контроль, включая полные журналы решений и человеческий надзор.
4. Модели развертывания
Существует три проверенных подхода в финансовом секторе:
- SLM в первую очередь, LLM в резерве: направляйте более 80% запросов на настроенный SLM и эскалируйте сложные случаи к LLM.
- LLM как основной инструмент: используйте LLM для синтеза данных с детерминированными инструментами для доступа к данным.
- Специализированный LLM: большие модели, адаптированные к финансовым данным, обеспечивают значительные преимущества для узких задач.
Важно всегда внедрять фильтры контента, проверку выходных данных и непрерывный мониторинг.
5. Матрица решений (быстрая справка)
Критерий:
- Регуляторные риски: внутренние помощники, не принимающие решения — предпочтение SLM; высокорисковые применения — LLM с полной валидацией.
- Чувствительность данных: локальное размещение — SLM; внешние API с защитой данных — LLM.
- Задержка и стоимость: задачи с высокой скоростью — SLM; задачи с низкой скоростью — LLM.
- Сложность: извлечение и маршрутизация — SLM; синтез и длинный контекст — LLM.
6. Конкретные примеры использования
Обслуживание клиентов: SLM в первую очередь с инструментами для распространенных вопросов, эскалация к LLM для сложных запросов.
KYC/AML: SLMs подходят для извлечения и нормализации данных; эскалация к LLM для сложных случаев мошенничества.
Кредитное андеррайтинг: использование SLM для принятия решений, LLM для объяснительных нарративов с обязательным человеческим контролем.
Продуктивность разработчиков: локальные SLM для ускорения работы; эскалация к LLM для сложного синтеза.
7. Показатели производительности и затрат перед «увеличением масштабов»
Оптимизация RAG: большинство неудач связаны с извлечением, а не с «интеллектом модели». Улучшайте разбиение, актуальность и ранжирование перед увеличением размера модели.
Примеры успешного применения:
- COiN от JPMorgan: автоматизация обзора кредитных соглашений, что сократило время обработки с нескольких недель до нескольких часов.
- FinBERT: модель, способная точно определять настроение в финансовых документах, что позволяет аналитикам лучше оценивать рыночные тенденции.















