Описание издания | Свежий номер | Архив | Приобрести/Подписаться |
Содержание номера 3/2022 ВАЛИДАЦИЯ МОДЕЛЕЙ В прошлом номере был рассмотрен хакатон по банковским гарантиям МКБ в разрезе исходных данных. Материал получился довольно дискуссионным и выявил некоторые проблемы в индустриальном использовании «коллективного разума». Для этого номера мы попросили крупного поставщика данных для банковских моделей с развитой компетенцией моделирования «под ключ» посмотреть получившую призы модель и оценить практическую применимость результатов форума. ОПЕРАЦИОННЫЙ РИСК О процедуре классификации и регистрации событий в базе данных сказано уже много. Это, несомненно, краеугольный камень Положения № 716-П. Однако цель перехода от «Базеля II» к «Базелю III» — не только повышение качества управления рисками, в частности операционным. Этот переход сопровождается ужесточением требований и рекомендаций Базельского комитета и фактически приводит их к единой стандартизированной методологии оценки величины операционного риска. Свершилось. Банки де-факто и почти де-юре стали ИТ-компаниями, и, похоже, им это неплохо удается. Автоматизировав собственные рутинные задачи, крупные банки предлагают получившиеся решения коллегам. Перейдем ли мы завтра в своих риск-отделах на комплексные решения по управлению персоналом? Редакция журнала задала несколько вопросов коммерческому директору HR-платформы «Пульс» Сбера Марте Леман. КРЕДИТНЫЙ РИСК Мы попросили декана МГИМО и разработчика библиотеки boo поделиться опытом в нахождении проблемных компаний путем анализа 2,5 млн годовых корпоративных отчетов российских организаций. Отметим, что названная open source библиотека способна очистить довольно «шумные» данные Росстата и перевести их в pandas. Это само по себе стоит затраченного на чтение статьи времени и точно сэкономит вам десятки часов, которые обычно уходят на «увлекательную» очистку данных госведомства. Получив от клиента финансовую отчетность в виде pdf-файлов, работник банка должен отобрать нужные файлы и страницы, затем вручную или путем копирования перенести данные во внутреннюю форму. Знакомая рутинная процедура кредитного анализа во многих банках, которая, казалось бы, с большим трудом поддается автоматизации (данные слишком разнородные). В Банке ВТБ автоматизировали этот процесс, создав алгоритм для работы с финансовой отчетностью. Как можно решить такую задачу силами всего двух разработчиков? В 2021 году рейтинговое агентство RAEX подготовило второй выпуск рейтинга информационно-аналитических систем (ИАС). Лидер (с большим отрывом по баллам) прежний, а вот внутри рейтинга оценки сервисов сильно сдвинулись. Рейтинг примечателен также тем, что в него добавлена самооценка участников рынка. Кратко о ней и о компании Seldon — в этом обзоре. АНАЛИЗ ДАННЫХ Лаборатория машинного обучения Альфа-Банка разработала и внедрила три нейросетевых модели на последовательных данных для решения задачи кредитного скоринга. Небольшие банки тоже могут взять на вооружение описанный подход: предложенный в соревнованиях AlfaBattle 2.0 и DL in Finance механизм предобработки данных и обучения моделей, выложенный в open source, позволяет разрабатывать нейросетевые модели кредитного скоринга на данных с миллионами записей даже на личном ноутбуке. В риск-моделях нередко используются текстовые данные: отзы- вы и комментарии, свободные ответы на вопросы анкет, новостная лента, данные чат-ботов с пользователем и самая большая часть — текстовая информация транзакций. В статье на примере реализованного проекта по анализу данных соцмедиа — текстов комментариев и отзывов пользователей о банке — показано, что даже простые задачи NLP, решаемые на реальных данных, могут потребовать глубоких исследований. Также в статье рассказывается, какие подходы можно применить после внедрения базового минимума. РЫНОЧНЫЙ РИСК В непростые времена, когда технический анализ фактически не дает результатов, особенное внимание можно уделить алгоритмам прогнозирования временных рядов на основе автоматического подбора параметров ARIMA-моделей. Попробуем сделать это в статистических пакетах MATLAB, Python, R и бесплатном российском ПО DRAGON. МИРОВЫЕ ПРАКТИКИ В последнее время в эконометрической литературе предпринимаются попытки исследовать финансовые «пузыри» в динамике цен на биткоины и другие криптоактивы. Взрывной рост цен, за которым следует резкое падение, несет высокий риск для инвесторов. Авторы одной из лучших публикаций журнала Risks за 2021 год исследуют взаимосвязи взрывоопасности различных криптовалют, что особенно актуально в течение затянувшейся «криптозимы». ПЕРСОНАЛЬНАЯ ЭФФЕКТИВНОСТЬ В прошлом номере мы опубликовали пошаговое объяснение логики подбора параметров решающего дерева. Продолжим рассматривать алгоритмы машинного обучения и немного упрощенно объясним, как устроен известный современный бустинговый алгоритм, прямо в табличном процессоре.
|
|