Издания и мероприятия для банковских специалистов:
 
Методический журнал
Риск-менеджмент в кредитной организации
Описание изданияСвежий номер Архив Приобрести/Подписаться
Выходит один раз в квартал
Объем 112 с
Издается с 2011 года
 
 

Обработка текстов и языковые модели: концепция, инструменты, архитектура

Размещено на сайте 20.12.2024
В этом обзоре мы покажем разные области обработки текстов, рассмотрим классические датасеты и обсудим проблемы анализа текстов. Также разберем современные инструменты для работы с текстами — нейросети, опишем две традиционные архитектуры: рекуррентные сети и трансформеры. А главное — опишем концепцию языкового моделирования: предсказание следующего токена, что позволяет с помощью специальных запросов решать широкий круг задач.
 
Александр ДЬЯКОНОВ, «Центральный университет», АО «ТБанк», академический руководитель направления наук о данных, д.ф.-м.н.
 
 
Приводятся извлечения из статьи. Полную версию материала читайте в журнале. Подписаться
 
 
Для языковой модели, такой как GPT, задача заключается не только в правильном выделении основных смысловых единиц, но и в уче­те взаимосвязей между ними. Усложненная структура предложения может привести к ошибкам в интерпретации ключевых компонентов.
Типизация задач, связанных с текстами, по формату входа и выхода позволяет лучше структурировать подходы к их решению, а также упростить выбор инструментов и методов.
Языковое моделирование удобно тем, что для него не нужна разметка. Можно набрать массивы данных из интернета и обучать языковую модель предсказывать следующий токен.
 
 
 
 
Другие проекты ИД «Регламент»