8 (495) 987 43 74 доб. 3304
Мы в соцсетях -              
Рус   |   Eng

Купить статью

Авторы: Строев  С. П., Захаров А. В., Люблинская Н. Н., Мекшенева Ж. В., Нечаев А. М., Шоколов В. В.     Опубликовано в № 3(99) 31 мая 2022 года
Рубрика: Управление эффективностью

Задача анализа эмоциональной окраски текстов в банковской деятельности

В работе излагается авторский подход к решению задачи анализа тональности русскоязычных сообщений в сети Интернет о деятельности банков. Материалами исследования выступают отзывы клиентов о банках в целом, о продуктах, сервисах и качестве обслуживания, размещенные на портале Банки.ру. В работе задача анализа тональности текстов рассматривается как задача бинарной классификации на множестве позитивных и негативных отзывов. Для представления собранных и предварительно обработанных текстов использовалась векторная модель со схемой взвешивания tf-idf. Поиск решения задачи бинарной классификации осуществлялся следующими алгоритмами с подбором оптимальных параметров на сетке: наивный байесовский классификатор, метод опорных векторов, логистическая регрессия, случайный лес и градиентный бустинг. Для оценки качества решения задачи классификации применялись стандартные статистические метрики – точность, полнота и F-мера. По указанным метрикам наилучшие результаты получены на классификационной модели, построенной с помощью метода опорных векторов. С целью выделения наиболее характерных тем сообщений клиентов рассматривалась также задача тематического моделирования текстов. Для ее решения применялся метод латентного размещения Дирихле. В результате установлено, что наиболее популярными темами сообщений являются «Карты» и «Качество облуживания». Полученные результаты работы могут использоваться в деятельности банка для автоматизации мониторинга его репутации в медиапространстве и при маршрутизации клиентских запросов по решению различных проблем. При решении задач активно применялись возможности языка программирования Python, а именно библиотеки для веб-скрейпинга, машинного обучения, обработки естественного языка.

Ключевые слова

анализ тональности текста, методы обработки текстов, алгоритмы машинного обучения, векторная модель представления текста, банковская деятельность

Автор статьи:

Строев  С. П.

Ученая степень:

канд. экон. наук, доцент, заведующий кафедрой алгебры и математических методов в экономике, Орловский государственный университет имени И. С. Тургенева

Местоположение:

Орел, Россия

Автор статьи:

Захаров А. В.

Ученая степень:

канд. экон. наук, доцент, декан факультета информационных систем и технологий, Университет "Синергия"

Местоположение:

г. Москва, Россия

Автор статьи:

Люблинская Н. Н.

Ученая степень:

канд. техн. наук, доцент, департамент цифровой экономики, Университет «Синергия»

Местоположение:

г. Москва, Россия

Автор статьи:

Мекшенева Ж. В.

Ученая степень:

канд. экон. наук, доцент, кафедра информационного менеджмента и информационно-коммуникационных технологий им. профессора В. В. Дика, Университет «Синергия»

Местоположение:

г. Москва, Россия

Автор статьи:

Нечаев А. М.

Ученая степень:

канд. воен. наук, доцент, департамент цифровой экономики, Университет «Синергия»

Местоположение:

г. Москва, Россия

Автор статьи:

Шоколов В. В.

Ученая степень:

руководитель направления аудита, АО «Райффайзенбанк»

Местоположение:

г. Москва, Россия