8 (495) 987 43 74
Мы в соцсетях -              
Рус   |   Eng

Купить статью

Авторы: Дли М. И., Булыгина О. В., Соколов  А. М.     Опубликовано в № 5(89) 06 ноября 2020 года
Рубрика: Управление эффективностью

Рубрицирование текстовой информации на основе голосования интеллектуальных классификаторов

Одним из приоритетов государственной политики России выступает практическая реализация концепции электронного правительства. Важным элементом этой концепции является организация эффективного взаимодействия органов власти и граждан, которая, помимо оказания государственных услуг, должна включать в себя обработку электронных обращений (заявлений, жалоб, предложений и т.п.). Исследования показывали, что скорость и оперативность обработки обращений в значительной степени зависит от качества определения тематических рубрик, т.е. решения задачи рубрицирования. Проведенный анализ обращений граждан, поступающих на электронную почту и официальные сайты различных органов власти, выявил ряд специфических особенностей (небольшой размер, наличие ошибок в тексте, свободный стиль изложения, рассмотрение нескольких проблем), которые не позволяют успешно применять традиционные подходы к их рубрицированию. Для решения указанной проблемы было предложено использовать различные методы интеллектуального анализа неструктурированных текстовых данных (в частности, нечетко-логические алгоритмы, нечеткие деревья решений, нечеткие пирамидальные сети, нейро-нечеткие классификаторы, сверточные и рекуррентные нейронные сети). В статье описаны условия применимости шести интеллектуальных классификаторов, предложенных для рубрицирования электронных обращений граждан. В их основе лежат такие факторы, как размер документа, степень пересечения тематических рубрик, динамичность их тезаурусов и объемом накопленной статистической информации. Для ситуации, когда конкретная модель не может произвести однозначный выбор тематической рубрики, предложено использовать метод голосования классификаторов, который позволяет существенно снизить вероятность ошибок рубрицирования на основе взвешенного агрегирования решений, полученных несколькими моделями, отобранными с помощью нечетко-логического вывода.

Ключевые слова

электронные обращения граждан, рубрицирование текстовых документов, интеллектуальные классификаторы, голосование классификаторов

Автор статьи:

Дли М. И.

Ученая степень:

докт. техн. н., профессор заместитель директора Филиала НИУ «МЭИ» в Смоленске кафедра Высшей математики и естественно-научных дисциплин Московского финансово-промышленного университета «Синергия

Местоположение:

г. Смоленск

Автор статьи:

Булыгина О. В.

Ученая степень:

канд.экон.наук, доцент, кафедра Информационных технологий в экономике и управлении, Филиал Национального исследовательского университета «МЭИ» в г. Смоленске

Местоположение:

г. Смоленск

Автор статьи:

Соколов  А. М.

Ученая степень:

ведущий инженер, научно-исследовательский отдел, филиал Федерального государственного бюджетного образовательного учреждения высшего образования «Национальный исследовательский университет "МЭИ"» в г. Смоленске

Местоположение:

г. Смоленск, Россия