8 (495) 987 43 74
Мы в соцсетях -              
Рус   |   Eng

Купить статью

Авторы: Булыгина О. В., Какатунова Т. В., Козлов П. Ю.     Опубликовано в № 6(84) 20 декабря 2019 года
Рубрика: Модели и методики

Анализ коротких неструктурированных документов с использованием нечетких весов значимости и особых процедур интеграции экономической информации

В статье предложен новый подход к автоматическому анализу коротких сообщений, поступающих на Интернет-порталы и электронную почту органов государственной власти. Разработанная модель позволяет выполнять классификацию коротких неструктурированных текстовых документов при недостатке статистической информации и слабой степени пересечения тематических рубрик. Входными данными для алгоритма построения модели является множество рубрик и обучающая выборка, а его результатом являются нечеткие весовые коэффициенты значимых слов тезаурусов рубрик, что обеспечивает корректное представление характеристик документа и работу алгоритма рубрицирования (классификации).

Ключевые слова

неструктурированный текстовый документ, рубрицирование текстов, нечеткие веса значимости

Автор статьи:

Булыгина О. В.

Ученая степень:

канд.экон.наук, доцент, кафедра Информационных технологий в экономике и управлении, Филиал Национального исследовательского университета «МЭИ» в г. Смоленске

Местоположение:

г. Смоленск

Автор статьи:

Какатунова Т. В.

Ученая степень:

докт. экон. наук, профессор, кафедра информационных технологий в экономике и управлении, филиал Федерального государственного бюджетного образовательного учреждения высшего образования «Национальный исследовательский университет "МЭИ"» в г. Смоленске

Местоположение:

г. Смоленск, Россия

Автор статьи:

Козлов П. Ю.

Ученая степень:

канд. техн. наук, ассистент филиала Национального исследовательского университета «МЭИ» в г. Смоленске

Местоположение:

Смоленск