№ 6(90)
28 декабря 2020 года
Рубрика: Эффективные алгоритмы Авторы: Федорова Е. А., Афанасьев Д. О., Демин И. С., Лазарев А. М., Нерсесян Р. Г., Пыльцин И. В. |
Цель исследования – разработка общедоступного тонально-тематического словаря на русском языке, позволяющего выявлять смысловую направленность по группам экономических текстов, а также определять их сентиментные (тональные) характеристики. В статье описаны основные этапы составления словаря с применением методов машинного обучения (кластеризация, выделения частотности слов, построение коррелограмм) и экспертной оценки определения тональности и расширение словаря за счет включения терминов из аналогичных зарубежных словарей. Эмпирическая база исследования включала в себя: годовые отчеты компаний, новости министерств и ЦБ РФ, финансовые твиты компаний и новостные статьи РБК по направлению «Экономика, финансы, деньги и бизнес». Составленный словарь отличается от предыдущих по следующим направлениям: 1) является одним из первых словарей, позволяющих оценивать тональность экономических и финансовых текстов на русском языке по пяти степеням тональности; 2) позволяет оценить тональность и смысловую направленность текста по 12 экономическим темам (например, макроэкономика, монетарная политика, фондовые и товарные рынки и т. д.); 3) итоговый словарь EcSentiThemeLex включен в программный пакет (библиотеку) rulexicon для среды программирования R1 и Python2. Приведены пошаговые примеры использования разработанной библиотеки в среде R, позволяющие оценить тональность и тематическую направленность экономического или финансового текста на основе лаконичного кода. Структура библиотеки позволяет использовать оригинальные тексты для их оценки без предварительной лемматизации (приведения к начальным формам). Составленный в данной работе тонально-тематический словарь EcSentiThemeLex со всеми словоформами позволит упростить решение прикладных задач текстового анализа в финансово-экономической сфере, а также потенциально сможет послужить базисом для наращивания числа соответствующих исследований в российской литературе. Продолжение... |
---|---|
№ 6(90)
28 декабря 2020 года
Рубрика: Моделирование процессов и систем Авторы: Калабихина И., Абдуселимова И. А., Архангельский В. Н., Банин Е. П., Клименко Г. А., Колотуша А. В., Николаева У. Г. |
Демографические показатели являются важными параметрами государственных программ по развитию России, а оперативный мониторинг демографического развития – залог успешной реализации программ. Очень часто данные государственной статистики публикуются с задержкой, что не позволяет использовать их при оперативном мониторинге и планировании. В настоящей работе рассматривается подход, позволяющий оперативно оценивать демографические процессы в области формирования семьи и прогнозировать демографические тенденции в краткосрочном будущем на основе данных статистики запросов из Google Trends. Взаимосвязи между данными поисковых запросов и демографическими показателями анализируются с помощью корреляции Пирсона. Для анализа используются годовые (коэффициенты рождаемости, количество абортов на 100 рождений, количество абортов на 1000 женщин, количество браков и разводов на 1000 населения) и месячные данные (число родившихся, количество браков и разводов) по рождениям, бракам и абортам с лагом и без. Анализ проводится на данных по России в целом и для восьми самых населенных регионов: Москва, Московская область, Краснодарский край, Санкт-Петербург, Ростовская область, Свердловская область, Республика Татарстан, Республика Башкортостан. Используя временные ряды, доступные в Google Trends с 2004 года, авторы демонстрируют, что некоторые демографические показатели могут быть спрогнозированы на основе данных родственных запросов к поисковому алгоритму Google с использованием модели ARIMA. Таким образом, возможно использовать данные поисковых запросов в качестве хорошего дополнения к данным демографических показателей, при построении моделей множественной регрессии для демографических расчетов или использовать в качестве прокси-переменных. Продолжение... |
№ 6(90)
28 декабря 2020 года
Рубрика: Моделирование процессов и систем Авторы: Маренко В. А., Ложников В. Е. |
Цель работы – описание нового метода моделирования объектов в виде комплекса информационных задач, включающего симплициальный анализ когнитивной структуры объекта исследования. Метод реализуется в несколько этапов. На первом этапе выявляется совокупность базисных факторов, влияющих на объект исследования со стороны внешней и внутренней среды, их попарное сравнение и формирование когнитивной модели в виде матрицы смежности 1-го уровня иерархии. Затем проводится группировка факторов для формирования 2-го уровня иерархии. Далее осуществляется объединение компонентов в когнитивную структуру 3-го уровня иерархии. На 4-м уровне представляется детализация компонентов 3-го уровня иерархии. Для проверки устойчивости сформированной детализированной структуры когнитивной модели проводится серия имитационных экспериментов. Неявные взаимосвязи между факторами исследуются с применением симплициального анализа. Апробация метода проведена на примере когнитивной модели «образ жизни» студенческой молодежи. Группирование факторов на втором уровне иерархии осуществлено по компонентам «бытовые условия», «когнитивный диссонанс» и «результативность деятельности». При проведении имитационного эксперимента установлено наличие импульсного резонанса в сформированной детализированной структуре 4-го уровня иерархии. Проведение имитационного эксперимента после проведения симплициального анализа детализированной структуры с целью упорядочения элементов матрицы смежности показало отсутствие импульсного резонанса, что соответствует теоретическим разработкам. Установлено влияние на «образ жизни» студенческой молодежи фактора «когнитивный диссонанс» личности, на который, в свою очередь, влияет фактор «досуг». Экспертное выражение «чем лучше "досуг", тем меньше "когнитивный диссонанс"» соответствует логике рассуждений. Возможное применение метода состоит в научно-обоснованном выявлении совокупности существенных факторов, влияющих на объект исследования, с целью обнаружения скрытых тенденций и реализации соответствующих мер социального управления. Продолжение... |