№ 6(90)
from 28 декабря 2020 года
Рубрика: Эффективные алгоритмы Авторы: Федорова Е. А., Афанасьев Д. О., Демин И. С., Лазарев А. М., Нерсесян Р. Г., Пыльцин И. В. |
Цель исследования – разработка общедоступного тонально-тематического словаря на русском языке, позволяющего выявлять смысловую направленность по группам экономических текстов, а также определять их сентиментные (тональные) характеристики. В статье описаны основные этапы составления словаря с применением методов машинного обучения (кластеризация, выделения частотности слов, построение коррелограмм) и экспертной оценки определения тональности и расширение словаря за счет включения терминов из аналогичных зарубежных словарей. Эмпирическая база исследования включала в себя: годовые отчеты компаний, новости министерств и ЦБ РФ, финансовые твиты компаний и новостные статьи РБК по направлению «Экономика, финансы, деньги и бизнес». Составленный словарь отличается от предыдущих по следующим направлениям: 1) является одним из первых словарей, позволяющих оценивать тональность экономических и финансовых текстов на русском языке по пяти степеням тональности; 2) позволяет оценить тональность и смысловую направленность текста по 12 экономическим темам (например, макроэкономика, монетарная политика, фондовые и товарные рынки и т. д.); 3) итоговый словарь EcSentiThemeLex включен в программный пакет (библиотеку) rulexicon для среды программирования R1 и Python2. Приведены пошаговые примеры использования разработанной библиотеки в среде R, позволяющие оценить тональность и тематическую направленность экономического или финансового текста на основе лаконичного кода. Структура библиотеки позволяет использовать оригинальные тексты для их оценки без предварительной лемматизации (приведения к начальным формам). Составленный в данной работе тонально-тематический словарь EcSentiThemeLex со всеми словоформами позволит упростить решение прикладных задач текстового анализа в финансово-экономической сфере, а также потенциально сможет послужить базисом для наращивания числа соответствующих исследований в российской литературе. Продолжение... |
---|---|
№ 6(90)
from 28 декабря 2020 года
Рубрика: Моделирование процессов и систем Авторы: Калабихина И., Абдуселимова И. А., Архангельский В. Н., Банин Е. П., Клименко Г. А., Колотуша А. В., Николаева У. Г. |
Демографические показатели являются важными параметрами государственных программ по развитию России, а оперативный мониторинг демографического развития – залог успешной реализации программ. Очень часто данные государственной статистики публикуются с задержкой, что не позволяет использовать их при оперативном мониторинге и планировании. В настоящей работе рассматривается подход, позволяющий оперативно оценивать демографические процессы в области формирования семьи и прогнозировать демографические тенденции в краткосрочном будущем на основе данных статистики запросов из Google Trends. Взаимосвязи между данными поисковых запросов и демографическими показателями анализируются с помощью корреляции Пирсона. Для анализа используются годовые (коэффициенты рождаемости, количество абортов на 100 рождений, количество абортов на 1000 женщин, количество браков и разводов на 1000 населения) и месячные данные (число родившихся, количество браков и разводов) по рождениям, бракам и абортам с лагом и без. Анализ проводится на данных по России в целом и для восьми самых населенных регионов: Москва, Московская область, Краснодарский край, Санкт-Петербург, Ростовская область, Свердловская область, Республика Татарстан, Республика Башкортостан. Используя временные ряды, доступные в Google Trends с 2004 года, авторы демонстрируют, что некоторые демографические показатели могут быть спрогнозированы на основе данных родственных запросов к поисковому алгоритму Google с использованием модели ARIMA. Таким образом, возможно использовать данные поисковых запросов в качестве хорошего дополнения к данным демографических показателей, при построении моделей множественной регрессии для демографических расчетов или использовать в качестве прокси-переменных. Продолжение... |
№ 6(90)
from 28 декабря 2020 года
Рубрика: Моделирование процессов и систем Авторы: Маренко В. А., Ложников В. Е. |
Цель работы – описание нового метода моделирования объектов в виде комплекса информационных задач, включающего симплициальный анализ когнитивной структуры объекта исследования. Метод реализуется в несколько этапов. На первом этапе выявляется совокупность базисных факторов, влияющих на объект исследования со стороны внешней и внутренней среды, их попарное сравнение и формирование когнитивной модели в виде матрицы смежности 1-го уровня иерархии. Затем проводится группировка факторов для формирования 2-го уровня иерархии. Далее осуществляется объединение компонентов в когнитивную структуру 3-го уровня иерархии. На 4-м уровне представляется детализация компонентов 3-го уровня иерархии. Для проверки устойчивости сформированной детализированной структуры когнитивной модели проводится серия имитационных экспериментов. Неявные взаимосвязи между факторами исследуются с применением симплициального анализа. Апробация метода проведена на примере когнитивной модели «образ жизни» студенческой молодежи. Группирование факторов на втором уровне иерархии осуществлено по компонентам «бытовые условия», «когнитивный диссонанс» и «результативность деятельности». При проведении имитационного эксперимента установлено наличие импульсного резонанса в сформированной детализированной структуре 4-го уровня иерархии. Проведение имитационного эксперимента после проведения симплициального анализа детализированной структуры с целью упорядочения элементов матрицы смежности показало отсутствие импульсного резонанса, что соответствует теоретическим разработкам. Установлено влияние на «образ жизни» студенческой молодежи фактора «когнитивный диссонанс» личности, на который, в свою очередь, влияет фактор «досуг». Экспертное выражение «чем лучше "досуг", тем меньше "когнитивный диссонанс"» соответствует логике рассуждений. Возможное применение метода состоит в научно-обоснованном выявлении совокупности существенных факторов, влияющих на объект исследования, с целью обнаружения скрытых тенденций и реализации соответствующих мер социального управления. Продолжение... |
№ 6(90)
from 28 декабря 2020 года
Рубрика: Разработка ИТ-инструментария Автор статьи: Култыгин О. П. |
Актуальность рассматриваемой в статье темы состоит в решении проблем проектирования экспертных систем промышленных предприятий на основе технологии больших данных. Цель исследования – проанализировать применяемые методологии на стадии проектирования информационной системы предприятия, разработать алгоритмы работы экспертной системы с большими данными. Краткая постановка задачи состоит в анализе имеющихся на рынке технологий работы с большими данными и возможности их использования для экспертных систем, выявлении основных стадий работы с большими данными для промышленных предприятий. В современном мире проблема использования больших данных (Big Data) стала чрезвычайно актуальной. Компании, фирмы и корпорации, являющиеся лидерами в области информационных технологий и ведения бизнеса, заняты поиском оптимальных решений для управления огромным количеством постоянно поступающей информации и ее глубокого анализа. Они ищут пути извлечения прибыли из данных, находящихся в их распоряжении, пытаются получить новые данные из уже существующих. Разработка собственной экспертной системы является экономически более рентабельной. Используемые методы – методы анализа и проектирования IDEF0, DFD, IDEF1, IDEF3, методы функционального (структурного) проектирования, методы объектно- ориентированного проектирования. Полученные результаты – разработана методика использования больших данных для создания экспертной системы промышленного предприятия. Реализация подобной экспертной системы собственными силами оказывается значительно дешевле, чем приобретение готовых программных комплексов. Продолжение... |
При проектировании современных средств вычислительной техники и цифровой электроники огромная роль отводится использованию имитационных моделей, которые позволяют выявлять ошибки на самых разных стадиях разработки изделия. Вначале для этого широко использовались монолитные модели. Но они хорошо работали только тогда, когда их размеры были относительно небольшими. Поэтому разработчики постепенно стали отказываться от использования монолитных моделей и переходить к использованию распределенных моделей, позволяющих повысить их быстродействие и расширить границы допустимых размеров. При этом особое внимание начали уделять иерархическим распределенным моделям, которые обеспечивают возможность исследовать поведение создаваемых устройств на разных уровнях детализации. Подобные модели позволили заметно раздвинуть допустимые границы их размеров и увеличить скорость работы. Однако такие распределенные модели обладают тем недостатком, что их эффективность заметно зависит не только от количества компонент, входящих в их состав, но и от размеров этих компонент. В работе приведены результаты исследования влияния введения дополнительного верхнего иерархического уровня на рабочие характеристики распределенных моделей на основе сетей Петри. Показано, что применение такого способа модификации распределенных моделей приводит к повышению их быстродействия в широком диапазоне изменения размеров. При этом наиболее значимый эффект достигается в распределенных моделях, содержащих большое количество компонент небольшого размера. Максимальное быстродействие модифицированных таким образом моделей может быть на порядок выше, чем у немодифицированных. В результате кроме общего увеличения эффективности модифицированных иерархических распределенных моделей это привело еще и к существенному выравниванию рабочих характеристик модифицированных распределенных моделей с подчиненными компонентами разного размера. Продолжение... |
|
№ 1(91)
from 26 февраля 2021 года
Рубрика: Цифровая трансформация Авторы: Пузыня Т. А., Власова Е. А., Лохтина И. В. |
Актуальность исследования продиктована внедрением цифровизации во все сферы жизнедеятельности людей, своевременной защиты информации, и в первую очередь персональных данных граждан. Задачей проведенного исследования послужила необходимость преобразования методов и подходов защиты информации при ее передачи, создании и хранении. Методический арсенал проведенного исследования представлен общенаучными методами познания сути и содержания изучаемого явления, структурирования составляющих его элементов и их системного обобщения, анализа причинно-следственной связи между функционалом визуализации и защитой информационного обеспечения принимаемых управленческих решений. В представленной статье рассмотрены проблемы применения технологии виртуализации для цифровой трансформации бизнеса – защиты конфиденциальной информации. Авторами проанализированы основные технологии виртуализации для цифровой трансформации бизнеса и сделан вывод о необходимости совершенствования нормативно-правовой базы в данной области. Значимость настоящей статьи заключается в том, что применение метода виртуализации позволит повысить уровень безопасности бизнеса с минимальными потерями. Действующий ГОСТ Р 56938–2016 «Защита информации при использовании технологий виртуализации» не в полной мере отражает вопросы защиты информации в условиях ее визуализации, что приводит к необходимости совершенствования нормативно-правовой базы при использовании технологий виртуализации для защиты информации. Особое внимание при этом следует уделить облачным хранилищам, сервисам для совместной работы и общения, программам для удаленного управления проектами, решениям в области кибербезопасности, CRM-системам. Все это особенно актуально сегодня, в период появления виртуальных рабочих мест и перевода работников на дистанционный режим работы. Продолжение... |