8 (495) 987 43 74 доб. 3304 Прием заявок на рассмотрение статей E-mail: evlasova@synergy.ru

Мы в соцсетях -              
Рус   |   Eng

Архив номеров

№2(122) Март-апрель 2026 года

Содержание номера:

ИТ-менеджмент

Управление эффективностью

Предложена модель прогнозирования отклонений факторов внешней и внутренней среды промышленного предприятия от плановых значений, выполненная на основе ансамбля искусственных нейронных сетей. Повышение точности таких прогнозов представляет собой актуальную исследовательскую задачу, так как точность играет ключевую роль при разработке производственных программ предприятий, позволяя обоснованно выстраивать конкурентные стратегии взаимоотношений с поставщиками и потребителями. На точность прогнозов существенно влияет нестабильность факторов внутренней среды (данных, непосредственно характеризующих производственные процессы с точки зрения их воздействия на объемы выпуска и качество продукции) и внешней среды (объем спроса, сроки поставки, качество комплектующих и сырья). Под нестабильностью в постановке задачи исследования понималась не сама изменчивость значений факторов, а флуктуации их обобщенных характеристик, относящихся ко всему набору данных. К таким характеристикам относятся нерегулярность поступления данных и наличие аномалий в них. Новизну результатов исследования составляет предложенная структура нейросетевой модели прогнозирования отклонений факторов внешней и внутренней среды от плановых показателей в условиях нерегулярности поступления информации и наличия аномалий в данных, а также алгоритм ее применения. В основе модели лежит ансамбль из трех нейросетевых подмоделей, построенных на архитектурах сверточных и рекуррентных нейронных сетей, составляющих прогнозы факторов внутренней среды и внешней среды (с учетом декомпозиции на микро- и макросреду) предприятия. Взаимовлияние нестабильности указанных факторов учитывается в модели за счет применения на ее выходе сети долгой краткосрочной памяти для агрегации результатов работы подмоделей при получении итогового прогноза. Результаты проведенного модельного эксперимента показали, что учет нестабильности факторов внешней и внутренней среды позволяет повысить точность прогноза их отклонений от плановых значений.

Существующие подходы технологии при глубоком анализе бизнесс-процессов часто демонстрируют низкую устойчивость к распространенным проблемам реальных данных – наличию шумовых записей и неполноте журналов событий. Целью работы является разработка и верификация комплексного трехэтапного подхода, объединяющего статистическую фильтрацию аномалий, вероятностно-временное восстановление пропущенных событий и адаптивный синтез модели процесса. В рамках исследования решались следующие задачи: критический анализ классических алгоритмов Discovery, формализация методов фильтрации на основе Isolation Forest и восстановления событий с использованием вероятностных и временных метрик, а также предложен адаптивный механизм выбора порога шума на основе нормированной энтропии вариативности подпроцесса. Подход реализован в виде программного модуля на Python с использованием библиотек pm4py, scikit-learn и numpy. Эксперименты на синтетических данных, сгенерированных с варьируемым уровнем шума и долей пропущенных событий, подтвердили устойчивость метода. Результаты оценивались по метрикам Fitness, Generalization, Simplicity и F1-мера в сравнении с алгоритмами Alpha Miner, Heuristics Miner и Inductive Miner. Предложенный подход показал статистически значимое улучшение качества результирующих моделей в условиях высокой зашумленности и неполноты исходных данных. Результаты работы формируют основу для создания устойчивых систем анализа бизнес-процессов, способных работать с данными из реальных информационных систем.

В преподавательский портфель

Разработка ИТ-инструментария

В статье предложена модель автоматической генерации образовательных тестов на основе доменно-адаптивного дообучения больших языковых моделей (LLM). Традиционные методы разработки тестовых заданий требуют значительных временных затрат и ограничены узкой предметной специализацией. В результате анализа известных подходов к генерации тестовых заданий с использованием исключительно инструктирования предобученных LLM выявлены ключевые ограничения: нестабильность результатов, недостаточный контроль над структурой вопросов и необходимость постредактирования, что обосновывает необходимость разработки специализированных решений. Предложен пайплайн дообучения языковой модели T-Lite (7 млрд параметров) с использованием техники LoRA на наборе данных из 4000 валидированных по дисциплинам высшего образования. Особенностью предложенного метода является применение цепочек мыслей (Chain-of-Thought) для структурирования процесса генерации заданий через декомпозицию на компоненты: тема, цель, формат, необходимые знания, формулировка и ожидаемый ответ. Разработан пайплайн вывода модели системы генерации заданий, интегрирующий мультимодальную обработку входных данных (текст/изображение), автоматическую сегментацию контента и многоэтапную генерацию заданий с использованием специализированных моделей Qwen2-VL и Gemma-2-27b-it. Проведено апробирование и практическое внедрение модели в экосистему независимого оценивания портала i-exam.ru. Это позволило расширить функционал существующих сервисов интернет-тестирования за счет получения дополнительной возможности по расширению нескомпрометированной базы заданий в тестовой форме, что особенно важно для обеспечения надежности процедур онлайн-тестирования, в частности таких, как ФЭПО и ФИЭБ. Данное внедрение подтверждает способность модели генерировать качественные образовательные тесты, соответствующие психометрическим требованиям и пригодные для использования в учебном процессе.

Инструментальные средства

Для проведения экономического моделирования зачастую возникает необходимость в оценке взаимовлияния между несколькими социально-экономическими показателями. При этом рассматриваемые факторы имеют многокритериальную структуру, то есть к их изучению можно подходить с различных сторон. Целью настоящего исследования является разработка метода, основанного на применении математического моделирования, благодаря которому можно получить комплексную оценку макроэкономических процессов для выявления значимых характеристик социоэкономических объектов и использования их при прогнозировании. Предложенный авторами подход базируется на нахождении функций импульсного отклика и декомпозиций дисперсий прогноза ошибок с помощью построения векторных авторегрессионных моделей. Обобщенный анализ этих характеристик межфакторного взаимодействия дает комплексное представление об изучаемых вопросах. При прогнозировании же учитываются силы влияния многокритериального фактора, рассматриваемого с различных аспектов. Это позволяет выбрать наиболее приоритетные меры, способствующие повышению уровня социально-экономического развития региона. Предложенный метод был протестирован на примере изучения взаимосвязи между социальными факторами миграционных потоков и уровнем занятости в Российской Федерации. В качестве эконометрического аппарата выбрана модель панельной векторной авторегрессии. Выбор указанной модели обусловлен как поставленной целью, так и структурой, имеющейся в распоряжении авторов базы данных. Исследование проводилось в разрезе трех социальных аспектов, характеризующих миграционные потоки, а именно взяты данные динамики количества прибывшего и убывшего трудоспособного населения, а также смоделированы процессы, учитывающие уровень образования респондентов и их гражданскую принадлежность. Благодаря использованию построенных в работе моделей авторами найдены обобщенные функции импульсных откликов и декомпозиция дисперсий прогноза ошибок. На основе полученных результатов сформирован ансамбль моделей, получен прогноз, учитывающий значимость каждого признака, и проведен сравнительный анализ. Научную строгость анализа и прикладное значение проведенной работы обеспечивают методы эконометрического моделирования. Практическая реализация осуществлялась с использованием интерпретируемого языка программирования R.

Эффективные алгоритмы

Разработка эффективных параллельных программ для мультикомпьютеров является сложной задачей, требующей решения множества проблем. С одной стороны, необходимо обеспечить нефункциональные свойства параллельной программы, такие как сокращение накладных расходов на организацию параллельной обработки, балансировка нагрузки на вычислительные узлы и процессорные ядра и т. п. С другой стороны, для параллельных программ актуальны новые классы ошибок, не свойственные последовательным программам. Для преодоления этих проблем разрабатываются системы автоматического конструирования параллельных программ. Такие системы берут на себя работу по выполнению программы на мультикомпьютере и обеспечению нефункциональных свойств, позволяя пользователю сосредоточиться на решении прикладной задачи. Цель данной работы – оценить степень готовности популярных систем автоматического конструирования параллельных программ как с точки зрения производительности, так и с точки зрения пользовательского опыта, а также выявить классы задач, для решения которых целесообразно использовать рассматриваемые системы. В работе представлено сравнение этих систем между собой и с наиболее часто использующимися технологиями параллельного программирования (­MPI, Open­MP) по критериям, наиболее значимым для пользователя при выборе используемой технологии (производительность, полнота документации, простота установки, возможности для отладки и оптимизации и др.). Общими проблемами, характерными для таких систем и рассмотренными в статье, являются неполнота документации, ошибки и неожиданное поведение. Однако данные системы по большей части способны конструировать параллельные программы приемлемой производительности. При этом относительная простота и высокий уровень абстракции входных языков программирования позволяют реализовать прикладной алгоритм с меньшими трудозатратами по сравнению с использованием технологий ­MPI и Open­MP.

Программная инженерия

Практический перенос приложений в среду операционных систем семейства Linux затрудняется отсутствием эффективных механизмов централизованного управления профилями мобильных пользователей при их входе в систему с любого компьютера в домене, функционально аналогичных компоненту Roaming User Profiles ­ОС Windows. Однако в отличие от ­ОС Windows, где настройки приложений и системы хранятся в едином реестре, в ­ОС Linux они размещены во множестве скрытых файлов и каталогов в домашней папке пользователя, что приводит к интенсивным пересылкам данных и, таким образом, увеличению времени инициализации и завершения сеанса и росту нагрузки на дисковую подсистему при сканировании метаданных. В работе предложен подход к организации централизованного управления мобильными профилями пользователей на основе образов дисков ­QCOW2. Используется механизм сохранения изменений и их полного локального копирования на время сессии, известный как Copy-On-Write, что устраняет основные недостатки сетевых файловых систем и синхронизации файлов. Разработана структура системы мобильных пользовательских профилей для Linux-сред, предложена методика обеспечения их целостности, производительности и отказоустойчивости, которая устраняет зависимость производительности от качества сети, характерную для метода на основе реестра. Полученные на созданном макете оценки таких показателей, как объемы пересылок по сети, время входа в систему, скорость чтения и записи файлов во время сессии, устойчивость к разрывам сетевого соединения, выявили их заметное увеличение по сравнению с аналогичными показателями, характерными для известных методов. Подход может служить основой для создания мобильных рабочих мест в гетерогенных Linux-средах.

Лаборатория

Моделирование процессов и систем

Эффективность выполнения операций над нечетко представленными данными (нечеткими множествами и отношениями) при моделировании объектов в условиях неопределенности во многом определяется сложностью организации нечетких вычислений, которая, как правило, основывается на предложенном Л. Заде принципе расширения с использованием четкой функции в качестве отображения. При определенных условиях операции над функциями принадлежности нечетких множеств и отношений, базирующиеся на принципе расширения Л. Заде, равнозначны интервальным операциям над их α-уровнями, которые вычисляются существенно проще. Доказательство этих результатов основывается на теореме Х. Нгуена. В ряде работ организация нечетких вычислений обобщается на случай нечеткого отображения между функциями принадлежности нечетких множеств и отношений на основе обобщенного принципа нечеткого расширения. Однако в этих исследованиях до сих пор не была решена проблема представления и доказательства возможности реализации этого принципа при переходе от операций над функциями принадлежности нечетких множеств и отношений к альтернативным операциям над их α-уровнями. В статье описывается реализация нечеткого отображения между нечеткими множествами и отношениями, основанная на нечеткой композиции функций принадлежности нечетких множеств и нечетких отношений. Предлагается трактовка обобщенного принципа нечеткого расширения, основанного на нечеткой композиции характеристических функций α-уровней нечетких множеств и отношений, а также базирующийся на этом принципе метод нечетких вычислений. Доказано условие равнозначности результатов нечеткой композиции на основе двух рассмотренных подходов, а также выполнена сравнительная оценка сложности вычислений и степени параллелизма при их реализации. Использование предлагаемого обобщенного принципа нечеткого расширения и базирующегося на нем метода нечетких вычислений позволяет существенно упростить и распараллелить реализацию нечетких вычислений при моделировании в условиях неопределенности за счет использования нечисловых (логических) операций над значениями характеристических функций α-уровней нечетких множеств и отношений вместо вычислительных операций над действительными значениями функций принадлежности этих нечетких множеств и отношений. Полученные результаты являются развитием теории нечетких вычислений и востребованы для эффективной реализации операций над нечетко представленными данными в задачах моделирования объектов и процессов в условиях неопределенности.

Информационная безопасность

Защита информации

Рассматривается проблема динамического обнаружения киберугроз в распределенных системах Интернета вещей в условиях ограниченной адаптивности статических систем обнаружения вторжений и уязвимости моделей машинного обучения к состязательным воздействиям. Целью работы является повышение эффективности обнаружения киберугроз в распределенных IoT-системах по критериям результативности и оперативности за счет применения генеративных моделей, способных моделировать нормальное и аномальное поведение узлов с учетом изменчивости среды. Используется метод, основанный на применении генеративно-состязательных моделей и контрастивного обучения для формирования оценки аномальности временных окон IoT-данных и принятия решения по пороговому правилу. Выполнен вычислительный эксперимент на открытом наборе данных N-BaIoT для сценариев атак семейства Mirai, в рамках которого проведена сравнительная оценка статистических, линейных и автоэнкодерных методов обнаружения аномалий на оконном представлении IoT-данных. Показано, что выбранное признаковое описание обеспечивает высокую результативность обнаружения киберугроз при малом времени вывода, а применение автоэнкодера демонстрирует наилучшие значения F1-меры на рассмотренных сценариях. Полученные результаты подтверждают перспективность дальнейшей реализации предложенного генеративного метода для анализа временных последовательностей IoT-трафика и его применения в интеллектуальных средствах мониторинга сетевой безопасности на уровне периферийных узлов и шлюзов IoT-систем.