№ 2(92)
from 30 апреля 2021 года
Рубрика: Эффективные алгоритмы Авторы: Байнова М. С., Соколов А. М. |
В статье предлагается алгоритм автоматизированного поиска и первичного анализа социологической информации для исследования территориальной идентичности жителей районов крупных городов в интернет- источниках. В качестве основного источника информации рассматриваются сообщества в социальных сетях (на примере социальной сети «Вконтакте»), в качестве вспомогательных – интернет-порталы о топографических объектах, находящихся на исследуемых территориях. Показано, что с точки зрения информационного обеспечения наибольшим потенциалом обладают публичные страницы и группы с открытой и ограниченной «стеной». Разработанный алгоритм предполагает выделение релевантных для решаемой задачи групп, выявление содержащихся в них записей по районной тематике и определение показателей активности участников сообщества при обсуждении территориальных проблем. Извлечение требуемой информации осуществляется посредством взаимодействия с сервером социальной сети с использованием официального программного интерфейса приложения (API). Для идентификации сообществ и записей предлагается использовать методы морфологического анализа текстовой информации. Описана программная реализация указанного алгоритма на языке Python 3.8.5, которая включает оригинальные функции для получения данных о сообществах по их идентификационным номерам, для формирования набора урбанонимов для заданного района и др. С использованием разработанной программы проведен анализ территориальных групп трех районов г. Москвы. Определена погрешность результатов работы программы относительно результатов, полученных вручную. Продолжение... |
---|---|
№ 2(92)
from 30 апреля 2021 года
Рубрика: Эффективные алгоритмы Авторы: Ерохин В. В., Притчина Л. С. |
В статье рассматривается проблема обнаружения и фильтрации шелл- кодов (shellcode) – вредоносного исполняемого кода, способствующего появлению уязвимостей при работе программных приложений с памятью. Основными такими уязвимостями являются переполнение стека, переполнение баз данных, а также некоторых других служебных процедур операционной системы. В настоящее время существует несколько десятков систем обнаружения шелл-кодов, использующих как статический, так и динамический анализ программ. Мониторинг существующих систем показал, что методы, обладающие невысокой вычислительной сложностью, характеризуются большим процентом ложных срабатываний. При этом методы с невысоким процентом ложных срабатываний характеризуются повышенной вычислительной сложностью. Однако ни одно из существующих на настоящий момент решений не в состоянии обнаруживать все существующие классы шелл- кодов. Это делает существующие системы обнаружения шелл-кодов слабо применимыми к реальным сетевым каналам. Таким образом, в статье рассмотрена задача анализа систем обнаружения шелл-кодов, обеспечивающих полное обнаружение существующих классов шелл-кодов и характеризующихся приемлемой вычислительной сложностью и малым количеством ложных срабатываний. Представлены классификации шелл-кодов и комплексный метод их обнаружения, основанный на эмуляции кода. Этот подход расширяет диапазон детектирования классов шелл-кодов, которые могут быть обнаружены, за счет параллельной оценки нескольких эвристик, которые соответствуют низкоуровневым операциям на CPU во время выполнения различных классов шелл-кода. Представленный метод позволяет эффективно обнаруживать простой и метаморфический шелл-код. Это достигается независимо от использования самомодифицируемого кода или генерации динамического кода, на которых основаны существующие детекторы полиморфного шелл-кода на основе эмуляции. Продолжение... |
№ 2(92)
from 30 апреля 2021 года
Рубрика: Модели и методики Авторы: Булыгина О. В., Зырянов С. И., Иванова О. А., Хамидуллин Р. Я. |
В условиях пандемии новой коронавирусной инфекции резко возросла значимость одноразовой посуды и упаковки для продуктов питания. С одной стороны, это способствовало повышению спроса на такую продукцию, а с другой – усилило и так острую конкуренцию на данном рынке. В результате перед производителями одноразовой посуды встала жизненно важная задача, связанная с поиском путей сохранения и расширения клиентской базы. Сегодня перспективным способом ее решения считается разработка и внедрение различных продуктовых и технологических инноваций. Однако реализация подобных проектов является достаточно сложным процессом, поскольку предлагает не только создание или модификацию производственных технологий и производимых продуктов, но и осуществление организационных изменений, связанных со всеми бизнес- процессами предприятия. Как показывает практика, особую роль при проведении таких организационных изменений играет человеческий фактор, при этом наибольшую угрозу для проекта представляют не ошибки планирования и реализации изменений, а сопротивление сотрудников. Одним из способов его предупреждения или снижения является создание специальной команды поддержки изменений, отличающейся инициативностью. Однако на практике достаточно трудно выявить таких сотрудников, которые не только имеют желание участвовать в реализации изменений, но и обладают достаточными знаниями, навыками, опытом для их проведения. Для решения данной проблемы было предложено моделирование поведения сотрудников, направленное на оптимизацию состава такой команды на основе исследования различных характеристик. Для его практической реализации использовался алгоритм пчелиных колоний, модифицированный путем введения элементов нечеткости (для задания начальных позиций поиска). Продолжение... |
В управлении бизнес-процессами весьма часто встречаются слабоструктурированные или неструктурированные задачи. Преобладание качественных оценок параметров таких задач приводит к тому, что исходные требования для выбора соответствующих информационных технологий могут быть сформулированы преимущественно на качественном уровне. В этой ситуации достаточно информативными могут оказаться оценки в виде лингвистических утверждений, формализованных нечеткими множествами. Неопределенность в исходных данных, наличие нескольких альтернативных решений позволяют формализовать задачу выбора информационной технологии для решения слабоструктурированных бизнес-задач как игру с природой, под которой понимается некоторая комбинация условий, например количество пользователей и интенсивность их запросов, оцениваемых нечеткими лингвистическими утверждениями. Целью предлагаемой работы является разработка метода нахождения наиболее целесообразного решения в условиях нечеткости исходных данных, определяющих выбор на множестве возможных альтернативных информационных технологий. Предложенный метод нахождения наилучшего решения отличается тем, что все необходимые исходные оценки задаются в виде лингвистических утверждений, формализуемых нечеткими множествами, при этом влияние нечетко определенных значений вероятностей состояний природы учитывается через точечные оценки нечетких множеств, формализующих эти значения, а интегральная оценка возможных решений получается путем преобразования исходных нечетких оценок альтернативных решений в форму эквивалентных треугольных нечетких множеств. Кроме того, предложенный метод позволяет при задании нечетких исходных оценок для решения задачи использовать различные виды функций принадлежности нечетких множеств, формализующих эти оценки, а также упростить сравнение полученных в виде нечетких множеств интегральных оценок возможных альтернативных решений. Продолжение... |
|
Выдающийся ученый Валерий Павлович Мешалкин – академик Российской академии наук (РАН), доктор технических наук, профессор, директор Международного института логистики ресурсосбережения и технологической инноватики (МИЛРТИ (НОЦ)), заведующий кафедрой логистики и экономической информатики РХТУ им. Д. И. Менделеева, главный научный сотрудник Института общей и неорганической химии им. Н. С. Курнакова РАН; заслуженный деятель науки РФ, заслуженный работник высшей школы РФ, почетный работник высшего профессионального образования РФ (2005 г.), лауреат премии Правительства РФ в области науки и техники и премии Президента РФ в области образования, лауреат конкурса преподавателей вузов «Золотые имена высшей школы России – 2018», сопредседатель редакционного совета журнала «Прикладная информатика» – достиг восьмидесятилетней вехи на своем жизненном пути. Вместе с коллегами по редакционному совету, авторами и читателями нашего журнала мы от всей души поздравляем Валерия Павловича с юбилеем и посвящаем ему данную публикацию. Продолжение... |
|
№ 3(93)
from 30 июня 2021 года
Рубрика: Модели и методики Авторы: Мешалкин В. П., Дли М. И., Пучков А. Ю., Рысина (Лобанева) Е. И. |
Предложен метод предварительной оценки прагматической ценности информации в задаче классификации состояния объекта на основе глубоких рекуррентных сетей долгой краткосрочной памяти. Цель проводимого исследования состояла в разработке метода прогноза состояния контролируемого объекта при минимизации количества используемых прогностических параметров, достигаемой с помощью предварительной оценки прагматической ценности информации. Это особенно актуальная задача в условиях обработки больших данных, характеризуемых не только значительными объемами поступающей информации, но и скоростью ее поступления и полиформатностью. Генерация больших данных сейчас происходит практически во всех сферах деятельности, что обусловлено широким внедрением в них Интернета вещей. Метод реализуется двухуровневой схемой обработки входной информации: на первом уровне применяется алгоритм машинного обучения «случайный лес», который имеет значительно меньшее количество настраиваемых параметров, чем рекуррентная нейронная сеть, используемая на втором уровне для окончательной и более точной классификации состояния контролируемого объекта или процесса. Выбор «случайного леса» обусловлен его способностью к оценке важности переменных в задачах регрессии и классификации. Это используется при определении прагматической ценности входной информации на первом уровне схемы обработки данных. Для этого выбирается параметр, который отражает указанную ценность в каком-либо смысле, и на основе ранжирования входных переменных по уровню важности осуществляется их отбор для формирования обучающих наборов данных для рекуррентной сети. Алгоритм предложенного метода обработки данных с предварительной оценкой прагматической ценности информации реализован в программе на языке MatLAB и показал свою работоспособность в эксперименте на модельных данных. Продолжение... |