8 (495) 987 43 74 доб. 3304 Прием заявок на рассмотрение статей E-mail: evlasova@synergy.ru

Мы в соцсетях -              
Рус   |   Eng

Архив номеров

№2(110) Апрель 2024 года

Содержание номера:

ИТ-менеджмент

Управление эффективностью

Индустрия подбора персонала находится на переломном этапе: интеграция искусственного интеллекта уже оказала свое влияние на традиционные процессы найма и может произвести революцию. В этой статье представлен подход к классификации резюме по категориям должностей, использующий поиск семантического сходства для усовершенствования механизма подбора кандидатов в рекрутинге. Предложенный метод отличается от традиционных систем, основанных на ключевых словах, и представляет собой структуру глубокого обучения, которая понимает и обрабатывает сложную семантику документов, связанных с работой. Целью исследования является разработка метода классификации текстов резюме, имеющих сложную организационную структуру. Данное исследование решает сразу несколько задач: повышение точности классификации резюме и нахождение наиболее стабильной модели для решения задачи классификации резюме. Авторы провели сравнение стандартных методов машинного обучения с нейросетевыми и показали эффективность последних. Результаты указывают на улучшение метрик качества по сравнению с традиционными ML-моделями, предлагая подход, который может использоваться для прескрининга при подборе персонала с помощью искусственного интеллекта, который выбирает подходящих кандидатов из других кандидатов на вакансию. Также авторами была обнаружена проблема нестабильности результатов при дообучении больших языковых моделей, когда модель даже при одинаковых значениях гиперпараметров дает разные результаты. Был проведен ряд экспериментов, чтобы лучше понять это явление, с вариацией двух параметров – learning rate и seed. В результате обнаружены существенное увеличение производительности при определенном пороге параметром и возможность количественно определить, какие из найденных моделей работают лучше.

Инструментальные средства

Эффективные алгоритмы

Во время четвертой промышленной революции на предприятиях легкой промышленности особую актуальность имеют вопросы автоматизации производственных процессов, в том числе с применением методов компьютерного зрения, машинного обучения и искусственного интеллекта. Ключевую роль в производственных процессах занимают подпроцессы мониторинга и оценки качества производимой продукции (текстильных полотен), на которое напрямую влияет процесс дефектоскопии. Благодаря развитию цифровых технологий и росту вычислительных мощностей появилась возможность автоматизации процесса дефектоскопии текстильных полотен с применением компьютерного зрения с целью снижения затрат на трудовые ресурсы и повышения точности обнаружения дефектов. Цель исследования, рассматриваемого в данной статье, – проведение экспериментов по разметке и обнаружению дефектов текстиля в соответствии с существующей классификацией с применением программно-аппаратного комплекса компьютерного зрения и использованием нейросетевого подхода. Для достижения поставленной цели в работе приводится описание существующей классификации дефектов текстильных полотен, описывается используемый программно-аппаратный комплекс и представляется применение нейросетевой модели архитектуры Mask R-CNN для решения задачи экземплярной сегментации дефектов. В рамках исследования вручную в качестве расширения обучающей выборки проведена разметка более чем 800 фотоснимков тканей по двум классам дефектов: «слет» и «затек воды»; полученные результаты работы нейросетевой модели оценены по метрикам IoU: лучший результат для класса «слет» DIoU = 0,8, для класса «затек воды» DIoU = 0,87. По результатам проведенных экспериментальных исследований сделаны выводы о существующем потенциале использования нейросетевого подхода для дефектоскопии подобных классов дефектов. Представленные результаты являются новыми уникальными примерами обнаружения данных классов дефектов при помощи нейросетевого подхода и могут быть использованы для обучения различных моделей обнаружению объектов на изображении; наработанный опыт может применяться в иных сферах промышленности.

Информационная безопасность

Модели и методики

Нелинейные регрессионные модели являются важным инструментом в сельскохозяйственных исследованиях, так как множество биологических процессов теоретически и экспериментально описываются нелинейными функциями. Помимо того, что нелинейные модели позволяют точно описывать экспериментальные данные, нелинейные функции обладают свойством физической интерпретируемости параметров и являются более устойчивыми вне области определения исследуемой выборки. На данный момент существующие методы расчета коэффициентов модели: метод наименьших квадратов, взвешенный метод наименьших квадратов и обобщенный метод наименьших квадратов обладают рядом недостатков. Наиболее совершенный метод – обобщенный метод наименьших квадратов опирается на большое количество аксиом, которые часто не соблюдаются в реальных примерах, а теоретическое доказательство не является аподиктическим. В статье представляется гибкий, устойчивый и точный метод расчета коэффициентов для произвольной однофакторной регрессионной модели на основе метода оценки максимального правдоподобия. Метод теоретически обосновывается с минимальным количеством аксиом, а также приводятся примеры результатов работы программной реализации для логистической функции и функции Михаэлиса на тестовых синтетических данных и экспериментальных выборках выработки сухой массы травы в зависимости от объема азотных удобрений. Основное преимущество метода заключается в простоте теоретического доказательства и малого количества теоретических ограничений на входные параметры задачи. Также предложенный метод, в отличие от обобщенного метода наименьших квадратов, детерминированно сходится на абсолютном минимуме благодаря использованию алгоритма DIRECT, может учитывать гетероскедастичность и не требует ручной настройки параметров оптимизации для обеспечения сходимости. Также представлены соображения о возможном расширении метода для многофакторного регрессионного анализа и возможные улучшения для оценки гетероскедастичности.

Автор: М. Клячин

Вследствие колоссальных изменений, произошедших в мире за последние несколько лет, для многих компаний вопрос экономической эффективности их деятельности стал жизненно важным. Сфера мероприятий не стала исключением. Экономическая сторона массовых мероприятий в настоящее время еще не получила должного освещения в научной литературе, что затрудняет создание качественного ­ИТ-инструментария. Такой инструментарий должен базироваться на математической модели, которая будет построена с учетом экономических особенностей мероприятий, для чего, в свою очередь, требуется изучение этих особенностей. Таким образом, целью исследования является формирование целевой задачи целочисленного программирования на основе факторов, влияющих на экономические показатели в процессе проведения мероприятия. Работа основана на анализе результатов «полевых» наблюдений, внутренней документации компаний-организаторов, материалов крупных массовых мероприятий, находящихся в свободном доступе, а также научной и популярной литературы по организации и проведению массовых мероприятий. В статье на основании особенностей массовых мероприятий определяются факторы, влияющие на экономические показатели в процессе проведения мероприятия, и на их основе сформирована целевая задача целочисленного программирования. Предложенная автором трехуровневая модель оптимизации распределения ресурсов в процессе проведения массового мероприятия, основанная на критериях выполнения плана массового мероприятия, снижения расходов на привлечение ресурсов и их перераспределение, может быть в дальнейшем рассмотрена как основа для создания ­ИТ-инструментария автоматизации процессов массовых мероприятий, который обеспечит наибольшую гибкость и рациональное использование имеющихся ресурсов в различных ситуациях.

Программная инженерия

В работе формулируются требования к моделям представления, алгоритмам получения, комплексирования и обработки слабоформализованных гетерогенных данных для построения пространственной модели объекта исследования. Спроектирован подход к агрегации мультиспектральных данных на примере задачи объединения визуальных данных аэрофотосъемки и географических координат объектов, которые получены с помощью беспилотных летательных аппаратов. Предложен алгоритм объединения визуальных данных на основе рекуррентного объединения изображений аэрофотосъемки, который включает в себя детектирование ключевых точек изображений и построение регрессионной модели RANSAC по этим точкам. Также предложен алгоритм сопоставления географических координат с точками объединенного изображения, который основан на идее эквивалентных преобразований над визуальными данными и географическими координатами объектов. Предложенные алгоритмы реализованы в виде программного инструмента, проведено его апробирование на нескольких наборах данных аэрофотосъемки. Выявлены перспективы развития предложенного подхода и недостатки входящих в него алгоритмов, которые требуется устранить. Установлено, что необходима дальнейшая оптимизация использования памяти при объединении изображений аэрофотосъемки и дальнейшие исследования в направлении компенсации перспективного искажения. Показана применимость предложенного подхода в задачах получения, комплексирования, обработки и визуализации слабоформализованных мультиспектральных данных в области аэрофотосъемки изображений различных диапазонов (тепловизионных, оптических и т. п.), а также в других областях обработки и анализа данных, таких как детектирование и семантическое сегментирование объектов на изображениях аэрофотосъемки. Дополнительная пространственная информация может повысить точность классификации и сегментации объектов на изображениях.

Представлены результаты исследования, целью которого являлось создание интеллектуальной системы машинного обучения для моделирования процессов агломерации шихты при обработке фосфатного рудного сырья. Актуальность исследования обоснована необходимостью совершенствования информационного обеспечения процессов управления технологическими системами в условиях цифровой трансформации производственной среды, проводимой в рамках четвертой промышленной революции и характеризуемой массовым внедрением индустриального Интернета вещей, что приводит к лавинообразному увеличению объемов технологических данных. Их обработка современными методами анализа, в том числе методами искусственного интеллекта, способна повысить качество принимаемых решений и обеспечить конкурентные преимущества. Научную новизну результатов исследования составляет структура предложенной гибридной интеллектуальной системы машинного обучения для моделирования процессов обработки фосфатного рудного сырья, в основе которой лежит совместное применение динамической модели агломерационного процесса в среде Simulink и глубокой нейронной сети. Архитектура нейронной сети разработана с учетом специфики математического описания процесса агломерации и включает входные полносвязные слои, принимающие результаты измерений переменных технологического процесса, а также рекуррентный слой, обрабатывающий объеденную последовательность с выходов полносвязных слоев. Интеграция Simulink-модели и глубокой нейронной сети делает возможным быструю адаптацию интеллектуальной системы под конкретную агломерационную машину за счет применения двухэтапной процедуры машинного обучения: сначала на имитационной модели Simulink, а затем на реальном объекте. Учитывая значительную инерционность процессов, сопровождающих агломерацию, такой подход обеспечивает оперативное изменение настройки гибридной интеллектуальной системы машинного обучения под новый состав сырья и технологические параметры. Разработана программа, предоставляющая удобный графический интерфейс для подготовки и применения интеллектуальной системы, а проведенные имитационные эксперименты показали, что процесс ее дообучения под новые технологические параметры проходит значительно быстрее первичного обучения при сохранении высокой точности получаемых результатов моделирования.

Цель представленного исследования заключается в доработке первоначального релиза графической оболочки для пакета OpenFOAM путем проектирования и подключения дополнительного модуля, ориентированного на численные эксперименты с применением программы-решателя twoPhaseEulerFoam в области моделирования задач механики сплошных сред. Данный модуль, в отличие от существующих приложений-аналогов, имеет статус программного продукта с открытым исходным кодом, не требует приобретения услуг технического обслуживания, обладает русскоязычным интерфейсом. В представленном программном средстве для упрощения дальнейшей поддержки и модификации реализовано отделение исходного кода внешней части приложения от кода, обеспечивающего логику работы. К ключевым оригинальным подходам, предложенным автором, также можно отнести подсистему сериализации расчетных параметров, которая позволяет преобразовывать параметры расчетного случая в json- и csv-объекты и выполнять обратный процесс. Это дает возможность пользователю переключаться между различными наборами параметров для одного расчетного случая. Кроме того, стоит подчеркнуть наличие в созданном программном модуле механизма проверки комплектности расчетного случая перед началом численного эксперимента. Рассмотрены некоторые особенности решателя и принципы его использования при подготовке расчетных случаев. Определено назначение исследования и составлен перечень требуемых задач. Описан выбранный технологический стек, а также вспомогательные средства разработки. Приведена процессная диаграмма, демонстрирующая работу приложения, а также приведено описание каждого этапа. Результаты исследования апробированы на примере одной из фундаментальных проблем механики сплошных сред и представлены в виде обновленной версии графической оболочки, размещенной в открытом доступе на ресурсе GitHub. По итогам исследования подтверждена эффективность выбранного технологического стека для достижения целей разработки, отмечены выполненные задачи. Сформулирована практическая значимость результатов, выражающаяся в потенциальной экономии рабочего времени инженеров и исследователей, минимизации ошибок моделирования и упрощении процесса подготовки расчетного случая.

Лаборатория

Моделирование процессов и систем

Автор: Ф. Краснов

Экономический эффект торговых интернет-площадок напрямую зависит от того, как быстро будут находить покупатели нужные товары. Низкая скорость поиска приводит к отказам от покупок, а отсутствие нужного товара на первой странице с результатами поиска снижает количество добавлений товаров в корзину. Время отклика системы поиска и наличие нужного товара на первых позициях поисковой выдачи характеризуются показателями полноты и точности системы поиска. Проблема низкого показателя полноты поиска, то есть всех подходящих под поисковый запрос товаров, обостряется в связи с ростом нагрузки и количества предлагаемых магазином товаров. Множество исследований направлено на поиск возможностей улучшения показателей полноты и точности путем более эффективного использования аппаратной части системы поиска и разработки моделей машинного обучения с новыми «слоями» искусственных нейронных сетей, обучающими данными и функциями потерь. В настоящей работе предложен подход, который для увеличения полноты поиска использует знания о товарных категориях. Универсальные методы приближенного поиска используют искусственные кластеры товаров для сокращения времени обработки поискового запроса. При этом полнота найденных товаров-кандидатов ухудшается на 10–20%. Такой подход оправдан, когда данные не имеют естественной структуры. В случае торговой интернет-площадки данные хорошо известны, ими являются товары и их модальности – название, описание, товарная категория, изображения товара, что дает возможность использовать эти знания о данных для улучшения приближенного поиска. Экспериментальные оценки результатов применения данного подхода выявили улучшения показателей полноты и точности извлеченной информации о товарах более чем на 50% без снижения скорости обработки поискового запроса.

ОТЗЫВЫ И РЕЦЕНЗИИ

Автор: В. Мешалкин

Представлена рецензия на новое издание учебника «Конкуренция в предпринимательстве» для вузов, вышедшего в издательстве Университета «Синергия». Отмечены основные преимущества учебника: наличие авторского взгляда на такие вопросы, как процесс соперничества, его объекты, предметы, акторы, результаты, ресурсы, типы и характер конкурентного взаимодействия, виды конкурентных действий, методы операционного взаимодействия сторон соперничества, конкурентная устойчивость и конкурентоспособность, конкурентные позиции, конкурентный статус, конкурентные стратегии, тактические конкурентные операции и комбинации, конкурентные ситуации, конкурентные уловки и головоломки, управление конкурентными действиями, конкурентный анализ. В условиях цифровой экономики и применения интеллектуальных технологий управления использование рассматриваемого издания в учебном процессе позволит сформировать у студентов вузов знания и умения, необходимые для ведения успешной предпринимательской деятельности в современных условиях хозяйствования. Описанный в учебнике инструментарий может эффективно использоваться на стратегическом, операционном и ситуационном уровнях участия в конкуренции с учетом потенциала его реализации в составе корпоративных информационных систем организации.