8 (495) 987 43 74
Мы в соцсетях -              
Рус   |   Eng

Авторы

Соколов А. М.

Ученая степень
ведущий инженер, научно-исследовательский отдел, филиал Федерального государственного бюджетного образовательного учреждения высшего образования «Национальный исследовательский университет "МЭИ"» в г. Смоленске
E-mail
ansokol98@mail.ru
Местоположение
г. Смоленск, Россия
Статьи автора

Рубрицирование текстовой информации на основе голосования интеллектуальных классификаторов

Одним из приоритетов государственной политики России выступает практическая реализация концепции электронного правительства. Важным элементом этой концепции является организация эффективного взаимодействия органов власти и граждан, которая, помимо оказания государственных услуг, должна включать в себя обработку электронных обращений (заявлений, жалоб, предложений и т.п.). Исследования показывали, что скорость и оперативность обработки обращений в значительной степени зависит от качества определения тематических рубрик, т.е. решения задачи рубрицирования. Проведенный анализ обращений граждан, поступающих на электронную почту и официальные сайты различных органов власти, выявил ряд специфических особенностей (небольшой размер, наличие ошибок в тексте, свободный стиль изложения, рассмотрение нескольких проблем), которые не позволяют успешно применять традиционные подходы к их рубрицированию. Для решения указанной проблемы было предложено использовать различные методы интеллектуального анализа неструктурированных текстовых данных (в частности, нечетко-логические алгоритмы, нечеткие деревья решений, нечеткие пирамидальные сети, нейро-нечеткие классификаторы, сверточные и рекуррентные нейронные сети). В статье описаны условия применимости шести интеллектуальных классификаторов, предложенных для рубрицирования электронных обращений граждан. В их основе лежат такие факторы, как размер документа, степень пересечения тематических рубрик, динамичность их тезаурусов и объемом накопленной статистической информации. Для ситуации, когда конкретная модель не может произвести однозначный выбор тематической рубрики, предложено использовать метод голосования классификаторов, который позволяет существенно снизить вероятность ошибок рубрицирования на основе взвешенного агрегирования решений, полученных несколькими моделями, отобранными с помощью нечетко-логического вывода. Читать дальше...

Создание цифрового двойника химико-технологической системы с использованием языка Python

В настоящее время при моделировании сложных технологических процессов в киберфизических системах все более широкое распространение получают процедуры создания так называемых цифровых двойников (ЦД), которые являются виртуальными копиями реальных объектов и отражают их основные свойства и характеристики на различных этапах жизненного цикла. Применение цифровых двойников позволяет в реальном времени отслеживать текущее состояние моделируемой системы, а также предоставляет дополнительные возможности для инжиниринга и более глубокой настройки входящих в нее компонентов для повышения уровня качества выпускаемой продукции. Развитию технологии «цифровой двойник» способствует происходящая в настоящее время Четвертая промышленная революция, характеризующаяся массовым внедрением в производство киберфизических систем. Указанные системы основаны на использовании новейших технологий обработки и представления данных и обладают сложной структурой информационных связей между ее компонентами. При создании цифровых двойников элементов подобных систем целесообразно использовать языки программирования, которые позволяют реализовывать визуализацию моделируемых процессов, а также предоставляют удобный и развитый аппарат для работы со сложными математическими зависимостями. Подобными характеристиками обладает язык программирования Python. В статье в качестве примера киберфизической системы рассматривается химико- технологическая система на основе обжиговой машины конвейерного типа. Данная система предназначена для реализации процесса производства окатышей из отходов добычи апатит- нефелиновых руд. В статье описаны различные аспекты создания цифрового двойника ее элементов, осуществляющих химико-технологический процесс сушки применительно к единичному окатышу. Цифровой двойник реализован с использованием языка программирования Python 3.7.5, и предусматривает визуализацию протекания процесса в виде трехмерной интерактивной модели. Визуализация выполнена с применением библиотеки VPython. Приводится описание алгоритма работы программного обеспечения цифрового двойника, вид интерфейса информационной системы, формат входной и выходной информации, а также результаты моделирования исследуемого химико-технологического процесса. Показано, что разработанный цифровой двойник может применяться в трех вариантах: самостоятельно (Digital Twin Prototype), в качестве экземпляра цифрового двойника (Digital Twin Instance), а также в составе совокупности цифровых двойников (Digital Twin Aggregate). Читать дальше...

Инструменты автоматизированного сбора и анализа социологической информации o территориальной идентичности жителей крупных городов

В статье предлагается алгоритм автоматизированного поиска и первичного анализа социологической информации для исследования территориальной идентичности жителей районов крупных городов в интернет- источниках. В качестве основного источника информации рассматриваются сообщества в социальных сетях (на примере социальной сети «Вконтакте»), в качестве вспомогательных – интернет-порталы о топографических объектах, находящихся на исследуемых территориях. Показано, что с точки зрения информационного обеспечения наибольшим потенциалом обладают публичные страницы и группы с открытой и ограниченной «стеной». Разработанный алгоритм предполагает выделение релевантных для решаемой задачи групп, выявление содержащихся в них записей по районной тематике и определение показателей активности участников сообщества при обсуждении территориальных проблем. Извлечение требуемой информации осуществляется посредством взаимодействия с сервером социальной сети с использованием официального программного интерфейса приложения (API). Для идентификации сообществ и записей предлагается использовать методы морфологического анализа текстовой информации. Описана программная реализация указанного алгоритма на языке Python 3.8.5, которая включает оригинальные функции для получения данных о сообществах по их идентификационным номерам, для формирования набора урбанонимов для заданного района и др. С использованием разработанной программы проведен анализ территориальных групп трех районов г. Москвы. Определена погрешность результатов работы программы относительно результатов, полученных вручную. Читать дальше...