Ученая степень
|
аспирант, ассистент, инженер-исследователь, Институт математики и компьютерных наук, Тюменский государственный университет
|
E-mail
|
a.a.chernyaev@utmn.ru
|
Местоположение
|
Тюмень, Россия
|
Статьи автора
|
Проблема недостоверной информации на данный момент является наиболее критичной в области распространения информации в сети Интернет. Глобальный переход информационных источников в интернет привел к тому, что информация распространяется слишком быстро и проверить ее достоверность довольно сложно. Данная тема поднимается, когда заходит разговор о СМИ, социальных сетях, блогах и других источниках информации. Передача информации перестала быть делом только СМИ. Любой пользователь интернета может быть источником информации. Развитие свободных источников информации и цифровизация источников привели к потере доверия к официальным СМИ. Следствием этого является развитие методов автоматического определения ложной информации. Задачи данной работы состоят в изучении возможности построения модели для автоматического определения уровня доверия к сообщению в социальной сети на русском языке и определении наиболее влиятельных параметров. Рассматриваемый метод направлен на многосторонний анализ поста, включающий параметры, полученные из текста сообщения, данных пользователя и распространения сообщения в социальной сети. Для работы с методами машинного обучения была собрана и размечена выборка данных, на которой были обучены модели машинного обучения. Выборка данных прошла процесс балансировки для получения стабильных результатов. После обучения моделей было получено пять моделей, обученных как на сбалансированной, так и на обычной выборке данных. Были получены результаты для моделей с ограничением на параметры для выявления наиболее влиятельных параметров. Результатами стали модели машинного обучения с высокими показаниями значений метрик на тестовых данных и выявлены наиболее влиятельные параметры, в которые были включены параметры, характерные только для русского языка.
Читать дальше...
|