8 (495) 987 43 74 доб. 3304 Прием заявок на рассмотрение статей E-mail: evlasova@synergy.ru

Мы в соцсетях -              
Рус   |   Eng

Купить статью

Авторы: Трубин А. Е., Зубанова А. Е., Корепанова В. С., Морозов А. А., Ожередов В. А.     Опубликовано в № 4(100) 31 августа 2022 года
Рубрика: Модели и методики

Методика предобработки данных машинного обучения для решения задач компьютерного зрения

В сфере машинного обучения не существует единой методологии предобработки данных, так как все этапы этого процесса являются уникальными, под конкретную задачу. Однако в каждом направлении используется определенный тип данных. В гипотезе исследования предполагается, что можно четко структурировать последовательности и фазы подготовки данных для задач распознавания текстов. В статье рассмотрены основные принципы предобработки данных и выделение последовательных этапов как конкретной методики для задачи распознавания символов азбук. В качестве исходных данных были выбраны изображения набора ETL. Предобработка включала в себя этапы работы с изображениями, на каждом из которых в исходные данные вносились изменения. Первым шагом являлось кадрирование, которое позволило избавиться от лишней информации на изображении. Далее был рассмотрен подход преобразования изображения к исходному соотношению сторон и определен метод преобразования из оттенков серого в черно-белый формат. На следующем этапе были искусственно расширены линии символов для лучшего распознавания печатных азбук. На последнем этапе предобработки данных была произведена аугментация, которая позволила лучше распознавать символы азбук независимо от их положения в пространстве. Как результат, была выстроена общая структура методики предобработки данных для задач распознавания текстов.

Ключевые слова

нейронные сети, сверточная нейронная сеть, предобработка данных, компьютерное зрение, машинное обучение

Автор статьи:

Трубин А. Е.

Ученая степень:

канд. экон. наук, доцент, директор департамента цифровой экономики, Университет «Синергия»

Местоположение:

г. Москва, Россия

Автор статьи:

Зубанова А. Е.

Ученая степень:

магистрант 1-го курса по направлению подготовки 38.04.01 «Экономика», Орловский государственный университет имени И. С. Тургенева

Местоположение:

Орел, Россия

Автор статьи:

Корепанова В. С.

Ученая степень:

канд. техн. наук, доцент, департамент цифровой экономики, Университет «Синергия»; ведущий инженер ООО «ЛУКОЙЛ-Инжиниринг»

Местоположение:

г. Москва, Россия

Автор статьи:

Морозов А. А.

Ученая степень:

студент 4-го курса по направлению подготовки 09.03.03 «Прикладная информатика», Орловский государственный университет имени И. С. Тургенева

Местоположение:

Орел, Россия

Автор статьи:

Ожередов В. А.

Ученая степень:

канд. физ.-мат. наук, доцент, кафедра информационного менеджмента и информационно-коммуникационных технологий им. профессора В. В. Дика, Университет «Синергия»; научный сотрудник, Институт космических исследований Российской академии наук

Местоположение:

г. Москва, Россия