Статьи автора
|
Развитие роботизированного сбора урожая может способствовать сокращению доли тяжелого ручного труда в садоводстве, достигающего 40%, а также недобора урожая, который доходит до 50%. Роботы для сбора плодов разрабатываются с конца 1960-х гг., однако ни один существующий прототип не используется на практике из-за низкой скорости сбора урожая и большой доли нераспознанных плодов, остающихся на деревьях. Цель исследования – разработка алгоритма обнаружения яблок на изображениях, способного работать быстро и находить как можно большую долю яблок. Для этого предложено использование сверточной нейронной сети YOLOv3 в сочетании со специальными процедурами пред- и постобработки, позволяющими улучшить качество распознавания яблок, в том числе в ситуациях наличия теней, бликов, различных повреждений яблок, пустых просветов между листьями, по форме напоминающих яблоки, перекрытия яблок ветвями, листьями и другими яблоками. Алгоритм распознает и красные, и зеленые яблоки, способен работать как с изображениями одиночных яблок на фотографиях крупного плана, так и с изображениями многочисленных яблок на фотографиях общего плана. Оценка качества алгоритма проводилась на тестовом наборе из 818 изображений красных и зеленых яблок (всего 5142 яблока). Среднее время обнаружения яблока составило 19 мс, доля объектов, которые ошибочно принимаются за яблоки, оказалась на уровне 7,8%, а доля нераспознанных яблок – на уровне 9,2%. И среднее время обнаружения, и частота ошибок оказались заметно меньше, чем во всех известных аналогичных системах. Читать дальше...
Средняя точность (AP) как площадь под кривой Precision – Recall является стандартом де-факто для сравнения качества алгоритмов классификации, информационного поиска, обнаружения объектов и др. При этом традиционные кривые Precision – Recall обычно имеют зигзагообразную форму, что затрудняет вычисление средней точности и сравнение алгоритмов. В данной работе предлагается статистический подход к построению кривых Precision – Recall при анализе качества алгоритмов обнаружения объектов на изображениях. Этот подход основан на расчете статистической точности и статистической полноты. Вместо традиционного уровня уверенности для каждого изображения рассчитывается статистический уровень уверенности как доля обнаруженных объектов. Для каждого порогового значения статистического уровня уверенности определяется суммарное число корректно распознанных объектов на всех изображениях (Integral TP) и суммарное число фоновых объектов на всех изображениях, ошибочно отнесенных алгоритмом к одному из классов (Integral FP). Далее вычисляются значения точности и полноты. Статистические кривые Precision – Recall, в отличие от традиционных, гарантированно являются монотонно невозрастающими. При этом статистическая средняя точность алгоритмов обнаружения объектов на маленьких тестовых наборах данных оказывается меньше, чем традиционная средняя точность, а на относительно больших тестовых наборах изображений эти различия сглаживаются. Приведено сравнение использования традиционных и статистических кривых Precision – Recall на конкретном примере. Читать дальше...
|