Успешное достижение целей обучения обусловлено целым рядом факторов. К числу наиболее значимых из них следует отнести максимально точно отражающий задачи и дидактические единицы изучаемого курса план проведения практических занятий и лабораторных работ, а также соответствующий уровень методической и инструментальной обеспеченности лабораторных практикумов. Решения относительно выбора всех этих элементов зависят от ряда условий, таких как правила и стандарты, действующие в конкретной образовательной среде, формат обучения, студенческий контингент и другие. В предлагаемой вниманию читателя статье не ставится задача дать примеры конкретных практических заданий, в ней представлен рамочный обобщенный план проведения лабораторных занятий по курсам моделирования и имитационного моделирования, на основе которого можно провести выборку и настройку применительно к конкретной учебной программе с учетом специфики условий. В основу плана положен набор предпосылок и принципов, которые обусловливают состав выполняемых в практикумах заданий и применяемый в них программный инструментарий. Дана краткая характеристика целей каждой практической задачи обобщенного плана, постановка задач и программные средства, используемые для их решения. Идеи и принципы, представленные в статье, могут быть полезны преподавателям для составления программ практических занятий по моделированию и имитационному моделированию, а также для разработки средств их методической и инструментальной поддержки. Продолжение... |
|
В настоящий момент «грязные» данные, то есть данные низкого качества, становятся одной из главных проблем эффективного решения задач Data Mining. Так как исходные данные аккумулируются из самых разных источников, то вероятность попадания «грязных» данных весьма высока. В связи с этим одной из важнейших задач, которую приходиться решать в ходе реализации Data Mining-процесса, является первоначальная обработка (очистка) данных, то есть препроцессинг. Необходимо заметить, что препроцессинг календарных данных является достаточно трудоемкой процедурой, которая может занимать до половины всего времени реализации технологии Data Mining. Сокращения времени, затрачиваемого на процедуру очистки данных, можно достичь, автоматизировав процесс с помощью специально разработанных инструментов (алгоритмов и программ). При этом следует помнить, что применение вышеуказанных элементов не гарантирует стопроцентную очистку «грязных» данных, а в некоторых случаях даже может приводить к появлению дополнительных ошибок в исходных данных. Авторами разработана модель автоматизированного препроцессинга календарных данных на основе синтаксического анализа и регулярных выражений. Предлагаемый алгоритм отличается гибкой настройкой параметров препроцессинга, достаточно простой реализуемостью и высокой интерпретируемостью результатов, что в свою очередь дает дополнительные возможности при анализе неудачных результатов применения технологии Data Mining. Несмотря на то, что предлагаемый алгоритм не является инструментом очистки абсолютно всех типов «грязных» календарных данных, он успешно функционирует в значительной части реальных практических ситуаций. Продолжение... |
|
Средняя точность (AP) как площадь под кривой Precision – Recall является стандартом де-факто для сравнения качества алгоритмов классификации, информационного поиска, обнаружения объектов и др. При этом традиционные кривые Precision – Recall обычно имеют зигзагообразную форму, что затрудняет вычисление средней точности и сравнение алгоритмов. В данной работе предлагается статистический подход к построению кривых Precision – Recall при анализе качества алгоритмов обнаружения объектов на изображениях. Этот подход основан на расчете статистической точности и статистической полноты. Вместо традиционного уровня уверенности для каждого изображения рассчитывается статистический уровень уверенности как доля обнаруженных объектов. Для каждого порогового значения статистического уровня уверенности определяется суммарное число корректно распознанных объектов на всех изображениях (Integral TP) и суммарное число фоновых объектов на всех изображениях, ошибочно отнесенных алгоритмом к одному из классов (Integral FP). Далее вычисляются значения точности и полноты. Статистические кривые Precision – Recall, в отличие от традиционных, гарантированно являются монотонно невозрастающими. При этом статистическая средняя точность алгоритмов обнаружения объектов на маленьких тестовых наборах данных оказывается меньше, чем традиционная средняя точность, а на относительно больших тестовых наборах изображений эти различия сглаживаются. Приведено сравнение использования традиционных и статистических кривых Precision – Recall на конкретном примере. Продолжение... |