Научная статья на тему 'АДАПТАЦИЯ МЕТОДОВ ТЕОРИИ РАСПОЗНАВАНИЯ ОБРАЗОВ В РЕШЕНИИ ЗАДАЧ ПО АНАЛИЗУ ПОВЕДЕНИЯ ЧЕЛОВЕКА'

АДАПТАЦИЯ МЕТОДОВ ТЕОРИИ РАСПОЗНАВАНИЯ ОБРАЗОВ В РЕШЕНИИ ЗАДАЧ ПО АНАЛИЗУ ПОВЕДЕНИЯ ЧЕЛОВЕКА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
5
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
искусственный интеллект / машинное обучение / распознавание образов / общественная безопасность / эксперт / глубокое обучение / поведение человека / artificial intelligence / machine learning / pattern recognition / public safe-ty / expert / deep learning / human behavior

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гавриленко Наталья Геннадьевна, Заворовский Иван Алексеевич

Рассматривается анализ главных компонентов, линейный дискриминантный анализ и метод сверточной нейронной сети, с обоснованием преимущества каждого метода, а также их недостатками, в решение задач по анализу поведения человека. Авторы предлагают комбинировать методы анализа главных компонентов, линейного дискриминантного анализа и сверточных нейронных сетей представляющие собой мощный инструмент, который позволяет устранить недостатки каждого из этих методов индивидуально. Данная комбинация обеспечивает более точное и эффективное распознавание образов в различных областях, таких как компьютерное зрение и распознавание поведения человека как в режиме реального времени, так и на видео.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ADAPTATION OF PATTERN RECOGNITION THEORY METHODS IN SOLVING PROBLEMS OF HUMAN BEHAVIOR ANALYSIS

The article discusses principal component analysis, linear discriminant analysis, and the convolutional neural network method, with a rationale for the advantages of each method, as well as their disadvantages, in solving problems of human behavior analysis. The authors propose combining the methods of principal component analysis, linear discriminant analy-sis, and convolutional neural networks, which are a powerful tool that allows you to eliminate the disadvantages of each of these methods individually. This combination provides more ac-curate and effective pattern recognition in various fields, such as computer vision and human behavior recognition both in real time and on video.

Текст научной работы на тему «АДАПТАЦИЯ МЕТОДОВ ТЕОРИИ РАСПОЗНАВАНИЯ ОБРАЗОВ В РЕШЕНИИ ЗАДАЧ ПО АНАЛИЗУ ПОВЕДЕНИЯ ЧЕЛОВЕКА»

УДК 004.896

Б01: 10.24412/2071-6168-2025-1-189-190

АДАПТАЦИЯ МЕТОДОВ ТЕОРИИ РАСПОЗНАВАНИЯ ОБРАЗОВ В РЕШЕНИИ ЗАДАЧ ПО АНАЛИЗУ ПОВЕДЕНИЯ ЧЕЛОВЕКА

Н.Г. Гавриленко, И.А. Заворовский

Рассматривается анализ главных компонентов, линейный дискриминантный анализ и метод сверточной нейронной сети, с обоснованием преимущества каждого метода, а также их недостатками, в решение задач по анализу поведения человека. Авторы предлагают комбинировать методы анализа главных компонентов, линейного дискриминантного анализа и сверточных нейронных сетей представляющие собой мощный инструмент, который позволяет устранить недостатки каждого из этих методов индивидуально. Данная комбинация обеспечивает более точное и эффективное распознавание образов в различных областях, таких как компьютерное зрение и распознавание поведения человека как в режиме реального времени, так и на видео.

Ключевые слова: искусственный интеллект, машинное обучение, распознавание образов, общественная безопасность, эксперт, глубокое обучение, поведение человека.

В последние десятилетия распознавание образов стало ключевой областью исследований и технологического развития, вносящую существенный вклад в различные сферы деятельности человека, начиная от компьютерного зрения и медицинской диагностики до автоматизации производства и систем искусственного интеллекта. Эта область охватывает большое число методов и технологий, направленных на разработку систем, способных обнаруживать, классифицировать и интерпретировать образы, получаемые из различных источников.

Суть распознавания образов заключается в обучении компьютерных систем "видеть" и "понимать" визуальные данные, аналогично, как это делает человеческий мозг. Её приложения - от простого определения объектов на изображении до решения сложных задач, таких как распознавание лиц и автоматическая обработка изображений в реальном времени. Данная область может существенно улучшить будущее в сфере обеспечения безопасности и расширить возможности многих индустрий [1].

С развитием глубокого обучения, сверточных нейронных сетей и других передовых методов машинного обучения, область распознавания образов переживает новый виток роста. Эти методы позволяют системам не только извлекать признаки из данных, но и автоматически обучаться на основе опыта, совершенствовать свою производительность и адаптироваться к разнообразным сценариям.

В настоящей статье представлены актуальные тенденции в области распознавания образов, анализируются передовые методы и технологии, предлагается авторское видение развития этой области путём реализации комбинации уже известных методов с дальнейшей их реализацией в виде программного продукта.

Современная научная литература активно исследует и применяет различные методы машинного обучения, включая байесовский классификатор, метод анализа главных компонент (PCA), линейный дискриминант-ный анализ (LDA) и метод сверточной нейронной сети (CNN). Эти методы широко используются в различных областях, включая компьютерное зрение, медицинскую диагностику, анализ данных и распознавание образов. Они продолжают привлекать внимание исследователей.

Так Байесовский классификатор является мощным алгоритмом в области распознавания образов, предоставляющий эффективный метод для автоматического присвоения объектов к различным категориям. Он основан на статистических принципах и находит широкое применение в таких областях, например, как обработка изображений, биометрия, медицинская диагностика. В своей структуре Байесовский классификатор использует теорему Байеса для оценки вероятности принадлежности объекта к определенному классу на основе известных характеристик. В контексте распознавания образов, этот метод способен учитывать сложные зависимости между признаками и образами, что делает его эффективным средством для анализа и классификации сложных визуальных данных. [3] Байесовский классификатор успешно применяется для задач сегментации объектов, определения образов, а также в задачах распознавания лиц и объектов на изображениях. [3] Его способность моделировать вероятности и адаптироваться к новым данным позволяет эффективно обрабатывать разнообразные визуальные сценарии. Преимущества байесовского классификатора включают высокую точность, особенно при наличии ограниченных данных, и способность обновлять модель при поступлении новой информации. Можно дать некое пояснение по использованию термина распознавания образов в Байесовском классификаторе, а именно, это не просто процесс распознавания картинки или предмета на изображение, это многоуровневая задача, направленная на поэтапное определение того, или иного поведенческого движения человека, направленного на выявления объекта путем его сегментации.

Будущие работы с применением этого метода, могут быть направлены на улучшение его способности работы с неструктурированными данными, учет временных зависимостей и интеграцию с другими методами машинного обучения для создания более комплексных систем распознавания образов. Однако, у этого метода есть свои недостатки и ограничения, которые требуют внимания и критического анализа. Так, Байесовский классификатор имеет тенденцию подчеркивать некоторые предположения об отсутствии зависимости между признаками, что может ограничивать его способность обрабатывать сложные взаимосвязи в данных. В случаях, когда объекты обладают сильной внутренней зависимостью признаков, байесовский классификатор может демонстрировать ограниченную эффективность. Эффективность байесовского классификатора напрямую зависит от корректного определения априорных и условных вероятностей. В случае, если эти вероятности неправильно моделируются или изменяются с

течением времени, производительность классификатора может уменьшаться. Особенно проблематично это в условиях, где структура данных динамична или непостоянна. Байесовский классификатор может демонстрировать неудовлетворительные результаты при работе с несбалансированными данными, когда количество объектов в различных классах значительно отличается. Это связано с тем фактом, что априорные вероятности играют важную роль, и несбалансированные данные могут привести к смещению классификации в пользу часто встречающегося класса. В случае высокоразмерных данных байесовский классификатор может столкнуться с проблемой "проклятия размерности", что может привести к ухудшению производительности и точности, особенно при наличии ограниченного количества обучающих примеров. Хотя байесовский классификатор имеет свои преимущества, важно осознавать его недостатки при выборе метода для конкретной задачи распознавания образов. На практике, в случаях использования метода Байесовского классификатора возникают ряд сложностей с распознаванием, а именно Байесовский классификатор может столкнуться с трудностями в распознавании индивидуальных лиц из-за высокой плотности людей и сложности в выделении признаков для классификации. В местах массового транспорта, таких как метро или автобусы в часы пик, большое количество пассажиров может затруднить распознавание лиц из-за ограниченного пространства и разнообразия поз и лицевых выражений. Также при проведении крупных мероприятий на открытом воздухе, таких как праздники или городские парады, большое количество участников и зрителей может сделать сложным определение и классификацию лиц из-за огромного количества объектов на видеофрагменте.

Еще, одним из немаловажных методов в распознавании образов является анализ главных компонент (PCA), призванный выделить ключевые особенности данных и снизить размерность, сохраняя важную информацию. Этот метод стремится преобразовать исходные признаки в новый набор, так называемые главные компоненты, которые ортогональны друг другу и упорядочены по убыванию дисперсии. Это позволяет сохранить максимальное количество информации в первых компонентах, снижая размерность данных, что позволяет эффективно справляться с проблемой «проклятия размерности», сокращая количество признаков и облегчая анализ. Несмотря на вызовы, PCA остается ценным средством в арсенале методов распознавания образов. Анализ главных компонент предоставляет эффективные механизмы для снижения размерности данных и выделения ключевых признаков. Однако, как и у любого метода, у PCA есть свои недостатки, такие как зависимость между признаками, что делает его неэффективным в обработке данных с нелинейными взаимосвязями. Это может привести к потере важной информации в нелинейных структурах данных. Наблюдается также потеря интерпретируемости, то есть главные компоненты, хотя и содержат максимальное значение дисперсии, часто трудно интерпретировать в исходных признаках. Это создает сложности в объяснении смысла каждой компоненты. К тому же, метод PCA чувствителен к

выбросам в данных, что может исказить результаты и привести к неправильной интерпретации структуры данных. У метода РСА не учитывается сложность структуры данных и контекста, что может сделать его недостаточным для задач, где важны зависимости между признаками. Метод может быть использован для анализа и обработки видео данных, например, для распознавания объектов, лиц и жестов. Предположим, у вас есть видео с изображением разных животных: собаки, кошки, зебры и слонов. Вы пытаетесь применить метод PCA для распознавания и классификации этих животных. Однако PCA может столкнуться с вопросом, когда различия между классами (животными) не максимальны в пространстве главных компонент. Например, если все животные на видео находятся в похожих положениях или освещены одинаково (рис. 1). Этот метод может испытать затруднения в разделении классов и правильной классификации. Таким образом, успех применения PCA к видео зависит от природы данных, их структуры и требуемой задачи распознавания или классификации.

Рис. 1. Метод РСА в распознавание животных

В свою очередь, Линейный дискриминантный анализ (LDA) представляет собой эффективный метод в области распознавания образов, направленный на максимизацию различий между классами данных. Суть метода в том, чтобы максимизировать отношение разброса между классами к разбросу объектов внутри классов. [5] Это достигается путем нахождения такой проекции данных, при которой классы становятся максимально разделимыми. В результате LDA генерирует новые признаки, называемые дискриминантами. Метод обеспечивает эффективную классификацию объектов, особенно в сценариях, где классы имеют ярко выраженные различия между объектами внутри отдельных классов и между ними. Данный метод, может быть использован для сокращения размерности данных, сохраняя при этом максимальное количество информации, необходимой для разделения классов. В отличие от PCA, LDA учитывает корреляции между признаками, что делает его более подходящим для некоторых видов данных. Метод LDA также моделирует структуры и взаимосвязи между классами, что позволяет лучше адаптироваться к специфике задач распознавания образов. Как и любой метод распознавания образов, LDA чувствителен к нелинейным зависимостям в данных. Если данные имеют сложные нели-

192

нейные структуры, LDA может оказаться менее эффективным, он чувствителен к выбросам в данных. Наличие выбросов может исказить результаты и привести к некорректному обучению модели. Также метод LDA предполагает, что дисперсии внутри каждого класса в среднем равны. В случае, когда дисперсии существенно различаются, производительность LDA может снизиться. При решении задач многоклассовой классификации, LDA может сталкиваться с проблемой эффективного обучения, особенно в случае большого числа классов. В свою очередь, полученные дискриминанты не всегда обладают прямой интерпретируемостью в терминах оригинальных признаков, что может усложнить анализ результатов.

Использование метода Байесовского классификатора и метода анализа главных компонент по отдельности не является достаточным для эффективного решения задач распознавания образов. Метод Байесовского классификатора сталкивается с ограничениями в предположении о независимости признаков и проблемой «проклятия размерности», в то время как PCA может приводить к потере информации о важных особенностях образов из-за линейных преобразований и сжатия данных. Для улучшения производительности распознавания образов авторами предлагается использовать комбинации различных методов и проводить предварительную обработку данных, с помощью разработанного пошагового алгоритма распознавания образов. Однако, при использовании данных методов в распознавании, появляются естественные и искусственные факторы, такие как, при движении людей в большом скоплении. Ни один из представленных методов по отдельности, не может эффективно произвести распознавание, ввиду большой концентрации объектов. При этом влияет также фактор освещенности и скорость движения объектов.

В своих трудах Яне Б. [15] отмечает основной сложностью в распознавании образов ошибочное распознавание при большой концентрации людей. Для решения отмеченной задачи, авторами был разработан и апробирован новый подход. Его суть в комбинации методов. В рамках его реализации предлагается объединить метод LDA с методом PCA, совместив их с методом Байесовского классификатора и глубоким обучением, поддерживаемый архитектурой сверточных нейронных сетей. При его реализации сначала применяется метод РСА для предварительной обработки данных уменьшив, тем самым, размерность и сохранив ключевые признаки. Такой подход призван снизить влияние шума и улучшить общую производительность. В то же время, использовав метод LDA после метода PCA, можно добиться повышения эффективности классификации. После этого метод LDA позволяет выделить дискриминанты, максимизирующие различия между классами, что особенно полезно в задачах с ярко выраженными классовыми различиями. В свою очередь, внедрение байесовского классификатора предоставляет возможность учесть априорные вероятности и обновить модель на основе новых данных. Это особенно важно в динамических сценариях. Таким образом, преимущество сочетания методов позволяет учесть нелинейные зависимости в данных при интеграции

PCA и LDA, тогда как байесовский классификатор способен работать с неструктурированными данными. Метод PCA может уменьшить влияние шума, а LDA и байесовский классификатор обеспечивают улучшение способности к выделению сигналов относительно шума. Байесовский классификатор обеспечит адаптацию к изменениям в данных, что важно в динамических сценариях, а LDA поможет поддерживать высокую разделимость классов. Предложенный подход на основе сочетания методов, может быть применен в обеспечении общественной безопасности при использовании распознавания образов и поведения человека на видео. [15]

Глубокое обучение, поддерживаемое высокой производительностью сверточных нейронных сетей (CNN), стало центральным элементом в преобразовании области распознавания образов. Такие сети представляют собой архитектуры нейронных сетей, оптимизированные для работы с визуальными данными. Они состоят из слоев, специально разработанных для выделения иерархии признаков на изображениях. Сверточные слои применяют фильтры к входным данным, выделяя локальные структуры и позволяя модели извлекать важные признаки. Пулинг-слои уменьшают размерность данных, поддерживая важные признаки и улучшая вычислительную эффективность. Модели обучаются на больших объемах данных с использованием метода обратного распространения ошибки, что позволяет им автоматически извлекать сложные закономерности.

В настоящее время, CNN демонстрируют очень хорошие результаты в задачах детекции и классификации объектов на изображениях. Свер-точные нейронные сети успешно применяются для пиксельной сегментации, позволяя выделять и классифицировать каждый элемент изображения. Глубокое обучение с CNN обеспечивает также точное распознавание жестов, движений и поз, что полезно в анализе поведения человека.

Основным преимуществом глубокого обучения с CNN является тот факт, что она способна изучать более абстрактные и сложные признаки, что улучшает их способность к распознаванию различных образов. При этом обучение на разнообразных данных делает модели более адаптивными к различным условиям съемки и сценариям. Способность сверточных слоев извлекать пространственные иерархии признаков, позволяет моделям лучше представлять сложные образы.

В настоящий момент, глубокое обучение, базирующееся на свер-точных нейронных сетях, стало ключевым фактором в развитии области распознавания образов. Этот подход открывает новые горизонты в визуальном анализе, предоставляя точные и адаптивные решения для различных задач. Несмотря на ещё существующие сложности, глубокое обучение с CNN остается в центре инноваций в области распознавания образов. формируя будущее визуальных технологий, в связи с этим представим, что у нас есть система видеонаблюдения в общественном месте, таком как вокзал или торговый центр, и мы хотим обнаруживать аномальное поведение, например, оставленные предметы, бегущие люди, длительные остановки и другие подозрительные сценарии.

В условиях динамичного городского окружения обеспечение общественной безопасности становится одним из приоритетных направлений. Технологии распознавания образов в видеопотоках сегодня играют важную роль в создании эффективных систем наблюдения, повышающих уровень безопасности в местах большого скопления людей. Однако, у каждого метода и используемой технологии есть как положительные моменты, так и отрицательные, минимизировать которые можно за счет объединения и взаимодействия методов между собой. Отмеченные выше методы распознавания образов могут быть использованы для выявления необычного или подозрительного поведения, что помогает оперативно реагировать на потенциальные угрозы, а также для точной идентификации индивидов, связанных с преступной деятельностью или разыскиваемых лиц. С использованием этих методов можно анализировать поведение людей в режиме реального времени и выявлять потенциальные угрозы еще до совершения преступления. Эти инновации становятся надежным инструментом для предотвращения преступлений, повышения градуса безопасности и создания комфортной городской среды для всех граждан. В связи с изложенным выше выделим ряд положительных и отрицательных результатов совместного использования метода LDA с методами глубокого обучения в задаче распознавания поведения человека на видео с целью обеспечения общественной безопасности. Они представлены в таблице № 1.

Таблица 1

Сравнительный анализ результатов использования методов_

Положительные: Отрицательные:

Линейный дискриминантный анализ Простота и эффективность Предполагает линейные зависимости в данных.

Уменьшает размерность данных, удаляя избыточность. Подходит для линейно разделимых данных.

Позволяет интерпретировать важность признаков Может быть менее эффективен при сложных структурах данных.

Глубокое обучение Способен извлекать сложные, нелинейные зависимости Требует большого объема данных для обучения.

Сверточные нейронные сети могут автоматически извлекать высокоуровневые признаки Требует значительные вычислительные ресурсы.

Сочетание LDA и глубокого обучения Комбинирование линейных и нелинейных признаков Требует внимательной настройки и оптимизации.

Улучшенная обобщающая способность (Может увеличить способность модели обобщать на новые сценарии) Потребность в большом объеме данных для обучения.

Повышение точности распознавания Усложнение процесса разработки и внедрения

Для минимизации отрицательных характеристик каждого из методов, связанных с ошибками при распознавании образов из-за выделенных ошибок, путём использования программы, которая планируется в среде Python, попробуем оценить возможность минимизации недочетов и коллизий

195

в вопросах распознавания поведения человека на видео. Для устранения выявленных недочетов, планируется использовать среду программирования Python. Планируется подключить готовые библиотеки распознавания на основе нейронных сетей «scikit-learn» для LDA и «tensorflow» для глубокого обучения на базе сверточной нейронной сети. Далее в процессе реализации, разобьем задачи распознавания образов на шаги, выходным результатом будет, программный продукт способный распознавать объекты и их девиантное поведение по разработанной нами градационной шкале.

Шаг 1: Получение видеоданных: захватывается видеопоток с камер наблюдения в реальном времени.

Шаг 2: Предобработка видеоданных: выполняется предварительная обработка видеоданных, а именно - определяется область на видео, лиц осуществляющих движение покадрово, тем самым предоставляется возможность количественно определить масштаб распознавания; выделяются люди, отслеживается их движения и приведение к стандартизированному формату, проанализировав количество людей в покадровом видео, можно будет записать в файл количество людей через определённый интервал времени на выделенную область. Выбор архитектуры напрямую зависит от обрабатываемого видео, если высокого разрешение видео и силуэт людей четко распознаваем, то можно применять архитектуру нейронной сети «yolov3 - tiny».

Шаг 3: Извлечение признаков с помощью LDA: применяем LDA для извлечения линейных комбинаций признаков, которые наилучшим образом разделяют классы допустимого и аномального поведения. Можно использовать, например, координаты движения, скорость, направление и другие характеристики.

Шаг 4: Применение глубокого обучения для извлечения высокоуровневых признаков: обучаем глубокую нейронную сеть (например, рекуррентную нейронную сеть или сверточную нейронную сеть) на последовательности видеокадров для извлечения более сложных пространственно-временных признаков.

Шаг 5: Обучение комбинированной модели: объединяем результаты LDA и высокоуровневых признаков из глубокого обучения. можно использовать многоклассовую классификацию или обучение с учителем для аномалий.

Шаг 6: Обнаружение аномалий: после обучения модели на данных обычного поведения, система может автоматически обнаруживать аномалии на видео, выделяя сцены или моменты, несоответствующие обычному паттерну поведения.

Шаг 7: Выделение некоего значения от 0 до 1, в котором 0 соответствует значению спокойного поведения, значение 1 соответствует значению аномального (девиантного) поведения объекта. Чем значение ближе к 1, тем более аномальным считается поведение.

Мы предлагаем метод, который может обнаруживать специфические формы поведения людей, такие как бег и встречи, даже в многолюд-

ных кадрах. Несмотря на то, что отслеживание каждого объекта, на котором находятся люди, является сложной задачей, можно было бы определить конкретное поведение человека путем поиска определенного уникального значения признака из основных нормальных значений признаков. Мы использовали траекторию движущегося человека, потому что она содержит много информации о поведении человека, такой как скорость или пройденное расстояние. Основной проблемой в технологии распознавания поведения человека при использование стандартных методов заключалась в том, что они не могут распознавать поведение человека на основе его траектории в группах людей, там, где очень большая активность и большой трафик. Так, в тестовом варианте применения нашего алгоритма, нам удалось достичь результата выделения объектов и описания их поведения, путем анализа их позы на снимке и манеры передвижения, с результатом их возможного нетривиального поведение от 0 до 1. (рис. 2.) Наш алгоритм распознал объекты на кадре, как мы можем видеть, объекты которые находятся в пред недвижимом состоянии, имеют значение близкое к «0», а объекты которые идут в ускоренном темпе, тем самым развили скорость и показывают свое некое отклонение от нормального значения, имеют показатель близкий к «1».

Рис. 2. Выделение объектов и характера их передвижения

Реализовав с помощью предложенного метода LDA с методами глубокого обучения на практике, в качестве вспомогательного инструмента распознавания поведения человека на видео, мы смогли выделить ряд положительных моментов:

1. Нам удастся повысить эффективность извлечения высокоуровневых признаков из видеоданных, путем покадрового разделения видеоданных.

2. Путем выделения типовых манер поведений людей, получится автоматически выделять различные шаблоны поведения, от простых движений до более сложных действий, таким образом получится сократить время обработки распознавания движения.

3. Комбинация LDA с методами глубокого обучения поможет привести к улучшению точности классификации поведения человека на видео. Это связано с тем, что LDA помогает выделить наиболее информативные признаки из выходов глубоких нейронных сетей.

4. Комбинация LDA с глубоким обучением позволит создать модель, адаптированная к различным сценариям поведения, обеспечив высокую степень гибкости и способность работать с разнообразными данными.

Таким образом, наш алгоритм может определять специфическое поведение путем анализа сходства каждого конкретного поведения с эталонной траекторией в пространстве признаков траектории. Десятимерные объекты были извлечены из траектории с помощью РСА, чтобы создать пространство объектов. Благодаря пространству признаков предложенный нами метод, сможет чувствительно обнаруживать конкретное поведение на основе небольшого количества данных. Большинство этих так называемых ложных обнаружений отклоняются процессом проверки. Преимущества нашего подхода, заключается в том, что есть возможность учесть как линейные зависимости, извлеченные LDA, так и сложные пространственно-временные зависимости, извлеченные глубоким обучением. Комбинирование методов увеличивает способность модели к обобщению на различные сценарии аномального поведения. Система сможет обучаться на данных обычного поведения и автоматически обнаруживать аномалии без необходимости ручной настройки.

Приведенная интеграция демонстрирует, как комбинированный подход с использованием LDA и глубокого обучения сможет повысить эффективность в задаче распознавания аномального поведения на видео. Такая система может быть важным элементом в системах обеспечения общественной безопасности и видеонаблюдения.

В конечном итоге, выбор между LDA, глубоким обучением или их комбинацией зависит от конкретных потребностей, объема данных и доступности ресурсов. С учетом экспертной оценки можно принять информированное решение о выборе метода или их сочетании для конкретной задачи распознавания поведения человека на видео. В последнее десятилетие распознавание поведения человека на видео стало важным направлением исследований, обеспечивая продвинутые системы безопасности и интеллектуальные технологии. Эксперты выделяют, что сценарии в реальной жизни могут быть чрезвычайно разнообразными. Комбинированный подход обеспечивает необходимую гибкость для адаптации к различным условиям, что часто бывает сложно для одиночных методов. Эксперты компании КТесКЬаЬ отмечают, что LDA может быть эффективным в выделении ключевых признаков и снижении размерности данных. Этот метод полезен для предварительной обработки видеоданных и выделения важных характеристик. Глубокие нейронные сети считаются мощным инструментом для моделирования сложных пространственных и временных зависимостей в данных. Яне Б. подчеркивает, что использование глубокого обучения дополняет анализ, обогащая его контекстом. [15] Эксперименты

с реальными видеоданными показывают, что комбинированный метод, включая LDA и глубокое обучение, превосходит по точности и эффективности использование отдельных методов. Этот вывод подкреплен результатами, демонстрирующими превосходство комбинации при решении разнообразных задач. Яне Б. обсуждает важность повышения робастности системы распознавания поведения. Комбинированный подход позволяет создавать более устойчивые системы, способные успешно справляться с динамичностью сценариев. [15]

Комбинация метода LDA с методами глубокого обучения в распознавании поведения человека на видео представляет собой мощный и перспективный подход, который может привести к значительному улучшению точности и интерпретируемости моделей. Использование глубокого обучения позволяет эффективно извлекать сложные признаки из видеоданных, что особенно важно для выделения характерных образов поведения. Глубокие нейронные сети могут обучаться на больших объемах данных и автоматически выявлять различные шаблоны поведения, что делает их мощным инструментом для распознавания сложных сценариев. Однако глубокое обучение имеет свои ограничения, такие как склонность к переобучению и сложность интерпретации результатов. В этом контексте LDA может стать ценным дополнением, позволяя уменьшить размерность данных и выделить наиболее информативные признаки. Благодаря своей интерпретируемости LDA позволяет лучше понять, какие аспекты поведения оказывают наибольшее влияние на классификацию.

Комбинирование этих двух методов позволяет совместить преимущества глубокого обучения и LDA. Глубокие нейронные сети выделяют сложные шаблоны поведения, в то время как LDA улучшает обобщающую способность модели, что делает ее менее склонной к переобучению и позволяет лучше понять причины классификации. Однако, несмотря на перспективы, существуют вызовы, требующие внимательного рассмотрения. Требования к вычислительным ресурсам, необходимость обучения на больших объемах данных и настройка гиперпараметров могут представлять собой значительные задачи в практической реализации. Гибкость, предоставляемая комбинированным подходом, а также синергия между методами, делают его предпочтительным решением в разнообразных условиях. Эксперты, анализировавшие наш алгоритм, выражают уверенность в том, что такой подход способствует более точному, эффективному и надежному анализу поведения человека, что является важным элементом в сфере безопасности, видеонаблюдения и психологических исследований.

В целом, использование совмещенного метода LDA и глубокого обучения в распознавании поведения человека на видео представляет собой перспективное решение, способное повысить эффективность систем видеомониторинга и безопасности. Это также подчеркивает важность интеграции различных методологий для создания более надежных и точных систем распознавания поведения на основе видеоаналитики.

Список литературы

1. Sochman J. AdaBoost with totally corrective updates for fast face detection [Electronic resource] / J. Sochman, J. Matas // Center for Machine Perception, Czech Technical University, Prague.

2. Viola P., Jones M. Robust Real-Time Object Detection: tech. report. Cambridge. 2021. 320 p.

3. Воронцов К.В. Комбинаторные оценки качества обучения по прецедентам // Доклады РАН. 2004. Т. 394. №2. С. 175-178.

4. Галеев С.Ф. Модификация алгоритма Виолы-Джонса для распознавания лиц в режиме реального времени // Современная техника и технологии. 2017. No 5. [Электронный ресурс] URL: http://technology.snauka.ru/2017/05/13529 (дата обращения: 10.06.2024).

5. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2015. 1007 с.

6. Заенцев И.В. Нейронные сети. Основные модели. Воронеж: ВГУ, 1999. 76 с.

7. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия - Телеком, 2022. 382 с.

8. Мерков А.Б. Распознавание образов. Введение в методы статистического обучения. М.: Едиториал УРСС. 2011. Т. 256.

9. Мокшин В.В. и др. Распознавание образов транспортных средств на основе эвристических данных и машинного обучения // Вестник Казанского технологического университета. 2022. Т. 19. №. 5.

10. Таранян А.Р. Обучение классификатора Виолы-Джонса для локализации автомобильных номерных знаков // Молодежный научно-технический вестник. 2014. No 11. [Электронный ресурс] URL: http://sntbul.bmstu.ru/doc/739653.html (дата обращения: 10.06.2024).

11. Дж. Ту, Гонсалес Р. Принципы распознавания образов. М.: Мир, 1978. 412 с.

12. Шапиро Л., Стокман Дж. Компьютерное зрение. М.: Бином. Лаборатория знаний, 2016. 752 с.

13. Шурыгин А.М. Прикладная стохастика: робастность, оценивание, прогноз. М.: Финансы и статистика, 2020.

14. Южаков Г. Расширенный набор характеристик Хаара // Научное сообщество GraphiCon. [Электронный ресурс] URL: http://www.graphicon.ru/html/2012/conference/RU2%20-

%20Visi/gc2012yuzhakov.pdf (дата обращения: 13.03.2024).

15. Яне Б. Цифровая обработка изображений. М.: Техносфера, 2017.

584 с.

Гавриленко Наталья Геннадьевна, д-р экон. наук, профессор, Россия, Омск, Сибирский государственный автомобильно-дорожный университет,

Заворовский Иван Алексеевич, аспирант, паУ1-27@уапёех.ги, Россия, Омск, Сибирский государственный автомобильно-дорожный университет

ADAPTA TION OF PATTERN RECOGNITION THEORY METHODS IN SOLVING PROBLEMS OF HUMAN BEHAVIOR ANALYSIS

N.G. Gavrilenko, I.A. Zavorovsky

The article discusses principal component analysis, linear discriminant analysis, and the convolutional neural network method, with a rationale for the advantages of each method, as well as their disadvantages, in solving problems of human behavior analysis. The authors propose combining the methods of principal component analysis, linear discriminant analysis, and convolutional neural networks, which are a powerful tool that allows you to eliminate the disadvantages of each of these methods individually. This combination provides more accurate and effective pattern recognition in various fields, such as computer vision and human behavior recognition both in real time and on video.

Key words: artificial intelligence, machine learning, pattern recognition, public safety, expert, deep learning, human behavior.

Gavrilenko Natalia Gennadyevna, doctor of economics sciences, professor, Russia, Omsk, Siberian State Automobile and Highway University,

Zavorovsky Ivan Alekseevich, postgraduate, [email protected], Russian Federation, Omsk, Siberian State Automobile and Road University

УДК 535.346.1:681.7

DOI: 10.24412/2071-6168-2025-1-201-202

ПРИМЕНЕНИЕ ЧАСТИЧНО КОГЕРЕНТНОГО ИЗЛУЧЕНИЯ В ИНТЕРФЕРЕНЦИОННОМ УСТРОЙСТВЕ ДЛЯ КОНТРОЛЯ РАБОЧЕЙ ПОВЕРХНОСТИ ПОЛИРОВОЧНОГО МАТЕРИАЛА

ОПТИЧЕСКИХ ИЗДЕЛИЙ

Е.Е. Майоров, В.В. Курлов, А.В. Арефьев, В.П. Пушкина

Работа посвящена применению частично когерентного излучения в исследовании материалов для полировки оптических поверхностей. В оптическом приборостроении этот метод позволяет оценить не только гладкость поверхностей, качество полировки материала, но и определить уровень износа рабочих поверхностей устройств для обработки оптических изделий, поэтому работа актуальна и перспективна. В работе поставлена цель, задача исследования и определены метод и объект исследования. Приведены внешние виды измерительной установки, измеряемых поверхностей, а также полировочного устройства оптических поверхностей. Получены микрорельефы исследуемых поверхностей и результаты измерений расстояния до поверхности при движении в направлении оси OX и OY. Подтверждено, что отличия микрорельефов поверхностей незначительны, поэтому данные поверхности целесообразно использовать для полировки оптических деталей.

Ключевые слова: оптическая поверхность, интерферометрия, полиэтиленте-рефталата, металлический щуп, фотоприёмный блок, опорное зеркало, ветви интерферометра.

Развитие методов и технических средств оптического контроля с необходимостью обуславливает совершенствование оптико-физических

i Надоели баннеры? Вы всегда можете отключить рекламу.