Научная статья на тему 'Стохастическое распознавание пространственных объектов: сканирование и автоматическая генерация признаков'

Стохастическое распознавание пространственных объектов: сканирование и автоматическая генерация признаков Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
94
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
3D-ИЗОБРАЖЕНИЕ / СТОХАСТИЧЕСКОЕ СКАНИРОВАНИЕ / ГИПЕРТРЕЙС-ПЕРОБРАЗОВАНИЕ / ГИПЕРТРИПЛЕТНЫЙ ПРИЗНАК / ОПОРНАЯ СЕТКА НА СФЕРЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Сёмов А. А.

В статье даётся описание нового геометрического метода распознавания пространственных изображений (гипертрейс-преобразование). Анализируется стохастический способ сканирования 3D изображений. Описываются практические моменты реализации такого сканирования и его связи с опорными сетками на сфере. Обосновывается необходимость равномерного распределения точек такой сетки на сфере. Приводится математическая модель нового типа признаков 3D изображений, имеющих аналитическую структуру, гипертриплетные признаки. Благодаря их аналитической структуре возможна автоматическая генерация большого количества признаков с заранее заданными свойствами, в частности, инвариантности и сенситивности по отношению к группе движений и масштабным преобразованиям. Рассматриваются аспекты автоматической генерации конструируемых признаков 3D изображений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Сёмов А. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Стохастическое распознавание пространственных объектов: сканирование и автоматическая генерация признаков»

Проведенное компьютерное моделирование позволяет сделать следующие выводы:

1. Предложенная модификация пчелиного алгоритма ABC позволяет решать задачу размещения базовых станций.

2. Для задач малой и средней размерности результаты пчелиного алгоритма совпадают с результатами метода полного перебора. При этом предложенный метод решает задачу на много порядков быстрее, чем точный метод ПП.

ЛИТЕРАТУРА

1. Надейкина Л. А., Черкасова Н. И. Проблема отказа доступа к сетевым сервисам // Труды международного симпозиума Надежность и качество. - 2015. - Т. 1. - С. 258-261.

2. Скаков Е. С., Малыш В. Н. Алгоритм имитации отжига в задаче оптимизации размещения базовых станций // Системы управления и информационные технологии. — 2015. - № 2, Т. 60. - С. 90-94.

3. Малыш В. Н, Скаков Е. С. Имитация беспроводной сети передачи данных // Труды международного симпозиума Надежность и качество. - 2014. - Т. 1. - С. 312-314.

4. Скаков Е. С., Малыш В. Н. Использование алгоритмов мультистарта и поиска с запретами для решения задачи размещения базовых станций // Информационно-управляющие системы. - 2015. - № 3, Т. 76. - С. 99-106.

5. Karaboga D., Basturk B. A Powerful and Efficient Algorithm for Numerical Function Optimization: Artificial Bee Colony (ABC) Algorithm // Journal of Global Optimization. - 2007. - № 3, Т. 39. - С. 459-471.

6. Гришин А. А., Карпенко А. П. Исследование эффективности метода пчелиного роя в задаче глобальной оптимизации // Наука и образование: электронное научно-техническое издание. - 2010. - № 8.

7. Karaboga D., Akay B. A Survey: Algorithms Simulating Bee Swarm Intelligence // Artificial

Intelligence Review. - 2009. - № 1-4, Т. 31. - С. 61-85.

УДК 004.93 Сёмов А.А.

ООО «Комэрф», Пенза, Россия

СТОХАСТИЧЕСКОЕ РАСПОЗНАВАНИЕ ПРОСТРАНСТВЕННЫХ ОБЪЕКТОВ: СКАНИРОВАНИЕ И АВТОМАТИЧЕСКАЯ ГЕНЕРАЦИЯ ПРИЗНАКОВ

В статье даётся описание нового геометрического метода распознавания пространственных изображений (гипертрейс-преобра-зование). Анализируется стохастический способ сканирования 3D изображений. Описываются практические моменты реализации такого сканирования и его связи с опорными сетками на сфере. Обосновывается необходимость равномерного распределения точек такой сетки на сфере. Приводится математическая модель нового типа признаков 3D изображений, имеющих аналитическую структуру, — гипертриплетные признаки. Благодаря их аналитической структуре возможна автоматическая генерация большого количества признаков с заранее заданными свойствами, в частности, инвариантности и сенситивности по отношению к группе движений и масштабным преобразованиям. Рассматриваются аспекты автоматической генерации конструируемых признаков 3D изображений.

Ключевые слова:

3D изображение, стохастическое знак, опорная сетка на сфере.

сканирование, гипертрейс-перобразование, гипертриплетный при-

Введение

Одной из центральных проблем современной информатики является анализ и распознавание трехмерных (далее 3D) изображений. По сравнению с двумерными (далее 2D) изображениями они точнее описывают форму и свойства объектов, полнее отражают информацию об изменениях объектов с течением времени [1, 2].

Сканирование со случайными параметрами улучшает соотношение «надежность - быстродействие» распознавания 3D изображений по сравнению с детерминированным сканированием, что было показано в [3].

В статье дается подробное описание стохастического способа сканирования 3D изображений и рассматриваются аспекты автоматической генерации их признаков.

Математическое описание гипертрейс-преобра-зования

Пусть F - исходная трехмерная модель. Определим плоскость В(^, г)=|х | X = как касательную к сфере c центром в начале координат и с радиусом r в точке (п, r), где ?/ = [cosp-sin С,sin р• sin O,cosc] - единичный вектор в R3, r, со и ф - сферические координаты. Сканирование пространственного изображения будет осуществляться сеткой параллельных плоскостей [4].

Взаимное положение 3D объекта F и каждой сканирующей плоскости В(^(с,р), f) характеризуют числом G по некоторому правилу HyperT: G = Hypef[(F П В(^( С,р),f)) . В качестве указанной характеристики могут выступать, например, площадь сечения. Т.к. число G зависит от трех параметров со, ф и r, то множество этих чисел формирует гипертрейс-матрицу 3TM, у которой ось 0с направлена горизонтально, ось 0ф - вертикально, ось 0r - вглубь. Далее, при помощи функционалов HyperP, HyperQ и HyperG обрабатываются строки матрицы, в результате чего она сворачивает в число Res(F) - признак исходного 3D изображения [5]:

= Иурег© о ИурепО. о ИурегР о НурегТ(^5есг)

Признаки получившихся в сечении фигур ГБеоЬ извлекаются при помощи 2D трейс-преобразования, введённого Н.Г. Федотовым.

Сканирование получаемых в сечение фигур ГБеоЬ осуществляется сеткой параллельных прямых ¡(в, р) с расстоянием Ар между линиями под всеми углами наклона прямых в в плоскости сечения [6], где в,р- полярные координаты прямой в плоскости сечения.

Взаимное положение изображения ГБеоЬ и каждой сканирующей линии ¡(в,р) характеризуется числом, вычисляемым по правилу Т: §(в,р) = Т(р§ес П¡(в,р)) • В качестве указанной характеристики может выступать, например, длина пересечения прямой 2D изображения сечения. Т.к. число д зависит от двух параметров 6 и р, то множество этих чисел формирует трейс-матрицу ТМ, у которой ось 0 6 направлена горизонтально, ось 0р - вертикально. Далее, при помощи функционалов Р и & обрабатываются строки матрицы, в результате чего она сворачивает в число П(рдес) - признак 2D изображения сечения [7]:

НурегТЕ.ей) = П(Е,е*) = © ° Р ° Т(Рдей П ¡(в, р)) ,

Стандартный перебор всех углов о и ф, которыми идентифицируется каждая сканирующая сетка параллельных плоскостей, в топологическом смысле для непрерывного случая дает модель концентрических сфер с центром в начале координат.

Каждой сканирующей сетке параллельных плоскостей на единичной сфере сопоставим точку, которая будет являться точкой касания со сферой плоскости, параллельной плоскостям данной сетки (отдельно для каждой пары (о, ф) углов обзора). Множество точек на сфере образуют сетку, которую будем называть опорной (рис. 1). Стоит отметить, что углы о и ф нужно изменять непроизвольным образом, а согласно построенной опорной сетке на сфере [8].

Рисунок 1 - Опорная сетка на сфере

Стохастическое сканирование гипертрейс-пре-образования

Сканирование исходного пространственного объекта F осуществляется сеткой параллельных плоскостей под разными углами обзора (о, ф) объекта со всех сторон. Детерминированный вариант данного сканирования заключается в одинаковом расстоянии Лг между плоскостями, тогда как для стохастического сканирования расстояние между плоскостями имеют случайное равномерное распределение внутри границ сканирования [9].

При проектировании распознающих систем используются дискретные представления переменных со, ф и г. Соответственно параметры сканирующих плоскостей образуют три множества:

Ш2, ®mЬ К %} , ^ rl} •

Детерминированное сканирование позволяет однозначно определить каждый элемент матрицы 3ТМ. Так, тройке (ci, фj, rk) соответствует элемент матрицы с номером (i, j, k) и значением HyperT(F П В(^(щ ,фу ),r )) , который характеризует информативный признак фигуры, полученной в сечении объекта F плоскостью При

применении стохастического сканирования на множествах M1, M2, M3 задаются вероятностные распределения:

М1 = W®^ Р2(®j Pm(®)} ,

M2 = {ql(p), 42 (p), - - , qn (p)}, M3 ={sl(r), s2(r),-.,s1 (r)} ,

2 Pi (а)=1, 2 qj (p)=1

2 Sk (r ) = 1 •

Pi ' qj ' sk и ЗТМг, j k = 0 с веро

ятностью

1 — Pi • qj • sk

друга (отсутствие совместных и попарных произведений вероятностей), что объясняется изначальным независимым заданием распределений на множествах M1, M2, M3 в связи с раздельной последовательной обработкой строк и столбцов матрицы 3ТМ функционалами HyperP, HyperQ и Hyper@ соответственно. Аналогичное замечание имеет место и для трейс-матрицы.

Однако, инвариантность к повороту на сфере отличается от инвариантности к повороту на плоскости, т.к. например, равномерные сетки, построенные на этих двух поверхностях, неизометричны. Рассмотрим следующую стохастическую реализацию предлагаемого метода.

Осуществлять сканирование будем плоскостями в пределах размеров исходного пространственного объекта. Данный выбор оправдан тем, что в этом случае заметно экономится время реализации сканирования, т.к. не требуется производить лишние "пустые" сканирования, когда сканирующая плоскость не пересекает исходный пространственный объект.

Пусть переменные заданы на отрезках 0 <Ф< 2л , 0<ф<2л , min <г <max и имеют равномерное распределение:

f.W=í ¿x е[0,2ж]

I 0, x « [О, 2ж]

fp(*H2*

I 0, x

-P, x e[0, 2ж] « [0, 2ж]

fr (x)=>

———, x e [min, max]

max— min

0, x « [min, max]

Выбирая параметры сканирования случайным образом на основе заданных распределений, получаем матрицу случайных величин ЭТМг, где

ЪТМг^ у ¡^ - Hyper п ,фу ),г )) с вероятностью

Аналогичное свойство имеет место и для трейс-матриц ТМ в плоскости сечения Fsect. Паре (6í, pj) соответствует элемент матрицы ТМ с номером

( i г 3 ) и значением т(^5ес I п / (в , Ру )) , который характеризует признак пересечения изображения Fsect и сканирующей прямой /(&■,Ру) [10-11]. При стохастическом сканировании будем иметь:

N1 = к(в), х2(в), ..., х( (0)} , N2 = ^1^ У2^ Уw (Р)} ,

2 X (в)-1, X у у (р)- 1 •

■ у

Выбирая параметры сканирования случайным образом на основе заданных распределений, получаем матрицу случайных величин ТМг, где

ТМг у k - Т(^ес I П /&,Ру )) с вероятностью Х| • Уу и

ТМг у k = 0 с вероятностью 1 — Х^ • у у .

Как видно из рассуждений приведённых выше,

вероятности р(^) , $(<р) и ^(г) независимы друг от

где min (max) - наименьшее (наибольшее) расстояние от начала координат до сканирующей плоскости, касающейся исходный пространственный объект в одной точке. Данное расстояние вычисляется среди всех возможных расстояний, вычисленных под разными углами сканирования исходного 3D изображения. Если min = 0, то начало координат находится в пределах анализируемого пространственного объекта (внутри или на его поверхности).

Технически данная процедура реализуется просто. Достаточно найти границы множества Var скалярного произведения вектора нормали сканирующей плоскости с векторами, имеющими начало в точке (0; 0; 0) и конец в одной из вершин исходного 3D объекта (рассматривается стандартное задание пространственного объекта в виде полигональной сетки его поверхности): for i е 1.. Row Vix

var¡ ^ a-Vixi? 1 + b-Vix¡? 2 + c-Vixi?3

где ja; b; c} - координаты вектора нормали сканирующей плоскости, Vix - массив вершин исходного объекта, RowVix - число строк матрицы Vix ( количество вершин объекта), строки матрицы обозначают пространственные декартовы координаты вершин.

В зависимости от расположения начала координат относительно исходного пространственного объекта будем иметь:

1. если для Vi будет vai¿ > 0 (начало координат находится вне объекта), то min = min (vaijj и

(vari) ;

max = maxi

2. если 3i такое, что var¿ < 0 (начало координат находится внутри объекта или на его поверхности), то min = 0 и max = max(var¿|) .

i

Отметим следующий факт. Если каждой сканирующей плоскости сопоставить точку (p-; qj; s^ j в координатной системе с тремя взаимно перпендикулярными осями 0р, 0q и 0s, то множество данных точек образует почти равномерно заполненную 3D фигуру - параллелепипед V (в силу случайного бросания точки). Поворот объекта в пространстве равнозначен повороту данного параллелепипеда, т.к. если зафиксировать сканирующую плоскость,

k

то ей будут соответствовать разные сечения для наиболее информативные среди них. Математическое

исходного и повернутого объекта. Поэтому чтобы описание данной процедуры можно найти в [13]. вычисление признака не зависело от поворота ис- Организовать обработку строк и столбцов мат-

ходного 3D изображения, необходимо, чтобы мно- рицы 3ТМ можно в виде дерева, когда для одного

жество точек У совпадало само с собой при их типа функционала HyperP последовательно вычис-

вращении. ляются все типы функционалов HyperQ, для каждого

Если взять только один срез (например, для из которых последовательно вычисляются все типы

r = 1 для каждого угла сканирования 3D изобра- функционалов HyperQ. Применение такой вычисли-

жения), то множество данных точек У образуют тельной схемы позволяет ускорить вычисление при-

дискретно заполненную сферу, откуда и получается знаков в несколько раз. понятие опорной сетки на сфере). Как видно из Заключение

рассуждений, такая сетка должна иметь равномер- Построен новый тип признаков 3D изображений,

ное распределение точек на сфере, чтобы при вра- имеющих аналитическую структуру, - гипертриплет-

щении она совмещалась с собой (дискретный шаг ные признаки. Благодаря их аналитической струк-

игнорируется). Более подробно описание можно туре возможна автоматическая генерация большого

найти в исследованиях [7, 12]. количества признаков с заранее заданными свой-

Автоматическая генерация признаков 3D изоб- ствами, в частности, инвариантности и сенситив-

ражения ности по отношению к группе движений и масштаб-

Функционалы, входящие в аналитическую струк- ным преобразованиям. туру признака, могут обладать разными свой- На основе результатов исследования разрабо-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ствами. Варьируя различные их виды, можно полу- таны программные комплексы по сканированию и

чать большое количество признаков с заранее за- распознаванию 3D изображений (свидетельства об

данными свойствами исходного 3D изображения. официальной регистрации программ для ЭВМ в Роспа-

Предлагаемый метод позволяет автоматически тенте № 2015612257 от 16.02.15 и № 2015612814 от

генерировать большое количество признаков 3D 26.02.15), которые позволяют повысить качество

изображения. Сформированная таким образом си- распознавания пространственных объектов в систе-

стема признаков, как правило, избыточна. Поэтому мах машинного зрения [14-15].

целесообразно разработать процедуру, которая ми- Работа выполнена при поддержке гранта РФФИ

нимизирует количество признаков и выделяет (проект №15-07-04 4 8 4).

ЛИТЕРАТУРА

1. Liu, K. Rotation-invariant HOG descriptors using fourier analysis in polar and spherical coordinates [Text] / K. Liu, H. Skibbe, T. Schmidt, T. Blein, K. Palme, T. Brox, O. Ronneberger // International Journal of Computer Vision, 2014. - Vol. 106. - Issue 3. - pp. 342-364.

2. Kiy, K.I. Segmentation and detection of contrast objects and their application in robot navigation [Text] / K.I. Kiy // Pattern Recognition and Image Analysis. Advances in Mathematical Theory and Applications. - 2015. - Vol. 25. - No. 2. - P. 338-346.

3. Федотов, Н.Г. Теория признаков распознавания образов на основе стохастической геометрии и функционального анализа [Текст] / Н.Г. Федотов. - М.: ФИЗМАТЛИТ, 2009. - 304 C.

4. Семов А.А. Об одном подходе к распознаванию ЗD-изображений / Надежность и качество: труды Международного симпозиума, под ред. Н.К. Юркова. - Пенза, Изд-во ПГУ. - 2013. - Т. 1. - С. 350351.

5. Fedotov, N.G. Trace transform of three-dimensional objects: recognition, analysis and database search [Text] / N.G. Fedotov, S.V. Ryndina, А.А. Semov // Pattern Recognition and Image Analysis. Advances in Mathematical Theory and Applications. - 2014. - Vol. 24. - No. 4. - Moscow: Pleiades Publishing, Ltd. - P. 566-574.

6. Fedotov, N.G. The Theory of Image-Recognition Features Based on Stochastic Geometry [Text] / N.G. Fedotov // Pattern Recognition and Image Analysis. Advances in Mathematical Theory and Applications. -1998. - V. 8. - № 2. - Moscow: Pleiades Publishing, Ltd. - P. 264-266.

7. Федотов, Н.Г. Анализ свойств триплетных признаков распознавания при различных вариантах сканирования изображений [Текст] / Н.Г. Федотов / Надежность и качество: труды Международного симпозиума, под ред. Н.К. Юркова. - Пенза, Изд-во ПГУ. - 2013. - Т. 1. - С. 80-82.

8. Fedotov, N.G. Trace transform of spatial images [Text] / N.G. Fedotov, S.V. Ryndina, А.А. Syemov / 11th International conference on Pattern Recognition and Image Analasis: New Information technologies (PRIA-11-2013). Conference Proceedings (V. I-II). - Samara: IPSI RAS, 2013. -V. 1. - P. 186-189.

9. Сёмов, А.А. Различные виды пространственного сканирования 3D изображений [Текст] / А.А. Сёмов // Надежность и качество: труды Международного симпозиума. - 2015. - Т. 2. - Пенза: ПГУ. - С. 150153.

10. Fedotov, N.G. Recognition of halftone textures from the standpoint of stochastic geometry and functional analysis [Text] / N.G. Fedotov, D.A. Mokshanina // Pattern Recognition and Image Analysis, Advances in Mathematical Theory and Applications. - 2010. - Vol. 20. - No. 4. - Moscow: Pleiades Publishing, Ltd. - P. 551-556.

11. Fedotov, N.G. Recognition of images with complex half-tone texture / N.G. Fedotov, D.A. Mokshanina [Text] // Measurement Techniques. - 2011. - Vol. 53. - № 11. - P. 1226-1232.

12. Fedotov, N.G. Trace transform of three-dimensional objects: recognition, analysis and database search [Text] / N.G. Fedotov, S.V. Ryndina, А.А. Semov // Pattern Recognition and Image Analysis. Advances in Mathematical Theory and Applications. - 2014. - Vol. 24. - No. 4. - Moscow: Pleiades Publishing, Ltd. - P. 566-574.

13. Федотов, Н.Г. Минимизация признакового пространства распознавания 3D изображения на основе стохастической геометрии и функционального анализа [Текст] / Н.Г. Федотов, А.А. Семов, А.В. Моисеев // Машинное обучение и анализ данных. - 2015. -T. 1. - №13. - Электронный журнал. - Издательство: Вычислительный центр им. А.А. Дородницына РАН (Москва). - C. 1796-1814.

14. Свидетельство об официальной регистрации программ для ЭВМ № 2015612257 Роспатента от 16.02.15. Программный комплекс анализа и распознавания 3D изображений на основе пространственного трейс-преобразования со случайными параметрами сканирования / Н. Г. Федотов, А. А. Сёмов.

15. Свидетельство об официальной регистрации программ для ЭВМ № 2015612814 Роспатента от 26.02.15. Программный комплекс анализа и распознавания 3D изображений на основе пространственного трейс-преобразования с детерминированными параметрами сканирования / А. А. Сёмов.

i Надоели баннеры? Вы всегда можете отключить рекламу.