УДК 681.007.05
ВОПРОСЫ НОРМАЛИЗАЦИИ ИЗОБРАЖЕНИЙ ПРИ ПРОЕКТИВНЫХ ПРЕОБРАЗОВАНИЯХ
ПЕЧЕНАЯ Е.М., ПРОКОПЕНКО Д.О., ПУТЯТИН Е.П.
Предложено несколько наиболее известных и широко разрабатываемых методов нормализации проективных преобразований. Дана критическая оценка этих методов и результатов их использования, подчеркнута необходимость найти более простой и универсальный метод нормализации группы проективных преобразований. С этой целью введены методология разложения группы проективных преобразований на подгруппы и приведена геометрическая интерпретация одного из указанных разложений.
Введение
В настоящее время остро стоит проблема разработки универсального алгоритма для решения задачи приведения полученного в реальных условиях изображения движущегося или стационарного объекта к некоторому эталону в целях его дальнейшего распоз -навания. Полученное таким образом изображение подвергается различным геометрическим деформациям, наиболее адекватной математической моделью которых является группа проективных преобразований. Из-за сложного вида таких преобразований и невозможности машинной реализации разрабатываемых алгоритмов вместо девятипараметрических проективных искажений, как правило, рассматривают только аффинную группу преобразований, определяемую шестью параметрами. Такой подход недостаточно эффективен, а высокая доля ошибки в приближениях не всегда приемлема при решении современных задач отслеживания движущегося объекта, роботизации процесса сборки деталей или обеспечения процесса стыковки самолетов и космических кораблей. Требуется разработка универсального алгоритма нормализации проективных преобразований, а также основных подгрупп проективной группы — ортогональных проективных преобразований и преобразований перспективы.
В первом и втором разделах кратко изложены наиболее интересные из известных нам алгоритмов нормализации проективных преобразований. Исследованы слабые и сильные стороны алгоритмов, приведен анализ результатов их работы с точки зрения решения проблем, указанных выше.
Так как алгоритм решения задачи нормализации проективных преобразований должен быть универсальным и независимым от вида преобразований, представляется целесообразным постоянный поиск новых путей решения указанной задачи. Поэтому в третьем разделе предложена к рассмотрению разработанная авторами методология разложения проективной группы на подгруппы с целью упростить вид преобразований и использовать уже известные методы для их последовательной нормализации. Для
наглядности приведена геометрическая интерпретация одного из разработанных разложений.
1. Использование метода сечений при нормализации проективных преобразований
Так как группы ортогональных преобразований и преобразований перспективы как основные подгруппы проективной группы наиболее интересны с практической точки зрения, мы использовали ихдля иллюстрации построения и работы алгоритмов нормализации.
При ортогональных проективных преобразованиях эталонное изображение В0(х1,х2) и входное изображение В(х],х2) связаны соотношением
f
B(xl,x2) = B
V
an x1 + al2 x2 + a13 аЪ1хх + a32 X2 + a33
a3jXj + a32X2 + a33 j
a2jXj + a22 X2 + a23
’(i)
где матрица А =(ay) удовлетворяет условию АА1 = Е; Е — единичная матрица третьего порядка.
Введем функции трех переменных Х], х2, х3:
H 0( Xj, X2, X3) = Bo
f Xj X2 ^ V X3 X3 j
; H(Xj,X2,X3) = B
Xj X2
V X3 X3 j
Эти функции являются продолжением по однородности в R3 распределенной яркости В0(х1,х2),В(х1,х2). Из соотношения (1) видно, что
H o( X) = H ( Ax), (2)
где х=(х3,х2,х3), т.е. в R3 функции Но и Н связаны линейным ортогональным преобразованием.
Далее для того, чтобы рассматриваемые функции обладали как В0(х],х2) и В(х],х2) свойством финитно-сти, мы вводим новые функции и заменяем соотношение (2) аналогичным соотношением для финитных функций:
л |H0(x) при х < 1;
H о = 1 и и
10 при||х|| > 1;
Так как матрица А равенства (2) следует
, j H (x) при ||х|| < 1;
І0 при ||х|| > 1.
ортогональная, то из
H>(X) = HI (Ax). (3)
Пусть со = (a1,a2,a3), F(a,H) — преобразование Фурье функции H(x) в R3. Тогда, учитывая соотношение (3), получаем связь между преобразованием Фурье функций H0 (x) и H(x):
F (о, ТІ) = F (АО, H0). (4)
Раскладывая целую функцию F(a, H) в равномерно сходящийся ряд по однородным полиномам, переходим от уравнения (4) к равенству однородных полиномов:
л л , _ч
Pk (о, H) = Pk (АО, H 0), k = 0,1,2,..., (5)
где
л к л
Pk (о, H ) = UKa x)k H (x) dx.
Ilxl |<1
(6)
Зависимость между полиномом (6) и эталоном В0(х1,х2) представима в явном виде:
82
РИ, 1998, № 2
Pk (ю, H о)
2
к + 3
Я(ю^! +Ю2X2 + X3 )к
D
X
к+3
X (1+х? + X2) 2 B0(xbх2 )dx1 dx2-
Однородный полином Рк (ю,H"0) является линейной формой переменных ю 1, ю 2, ю 3 с коэффициентами
~ 1 2 2 —2
М01 = 2JJ х1(1 + х1 + х2 ) B0(xhх2 )dx1 dx2;
2 D
1 -- 2 2 —2
1)2 = 2JJ х2(1 + х1 + х2 ) B0(xTх2 )dx1 dx2;
2D
1)3 = 2 Я (1 + х2 + х 2) 2 B0( х1х 2 ) dx1 dx 2-
2D
Пусть вектор ц0 = (ц01, ц02, я03), а для входного изображения Я = (/u1, /~2, /и3). Тогда
~ = А~0. (7)
Для нахождения неизвестных элементов матрицы А используем метод сечений [ 1], который заключается в анализе изображений в каждой их точке, основанном на их функции распределения яркости, и переходе от изображений В(хьх2) с некоторыми значениями яркости к бинарным изображениям Bj(х1,х2) с нулевыми и единичными значениями в зависимости от того, наблюдается ли j яркость в точке. Задавая достаточно большое число сечений изображений 5о(х1,х2) и В(х^х2), получаем переопределенную систему
~1 = Ар10, j = 1,..., m.
Можно показать [1], что при действии группы SO2 ортогональных преобразований в R3 наилучшее приближение по методу наименьших квадратов достигается в случае A=(UVf, где матрицы U и V составлены из ортонормированных собственных векторов матриц WW* и WtW соответственно, а квадратная матрица третьего порядка W имеет вид
m
W = ЕЮ(~1У.
j=1
Таким образом, использование метода сечений позволяет формировать переопределенную линейную систему и нормализовывать различные подгруппы проективных преобразований путем нахождения искомой ортогональной матрицы А.
Основным недостатком данного подхода к нормализации проективных преобразований является его неуниверсальность при работе с изображениями различной яркости. Перед исследователями постоянно стоит вопрос о выборе наиболее подходящего разбиения на градации яркости, т.е. запрограммированный алгоритм невозможно использовать в автономном режиме; при нормализации всегда должен присутствовать оператор, который решает вопрос о выборе количества сечений.
В связи со сказанным выше представляет интерес более независимый от вида изображения метод нор -мализации путем использования конкомитантов.
2. Использование конкомитантов при получении операторов нормализации
Данная теория основана на построении операторов нормализации, связанных с бесконечномерным представлением группы проективных преобразований G в виде квадратных матриц третьего порядка.
Рассматривая группу G1 как подгруппу G и р1 — сужение представления р на подгруппу G, введем оператор частичной нормализации F1 со множеством эталонов Mi и оператор нормализации F0, связанный с представлением р1 и определенный в области, пересекающейся с М\. Таким образом, от задачи нахождения исходного оператора нормализации F проективной группы G путем его разложения в произведение более простых операторов сделан переход к нахождению операторов частичной нормализации F0 и Fi (F= FFi). Совершая подобные переходы от Gк G1, от G1 к G2 и т.д., можно пользоваться более простой задачей для нахождения операторов частичной нормализации.
Далее для упрощения построения оператора нормализации осуществим переход к конечномерным представлениям. Чтобы их построить, введем в рассмотрение полиномиальные конкомитанты группы. Доказано, что если F : B ^ р(<~(B))B — оператор частичной нормализации, связанный с представлением р(g) группы G, и j: п(g) ^р(g) — конкоми-тант группы G, то
F : B ~^n(<p(jB))B (8)
является оператором частичной нормализации, связанным с представлением п( g).
Предположим, что р( g) — конечномерное представление группы Gи G]—ее подгруппа. Доказано, что для существования оператора частичной нормализации необходимо и достаточно, чтобы множество векторов
В, для которого подгруппа G(B) ={g є G: p(g)B = B} сопряжена с одной из подгрупп группы G], обладало непустой внутренностью.
Основываясь на результатах, изложенных в [4], приходим к выводу, что в качестве G] следует брать максимально разрешимую, максимально компактную либо максимально коммутативную компактную собственную подгруппу группы G.
Задача отыскания операторов частичной нормализации сводится к нахождению полиномиальных конкомитантов, которые можно найти с помощью известной в теории инвариантов [2] конструкции. С помощью приведенной в [3] схемы доказано, что задача отыскания полиномиальных конкомитантов сводится к исследованию приводимости симметрических тензорных степеней представления р.
Приведенная теория наглядно доказывает, что задача построения оператора нормализации наиболее проста для таких групп G, для которых легко отыскиваются инвариантные подпространства конечной коразмерности. Такими являются разрешимые и компактные группы.
Сложность данного подхода заключается в высо -кой трудоемкости аппаратной реализации.
Исходя из нашего опыта нормализации группы аффинных преобразований, когда полная группа раскладывалась на подгруппы, которые в свою оче-
РИ, 1998, № 2
83
редь нормализовывались последовательно, мы предположили, что возможны такие разложения группы проективных преобразований на подгруппы, которые позволят упростить процедуру нормализации. Основываясь на этом предположении, мы разработали метод нормализации проективных преобразований путем разложения группы на подгруппы и их дальнейшей последовательной нормализации.
3. Метод последовательной нормализации проективных преобразований
Анализируя природу проективных преобразований, можно заключить, что они представляются как аффинные преобразования на плоскости при изменении ее положения в пространстве. При таком представлении любые изменения положения изображения можно описать как поворот исходной плоскости на некоторый угол q относительно любой удобно выбранной прямой (например, прямой, лежащей в плоскости XOY), ее смещения на некоторое расстояние h в направлении нормали плоскости поля зрения. Все остальные изменения можно описать аффинными преобразованиями.
Рассмотрим геометрическую интерпретацию изменения положения точек изображения при повороте плоскости (рис. 1):
D2 (n2(0,cos9,sin9))
Рис.1. Проективные преобразования при повороте плоскости изображения на угол 9 XOYZ — система координат, связанная с видеодатчиком; f - фокусное расстояние датчика; D, — плоскость поля зрения датчика; d — расстояние от датчика до исходной плоскости изображения А; нормали к плоскостям Д и Д имеют вид л1(0,1,0); D2 — плоскость изображения после поворота на угол q, имеющая нормаль n2(0,cosq,sin9)
Аналогично точку изображения в поле зрения (X2,z2), соответствующую точке изображения (x2,y2,z2) после поворота плоскости объекта на угол 9, ищем как точку пересечения плоскости D0 с прямой l2, соединяющей видеодатчик с точкой изображения (X2,y2,Z2):
X - Xj _ Y - d + Zj sin 9 _ Z - Zj cos 9 Xj d - zjsin9 zJcos9 ^
Y - f = 0
x2 -x f -d + z, sin9 z2 -z, cos9
^ -------- = -----j----=-----1---- ^
xj d -zj sin9 zj cos9
2 f - d + z, sin 9 f
x = x + x------------j-----= x
j
d - z. sin9 d - z, sin9
2 _ f -d + z.sin9 f cos9
z = zjcos9 + zj cos9--------j-----= zj—------:--
d - zj sin 9 d - zj sin 9
После поворота плоскости Dj на угол q координаты рассматриваемой точки в поле зрения изменятся следующим образом:
x 2 =-
fxj
z2 =
fzj cos 9
r j ■ X r j ■ c (9)
f - z sin 9 f - z sin 9
Нетрудно заметить, что (9) можно представить в виде простейшего проективного преобразования, именуемого перспективой:
x z'
x = -
j - hz'
Действительно, пусть
z = -
j - hz''
x1 = x', z1 = z' cos9, h =tg9,
f
тогда, подставив (11) в (9), получим:
(10)
(11)
x
2
sin 9 ,
------x
h cos 9_____
sin 9 , sin 9
z
h cos 9 cos 9
x'
1- hz’ ’
Из рис.1. видно, что уравнение плоскости поля зрения Do имеет вид Y-f=0, уравнение плоскости D] имеет вид Y-d=0, а точка изображения (xi,d,zi) после поворота плоскости переходит в точку с координатами (*2,y2,Z2), где Х2=Х1, y2=d-Z1sinq, Z2=Z1COsq.
Координаты (x1,z1) точки изображения в поле зрения, соответствующей реальной точке изображения (x1,d,z1) до поворота плоскости объекта, находим как координаты точки пересечения плоскости поля зрения D0 с прямой l1, которая соединяет видеодатчик с точкой (x1,d,z1) и задается уравнением
X - xj Y - d Z - zj
xj d zj
Y - f = 0
x j - xj f - d
xj d
zj -z! = f - d
zj d
x j = xj + xj( f - d)
jd
zj = z + z!( f - d) .
j d
fx j.
d ’
fix
d '
z
2
sin 9
z
hcos 9______
sin 9 sin 9
z
h cos 9 cos 9
z’
і- hz’
(12)
Таким образом, доказано, что всякое проективное преобразование можно представить в виде комбинации аффинныхи простейшегопроективного преобразования.
Чтобы получить полное разложение группы проективных преобразований в произведение групп более простых преобразований, необходимо получить уравнения, описывающие преобразование изображения при смещении его плоскости в направлении нормали к ней. Для изучения геометрической интерпретации смещения плоскости используем рис. 2.
Далее, как и в случае поворота плоскости, который был рассмотрен ранее, координаты (X ' ,z' ) точки изображения в поле зрения, соответствующей реальной точке изображения (x,d,z) до смещения плоскости объекта, находим как координаты точки пересечения плоскости поля зрения D0 с прямой l1:
84
РИ, 1998, № 2
, fx , fz dx' dz'
x = —; z = — или x = —; z =—.
d d f f
Находим точку изображения в поле зрения (x",Zr), соответствующую точке изображения (x, d+h, z) после смещения плоскости объекта, как точку пересечения плоскости D0 с прямой l2, соединяющей видеодатчик с точкой изображения (x, d+h, z):
x
ff
f - (d + h)
x + x-------
d+h
z
П
zf
d+h
xf . d + h ’
стояние h, описываемых формулами (13); Ga -группа аффинных преобразований:
x ^ a11x + a12y + a13; y ^ a21 x + a22 y + a23
Для демонстрации практического применения полученного разложения (14) рассмотрим в качестве примера шестипараметрическую группу проективных преобразований:
Oix + 6^2 У + О3
a(a\x +ауу +«э ) + Р(а^x +а5у +а6)-ax - Ру + у’
После сдвига плоскости изображения Do на расстояние h вдоль оси у координаты рассматриваемой точки в поле зрения изменятся следующим образом:
а4 x +а5 у + а6
У ^ Y---------------4----5---6--------------
a(alx +а2У + аз) + P(a^x +а5у + а6)-ал - Ру + у
(15)
,, dx f dx
x =------— =-----;
f d + h d + h
„ dz' f dz' (13)
z =------— =-----.
f d + h d + h
Полученные результаты дают возможность говорить о том, что проективные преобразования можно считать комбинированными, т.е. такими, которые можно рассматривать как результат последовательного применения базовых смещений.
Значит, при нормализации проективных преобразований можно использовать процедуру последовательной нормализации, когда на каждом шаге она осуществляется только одной из базовых групп преобразований.
Рис.2. Проективные преобразования при смещении плоскости изображения на расстояние h: XOYZ — система координат, связанная с видеодатчиком; f — фокусное расстояние датчика; D0 — плоскость поля зрения датчика; d — расстояние от датчика до исходной плоскости изображения Do; D2 — плоскость изображения после смещения на расстояние h
Обозначим группу преобразований поворота плоскости, описываемых формулой (9), как Gg, а преобразования, описываемые в (13), назовем группой преобразований смещения плоскости и обозначим Gh. Тогда, учитывая приведенные выше рассуждения, получим, что группу проективных преобразований плоскости Gp можно представить в виде
Gp = Gsg GhGa, (14)
где Gsg - группа преобразований поворота плоскости на угол g, описываемых формулами (9); a Gh -группа преобразований смещения плоскости на рас-
где а, р, у - фиксированные параметры; ар ..., а6 -параметры преобразования. Как показано в [1], приведенные проективные преобразования являются следствием аффинных преобразований в фиксированной плоскости, нормальное уравнение которой имеет вид ox + Ру + yz = H, где Н - расстояние от плоскости до начала координат.
Согласно нашему утверждению, эту плоскость при любых параметрах а, р, у, Н можно представить как поворот и смещение плоскости поля зрения датчика. При этом смещение происходит вдоль оси у на расстояние h:
h=H - f
в ,
а поворот осуществляется на угол g :
р . sing =——
cosg =
а2 +у2
(16)
signer)- (17)
V2 ОХХХ І/ I
а2 +Р2 +у2 д/а2 + Р2 +у
Поворот происходит относительно прямой:
осх + ву + yz = H
у = f.
(18)
Для того чтобы поворот плоскости осуществлялся, как описано выше относительно прямой z=0, y=f, нужно в качестве исходной системы координат,свя-занной с видеодатчиком, выбрать такую систему:
xi = x (H-а-р.f)sign(y) + z__И________.
ЛІГ2 -(H-а-в f )2 ’
у1 = у;
zi = z (H-а-в f )sign(y) -x__H________
P2 -(H-a-Pf )2 P2 -(H-a-Pf )2 .
Таким образом, указанную группу проективных преобразований изображения можно представить в виде аффинных преобразований изображения на плоскости, которая была смещена на расстояние h, определяемое формулой (16), и повернута относительно прямой (18) на угол 9, однозначно определяемый формулами (17).
После получения разложения (14) задача нормализации проективных преобразований существенно упрощается, так как теперь необходимо искать нормализаторы более простых групп преобразова-
РИ, 1998, № 2
85
ний Gsg, Gh и Ga. Нормализация аффинной группы Ga уже рассмотрена в [1], возможно построить и
операторы нормализации групп Gh и Gsff. Таким образом, разработанная теория позволяет осуществлять процедуру нормализации любых проективных преобразований.
Литература: 1.Путятин Е.П., Аверин С.И. Обработка изображений в робототехнике. М.: Машиностроение, 1990. 320 с. 2. Дьедоне Ж.., Керрол Дж, Мамфорд Д. Геометрическая теория инвариантов. М.: Мир, 1974. 280 с. 3.Путятин Е.П., Сергеева Н.К. Разработка метода получения операторов нормализации при проективных преобразованиях // Оптико-когерентные информационно-измерительные системы. 1977. Вып. 1. 162 с.
4. Борель А. Линейные алгебраические группы. М.: Мир, 1972. 269 с.
Поступила в редколлегию 22.06.98
Рецензент: д-р техн. наук, проф. Шостак В.Ф.
Путятин Евгений Петрович, д-р техн. наук, профессор, зав. кафедрой ПрЭВМ ХТУРЭ. Научные интересы: методы сегментации, нормализации и распознавания изображений, цифровая обработка изображений. Адрес: 310726, Украина, Харьков, пр. Ленина, 14, тел. (0572) 40-94-19.
Прокопенко Дмитрий Олегович, аспирант кафедры ПрЭВМ ХТУРЭ. Научные интересы: распознавание изображений и методы нормализации видеоизображений, исследование преобразований и построение моделей их разложения. Адрес: 310726, Украина, Харьков, пр. Ленина, 14, тел. (0572) 40-94-19.
Печеная Елена Михайловна, соискатель кафедры матфизики ХГУ. Научные интересы: математическое моделирование и методы вычислений в электродинамике и электронике, численные методы, методы нормализации изображений. Адрес: 310022, Украина, Харьков, пл.Свободы, 4, тел. (0572) 45-42-34.
УДК 681.519
ПРОЦЕДУРЫ ГРУППОВОГО КОНТРОЛЯ ДЛЯ ИНФОРМАЦИОННЫХ СИСТЕМ
САЕНКО В.И., КЛИМЕНКО А.В. * 1
Рассмотрены вопросы построения процедур контроля состояния элементов в организационных информационных системах с административным управлением при обслуживании заявок. Предложена математическая модель связи элементов системы, дисциплины обслуживания и процедуры группового контроля обслуживания заявок в системе.
Одна из проблем, присутствующая в организационных информационных системах с административным управлением, — своевременная обработка заданий, поступающих исполнителям. Качество обработки заданий определяет действенность управления всей системой в целом. Степень их обработки во многом зависит от характеристик обрабатывающего элемента, поэтому представляется актуальным разработка процедур контроля состояния заданий в системе и процедуры эмпирического определения характеристик элементов. Такие процедуры составляют часть комплексной программной системы мониторинга состояния организационных объектов.
1. Постановка проблемы
Эффективность функционирования организационной информационной системы с административным управлением в значительной мере определяется эффективностью реализации управляющих воздействий [ 1]. В свою очередь управляющие воздействия, являющиеся фактически распоряжениями и приказами, представляют собой задания для исполнителей, поэтому качество обработки этих заданий определяет качество функционирования всей системы.
Пусть система обслуживания описывается элементами источников, генерирующих сообщения, и элементами исполнителей. В общем случае поток информации генерируется множеством (группой) элементов источников и обрабатывается множеством элементов исполнителей. Рассматривается класс мно-
гомерных, дискретных многосвязных систем, функционирование которых сводится к обработке непрерывно-дискретного информационного потока заданий в течение определенного периода.
При высокой интенсивности потока часть заданий либо обрабатывается с опозданием, либо вообще не обрабатывается. Указанные сбои приводят к нарушению функционирования всей системы в целом и связаны с присутствием в ней так называемых “узких мест”. Узкие места — это единичные элементы исполнителей, имеющие фактически низкие характеристики производительности обработки заданий. Обнаружить эти места в текущий момент времени невозможно, так как они непостоянны во времени и меняются поэлементно. Однако их удается выявить путем контроля всех потоков за достаточно длительный период. Степень возможности обработки задания определяется несколькими параметрами: степенью сложности источника, временным интервалом его обработки, производительностью элемента исполнителя, нагрузкой на этот элемент. Недетерминированность этого процесса связана с вероятно -стной оценкой, характеризующей параметры потребителя. Проблема заключается в оценке этих вероятностных характеристик. Их удается выявить только путем контроля всех потоков за достаточно длительный период. Цель выявления — формирование корректирующих функций прогноза для целевых функций всей системы. Контроль всех информационных потоков для реальных систем — задача достаточно сложная из-за больших мощностей множеств элементов источников и элементов исполнителей [2—5].
Решить описанные проблемы можно при наличии процедур, обеспечивающих накапливание статистических данных по обработке информационного потока, определения подмножества исполнителей, регулярно не справляющихся с обработкой, и групп источников, генерирующих особо сложные для выполнения задания.
2. Основные положения. Математическая модель
Пусть существует дискретная система, состоящая из І0 элементов источников информации I и І0 элементов исполнителей P. Тогда множество R={rkij:k=1,...,k<), І=1,...,І0, j=1,...J0} есть информа-
86
РИ, 1998, № 2