2014 ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА Сер. 10 Вып. 2
ПРИКЛАДНАЯ МАТЕМАТИКА
УДК 519.61:511-33
Н. А. Балонин1, М. Б. Сергеев2
НОРМЫ ОБОБЩЕННЫХ МАТРИЦ АДАМАРА
1 Санкт-Петербургский государственный университет аэрокосмического приборостроения, 199406, Санкт-Петербург, Российская Федерация
2 Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, 197101, Санкт-Петербург, Российская Федерация
В статье вводится понятие квазиортогональных матриц (М-матриц, минимаксных матриц), обладающих качеством иметь экстремально малое значение их максимального элемента после нормализации их столбцов или строк (ш-норму). Различаются между собой случаи достижения строгого минимума ш-нормы у матриц Адамара и локального минимума у обобщенных матриц нечетных и некоторых четных порядков. М-матрицы классифицируются по количеству уровней — значений, которые принимают их элементы. Помимо матриц Адамара и Белевича, приводятся примеры нечетных по порядку двух- и трехуровневых матриц Мерсенна и Ферма, а также четных модульно двухуровневых матриц Эйлера, замещающих матрицы Белевича, когда они не существуют. Даются формулы для расчетов уровней М-матриц и характерных весов правой части условия ортогональности их столбцов. Для оценки близости М-матриц к матрицам Адамара вводится понятие приведенной ш-нормы (¿-нормы), равной единице у матриц Адамара. Приводятся графики h-норм семейства рассматриваемых матриц. Отмечается существование всех матриц Мерсенна и Эйлера нечетных и нечетных порядков, смежных 4. Указывается на проблему в области построения минимаксных матриц на порядках матриц Ферма. Отмечается, что приведенные в работе структурные признаки и формулы для весовых коэффициентов могут быть положены в основу альтернативных определений исследуемых матриц. Библиогр. 8 назв. Ил. 1.
Ключевые слова: ортогональные матрицы, матрицы Адамара, матрицы Белевича, матрицы Мерсенна, матрицы Ферма, матрицы Эйлера, М-матрицы, квазиортогональные матрицы, адамарова норма.
N. A. Balonin M. B. Sergeev2
THE GENERALIZED HADAMARD MATRIX NORMS
1 Saint Petersburg State University of Aerospace Instrumentation, 199406, St. Petersburg, Russia Federation
2 Institute of Information and Control Systems of the National Research University of Information Technologies, Mechanics and Optics, 197101, St. Petersburg, Russia Federation
Балонин Николай Алексеевич — доктор технических наук, профессор; e-mail: [email protected] Сергеев Михаил Борисович — доктор технических наук, профессор, директор; e-mail:
Balonin Nikolaj Alekseevich — doctor of technical sciences, professor; e-mail: [email protected] Sergeev Mikhail Borisovich — doctor of technical sciences, director; e-mail: [email protected]
The concept of quasi-orthogonal matrices (M-matrices, minimax matrices) with the quality to have an extremely small value of the maximum element after normalization of their columns or rows is introduced (m-norm). Cases to achieve the strict minimum of m-norm — Hadamard matrices and a local minimum — generalized Hadamard matrices of odd and even orders are differed. M-matrices by the number of their levels — values that take their items are classified. Apart from the Hadamard and Belevich matrices, examples of odd order two- and three-levels matrices Mersenne and Fermat are observed, including even modular duplex Euler matrices replacing matrix Belevich when they do not exist. The formulas to calculate the M-matrices and characteristic weights of the right side of their orthogonal columns condition are described. To assess the proximity of M-matrices to the Hadamard matrices the weighted m-norm (h-norm) is proposed, it's equal to the unity for the any Hadamard matrix. Histograms h-norms for the family the Hadamard matrices are given. The existence of all Mersenne and Euler matrices for odd and odd orders related 4 are noted. A problem to construct the minimax matrices of Fermat matrix orders is indicated. The structural features and formulas of weighting factors as the basis of alternative definitions of the matrices are noted. Bibliogr. 8. Il. 1.
Keywords: orthogonal matrices, Hadamard matrices, Belevich matrices, Mersenne matrices, Fermat matrices, Euler matrices, M-matrices, quasi-matrices, Hadamard norm.
Введение. Если ортогональная матрица порядка n содержит много элементов с максимальным модулем (обозначим его m), то умножение ее на скалярный множитель ^ дает матрицу А„ более простого вида, т. е. содержащую много элементов ±1. Столбцы такой матрицы, назовем ее квазиортогональной, попарно ортогональны, причем
Л^ An = wI,
где I = diag(l, 1,1,..., 1), а весовой коэффициент ш равен Такие матрицы рассматривались в работах [1—5]. Хорошо известные примеры - матрицы Адамара и Белевича [1, 2].
Определение 1. Матрица Адамара Hn - квадратная матрица порядка n, состоящая из элементов {1,--1}, такая, что
HTHn = nI.
Весовой коэффициент ш = п = где то - значение максимального модуля элементов ортогональной матрицы, полученной из матрицы Адамара нормированием ее столбцов.
Определение 2. Матрица Белевича Cn (С-matrix, conference-matrix) - квадратная матрица порядка n, с нулевой диагональю и остальными элементами {1, —1}, такая, что
CTCn = (n — 1) I.
Весовой коэффициент ш = п — 1 = где то - значение максимального модуля элементов ортогональной матрицы, полученной из матрицы Белевича нормированием ее столбцов.
Матрицы Адамара и Белевича существуют только для четных значений порядка. Множество таких матриц расширено в работах [3-5] использованием модифицированного алгоритма Сильвестра, что не исключает возможность определения аналогичных матриц нечетных и некоторых четных порядков через зависимость весового коэффициента (и показателя m) от порядка n. Эта зависимость рассмотрена недостаточно полно и нуждается в дополнительном освещении.
Определение М-матриц и их норм. Для удобства описания некоторых классов квазиортогональных матриц введем определения уровня матрицы и ее уровне-вости.
Определение 3. Уровнями матрицы будем называть численные значения, которым равны ее элементы.
Определение 4. Уровневостью матрицы будем называть количество ее уровней. Например, матрица Адамара - двухуровневая матрица с элементами {1, -1}.
Модульными уровнями матрицы будем называть модули численных значений элементов, а модульной уровневостью - их количество. Так, матрица Адамара является модульно одноуровневой.
Пусть т - максимум модулей элементов ортогональной матрицы. Аналогичная характеристика квазиортогональных матриц получается после приведения их к ортогональному виду и называется уровневой нормой (или т-нормой).
Определение 5. Приведенной адамаровой нормой (Н-нормой) матрицы называется показатель к = т^/п.
Приведенная норма матриц Адамара равна единице - это минимальное значение данного показателя на классе ортогональных матриц того же порядка. В самом деле, минимум максимальной проекции одиночного вектора единичной нормы на сфере достигается равноудаленностью его от базисных ортов. Достижение того же показателя системой нормированных векторов, подчиненных некоторому уравнению связи (условию их ортогональности), сложнее. Тем не менее для матриц Адамара это возможно, согласно их определению. Напомним, что существование таких матриц для всех значений порядков, кратных четырем (гипотеза Адамара), не доказано.
Ортогональные или квазиортогональные матрицы, обладающие отмеченным выше качеством матриц Адамара иметь минимальную величину т-нормы, будем называть минимаксными, или М-матрицами [5]. Отметим, что |с1е1;(А)| = = поэтому М-матрицы так же, как и матрицы Адамара, обладают максимально возможным значением модуля определителя на классе квазиортогональных матриц.
Определение 6. М-матрица в точном, т. е. в узком, смысле - матрица с минимальным максимумом абсолютных значений ее элементов (минимальной т-нормой) на заданном порядком п классе ортогональных матриц.
Такие матрицы, даже если они существуют, найти возможно далеко не всегда. Примером М-матриц являются матрицы Адамара, первым проблемным порядком для них в настоящее время - порядок 668. Среди прочих М-матриц определены все матрицы, порядок которых меньше 13 [5], а также матрица порядка 22 [6]. Поэтому интересны М-матрицы, толкуемые более широко. В теории оптимизации помимо глобальных существуют локальные экстремумы. К субоптимальным решениям, не совпадающим с глобальным экстремумом, относятся решения задач при наличии некоторых дополнительных условий. Задав количество уровней матрицы в узком диапазоне, можно получить, как правило, только такие локально-оптимальные матрицы. Варьирование количества возможных значений элементов (повышение уровневости) позволяет получить более оптимальный по т-норме вариант, который может оказаться в итоге абсолютным экстремумом.
Определение 7. М-матрица в широком смысле - это матрица локально-оптимальная по т-норме (или Н-норме).
Термин локально-оптимальная по т-норме матрица означает, что ее норма минимальна (или максимальна, при еще более расширительном толковании) среди норм всех возможных квазиортогональных матриц, образуемых ограниченной по амплитуде вариацией значений элементов исходной матрицы. Тем самым М-матрицы в смысле определения 6 составляют подмножество этого класса квазиортогональных матриц.
Матрицы Адамара - тот случай, когда оба важных инварианта, различающих М-матрицы между собой, ш-норма и уровневость, минимальны.
Отличающиеся от них трехуровневые матрицы Белевича сосуществуют с некоторыми матрицами Адамара, когда порядки кратны четырем, и, следовательно, матрицы Белевича не всегда оптимальны. ^-Норма для них выше, чем у матриц Адамара, хотя и стремится к единице с увеличением порядка п. На тех значениях порядков, для которых нет матриц Адамара, матрицы Белевича строго оптимальны, но они, в свою очередь, существуют не всегда.
Разрешимость задачи на поиск М-матриц зависит, как видно, от их уровневости -модульно одноуровневые матрицы Адамара получены далеко не для всех порядков, модульно двухуровневые матрицы Белевича построены на более широком множестве порядков матриц и т. п.
Адамаровы нормы М-матриц. Будем искать М-матрицы, приведенные к квазиортогональному виду, у которых весовой коэффициент ш зависит от норм. Формула для весового коэффициента выясняется по структурным инвариантам: распределениям элементов столбцов в уровнях матриц, представленных в работах [3-5]. После чего, как и в случае матриц Адамара и Белевича, данную зависимость можно использовать в формулировках определений приведенных матриц, расширяя их состав. Напомним, что общих алгоритмов нахождения таких матриц нет, есть лишь несколько конструкций, позволяющих построить матрицы Адамара некоторых порядков.
Опираясь на предыдущие исследования, приведем весовые коэффициенты и ада-маровы нормы, вводя их индивидуальные обозначения для каждого вида М-матриц.
Единичная матрица - двухуровневая матрица I порядка п, состоящая из {1, 0}, столбцы которой ортогональны
1Т1 = I,
единичные элементы сосредоточены на диагонали, уровневая норма ш =1, приведенная норма = а/п - самая большая у М-матриц.
Данная матрица интересна тем, что дает ограничение ^-норм М-матриц сверху. Это доказывается максимально возможными значениями проекций сначала одиночного вектора на сфере, а потом семейства ортогональных векторов.
О-матрица - двухуровневая матрица вида Б„ = 20п—п1 порядка п с элементами {а = 2 — п, Ь = 2}. Здесь 0п - квадратная матрица порядка п, все элементы которой единицы.
Делением на 2 — п матрица Оп приводится к форме с элементами {а = 1, — Ь}, где Ь = 2/ (п — 2), а единичные элементы сосредоточены на диагонали. При этом
БТБп = Л,
где 3 = 1 + (п — 1) Ь2.
Значение п = 2 - это особый случай антидиагональной матрицы = Й1р (I), совпадающей с матрицей Белевича С2 и имеющей с ней одинаковую ^-норму. Однако с ростом порядка график приведенных норм для матриц Белевича стремится к единице, а для О-матриц - к величинам = а/п единичных матриц, т. е., обладая общей точкой, они в дальнейшем расходятся между собой.
При п = 3 то = при п > 3 то = -щ = , приведенная норма = =
> 1.
п
Матрица Адамара - двухуровневая матрица Нп порядка п. Уровневая норма то = приведенная норма /г-н = 1-
Графики приведенных норм матриц Адамара, единичных и О-матриц имеют только одну общую точку при вырожденном (для матриц, становящихся скалярами) значении порядка п =1, величина которой для матриц Адамара является константой и определяет нижнюю границу норм матриц.
Матрица Белевича - трехуровневая матрица Си порядка п. Уровневая норма то = приведенная норма к с = ^ стремится к приведенной норме матрицы
Адамара с ростом п.
Рассмотренные матрицы характеризуют две тенденции: у матриц с диагональным преобладанием (единичная и О-матрица) приведенная норма возрастает, ее квадрат аппроксимируется порядком п. У плотно заполненных матриц (Адамара, Белевича) приведенная норма равна единице или стремится к этому показателю. Описываемые ниже матрицы тоже плотные, и их нормы стремятся к единице, но медленней, чем у матрицы Белевича.
Матрица Мерсенна [3] - двухуровневая матрица Ми порядка п, состоящая из элементов {а = 1, —Ь}, столбцы которой ортогональны
мТм„ =
где /л = ("+1)+(-1)ь2 .
Структурные инварианты: модулей элементов каждого столбца такой матрицы равны а = 1, модули остальных элементов равны Ъ < а, причем Ъ = ^ при п = 3, в остальных случаях Ь = 4 , где д = п + 1 (порядок матрицы Адамара [7]).
При п = 3 то = |, при п > 3 то = -4= = /-2 , приведенная
норма км = у^ стремится с ростом порядка п к /гн = 1.
В отличие от матриц Адамара и Белевича график ^-норм матриц Мерсенна ответвляется от графика ^-норм О-матриц на п = 3 и далее стремится к предельному значению, равному единице. На п = 3 это М-матрица строго оптимальная, т. е. замещает собой не существующие здесь матрицы Адамара и Белевича. Значения порядков, для которых известен алгоритм построения этих матриц, включают числа Мерсенна [3].
Матрица Ферма [4] - трехуровневая матрица Е„ порядка п, состоящая из элементов {а = 1, —Ь, в}, столбцы которой ортогональны
Ги = /I,
(2q-p)(l-Ъ2) ,99
где / =-^-- +</6 ; в - элементы первых строки и столбца, начинающихся
с а (т. е. каймы матрицы Ь ^ в < а).
Структурные инварианты: элементов каждого столбца (помимо первого)
матрицы Е„ равны а =1, начинаются столбцы с единственного элемента каймы в, остальные элементы отрицательны и равны —Ъ, Ъ = в = | при п = 5, в остальных
7, 2 п-р д/пд-гуд
случаях 6=—^, в = —--, р = д + у/1_/, д = п- 1.
График ^-норм матриц Ферма ответвляется от графика ^-норм О-матриц на п = 5 порядке, далее стремится к предельному значению, равному единице. На п = 5 это локально-оптимальная М-матрица, поскольку ее уровневость равна трем (у оптимальной их больше).
Уровневая норма то = приведенная норма к-р = —> 1. Значения порядков матриц, для которых известен алгоритм построения, включают числа Ферма [4].
Матрица Эйлера [8] - четырехуровневая матрица Еп порядка п, состоящая из элементов {а = 1, —а, Ь, —Ь}, столбцы которой ортогональны
ЕТ Еп = СI,
где ^ = (п+2) + (п-2)Ь^
Структурные инварианты: модулей элементов каждого столбца такой матрицы равны а = 1, модули остальных элементов равны Ь < а, Ь = ^ при п = б,
в остальных случаях Ь = = п + 2.
Уровневая норма ш = /¿е = —► 1. Значения порядков, для которых
существуют эти матрицы, включают четные числа, для которых нет матриц Адамара и Белевича, что связано с признаками разложимости значения п — 1 на сумму квадратов двух чисел, т. е. это дополняющие локально-оптимальные матрицы (матрицы Эйлера). Нормы матриц Эйлера ответвляются от ветви норм матриц Адамара на п = 2 порядке, их график имеет экстремум на п = 14.
10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 п
Адамаровы нормы семейства матриц Адамара (Н), Белевича (С), Мерсенна (М), Ферма (Е), Эйлера (Е)
Графики к-норм семейства рассматриваемых матриц приведены на рисунке. Они лежат в створе ветвей матриц Адамара (ограничение значений норм снизу) и единичных матриц (ограничение сверху) - графики к-норм единичной и Ю-матриц слишком стремительно уходят вверх и видны при увеличении масштаба, нивелирующем различия между нормами наиболее интересных матриц Адамара, Белевича, Мерсенна, Ферма и Эйлера. Матрицы Эйлера сосуществуют с матрицами Белевича на одних и тех же значениях порядков (что объясняет двойное раскрашивание столбиков) и дополняют их для п = 22, 34 и т. п., для которых матрицы Белевича не существуют. Порядки матриц Ферма соответствуют числам Ферма, что объясняет пробелы на п = 9, п = 13 и т. п.
Заключение. Приведенная норма является константой к = 1 для матриц Ада-мара и инвариантом преобразования, с помощью которого получают дополнительные ветви матриц элементарным удвоением порядка, - алгоритм Сильвестра [3]
не улучшает этот показатель. Нормы построенных алгоритмом матриц можно изобразить горизонтальными линиями, идущими от каждой из норм М-матриц вправо.
Порядки матриц Эйлера, начиная со второго, следуют через 4, причем матрица шестого порядка продуцируется при помощи алгоритма Сильвестра из матрицы Мерсенна третьего порядка. Соответственно их приведенные нормы совпадают между собой и нормой D3, т. е. норма Еб меньше, чем у D6.
В работе [7] сформулирована гипотеза о существовании матриц Мерсенна и Эйлера, аналогичная гипотезе Адамара. Если она верна, то пропусков соответствующих им порядков на графике нет. Матрицы Эйлера замещают отсутствующие матрицы Белевича порядков 22, 34 и т. п. [6]. В отношении пропусков порядков матриц Ферма требуются дополнительные исследования для выяснения уровневости, гарантирующей наличие некоторых дополняющих их матриц. Все приведенные выше структурные признаки и формулы для весовых коэффициентов могут быть положены в основу альтернативных определений таких матриц [8].
Литература
1. Hadamard J. Resolution d'une question relative aux determinants // Bull. des Sciences Mathematiques, 1893. Vol. 17. P. 240-246.
2. Belevitch V. Theorem of 2ra-terminal networks with application to conference telephony // Electr. Commun. 1950. Vol. 26. P. 231-244.
3. Балонин Н. А., Сергеев М. Б., Мироновский Л. А. Вычисление матриц Адамара-Мерсенна // Информационно-управляющие системы. 2012. № 5. С. 92-94.
4. Балонин Н. А., Сергеев М. Б., Мироновский Л. А. Вычисление матриц Адамара-Ферма // Информационно-управляющие системы. 2012. № 6. С. 90-93.
5. Балонин Н. А., Сергеев М. Б. М-матрицы // Информационно-управляющие системы. 2011. № 1. С. 14-21.
6. Балонин Ю. Н., Сергеев М. Б. М-матрица 22-го порядка // Информационно-управляющие системы. 2011. № 5. С. 87-90.
7. Балонин Н. А. О существовании матриц Мерсенна 11-го и 19-го порядков // Информационно-управляющие системы. 2013. № 2. С. 90-91.
8. Балонин Н. А., Сергеев М. Б. О двух способах построения матриц Адамара-Эйлера // Информационно-управляющие системы. 2013. № 1 (62). С. 7-10.
References
1. Hadamard J. Resolution d'une question relative aux determinants. Bull. des Sciences Mathematiques, 1893, vol. 17, pp. 240-246.
2. Belevitch V. Theorem of 2ra-terminal networks with application to conference telephony. Electr. Commun., 1950, vol. 26, pp. 231-244.
3. Balonin N. A., Sergeev M. B., Mironovskiy L. A. Vichislenie matrits Adamara-Mersenna (Hadamard-Mersenne matrices calculation). Informatsionno-Upravlyayushie Systemy, 2012, no. 5, pp. 92-94.
4. Balonin N. A., Sergeev M. B., Mironovskiy L. A. Vichislenie matrits Adamara-Ferma (Ha-damard-Fermat matrices calculations). Informatsionno-Upravlyayushie Systemy, 2012, no. 6, pp. 90-93.
5. Balonin N. A., Sergeev M. B. M-matritsy (M-matrices). Informatsionno-Upravlyayushie Systemy, 2011, no. 1, pp. 14-21.
6. Balonin U. N., Sergeev M. B. M-matritsa 22-go poryadka (M-matrix of order 22). Informatsionno-Upravlyayushie Systemy, 2011, no. 5, pp. 87-90.
7. Balonin N. A. О suschestvovanii matrits Mersenna 11-go i 19-go poryadkov (To existance of Mersenne matrices of 11-th и 19-th orders). Informatsionno-Upravlyayushie Systemy, 2013, no. 2, pp. 90-91.
8. Balonin N. A., Sergeev M. B. O dvuh sposobah postroeniya matrits Adamara-Eulera (Two ways of Hadamard-Euler matrices calculation). Informatsionno-Upravlyayushie Systemy, 2013, no. 1 (62), pp. 7-10.
Статья рекомендована к печати проф. Н. В. Егоровым. Статья поступила в редакцию 19 декабря 2013 г.