Научная статья на тему 'Достаточное условие конвертируемости матрицы над конечным полем'

Достаточное условие конвертируемости матрицы над конечным полем Текст научной статьи по специальности «Математика»

CC BY
85
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПЕРМАНЕНТ / PERMANENT / ПРОБЛЕМА ПОЛИА / POLYA PROBLEM / ЗНАКОВАЯ КОНВЕРТАЦИЯ МАТРИЦ / SIGN CONVERSION / КОНЕЧНОЕ ПОЛЕ / FINITE FIELD

Аннотация научной статьи по математике, автор научной работы — Будревич Михаил Вячеславович

Изучается возможность знаковой конвертации перманента в определитель для матриц над конечным полем. Получено достаточное условие знаковой конвертации для матриц над конечным полем с большим числом ненулевых элементов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Достаточное условие конвертируемости матрицы над конечным полем»

Краткие сообщения

УДК 512.643.8

ДОСТАТОЧНОЕ УСЛОВИЕ КОНВЕРТИРУЕМОСТИ МАТРИЦЫ

НАД КОНЕЧНЫМ ПОЛЕМ

М. В. Будревич1

Изучается возможность знаковой конвертации перманента в определитель для матриц над конечным полем. Получено достаточное условие знаковой конвертации для матриц над конечным полем с большим числом ненулевых элементов.

Ключевые слова: перманент, проблема Полна, знаковая конвертация матриц, конечное поле.

A sign conversion for matrices over finite fields is studied. The sufficient condition for sign conversion between permanent and determinant functions is obtained for matrices with large number of nonzero elements.

Key words: permanent, Polya problem, sign conversion, finite field.

Перманент является важной комбинаторной функцией, которая часто применяется в прикладных задачах теории графов. Основная трудность применения перманента связана с большой сложностью его вычисления. В работе изучается вопрос о возможности вычисления перманента с использованием определителя. Это связано со схожестью формальных определений этих функций:

det(А) = Y^ sgn(o-) Л aia{i),

<J&S„ í=l

per(A) = Y^ П aMi)'

<J&S„ í=l

где Sn — группа перестановок на множестве из п элементов, a sgn(cr) — знак перестановки а.

Используются следующие обозначения. Через Мп(Т) и Vn(T) будем обозначать множество квадратных матриц порядка п и векторов длины п с элементами из Т, где Т — произвольное множество. Пусть а = {¿i,..., ik}, где 1 ^ i i < ... < ik ^ п, и /3 = {ji,..., j¡}, где 1 ^ ji < ... < ji ^ m, — два набора различных индексов. Через А(а\/3) будем обозначать матрицу полученную из А вычеркиванием строк с номерами из а и столбцов с номерами из /3. Если а или /3 — пустое множество, то будем писать А(\(3) и А(а|) соответственно. Через Fg будем обозначать конечное поле из q = рп элементов, где р является простым числом. Если п = 1, то будем писать Fp. Через v{A) будем обозначать число ненулевых элементов в матрице. Каждой перестановке а € Sn поставим в соответствие множество элементов ai<j(i),... ,(ina(n)j которое будем называть обобщенной диагональю матрицы А.

Исследование знаковой конвертации было впервые начато Полна [1]. Им был поставлен вопрос: при каких п для любой матрицы А € Мп(0,1) существует матрица X = Х(А) € Мга(+1, —1), удовлетворяющая условию per(A) = det(X о А)? Здесь о обозначает поэлементное умножение матриц. Поэлементное умножение на матрицу X фактически означает умножение некоторых элементов исходной матрицы А на — 1, поэтому такой подход называется знаковой конвертацией.

Знаковая конвертация для матриц над полем характеристики 0 достаточно глубоко изучена. Основным результатом в этой области является следующая теорема Гибсона.

Теорема 1 [2, с. 474]. Пусть А € Мп(0,1) является конвертируемой матрицей, у которой рег(А) > 0. Тогда v(A) ^ п +^га~2 = Qn и равенство справедливо тогда и только тогда, когда существуют матрицы перестановок P,Q € Мп, тлкие, что

/10 0 1 1 о

PAQ = Gn =

111. 111. \1 1 1 .

0 1\ 0 1

0 1 1 1 1 1/

где матрица Gn называется матрицей Гибсона порядка п.

Будревич Михаил Вячеславович — асп. каф. высшей алгебры мех.-мат. ф-та МГУ, e-mail: mbudrevichQyandex.ru.

В большинстве работ о вычислении перманента с использованием определителя в качестве основного берется поле с характеристикой 0. Аналогичный вопрос для матриц над конечным полем изучался в работах [3, 4], где доказана невозможность построения биективного преобразования ф : Мп(¥д) —>■ Мп(¥д), удовлетворяющего равенству рег(А) = Ле^ф(А)). В последующем в [5] было показано, что в случае конечного поля не существует прямого аналога теоремы Гибсона, а именно в [5] построена серия примеров знаково-конвертируемых матриц с элементами из ¥р \ {0}.

Целью настоящей работы является доказательство достаточного условия знаковой конвертируемости матрицы над конечным полем в терминах числа ненулевых элементов в ее столбцах и строках. Нам понадобятся следующие вспомогательные результаты.

Лемма 1 [5, следствие 4.12]. Пусть Fp — конечное поле из р элементов, р — простое число и а 1,..., ат — фиксированные ненулевые элементы Fp; где т ^ р — 1, некоторые из которых могут совпадать. Тогда для любого элемента а € существует набор (5\,... ,5т), где 5г € {±1}, такой, что

Лемма 2. Пусть в матрице А € Мп(¥р), р > 2, существует обобщенная диагональ из ненулевых элементов. Тогда существует такая матрица X € Мга(±1); что рег(А о X) ф 0.

Доказательство. Без ограничения общности можно считать, что главная диагональ матрицы А заполнена ненулевыми элементами. Этого можно добиться перестановкой столбцов исходной матрицы.

Докажем утверждение леммы индукцией по параметру п. Пусть п = 2. Если рег(А) ф 0, то положим X = ,12, где .12 — матрица порядка 2, заполненная единичными элементами. Очевидно, что лемма выполнена. Пусть рег(А) = аца,22 + Я12О21 = 0. Так как на главной диагонали стоят ненулевые элементы,

2ац(122 ф 0, так как р > 2.

Пусть п > 2 и утверждение леммы доказано для всех порядков меньше п. По предположению индукции существует такая матрица X € Мга(±1), что рег(Д(1|1) о Х(1|1)) ф 0. Применим формулу Лапласа к перманенту матрицы А о X:

Первое слагаемое в (1) не равно нулю. Если рег(АоХ) ф 0, то X — искомая матрица. Если рег(АоХ) = 0, то заменим в X элемент хц на — Хц. Тогда рег(Д о X) = —2жцрег(А(1|1) о Х(1|1)) ф 0. Лемма доказана.

Следствие 1. Пусть в матрице А € Мп(¥р) существует обобщенная диагональ из ненулевых элементов. Тогда существует такая матрица X € Мга(±1); что ёе1](Д о X) ф 0.

Доказательство. Доказательство дословно повторяет доказательство леммы 2 с заменой перманента на определитель.

Следствие 2. Пусть А € Мп(¥р) и рег(Д) ф 0; р > 2. Тогда существует матрица X € Мп( 1, —1); такая, что ёе1](Д о X) ф 0.

Доказательство. Так как рег(А) ф 0, то в матрице существует обобщенная диагональ, состоящая из ненулевых элементов. Утверждение вытекает из следствия 1.

Перейдем к основному результату настоящей статьи.

Определение. Матрица А € Мп(¥р) называется частично разложимой, если существуют матрицы перестановок Р, <5, такие, что

где Ац и А22 — квадратные подматрицы порядка к > 0 и > 0 соответственно, к + в = п. Матрица называется вполне неразложимой, если она не является частично разложимой.

Теорема 2. Пусть матрица А € Мп(¥р), где р>2ип^2р — 6, удовлетворяет следующим условиям:

1) один из столбцов не содержит нулевых элементов;

2) в одной из строк не менее чем М = (р — 3) — 1 )(р — 1) + 2 ненулевых элементов (здесь и далее логарифмирование выполняется по основанию 2);

3) матрица А вполне неразложима.

Тогда матрица А знаково-конвертируема.

Доказательство. Без ограничения общности можно считать, что первый столбец матрицы А не содержит нулевых элементов и в первой строке А не менее чем т ^ М ненулевых элементов. Так как матрица А вполне неразложима, то для любой нулевой подматрицы размера в х Ь имеем (£ + в) ^ (п — 1).

т

а= Т,

г=1

Получаем рег(А о X) = ацагг — ^12^21

рег(А о X) = ацрег((Л о Х)(1|1)) + а^регЦА о Х)(1|2)) + ... + а1„рег((А о Х)(1|п)). (1)

Следовательно, для любой нулевой подматрицы I х к в Л(1|1) имеем (I + к) ^ (п — 1), а значит, по теореме Фробениуса-Кёнига [6, теорема 2.1] в А(1|1) существует обобщенная диагональ, не содержащая нулевых элементов. Согласно следствию 1, можно выбрать такую матрицу Y € Мга(±1), что det((A о К)(1|1)) ф 0. Нашей целью является доказательство возможности такой знаковой конвертации А, чтобы определитель принимал любое наперед заданное значение из поля. Поэтому можно считать, что для матрицы А выполнено условие det(A(l|l)) ф 0.

Обозначим через а\,...,ап строки матрицы А(|1) и рассмотрим их как элементы векторного пространства Vn~l(¥p). Так как det(A(l|l)) ф 0, то векторы а,2,---,ап линейно независимы. Пусть N = {а\ оц,о £ Vn_1(±l)}. Поскольку в векторе а\ имеется (т — 1) ненулевая компонента, а характеристика chF = р > 2, то в N существует в точности 2т~1 различных векторов.

Так как det(А(111)) ф 0, то существует обратная к А(1|1) матрица. Обозначим ее через В = (Д(1|1))-1. Тогда Büí = e¿_i для г = 2,... ,п, где ек — к-й базисный вектор стандартного базиса. Пусть N' = BN = {Ва\а € N}. Очевидно, что N' содержит 2т~1 векторов.

Докажем, что в N' существует элемент, который выражается минимум через (р—2) базисных вектора. Так как базисные векторы при умножении на матрицу В перешли в элементы стандартного базиса, то требуемое утверждение равносильно тому, что в N' существует вектор с (р — 2) ненулевыми координатами.

Предположим противное. Посчитаем, сколько может быть в пространстве Vn_1(Fp) векторов, у которых менее чем (р — 2) ненулевые координаты; обозначим их количество через D. Они включают в себя векторы с одной ненулевой компонентой, всего (п — 1 ){р — 1) штук. Векторов с двумя ненулевыми компонентами — I)2 штук и т.д., вплоть до векторов с (р — 3) различными ненулевыми компонентами,

которых C^Z^ip — 1)р_3 штук. Таким образом, имеет место следующее равенство:

Р-з

D^CLxip-l У- (2)

г=1

В силу сделанного предположения справедливо неравенство D ^

Оценим величину I) сверху. Заметим, что при г < (р — 3) ^ ^ имеет место неравенство

СЫР-IT = г +1 1

Сгп+_\(р ~ 1)г+1 (п ~ г - 1)(р - 1) р - 1'

которое означает, что каждое следующее слагаемое в (2) как минимум в (р — 1) раз больше предыдущего, а значит, так как всего слагаемых (р — 3), то всю сумму можно оценить сверху удвоенным последним слагаемым:

D<2CpnZl(p-l)p-3.

Логарифмируя неравенство D ^ получаем

п—1 р—3

М - 1 < т - 1 < log D = log 2 + (р - 3) log(p - 1) +

к=п—р-\- 3 j=2

Уберем из log D отрицательные слагаемые, а положительные приравняем к максимальному. Используя условия настоящей теоремы, будем иметь

log D < log 2 + (р - 3) log (р - 1) + (р - 3) log (и - 1) = (р - 3) log (и - 1)(р - 1) + 1 = М - 1 < т - 1. (4)

Неравенства (3) и (4) противоречивы, а значит, существует элемент в N' не менее чем с (р — 2) ненулевыми координатами.

В силу построения множества N' это означает, что в N существует вектор, который выражается минимум через (р — 2) вектора из а,2,... ,ап.

Выберем вектор, выражающийся не менее чем через (р — 2) вектора. Обозначим его через b = а\ о v. Выберем матрицу X, такую, что первая строка без первого элемента совпадает с v, а остальные элементы единичные. Далее рассмотрим матрицу С = А о X. Обозначим через с\ первую вектор-строку в матрице С(|1). Матрица С обладает следующими свойствами:

1) det(C(l|l)) ф 0;

2) вектор Ъ\ выражается не менее чем через р — 2 строки матрицы С(1|1), а значит, среди чисел det(C(¿|l)), где г = 2,..., п, не менее чем р — 2 числа, отличные от нуля.

Разложим определитель матрицы С по первому столбцу:

det(C) = cndet(C(l|l)) - ... + (-l)^1^det(C(n|l)).

Так как сц ф 0, г = 1,..., п, то в последнем равенстве не менее (р — 1) отличных от нуля слагаемых, а значит, по лемме 1 можно так умножить некоторые из слагаемых на —1, что будет получен любой элемент из Fp, в частности Р = рег(А). Пусть эти множители образуют первый столбец матрицы U, остальные элементы которой равны единице. Тогда будем иметь равенство per(A) = det(C о U) = det(A о X о U) = det(AoZ). Таким образом, построили матрицу Z € Мга(+1, —1), которая конвертирует матрицу А. Теорема доказана.

Замечание. Условие простоты поля Fp в доказательстве теоремы существенно. А именно лемма 1 будет неверна для поля Fç, где g = рк и к > 1. Представим Fç как факторкольцо кольца Fp[a;] по какому-то неприводимому многочлену степени к > 1. Возьмем элемент ж € F и любое количество элементов сц € Fp С Fg. Тогда линейной комбинацией х и сц с коэффициентами ±1 нельзя получить элементы из Fp.

Пример. Теорема 2 позволяет показать конвертируемость некоторых матриц. Например, дана вполне неразложимая матрица А € M14(F5), в которой существует строка и столбец без нулевых элементов. Так как M = 2 log(13 • 4) + 2 < 14, то по теореме 2 матрица А конвертируема.

Следствие 3. Пусть матрица А € Мп(¥р) заполнена, ненулевым,и элементами, где р > 2 — простое число и п удовлетворяет неравенству п ^ (р — 3) log(n — 1)(р — 1) + 2. Тогда, матрица А знаково-конвертируема.

Доказательство. По определению матрица без нулевых элементов вполне неразложима. Очевидно, что п ^ (р — 3) log (и — 1)(р — 1) + 2 > 2р — 6, а значит, все условия теоремы 2 выполнены и матрица А конвертируема.

Следствие 4. Пусть А € Мп(¥р) — частично разложимая матрица, перестановочно эквивалентная верхне-блочно-треугольной матрице с вполне неприводимыми блоками А\,..., А^ на главной диагонали, один, из которых удовлетворяет условиям теоремы 2. Тогда, матрица А знаково-конвертируема.

Доказательство. Без ограничения общности можно считать, что блок А\ удовлетворяет требованиям теоремы 2. Тогда, согласно доказательству теоремы 2, для любого г € Fp существует матрица Хг, такая, что det(Ai о Хг) = г. Если среди блоков нет нулевых, то в каждом существует обобщенная диагональ из ненулевых элементов. По следствию 1 для каждого блока А2,... ,Ak существует матрица Xi такая, что det(о Xi) ф 0. Заметим, что

к

det(A') = det (Ai о Xr) det (А* о Xi)

г=2

может принимать любое значение, так как первый сомножитель может принимать любое значение в поле, а остальные сомножители не равны нулю. Остается подобрать требуемое значение параметра г.

Если среди блоков есть нулевой, то в матрице не существует обобщенной диагонали без нулевых элементов, а значит, заведомо верно равенство per(A) = det(A) = 0.

Автор приносит благодарность научному руководителю профессору А.Э. Гутерману за постановку задачи, активное участие в обсуждении полученных результатов и помощь в подготовке настоящей работы. Также автор признателен рецензенту за проявленное к работе внимание и сделанные замечания и комментарии.

Работа выполнена при финансовой поддержке грантов МЛ 002.21)1 1.1 и РФФИ № 12-01-00140-а.

СПИСОК ЛИТЕРАТУРЫ

1. Polya G. Aufgabe 424 // Arch. Math. Phys. 1913. 20, N 3. 271.

2. Gibson P.M. Conversion of the permanent into the determinant // Proc. Amer. Math. Soc. 1971. 27. 471-476.

3. Dolinar G., Guterman A., Kuzma В., Orel M. On the P'olya permanent problem over finite fields // Europ. J. Combinatorics. 2011. 32. 116-132.

4. Budrevich M. V., Guterman A.E. Permanent has less zeros than determinant over finite fields // Contemp. Math. Amer. Math. Soc. 2012. 579. 33-42.

5. Budrevich M. V., Guterman A.E. On the Gibson bounds over finite fields // Serd. Math. 2012. 38. 395-416.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Мипк X. Перманенты. M.: Мир, 1982.

Поступила в редакцию 20.12.2013

i Надоели баннеры? Вы всегда можете отключить рекламу.