8
ВЕСТН. моек. УН-ТА. СЕР.1, МАТЕМАТИКА. МЕХАНИКА. 2009. №4
УДК 519.71
ОБ ОДНОМ СООТНОШЕНИИ ДВУХ МЕР СЛОЖНОСТИ ВЫЧИСЛЕНИЯ СИСТЕМ ОДНОЧЛЕНОВ
В. В. Кочергин1
Для одного класса матриц, задающих показатели степеней переменных в системе одночленов, установлена нетривиальная нижняя оценка сложности — минимального числа умножений, достаточного для вычисления системы по переменным. Также приведен пример последовательности матриц (и соответственно систем одночленов), для которой возможность использования наряду с самими переменными величин, обратных к переменным, приводит к снижению сложности асимптотически в 2 раза.
Ключевые слова: аддитивная цепочка, сложность вычисления систем одночленов.
For a class of matrices defining exponents of variables in a system of monomials, a nontrivial lower bound of complexity is found (where the complexity is defined as the minimum number of multiplications required to calculate the system starting from variables). An example of a sequence of matrices (system of monomials, respectively) is also given so that the usage of inverse values of variables (in addition to the variables themselves) makes the complexity asymptotycally two times less.
Key words: addition chain, computation complexity of system of monomials.
Пусть А = (а^) — целочисленная матрица размера р х д с неотрицательными элементами и без нулевых строк.
Минимально возможное число операций умножения, достаточное для вычисления по переменным Х\,Х2,.. -,Хд задаваемой матрицей А системы одночленов
/ = Ха11 Ха12 Ха1" / = Ха21 Ха22 Ха2д / = ХаР1 ХаР2 Хард
Л — Х1 Х2 ... , / 2 — Х1 Х2 ... ХЯ , . ..1 /р — Х1 Х2 ... ХЯ
(при этом допускается многократное использование промежуточных результатов), будем называть сложностью вычисления (или просто сложностью) системы одночленов /1,/2,...,/р и обозначать, следуя [1], через I (/1, /2 ,...,/р). Эта величина полностью определяется матрицей А, и поэтому естественно ввести для нее и другое обозначение, а именно 1(А).
Величину 1(А) можно также интерпретировать как минимально возможную сложность (число элементов) схемы из функциональных элементов (необходимые определения можно найти в [2, 3]), на входы которой подаются переменные Х1,Х2,...,ХЯ, на выходах вычисляются одночлены х'^11 хо^12 ...Х^1д, Ха21 х'о22 ... Хд2",..., хдр1 хаар2 ... Ха/д, задаваемые целочисленной матрицей наборов показателей степеней А размера р х д, а сама схема состоит из двухвходовых элементов, реализующих произведение одночленов, подаваемых на входы элемента. В данной работе будем в основном придерживаться этой интерпретации.
В эквивалентной аддитивной постановке обычно говорят либо о сложности вычисления линейных форм (см., например, [4, 5]), либо о сложности порождения р строк матрицы А аддитивными цепочками векторов, начинающихся с д векторов, каждый из которых состоит из одной единицы и д — 1 нулей [6-9].
В данной работе задача исследования величины 1(А) понимается в следующей асимптотической постановке. Пусть дана последовательность {А(п) = (а^(п))} целочисленных матриц (эти матрицы должны быть с неотрицательными элементами и без нулевых строк) размера р(п) х д(п), удовлетворяющая при п условию т&ха..£Л(п) а^ ^ с. Задача состоит в нахождении при п асимптотики роста функ-
ционала сложности 1(А(п)). Описанию полученных в этом направлении результатов, а также изучению близких к данной проблеме вопросов посвящена работа [5].
В общем случае изучение асимптотики роста величины 1(А) представляется весьма трудной задачей. В настоящее время известна асимптотика роста только для некоторых частных случаев.
1 Кочергин Вадим Васильевич — доктор физ.-мат. наук, доцент каф. дискретной математики мех.-мат. ф-та МГУ, e-mail:
vvkoch@yandex. ru.
ВЕСТН. МОСК. УН-ТА. СЕР.1, МАТЕМАТИКА. МЕХАНИКА. 2009. №4
9
Положим
D(A) = max ( max |detA(ii,Í2,...,ik; ji,j2,...,jk)l )•
k: 1^k^min(p,q) \(ii,...,ik; ji,...,jk) /
Таким образом, D(A) — это максимум абсолютных величин миноров матрицы A, где максимум берется по всем минорам. С использованием соображений из [10] нетрудно показать (подробное доказательство в более общем случае см., например, в [5]), что для произвольной матрицы A из рассматриваемого класса справедлива нижняя оценка1
l(A) ^ log D(A).
Верхняя оценка, асимптотически совпадающая с этой нижней оценкой, в работах [11-13] была последовательно получена для случаев:
а) матриц размера 2 х 2;
б) матриц размера 2 х q(n) и матриц размера p(n) х 2 (двойственный случай) при ограниченных или слаборастущих значениях p(n) и q(n);
в) матриц размера 3 х 3.
Эти результаты естественным образом приводят к предположению о том, что для матриц любого фиксированного размера p х q в рамках асимптотической постановки задачи справедливо соотношение l(A) — log D(A). Косвенным доводом в пользу справедливости этой гипотезы является основной результат работы [14], который может быть проинтерпретирован следующим образом.
Пусть A = (aij) — произвольная целочисленная матрица размера p х q. Обозначим через 12(A) минимально возможное число операций умножения и деления, достаточное для вычисления по переменным Xi,X2, • • .,Xq задаваемой матрицей A системы функций (уже, вообще говоря, не являющихся одночленами) fi = X1г1 Xа>г2 • • • xaqiq, i = 1, 2,... ,p. Из [14] следует, что в такой, несколько более сильной модели для матриц любого фиксированного размера p х q с ростом абсолютного значения максимального элемента матрицы A выполняется асимптотическое равенство
l2(A) - log D(A).
В данной работе тем не менее устанавливается, что предположение о справедливости асимптотической формулы l(A) — log D(A) для матриц любого фиксированного размера p х q оказывается неверным уже для матриц размера 4 х 4: приводится пример последовательности матриц размера 2t х 2t, для которой нижнюю оценку из [5] можно усилить в 2t/(t + 1) раз. Кроме того, показано, что в "промежуточной" модели, в которой не разрешена операция деления, но можно использовать в вычислениях помимо самих переменных и обратные к ним величины (подробнее о модели см., например, [5, 15, 16]), для той же последовательности матриц аналогичный эффект отсутствует.
Обозначим через A(t, n) матрицу размера 2t х 2t, определяемую следующим образом. Первой строкой матрицы A(t, n) является набор длины 2t, первая половина разрядов которого равна n, а вторая половина — нулю. Остальные 2t — 1 строки матрицы A(t, n) получаются из первой строки последовательным циклическим сдвигом на один разряд вправо. Тогда элементы aij матрицы A(t, n) задаются равенствами
{и, если 0 ^ ] — % ^ Ь — 1 или ] — % ^ — (Ь + 1); 0, если ] — % ^ Ь или —Ь ^ ] — % ^ —1,
К примеру, матрица А(Ь, и) при Ь = 3 имеет вид
A(3,n) =
i = 1, 2,...,2t, j = 1, 2,...,2t.
n n n 0 0 0
0 n n n 0 0
0 0 n n n 0
0 0 0 n n n
n 0 0 0 n n
n n 0 0 0 n
Для удобства договоримся под записью aj при j > 2t и 1 ^ i ^ 2t понимать элемент air, где r определяется из условий 1 ^ r ^ 2t, r = j (mod 2t).
1 Здесь и далее log x означает log2 x.
Теперь можно утверждать, что для любого i (1 ^ i ^ 2t) среди элементов aj и aij+t один является нулевым, а другой равен п.
Если аналогичным образом под записью Xj при j > 2t понимать переменную xr, где r определяется из условий 1 ^ r ^ 2t, r = j (mod 2t), то задаваемые матрицей A(t,n) одночлены fi = x^1 xa>i2 ■■■Xqq, i = 1, 2, ■■■ ,2t, можно представить так: fi = хПхП+1 ■ ■ ■ x'i+t_ 1.
Теорема 1. При условии t = o(log n) справедливо асимптотическое равенство
l(A(t, п)) - 2t log п.
Доказательство. Нижняя оценка. Пусть S — минимальная схема из элементов умножения с 2t входами, на которые подаются переменные xi,x2,^^^,x2t, и 2t выходами, которые вычисляют одночлены fi = x™x™+i ■■■x'n+t-i, т.е. на выходах схемы S вычисляется система одночленов, задаваемая матрицей A(t,n). Будем считать, что на i-м выходе схемы S реализуется одночлен fi.
Среди всех элементов схемы S выделим подмножества Si, i = 1, 2,■■■ ,2t, следующим образом. Элемент схемы S отнесем к множеству Si, если вычисляемый этим элементом одночлен имеет вид xT xOit1 ■ ■ ■ x+--1, где ai ^ 1, aj ^ 0 при i + 1 ^ j ^ i + t - 1.
При i = j выполняется соотношение Si П Sj = 0. Действительно, пусть это не так, т.е. некоторый элемент e схемы S содержится и в множестве Si, и в множестве Sj. Тогда он вычисляет одночлен, содержащий в качестве множителя ненулевую степень и переменной xi, и переменной xj. Далее, если xi Е {xj,xj+i, ■■■, xj+t-1}, то xj / {xj,, xi+1, ■■■, xi+t-1} и, следовательно, хотя бы одно из двух включений
xi Е {xj, xj+1, ■■■, xj+t-1}, xj Е {xh xi+1, ■ ■ ■ , xi+t-1}
не выполняется, что противоречит тому, что вычисляемый элементом e одночлен содержит в качестве множителя ненулевую степень и переменной xi, и переменной xj.
С другой стороны, для любого i, 1 ^ i ^ 2t, справедливо неравенство \Si\ ^ logп, и поэтому окончательно имеем
l(A(t,n)) = l(S) ^ 2t log п■
Верхняя оценка. Для вычисления системы одночленов {f1, f2, ■ ■ ■, f2t}, задаваемой матрицей A(t,n), достаточно каждую переменную возвести в степень п, а затем для каждого из одночленов ■ ■ ,f2t
перемножить соответствующие t степеней. Поэтому, учитывая известный [17] (см. также [6]) результат о
том, что для вычисления по переменной х и числу п степени хп достаточно logn + О операций
умножения, при t = o(log п) имеем
l(A(t,n)) ^ 21 ^logп + О (^fog^)) +2t~ = 2i(logn + o(logn)).
Теорема 1 доказана.
Лемма. При t ^ bg'iogra спРаведливо равенство D(A(t,n)) = nt+l.
Доказательство. Разобьем строки матрицы A(t,n) на t пар, отнеся для i = 1, 2, ■ ■ ■ ,t к i-й паре строки с номерами i и i + t. Аналогичным образом разобьем столбцы матрицы A(t, п) на t пар, отнеся для j = 1, 2, ■ ■ ■ ,t к j-й паре столбцы с номерами j и j + t. Покомпонентная сумма строк (столбцов) любой пары дает строку (п,п, ■■■,п) (столбец (п,п, ■■■,п)Т^. Следовательно, любое множество строк (столбцов), включающее в себя для двух некоторых пар обе строки (оба столбца) этих пар, является линейно зависимым, и поэтому любой минор порядка r, где r ^ t + 2, равен нулю.
Рассмотрим миноры порядка t + 1. Для того чтобы определитель подматрицы, состоящей из (t + 1) строки и (t + 1) столбца матрицы A(t,n), был отличен от нуля, необходимо, чтобы выполнялись два условия: ровно для одной пары обе строки включены в подматрицу (следовательно, среди выбранных строк должен быть представитель каждой пары) и ровно для одной пары оба столбца включены в подматрицу (среди выбранных столбцов должен быть представитель каждой пары).
В случае выполнения этих условий из такой подматрицы с помощью элементарных, не изменяющих абсолютную величину определителя преобразований — перестановки строк, умножения строки на -1, сложения строки со строкой (п,п, ■■■,п), перестановки столбцов, умножения столбца на -1, сложения столбца со столбцом (п,п, ■■■, n)T — можно получить матрицу, совпадающую с подматрицей матрицы
A(t,n), состоящей из ее первых (t + 1) строк и первых (t + 1) столбцов. Определитель такой матрицы равен nt+1. Таким образом, миноры порядка t + 1 по абсолютной величине равны либо нулю, либо nt+1.
Миноры порядка не более t не превосходят по абсолютному значению величину tin*. Следовательно, | ^ log n
при выполнении условия t ^ i0giogra имеем
nt+1 < D(A(t,n)) < max (nt+1, tin*) = nt+1.
Лемма доказана.
С помощью доказанной леммы из теоремы 1 легко получить
Следствие. При условии t ^ bg'iogra спРаведливо асимптотическое равенство
2t
log£>(A(i,n)).
Теперь введем еще одну меру сложности вычисления систем одночленов (а также функций более широкого класса).
Так же, как и в работах [5, 16], для произвольной целочисленной матрицы A = (aj) размера p х q через If(A) обозначим минимально возможное число операций умножения, достаточное для вычисления по переменным Ж1,Ж2, ...,xq и обратным к ним величинам x-1 ,x-1,..., xсистемы задаваемых матрицей A функций fi = x0qi1 xa2 ... xaqiq, i = 1, 2,... ,p. Для этой величины также будем использовать обозначение ¡F(f1, f2,..., fq).
Очевидно, что для любой матрицы A с неотрицательными элементами и без нулевых строк выполняются соотношения ¡2 (A) ^ If (A) ^ ¡(A). Добавление не очень важной на первый взгляд возможности использования помимо переменных обратных к ним величин при вычислении системы одночленов, задаваемых матрицами A(t,n), существенно меняет ситуацию.
Теорема 2. При условии t = o(log n) справедливо асимптотическое равенство
¡F(A(t,n)) - (t + 1) log n.
Доказательство. Нижняя оценка. Справедливость для любой ненулевой матрицы A неравенства ¡F(A) ^ logD(A) доказана в [5, 16]. Для завершения доказательства нижней оценки достаточно использовать очевидное соотношение D(A) ^ nt+1.
Верхняя оценка. Опишем процесс вычисления по переменным x1,x2,..., x2t и обратным к ним величинам x-1,x- 1,..., x-
" 1 ™ 1 , x2t1 системы функций
Н = хап Ха12 % = 12 2Ь
Н — Х1 х2 ••• x2t , % — , *',••• ,
задаваемой матрицей А(Ь,и) = (ац). Положим
д0 = Х1+1Х1+2 • • • Х2й 9г = 1г9о , % = 1 2,••• , В силу равенств Н = gogi справедливы соотношения
1р(А(ь,и)) = Ь(¡1,12,•••,¡21) < Ь(до) + Ь(д1 ,g2,•••,g2t) + 2Ь
Показатели степеней переменных Хl,Х2,•••, Х2г в представлении функций gl,g2,•••, g2t образуют матрицу В(Ь,и) = (Ъц) размера 2Ь х 2Ь, элементы которой можно также определить равенствами
bij =
ij
если 1 ^ j ^ t;
aij — n, если t + 1 ^ j ^ 2t,
i = 1, 2,...,2t, j = 1, 2,...,2t.
Для иллюстрации выпишем матрицу B(t,n) при t = 3:
B(3,n) =
n n n —n —n —n
0 n n 0 —n —n
0 0 n 0 0 —n
0 0 0 0 0 0
n 0 0 —n 0 0
n n 0 —n —n 0
Отметим, что в матрице В(Ь,п) для Э = 1, 2,... ,Ь столбец с номером Э + Ь получается из столбца с номером Э путем домножения всех элементов Э-го столбца на —1. Кроме того, отметим, что в столбцах с номерами 1, 2,... ,Ь все ненулевые элементы равны п.
Вычислить функции д\,§2,... ,д2г можно следующим образом.
Сначала, используя Ь операций умножения, вычисляем функции у\ = Х1Х—у2 = Х2Х—+2,..., Уг = хгх — •
Далее, каждую из функций У1,У2,...,Уг возводим в степень п, тем самым будут вычислены все функции у^, г = 1, 2,...,2Ь, э = 1, 2,...,Ь.
Наконец, для каждого г, г = 1, 2,...,2Ь, с использованием не более Ь — 1 операции умножения вычисляем функцию
уЬц уЬг2 „Ьц = [ ХЬц Ы 2 ХЬгЛ ¡Х - Ьи Х - Ьг2 Х - ЬгЛ = ХЬг1 ХЬг2 ХЬц ХЬг,^ + 1 ХЬг^ + 2 Х= у1 у2 ... уг — \^Х1 Х2 .. . Хг ) \^Хг+1 Хг+2 ... Х2г ) — Х1 Х2 ... Хг Хг+1 Хг+2 ... Х2г — Уг.
Таким образом,
¡е (д1 ,д2,..., д2г) < Ь + Ь ¡Е (хп) + 2Ь(Ь — 1) < Ь¡е (хп) + 2Ь2 — Ь.
Кроме того,
¡Е(до) < ¡Е(Хп) + Ь — 1.
Следовательно,
¡е(А(Ь,п)) = ¡е(¡1,12,...,12г) < ¡е(до)+ ¡е(д1,д2,...,д2г)+2Ь < < (Ь + 1)Е(хп)+2Ь2 + 2Ь.
Для возведения в степень п достаточно 1сщп + О операций умножения [6, 17], поэтому при
Ь = о(1о§ п) имеем
¡Е(А(Ь,п)) < (Ь + 1)(1о§п + о(1о§п)).
Теорема 2 доказана.
Следствие. При условии £ ^ ь^о^га спРаведливо асимптотическое равенство
¡е(А(Ь,п)) - 1о§О(А(Ь,п)).
Из теорем 1 и 2 непосредственно следует
Теорема 3. При условии Ь = п) справедливо асимптотическое равенство
¡(А(Ь,п)) 2Ь
- ГЧ»< -
¡е (А(Ь,п)) Ь + 1'
Таким образом, для любого фиксированного Ь, Ь ^ 2, можно привести пример такой последовательности матриц размера 2Ь х 2Ь, что задаваемая этой матрицей система одночленов допускает снижение сложности асимптотически в 2Ь/(Ь + 1) раз в случае, если при вычислении помимо самих переменных можно дополнительно использовать обратные к ним величины.
Кроме того, из теоремы 3 непосредственно вытекает
Следствие. Пусть при п — со выполняются условия Ь — со и Ь = п). Тогда справедливо
асимптотическое равенство
1т,п)) 9
- А.
¡е (А(Ь,п))
Замечание. Рассматриваемые в работе матрицы А(Ь, п) вырождены: при размере 2Ь х 2Ь они имеют ранг Ь + 1. Однако эти матрицы можно немного "подправить", увеличив на 1 диагональные элементы аг+2,г+2, аг+з,г+з,..., &2г,2г. С одной стороны, полученные матрицы А'(Ь, п) невырождены и удовлетворяют равенствам О (А'(Ь,п)) = ёе! А'(Ь,п) = пг+1 = 0(А(Ь,п)), а с другой — все оценки сложности для них сохраняются практически без изменений.
Работа выполнена при финансовой поддержке РФФИ (проект № 08-01-00863) и программы поддержки ведущих научных школ РФ (проект НШ-4470.2008.1).
СПИСОК ЛИТЕРАТУРЫ
1. Pippenger N. On evaluation of powers and monomials ^ SIAM J. Comput. 198G. 9, N 2. 23G-25G.
2. Лупанов О.Б. Об одном подходе к синтезу управляющих систем — принципе локального кодирования ^ Проблемы кибернетики. Вып. 14. М.: Наука, 1965. 31-11G.
3. Севидж Д.Е. Сложность вычислений. М.: Факториал, 1998.
4. Сидоренко А.Ф. Сложность аддитивных вычислений семейств целочисленных линейных форм У У Зап. научных семинаров ЛОМИ. Т. 1G5. Л.: Наука, 1981. 53-61.
5. Кочергин В.В. О сложности вычисления систем одночленов и систем целочисленных линейных форм У У Дискретная математика и ее приложения: Сб. лекций молодежных научных школ по дискретной математике и ее приложениям. Вып. III. М.: ИПМ им. М.В. Келдыша РАН, 2GG7. 3-63.
6. Кнут Д.Е. Искусство программирования для ЭВМ. Т. 2. М.: Мир, 1977.
7. Knuth D.E., Papadimitriou C.H. Duality in addition chains ^ Bull. Eur. Assoc. Theor. Comput. Sci. 1981. 13. 2-4.
8. Olivos J. On vectorial addition chains ^ J. Algorithms. 1981. 2, N 1. 13-21.
9. Гашков С.Б., Кочергин В.В. Об аддитивных цепочках векторов, вентильных схемах и сложности вычисления степеней ^ Методы дискретного анализа в теории графов и сложности. Вып. 52. Новосибирск, 1992. 22-4G.
1G. Morgenstern J. Note on a lower bound of the linear complexity of the fast Fourier transform ^ J. Assoc. Comput. Mach. 1973. 20. 3G5-3G6.
11. Кочергин В.В. О сложности вычисления пары одночленов от двух переменных ^ Дискретная математика. 2GG5. 17, вып. 4. 116-142.
12. Кочергин В.В. О сложности вычисления систем одночленов от двух переменных У У Тр. VII Междунар. конф. "Дискретные модели в теории управляющих систем" (Покровское, 4-6 марта 2GG6 г.). М.: МАКС Пресс, 2GG6. 185-19G.
13. Кочергин В.В. О сложности совместного вычисления трех одночленов от трех переменных У У Математические вопросы кибернетики. Вып. 15. М.: Физматлит, 2GG6. 79-155.
14. Кочергин В.В. Об асимптотике сложности аддитивных вычислений систем целочисленных линейных форм У У Дискретный анализ и исследование операций. Сер. 1. 2GG6. 13, № 2. 38-58.
15. Кочергин В.В. О максимальной сложности вычисления систем элементов свободной абелевой группы ^ Вестн. Моск. ун-та. Матем. Механ. 2GG7. № 3. 15-2G.
16. Кочергин В.В. О сложности совместного вычисления трех элементов свободной абелевой группы с двумя образующими УУ Дискретный анализ и исследование операций. Сер. 1. 2GG8. 15, № 2. 23-64.
17. Brauer A. On addition chains ^ Bull. Amer. Math. Soc. 1939. 45. 736-739.
Поступила в редакцию 19.11.2008
УДК 515.164.174, 515.122.55
РАВНОМЕРНАЯ ЛЕММА МОРСА И КРИТЕРИЙ ИЗОТОПНОСТИ ФУНКЦИЙ МОРСА НА ПОВЕРХНОСТЯХ
Е. А. Кудрявцева1
Пусть M — гладкая, компактная (ориентируемая или неориентируемая) поверхность с пустым или непустым краем. Пусть Do С Diff(M) — группа диффеоморфизмов, гомотопных idM. Две гладкие функции f, g : M ^ R называются изотопными, если f = h о g о h\ для некоторых диффеоморфизмов h\ Е Do и h2 Е Diff +(R). Пусть F — пространство функций Морса на M, постоянных на каждой компоненте края и не имеющих критических точек на крае. Доказан критерий изотопности функций Морса из F. Для каждой функции Морса f Е F построен набор морсовских локальных координат в попарно не
1 Кудрявцева Елена Александровна — канд. физ.-мат. наук, доцент каф. дифференциальной геометрии и приложений мех.-мат. ф-та МГУ, e-mail: [email protected].