Сравнение сложностей задач нахождения базиса Гребнера идеала и решений этого идеала
А. В. Шокуров
Аннотация. Сравниваются сложности задач нахождения решения системы алгебраических уравнений и базисов Гребнера идеалов этих систем.
1. Введение
В диссертации Б. Бухбергера [ВисОб] в 1965 году был предложен новый метод исследования идеалов в кольцах многочленов. В основании метода положено использование базиса идеала специального вида — базиса Гребнера, названного им так в честь своего научного руководителя. Предложенный подход позволил доказать алгоритмическую сводимость задачи нахождения решений системы алгебраических уравнений от многих переменных к задаче нахождения решений алгебраического уравнения от одной переменной. В дальнейшем этот метод нашел множество применений в различных теоретических и прикладных разделах математики, механики, криптографии и др. (см. [BucOl], [Laz83]).
Однако практическое использование метода сопряжено с колоссальными вычислительными затратами. Первые оценки трудоемкости этого метода были получены еще тогда, когда понятие базиса Гребнера еще не было известно. В работе [Нег25] еще в 1925 г. была получена необходимая верхняя оценка в виде двойной экспоненты от числа переменных и максимальных степеней входящих описание задачи многочленов для степеней разложения элемента идеала по его произвольному базису. Как оказалось позднее [Dube] эта оценка не может быть улучшена.
Поскольку базис Гребнера зависит от допустимого упорядочения на множестве термов, естественно был поставлен вопрос о возможной зависимости трудоемкости вычисления такого базиса от такого прядочения. Поэтому сначала потребовалось описать такие упорядочения. Полное описание таких опорядочений было дано в работе [Rob85], Однако этот же результат можно извлечь из более ранних работ [МИ53] и [Gio52],
В дальнейшем эти упорядочения использовались при построении специальных алгоритмов нахождения базиса Гребнера. Выделим особо алгоритмы г4 и ГЕ предложенные Фожеро ( [Еаи99], [Еаи02]).
Экспоненциальная оценка для сложности задачи нахождения базиса Гребнера в общем случае получена в [КМ96]. Среди других работ в этом направлении выделим [Ваг04], [Вго87], [Сш84], [Н1Л1], |Ьа/83|. [Мау89], [Мау97], [ММ82].
Для булевых идеалов в статье [КМ96] доказана
Теорема. 1 Для заданных базиса булева идеала IС и
допустимого порядка на термах < единственный приведенный базис Гребнера для I относительно порядка < (задача 1) может быть вычислен алгоритмом, объем используемой памяти которого ограничен сверху полиномом от длины входных данных.
В данной работе доказано, что размер базиса Гребнера О булева идеала / может иметь экспоненциальный размер относительно размера описания базиса идеала / , т.е. выполняется
Теорема. 2 Задача построения базиса Гребнера булева идеала не принадлежит классу ГР.
2. Основные определения
Пусть М — произвольное множество. Отображение
М х М —»М (1)
будем называть операцией. Для операции могут использоваться мультипликативная и аддитивная запись — ху и х + у соответственно. Аддитивная запись обычно используется только для коммутативной операции, т.е. когда х + у = у + х для всех пар (х. у).
Операция называется ассоциативной, если для всех троек (х.у.г) выполняются соотношения (ху )г = х(уг).
Если для всех пар х, у из М выполняются соотношения ху = ух, то операция называется коммутативной.
Элемент е е М называется единичным элементом, если для всех х е М выполняются соотношения ех = х = хе . (В случае аддитивной записи операции единичный элемент обозначается через 0 и называется нулевым элементом.) Единичный элемент единствен, если он существует. Действительно, пусть е' — другой единичный элемент. Тогда выполняются соотношения
е = ее' = е'.
Определение 1. 3 Множество А/ с ассоциативной операцией называется полугруппой. Полугруппа, содержащая единицу, называется моноидом.
Определение 2. 4 Отношение на моноиде М называется допустимым упорядочением моноида М, если для этого отношения выполняются следующие свойства:
• Для любых различных элементов и и2 моноида М всегда
выполненяется в точности одно из соотношений 1\ ~< 1'2 ИЛИ 1'2 1\ .
• Если 1'2 . то для любого V е М выполняется соотношение
V ■и1 -<и-и2.
• В любом непустом подмножестве М0 с М всегда существует
наименьший элемент г/0 е М0:
V V £ М0 и0 -< V или и0 = V.
Отношение и -< ¡1 будем записывать также как / / >- и .
Пусть X = {х\,...,хп} — конечное множество. Обозначим через &
множество неотрицательных целых чисел. Выражения вида х,1 ... хн", где
6ь> = {Сь>1,...,6ь>и}е«И+,
будем называть термами на множестве X и обозначать Т(X). Множество Т (X) является моноидом относительно операции умножения, заданной формулой
Ушп уП уЧп = у^1+т ушп+Чп
Л1 . . . Лп ■ А1 . . . Лп Л1
На моноиде термов Т(Х) существует бесконечно много допустимых
упорядочений. Из определения моноида термов следует, что достаточно описать допустимое упорядочение на множестве .
Примеры допустимых упорядочений на множестве векторов из Ъп+ .
• Лексикографический порядок. Для а, ¡3 £♦” будем считать, что а>- ¡3, если в векторе разности а — ¡3 первая слева ненулевая координата положительна.
• Лексикографический порядок в градуированном моноиде. Градуируем
оо
моноид М = Ц/Ц., где М1 = {а | +... + ап = /'} . При /' > у всякий
1=0
элемент множества М( больше любого элемента множества Мj. Порядок в каждом М( зададим как лексикографический.
• Обратный лексикографический порядок в градуированном моноиде.
оо
Г радуируем моноид М = Ц/Ц., где М, = {а е^"+ \а1+ ... + ап = 1} . При /' > ]
/=0
всякий элемент множества М1 больше любого элемента множества \1/. Порядок в каждом М( зададим как обратный лексикографический, т. е. для элементов а, ¡3 е М / выполняется соотношение а >- ¡3 тогда и только тогда, когда первая справа ненулевая координата в векторе разности а — ¡3 отрицательная.
Фиксируем некоторый допустимый порядок -< на множестве термов Т(X). Фиксируем также некоторое поле К . Элементами кольца многочленов на множестве переменных X = {х1,...,хп} являются выражения вида
1ет{х)
где а1 е К иа,^0 только для конечного множества термов I (Е Т{\).
Определение. 5 Пусть А — поле. Конечное множество С называется базисом Гребнера идеала I кольца А[Х], если
• С — базис идеала / ,
• М/е138еО\НТ{8)\НТ{/).
Поскольку А — поле, старший моном любого элемента идеала делится на старший моном некоторого элемента базиса Гребнера этого идеала. Отметим также, что базисы Гребнера идеала для различных допустимых порядков на множестве термов Т (X) различны.
3. Простая система уравнений со сложным базисом Гребнера
Теорема 1. 6 Задача построения базиса Гребнера булева идеала не принадлежит классу ГР.
Рассмотрим кольцо многочленов К[Х] от переменных множества Л' = ¡х,...хи\ над произвольным полем К. Фиксируем целое число
О < .V < п для целого 0 < / < £ обозначим через о‘)" (х........х ) / -й
симметрический многочлен. Далее будем предполагать, что хактерика поля К либо 0, либо больше 5 .
Фиксируем неотрицательное целое число к <п , где п — число переменных в кольце многочленов. Рассмотрим идеал / , порожденный многочленами
Мх1,...,хп) = х1+... + хп-к, /.(х1;...,хи) = х,2-х,., / = 1 ,...,п. (2)
Рассмотрим множество многочленов = {/ I / = 1,...,и}.
Лемма 1. 7 Пусть идеал I определен многочленами из формулы (2) и заданы два целых числа 0 < /' < 5 < п. Тогда существует такой многочлен Р11 (х^!,...,хп) степени не выше / от переменных х!+1,...,хп, что
^‘Чх1,...,х1) + Р^(х1+1,...,хп)е1.
Доказательство. Воспользуемся индукцией по / .
При г = 1 определим многочлен /’ (<хг ........хи... формулой
ри(х-+1 >• • хп) = х,+1 + ■ ■ ■ + х„ ~к = (*,+1 >• • •.*„)~к-
Тогда
/0(х1,...,хП) = аУ(х1+...,х1) + Р1'1(х1+1,...,хП)е1.
Предположим, что существование многочленов /’ г доказано для всех К ]<*. Докажем существование многочлена Р11. Заметим, что для любых а и Ь в силу равенства
а’ — У = (а — Ь)(а^1 + ... + У~1)
и определения идеала из соотношения а — Ье1 следует, что а1 — У е / . Положим
а = х1+... + х! = а[!)(х1,...,х!)Ь =-х!+1-,..-хп+к
-<71(я“,)(ж1+1 ,...,хп) + к.
Легко видеть, что
а1 = ]\-аУ\х1,...,х,) + ь(а\*\х1,...,х,),...У*\(х1,...,х,))(то<1Р),
где Ь — линейная форма. Тогда при некотором к е / выполняется соотношение
а] = у!-сг^)(л-1,...,х^ + 1(сг1м(л-1,...,х^,...,сг^)1(х1,...,х^)
+ /г(х1,...,хи)
Согласно предположению индукции для для всех / = 1............../ — 1 существуют
/г, £ / для которых выполняются соотношения
а]!\х1,...,х!) = 1г1{х1,...,хп)-Р1!{х!+1,...,хп).
Поскольку а1— У е I, и У = <2 !(х!+1,...,хп) и degQj: , то при
некотором ё выполняется соотношение
а*-У = j\■a(f)(xl,...,xs)-L(P.s(xs+l,...,xJ,...,P¡^xs+l,...,xJ)-Qj,Лxs+l’■■■’xn)+g(xl’■■■’xn) и, следовательно, можно определить многочлен Р1 г формулой
ри (х,+1х„) = -т: (0У,, (*,+1 + Д ^ (х1+1(ж1+1Жя)))
у!
Введем обозначение
51 ={0,1}х...х{0,1}.
Для со = ,..., ) е В* положим
I ш |= \ +... + /^.
Для любого целого 0 < к < п определим разбиение множества X на два множества 7 = {х1,..., хк } (в случае к = 1 это множество пустое) и множество 2 = {хк,...,хп} . Напомним, что для любого ш еопределен терм
У" = Г1 у'к-1 1 л1 ... лк1 ,
где ш = ¡к ), и для любого Т) е В" определен терм
2V — у.3п-к+1
к ' ' ' п ’
где ?7 = 0'1,...,
Лемма 2. 8 Пусть 0 < к <2к < п и характеристика поля К больше п или равна 0. Тогда в кольце многочленов К\хк,.. ,,хп\ существует единственный, с точностью до умножения на ненулевую константу, ненулевой многочлен вида \ш\<к
Е л^,
шеВп-к+1
принадлежащий идеалу / .
Доказательство. Вначале докажем существование указанного многочлена, воспользовавшись леммой 1.
Положим $ = к — 1. Согласно лемме 1 для всех /' < к определены многочлены /’ к , удовлетворяющие условиям
СГ{*-г> хк_!) + Р1к_х (хк,...,хп)еР
Поскольку с1ец /’ к , < /. а идеал / — булев (см. определение 3), то
существуют такие многочлены ¡1 к € / и
I из |< /
а,*(**,-,*»)= Е
и определения идеала из соотношения а — Ь&1 следует, что ак —Ък е /. Положим
а = х1+... + хк_р = —хк —,.. — хп+к.
Раскрывая скобки и используя соотношения х,2 = х, при всех / = 1...........п
получаем равенства
что
^.і_і(хі,...,хи) = ба(хі,...,хи) + /г.Дхі,...,хи).
Тогда
для всех пар к , удовлетворяющих условию 0 < /' < к — 1 < п . Заметим, что в силу равенства
ак-Ък ={а-Ъ){ак-1 +... + Ък-1)
к-1
к-1
Тогда в силу соотношений (3) выполняется равенство
\из\<к
и, учитывая, что ак —Ьк є /, получаем
І-1
| из \< к
Поскольку характеристика поля К больше к , многочлен
к-1
| ш |< к
не равен 0, принадлежит кольцу многочленов К\/.\ и идеалу / .
Далее покажем, что указанный многочлен единствен. Выберем любой многочлен
\со\<к р{хк,...,хя)= ^2
шеВ”-к+1
удовлетворяющий условиям леммы 2. Необходимым условием принадлежности многочлена р идеалу / является равенство этого многочлена нулю во всех корнях идеала / .
Разобьем множество М всех корней идеала / на непересекающиеся
подмножества М(, где / = 0.1.....к — \, Для этого определим множество А/,
как множество корней (а1,...,ап) идеала, удовлетворяющих условию а1 +... + <\к = /'. Множества А/,, очевидно, не пересекаются. Поскольку
идеал / булев, то координаты корней могут быть равными только 0 или 1. Поэтому а1 +... + о/; < к . Следовательно, множество корней М идеала /
представимо в виде разбиения к-\
м = Цм,..
/=0
Докажем, что
АШ=(-1)НАШ0, (4)
где
со0 = (0,...,0).
Доказательство проведем индукцией по і =\ш\.
Пусть | ш |= 1. Рассмотрим множество корней А//; с М. Поскольку а1+... +ак_1= к — 1, то только одна из координат (ак,...,ап) равна 1, а остальные нулевые. Все эти корни находятся во взимнооднозначном соответствии с такими векторами со є к , что | со |= 1. Поскольку многочлен р обращается в нуль на таких векторах, то для всех | со |= 1 выполняется равенство Л = — Лшо.
Пусть равенство (4) доказано для всех | со |< т < к . Докажем равенство (4) для всех \со\= т.
Рассмотрим множество корней Поскольку а1 +... + ак1 = к — т ,
то из координат {ак,...,ап) в точности т равны 1, а остальные нулевые. Все такие решения находятся во взимнооднозначном соответствии с такими
что | со |= т . Заметим, что согласно определению множества Мк
и предположения индукции для таких решений выполняется равенство
| со |< т \со\<т | |= т
р(ак,...,а„) = £ ХШАШ = £ (-1)МЛшо^+ \А\
шевп-к+\ шеВ”-к+1 пЕВ”-к+1
где А = (ак,...,ап). Согласно определению множества \1к ш и ввиду
неравенства 2к <п при 0< /' < т на решениях из Мк справедливо
равенство
I со |= / | со |= /
£ (_1)НЛшо^= £ (-1)'ХшА"=(-1У-т .Лшо.
вп-к+1 шевп-к+1 I
Также выполнено равенство
| г] |= т А = V \А\
40 / ■< V ’
певп-к+1
где г]0 = (п/;...., ап). Заметим, что справедливы равенства
т
Тр (-1)' =(1-1Г =0. (5)
/=0
/
Поскольку многочлен р равен нулю на таких векторах (ак,..., ап), то выполняются равенства
т-1
р(ак,...,ап) = ^2(~^У-т -Ашо+\ =0.
1=0
I
Учитывая теперь соотношение (5) получаем равенство Ачо = (— 1)"' ■ А 0. Следовательно, для всех | со |= т выполняется равенство Л = (— 1) ■ Л о. Поэтому
р{ак,...,ап) = \о
Следствие 1. 9 Пусть выполняются предположения леммы 2. Тогда многочлен
р{ак,...,ап) = (**. • • •, )• (6)
является неприводимым элементом базиса Г ребнера идеала / для лексикографического упорядочения термов на множестве переменных
X = {х1,...,хп}.
Доказательство. Предположим, что многочлен р приводим. Тогда существует элемент g неприводимого базиса Гребнера идеала / , старший терм которого делит один из термов многочлена р. Следовательно, этот старший терм многочлена g содержит только переменные из множества Т = {хк,..., хп} . Поскольку термы многочлена g упорядочены
лексикографически, все его остальные термы также зависят только от переменных из множества 2 . Поэтому многочлен g удовлетворяет условиям
леммы 8, и многочлен р Є К\хк,...,хп\ отличается от g ненулевым множителем, т.е. р неприводим.
Следующее утверждение завершает доказательство теоремы 1.
п
Следствие. 10 При к = —
относительно описания идеала I формулами (2).
Доказательство. Многочлен р является неприводимым элементом базиса
п
размер базис Гребнера идеала I экспоненциален
Г ребнера идеала / и содержит
к +1
> 2" термов с коэффициентами 1.
4. Нахождение решений систем алгебраических уравнений с использованием базиса Гребнера
Определение 3. 11 Поест I в кольце многочленов АГ[х1,...,хи] надполем К называется булевым, если х2 — хі Є / для любого 0 < і <п . Система уравнений, определяющая такой идеал, называется булевой.
Теорема 2. 12 Гели булева система уравнений над полем К имеет единственное решение, то приведенный базис Гребнера идеала этой системы определен однозначно с точностью до коэффициентов и не зависит от выбора допустимого порядка на множестве мономов.
Доказательство. В силу соотношений х2 = х( все х принимают значения в множестве {0,1}, и следовательно, решения, принадлежащие алгебраическому замыканию поля К , лежат в поле К . Пусть единственным решением булевой системы уравнений является набор хІ. = а,, і = 1,...,и. Докажем вначале, что идеал
I = {х1-а1,...,хп-ап}
совпадает в этом случае с идеалом, заданным булевыми уравнениями исходной системы уравнений. Действительно, поскольку x¡ — а. обращается в нуль во всех решениях исходной системы, то согласно теореме Гильберта о нулях идеала при некотором натуральном к многочлен (х, — at f принадлежит идеалу, заданному исходной булевой системой уравнений, а тогда и сам многочлен х — д принадлежит этому идеалу, поскольку
выполняется равенство xf = xt. Следовательно, идеал / лежит в идеале J, заданном булевыми уравнениями исходной системы уравнений. Очевидно, что для любого многочлена f е J выполняется соотношение f —> , а, где
j j р _ ;
а е{0,1}. Если этот элемент ненулевой, то система не имеет решения. Если этот элемент нулевой, то это означает, что / G / . Поэтому I = J .
Пусть F0 — приведенный базис Гребнера, относительно некоторого допустимого порядка. Пусть хп — наименьший моном положительной степени относительно этого порядка. Тогда из хп—ап el следует существование многочлена he F0 старший моном которого делит моном хп. Поскольку моном хп — наименьший, этот моном делится на старший моном многочлена h . Следовательно, xn—aneF0. Переменная хп не входит ни в один оставшихся многочленов базиса Гребнера F0. Следовательно, рассуждая как выше получаем, что в базис Гребнера входит также хп_х —ап_х, где хп_х следующая по старшинству переменная.
Следствие 3. 13 Задачи нахождения базиса Гребнера и единственного решения для булевых идеалов, имеющих единственное решение эквивалентны.
Литература.
[Bar04] Bardet, М. and Faugere, J.C and Salvy, В. “On the complexity of Gröbner basis computation of semi-regular overdetermined algebraic equations’Mn: International Conference on Polynomial System Solving - ICPSS. Paris, France, Nov. 2004, pp. 71 -75.
[Bro87] D. Brownawell. “Bounds for the degrees in the Nullstellensatz”. In: Armais of Math. Second Series 126.3 (1987), pp. 577-591.
[ВисОб] B. Buchberger. Ein Algorithmus zum Auffinden der Basiselemente des Restklassenrings nach einem nulldimensionalen Polynomideal (An Algorithm for Finding the Basis Elements in the Residue Class Ring Modulo a Zero Dimensional Polynomial Ideal). PhD thesis, Universität Innsbruck, 1965. English translation in J. of Symbolic Computation, Special Issue on Logic. Mathematics, and Computer Science: Interactions. 41(3/4):475—511,2006.
[BucOl ] В. Buchberger. Gröbner Bases : A Short Introduction for Systems Theorists, Computer Aided Systems Theory—EUROCAST 2001 (2001) Volume: 330, Issue: 9, Publisher: Springer, Pages: 1-19.
[Gio52] Trevisan Giorgio. “Classificazione dei semplici ordinamenti di un gruppo libero commutativo con n generatori”. In: vol. 22. CEDAM, 1952, pp. 143-156.
[Giu84] Marc Giusti.“Some Effectivity Problems in Polynomial Ideal Theory”. In: Proceedings of the International Symposium on Symbolic and Algebraic Computation. EUROSAM’84. London, UK: Springer-Verlag, 1984, pp. 159-171.
[Fau02] J.-C. Faugere. “A new efficient algorithm for computing GroDbner bases without reduction to zero (F5)”. In: Proceedings of the 2002 international symposium on Symbolic and algebraic computation. ISSAC ’02. Lille, France: ACM, 2002, pp. 75-83.
[Fau99] J.-C. Faugere. “A new efficient algorithm for computing GroDbner bases (F4).” In: Journal of Pure and Applied Algebra 139. l-3(June 1999), pp. 61-88.
[Her25] G. Hermann. Die Frage der endlich vielen Schritte in der Theorie der Polynomideale: Unt. Benutzung nachgelassener Satze v .Kurt Hentzelt. Springer, 1925.
[HL11] Amir Hashemi and Daniel Lazard. “Sharper Complexity Bounds for Zero-Dimensional Gröbner Bases and Polynomial System Solving”. In: IJAC 21.5 (2011), pp. 703-713.
[KM96] Klaus Kühnle and Ernst W. Mayr. “Exponential space computation of Gröbner bases”. In: Proceedings of the 1996 international symposium on Symbolic and algebraic computation. ISSAC’96. Zurich, Switzerland: ACM, 1996, pp. 63-71.
[Laz83] Daniel Lazard. “Gröbner-Bases, Gaussian elimination and resolution of systems of algebraic equations”. In: Proceedings of the European Computer Algebra Conference on Computer Algebra. London, UK: Springer-Verlag, 1983, pp. 146-156.
[May89] Ernst W. Mayr. “Membership in Polynomial Ideals over Q Is Exponential Space Complete”. In: STACS. Ed. by Burkhard Monien and Robert Cori. Vol. 349. Lecture Notes in Computer Science. Springer, 1989, pp. 400^106.
[May97] Ernst W. Mayr. “Some Complexity Results for Polynomial Ideals”. In: J. Complexity 13.3 (1997), pp. 303-325.
[MM82] E. Mayr and A. Meyer. “The complexity of the word problems for commutative semigroups and polynomial ideals”.English.In:Adv.Math., Beijing 46.3 (Dec. 1982), pp. 305-329.
[RiqlO] C. Riquier. Les systèmes d’équations aux dérivées partielles. Cornell University Library historical math monographs. Gauthier-Villars, 1910.
[Rob85] Lorenzo Robbiano. Term orderings on the polynomial ring. Computer algebra, EUROCAL ’85, Proc. Eur. Conf., Linz/Austria 1985, Vol. 2, Lect. Notes Comput. Sei. 204,513-517(1985). 1985.
[МИ53] Зайцева М.И.. “О совокупности упорядочений абелевой группы”. Успехи математических наук 8 (1953), pp. 135-137.
[Dube] Т. W. Dube, The structure of polynomial ideals and Grobner bases, SIAM Jomal of Computing, 19: 750-773, 1990.