УДК: 519.853.4
О ЗАДАЧАХ ОПТИМИЗАЦИИ ПОКАЗАТЕЛЯ ГУРВИЦА ДЛЯ СЕМЕЙСТВ МНОГОЧЛЕНОВ
© 2008 А. М. Фрумкин
доц. кафедры электротехники, электроники и автоматики, к.т.н., e-mail: frumkinam@mail. ru Курский государственный технический университет
Статья посвящена задачам минимизации максимума вещественных частей корней для многочлена с варьируемыми коэффициентами.
Ключевые слова: многочлен, корень, показатель Гурвица, критерий Гурвица, семейство многочленов, минимакс.
Пусть (ai,a2,...an-i,an) - вещественный n-мерный вектор (neN),
f(a,^)=^n+a^n-1+a2^n-2+...+an - соответствующий многочлен степени n, Z(a)={^eC: f(a,^)=0} - множество его корней. Здесь N - множество натуральных чисел, C -множество комплексных чисел. Показателем Гурвица многочлена f(a,) (или вектора a)
назовем число x(a) = max Re(A.) . Так же, как и корни многочлена, показатель Гурвица
XeZ(a)
является непрерывной функцией его коэффициентов. Теорема о непрерывной зависимости корней многочлена от его коэффициентов будет существенно использована в дальнейших рассуждениях. Эта теорема может быть доказана, например, на основе результатов, представленных в [Стоилов1962: глава 10].
В теории автоматического регулирования возникает такая задача. Имеется
гладкое отображение a:Rm^Rn, определяющее семейство многочленов с
вещественными коэффициентами:
g(aA)=f(a(a)A)=r+ai(a)r-1+a2(a)r-2+. ..+an(a). (1)
Коэффициенты многочленов g(a,^) зависят от параметра - m-мерного вектора a=(a1,a2,...am)eRm. Необходимо найти множество значений a, при которых функция x(a(a)) имеет наименьшее значение. Искомое множество (как и во всякой оптимизационной задаче) может быть пустым, конечным или бесконечным. От классических задач минимакса эта задача отличается тем, что корни многочлена g(a,^) не являются гладкими функциями a: гладкость нарушается при значениях a, которым соответствуют кратные корни.
С позиций теории регулирования, a - набор изменяемых параметров технического объекта; многочлены исследуемого семейства g(a,) являются
характеристическими для линейных дифференциальных уравнений, описывающих переходные процессы в объекте в окрестности установившегося положения равновесия при различных значениях a. Решение описанной задачи позволяет найти множество значений a, при которых переходные процессы протекают в определенном смысле наиболее быстро. Содержательным является случай, когда область Qa={aeRm: V^eZ(a(a)) Re(^)<O}^0, то есть всегда существуют a, при которых положение равновесия асимптотически устойчиво. Область Qa далее будем называть областью Гурвица, а семейство многочленов a(a) с Qa^0 - гурвицевым. Введенная терминология согласована с [Курош 1949].
Если имеется возможность путем изменения a варьировать независимо все коэффициенты многочлена, то (в отсутствие ограничений на область изменения a)
показатель Гурвица может быть сделан как угодно малым и искомое множество значений a пусто. В частности, искомое множество пусто в случае n=1 и неограниченного сверху a1(a). Содержательными являются случаи m<n.
В данной статье аналитически решается несколько задач оптимизации показателя для простых гурвицевых семейств многочленов степени n=2,3.
Сначала докажем две леммы, которые могут быть применены к исследованию семейств многочленов произвольной степени. Далее начало и завершение доказательства обозначаются соответственно символами ^ и ^, противоречие -символом ■ , значения параметров, при которых показатель Гурвица минимален, будем называть особыми.
Лемма 1. Пусть (a1,a2,...an-1,an)eRn - гурвицев n-мерный вектор (neN), то есть
a1 a1
у (a) = max Re(A,) < 0. Тогда x(a) > -—, и если x(a) = - —, то все корни f(a,) имеют XeZ(a) n n
a1
одинаковые вещественные части, равные - —.
n
Р
^ Лемма. Пусть у1,у2,...уР - p неотрицательных чисел и ^у k = s. Тогда для
k=1
некоторого ke1p yk<s/p и для некоторого ke1p yk>s/p. ^ Действительно, если Vk ke1,p Р
yk>s/m, то ^у k > s, что противоречит условию леммы. Аналогично, если Vk ke 1,p k=1 Р
yk<s/m, то ^у k < s, что противоречит условию леммы. ^ k=1
Пусть ^1, Я,2, ... ^n - некоторая нумерация корней f(a,) с учетом их кратности. По
теореме Виета, a1 = -(^1+^2+...+^n). Так как сумма в правой части равенства содержит
вместе с каждым комплексным корнем его сопряженное значение, то все мнимые части
корней взаимно уничтожаются, и (с учетом равенств Vke1n Re^k=-|Re^k|)
a1= -(Re^1+Re^2+. ..+Re^n)=|Re^1 |+|Re^|+. ..+|Re^n|. (2)
Согласно лемме для некоторого pe1,n |Re^p|<a1/n ^ Re^p=-|Re^p|>-a1/n, то
есть x(a)= max Re(A, k) >Re^p> -a1/n.
1< k<n
a1
Пусть x(a) = - —. Если для некоторого корня ^p Re^p> -a1(a)/n, то x(a)> -a1(a)/n
■ , то есть V ke1n Re^k<-a1(a)/n. Если для некоторого p Re^p< -a1(a)/n, то ReA, 1 +Re^2+... +Re^n< -a1 ■ ^
Лемма 2. Пусть f(a,A)=An+a1An-1+a2An-2+...+an - гурвицев многочлен и рассматривается задача оптимизации показателя Гурвица при изменении только одного коэффициента ak=a. Все остальные коэффициенты am>0 (m^k) фиксированы. Для любой такой задачи (любого ke 1,n) имеeт место следующее утверждение: если значению варьируемого параметра a соответствует некратный вещественный корень многочлена, больший вещественных частей всех других корней, то данное значение параметра a - неособое.
^ Пусть варьируются значения an (то есть рассматривается семейство f(a,^)=^n+a1^n- +a2^n- +...+an-1A+a, a1, a2, ... an-1 - фиксированы) и для некоторого a0 выполняется условие утверждения. Обозначим рассматриваемый некратный корень А0.
По определению показателя Гурвица, x(a0)=A0. Рассмотрим частные производные f по
a и X в точке (a0,X0). Индексы при значке д далее указывают номер позиции аргумента, по которому дифференцируем. d1f(a0,X0)=1, d2f(a0,X0)^0 в силу некратности X0. По теореме о неявной функции, отношение {(a,X)eR2: f(a,X)=0} в некоторой
прямоугольной окрестности (a0,X0) является непрерывно дифференцируемой
df(a 0, X 0)
функцией, которую мы обозначим через ф. 9'(a0)= - ----г—-^0, и потому в
д2f(a 0,X0)
некоторой окрестности a0 она строго монотонна. Пусть X1, X2, ... Xn-1 - оставшиеся
корни f(a0,). По условию ^= max Re(X m)<X0. Пусть ^e(^,X0), например
1< m< n-1
^=(Л+Х0)/2. В силу непрерывной зависимости корней от коэффициентов мы всегда можем найти такой интервал I, содержащий a0, что для любого aeI вещественные части корней, соответствующих a и близких к Х1, Х2, ... Xn-1, будут меньше ^, а вещественный корень ф^) будет больше ^. С другой стороны, в силу монотонности ф мы всегда можем найти такое aeI, что ^^(a)<X0. Тогда х^^ф^^х^), то есть a0 не является особым значением.
Рассуждения для задачи, в которой изменяется коэффициент с номером m<n, отличаются от проведенных только одной деталью: производная f по a равна mX0m- . Если X0=0, то, в силу гурвицевости семейства f, рассматриваемое значение не является особым. Если X0^0, то рассуждения полностью повторяют проведенные. ^
В рассматриваемых ниже задачах некоторые коэффициенты многочлена считаются фиксированными, а оставшиеся варьируются (принимая любые вещественные значения). Поэтому далее не используются специальные обозначения для семейства коэффициентов a: постоянные значения обозначаются латинскими буквами, а варьируемые (не более двух) - греческими. Во всех задачах область Гурвица обозначается буквой Q и описывается с использованием критерия Гурвица [Курош 1949; Лаврентьев 1973]. Искомое множество особых значений будем обозначать буквой S. Если p - набор варьируемых параметров (p=a или р=^,Р)), то многочлен, соответствующий р, множество его корней и показатель Гурвица, как функции параметров, обозначаются соответственно как f(p,), A(p)={XeC: f(p,X)=0} и x(p).
Формулировки и решения задач представим в форме доказываемых утверждений.
Утв. 1. Пусть f(P,X)=X +PX+q - семейство многочленов с постоянным q>0 и варьируемым Р ( в данном случае Q=(0,ro)). Тогда особая точка Р единственна: Р=2д/^,
x(p)= - Vi , S={^Vq}.
^ Пусть Р<2д/^, то есть дискриминант трехчлена D=p2/4-q<0. Тогда оба корня имеют одинаковые вещественные части, равные x(P)= - P/2>-^q. Пусть Р>2д/^, то есть дискриминант трехчлена D=p2/4-q>0. Тогда трехчлен имеет вещественный корень
X =-Р + ,
/Lmax 2 \
Утв. 2. Пусть f(a,X)=X2+pX+a - семейство многочленов с постоянным p>0 и
варьируемым a (в данном случае также Q=(0,ro)). Тогда особая точка не единственна:
2
Р Р
-4 - q >- 2> -Vq, то есть x(p)> -Vq. при p=2Vq x(p)= -л/ч >
S=[p /4,го) л VaeS x(a)= -p/2.
^ Действительно, если
максимальный из которых X max = - ^ ^
^ Действительно, если а<р2/4, то многочлен имеет два вещественных корня,
Р
p2 p 2
— - a > - 2, то есть x(a)> -p/2. Если a=p /4,
то многочлен имеет кратный вещественный корень k= -p/2, то есть х(а)= -p/2. Если а>р /4, то многочлен имеет два комплексных корня k^k2 с одинаковыми вещественными частями Re^=Rek2= -р/2, то есть снова х(а)= -р/2. Таким образом, S=[p2/4,œ) не пусто и является искомым множеством. ^
Лемма 3. Пусть f(a,X)=X3+a1X2+a2X+a3 - гурвицев многочлен и рассматривается задача оптимизации показателя Гурвица при изменении только одного коэффициента ak=a (кє 1,3). Все остальные коэффициенты am>0 (m^k) фиксированы. В смысле любой такой задачи (любого кє 1,n) для того, чтобы параметр а был особым, необходимо существование набора положительных чисел (s,p,q), удовлетворяющих следующим условиям:
1) s+p=a1, sp+q=a2, sq=a3 (здесь, в зависимости от задачи, a1=a или a2=a или a3=a), p2<4q, p<2s;
2) если другому значению а' соответствует набор (s',p',q'), удовлетворяющий условиям 1), то p'<p.
^ Пусть а - особое значение. Соответствующий многочлен обозначим g(a,k). В силу гурвицевости семейства все корни g(a,k) имеют отрицательные вещественные части. Далее, g(a,k), как многочлен нечетной степени, имеет по крайней мере один вещественный корень. Обозначим через -s самый маленький из вещественных корней многочлена g(a,k). Представим многочлен в виде произведения: g(a,k)=(k+s)(k +pk+q). Здесь p>0A q>0, так как g(a,k) - гурвицев. Раскрыв скобки, получим: s+p=a1, sp+q=a2, sq=a3 (в соответствии с задачей a1=a или a2=a или a3=a). Пусть p2>4q. Тогда многочлен
p2
q.
1 Р
имеет помимо -б еще два вещественных корня: к 2 = - ^ - ^
По самому выбору б имеем -Б<к2<к3 и по лемме 2 а - неособое значение И. Следовательно, р2<4д. Тогда вещественные части двух оставшихся корней есть -р/2. Если р>2б, то -р/2<-Б, то есть, опять по лемме 2, а - неособое значение И. Следовательно, р<2б, -р/2>-Б и х(а)= -р/2. Пусть теперь для некоторого а' найдется набор (8',р'^'), удовлетворяющий условиям 1). По этим условиям многочлен представляется в виде §(а',к)=(к+8')(к2+р'к+д') и оказывается, что х(а')= -р'/2, поэтому, если р'>р, то х(а')<х(а) и а - неособая точка И, то есть р'<р ►
Далее будут рассматриваться задачи оптимизации показателя Гурвица для семейств многочленов вида Г(а,р,к)=к3+а1к2+рк+а, где значение а1>0 фиксировано, а а и Р варьируются вместе или поодиночке.
Утв. 3. Пусть Г(а,к)=к3+а1к2+а2к+а - семейство многочленов третьей степени, зависящих от параметра а. Здесь а1,а2>0 - константы, 0=(0,а1а2). Если 3а2>а12, то при а1 2 2
а = “3^2 - 9"а1) показатель Гурвица принимает минимальное значение, равное -а1/3.
2 1 I 2 I 2 2
Если 3а2<а1 , то при а = 27^1 + 2^^ -3а2)[а^ -^а^ -3а2 ] показатель Гурвица
1 п-------
принимает минимальное значение, равное - 3^1 -у а^ - 3а2 ) . В обоих случаях точка
минимума единственна.
^ Пусть а особая точка, (Б,р,д) - набор чисел, удовлетворяющий условиям 1) и
2) леммы 3. Из равенств Б+р=а1, Бр+д=а2 следует, что Б=а1-р, д=а2-(а1-р)р=а2-а1р+р2, поэтому неравенства из условия 1) переписываются так:
2
р<2(а1-р), р2<4(а2-а1р+р2) или р< — а1, 3р2-4а1р+4а2>0.
Согласно условию 2) леммы 3 р должно иметь максимальное значение при условии выполнения двух последних неравенств. Для того чтобы р могло принять
2
максимальное значение р=^аь необходимо, чтобы
2 2 2 2 3(— а1) -4а1-3 а1+4а2>0 о 3а2>а1 .
2 2 11 2 Таким образом, при 3а2>а1 р=^а1, 8=2Р=3аь Ч=а2-$р=а2-2а1 /9, а=БЧ,
а^ 2 2
а = у (а2 - 9а1), Х(а)=-а1/3.
22 Пусть 3а2<а1 . В этом случае неравенство 3р -4а1р+4а2>0 имеет два промежутка
2 / 2 2 / 2 решений: (-да, 3^1 -уа^ -3а2 ) ] и [3^1 + \а1 -3а2), +да). Второй промежуток не
2
пересекается с промежутком (0, ^а1], поэтому, в силу неравенства
2 Г~2------ 2
3^1 -^ а1 - 3а2)<^а1, множество возможных значений р, определяемое
2 П--------------
необходимыми условиями особой точки, - это промежуток (0,^(а1 -^а1 -3а2)].
2 П--------
Максимальное возможное значение р=з^ -^ а1 - 3а2 ) определяет особое значение а. Данному значению соответствуют
_ 2/ ¡~2 “ ч_а1 + 2л/а2 - 3а2
Б=а1 - 3 (а1 -^ а1 - 3а2)= 3
а1 + 2д/а2 - 3а2 1 I 2 0 \2
Ч = а2-эр=а2-р---------3--=9(а1^а1 - 3а2 ) ,
1 I 2 2 I 2 2 р 1 I 2
а=8ч= уу (а1+^ л/ а1 - 3а2) (а1 -д/а1 - 3а2), х(а)= - 7 = - 3(а1 -д/ а1 - 3а2).
Проведенные рассуждения показывают, что при любом соотношении между а2 и а1 найдется единственное значение а, которое может быть особым. С другой стороны, непрерывная функция х(а) достигает минимума на замкнутом множестве О = [0,а1а2], причем крайние точки особыми не являются. Следовательно, найденное значение действительно является особым. ^
Утв. 4. Пусть А(РД)=к +а1к +Р^+а3 - семейство многочленов третьей степени, зависящих от параметра р. Здесь а1,а3>0 - константы, О=(а3/а1,да). Если 27а3>а13, то при
2 2 а3
Р = _ а1 + 3— показатель Гурвица принимает минимальное значение, равное -а1/3. 9 а1
Если 27а3<а13, то многочлен ф(р)=р3-а1р2+4а3 в
2
промежутке (0, ^а1]
имеет
единственный корень ^. При Р= ^(а1 -^) + —3— показатель Гурвица принимает
а1 -л
минимальное значение, равное -^/2. В обоих случаях точка минимума единственна.
^ Рассуждения аналогичны рассуждениям предыдущего доказательства. Пусть а особая точка, (в,р,ч) - набор чисел, удовлетворяющий условиям 1) и 2) леммы 3. Из
I а3 1 л
равенств Б+р=а1, 8Ч=а3 следует, что Б=а1-р, ч=--------, поэтому неравенства из условия 1)
а1 - р
леммы 3 переписываются так:
2 а3 2 3 2
р<2(а1-р), р <4------- или р<— а1, р -а1р +4а3>0.
а1 - р 3
Согласно условию 2) леммы 3 необходимо, чтобы р имело максимальное значение при условии выполнения двух последних неравенств. Для того чтобы р могло
2
принять максимальное возможное значение р=^ а1, необходимо, чтобы
2 3 2 2 3
(— ах) -а1(— а1) +4а3>0 о 27а3>а1
3 2 1 1 2 2 а3
Таким образом, при 27а3>а1 р=—а^ б=—р=—а^ ч=3а3/а1, Р=Бр+ч = —а1 + 3—,
3 2 3 9 а1
х(р) = - а1/3. з
Пусть 27а3<а13. В этом случае особое значение Р определится решениями неравенства р -а1р +4а3>0. Многочлен ф(р)=р -а1р +4а3 имеет две точки локального экстремума, определяемых условием ф'(р)=3р2+2а1р=0. Это р0=0 и р1=(2/3)а1. На
2
промежутке [р0,р1]=[0,‘3 а1] ф строго монотонно убывает и, в силу условий ф(р0)=4а3>0
а3
и ф(р1)=4(а3 -—)<0, имеет на этом промежутке единственный корень, который мы
2
обозначим л. Так как для р имеется дополнительное ограничение: 0<р<^-ь то
множество возможных значений р, определяемых необходимым условием особой точки, - промежуток (0,л]. Максимальное возможное значение р=л. Соответственно
8=^^ Ч= а3 , р= Л(а1 -л)+ ~!— и Х(р)= -у. а1 - л а1 - л 2
Таким образом, как и в предыдущей задаче, при любом соотношении между а3 и
а1 найдется единственное значение Р, которое может быть особым. Для того чтобы
показать, что это значение действительно является особым, покажем, что для
Л
некоторого р0>0 при р>р0 Х(Р)> - 2 . Действительно, пусть РеО, -б - вещественный корень многочлена ДР,) и Г(Р,к)=(к+в)(к2+рк+ч), где р,Ч>0. Тогда ч=Р-Бр. С другой стороны, 8р<(8+р)2/4=а12/4, то есть ч>Р-а12/4. Пусть 0<8<у. Выберем р0>а12/4
достаточно большим, чтобы б = —3 <------------<8, то есть Р0 > _ а2 + —. Тогда для
Ч а2 48
р0 - 4
Л
Р>Р0 х(Р)>-б>-8>-1. На промежутке
[~,Р0] непрерывная функция х(Р) достигает а1
минимума, причем крайние точки особыми не являются. Следовательно, найденное а1
значение ре(-3,р0) действительно является особым. ^
Утв. 5 Пусть Г(а,Р,к)=к3+а1к2+Рк+а - семейство многочленов с постоянным
а1>0 и варьируемыми а,Р (в данном случае О=((а,Р)еК2: 0<а<а1р}). Тогда особая
2 а 13 2 2 3
точка не единственна: 8={(а,Р)еЯ : а>—лР=—а1 +----а} л УаеБ х(а) = -а1/3.
27 9 а1
^ По лемме 1 показатель Гурвица не может быть меньше, чем -а1/3. Поэтому, если множество Б={(а,Р)еО: х(а,Р)=-а1/3}^0, то это множество есть решение задачи. Пусть (а,Р)еБ. Рассмотрим представление Г(а,Р,к)=(к+в)(к+рк+ч). По лемме 1 все вещественные части корней многочлена Г(а,РД) должны быть равны между собой. Из
2
условия р -4ч>0 следует, что все корни вещественны и по крайней мере два из них
различны И. Следовательно необходимо выполнение неравенства р2-4ч<0, и тогда
Б=а1/3, р=2а1/3. Неравенство р2-4ч<0 с учетом равенства БЧ=а эквивалентно такому:
а3
а> —. Каждому а, удовлетворяющему последнему неравенству, можно подобрать
2 2 3
только одно значение Р: Р=Бр+ч= 9^1 +----а. Таким образом, Б^0. '
Мы видим, что решение задачи оптимизации показателя Гурвица не всегда
однозначно. При определении параметров регуляторов с использованием семейств
характеристических многочленов можно сформулировать дополнительное условие,
согласно которому в множестве Б выбирается единственное значение. Это условие -
отсутствие колебаний величин в переходном процессе, то есть отсутствие комплексных
корней у многочлена, соответствующего выбираемому значению параметра. Таким
образом, в задаче описываемой Утв. 2, наилучшим будет а=р2/4, а в задаче
„3 2
а1 а1
описываемой Утв. 5, наилучшей будет пара (а,Р)=(—, —).
Библиографический список
Стоилов, С. Теория функций комплексного переменного. Т. 1. / С. Стоилов. -М. : Ин.Лит., 1962. - 364 с.
Курош, А. Г. Курс высшей алгебры / А. Г. Курош. - М.-Л.: ГИТТЛ, 1949. - 335 с. Лаврентьев, М. А. Методы теории функций комплексного переменного / М. А. Лаврентьев, Б. В. Шабат. - М. : Наука, 1973. - 736 с.