Вычислительные технологии
Том 9, № 2, 2004
ОБ УСЛОВИЯХ ОПТИМАЛЬНОСТИ РЕШЕНИЯ ИНТЕРВАЛЬНОЙ СИСТЕМЫ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ
М.А. Ляшко Балашовский филиал Саратовского государственного университета, Россия e-mail: [email protected]
Sufficient conditions for the coincidence of the interval hull XH for the combined set £ of solutions of the interval system x = Ax + b with p(|A|) < 1 and the fixed point x* of the mapping Ax + b : IIRra ^ IIRra are proved. When xH < xH, a j = 0 and aj = 0 (i,j=1,n) these conditions also become the necessary ones.
1. Постановка задачи
Для интервальной системы линейных алгебраических уравнений
x = Ax + b, A e HRraxra, b e IIRra, (1)
одной из важных задач является задача нахождения объединенного множества решений (ОМР)
£ = {x|(3A e A)(3b e b)(x = Ax + b)} .
При условии невырожденности всех вещественных матриц, входящих в интервальную матрицу I — A, множество £ ограничено и актуальной является задача нахождения интервального вектора минимальной ширины, содержащего множество £, т. е. так называемой интервальной оболочки XH = , xf,... , множества £, где
xH = [xH,xH] , xf = min{x^|x e £}, xH = max{x^|x e £}, i = l,...,n. (2) В дальнейшем будем предполагать, что £ ограничено, т. е. XH существует. Точные значения min {x^|x e £} и max {x^ |x e £} достигаются при решении систем x = Ax + b, когда значения коэффициентов равны концевым значениям соответствующих интервальных коэффициентов матрицы A и вектора b. Таким образом, решение 2га(га+1) точечных систем гарантирует точное получение XH.
© Институт вычислительных технологий Сибирского отделения Российской академии наук, 2004.
-4
л
4
Х1
-5 -
3
X
4 5
Х1
Рис. 1.
Если в системе (1) р(|А|) < 1 (т.е. отображение Ах + Ь : ПЯ" ^ ПЯ" является сжимающим), то единственный неподвижный интервальный вектор (неподвижная точка) х* этого отображения в силу определения обращающий уравнение (1) в верное равенство
х* = Ах* + Ь
(3)
может быть найден с заданной точностью каким-либо итерационным методом. При этом выполняется включение
Xя С х*.
В некоторых случаях х* совпадает с Xя. Например, система
х
[0.6, 0.8] [ 0, 0.2] [ 0, 0.1] [0.6, 0.8]
х +
[-0.2, 0.2] [-0.2, 0.2]
(4)
имеет ОМР Е, изображенное на рис. 1 слева [3]. Здесь р(|А|) а и х* = Xя
0.94... < 1, вектор х*
([-4, 4], [-3, 3])
Измененная система
х
[ 0.6 , 0.8] [-0.1, 0.2] [-0.12, 0.1] [ 0.6, 0.8]
х +
[-0.2, 0.2] [-0.2, 0.2]
имеет множество Е, изображенное на рис. 1 справа. При этом р(|А|) = 0.95... < 1 и х* = ([-5, 5], [-4, 4])Т , в то время как интервальная оболочка остается прежней: Xя =
([-4, 4], [-3, 3])Т .
Вопрос о совпадении или несовпадении Xя и х* во включении (4) в общем случае до сих пор остается открытым [6]. Основная задача, рассмотренная в этой статье, состоит в следующем: найти условия, при которых неподвижная точка х* отображения Ах + Ь : 11Я" ^ 11Я" совпадает с интервальной оболочкой Xя объединенного множества решений системы х = Ах + Ь. При выполнении этих условий Xя может быть найдена с помощью итерационных методов, достаточно простых в реализации.
2. Основной результат
Приведем доказанные ранее автором [2] как достаточные, так и необходимые условия совпадения Xя и вектора х* для некоторого класса систем (1). Интервал а = [а, а] будем
4
4
считать неотрицательным, если а > 0, и неположительным, если а < 0. Неотрицательным интервалам поставим в соответствие знак " +", а неположительным - знак "-". Интервалу, для которого а = а = 0, можно поставить в соответствие любой знак. Оказывается, некоторой закономерности в распределении знаков интервальных коэффициентов матрицы А достаточно, а при более жестких условиях и необходимо для совпадения х* и Xя, а именно справедлива
Теорема 1 ([2]). Пусть матрица А в системе (1) состоит только из неположительных и неотрицательных коэффициентов. Для того чтобы интервальная оболочка Xя множества Е совпадала с неподвижной точкой х*, отображения Ах + Ь достаточно, а если при г, = 1,п выполняются требования хя < хя и а^ = [0, 0], г = то необходимо, чтобы в матрице А:
1) главная диагональ была неотрицательная;
2) существовало целое число г € {1, 2, ...,п} такое, что если знаки коэффициентов
и а^, р, д = 1,п,р = д, совпадают, то коэффициенты ард и адр неотрицательны, а
если знаки а^р и а^д не совпадают, то коэффициенты ард и адр неположительны.
Например, указанные ниже распределения знаков интервальных коэффициентов в матрице А размера 5 х 5 достаточны для совпадения х* и Xя:
+ + + - - + - + - + + - + + +
+ + + - - - + - + - - + - - -
+ + + - -, + - + - + , + - + + +
- - - + + - + - + - + - + + +
- - - + + + - + - + + - + + +
Не умаляя общности, проверку условий теоремы можно осуществлять с помощью первой строки (г = 1). Процесс легко алгоритмизируется и требует п(п + 1)/2 повторений цикла проверки соответствия знаков коэффициентов (для г = 1,... , п - 1 и ] = г,..., п).
В данной статье результат, сформулированный выше, распространяется на системы, интервальные коэффициенты которых могут содержать нуль внутри. Произведение интервалов в классической интервальной арифметике определяется так, что можно менять один из операндов, не меняя результат. Например, [-1, 2]-[-4, 5] = [-8,10] = [0, 2]-[-4, 5] = [1, 2] • [-4, 5] и т.д. То есть интервал [-1, 2], содержащий 0, дает в этом примере такой же результат, как и положительный интервал [1, 2]. Произвольная матрица А из системы (1) при умножении на вектор из окрестности неподвижной точки х* может давать результат, как если бы она состояла из интервальных коэффициентов фиксированного знака. Это и позволяет сформулировать для таких систем результат, аналогичный изложенному выше.
Рассмотрим а = [-0.8,0.5], х = [-0.1, 0.2]. Тогда ах = [-0.16, 0.1], причем ах = ах = -0.8 • 0.2 = -0.16 и ах = ах = 0.5 • 0.2 = 0.1. Представим полученное произведение в виде
ах\ = (Яи а^ ^ /х^ (5)
ах/ ^21 а22/ \х/ , ( )
где элементы 2 х 2-матрицы а^ € {0, а, а}, г,^ = 1, 2. Получим
'-0.16\ /0 -0.8\ /-0.1
0.1 0 0.5 0.2 (6)
Очевидно, что произведение а• у того же самого интервала а и достаточно близкого к х интервала у также может быть представлено в виде (5), где матрица 2 х 2 совпадает с матрицей из равенства (6):
'ау^ = (0 (у
V0 05У Ы
В другом случае, например при а = [-0.8, 0.5], х = [-0.1, 16], получим произведение ах = [-0.128,0.08]. Здесь ах = ах = ах = 0.08. Поэтому, представляя результат перемножения а и х в виде (5), получим
—0.128Л = ( 0 -0.8\ (-0.Л = (0 —0.8\ (-0.1
0.08 = -0.8 0 0.16 = 0 0.5 0.16
Ясно, что для интервалов, достаточно близких к х, не удастся добиться п(едставления в
виде (5) с одной и той же матрицей 2 х 2: для одних такой матрицей будет ( 0
\ —0.8 0
'0 -0.8'
а для других — матрица I 0 05
Обозначим через Ш(а) множество интервалов х € Ж таких, что произведения ах и ау интервала а и интервала х и достаточно близкого к х интервала у представляются в виде (5) с одинаковой матрицей 2 х 2.
Анализируя возникающие ситуации, можно дать следующее описание множества Ш(а). Пусть а = [а, а], тогда при вырождении а в точку Ш(а) = ПИ. Если же а — знакопостоянный интервал, не вырождающийся в точку, т. е. 0 < а < а или а < а < 0, то Ш(а) состоит из интервалов х, ни один из концов которых не равен нулю. Если же а содержит нуль внутри, т.е. а < 0 < а, то Ш(а) состоит из таких интервалов, для которых ах = ах и ах = ах.
Обозначим через Ш(А) множество векторов х € Ж"" таких, что произведения а^ • Xj и а^ • yj элементов матрицы А = (а^ )".,=1 из системы (1) и компонент вектора х = (xj)"=1 и достаточно близкого к х вектора у = (yj)"=1 представляются в виде (5) с одинаковыми матрицами 2 х 2 при г,^ = 1,п. Далее, пусть в равенстве (3) х* € Ш(А). Поскольку при этом произведения а^х* можно представить в виде (5), интервальную п-матрицу А и интервальные п-векторы Ь и х* можно заменить точечными 2п х 2п-матрицей А(х*) и 2п-векторами Ь и ж*, которые будут выглядеть так:
ж* = Сх1, x1, x2, х" х")Т,Ь = (Ь^ Ь1, Ь2, Ь2,..., Ь" Ь„)Т
Такая замена соответствует отображению
а :11а" ^ Ш2", а(х) := ж = (х1, х1, х2, х2,..., хп, хп)Т (7)
При этом для определения коэффицентов а^, г,^ = 1, 2п, вещественной 2п х 2п-матрицы А(х*) используем равенство
а(Ах*) = А(х*) • а(х*), (8)
которое является обобщением равенства (5). Поэтому А(х*) удовлетворяет равенству
ж* = А(х*) • ж* + Ь,
(9)
которое по существу является другой записью равенства (3). Эта матрица состоит из п2 блоков 2 х 2. При этом г^'-й 2 х 2-блок соответствует распределению концов интервала а^ при умножении на х* для формирования концов х*. Например, для системы
х
[ 0.6 , 0.8] [-0.1, 0.2] [-0.12, 0.1] [ 0.6, 0.8]
х +
[-0.2, 0.2] [-0.2, 0.2]
где х* = ([-5, 5], [-4,4])Т , равенство (9) выглядит так:
- 5 / 0.6 0 0.2 0 - 5 - 0.2
5 0 0.8 0 0.2 5 0.2
- 4 = 0 -0.12 0.6 0 - 4 + - 0.2
V 4 V 0.12 0 0 0.8 V 4 V 0.2
Как показывает анализ всевозможных вариантов, возникающие в формуле (5) 2 х 2-матрицы, а значит, и 2 х 2-блоки в формуле (8) можно разделить на четыре типа:
а)
Р1 0
0 Р2
ь)
0
П2
П1 0
с)
Р1 0
П2 0
й)
0 П1 0 Р2
где рьр2 > 0, п1,п2 < 0, причем в блоках а и Ь элементы могут обращаться в нуль, а блоки с и й обязательно содержат два ненулевых элемента, иначе их можно отнести к блокам типа а или Ь.
Теорема 2. Для того чтобы интервальная оболочка Xя множества Е совпадала с неподвижной точкой х* отображения Ах + Ь достаточно, а если при г,^ = 1,п выполняются требования хя < хя, а^- = 0 и а^ = 0, то и необходимо, чтобы в блочной матрице А(х*):
1) главная диагональ состояла из 2 х 2-блоков типа а;
2) вне главной диагонали не было 2 х 2-блоков, кроме блоков типа а и Ь;
3) существовало целое число г € {1,...,п} такое, что если типы 2 х 2-блоков а^р и , р, д = 1,п, р = д, совпадают, то 2 х 2-блоки ард и адр являются блоками типа а, а если типы а^р и а^ не совпадают, то блоки ард и адр являются блоками типа Ь.
При проверке достаточных условий нулевому 2 х 2-блоку можно приписать любой тип. Таким образом, условия теоремы 2 указывают на то, что для совпадения Xя и х* интервальная матрица А с произвольными по знаку коэффициентами должна вести себя точно так же, как матрица со знакопостоянными коэффициентами, удовлетворяющими условиям теоремы 1.
В основе доказательства необходимости свойств 2 и 3 лежит результат Хансена [4], приводимый ниже. Он касается совпадения или несовпадения концов интервального расширения рациональной функции нескольких переменных и границ множества значений этой функции.
Пусть f (х) : И" ^ И — рациональная функция п переменных. Обозначим х = (ж1,...,жга), а входящие в f(х) постоянные коэффициенты — а = (а1,...,ат). Множеством значений f (х) называется интервал
Ба^е.
ж€х,а€а
f (х) =
тт f (х), тах f (х)
а естественным интервальным 'расширением / (ж) — интервал F(x) = [Е, Е], получающийся в результате замены ж, а соответственно на х, а и всех вещественных арифметических операций на интервальные. Значение Е (Е) называется оптимальным, если Е = шЬхех.аеа/(ж) (Е = шаххех.аеа/(ж)).
Лемма 1 ([4]). Если Е является функцией обоих концов одной или более компонент вектора х, то Е не является оптимальным. То же самое справедливо и для Е. Если Е является функцией только одного конца каждой компоненты вектора х, то Е является оптимальным. То же самое справедливо и для Е.
С помощью результата Хансена докажем важную лемму.
Лемма 2. Если в блочной 2п х 2п-матрице (х*); состоящей из 2 х 2-блоков, для
некоторого к = 2, 3,... существует г?-блок (г,? € {1, 2,... , п}), содержащий в какой-либо
* < ,
строке два ненулевых элемента, и х* < х*, то Xя = х:
Доказательство леммы 2 проведем для к = 2. Пусть ( а(2)) обозначает блочную
матрицу А2(х*). Пусть в матрице А2(х*) блок а(2) (г,? € {1, 2,... , п}) содержит в какой-либо строке два ненулевых элемента. Вектор х* обращает в верное равенство уравнение (1) и уравнение
х = А(Ах + Ь) + Ь, (10)
при этом выполняются равенства (2), включение (4), а ОМР системы (10) совпадает с Е:
Е = {ж|(3А € А)(36 € Ь)(ж = Аж + 6)} = {ж|(3А € А)(36 € Ь)(ж = А(Аж + 6) + 6)} . (11)
Используя (7)-(9), получим
ж* = а(х*) = а (А(Ах* + Ь) + Ь) =
= а (А(Ах* + Ь)) + а(Ь) = А(Ах* + Ь) ■ а(Ах* + Ь) + а(Ь) = = А(х*) ■ (А(х*)а(х*) + а(Ь)) + а(Ь) =
= А2(х*)ж* + А(х*)6 + 6. (12)
Рассмотрим непрерывную вещественную функцию
п
/»(ж) = (А(Аж + 6) + 6)» = ^ а, (Аж + 6),- + 6».
Значением интервального расширения этой функции при замене ж, А, 6 соответственно на х*, А, Ь является интервал х*. Пусть в матрице А2(х*) существует блок а(2), г,? € {1, 2,. . . , п}, содержащий в какой-либо строке два ненулевых элемента. Из соотношения (12) выпишем строки с номерами 2г—1 и 2г:
х* = (А2(х*)ж* + А(х*)6 + 6)2»—1, х* = (А2(х*)ж* + А(х*)6 + 6)2».
В одной из них справа от знака равенства имеются отличные от нуля коэффициенты при х* и х* и по условию х* = х*. В силу непрерывности одна из функций £»(ж) или £»(ж) будет иметь ненулевые коэффициенты при х, и х, для всех векторов, достаточно близких к х*. Поэтому множество значений функции /»(ж)
Кап§ежех* ,Аел,ьеь У»(ж)
шт /(ж), шах /»(ж) хех*,Аел,ьеь жех*,Аел,ьеь
по лемме 1 не совпадает со значением ее интервального расширения, а следовательно, компонента хя, в силу (2) и (11) удовлетворяющая хя С Ка^ех€х» Аельеь/Кх), также не совпадает с х*. Итак, Xя = х*. Рассуждения можно продолжить для к = 3, 4,... □
Доказательство теоремы 2. Докажем необходимость свойства 1 методом "от противного". Пусть на главной диагонали имеется блок 2 х 2 с номером qq типа b, c или d, причем в нем содержится хотя бы один отрицательный коэффициент (n или n2). По условию теоремы Xя = (x^, x^,... , x^)Т , xH = [xH, xH] , xH < xH, i = 1,n. Как уже было сказано выше, координатные компоненты точек из множества решений достигают своих экстремальных значений xH = min {x^|x £ Е} и xH = max {x^|x £ E} в вершинах множества Е, являющихся решениями систем вида x = Ax + b, где aj £ {a^, aj}, bj £ {bi5 b^},
i,j = 1, n. Рассмотрим систему x = A'x + b', решение x' = (xi, x'2, удовлетворяет равенству
Xя
Т
которой
xg aqix1 + ■ ■ ■ + aqqxg + ' ' ' + aq«,x«, + bq.
(13)
Аналогично пусть x'' = (x'i, x'2',
^Я,... x^n)Т — решение системы x = A''x + b'', причем
x" = aqi xi + ■ ■ ■ + aq'q x + bq'.
—q
qq—q
""qra^ra
(14)
В матрицах А7 и А" коэффициенты а^ и а^ заменим на адд, обозначив новые матрицы соответственно А7 и А". Подействуем отображением А7х + Ь7 на интервальный вектор
ТТ
'' 12
x
я
.x^) , а отображением A''x + b'' — на вектор (x'/,x'2',...
xH x''
I Aq > • • • 1
Выпишем q-е компоненты векторов, полученных в результате этих отображений:
xq aqix 1 + ■ ■ ■ + aqq xq + ■ ■ ■ + aqnxnn + bq,
xq = aqixi +
+ aqqxH +
+ a'' x'' + b''
+ aqraxra + bq .
В силу монотонности по включению xq С x*, xq' С x(
q
> xH, x'„' < xH, и если хотя бы
x' > ~Я
q, xq >
одно из двух последних неравенств строгое, то xq >
> xq > xH или x* < xq < xq, откуда
q или x^ ^q
xH
я,
[xH, xH] = [x*, x*] и XH = x*. Для доказательства неравенства xq > xH покажем, что
qq q
aqqxH > aqqxH для любого из двух возможных значений a^
aqq или aqq = aqq.
H
ax
В случае же выполнения равенства aqqxqH qq H '' H '' ''
неравенство aqqxH < aq?qxH при aqq = aqq или aqq
' xH
д покажем, что выполняется строгое , из которого следует, что х"
H
^ •
Поскольку блок а«« является блоком типа Ь, с или
-ъдд
а„„ < 0 < а«« (0 € т1(адд)). В произведении а«« • х;
н
< 0, и либо а«« < 0, либо
будем иметь
Г1-!-[
3- [
а«д хд
н
а^д хн , а«д хн
, если а«« < 0,
адд Хн ,
, если а«« < 0,
хд > 0.
.я
хд < 0.
а хн а хн
^Ьдд^-д 1 ЪЬдд^д
4. [а«« хн , адд хн
адд хн , ^дд хн
5.[:
к6. [ш1п (
хН ],'
] ,если а«« < 0, 0 € т^хН)-] , если 0 € т^а««), хН > 0. ] , если 0 € 1п1(адд),
а^д х н , адд хн
) шах ( а«дх н ,
хд >
д
хд <
д
■ хН м
ддхд
Н)] , если 0 € т^а««), 0 € Ы;(хН)
Пусть а«
(15)
а«« < 0 и по условию хН < хд . Тогда в указанных в (15) случаях: 1. а«« < 0, а«« < 0,0 < хН < хН, следовательно, а««хН = а„„хН < а„„х Н < а,
««
«г д
.^д^д
хН
< аддхд
адд хН •
2. с!«« < 0, хН < хН < 0, следовательно, а««хН ^д—д
3. а«д < 0, хН < 0 < хН, следовательно, а««хН = а««хН < а««хН
а««хН < а««хН
я
4. а«д < 0 < адд , хд
5. ^дд < 0 < адд, хН
> 0, следовательно, а««хд = а««х;
■л
д
я
я
а«д х Н.
ддхд .
ддхд .
хд < х« < 0, следовательно, а««х^т = а««хН < а««х;
6. адд < 0 < адд, х«
Н < 0 < хН
< а дд х
Н ^ а хН < а х Н дд"д —дд д ^ 2дд—д
я ^ „ ,_я „ ^я
ддхд .
« , следовательно, а««х« < а««х^, а««х«
< ддхд
я
значит,
/ _н _Н ( Н _ _Н
аддхд = ^«дхд < шах (Дддх« , аддх«
ддх
я
дд д
я
д
Таким образом, если а«д = адд < 0 и хН < хН, то а«дхН < аддхН и X Н = х Пусть теперь а«
1. адд < 0,0 < х Н < х Н, и если адд < 0, то а««хН = аддх Н < аддх;
адд = 0 получим а[
дд
х
- х«
дд"д
ТТ _1Т
адд и по условию хН < хд
. Тогда в указанных в (15) случаях: я
дд д
хдд
/ хН = а««хН = а««хН = а««хН. Таким образом, возможно совпадение
дд д
дд д
««—д
ддхд , иначе при
я
/ _Н гг _
ад«хН и аддхН при адд
0. Но в этом случае выполняется строгое неравенство аддхН <
дд д
" х Н
дд х«
//
дд
дд д
а«дхН. Действительно, при а«д = а«д получаем аддхН ад« = адд получим, что аддхН < 0 = аддхН = а«дхН.
а«д < 0, адд < 0, хН < хН < 0, следовательно, а««хН
я хН
—«« «
< аддхд
»» Н
а««хН, а при
аддх н < адд хН < аддх
ддх
я
дд д
3. а«« < 0, адд < 0, хН < 0 < хН, следовательно,
^дд "> ^дд — "> ^ ^ " - "д
4. В случае а«« < 0 < а,
ддх
я
0 < хН < хН значения а' х
дд хН = а«« х < 0 / — Н Н
и аддхд совпадают: а««хд
х
дд д / —Н
дд д
аддхН. Покажем, что выполняется строгое неравенство аддхН < а«дхН. Действи-
а«д хН
// Н
тельно, при адд = а«д получаем аддхд
дд д
дд—д
тт
что ддхд
дд ^дд 47 я
а хН < а хН
^дд д
// х ,
дд—д '
//
дд
адд получим,
^«д хд < ^«дх < а«дх«
я
а// х .
адд хд .
5. ^«д < 0 < адд, х<Н < хН
6. Если шах (а«дхд
Н - хН
ддхд
< 0, следовательно, а««х(
Н ^ ^ ^рН _ - хН
ддхд
/ хН — а хН < а
««хд = а«« хд < а«
ддхд
< а«дх
ддх
я
дд д
а«дх« ^ аддх Н , то а«дхН а«дх.
< аддхН = аддхН. Если же
-дд^д
дд д
_ _^
^«д хд , адд хд
а хН
адд хд ,
*
. _н
ТО аддХн
а<?<? ХН
а99хН. Но поскольку а99 < 0 < а^, хЯ < 0 < хЯ, при а^
выполняется
аддхд = ^гдХд > т^П (йддХд , аддХ<н
а
ах .
При а'' = а99 в случае
имеем
Если же
то адд хд = а99 Хд = а99 Хд •
_££ _ ££
а99 хд , адд хд
а хя
аТ' х<? = а99 хн > хд
ах . а99х9 .
т1п хН , а99хН ) = а99хН ,
Допустим, что одновременно
я
я
тах х9 ) х9
а99х9
■я
_^ _ ^
х9 , а99 х9
а<?<? х9
я
их
х*. Следовательно, блок а99 является блоком типа а, что противоречит первоначальному допущению. Необходимость выполнения первого свойства доказана.
Докажем теперь необходимость второго свойства матрицы А(х*) при условии, что хя < и а;
7 я
аг; = 0
= 0, г,^ = 1, п. Это означает, что во всех блоках матрицы А(х*) имеются два ненулевых элемента. Покажем, что наличие в матрице А(х*) вне главной диагонали 2 х 2-блоков вида с или й влечет получение на главной диагонали в матрице А2(х*) 2 х 2-блока, содержащего в какой-либо строке два ненулевых элемента. Пусть блок а^ является блоком вида с или й. При умножении 2 х 2-блоков любого вида на блоки вида с или й с любой стороны получаются только блоки вида с или й. Вычисляя
-,(2)
к=1
... + а,, + ... + а^ а^г +
получим блок с двумя ненулевыми элементами в какой-либо строке, откуда по лемме 2 х* = Xя.
Докажем необходимость третьего свойства матрицы А(х*). Необходимость симметричного расположения блоков одного типа относительно главной диагонали следует из рассуждений, проведенных выше: иначе в А2(х*) будет существовать блок а(2), содержащий два ненулевых коэффициента в какой-либо строке. Допустим далее, что выполняется одно из условий:
1) блоки агР и аг9, р = д, являются блоками типа а, в то время как аР9 и а9Р являются блоками типа Ь, и р = г;
2) блоки агр,аг9, аР9 и а9Р являются блоками типа Ь, и р = д, р = г;
3) блок агр является блоком типа а, аг9 — блоком типа Ь, р = д, а аР9 и а9Р являются блоками типа а, и р = г;
4) блок агР является блоком типа Ь, аг9 — блоком типа а, р = д, а аР9 и а9Р являются блоками типа а, и р = г.
Рассмотрим случай 1. При д = г не выполняется требование симметричного расположения блоков и х* = X я. Пусть г = д. Значит, блок а(2 = ^П=1 а^, содержащий
п
слагаемое агРаР9, будет блоком типа Ь или будет содержать в какой-либо строке два ненулевых элемента. В последнем случае сразу получаем х* = X я. То же самое можно сказать и о блоке а(2 = ^П=1 а^акР, содержащем слагаемое аг9а9Р. Если а(2 и а(2 — блоки типа
Ь, то а(3) = ... + аРг + ... + а^ а9г + ... содержит в какой-либо строке два ненулевых элемента. По лемме 2 получим х* = X я. Остальные случаи рассматриваются аналогично.
Доказательство достаточности, не теряя общности, можно провести для г = 1. Рассмотрим решение х* системы (1) и определим векторы и, V € 1Яп:
,(2),
,(2),
иг
х*, еслиа1г— блок а, х*, еслиа1г — блок Ь,
х*, если а1г — блок а, х*, если а1г — блок Ь.
(16)
Покажем, что при выполнении условий теоремы существуют матрицы А1,А2 € А и векторы Ь1,Ь2 € Ь такие, что и и V являются неподвижными точками отображений А^ж + Ь1 и А2ж + Ь2 и, следовательно, принадлежат Е. То есть равенство х* = Ах* + Ь может быть представлено в виде двух равенств:
и = А1и + Ь1, v = А^ + Ь2,
(17)
где А1, А2 € А, Ь1, Ь2 € Ь. Для определения коэффициентов матриц А1, А2 и векторов Ь1, Ь2 последние соотношения выпишем покомпонентно:
иг
У^ а^-и. + Ь1г, V; = ^ а2г^-и,- + Ь2,, г = 1, 2,..., п. ¿=1 ¿=1
(18)
Равенство (3) можно записать покомпонентно х* = ^П=1 а. ■ х* + Ьг, г = 1, 2,... , п, или
(19)
х*
X] аг.7 ■ х* +
х*
Х^аг. ■ х* + Ьг, г = 1, 2,
, п.
¿=1
¿=1
Поскольку в силу (16) иг и vг являются разными концами х*, для выполнения равенств (18) векторы Ь1,Ь2 € Ь выберем с учетом (19):
Ь1г
Ьг при иг Ьг при иг
Ь2
Ьг при vг Ьг при vг
—*
(20)
В произведении Ах* элементы а. х
*
' аг. х*
1 аг.
аг. х* , аг. х*
(аг. )
11
(аг. )
22
(аг. )
21
(а. ) 0
12
соответствуют блокам А(х*): если а. — блок типа а;
если а. — блок типа Ь.
(21)
Отсюда следует, что при совпадении типов а1Р и а19 (р, д € {1,... , п}, р = д) принадлежность аР9 и а9Р к типу а обеспечивает в равенствах (21) вычисление хР в соответствующем слагаемом только через х*, х* — только через хР, хР — только через х*,
их
только
v
п
п
*
*
}
0
0
0
¿
через хр. Аналогично при несовпадении типов а1р и а1(? (р, д € {1,... , п}, р — д) принадлежность ард и адр к типу Ь обеспечивает в равенствах (21) вычисление хр только через х*, х* — только через хр, хр — только через х*, х* — только через хр. Принадлежность блоков А(х*), расположенных на главной диагонали, к типу а обеспечивает для всех г € {1,... , п} в равенствах (21) вычисление х* только через х*, а х* — только через х*.
Таким образом, при выполнении условий теоремы существуют матрицы А1, А2 € А и векторы Ьь Ь2 € Ь такие, что любой из концов компонент х* в равенстве (21) вычисляется с помощью некоторого определенного фиксированного набора концов остальных компонент и себя самого и любая компонента из этих наборов опять-таки вычисляется через его же компоненты. Эти наборы компонент — векторы и и V.
Зная векторы и и V и решение х*, с помощью равенств (21) можно определить матрицы Аь А2 € А:
а1у —
а2у —
(ау )ц, если и» и аУ — блок типа а
(аг^ )22, если иг -* — х* и аУ — блок типа а
(ау ) 12, если и» и аУ — блок типа Ь,
- )21, если и» —* — х* и — блок типа Ь;
(аг^ )22, если V» -* и аЧ — блок типа а,
(аг^ )ц, если V» * — Хг и аЧ — блок типа а,
(ау )21, если V» -* — х* и аЧ — блок типаЬ,
- (аг^) 12, если V» — х* и аЧ — блок типа Ь.
(22)
Таким образом, доказано, что при выполнении условий теоремы векторы и и V, определенные по формулам (16), удовлетворяют соответственно равенствам и — А1и + Ь1 и V — А^ + Ь2, где векторы Ь1 и Ь2 определены по формулам (20), а матрицы А1 и А2 — по формулам (22). □
Замечание 1. Для проверки требования теоремы хн < хн, г — 1,п, в значительном числе случаев можно использовать эффективную оценку ОМР Е изнутри [5, 7]. Легко показать также, что данное требование будет удовлетворено при выполнении в системе (1) условий Ьг < Ь, г — 1, п. В этом случае Е содержит открытое множество, а значит, ни по одной компоненте X н не вырождается в точку.
П р и м е р 1. Решением системы
х
[-0.1, 0.7 ] [-0.2, 0.08] [-0.2, 0.03] [-0.1, 0.3 ]
х +
[0.1,1.3]
[0.3,1.2]
является вектор х — ([-1, 5], [-1, 2])' . По формуле (8) получим матрицу
А(х*)
0.7 0 0 -0.2
0 0.7 -0.2 0
0 -0.2 0.3 0
-0.2 0 0 0.3
Значит, данная система удовлетворяет достаточным условиям теоремы 2, и Xя = х*. Так как Xя = ([-1, 5], [-1, 2])Т , система удовлетворяет и необходимым условиям. Объединенное множество решений Е, векторы Xя и х* указаны на рис. 2. По формулам (16), (20) и (22) получим
и =(х1, х2) 1 =(-1, 2)
Т
Ь1 = (Ь1, Ь2)Т
(0.1,1.2)
Т
v =(х1, х2)Т = (5,-1)Т,
Ь2 =(Ь1, Ь2)Т
А1
(а11)11 (а21)21
(а12)12 (а22 )22
0.7 -0.2 -0.2 0.3
А
(а11)22 \ (а21) 12
(1.3, 0.3)
(а12)21 (а22)11
Т
0.7 -0.2 -0.2 0.3
Векторы и и v удовлетворяют равенствам и = А1и + Ь1 и v = + Ь2. Как видно из рис. 2, в этих точках обе координаты достигают на Е экстремальных значений.
П р и м е р 2. Система
х
[0, 0.5] [-0.05,0.2] [0, 0.2] [ 0.3 , 0.5]
х +
[ 1.2,2.1] [-0.5, 0 ]
имеет решение х* = ([1, 5], [-1, 2])Т , с помощью которого находим
А(х*)
0 0 0.2 0
0 0.5 0 0.2
0 0 0.5 0
0 0.2 0 0.5
Значит, данная система удовлетворяет достаточным условиям теоремы 2, и X
я
11
121
х*. На
0, и необходимые
рис. 3 изображены Е, Xя и х* для этой системы. Здесь а условия для этого случая не доказывались. Как и в предыдущем примере, можно найти
и = (х1,х2)Т = (1,-1)Т, v = (х,х2)Т
(5, 2)
Т
А
Ь1 = (Ь1, Ь)
(а11)11 (а12)11 (а21) 11 (а22) 11
Т
1>Ы2, -(1.2, -0.5)', Ь2 = (Ь1, Ь2)1 =(2.1, 0)
Т
0 0.2 0 0.5
А
(а11)22 (а12)22 = 0.5 0.2 \(а21 )22 (а22)2^ \0.2 0.5у
В точках и и v обе координаты достигают на Е экстремальных значений. П р и м е р 3. Для системы
х
[ 0.6, 0.7] 0 [-0.3, -0.2] [0.4, 0.5]
х +
[0.4,1.5] [1 , 1.2]
решение х = ([1, 5], [-1, 2]) Т . Находим
А(х*)
( 0.6 0 0 0
0 0.7 0 0
0 -0.3 0.5 0
-0.2 0 0 0.5
В матрице А(х*) будем считать блок а12 блоком типа Ь. Значит, данная система удовлетворяет достаточным условиям теоремы 2, и Xя = х* (рис. 4). Здесь а12 = 0, и необходимые условия не доказывались. Как и в предыдущем примере, можно найти неподвижные точки и и v отображений А1ж + Ь1 и А2ж + Ь2, матрицы А1, А2 и векторы Ь1 и Ь2, задающие эти отображения:
и = (х1, х2)Т = (1, 2)Т, v = (х1, х2)Т = (5, -1)Т, Ь1 = (Ь1, Ь2)Т = (0.4,1.2)Т, Ь2 = (Ь1, Ь2)Т = (1.5,1)Т,
Л =( (а11)11 (а12)1^ = ( 0.6 0 ^ Л =( (а11 )22 (а12)2Л = ( 0.7 0 ^ 1 \(а21 )21 (а22)2^ \-0 2 0.5^' 2 )12 Мц^ ^3 0.5^ "
В точках и и v обе координаты достигают на Е экстремальных значений.
П р и м е р 4. Для системы со знакопостоянными коэффициентами в матрице А
х = /[0.6, 0.7] [-0.2, -0.1]\ х + /[ 0.8, 1.3] х I [0.2,0.3] [ 0.3, 0.4]у х + и-0.8, -0.3]
не выполняются необходимые условия теоремы 2 (и теоремы 1): блоки а12 и а21 будут, очевидно, иметь разные типы, а по замечанию 1 хя < хя, г = 1, 2,..., п. Эта система имеет решение х* = ([1, 5], [-1, 2])Т и ОМР Е, изображенное на рис. 5. Здесь
Xя = ([1.8, 4.3], [-0.6,13])
Т
и Xя = х*. Из рис. 5 видно, что каждая координата достигает экстремального значения в точке множества Е, в которой другая координата экстремума не достигает.
Замечание 2. Если выполнены требования 1-3 теоремы 2 и 0 € т^х*), г = 1,п, то ненулевые коэффициенты в 2 х 2-блоках ау являются наиболее удаленными от нуля концами интервалов ау и вид формул (22) значительно упрощается: г^'-коэффициенты (г, ] = 1, п) матриц А1 и А2 находятся по формулам
!ау, если блоки а1г,ау одного типа,
(23)
ау, если блоки а1г,ау разных типов. В качестве иллюстрации можно рассмотреть пример 1.
Х2
-1-
X
я
х
5 Х1
Рис. 5.
Таким образом, используя теорему 2, вопрос о совпадении или несовпадении Xя и х* для систем общего вида можно решить только после нахождения решения х* и построения матрицы А(х*), но в некоторых случаях при выполнении достаточных условий теоремы 1 матрицы А1 и А2 и векторы Ь1 и Ь2 можно построить, используя только исходную систему (1). Решая вещественные системы (17) прямым или итерационным методом, можно найти границы компонент х*. Именно, справедлива
Теорема 3. Пусть матрица А в системе (1) состоит только из неположительных и неотрицательных коэффициентов, 0 € т^Ъ), г = 1,п, и выполнены требования 1 и 2 теоремы 1. Тогда Xя = х* и концы компонент х* находятся при решении вещественных систем (17), где %-е компоненты (г = 1,п) векторов Ь1 и Ь2 определяются по формулам
>и
Ъ, если а1г > 0, Ъг, если а1г < 0,
ь2г
Ъ,
Ъ,
если а1г < 0, если а1г > 0,
2
1
а г^'-коэффициенты (г,^ = 1,п) матриц А1 и А2 — по формулам (23).
Лемма 3 ([1]). Пусть А — интервальная матрица, для которой р(|А|) < 1. Тогда для решения х* (которое существует и единственно) уравнения х* = Ах* + Ь верно соотношение
Доказательство теоремы 3. Используя лемму 3, получаем, что 0 € т^х*), г = 1,п. В этом случае формулы (24) сразу же получаются из формул (20). После нахождения решений и и v, соответствующих системам (17), концы г-х компонент (г = 1,п) решения х*, очевидно, определяются по формулам
Список литературы
[1] Алефельд Г., Херцбергер Ю. Введение в интервальные вычисления. М.: Мир, 1987.
[2] Ляшко М.А. О совпадении интервальной оболочки объединенного множества решений ИСЛАУ с итерационным решением. Балашов, 1996. Деп. в ВИНИТИ 08.02.96,
[3] BARTH W., Nuding E. Optimale Losung von Intervallgleichungssystemen // Computing. 1994. Vol. 12. P. 117-125.
[4] HANSEN E.R. Sharpness in Interval Computations // Reliable Computing. 1997. Vol. 3, N 1. P. 17-29.
[5] KUPRIYANOVA L. Inner estimation of the united solution set of interval linear algebraic system // Reliable Computing. 1995. Vol. 1, N 1. P. 15-31.
[6] NEUMAIER A. Interval Methods for Systems of Equations // Cambrige: Cambrige Univ. Press, 1990.
[7] ШАРЫй С.П. Алгебраический подход к анализу линейных статических систем с интервальной неопределенностью // Изв. РАН. Теория и системы управления. 1997. № 3.
{y = (I - A)-1b|A е A, b е b} С {ф е x*}.
□
№ 429-В96.
С. 51-61.
Поступила в редакцию 28 февраля 2002 г., в переработанном виде — 31 июля 2002 г.