Научная статья на тему 'Внешнее оценивание обобщенных множеств решений интервальных линейных систем'

Внешнее оценивание обобщенных множеств решений интервальных линейных систем Текст научной статьи по специальности «Математика»

CC BY
326
85
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Шарый С. П.

В работе развиваются различные методики внешнего интервального оценивания обобщенных -множеств решений для интервальных линейных систем уравнений. Предложен алгебраический подход, при котором задача внешнего интервального оценивания сводится к задаче нахождения алгебраического решения вспомогательной системы уравнений в полной интервальной арифметике Каухера. Второй основной результат работы обобщенный интервальный метод Гаусса-Зейделя для внешнего оценивания -множеств решений интервальных линейных систем. Исследуется сфера применимости предлагаемых методов, проводится анализ сходимости обобщенного метода Гаусса-Зейделя, доказывается оптимальность получаемых с его помощью результатов для интервальных линейных систем с М-матрицами.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Outer estimation of generalized solution sets to interval linear systems

The paper advances various techniques for outer interval estimation of the generalized AE-solution sets to interval linear systems. We propose "algebraic approach" in which the outer estimation problem is reduced to the problem of computing algebraic solutions of an auxiliary equation in Kaucher complete interval arithmetic. The second main result of the paper is generalized interval Gauss Seidel iteration. We examine the applicability of the techniques proposed, present the convergence analysis for Gauss Seidel iteration, and prove the optimality of its results for interval linear systems with M-matrices.

Текст научной работы на тему «Внешнее оценивание обобщенных множеств решений интервальных линейных систем»

Вычислительные технологии

Том 4, № 4, 1999

ВНЕШНЕЕ ОЦЕНИВАНИЕ ОБОБЩЕННЫХ МНОЖЕСТВ РЕШЕНИЙ ИНТЕРВАЛЬНЫХ ЛИНЕЙНЫХ СИСТЕМ

С. П. Шарьш Институт вычислительных технологий СО РАН Новосибирск, Россия e-mail shary@ict.nsc.ru

The paper advances various techniques for outer interval estimation of the generalized AE-solution sets to interval linear systems. We propose "algebraic approach" in which the outer estimation problem is reduced to the problem of computing algebraic solutions of an auxiliary equation in Kaucher complete interval arithmetic. The second main result of the paper is generalized interval Gauss — Seidel iteration. We examine the applicability of the techniques proposed, present the convergence analysis for Gauss — Seidel iteration, and prove the optimality of its results for interval linear systems with M-matrices.

1. Обобщенные множества решений интервальных задач

Предметом настоящей работы являются интервальные системы линейных алгебраических уравнений (ИСЛАУ) вида

Ax = b (1)

с интервальной матрицей A = (aj) и интервальным вектором правой части b = (bj). Мы будем рассматривать так называемые обобщенные множества решений для (1), естественно возникающие в том случае, когда различные интервальные параметры системы выражают неопределенности и/или неоднозначности различного типа. Напомним, что интервальная неопределенность данных изначально может трактоваться двояко, в соответствии с двойственным характером интерпретации самих интервалов.

Как правило, в практических моделях интервалы интересуют нас не сами по себе как самостоятельные целостные и внутренне нерасчленимые объекты. Бессмысленно говорить об интервальной температуре или интервальной цене товара; корректным является рассмотрение интервала температур или интервала значений некоторой суммы денег. Таким образом, интервалы являются абстракциями более высокого уровня в сравнении с обычными (точечными) величинами, они имеют смысл лишь постольку, поскольку содержат в себе эти точечные значения. Более точно, мы можем рассматривать интервалы и интервальные объекты лишь в связи с тем или иным свойством, которое может выполняться или не выполняться для их элементов-точек. Таким свойством (обозначим его через R) может

© С. П. Шарый, 1999.

быть точечное уравнение, система уравнений или неравенств и т. п. При этом возможны две принципиально различные ситуации:

либо рассматриваемое свойство Д(г>) (точечное уравнение, неравенство и т.п.) имеет место для всех чисел V из заданного интервала V;

либо это свойство Я^) выполняется лишь для некоторых чисел V из интервала V, не обязательно всех, или даже хотя бы для одного значения из V.

В формальной записи это различие выражается употреблением логических кванторов — всеобщности V или существования 3:

в первом случае мы пишем " (Уи £ V) Я^)" и будем говорить об У-типе (А-типе) интервальной неопределенности;

во втором случае мы пишем " (3v £ V) Я^)" и условимся говорить о 3-типе (Е-типе) интервальной неопределенности (см. также [3, 11, 12, 28, 29, 31, 32]).

Соответственно очерченное различие между видами неопределенности должно приниматься во внимание при строгом определении решений и множеств решений интервальных уравнений, неравенств и т.п. Например, для интервальной т х п-системы уравнений (1) наиболее общее определение множества решений должно иметь вид

{х £ Еи 1 ( ^п! £ )(£ ) ■ ■ ■ ( Яти+т^тп+т £ ^тп+т )(Ах = Ь ) }, (2)

где Q1, ^2, • • • , Яти+т — логические кванторы V или 3, (VI, V2,... , vmra+m) := ( ап, Й12,... , ати,Ь 1,Ь2,...,Ьт) £ Кти+т — агрегированный (составной) вектор параметров рассматриваемой системы уравнений, (VI, v2,..., vmu+m) := (а11, а12,..., ати, Ь1, Ь2,..., Ьт) £ Щти+т — агрегированный вектор интервалов возможных значений этих параметров, (п1, п2,... , пти+т) — некоторая перестановка натуральных чисел 1, 2,... , тп + т.

Определение 1. Множества вида (2) будем называть обобщенными множествами решений для интервальной системы уравнений Ах = Ь.

Уместно отметить, что специфическая линейная форма рассматриваемой интервальной системы уравнений никак не задействована в определении 1, и поэтому оно, в действительности, приложимо для гораздо более общих интервальных систем уравнений, неравенств и т.п. (см., например, [3, 11, 29]).

Определение 2. Логическая формула вида

( £ )( Я2^2 £ ^2 ) ■ ■ ■ ( Яти+т^тп+т £ ^т„+т )( Ах = Ь ),

выписанная после вертикальной черты в определении множества (2) и задающая характеристическое свойство его точек, называется выделяющим предикатом соответствующего обобщенного множества решений интервальной линейной системы уравнений.

Определение 1 является чрезвычайно общим. Логический квантор при каждом интервальном элементе системы может принимать одно из двух возможных значений, и потому нетрудно подсчитать, к примеру, что количество охватываемых этим определением множеств решений далеко превосходит даже 2ти+т. Свой вклад в это огромное разнообразие вносит, в частности, то обстоятельство, что в логических формулах (в том числе в выделяющем предикате множества решений) вхождения разных кванторов нельзя переставлять друг с другом [7].

Обобщенные множества решений интервальных уравнений и систем уравнений естественно возникают в исследовании операций и теории принятия решений и имеют интересные и важные приложения. Далее в этой работе мы не будем рассматривать множества решений самого общего вида (2) с произвольно перемешанными кванторами при параметрах, а ограничимся только такими множествами решений интервальных уравнений, у

которых в выделяющем предикате все вхождения квантора всеобщности V предшествуют вхождениям квантора существования 3. Иными словами, мы будем рассматривать только те множества решений, для которых выделяющий предикат имеет АЕ-форму. При интерпретации на языке системного анализа они моделируют один этап воздействия "возмущение— управление" на систему [11, 12, 29].

Определение 3. Обобщенные множества решений интервальных систем уравнений, для которых выделяющий предикат имеет АЕ-форму, станем называть АЕ-множествами решений (или множествами АЕ-решений).

Под определение 3 подпадает, например, известное допустимое множество решений1

Stoi(A, b) = { x G Rn | (Vaи G an)(Vai2 G ai2) ■ ■ ■ (Vamra G amra)

(3bi G bi)(3b2 G b2) ■ ■ ■ (3bm G bm)( Ax = b ) },

соответствующее случаю, когда в матрице A все элементы имеют А-неопределенность, а в векторе b — Е-неопределенность. Его обычно записывают в более коротком виде:

Stoi(A, b) = { x G Rn | (VA G A)(3b G b)( Ax = b) } =

= {x G Rn | (VA G A)( Ax G b) } = { x G Rn | (Ax С b) }.

Другой пример — популярное объединенное множество решений интервальной системы уравнений, т. е. множество решений всех точечных систем Ax = b с коэффициентами A G A и b G b, строго определяемое как

5uni(A, b) =

= {x G Rn | (3an G an)(3ai2 G ai2) ■ ■ ■ (3amra G amra) (3bi G bi)(3b2 G b2) ■ ■ ■ (3bm G bm) (Ax = b)} = = { x G Rn | (3A G A)(3b G b)( Ax = b) } = { x G Rn | (Ax П b = 0) }.

2. Кванторный формализм

Рассмотрим теперь для АЕ-множеств решений различные способы описания распределения типов интервальной неопределенности по элементам системы уравнений. Таких способов будет представлено три:

1) указание для системы (1) кванторной матрицы и кванторного вектора правой части;

2) разбиение индексных множеств матрицы и вектора правой части системы (1);

3) дизъюнктные разложения интервальной матрицы и правой части системы (1). Обратимся теперь к их подробному описанию.

1. Коль скоро порядок кванторов в выделяющем предикате зафиксирован, то простейший способ описания типов неопределенности заключается в прямом указании того, какие логические кванторы соответствуют тем или иным элементам интервальной системы. Именно, если ввести m х n-матрицу а = (а^) и m-вектор в = (А), составленные из

1 Соответствующий английский термин — tolerable solution set. Обзор относящихся к нему результатов читатель может найти в [26]. Для динамических систем один из аналогов этого множества решений — известное множество выживающих траекторий, а математическая постановка, из которой оно естественно возникает, есть не что иное как задача о живучести.

логических кванторов и такие, что

а.

г] ■-

V, если аг] имеет А-неопределенность, 3, если аг] имеет Е-неопределенность,

вг :

V, если Ьг имеет А-неопределенность, 3, если Ьг имеет Е-неопределенность,

то указание а и в полностью определяет конкретное АЕ-множество решений ИСЛАУ.

2. Другой путь представления типов неопределенности, отвечающих различным элементам линейной системы (1), — задание разбиения индексных множеств элементов матрицы А и правой части Ь. Более точно, пусть множество индексных пар (г,]) элементов матрицы А, т. е. множество

{ (1,1), (1, 2),..., (1, п), (2,1), (2, 2),..., (2, п), ..., (т, 1), (т, 2),..., (т,п) },

разбито на две непересекающиеся части Н = { £1,... , £р} и Н = { £1,..., 0}, р + q = тп такие, что

элемент аг]- имеет А-неопределенность при (г,]) € Н, элемент аг]- имеет Е-неопределенность при (г,]) € Н. Аналогично, пусть 0 = {... , 10} и 0 = { г?1,... , г?5}, 0 и 0 = {1, 2,... , п} — непересекающиеся множества натуральных индексов такие, что в правой части ИСЛАУ элемент Ьг имеет интервальную А-неопределенность при г € 0, элемент Ьг имеет интервальную Е-неопределенность при г € <Э. При этом допускается естественная возможность того, что некоторые из множеств Н, Н, <Э, <Э пусты. Ясно, что

а

г]

V, если (г,]) € Н, 3, если (г,]) € Н,

вг

V, если г € 0, 3, если г € 0,

а то или иное конкретное АЕ-множество решений однозначно задается указанием разбиений Н и Н и 0 и 0.

3. Наконец, еще один удобный способ описывать распределения типов неопределенности по интервальным элементам системы уравнений (1) состоит в следующем. Определим интервальные матрицы Ау = (а]) и А3 = (а]) и интервальные векторы Ьу = (Ьу) Ь3 = (Ь3) тех же размеров, что А и Ь соответственно, следующим образом:

и

а

г]

аг], если аг] = V. 0, иначе,

а

г]

аг], если аг] = 3, 0, иначе,

3

При этом

Ьу I Ьг, если вг = V, ^ Г Ьг, если вг = 3, 0, иначе, г 1 0, иначе.

А. — А. + А. , а„ ] а, ] — 0, Ь = Ьу + Ь3, Ьу ь, = 0,

т. е. матрицы Av, Л3 и векторы bv, b3 образуют дизъюнктные (взаимнодополнительные) разложения для A и b соответственно. В матрице Av и векторе bv сосредоточены все интервальные элементы системы (1), соответствующие A-типу неопределенности, а в матрице A3 и векторе b3 — все интервальные элементы, соответствующие E-типу неопределенности.

Важно отметить, что между тремя введенными выше группами объектов, которые порождаются интервальной линейных системой (1) и ее АЕ-множеством решений, именно между

1) кванторными матрицей а и вектором ß;

2) разбиением индексных множеств матрицы и вектора правой части системы (1) на непересекающиеся подмножества H, H, 0, 0;

3) дизъюнктными разложениями интервальной матрицы A = Av + A3 и правой части b = bv + b3,

имеется взаимно однозначное соответствие, так что указание любого одного из пунктов этой триады автоматически определяет два других. Ниже мы, поэтому, будем свободно переходить от одного способа описания к другому без специальных комментариев.

Можно дать также следующее определение.

Определение 4. Пусть для интервальной m х n-системы линейных алгебраических уравнений Ax = b заданы кванторные m х n-матрица а и m-вектор ß и ассоциированные с ними разбиения индексных множеств матрицы и вектора тех же размеров на непересекающиеся подмножества H = { ,... , и H = { ... , }, p + q = mn, <0 = { ,... , } и 0 = { }, r + s = m.

Назовем АЕ-множеством решений типа aß интервальной линейной системы Ax = b множество

(A, b) := {x G Rn | (Va|x G a|x) ■ ■ ■ (Va|p G a|p)(Vb^ G b^) ■ ■ ■ (Vb^ G b^)

(За^ G а^) ■ ■ ■ (3a|q G a|q)(3b^ G ) ■ ■ ■ (3^s G )(Ax = b) }, (3)

или, что эквивалентно, множество

Eaß (A, b) := { x G Rn | (VA g Av )(Vb G bv)(3A G A3 )(3b G b3)(( A + A) x = b + b) },

где A = Av + A3 и b = bv + b3 — соответствующие дизъюнктные разбиения матрицы ИСЛАУ и ее правой части.

Заметим, что всегда (A, b) С Suni(A, b), т.е. объединенное множество решений является наиболее широким в семействе всех AE-множеств решений интервальной системы.

3. Постановка задачи оценивания

Нетрудно показать (см. [12]), что пересечения обобщенных АЕ-множеств решений с каждым из ортантов пространства Кга являются выпуклыми полиэдральными множествами, определяемыми системами линейных неравенств, коэффициенты которых суть концы интервальных элементов ИСЛАУ. При этом может реализовываться любое расположение множества решений относительно ортантов пространства Кга. Например, на рис. 1, 2 показаны некоторые множества решений известной интервальной линейной системы

[2.4] [-2.1]Ч х = / [-2,2] N

[-1,2] [2,4] )Х ^[-2,2] / ()

из [14], которая неоднократно рассматривалась многими авторами.

Рис. 1. Объединенное множество решений и допустимое

множество решений Е^ы интервальной системы уравнений (4).

Следовательно, сложность прямого описания ЛЕ-множеств решений, при котором мы выписываем для них уравнения всех ограничивающих гиперплоскостей и т. п., в худшем случае может расти не медленнее общего числа ортантов в Кга, т.е. экспоненциально с размерностью п. Подобное описание делается чрезвычайно трудоемким и практически бесполезным уже при довольно небольших размерностях систем (более десятка).

Как правило, на практике такое точное описание даже не требуется. Часто бывает достаточно заменить точное множество решений некоторым его приближением в соответствии с содержательным смыслом рассматриваемой задачи. Например, анализ живучести и некоторые задачи идентификации систем требуют внутреннего оценивания множеств решений интервальных уравнений, т. е. нахождения для множеств решений просто описываемых подмножеств (см. [2, 27, 29, 34]). Напротив, при анализе параметрической чувствительности систем управления требуется знать внешние гарантированные оценки множества состояний, в которых наши компенсирующие управления способны удерживать систему несмотря на наличие внешних неконтролируемых возмущений. При этом нужны внешние оценки множеств решений с помощью простых объемлющих множеств. Соответствующая задача обычно формулируется так:

Рис. 2. Некоторые множества ЛЕ-решений интервальной линейной системы (4).

(5)

Найти (быстро и, по возможности, более точно) внешние координатные оценки множества решений Eaß(A, b), или, иначе, оценить min { xk | x £ Saß } снизу и max { xk | x £ Saß } сверху, k = 1, 2,... , n.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Фактически, эта постановка требует отыскания некоторого гипербруса (прямоугольного параллелотопа со сторонами, параллельными координатным осям), содержащего множество решений (рис. 3). Гипербрусы являются геометрическими образами интервальных векторов, и соответственно мы будем называть внешней интервальной оценкой для множества решений некоторый гипербрус, содержащий (объемлющий) это множество решений. Таким образом, задачу (5) удобно формулировать в следующем, чисто интервальном, виде:

Найти (быстро и, по возможностиi, более точно) внешнюю интервальную оценку для множества решений Eaß(A, b) (6)

интервальной линейной системы Ax = b.

Именно эта задача и представляет собой основной объект изучения в настоящей работе. Более точно, целью исследования является развитие численных методов внешнего интервального оценивания обобщенных АЕ-множеств решений интервальных линейных систем вида (1). Ниже для простоты мы ограничиваемся рассмотрением интервальных линейных систем Ax = b с квадратными n х n-матрицами.

Внешняя (гарантированная)

Х2

Точное множество решений

интервальная оценка множества решений

Рис. 3. "Внешние задачи" — это задачи внешнего интервального оценивания множеств решений, в частности, задачи о параметрической чувствительности управляемых систем в интервальной постановке.

4. Подготовительные сведения

В излагаемой ниже теории центральную роль играет полная интервальная арифметика Ж, часто называемая также, по имени создателя, интервальной арифметикой Каухера. Напомним, что она является алгебраическим и порядковым пополнением классической интервальной арифметики Ш, так что Ш С Ж. Отличительной особенностью арифметики

IR является наличие неправильных интервалов [x, x], x > x, помимо обычных правильных интервалов [x, x] с x < x, образующих классическую интервальную арифметику. В целом полная интервальная арифметика IR имеет лучшие чем у IR алгебраические свойства и является решеткой относительно порядка по включению. Подробное описание полной интервальной арифметики Каухера IR можно найти либо в оригинальных работах [17-19], либо в [11-13, 27-30].

Как обычно, будем обозначать через "opp" операцию взятия противоположного элемента в полной интервальной арифметике IR, а через "0" — операцию, обратную к сложению, т. е.

opp v := [—v, —v], u 0 v := u + opp v = [u — v, u — v].

Напомним также, что

dual v := [ v, v] — операция дуализации;

|v| := max{ |v|, |v| } — абсолютная величина (модуль) интервала;

v, если v правильный pro v := < — правильная проекция интервала.

dual v, иначе,

Для интервальных векторов и матриц все выписанные выше операции определяются покомпонентным образом.

Помимо теоретико-множественного включения на множестве интервалов IR существует еще одно частичное упорядочение, которое естественно обобщает линейный порядок " <" на вещественной оси.

Определение 5 (см. [17, 20, 22]). Для интервалов x, y G IR условимся считать, что x не превосходит у, и будем писать "x < y" тогда и только тогда, когда x < У и x < у.

Интервал (интервальный вектор, интервальная матрица) называется неотрицательным (т. е. > 0), если неотрицательны его концы.

Интервал (интервальный вектор, интервальная матрица) называется неположительным (т. е. < 0), если неположительны его концы.

Например, [1, 2] < [3, 2], причем оба сравниваемых интервала [1, 2] и [3, 2] неотрицательны.

Наконец, нам будет удобно ввести следующее определение.

Определение 6. Квадратную интервальную матрицу назовем невырожденной (неособенной), если невырождены все точечные матрицы из ее правильной проекции.

5. Характеризации множеств АЕ-решений

Теорема 1.

5«e(A, b) = р| р| и и { x G Rn | (A + A) x = b + b}.

AeAv bebv AeA3 beb3

В частности, если A — невырожденная интервальная матрица, то

S^A, b) = П П и и (A + A)-1( b + b).

AeAv bebv AeA3 beb3

Доказательство. По определению операций пересечения и объединения множеств, (A, b) = { x G Rn | (VA G Av)(Vb G bv)(3A g A3)(3b G b3)(( A + A) x = b + b) } =

р| р| {x е Rn | (3A е A3)(3b е b3)((A + A)x = b + b)}

AeAv bebv

= П П U U {x е Rn | (A + A) x = b + b}.

AeAv bebv AeA3 beb3

Например, для объединенного множества решений ИСЛАУ (1) с невырожденной матрицей A

1-1;

i(A, b)= U U A-1b,

AeA beb

что и обуславливает его название.

Как уже было отмечено, логические кванторы разного типа в общем случае не перестановочны друг с другом. Мы не имеем права их переставлять и в выделяющем предикате при определении обобщенных множеств решений интервальных систем общего вида. Но оказывается, что в частном случае линейных систем (1) можно переставить кванторы существования и всеобщности, относящиеся к разным частям уравнения. Более точно, справедлива следующая теорема. Теорема 2.

Jaß

(A, b) = { x е Rn | (VA е AV)(3A е A3)(Vb е bv)(3b е b3)(( A + A) x = b + b)}.

Доказательство. Преобразуем эквивалентным образом выделяющий предикат множества из правой части доказываемого равенства:

{ х £ Еи | (УА £ А7)(3А £ А3)(УЬ £ Ь7)(3Ь £ Ь3)(( А + А) х = Ь + Ь) } =

= { х £ Еи | (УаА £ А7)(3А £ А3)(УЬ £ Ь7)(3Ь £ Ь3)( Ах - Ь = Ь - Ах) } = = { х £ Еи | (УА £ А7)(3А £ А3)(УЬ £ Ь7)( Ах - Ь £ Ь3 - Ах) } = = { х £ Еи | (УА £ А7)(3А £ А3)( Ах - Ь7 С Ь3 - Ах) } = = { х £ Еи | (УА £ А7)( Ах - Ь7 С Ь3 - А3 ■ х) } =

= { х £ Еи | А7 ■ х - Ь7 С Ь3 - А3 ■ х },

поскольку для любой правильной интервальной матрицы С и вещественного вектора х результат интервального умножения С ■ х всегда совпадает с { Сх | С £ С } [1, 22].

Как видим, характеризация множества из правой части рассматриваемого соотношения полностью идентична, в силу теоремы 1, характеризации множества из его левой части. Следовательно, действительно имеет место их равенство.

Как следствие теоремы 2 получаем еще одно теоретико-множественное представление для множества АЕ-решений интервальных линейных систем.

Теорема 3.

~«e(A, b)= f| U р| |J{ x G Rn | (A + A) x = b + b }.

AeAv AeA3 b€bv 6eb3

В частности, если A — невырожденная интервальная матрица, то

~«e(A, b) = П U П U (A + A)-1( b + b).

AeAv Asa3 bebv 6eb3

Доказательство аналогично доказательству теоремы 1.

Обратимся теперь к аналитическим характеризациям обобщенных AE-множеств решений интервальных линейных систем уравнений вида (1). Отправным пунктом наших построений является следующий результат (см. [12, 28]).

Теорема 4. Точка x G Rn принадлежит множеству решений (A, b) тогда и только тогда, когда

Av ■ x - bv С b3 - A3 ■ x, (7)

где все операции и отношения рассматриваются в классической интервальной арифметике.

Для придания результату (7) более краткого вида обозначим

Ac := Av + dual A3, bc := dual bv + b3. (8)

Определение 7 [31, 32]. Интервальные матрицу Ac и вектор bc, определяемые посредством (8), станем называть характеристическими2 для АЕ-множества решений ИСЛАУ (1), задаваемого дизъюнктным разложением A на Av и A3, b на bv и b3.

Нововведенное понятие настолько важно в развиваемой нами теории, что его необходимо рассмотреть подробнее. Подчеркнем, что указание характеристических матрицы и вектора полностью определяют AE-множество решений интервальной линейной системы, наряду с триадой, описанной в разделе 2, т.е. кванторными матрицей а и вектором в, разбиением индексных множеств матрицы ИСЛАУ и ее правой части, а также их дизъюнктными разложениями. Но задание характеристических матрицы и правой части дает даже больше информации, одновременно указывая и сами интервалы, и тип их неопределенности в ИСЛАУ. Поэтому имеет смысл говорить о множестве AE-решений (некоторой) интервальной линейной системы, соответствующих данным характеристической матрице и правой части, и писать S(Ac, bc), не указывая явно эту систему и распределение типов неопределенностей в ней.

Теорема 5. Точка x GRn принадлежит множеству решений (A, b) тогда и только тогда, когда

Ac ■ x С bc (9)

в полной интервальной арифметике Каухера. Доказательство. Заметим, что

opp (—v) = dual v

2Верхний индекс c у матрицы A и вектора b как раз обозначает "characteristic".

для любого интервала v £ IR. Следовательно, если к обеим частям включения (7) прибавить по (dual bv + dual (A3 ■ x)), то придем к эквивалентному включению в полной интервальной арифметике

Av ■ x + dual (A3 ■ x) С dualbv + b3. (10)

Но dual (A3 ■ x) = (dual A3) ■ x, так как x — точечный вектор. Поэтому вместо (10) мы можем написать

Av ■ x + (dual A3) ■ x С dualbv + b3.

Наконец, в левой части можно воспользоваться дистрибутивностью относительно точечной переменной x, получая вместо (7) равносильное включение

(Av + dual A3) ■ x С dual bv + b3,

которое совпадает с (9).

Ниже нам понадобится еще одна характеризации AE-множеств решений, в которой переменная выделена в левой части в чистом виде (fixed-point form — в англоязычной терминологии). Приступая к ее выводу, предположим, что S £ IRnxn — некоторая невырожденная интервальная диагональная матрица.

Замечательность подобных матриц состоит в том, что для них (и только для них) существуют алгебраически обратные в обычном смысле матрицы. Более точно, для любой такой матрицы S = diag{ si,... , sn} существует матрица S-1 такая, что

SS-1 = S-1S = I.

При этом, как нетрудно понять,

S-1 = diag{ s-1,..., s-1}.

Отправная точка дальнейших рассуждений — результат теоремы 5:

x £ Saß (A, b) ^ Ac ■ x С bc. (11)

Добавляя к обеим частям (11) по (Sx 0 Acx), получим равносильное включение

Sx С Sx + opp (Acx) + bc.

Но opp (Acx) = opp (Ac) x для вещественных x. Следовательно, имеем

Sx С Sx + (opp Ac) x + bc,

и далее, опять-таки в силу вещественности x, в правой части можно воспользоваться дистрибутивностью и вынести переменную за скобки. Наконец, домножая обе части на матрицу S-1, в целом получим

x £ Saß(A, b) ^^ x С S-1 ((S 0 Ac) x + bc).

Заметим, что при x £ Saß(A, b) = 0 из проведенных нами рассуждений следует, что S-1( (S 0 Ac) x + bc) — правильный интервальный вектор. Итак, имеет место следующая теорема.

Теорема 6. Пусть S £ IRnxn — некоторая невырожденная интервальная диагональная матрица. Точка x £ Rn принадлежит множеству решений Saß(A, b) тогда и только тогда, когда ( )

x £ S-1( (S 0 Ac) x + bc).

6. Алгебраический подход

Известно, что задачи внутреннего оценивания обобщенных АЕ-множеств решений интервальных систем уравнений успешно решаются с помощью алгебраического подхода [11, 12, 27-29], при котором исходная задача оценивания сводится к задаче нахождения алгебраического решения некоторого вспомогательного уравнения в полной интервальной арифметике Ж. Напомним определение.

Определение 8 (см. [16, 24, 25]). Интервальный вектор называется алгебраическим решением интервальной системы уравнений, если подстановка его в эту систему и выполнение всех операций в соответствии с правилами рассматриваемой интервальной арифметики приводят к равенству.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В этом разделе мы покажем, как алгебраический подход может быть распространен на задачи внешнего оценивания множеств АЕ-решений интервальных линейных систем.

Теорема 7. Пусть интервальная матрица О € Жгахга и интервальная невырожденная диагональная матрица Я € Жгахга таковы, что

р( I Я-1 ||О|) < 1,

т. е. спектральный радиус произведения матриц | Я-1||О|, составленных из модулей элементов Я-1 и О соответственно, меньше единицы. Тогда алгебраическое решение интервальной линейной системы

Ях = Ох + Ь (12)

существует и единственно для любого интервального вектора Ь € Жга.

Доказательство. Как известно [19], расстояние а^ (• , •) между элементами полной интервальной арифметики Ж вводится следующим образом:

аМ ( и, V) := тах{ | и — V |, | и — V |} = | и 0 V |.

При этом для любых интервалов р, и, V € Ж справедливо неравенство (см. также [19])

а^ (ри, pv) < |р| • аМ ( и, V ).

Эта оценка в неизменном виде переносится и на многомерный случай, если под расстоянием между и, V € Жга понимать покомпонентную векторнозначную метрику (псевдометрику по терминологии Коллатца [8]), а многомерное неравенство " <" также рассматривается покомпонентно. Более точно, для интервальных векторов и = (и1,..., ип)т и V = (v1,... , vra)т определим

аМ ( и, V) :=

/ аМ ( и1, v1) \

уа^ и„, V™)

€ Ега (13)

Тогда для любой интервальной матрицы Р с элементами рг]- € Ж и любых интервальных векторов и, V соответствующего размера имеет место

аМ( Ри, Pv) < |Р| • ( и, V). (14)

Действительно, для любых интервалов у, у', 2, 2' € Ж известно неравенство

ам (у + 2, у' + 2') < а^ (у, у') + а^ (2,2')

(см. [19]). Мы можем поэтому заключить, что

dist(( Pu)i, (Pv)*) = dist J^PijUj , ^ Pijvj ) -

j=1 j=1

n

<Y1dist (Pij u, Pij vj) - Y11 Pij1 ■dist (uj, vj) j=i j=i

при всех i G { 1, 2,... , n }, что и доказывает3 многомерную оценку (14). В частности, в рассматриваемой ситуации при любом векторе h G IRn

dist (S-1(Gu + h), S-1(Gv + h)) - | S-1| ■ dist (Gu + h, Gv + h) =

= | S-1| ■ dist ( Gu, Gv) - | S-1| |G| ■ dist ( u, v).

Если спектральный радиус матрицы | S-1| |G| меньше единицы, то мы оказываемся в условиях применимости конечномерного варианта теоремы Шредера о неподвижной точке (см., например, [1, 8, 10, 22]). Именно, отображение IRn ^ IRn, действующее по правилу

x ^ S-1(Gx + h),

является сжимающим относительно псевдометрики dist и потому имеет единственную неподвижную точку, которая есть не что иное как алгебраическое решение интервальной линейной системы (12).

Теорема 8. Пусть для интервальной линейной системы Ax = b обобщенное АЕ-множество решений Saß(A, b) непусто, Ac и bc — характеристические матрица и правая часть этого множества решений и, кроме того, существует невырожденная интервальная диагональная матрица S G IRnxn, такая что

р( |S-1 ||S 0 Ac|) < 1. (15)

Тогда алгебраическое решение интервальной линейной системы

Sx = ( S 0 Ac) x + bc (16)

(которое существует и единственно в силу теоремы 7) является правильным интервальным вектором, содержащим множество решений Saß(A, b).

Доказательство. Пусть x* — алгебраическое решение интервальной линейной системы (16). Возьмем какую-нибудь точку X G Saß(A, b) и покажем, что необходимо X G x*. В силу теоремы 6 принадлежность X G Saß(A, b) равносильна включению

X G S-1( (S 0 Ac) X + bc). (17)

Организуем в IRn итерационный процесс по следующим формулам:

x(0) := X, (18)

3Для случая классической интервальной арифметики Ш неравенство (14) хорошо известно, но для полной интервальной арифметики в многомерном случае оно никем ранее не упоминалось и не использовалось.

n

n

n

x(fc+1) .= s-1( (S е ac) x(k) + bc). (19)

Пользуясь математической индукцией, нетрудно показать, что все последовательные приближения этого процесса содержат x. Действительно, для x(0) это верно по построению. Если же x е x(k), то в силу (17) и свойства монотонности интервальных арифметических операций в IR по включению

x е s-1 ((S е Ac) x + bc) с s-1 ((S е Ac) x(k) + bc) = x(fc+1). (20)

Итак, x G x(k) для всех натуральных k. В частности, отсюда следует правильность всех интервальных векторов x(k).

Далее условие ( )

р( |S-1|| s е Ac0 < 1 (15)

влечет сходимость итерационного процесса, определяемого в псевдометрическом пространстве IRn формулами (18), (19) (см. [8]). Ясно также, что последовательность x(k) сходится к неподвижной точке отображения

x ^ S-1( (S е Ac) x + bc),

т. е. к единственному алгебраическому решению x* уравнения (16). Поскольку принадлежность x G x(k) равносильна системе 2n нестрогих неравенств, то она должна сохраниться и в пределе:

x G lim x(k) = x*.

Это и требовалось доказать.

Приведем необходимый комментарий по поводу практической реализации развитого выше алгебраического подхода, т. е. методов нахождения алгебраического решения основного уравнения (16). Теоремы 7-8 уже дают теоретический фундамент для построения стационарных итерационных алгоритмов, основанных на теореме Шредера о сжимающем отображении. Именно, в условиях теоремы 8 можно организовать интервальный итерационный процесс по формуле (19) (или какой-либо ее модификации), который будет сходиться к внешней оценке AE-множества решений (A, b) из любого начального приближения x(0). При этом наиболее удобным выбором x(0) является интервальный вектор, который уже гарантированно содержит множество решений Saß(A, b). Тогда из включения (20) следует, что все последовательные приближения x(k) процесса (19) также содержат оцениваемое AE-множество решений. Например, в качестве x(0) можно взять внешнюю интервальную оценку объединенного множества решений ИСЛАУ, отыскание которой является хорошо изученной задачей [1, 5, 6, 20, 22].

Другая возможность вычисления требуемого алгебраического решения — субдифференциальный метод Ньютона (см., например, [13, 27, 30]), применимость которого к настоящему случаю строго обоснована для интервальных систем (16) с матрицами (S е Ac), в каждой строке которых все элементы либо правильные, либо неправильные. Но экспериментально обнаружено, что этот метод очень хорошо работает и для общих интервальных систем, в которых правильные и неправильные элементы в матрице (S е Ac) перемешаны произвольно (хотя в данном случае это уже не субдифференциальный, а квазидифференциальный метод Ньютона).

Наконец, следует рассмотреть роль и выбор диагональной матрицы S. Ее назначение — способствовать, насколько это возможно, выполнению условия

р( |S-1 ||S е Ac|) < 1. (15)

Исходя из полуэвристических соображений естественно, к примеру, взять S равной диагонали характеристической матрицы Ac = (aj), т.е.

S = diagj a11; a22,---, <„}•

Ясно также, что возможность достичь наших целей варьированием S весьма ограничена: для некоторых матриц Ac условию (15) нельзя удовлетворить ни при каком S. Ниже в разделе 9 мы обсудим другой способ достижения неравенства (15) — обобщенное предо-буславливание, которое в ряде случаев оказывается гораздо более предпочтительным или даже единственно возможным. Если к исходной ИСЛАУ уже применено предобуславли-вание, то для простоты можно взять в качестве S единичную матрицу I.

Рассмотрим далее вопрос качества интервальных решений задачи внешнего оценивания, т. е. степени близости полученной интервальной оценки к идеальному множеству решений.

Общеизвестно, что задачи внутреннего интервального оценивания могут иметь столь много максимальных по включению, но несравнимых между собой решений, что наилучшее в смысле представительности интервального решения среди них выбрать в принципе нельзя. Но для задач внешнего интервального оценивания естественным образом определяется понятие наилучшего по включению решения.

Определение 9. Внешняя интервальная оценка множества решений, совпадающая с его интервальной оболочкой, называется оптимальным (или наилучшим) решением задачи внешнего интервального оценивания (6).

Получение оптимальных или гарантированно близких к оптимальным решений в задачах внешнего оценивания множеств решений интервальных систем является идеальной целью, относительно которой обычно судят о качестве решения задачи тем или иным методом.

Каково качество внешнего интервального оценивания АЕ-множеств решений ИСЛАУ с помощью алгебраического подхода? Иными словами, насколько близка получаемая интервальная оценка к оптимальному решению внешней задачи? Здесь мы не будем рассматривать этот вопрос, так как он требует отдельного исследования. Недавние теоретические результаты А.В. Лакеева [9] свидетельствуют о том, что в самом общем случае, когда на матрицу ИСЛАУ не накладывается никаких ограничений, задача оценивания АЕ-множеств решений может оказаться труднорешаемой. Более точно: если в интервальной матрице системы A "достаточно много" элементов имеют Е-неопределенность, то как задача распознавания соответствующего множества решений (т. е. выяснения того, пусто оно или нет), так и задача его внешнего оценивания являются NP-полными. Данное свойство на нынешнем этапе развития теории сложности вычислений считается равносильным "труднорешаемости" задачи. По этой причине надеяться на качественное внешнее оценивание множеств решений ИСЛАУ в общем случае нельзя. Тем не менее оказывается, что в

4

ряде практически значимых случаев можно дать простые априорные достаточные условия того, что получающаяся с помощью алгебраического подхода внешняя интервальная оценка множества решений оптимальна. Приведем без доказательства следующий важный результат.

Теорема 9 (см. [31]). Пусть для интервальной линейной системы Ax = b обобщенное АЕ-множество решений Eaß(A, b) непусто, Ac и bc — характеристические матрица и правая часть этого множества решений и, кроме того, существует невырожденная

4Проверяемые до фактического решения задачи, лишь на основании ее вида.

интервальная диагональная матрица S £ Жгахга такая, что

р(|S-1 ||SеAc|) < 1,

а матрицы Я 1 и (Я 0 Ас) неотрицательны. Тогда алгебраическое решение интервальной линейной системы

Бх = ( Б 0 Ас) х + Ьс (16)

(которое существует, единственно и дает внешнюю интервальную оценку для (А, Ь) в силу теорем 7-8) является интервальной оболочкой для (А, Ь), т. е. наименьшим интервальным вектором, содержащим множество решений (А, Ь).

7. Интервальный метод Гаусса — Зейделя для обобщенных множеств решений

Одним из наиболее популярных и эффективных алгоритмов нахождения внешних интервальных оценок для объединенного множества решений ИСЛАУ является интервальный метод Гаусса — Зейделя (см., например, [14, 20, 22]), применяемый обычно после предварительного предобуславливания интервальной линейной системы. Наша цель — адаптировать этот метод на задачи внешнего интервального оценивания обобщенных АЕ-множеств решений. Ниже будем предполагать невырожденность интервальной матрицы А, т. е. невырожденность всех точечных матриц А £ А. Ясно, что тогда путем перестановки уравнений системы (строк матрицы ИСЛАУ) можно добиться того, чтобы в новой матрице А все диагональные элементы а»» не содержали нуля. Именно это условие и будет существенно использоваться в наших построениях.

Основой точечного метода Гаусса — Зейделя является, как известно, расписывание системы уравнений Ах = Ь в явном покомпонентном виде

п

йух3- = Ь», г = 1,..., п,

3 = 1

и последующее решение г-го уравнения, г = 1, 2,... , п, относительно х» в предположении ац = 0. Аналогичным образом будем действовать и при построении интервального метода.

Воспользуемся характеризацией АЕ-множеств решений, предоставляемой теоремой 5: точка х принадлежит множеству решений (А, Ь) тогда и только тогда, когда

Ас ■ х С Ьс.

Представляя это включение покомпонентно, получим

п

XX'х3 С ЬС' г

3=1

что равносильно

а^х» С орр ^ а3ху + ЬС, г = 1,..., п.

3=»

Если же 0 ^ pro aC = a^, то обе части этого включения можно домножить на (a^) 1, придя к выражению

xi £ ( ac) 1 ( opp Y^ aj xj + bc ) > i = 1

Предположим, что нам уже известен некоторый интервальный вектор х, содержащий множество решений (А, Ь), т.е. х 1Э (А, Ь). Тогда, если х £ Еав (А, Ь), то должна быть справедливой следующая цепочка соотношений:

xi е (aCi) М oPP ajxj + bc 1 = (aCi) 1 ( oP^ aj j + b:

(aii) 1 ( opp aj) xj +bc I -(aii) 1 ( opp aij) xj +bc

V j=i ' \ j=i

3=г / \ 3=г

Последнее равенство в цепочке выполнено, поскольку все Xj суть точечные, а последнее включение — так как xj• £ xj• и интервальные арифметические операции монотонны по включению. Таким образом, если определить интервальный вектор X посредством покомпонентных равенств

5>pp aj) Xj + bc V j=i '

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(4) ( aij) Xj + bi I' i (21)

то в рассматриваемых нами условиях он, во-первых, является правильным интервалом, несмотря на возможное наличие неправильных интервалов aj и b^, взятие противоположных элементов и т. п. в выражении (21), во-вторых, дает внешнюю интервальную оценку множества решений Saß(A, b).

Поэтому естественно взять пересечение

x П x D Eaß(A, b)

как более точную внешнюю интервальную оценку множества решений Saß(A, b). Наконец, чтобы наиболее полно воспользоваться получаемой в ходе работы алгоритма информацией, организуем, как и в классическом точечном методе Гаусса — Зейделя, немедленное вовлечение полученной новой оценки каждой компоненты (которая заведомо не хуже старой) в вычислительный процесс. Таким образом, i-я компонента нового приближения X будет вычисляться по формуле (21) на основе уже вычисленных компонент X с номерами i =1, 2,... , i — 1, а также i + 1-й, ... , n-й компонент старого приближения x.

В целом вычислительная схема интервального метода Гаусса — Зейделя для уточнения внешней интервальной оценки AE-множеств решений имеет вид, представленный в таблице.

Если Saß(A, b) Пx = 0, то результатом работы выписанного алгоритма является последовательность {X} вложенных правильных интервалов, которая обязана иметь предел в (см. [1, 20, 22]). Критерием остановки итерирования может служить, как обычно, достижение достаточной степени близости (в некоторой метрике или же псевдометрике dist (13)) между двумя последовательными приближениями. Для начала работы интервального метода Гаусса — Зейделя нужно знать некоторое начальное интервальное приближение

С. П. Шарый Таблица

Обобщенный интервальный метод Гаусса — Зейделя

Вход

Характеристические матрица Ас € Жгахга и вектор правой части Ьс € Жга, соответствующие оцениваемому АЕ-множеству решений (А, Ь) интервальной линейной системы Ах = Ь.

Интервальный вектор х = (XI,... , х„)т € Шга, ограничивающий желаемую часть множества решений £а0(А, Ь).

Заданная точность е > 0.

Выход

Либо информация "множество решений (А, Ь) не пересекает х", либо

хп)Т ^ "«в(

новые внешние границы х = (х 1,... , xn)T D (A, b) П x.

Алгоритм

d :=

DO WHILE ( d > e ) DO FOR i = 1 TO n

(i— 1 n

°pp aj) x + (°ppaj) x + bi I; j=1 j=i+1

IF ( xi есть неправильный интервал ) THEN

STOP, сигнализируя "множество решений (A, b) не пересекает x";

Xi : Xi П Xi;

IF ( Xi есть пустое множество 0 ) THEN

STOP, сигнализируя "множество решений (A, b) не пересекает x";

END DO

d := расстояние между x и x; x := x; END DO

х Э (А, Ь). Мы всегда можем получить его как внешнюю интервальную оценку объединенного множества решений 5ип;(Л, Ь) для соответствующей интервальной линейной системы (коль скоро оно наиболее широкое), применив какой-либо из большого количества хорошо разработанных для этой цели методов [1, 5, 6, 13, 14, 20, 22, 30].

8. Исследование обобщенного метода Гаусса — Зейделя

Глубокое теоретическое исследование классического интервального метода Гаусса — Зейделя для внешнего оценивания объединенного множества решений ИСЛАУ было дано Бартом и Нудингом [14], а затем Ноймайером [22]. Развитую этими авторами теорию можно перенести на выведенный нами обобщенный интервальный метод Гаусса — Зейделя. Частично это и делается ниже.

В наших построениях, как и у Ноймайера [22], существенную роль играют понятия М-матрицы и Н-матрицы. Напомним необходимые определения и результаты.

Определение 10 (см. [4, 15, 33]). Матрица А = (а^) € Мгахга называется М-матрицей, если она удовлетворяет любому из следующих эквивалентных условий: внедиагональные элементы матрицы А неположительны и А-1 > 0; А = в/ — Р, где Р — неотрицательная матрица и в > р(Р);

внедиагональные элементы матрицы А неположительны, а ее собственные числа имеют положительные вещественные части;

внедиагональные элементы матрицы А неположительны, ее диагональ О = (а^) положительна и р(/ — О-1А) < 1;

Теорема 10 (предложение 3.6.3 из [22]). Пусть Р, ^ — точечные п х п-матрицы, причем Р неотрицательна, а Q — М-матрица. Разность (^ — Р) является М-матрицей тогда и только тогда, когда р^-1Р) < 1.

Определение 11 [14, 22]. Матрица Л € Жгахга называется интервальной М-матрицей, если каждая вещественная матрица А € Л является М-матрицей.

Определение 12 [22]. Для правильного интервала а обозначим через (а) наименьшее расстояние точек а до нуля, т. е.

Для правильной интервальной матрицы Л = (а^) € Шгахга матрицей сравнения называется точечная матрица того же размера, обозначаемая (Л), такая, что

Определение 13 [22]. Правильная интервальная квадратная матрица Л называется Н-матрицей, если ее матрица сравнения (Л) является М-матрицей.

5Список может быть значительно продолжен. К примеру, Берман и Племмонс [15] перечисляют 50 условий, эквивалентных утверждению "матрица А является м-матрицей". Большое количество эквивалентных определений м-матрицы можно найти в справочнике [4] и книге Ноймайера [22].

и т. д.

5

шт{ |а|, |а| }, если а Э 0, 0, если а Э 0.

-й элемент

В частности, Н-матрицей является любая интервальная матрица А = ( а^) со строгим диагональным преобладанием, удовлетворяющая неравенству

>a«> > У у I a¿j I Для всех i = 1, 2,... , n.

(22)

Менее тривиальный пример интервальных Н-матриц — правильные невырожденные треугольные матрицы, верхние или нижние [22].

Теорема 11. Если х* — предел обобщенного интервального метода Гаусса — Зейделя, примененного для оценивания некоторого АЕ-множества решений интервальной линейной системы А х = Ь, то

(А)| х*|<| Ь |. (23)

Если же А является интервальной Н-матрицей, то

I x1<(A>-1| b

(24)

Доказательство. Напомним, что мы рассматриваем только невырожденные интервальные матрицы A и без ограничения общности считаем 0 ^ a^, i =1, 2,... , n.

Переходя к пределу в расчетных формулах, определяющих обобщенный интервальный метод Гаусса — Зейделя, и учитывая, что lim x = lim X = x*, получим

x*

x* П( (аСг)-^ £ (

>pp aj)x* + bc

i = 1, 2,...,n.

Следовательно, по крайней мере

x* С (acW £ (opp aj) x* + b^ ,

(25)

и потому

I x*|<

(aCi) £ (opp aj) x* + b:

для всех г = 1, 2,... , п, так как в обеих частях включения (25) стоят правильные интервалы. Оценим сверху правые части полученных неравенств:

(aCi)-1( Е (opp aj) x* + b:

I(a¿¿)-11

£(opp aCj) x*+b

<

< I a-i4 ( £ | (opp aj) x*| + | ЬсЛ < (а*)-1 ( £ | || x*| + | Ъг| для всякого i = 1, 2,... , n. Таким образом, в целом имеем

I x*I<(an>-1( £ I ajII x*I + I ьЛ

что равносильно

< а«>| х1"£| а,1| х*| < | Ъг|,

или

(<Л>| Х*|) г <1 Ъг|

для всех г = 1, 2,... , п, т. е. совпадает с (23).

Если же Л — интервальная Н-матрица, то <Л> — это М-матрица и, домножая обе части (23) на <Л>-1 > 0, получим (24).

Из неравенства (24) следует, что если интервальная матрица Л является Н-матрицей, то любой достаточно широкий начальный интервальный вектор х улучшается (т. е. уменьшается в размерах) обобщенным интервальным методом Гаусса — Зейделя. Напротив, если Л не есть Н-матрица, то такого вывода сделать уже нельзя. Ноймайер в [22] доказал в этих условиях даже следующий эффектный результат.

Теорема 12 [22]. Если правильная интервальная п х п-матрица Л = (а,) не является Н-матрицей, то существуют сколь угодно широкие правильные интервальные векторы, которые не улучшаются интервальным методом Гаусса — Зейделя, примененным для внешнего оценивания объединенного множества решений интервальной системы Лх = 0.

Для исследуемого нами обобщенного интервального метода Гаусса — Зейделя доказательство Ноймайера уже не подходит: в нем существенно используется тот факт, что абсолютная величина произведения интервалов равна произведению абсолютных величин сомножителей, а в полной интервальной арифметике Каухера это свойство не имеет места. Тем не менее гарантировать улучшение начального интервала методом Гаусса — Зейделя в случае, если матрица ИСЛАУ не является Н-матрицей, мы все-таки не можем.

Одним из наиболее замечательных фактов, относящихся к классическим интервальным итерациям Гаусса — Зейделя в применении к объединенному множеству решений ИСЛАУ, является следующее свойство оптимальности, впервые обнаруженное Бартом и Нудингом [14]: если матрица ИСЛАУ является интервальной М-матрицей, то метод Гаусса — Зейделя сходится к интервальной оболочке объединенного множества решений.

Нам удалось распространить этот классический результат и на обобщенный интервальный метод Гаусса — Зейделя:

Теорема 13. Если в интервальной линейной системе Лх = Ъ матрица Л является интервальной М-матрицей, то обобщенный интервальный метод Гаусса — Зейделя сходится к оптимальной внешней интервальной оценке АЕ-множества решений рассматриваемой системы.

Доказательство. Введем следующие обозначения:

Е = (е,) — матрица, полученная из матрицы системы Л = (а,) заменой ее диагональных элементов на нули;

Б = (в,) — диагональная матрица с элементами вц = а^, г = 1, 2,... , п, по главной диагонали;

Ес = ( е,) — матрица, полученная из характеристической матрицы Лс = (а,) заменой ее диагональных элементов на нули;

БС = (в,) — диагональная матрица с элементами вС = а^, г = 1, 2,... , п, по главной диагонали.

Очевидно,

Л = Б + Е,

АС = БС + ЕС,

и

= ау = о для г = ^

е»з = е3 = 0 для г = ^

Если х* — предел обобщенного интервального метода Гаусса — Зейделя, примененного к ИСЛАУ Ах = Ь, то, очевидно,

х* = х* П (БС)-1( (орр ЕС) х* + ЬС ),

а потому

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

х* С (БС)-1( (орр ЕС) х* + ЬС ). (26)

Далее, если А есть М-матрица, то ее диагональ состоит из положительных элементов, |( БС)-1| = (Б)-1, и значит

|( БС)-1|| орр ЕС| = (Б)-1|Е|. (27)

Кроме того, Б также есть М-матрица.

Но и матрица сравнения (А) является М-матрицей, будучи одной из точечных матриц в пределах А. Следовательно, поскольку (А) = (Б) — |Е|, то из результата Ноймайера (теорема 10) вытекает ( )

р( (Б)-1|Е|) < 1,

что вместе с (27) приводит к неравенству

р( |( БС)-1| | орр ЕС|) < 1.

Таким образом, можно заключить, что итерационный процесс в Жп, определяемый формулами

х(0) := х*,

х(к+1) := (БС)-1( (орр ЕС) х(к) + ЬС ), к = 0,1,...,

сходится к единственной неподвижной точке х* отображения Жп ^ Жп, действующего по правилу ( )

х ^ (БС)-1( (орр ЕС) х + ЬС ).

При этом х* является алгебраическим решением интервальной линейной системы

х =(БС)-1( (орр ЕС) х + ЬС ). (28)

Далее, из включения (26) по индукции можно вывести, что

х* С х*. (29)

Действительно, х* С х(0), и если х* С х(к), то, принимая во внимание свойство монотонности интервальных арифметических операций в Ж по включению, нетрудно заключить:

х* С ( БС)-1( (орр ЕС) х* + ЬС ) С (БС)-1( (орр ЕС) х(к) + ЬС ) = х(к+1).

Переходя к пределу к ^ то, получаем (29).

Для завершения нашего доказательства следует лишь сослаться на теорему 9: коль скоро х* есть алгебраическое решение системы (28) и А является М-матрицей, то х* — это интервальная оболочка множества решений (А, Ь) и х* 1Э (А, Ь). Следовательно, в силу (29) вектор х* также является интервальной оболочкой (А, Ь).

9. Предобуславливание

Обе развитые выше методики для внешнего интервального оценивания АЕ-множеств решений ИСЛАУ — алгебраический подход и обобщенный интервальный метод Гаусса — Зейделя — имеют существенные ограничения на область приложимости. Ключевым моментом применимости алгебраического подхода является приведение исходной интервальной линейной системы (1) к виду (16) таким образом, чтобы выполнялось условие р( |й-1| |Я© Ас| < 1. В свою очередь, обобщенный интервальный метод Гаусса — Зейделя хорошо работает, как следует из теории раздела 8, только для интервальных линейных систем с Н-матрицами. Совершенно очевидно, что оба эти условия довольно обременительны и на практике выполняются далеко не всегда. Как же находить внешние оценки АЕ-множеств решений интервальных линейных систем в общем случае?

В классической задаче внешнего интервального оценивания объединенного множества решений обычно практикуют так называемое предобуславливание — домножение обеих частей системы слева на некоторую вещественную матрицу, часто обратную для середины матрицы ИСЛАУ [1, 20, 22]6. От подобной трансформации объединенное множество решений расширяется, но вместе с тем улучшаются свойства интервальной матрицы пре-добусловленной системы (см. [22]). К сожалению, этот прием, который мы будем называть наивным предобуславливанием, напрямую при оценивании обобщенных множеств решений неприменим.

При простом домножении интервальной матрицы и правой части ИСЛАУ слева на вещественную матрицу обобщенные множества решений необязательно расширяются, но могут изменяться довольно сложным образом. Чтобы наглядно проиллюстрировать это явление, вновь рассмотрим интервальную линейную систему (4), для которой

mid A

3 1

- 2

1

^ 2 3 )

(mid A)

-1

( 12 2 \

37 37

2 12

V - 37 37 /

а интервальная система, "наивно предобусловленная" с помощью обратной средней, есть

4 (111261 И0'101 ) x=4 (1-141411. (зо)

37 у [-10,10] [11,26] ) 37 у [-14,14] '

Из рис. 4, а (выполненного в том же масштабе, что и рис. 2) видно, что множество ^ g ^ ^ g ^ -решений "наивно предобусловленной" системы (30) в первом ортанте не со-

( 4 5\ , ,

держит вершину ( 3, 3 I и прилегающую к ней часть (например, точку (1,1)) множества

g g ^ ^ g ^-решений для исходной ИСЛАУ (4). В силу центральной симметричности

рассматриваемых множеств такая же ситуация имеет место и в третьем ортанте.

Итак, множество решений "наивно предобусловленной" ИСЛАУ не обязательно содержит множество решений исходной ИСЛАУ, а потому внешняя оценка множества решений этой интервальной линейной системы может и не быть внешней оценкой соответствующего множества решений исходной системы. Тем не менее выход из создавшегося затруднения

6 В книге Алефельда и Херцбергера [1] предобуславливание называется методом Хансена (см. главу 16).

а б

решений, соответствующее характеристическим матрице и правой части (31).

есть, и состоит в том, что мы должны предобуславливать не исходную интервальную линейную систему вообще, а характеристическую матрицу и характеристический вектор правой части, соответствующие конкретному рассматриваемому множеству АЕ-решений.

Вновь обратимся к теореме 5, дающей удобную аналитическую характеризацию множеств АЕ-решений интервальных линейных систем:

X е Еав(А, Ь) ^^ Ас ■ X С ьс.

Если Л — какая-нибудь квадратная точечная п х п-матрица, то следствием включения, выписанного справа в этой эквивалентности, является

Л(АС ■ х) С ЛЬС.

Известно, что произведение интервальных матриц в общем случае неассоциативно. Тем не менее для точечных Л и х имеет место равенство7

Л(АС ■ х) = (ЛАС) х.

Следовательно, в целом приходим к импликации

X е (А, Ь) (ЛАС) X С ЛЬС,

7Обоснование этого равенства для матричного умножения в полной интервальной арифметике ЕМ совершенно аналогично классическому случаю, и мы его опускаем.

содержательный смысл которой может быть выражен следующим образом.

Теорема 14. Если Л € ^пхп — квадратная точечная матрица, то множество АЕ-решений 2(АС, Ьс) для интервальной линейной системы (1), соответствующее характеристическим матрице Ас и вектору правой части Ьс, содержится во множестве АЕ-решений 2(ЛАС, ЛЬС) для интервальной линейной системы (ЛА) х = ЛЬ, соответствующих характеристической матрице ЛАС и вектору правых частей ЛЬС.

Будем называть домножение характеристических матрицы и правой части слева на вещественную матрицу обобщенным предобуславливанием интервальной линейной системы. Как видим, его результатом может быть лишь расширение множества АЕ-решений, но для новой характеристической матрицы может оказаться выполненным условие

р( |/е Ас|) < 1,

которое так желательно для применимости наших подходов. Следовательно, исходную задачу внешнего интервального оценивания некоторого множества решений ИСЛАУ можно будет заменить на успешно решаемую задачу внешнего оценивания другого множества решений, которое соответствует предобусловленной матрице и правой части.

Например, для множества ^ з з ^ ^ 3 ^ -решений интервальной линейной системы (4) характеристические матрица и вектор правой части есть

Ас

[2, 4] [1, —2] [2, —1] [4, 2]

Ьс

[—2, 2] 37 I [—2, 2]

а потому

(ш1а А)-'ас = 37

[14, 23] [10, —10] [8, —8] [26,11]

(ш1а а)-1ьс = —

2

3~7

[—14,14] [—14,14]

(31)

Множество АЕ-решений ИСЛАУ, соответствующее характеристическим матрице и правой части (31), изображено на рис. 4, б. Оно очень похоже на то, что представлено на рис. 4, а. Тем не менее, как легко убедиться из сопоставления с рис. 2, правое множество рис. 4,

в отличие от левого, включает в себя все -решения исходной интервальной

линейной системы (4).

Далее,

1

|1 е (ш1а А) АС| = —

9 20

37 V 16 15

1

а собственные числа этой матрицы равны — (12 ± \/329), так что условие (32) (см. ни-

37

же) действительно соблюдается. В то же время нетрудно показать, что никаким выбором диагональной матрицы Б условию (15) теоремы 8 удовлетворить нельзя.

Как мы уже отмечали, введение процедуры обобщенного предобуславливания делает, вообще говоря, излишними манипуляции с диагональной матрицей Б, фигурирующей в теоремах 6-8. Положим поэтому Б = I и для удобства читателя переформулируем основные результаты алгебраического подхода (см. раздел 6) в виде, который явно учитывает предобуславливающую матрицу Л.

Теорема 15. Пусть Л — квадратная точечная матрица. Тогда, если точка x £ Rn принадлежит множеству решений Eaß(A, b), то

x £ (1 е ЛAc) x + льс.

Теорема 16. Пусть для интервальной линейной системы Ax квадратная точечная матрица Л, что

р( 11 е ЛAc|) < 1.

Тогда алгебраическое решение интервальной системы

x = (1 е ЛAc) x + ЛЬс (33)

существует и единственно. Если же обобщенное множество решений Eaß(A, b) непусто, то алгебраическое решение интервальной системы (33) является правильным интервальным вектором, содержащим Eaß(A, b).

Доказательства этих утверждений совершенно аналогичны доказательствам теорем 6 -8, и поэтому не приводятся.

Список литературы

[1] Алефельд Г., Херцбергер Ю. Введение в интервальные вычисления. Мир, М., 1987.

[2] АщЕпков Л. Т. К проблеме повышения живучести управляемых систем. В "Модели и методы исследования операций". Под ред. Б. А. Бельтюкова и В. П. Булатова. Наука, Новосибирск, 1988, 69-85.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[3] ВАтолин А.А. О задачах линейного программирования с интервальными коэффициентами. Журн. вычисл. матем. и матем. физ., 24, 1984, 1629-1637.

[4] Воеводин В.В., Кузнецов Ю.А. Матрицы и вычисления. Наука, М., 1984.

[5] Добронец Б.С., Шайдуров В.В. Двусторонние численные методы. Наука, Новосибирск, 1990.

[6] Калмыков С.А., Шокин Ю.И., Юлдашев З.Х. Методы интервального анализа. Наука, Новосибирск, 1986.

[7] Клини С.К. Математическая логика. Мир, М., 1973.

[8] КоллАтц Л. Функциональный анализ и вычислительная математика. Мир, М., 1969.

[9] Лакеев А.В. Вычислительная сложность оценивания обобщенных множеств решений интервальных линейных систем. В "Труды XI междунар. Байкальской школы-семинара "Методы оптимизации и их приложения". ИСЭМ, Иркутск, 1998, 115-118.

b существует такая (32)

10] ОРТЕГА Дж., РЕйНБОЛДТ В. Итерационные методы решения нелинейных систем уравнений со многими неизвестными. Мир, М., 1975.

11] ШАРЫй С.П. Новый подход к анализу статических систем с интервальной неопределенностью в данных. Вычисл. технологии, 2, №1, 1997, 84-102.

12] ШАРЫй С.П. Алгебраический подход к анализу линейных статических систем с интервальной неопределенностью. Изв. РАН. Теория и системы управления, №3, 1997, 51-61.

13] ШАРЫй С.П. Алгебраический подход во "внешней задаче" для интервальных линейных систем. Вычисл. технологии, 3, №2, 1998, 67-114.

14] BARTH W., Nuding E. Optimale Losung von Intervallgleichungssystemen. Comput., 12, 1974, 117-125.

15] BERMAN A., PLEMMONS R.J. Nonnegative matrices in the mathematical sciences. Academic Press, New York, 1979.

16] Berti S. The solution of an interval equation. Mathematica, 11 (34), No. 2, 1969, 189-194.

17] GardeNes E., TREPAT A. Fundamentals of SIGLA, an interval computing system over the completed set of intervals. Comput., 24, 1980, 161-179.

18] GardeNes E., Trepat A., Mielgo H. Present perspective of the SIGLA interval system. Freiburger Intervall-Berichte, No. 82/9, 1982, 1-65.

19] KAUCHER E. Interval analysis in the extended interval space IR. Com,put. Suppl., 2, 1980, 33-49.

20] KEARFOTT R.B. Rigorous global search: Continuous problems. Kluwer, Dordrecht, 1996.

21] KREINOVICH v., Lakeyev A., Rohn J., Kahl P. Computational complexity and feasibility of data processing and interval computations. Kluwer, Dordrecht, 1997.

22] NEUMAIER A. Interval methods for systems of equations. Cambridge University Press, 1990.

23] NEUMAIER A. On Shary's algebraic approach for linear interval equations. SIAM J. on Matrix Analysis and Appl. In press. (PostScript- и dvi-файлы работы доступны на http://solon.cma.univie.ac.at/~neum/papers.html).

24] NICKEL K. Die Auflösbarkeit linearer Kreisscheiben- und Intervall-Gleichungssystemen. Linear Algebra and its Appl., 44, 1982, 19-40.

25] RATSCHEK H., Sauer W. Linear interval equations. Comput., 28, 1982, 105-115.

26] Shary S.P. Solving the linear interval tolerance problem. Math. and Comput. in Simulat., 39, 1995, 53-85.

[27] Shary S.P. Algebraic approach to the interval linear static identification, tolerance and control problems, or One more application of Kaucher arithmetic. Reliable Comput., 2, 1996, 3-33.

[28] SHARY S.P. Algebraic solutions to interval linear equations and their applications. In "Numerical Methods and Error Bounds". Eds. G. Alefeld and J. Herzberger. Akademie Verlag, Berlin, 1996, 224-233.

[29] SHARY S.P. A new approach to the analysis of static systems under interval uncertainty. In "Scientific Computing and Validated Numerics". Eds. G. Alefeld, A. Frommer and B. Lang. Akademie Verlag, Berlin, 1996, 118-132.

[30] SHARY S.P. Algebraic approach in the "outer problem" for interval linear equations. Reliable Comput., 3, 1997, 103-135.

[31] SHARY S.P. Interval Gauss — Seidel method for generalized solution sets to interval linear systems. In "MISC'99 — Workshop on Applications of Interval Analysis to Systems and Control", Girona, Spain, February 24-26, 1999. Universitat de Girona, 1999, 51-65.

[32] SHARY S.P. Outer estimation of generalized solution sets to interval linear systems. In "Developments in Reliable Computing". Ed. T. Csendes. Kluwer, Dordrecht, 1999, 323-335. (Опубликовано также: Reliable Comput., 5, 1999, 323-335.)

[33] VARGA R.S. Matrix iterative analysis. Prentice Hall, Englewood Cliffs, 1962.

[34] WALTER E., Pronzato L. Identification of parametric models from experimental data. Springer, Berlin-Heidelberg, 1997.

Поступила в редакцию 15 мая 1999 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.