УДК 519. 615.5
А. А. Буздин, Е. А. Васильева КАСАТЕЛЬНОЕ РАЗЛОЖЕНИЕ И ЕГО ОБОБЩЕНИЯ
Представлен метод решения больших систем линейных уравнений, основанный на неполном блочном разложении блочных трехдиагональ-ных матриц. Этот метод является обобщением частотно-фильтрующего метода, предложенного Г. Виттумом в [1], методов, описанных в работах [2—4] и др.
We present a preconditioner for large systems of linear equations based on the incomplete block decomposition for block-tridiagonal matrices. This method generalizes frequency-filtering method of G. Wittum [1] and methods developed in [2-4] etc.
Ключевые слова: большая система линейных уравнений, блочное разложение, блочная трехдиагональная матрица, частотно-фильтрующий метод.
Key words: large system of linear equations, block decomposition, block-tri-diagonal matrix, frequency-filtering method.
Введение
Рассмотрим систему линейных уравнений вида
Ки = Б (1)
с положительно определенной блочно-трехдиагональной матрицей
K =
Г D1
L1
0
- L1 D 2
0 L2
D„1
- Ln-1
0
L
Dn
n-1
(2)
0
0
© Буздин А. А., Васильева Е. А., 2014
Вестник Балтийского федерального университета им. И. Канта. 2014. Вып. 10. С. 161 — 169.
где матрицы L к и D к — матрицы размерности m х m. Векторы u и F
имеют вид u = blockvector{uk}, F = blockvector{Fk}, где u, Fk e Rm . Система (1) может быть решена при помощи полного блочного разложения К:
К = (L + T) T-1 (U + T),
где L и U — соответственно нижняя и верхняя блочно-треугольные матрицы; T — блочно-диагональная матрица T = blockdiag{Tk}; блоки Tk удовлетворяют следующей рекурсии
Ti = Di, Tk = Dk - Lkni Tk:L1 Lkm, k > 1. Решение u может быть получено в два этапа: 1. v = T 1 (F - Lv). 2. u = v - T-1LT u.
Для этого требуется эффективно решать системы с матрицами Tk, что весьма затруднительно, так как матрицы Tk при k > 1 не являются разреженными.
Метод неполного блочного разложения основывается на замене матриц Tk на их разреженные аппроксимации T, что приводит к следующей факторизации матрицы K:
K = (L + T) T -1(LT + T)- N, (3)
где T = blockdiag{ Tk}. Матрица N называется матрицей остатка и имеет вид N = blockdiag{ N k}. Матрица W = (L + T) T-1(LT + T) является теперь «легко обратимой» и может быть использована в качестве предобуславливателя. Скорость сходимости методов такого типа зависит от способа конструкции блоков Tk.
Статья посвящена фильтрующему разложению, впервые предложенному в [1]. Матрицы W этого разложения строятся так, чтобы удовлетворять фильтрующим условиям либо поточечно
Ne = 0 (4)
для некоторого тестового вектора e, либо усредненно.
Выбор гладкого или быстроменяющегося тестового вектора e приводит к предобуславливателю W, сильно подавляющему соответственно низкочастотные или высокочастотные компоненты ошибки.
В касательном частотно-фильтрующем разложении, введенном в [4], диагональные блоки имеют виц
= D1, Tk = Dk + &кTk-1©k - Lk-1©k - 0kLk-1, k > 1, (5)
где 0 k — диагональные m х m матрицы, вычисляемые в соответствии с фильтрущими условиями (4), имеющими в этом случае вид
Tk- 10ke = Lk-1e .
В работе [2] матрицы 0 k заменяются скалярными параметрами цk, которые выбираются в соответствии с условиями
(Ne, e) ^ min. (6)
Такой выбор параметров приводит к касательному разложению с диагональными блоками
Т = Б!, Т = Бк + ц2-{~к- 2цк^кк > 1, (7)
Условие (6) приводит к равенству
Цк = ^ • (8)
(Тк е, е)
В работе [3] было рассмотрено более общее двухчастотное разложение, в котором
Т = Б1, Тк = Б к + Ц(к1)1 42)1 Тк-1 - (ц(к1)1 + 42Л) Ь к, к > 1, (9)
с двумя последовательностями параметров ц^ и цк2^ 163
V (Ьк е(1), е(1)) ц(2) (Ьк е(2), е(2)) Цк (Тк е(1), е(1))' Цк (Тк е(2), е(2))'
(1) (2)
где е 'и е ' — некоторые тестовые вектора.
Для модельной задачи, то есть в случае, если матрица (2) имеет виц К = Ъ1оскЫ^(-Ь, Б, -Ь}, (10)
касательное и двухчастотное разложение можно записать в более простых видах. В этом случае диагональные блоки Тк полного разложения задаются формулами
1 1 = Л е (С)7 2
Тк = Л /к (С)Л, (11)
1 1
где С = Ь 2БЬ 2 и /к — рациональные функции;
1
Л(Х) = Х, /к(X) = Х- ——, к > 1. (12)
Л-1(Х)
Как касательное, так и двухчастотное разложения матрицы К получаются заменой функций /к в (11) на их некоторые линейные аппроксимации /к . В случае касательного разложения функции /к представляют собой касательные к функциям /к в точках X, задаваемых параметрически так, чтобы Тк = /к (Х)О+/к (Х)(О-XI). Двухчастотное разложение соответствует линейной аппроксимации функций /к, которая строится по заданным точкам Х(1) и Х(2): Тк = /к (Х(1))О+Д12/к (О-Х(1)Л), где
д е /к (Х(2)) - /к (Х(1)) Д12 /к = Х(2) -Х(1) .
Используя (12), можно показать, что блоки касательного разложения получаются по формуле (7), где Цк = 1/ /к (X), а блоки двухчастот-ного разложения вычисляются по формуле (7), где ц(к1) = 1/ /к (Х(1)), ц(к2) = 1/ /к (Х(2)). Было показано, что для всех рассмотренных разложений при оптимальном выборе параметров спектральный радиус мат-
2
рицы перехода удовлетворяет следующей оценке р(1 - W-1K) = 1 - 0(к3), где к — шаг сетки. Таким образом, использование этих методов в каче-
стве предобуславливателя в методе сопряженных градиентов дает скорость сходимости порядка 1 - 0(й1/3). Можно получить еще большую эффективность метода, если использовать не одно, а последовательность касательных разложений с различными параметрами X. Как показано в работе [1], если использовать число разложений, пропорциональное логарифму шага сетки, то скорость сходимости метода не будут зависеть от шага сетки.
1. Обобщенное касательное разложение
--Как показал анализ модельной задачи (1), (10), касательное и двухчас-
164 тотное разложения основаны на линейных аппроксимациях функций из (12). Рассмотрим их приближение рациональными аппроксимациями
7 (X) = Рь (X)/Ом (X), (13)
где РЬ (X) и Ом(X) — многочлены степени Ь и М соответственно. Использование рациональных аппроксимаций приводит к дальнейшему увеличению порядка скорости сходимости разложений (см. [5]).
Пусть задано множество N различных точек на комплексной плоскости и связанное с каждой из них представление функции
14-1 1
и,1 (^ - з У + 0[(2 - г )Н. (14)
Построим рациональную дробь РЬ (г)/Ом (г) такую, чтобы она обладала свойствами (14), а степени числителя и знаменателя удовлетворяли
N
м + Ь = N = £ т{ -1 (15)
]=о
так, чтобы число неизвестных коэффициентов совпадало с числом условий. Если все условия рассматриваются в единственной точке, то задача называется задачей Паде. Если все т1 = 1, то задача называется задачей Коши — Якоби. В общем случае задача называется обобщенной задачей Паде. Существует ряд способов ее решения (см., напр., [6] и [7]).
Для того чтобы определить обобщенное касательное разложение, приведем решение обобщенной задачи Паде для случая, когда в (14) все = 2.
Теорема 1. Пусть / = и,,0, /' = и,,1 и
Т(г) = / (г - г ),(1 * Д Т4 (г) = / + /(г - г). (16)
- г
Тогда решение обобщенной задачи Паде для случая т, = 2, Ь = М + 1 имеет вид
7 (г) = Рм+1(г)/Ом (г) = (1Т 1)-1, (17)
где матрица WN = (т,,^ (г)] I, ] = 1,... М и многочлены Рм+1(г) и ОМ (г):
^ 0 1т ^
Рм+1(г) = ае1 WN, Ом (г) = - ае1 Доказательство этой теоремы можно найти в [5].
1 WN ,
Эта теорема позволяет рассмотреть неполное блочное ЬИ-разложение
где
W(р) = (L + Т( р)) (Т( р) ^^ +Т( р)),
Т( р) = blockdiag{гi(р)} — матрица, состоящая из блоков
1 1
Р) _ 7 2 ~(Р)(
ТИ> _ 7 /(Р)(С)I2 .
(19)
(20)
Способ построения этих блоков описывается в следующей легко проверяемой теореме:
Теорема 2. Для блоков Ткр) справедливо следующее равенство:
Т(р) _ Тк ~
V1 у
Т 1,1 Тк Т 2,1 Тк Т 1,2 Тк Т 2,2 Тк
ТкрД Ткр,2
Т 1,р VI ^ к
I
V,р
V1 у
Т^ _ /к+/к (^))(0-£(1)ь), Т^ _ /к (Х(1 ))0 + Д/ (О-£(1 Ь), 1 * ].
(21)
(22)
Как видно из формул (22), в случае модельной задачи блоки Тк1 и Тк,1 представляют собой диагональные блоки касательного и двухчас-
тотного разложений соответственно. Следовательно, их можно вычислить по рекуррентным формулам (7) и (9). Это позволяет обобщить разложение (19) матрицы более общего вида
Г Б, -I
К _
Б2
0
0
' бя_
0 -1п
0
Б„
(23)
где Б к и 1к — т х т матрицы.
Определение 1. Неполное блочное Ш-разложение (19), аде диагональные блоки имеют вид (21), в котором Т1к'1 задаются рекуррентными соотношениями
Т1-1 _ Б1, Т,1 _ Б к +(ц(к1^1 ^ -ц^ к-1 + Ь^), к > 1,1 * 1; (24)
Т1,1 _ Б1, Т^ _ Бк +41-! ЦД Т^ -^-1-Ц(к1)11Тк-1, к > 1,1 Ф] (25)
с параметрами ц(к") е Я, назовем обобщенным касательным разложением порядка р.
Обратим внимание на то, что если матрица исходной системы уравнений имеет вид (2), формулы (24), (25) совпадают с рекуррентными формулами (7) и (9). Поэтому можно рассматривать (24), (25) как обобщение касательного и двухчастотного разложений на матрицы вида (23).
Рассмотрим далее вопрос корректности сформулированного определения. В силу построения матрицы Тк, 1 _ (т. 1) и матрицы Ткр) всегда
симметричные. Покажем, что блоки Ткр) положительно определены,
165
если
1
I
таким же свойством обладает матрица системы К. Для этого мы сначала дадим другое, эквивалентное прежнему, определение этих блоков Ткр).
Рассмотрим подпространства векторов Хк с Кпт такие, что каждое подпространство Хк состоит из блочных векторов у(к) = Ъ1оск^ес1ог{V/0}, у которых компоненты к) = 0 при I ф к. Пусть для каждого 1, 1 ^ 1 ^ р, определены матрицы линейных отображений рк) : Хк ^ Япт, где
.(О
р(|) = (ц® - • - • ^.....^ 1,0.....0)Т и г® = (рк)Г : Я™ ^ Хк.
166 Теорема 3. Блоки Ткл касательного разложения можно получить по формуле
Хк'1 = гк') К рк). (26)
Доказательство. Легко проверить, что Т1,г = 01, а при к > 1 блоки
Т11 -к удовлетворяют следующей рекурсии:
Тк"1 = г» Крк1) = Бк + (ц£1 )2 г(-)1 К рк-1 -цк°1(Ьк-1 + Ц,) =
= Бк + (цкГ-1 )2 Т- -Ц(к°1(Ьк-1 + Ь-:),
которая совпадает с рекурсией (24). Аналогично можно показать, что блоки двухчастотного разложения Тк',' получаются по формуле ТГ = Г;) Кр(к'). Введем матрицы
( Т 1,1
Ркр) = (р(к1).....р(кр)), = (I, I.....I) и Ккр) =
,(р)
■Г р,1 -Г р,2 V к к
■ Л
т р ,р
1к у
Тогда матрица К(кр) = (Р
(р) =(Р(р))
Т К Р(р) ^ р) = V 1р (К(кр) )-11рт )"1.
Теорема 4. Пусть матрица Ркр) невырожденная. Тогда блок Тк(к) совпадает с блоком Тк полного блочного разложения матрицы К.
Доказательство. Запишем блоки полного блочного разложения Тк в
(Б, -ЬТ 0 - 0 Л
таком виде: Тк = (0К-11(0)-1, где Кк =
10 = (0,. ,0, I). Так как матрицы Р ( к) = (р (к1), кт х кт невырожденные, то для матрицы Тк справедливо
'•• Бк-! -ЬТ-
0 -Ьк-г Бк , (к) \
, р к ) размерности
и
Тк =
(к ^0 )-1
^кк) í (Ркк)) К к Ркк)
1 (Ркк)) Я
Легко проверить, что
Кк) _(рк) )Т К к Р<к) _
Г Т Т !,2 Т 1,к А
Тк Тк "' Тк
"Т 2,1 ' 2,2 :
Тк Тк :
т к,1 '-г к,2 у к,к
V Тк Тк "' Тк У
и 10Ркк) _(I,I,...,I)_ 1к.
_ Тк( к). □
Тогда справедливо равенство Тк _(1р (К(кк)) 1рг)
Теорема 5. Пусть матрица К симметричная, положительно определенная. Пусть также при 1 ^ к ^ р матрицы Ркк), а для любого к > р матрицы Ркр) невырожденные. Тогда для всех к блоки обобщенного касательного разложения Тк(р) существуют и положительно определены. Кроме того, матрица остатка р) _ W(р) - К имеет блочно-диагональный вид с блоками
р) _ blockdiag{R(kp)}, (27)
где R(1Р) _ - _ R(pp) _ 0 и R(kp) > 0, при к ^ р + 1.
Доказательство. К _ (Ь + Т) Т-1 (и + Т) — полное блочное разложение матрицы К. Так как матрица К положительно определена, то и матрицы Т1 и Т-1 также положительно определены.
Для доказательства существования обобщенного касательного разложения W(р) матрицы К выведем по индукции следующие свойства: матрицы Т^р) положительно определены, более того, Т/р) ^ Тк > 0; блоки матрицы остатка R к(р) все симметричные и удовлетворяют неравенству R ^р) ^ 0. Для этого представим матрицу остатка в следующем виде: R(р) _ Т(р) - Т + Ь((Т(р))-1 - Т-1)ЬТ. Отсюда видно, что R(р) имеет блочно-диагональный вид
[0, 1 < к < р,
Rк<р) _ р) - Тк + ьк-1 ((-1(р) )-1 - Т- )Т-1, к > р. (28)
Заметим, что в силу теоремы 4 предположения теоремы 5 справедливы при любом к е {1,., р}. Предположим, что они справедливы для некоторого к _ 1 -1 ^ р. Тогда из (28) следует Т _ ^р) + Т + Ц-ЛСТ^Г1 -Т^Ь-г
В силу индукционного преположения, Т1 Т1-1, следовательно, Тг>Т-с откуда 11-1((TI-()-( -Т})!-^ 0.
Для доказательства того, что RСp) ^ 0, перепишем (28) в виде [0, 1 < к < р, ^_^Тк<р)-( 1к,("Тй)ь^), к>р
и сравним матрицы Тк(р) и Тк _ Бк - Ьк-1 (Тк(Р1) Ьк-1 при к > р .
167
168
Отметим, что в силу определения матриц Тк матрицы Тк имеют
T =
Г 0 ^ T Г t 1,1 Tk -1 T 1'P ik -1 LT Л L k-1
0 ,1У T P-1 ik-1 VL k-1 • T p 'P lk-1 ■ L k-1 LTk-1 D k У
Гю 1I л
вид
Г о Л
v 1у
=: Л"
Обозначив R :=
ffljI
, представим матрицу Л в виде:
Г 0 > T Г Г T 1Д Tk-1 T 1,p k-1
Л = 0 R RT T p,! k -1 T p ,p k-1
V1У V V L k-1 • • Lk-!
/
гГ Л
'-'к-1 D
R
к У
RT
V1У
F+1
p+1 *
Элементарные вычисления и применение рекурсий (24) и (25) дают
f т i,i т i,p л Ak *** Tk
Z11 =
TT p,1
t p,p к
7 =
12
Г Dk + -i ^
Dk + ®p Lk-1
Легко проверить, что для любой регулярной 2 х 2 блочной матрицы
7 7
21 22
справедлива формула 7 1 =
7-1 0 о о
Л (
"7 7
11 12
S-1 (-7217-1,i),
Где S = 722 7217-1712'
Применяя эту формулу, получим:
Л = !;7-1 Ip + (I - 1рГ7-j7u) (Dk - 7[27-11712 )-1 (i - 7T27-J I). (29)
Здесь Dk - 7г27-1712 — дополнение Шура положительно определенной матрицы. Отсюда Dk - 7Т,7ц712 > 0 и из (29) имеем Л^1рГ7ц1р = (Tp))-1, то есть Tk = Л1^"Tkp). Таким образом, для k > p, справедливо Rkp) = "Tkр) - Tk ^ 0. Это доказывает, что для всех k блоки "Tkр) положительно определены. □
Следствие. Так как матрица остатка положительно полуопределена, то W(q) > K. Это означает, что метод простой итерации с матрицей W(q) в качестве предобуславливателя всегда сходится.
Список литературы
1. Wittum G. Filternde Zerlegungen-Schnelle Löser für grosse Gleichungssysteme // Teubner Skripten zur Numerik. Stuttgart, 1992. Bd 1.
2. Buzdin К. Tangential decomposition // Computing. 1998. № 61. P. 257 — 276.
3. Buzdin К., Wittum G. Two-frequency decomposition. Preprint, Universität Heidelberg, 2000.
Касательное разложение и его обобщения
4. Wagner C. Tangential frequency filtering decompositions for symmetric matrices // Numer. Math. 1997. № 78. P. 119-142.
5. Буздин А. А., Васильева Е. А. Неполное блочное разложение, основанное на аппроксимациях Паде // Математическое моделирование. 2006. Т. 1, № 4. С. 89—99.
6. Stoer J., Bulirsch R. Introduction to numerical analysis. N. Y., 1992.
7. Baker G.A. P. Graves-Morris Pad'e Approximants. L., 1981.
Об авторах
Алексей Алексеевич Буздин — канд. физ.-мат. наук, доц., Балтийский федеральный университет им. И. Канта, Калининград.
E-mail: [email protected]
Екатерина Алексеевна Васильева — канд. физ.-мат. наук, доц., Калининградский государственный технический университет.
E-mail: [email protected]
About the authors
Dr Aleksey Buzdin — Ass. Prof., I. Kant Baltic Federal University, Kaliningrad.
E-mail: [email protected]
Dr Ekaterina Vasilyeva — Ass. Prof., Kaliningrad State Technical University, Kaliningrad.
E-mail: [email protected]