ISSN 1992-6502 ( P ri nt)_
2014. Т. 18, № 4 (65). С. 206-215
Ъыьмт QjrAQnQj
ISSN 2225-2789 (Online) http://journal.ugatu.ac.ru
УДК 517.968:519.612::004.021
Параллельные алгоритмы
решения структурной обратной задачи магнитометрии на многопроцессорных вычислительных системах
1 1 3
е. н. Акимова , в. е. Мисилов , а. ф. Скурыдина
1 [email protected], 2 [email protected], [email protected]
Институт математики и механики им. Н. Н. Красовского УрО РАН (ИММ УрО РАН) Уральский федеральный университет им. Б. Н. Ельцина (УрФУ)
Поступила в редакцию 24 июня 2014 г.
Аннотация. Для решения трехмерной структурной обратной задачи магнитометрии о нахождении поверхностей раздела сред постоянной намагниченности предложены быстрый покомпонентный метод типа Ньютона для модели двухслойной среды и регуляризованные методы градиентного типа с переменными весовыми множителями для модели нижнего полупространства в форме многослойной среды. На основе методов типа Ньютона и методов градиентного типа решения задач магнитометрии для моделей двухслойной и трехслойной среды разработаны эффективные параллельные алгоритмы, численно реализованные на многоядерном процессоре Intel и графических процессорах NVIDIA. Проведена оптимизация параллельных алгоритмов. Для модельной задачи магнитометрии проведено сравнение параллельных итерационных алгоритмов по относительной погрешности, числу итераций и времени счета.
Ключевые слова: обратная задача магнитометрии; метод типа Ньютона; градиентные методы; параллельные алгоритмы; многоядерные и графические процессоры.
ВВЕДЕНИЕ
Важнейшими задачами исследования структуры земной коры являются обратные задачи грави-магнитометрии о восстановлении поверхностей раздела между средами [1, 2]. Задачи гравиметрии и магнитометрии описываются нелинейными интегральными уравнениями Фредгольма первого рода, т. е. являются существенно некорректными задачами. После дискретизации задачи сводятся к системам нелинейных уравнений большой размерности (до нескольких сотен тысяч). Одним из путей уменьшения времени расчетов и повышения
Статья рекомендована к публикации программным комитетом международной научной конференции «Параллельные вычислительные технологии 2014».
Работа выполнена при частичной поддержке УрО РАН по программе фундаментальных исследований Президиума РАН (проект 12-П-15-2019), по проекту РЦП-14-И11 и при частичной поддержке РФФИ (проект 12-01-00105-а).
эффективности решения геофизических задач является распараллеливание алгоритмов и использование многопроцессорных вычислительных систем (МВС). В Институте математики и механики УрО РАН (г. Екатеринбург) установлены суперкомпьютеры МВС-ИММ и «Уран», которые успешно используются при решении прикладных задач. Суперкомпьютер «Уран» включает в себя 48 вычислительных узлов, состоящих из Multi-Core CPU Intel Xeon (4, 6 и 8 ядер) и 8 GPU NVIDIA Tesla (448 и 512 ядер).
В данной работе для модели нижнего полупространства в форме двухслойной среды для решения трехмерной структурной обратной задачи магнитометрии о нахождении поверхности раздела между средами постоянной намагниченности предложен быстрый покомпонентный метод типа Ньютона. Для модели нижнего полупространства в форме многослойной среды для решения структурной задачи магнитометрии предложен подход, основанный на применении линеаризованных методов градиентного типа с переменными весовыми множителями,
позволяющим по суммарному полю находить из интегрального уравнения несколько структурных границ.
На основе методов типа Ньютона и методов градиентного типа решения задач магнитометрии для двухслойной и трехслойной среды разработаны эффективные параллельные алгоритмы, численно реализованные на многоядерном процессоре Intel и графических процессорах NVIDIA, входящих в состав суперкомпьютера «Уран». Проведена оптимизация параллельных алгоритмов. Параллельные алгоритмы встроены в разработанную систему удаленных вычислений «Специализированный веб-портал решения задач на многопроцессорных вычислительных системах». Для модельной задачи магнитометрии проведено сравнение параллельных итерационных алгоритмов по относительной погрешности, числу итераций и времени счета.
1. АЛГОРИТМЫ РЕШЕНИЯ СТРУКТУРНЫХ ОБРАТНЫХ ЗАДАЧ
МАГНОТОМЕТРИИ О НАХОЖДЕНИИ ПОВЕРХНОСТЕЙ РАЗДЕЛА СРЕД
1.1. Структурная задача магнитометрии о нахождении поверхности раздела для модели двухслойной среды
Рассматривается трехмерная структурная обратная задача магнитометрии о нахождении поверхности раздела между средами на основе данных о магнитном поле, измеренном на некоторой площади земной поверхности, и скачке вектора намагниченности. Предполагается, что модель нижнего полупространства состоит из двух слоев постоянной намагниченности J (l = 1,2), разделенных искомой поверхностью
S (рис. 1).
В предположении, что магнитная аномалия создана отклонением искомой поверхности Б от горизонтальной плоскости г = Н (ось 2 направлена вниз), в декартовой системе координат функция 2 = г(X, у), описывающая искомую поверхность раздела, удовлетворяет нелинейному двумерному интегральному уравнению Фредгольма первого рода
A(z) ,A/JJ
x', yr)
[(x - x')2 + ( y - y')2 + z2( X, У)
(1)
H
(x - x')2+( y - y')2+ H2
dx'dy' = Sz{ x', y',0),
где Д/ - скачок вертикальной компоненты вектора намагниченности на границе раздела сред, Дг (х, у) — аномальное магнитное поле, г = Н — асимптотическая плоскость для данной границы раздела, т. е.
lim
|x|,| y Н
< x, y) - H = 0.
Предварительная обработка магнитных данных, связанная с выделением аномального поля из общих магнитных данных, выполняется по методике, предложенной в работе [3].
Обратная задача магнитометрии является существенно некорректной задачей, решение которой обладает сильной чувствительностью к погрешности правой части, полученной в результате измерений и предварительной обработки геофизических данных.
После дискретизации уравнения (1) на сетке п = М х N, где задана правая часть Дг( х, у), и аппроксимации интегрального оператора по квадратурным формулам имеем систему нелинейных уравнений
А [ 2] = ^. (2)
1.2. Методы решения структурной задачи магнитометрии для двухслойной среды
Для решения структурной задачи магнитометрии (1) при решении системы нелинейных уравнений (2) можно использовать итеративно регуляризованный метод Ньютона (МН) [4]
Рис. 1. Модель двухслойной среды
z
X
-1 = 2?-[A'n (zk) + аI An(z*) + а(z* -H)-Fr
X
(3)
либо модифицированный метод Ньютона (ММН), когда производная в обращаемом операторе вычисляется в фиксированной точке
z0 = const [5]
z
X
-1 = 2 -[ An (20 ) + aI An (2) + а(2* -H)-Fr
X
(4)
Здесь Ап(zk) и 1п — конечномерные аппроксимации интегрального оператора и правой части в уравнении (1), А^ (zk ) — производная оператора А в точке zk , I — единичный оператор; а, а — положительные параметры регуляризации, к — номер итерации.
Нахождение очередного приближения zk+1 метода Ньютона (3) либо его модифицированного варианта (4) сводится к решению СЛАУ
л к к+1 т^ к ,
Ап Z = 1п , (5)
где Ак = А ( zk ) + а1 — плохо обусловленная несимметричная заполненная п х п матрица для метода (3) либо симметричная п х п матрица Ак - л' (т____„о
A; ( z0) + а I при z0 = const
для мето-
да (4). Вектор ¥к размерности п имеет вид
= Апк2 —(Ап (2) + а(zk — Н) — I).
Заметим, что в общем случае решения задачи методом Ньютона предварительно СЛАУ (5) приводится к виду с симметричной матрицей
= |Ак)тАк +а1 ]zk+1 = (Ак)тЦ -Ь, (6)
где (А^)' — транспонированная матрица, а —
параметр регуляризации.
Условием останова итерационных процессов (3) — (4) является выполнение условия ||А [z] -111 /1|11| <£ при достаточно малом е> 0.
На каждом шаге методов типа Ньютона для
нахождения очередного приближения zk+1 с помощью решения СЛАУ (5) либо (6) могут быть использованы итерационные методы градиентного типа: простой итерации, минималь-
ных невязок, минимальной ошибки, наискорейшего спуска или сопряженных градиентов в ре-гуляризованном варианте [6, 7].
В данной работе для решения структурных обратных задач грави-магнитометрии в двухслойной среде, кроме итерационных процессов типа Ньютона (3) и (4), предлагается быстрый покомпонентный метод типа Ньютона.
Для сетки п= М х N систему нелинейных уравнений (2) можно представить как совокупность нелинейных уравнений относительно неизвестных компонент
zml, т = 1.....М, I = 1,..., N.
Перенумеруем точки сетки по горизонтали и рассмотрим на сетке вектор z с компонентами zml, т1 = 1,..., М х N.
Запишем уравнения системы (2) для каждой точки zmг сетки п = М х N в виде
(А [= 1I, (7)
где — значение выделенного аномального магнитного поля в точке zmг,
(An ML=AJ X X
,=i j=i
H
(x„ - x,')2+(y, - y; )2 + z 2( x;, y)"
(x„ - x; )2+(y, - yj )2 + H2
Ax' Ay'
Для решения нелинейных уравнений системы (7) итерационный покомпонентный метод типа Ньютона (ПМН) имеет вид:
k+1 _ k _ ml ml /
[(An [zk ])m
!A[2mil (8)
где
;=i j=i
z( Xm, y,)
( xm - x; )2 +( у, - yj )2 + z2( xm, У, )
32
3z 2(Xm, У1)
52
(Xm - x'; )2 +(У1 - У] ) + z2(xm, У1) (сумма элементов строки матрицы производной
a< АУ
3
А [ 2 ]), у— положительный регулирующий
параметр, к - номер итерации.
В качестве начального приближения выбирается 2°т1 = Н . Условием останова итерационного процесса (8) является выполнение усло-
вия шах|
т1
|( А Ит—/щахИт,| при т.
1.3. Структурная задача магнитометрии о нахождении поверхностей раздела для модели многослойной среды и методы ее решения
Рассматривается трехмерная структурная обратная задача магнитометрии о нахождении поверхностей раздела сред на основе данных о магнитном поле, измеренном на некоторой площади земной поверхности, и скачкам векторов намагниченности. Предполагается, что нижнее полупространство состоит из нескольких слоев постоянной намагниченности / (I = 1,...,Ь), разделенных искомыми поверхностями Б, где Ь — число границ раздела
(рис. 2). Магнитный эффект от такого полупространства равен сумме магнитных эффектов от всех поверхностей раздела.
Рис. 2. Модель многослойной среды
Пусть поверхности раздела задаются уравнениями 2 = 2 (х, У), скачки вертикальных компонент векторов намагниченности на них равны Д/ , поверхности имеют горизонтальные
асимптотические плоскости 2; = Н{ , т. е. |2г(х У) — Н\ = т.
|х У 1
Функции 2 = 2 (х, У), описывающие искомые поверхности раздела, удовлетворяют нелинейному двумерному интегральному уравнению Фредгольма первого рода
/
ь щ щ
А(2) Ц
2( х \ У
Н
[(х — х' )2 + (у — у' )2 + Н] ]'
[( х — х )2 + (у — у' )2 + 2]( х, у)]'
йхйу = Д2( х, у' ,т),
(9)
где Д2 (х, у) — аномальное магнитное поле,
Ь
Д2( х, у) = ^ Д2; — суммарное поле.
г=1
После дискретизации уравнения (9) на сетке п = М х N, где задана правая часть Д2( х, у), и аппроксимации интегрального оператора А (¿) по квадратурным формулам имеем вектор правой части ^(х, у) размерности М х N, вектор
решения 2(х, у) = [2 (х, у),..., ^ (х, у)] размерности Ь х М х N, матрицу производной оператора А'(2к )Т размерности Ь х М2 х N2 и систему нелинейных уравнений
(10)
Задача является недоопределенной, т. к. по заданной функции Д2( х, у) мы пытаемся найти
несколько неизвестных функций 2; = 2г (х, у),
что влечет неединственность решения.
Для решения задачи магнитометрии для модели многослойной среды при решении системы нелинейных уравнений (10) предлагается использовать линеаризованные итерационные методы градиентного типа с весовыми множителями у , вычисляемыми для каждой компоненты 2 (I = 1, . ., Ь хМ х N (см. [8, 9] для решения задачи гравиметрии):
• линеаризованный метод наискорейшего спуска (ЛМНС)
к+1 к 2. = 2. — У
I I 1 I
Б ( )
А (2к(2к) Б (2к) = А ' (2к )Т (А( 2к) — ^);
$ ( 2^ ),
2
• линеаризованным метод минимальном ошибки (ЛММО)
2
k+1 k zi = z, ~Yi
A(z ) - F
S (zk ), (12)
S (zk)
где ^ — г - компонента результирующего вектора z(x, у); к — номер итерации.
Переменные весовые множители у для каждой компоненты ^ (г = 1,...,ЬхМхN) выбираются специальным образом путем нормировки аномальных магнитных полей (соответствующих искомым поверхностям раздела (I = 1,. ., Ь)), выделенных из общего магнитного поля Az(X, у) для каждой границы раздела по методике [3].
Весовые множители у будем выбирать следующим образом:
I = [ I 12,...1 ] =
_ (/1, У2,..., Ум хN,..., УЬхМ хN ) ^
^ (У1, У2,..., УЬхМхN), 1/1'
у =а '1 , уе[0,а], Р> 1, 0<а< 1,
max
UI'
(13)
где I (I = 1,...,Ь) — аномальные поля от магнитных масс, находящихся между соответствующими глубинами Н и Н для искомых
поверхностей раздела (I = 1,..., Ь) ,
(I = 1,...,Ь), а — параметр регуляризации.
В качестве начального приближения используются горизонтальные асимптотические плоскости z/CI = Н (I = 1,...,Ь) . Условием останова итерационных процессов (11) — (12) является выполнение условия ||А^) —1|| /|| 1|| <£
Ь
при достаточно малом £ , где I = ^ I.
I=1
Заметим, что линеаризованные методы градиентного типа с постоянным множителем у можно использовать при решении задачи магнитометрии для модели двухслойной среды.
2. РАСПАРАЛЛЕЛИВАНИЕ И ЧИСЛЕННАЯ РЕАЛИЗАЦИЯ ИТЕРАЦИОННЫХ МЕТОДОВ РЕШЕНИЯ ОБРАТНЫХ ЗАДАЧ
Параллельные алгоритмы решения структурной обратной задачи магнитометрии о восстановлении поверхностей раздела для модели двухслойной на основе итеративно регуляризо-ванного метода Ньютона, модифицированного метода Ньютона и покомпонентного метода типа Ньютона, а также параллельные алгоритмы решения структурной обратной задачи магнитометрии для моделей трехслойной и четырех-слойной среды на основе линеаризованных методов градиентного типа численно реализованы на многоядерном процессоре Intel и графических процессорах NVIDIA, входящими в состав суперкомпьютера «Уран» (ИММ УрО РАН). Параллельные алгоритмы реализованы на многоядерном процессоре Intel с помощью технологии OpenMP и библиотеки Intel MKL, на GPU NVIDIA Tesla — c помощью технологии CUDA и библиотеки CUBLAS.
При реализации на многоядерном процессоре распараллеливание итерационных методов градиентного типа и методов типа Ньютона основано на разбиении матрицы A СЛАУ горизонтальными полосами на m блоков, а вектора решения z и вектора правой части b СЛАУ на m частей так, что n = m х L, где n — размерность системы уравнений, m—число процессоров, L — число строк матрицы в блоке. На текущей итерации каждый из m процессоров вычисляет свою часть вектора решения. В случае умножения матрицы A на вектор z каждый из m процессоров умножает свою часть строк матрицы A на вектор z . В случае матричного умножения AT A каждый из m процессоров умножает свою часть строк транспонированной матрицы AT на всю матрицу A. Host-процессор (ведущий) отвечает за пересылки данных и также вычисляет свою часть вектора решения.
С целью оптимизации выполнения вектор-но-матричных операций проведено распараллеливание и векторизация циклов с помощью технологии OpenMP и средств компилятора Intel .
При реализации на графических процессорах NVIDIA линеаризованных итерационных методов наискорейшего спуска и минимальной ошибки проведена оптимизация работы с памятью. Наилучшим по быстродействию оказывается метод вычисления элементов матрицы A'
2
«на лету», т. е. вычисление значения элемента матрицы происходит в момент обращения к этому элементу без сохранения его в память видеокарты.
Алгоритмы решения структурных обратных задач магнитометрии о восстановлении поверхностей раздела сред встроены в разработанную систему удаленных вычислений «Специализированный веб-портал решения задач на многопроцессорных вычислителях» [10], установленный в Отделе некорректных задач анализа и приложений Института математики и механики УрО РАН. В настоящее время на веб-портале предусмотрен запуск программ для решения задач грави-магнитометрии на суперкомпьютере «Уран» с указанием числа процессорных узлов или ядер (МВС, NVIDIA Tesla, Multi-Core CPU), вида задачи и метода решения задачи.
3. РЕЗУЛЬТАТЫ ЧИСЛЕННЫХ ЭКСПЕРИМЕНТОВ
Результаты численных расчетов решения структурной задачи гравиметрии с модельными данными для трехслойной среды на многопроцессорных системах приводятся в работе [8]. Здесь мы рассмотрим решение структурной задачи магнитометрии для трехслойной среды, разделенной двумя искомыми поверхностями S и S с модельными данными на площади S, имеющей размеры 90 х100 км2.
Суммарное магнитное поле Az на площади S находилось путем решения прямой задачи магнитометрии с известными точными решениями (рис. 3):
z(х, у) = 5+4e—(*/10-3-5)6-(y/1°-2-5)6 -
—3e
-( х/10—5.5)6 — (y/10—4.5)6.
z2 (х, y) = 15 + 7e
-(х/20—1.5)2—(y/20—1.5)2 х/20—3)2 —(y/20—2)2
Расстояния до асимптотических плоскостей принимались равными Н = 5 км и Н2 = 15 км. Скачки вертикальных компонент векторов намагниченности принимались равными А/ = А/2 = 0.4 А/м. Шаги сетки составили Ах = Ау = 1.0 км.
После дискретизации уравнения (9) на сетке имеем вектор правой части ^(х, у) размерности 9000, результирующий вектор решения 2(х, у) = [ ^ (х, у), ^ (х, у)] размерности 18000,
матрицу производной оператора Л'()т размерности 18000 х 9000 и систему нелинейных уравнений вида (10).
На рис. 3 изображены модельные поверхности «квадратные горка и впадина» и «горка и впадина». На рис. 4 приводится суммарное магнитное поле Аz от модельных поверхностей без шума и с равномерным шумом с амплитудой 15 %.
Задача решалась двумя способами: 1) восстановление обеих поверхностей по суммарному полю линеаризованными методами наискорейшего спуска (11) и минимальной ошибки (12) с переменными весовыми множителями у ;
2) восстановление каждой поверхности по отдельности по соответствующему полю, выделенному по методике [3], линеаризованными методами наискорейшего спуска и минимальной ошибки с постоянным множителем у либо методами типа Ньютона (3), (4), (8), описанными в п. 2.2. На каждом шаге МН и ММН используется метод минимальных невязок.
На рис. 5 и 6 приводятся приближенные решения структурной задачи магнитометрии для трехслойной среды для модели без шума. На рис. 5 изображены поверхности раздела, восстановленные по суммарному полю методом ЛММО с весовыми множителями, на рис. 6 -поверхности раздела, восстановленные по выделенным полям.
Рис. 3. Точные решения z (х, у) и z2 (х, у) для трехслойной среды
Рис. 4. Суммарное магнитное поле без шума и с шумом
Рис. 5. Приближенные решения 2Х ( у) и г2 ( \*, у) , восстановленные по суммарному полю (без шума)
-2 -з
-4
-5 |--6 1--7 --8
Рис. 6. Приближенные решения г1 ( _)' ) и г2 ( \*, _)'), восстановленные по выделенным полям (без шума)
Рис. 7. Приближенные решения 2Х ( _)') и г2 ( \*, у) , восстановленные по суммарному полю (с шумом)
Рис. 8. Приближенные решения z1 ( у) и z2 ( \*, у) , восстановленные по вьщеленным полям (с шумом)
Таблица 1
Относительные погрешности и времена решения модельной задачи без шума
Задача без шума 4 N+N Ti T T
1 способ ЛММО 0.03 0.06 70 150 сек 30 сек 9 сек
1 способ ЛМНС 0.03 0.06 60 152 сек 32 сек 10 сек
2 способ ЛММО 0.056 0.056 50+60 155 сек 50 сек 12 сек
2 способ ЛМНС 0.056 0.056 70+60 165 сек 60 сек 14 сек
2 способ МН 0.062 0.067 7+5 26 мин. 4.7 мин. 60 сек
2 способ ММН 0.049 0.053 3+5 12 сек 3 сек 0.4 сек
2 способ ПМН 0.045 0.056 4+3 7 сек 1.8 сек 0.2 сек
Таблица 2
Относительные погрешности и времена решения модельной задачи с шумом
Задача с шумом 42 N+n2 T: T T
1 способ ЛММО 0.04 0.06 70 150 сек 30 сек 9 сек
1 способ ЛМНС 0.04 0.06 58 150 сек 33 сек 11 сек
2 способ ЛММО 0.05 0.06 60+60 160 сек 52 сек 12 сек
2 способ ЛМНС 0.05 0.06 70+60 165 сек 58 сек 13 сек
2 способ МН 0.069 0.075 5+4 19.5 мин 4.8 мин 45 сек
2 способ ММН 0.055 0.061 6+5 15 сек 3.5 сек 0.6 сек
2 способ ПМН 0.045 0.058 4+3 7 сек 1.8 сек 0.2 сек
На рис. 7 и 8 приводятся приближенные решения структурной задачи магнитометрии для трехслойной среды для модели с шумом с амплитудой 15%. На рис. 7 изображены поверхности раздела, восстановленные по суммарному полю методом ЛММО с весовыми множителями, на рис. 8 - поверхности раздела, восстановленные по выделенным полям.
Задача решалась на вычислительных узлах суперкомпьютера «Уран»: на многоядерном процессоре Intel Xeon с применением технологии OpenMP и библиотеки Intel MKL (умножение матриц для МН по формуле (6)) и на графических процессорах NVIDIA Tesla с помощью технологии CUDA. Для Intel Xeon проведена оптимизация выполнения векторно-матричных операций опциями компилятора и векторизация
циклов с помощью директивы #pragma 8т<1 В результате время решения задачи уменьшилось в несколько раз.
Для модельной задачи магнитометрии проведено сравнение параллельных итерационных алгоритмов по относительной погрешности, числу итераций и времени счета.
В табл. 1 и 2 представлены результаты решения задачи магнитометрии в трехслойной среде для модельных поверхностей «квадратные горка и впадина» и «горка и впадина» без шума и с равномерным шумом 15 %. В 1-м столбце табл. 1 и 2 приводится метод решения задачи. При решении задачи первым способом по суммарному полю методами ЛММО и ЛМНС весовые множители у выбирались из предвари-
тельно выделенных полей по формуле (13) с параметрами ß = 1.3, а = 0.4 . При решении задачи вторым способом для восстановления каждой поверхности раздела по соответствующему выделенному полю выбирались следующие параметры: для методов ЛММО и ЛМНС у = 0.1, для метода Ньютона и модифицированного метода Ньютона а = 10—3, для покомпонентного метода типа Ньютона у = 1.6 .
Во 2- и 3-м столбцах табл. 1 и 2 приводятся наименьшие относительные погрешности восстановленных поверхностей
ь =1К -zi7IIzTll,
где Ь - погрешность для H = 5 км, ö2— погрешность для H = 15 км, в 4 столбце таблиц -общее число итераций восстановления двух поверхностей N = N + N, в остальных столбцах
приводятся времена решения задачи. T - время решения на одном ядре процессора Intel Xeon, T — время решения на 6 ядрах Intel Xeon, T3 -время решения на GPU NVIDIA Tesla.
Численные эксперименты, выполненные для модельной задачи магнитометрии, показали, что для методов градиентного типа способ восстановления поверхностей раздела по суммарному полю по сравнению со способом восстановления каждой поверхности по выделенным полям уменьшает относительную погрешность решения и число итераций. Дополнительные погрешности, возникающие при реализации методики разделения полей [3], распределяются здесь более равномерно по обеим границам и оказывают меньшее влияние. Кроме того, данный способ более устойчив к шуму (см. рис. 7 и 8).
Заметим, что методы типа Ньютона нельзя использовать для восстановления поверхностей раздела по суммарному полю в связи с несовпадением размерностей вектора правой части и расширенного вектора решения системы нелинейных уравнений (10).
Для способа восстановления поверхностей раздела по выделенным полям модифицированный метод Ньютона и покомпонентный метод типа Ньютона являются наиболее экономичными. Метод Ньютона имеет самую высокую вычислительную сложность в связи с тем, что на каждой итерации метода приходить пересчитывать матрицу СЛАУ и предварительно переходить к системе с симметричной матрицей (6). Время решения задачи методом Ньютона на од-
ном ядре составило 26 минут, градиентными методами - 2,5 минуты, методами ММН и ПМН - менее 15 сек. Однако линеаризованные методы градиентного типа и метод Ньютона является более устойчивыми к шуму по сравнению с ММН и ПМН.
Распараллеливание алгоритмов при решении обратных задач магнитометрии на многоядерном процессоре Intel Xeon с оптимизацией и GPU NVIDIA Tesla уменьшает время счета. Решение задачи на 6 ядрах Intel Xeon градиентными методами составляет менее 1 мин., методами ММН и ПМН - менее 7 сек. Решение задачи на GPU методом Ньютона занимает минуту, градиентными методами - 10 сек, а решение задачи ММН и ПМН составляет доли секунды.
ЗАКЛЮЧЕНИЕ
Для решения трехмерной структурной обратной задачи магнитометрии о нахождении поверхностей раздела для модели двухслойной среды предложен быстрый покомпонентный метод типа Ньютона. Для решения структурной задачи магнитометрии для модели многослойной среды предложен подход, основанный на применении регуляризованных методов градиентного типа с переменными весовыми множителями, позволяющий по суммарному полю находить из интегрального уравнения несколько структурных границ. На основе методов типа Ньютона и методов градиентного типа решения задач магнитометрии для моделей двухслойной и трехслойной среды разработаны эффективные параллельные алгоритмы, численно реализованные на многоядерном процессоре Intel и графических процессорах NVIDIA, входящих в состав суперкомпьютера «Уран». Проведена оптимизация параллельных алгоритмов. Параллельные алгоритмы встроены в разработанную систему удаленных вычислений «Специализированный веб-портал решения задач на многопроцессорных вычислительных системах». Для модельной задачи магнитометрии проведено сравнение параллельных итерационных алгоритмов по относительной погрешности, числу итераций и времени счета. Распараллеливание алгоритмов при решении обратных задач магнитометрии на многоядерном процессоре Intel Xeon с оптимизацией и графических процессорах NVIDIA Tesla уменьшает время счета.
Авторы выражают благодарность члену-корреспонденту РАН В. В. Васину за полезные обсуждения и внимание к работе.
СПИСОК ЛИТЕРАТУРЫ
1. Малкин Н. Р. О решении обратной магнитометрической задачи для случая одной контактной поверхности (случай пластообразно залегающих масс) // ДАН СССР. Сер. А. 1931. № 9. С. 232-235. [ N. R. Malkin, "On the solution of the inverse magnetic problem for the case of one contact surface (layered distribution of masses)," (in Russian), Dokl. Akad. NaukSSSR, no.9, pp. 232-235, 1931. ]
2. Мартышко П. С., Ладовский И. В., Цидаев А. Г. Построение региональных геофизических моделей на основе комплексной интерпретации гравитационных и сейсмических данных // Физика земли. 2010. T. 46. № 11. С. 23-35. [ P. S. Martyshko, I. V. Ladovskii, and A. G. Tsidaev, "Construction of regional geophysical models based on the joint interpretation of gravitaty and seismic data," Izvestiya, Physics of the Solid Earth, vol. 46, no. 11, pp. 931-942, 2010. ]
3. Мартышко П. С., Пруткин И. Л. Технология разделения источников гравитационного поля по глубине // Геофизический журнал. 2003. Т. 25. № 3. С. 159-168. [ P. S. Martyshko and I. L. Prutkin, "Technology of separation of gravitational field sources in depth," (in Russian), Geofiz. Zh., vol. 25, no. 3, pp. 159-168, 2003. ]
4. Bakushinsky A., Goncharsky A. Ill-Posed Problems: Theory and Applications. London: Kluwer Akad. Publ., 1994. [ A. Bakushinsky and A. Goncharsky. Ill-Posed Problems: Theory and Applications. London: Kluwer Akad. Publ. 1994. ]
5. Васин В. В. Модифицированные процессы ньютоновского типа, порождающие фейеровские аппроксимации регуляризованных решений нелинейных уравнений // Тр. Ин-та математики и механики УрО РАН. 2013. T. 19. № 2. С. 85-97. [ V. V. Vasin, "Modified processes of Newton type generating Fejer approximations of regularized solutions to nonlinear equations," Trudy Inst. Math. Mekh. UrO RAN, vol. 19, no. 2, pp. 85-97, 2013. ]
6. Васин В. В., Еремин И. И. Операторы и итерационные процессы фейеровского типа. Теория и приложения. Екатеринбург: УрО РАН. 2005. [ V. V. Vasin and I. I. Eremin, Operators and Iterative Processes of Fejer Type. Theory and Applications. Berlin-NewYork: Walter de Gruyter, 2009. ]
7. Бахвалов Н. С., Жидков Н. П., Кобельков Г. М. Численные методы. 8-е изд. М.: Лаборатория Базовых Знаний. 2003. [ N. S. Bakhvalov, N. P. Zhidkov, G. M. Kobel'kov, Computational Methods, 1987. ]
8. Акимова Е. Н., Васин В. В., Мисилов В. Е. Алгоритмы решения обратных задач гравиметрии о нахождении поверхностей раздела сред на многопроцессорных вычислительных системах // Вестник УГАТУ. 2014. T. 18. № 2 (63). С. 208-217. [ E. N. Akimova, V. V. Vasin, V. E. Misilov, "Algorithms for solving inverse gravimetry problems of finding the interface between media on multiprocessing computer systems", (in Russian), Vestnik UGATU, vol. 18, no. 2 (63), pp. 208-217, 2013. ]
9. Акимова Е. Н., Мартышко П. С., Мисилов В. Е. Алгоритмы решения структурной задачи гравиметрии в многослойной среде // ДАН. 2013. Т. 453. № 6. С. 676-679. [ E. N. Akimova, P. S. Martyshko, V. E. Misilov, "algorithms for solving the structural gravity problem in a multilayer medium", DAN, Vol. 453, No. 2, pp. 1278-1281, 2013. ]
10. Акимова Е. Н., Белоусов Д. В., Мисилов В. Е. Алгоритмы решения обратных геофизических задач на многопроцессорных вычислительных системах // Сибирский журнал вычислительной математики. 2013. Т. 6. № 2. С. 107-121. [ E. N. Akimova, D. V. Belousov, and V. E. Misilov, "Algorithms for solving inverse geophysical problems on parallel computing systems," Numerical Analysis and Applications, vol. 6, no. 2, pp. 98-110, 2013. ]
ОБ АВТОРАХ
АКИМОВА Елена Николаевна, вед. науч. сотр. отд. некорректных задач анализа и приложений, проф. каф. выч. методов и уравнений мат. физики. Дипл. математик (Уральск. гос. ун-т, 1982). Д-р физ.-мат. наук (ЮУрГУ, 2009). Иссл. в обл. паралл. алгоритмов решения прикл. задач.
МИСИЛОВ Владимир Евгеньевич, вед. программист отд. некорректных задач анализа и приложений, асп. Дипл. мат.-программист (УрФУ, 2010). М-р по прикл. мат. и ин-форм. (там же, 2012). Иссл. в обл. паралл. вычислений на многопроц. системах.
СКУРЫДИНА Алия Фиргатовна, вед. математик отд. некорректных задач анализа и приложений, асп. Дипл. мат.-программист (УрФУ, 2012). Иссл. в обл. паралл. вычислений на многопроц. системах.
METADATA
Title: Parallel algorithms for solving a structural inverse magnetic problem on multiprocessing computer systems Authors: E. N. Akimova, V. E. Misilov, A. F. Skurydina Affiliation: Institute of mathematics and mechanics of Ural Branch RAS (IMM of UrB RAS); Ural Federal University (UrFU), Ekaterinburg, Russia. Email: aen15yandex.ru, [email protected],
[email protected] Language: Russian.
Source: Vestnik UGATU (scientific journal of Ufa State Aviation Technical University), vol. 18, no. 4 (65), pp. 206-215, 2014. ISSN 2225-2789 (Online), ISSN 1992-6502 (Print). Abstract:
For solving a three-dimensional structural inverse magnetic problem of finding interfaces between different magnetization media, fast component wise Newton type method for a two-layered medium and regularized gradient type methods with variable weight factors for a multilayered medium are proposed. On the base of the Newton type and gradient type methods, effective parallel algorithms for two- and three-layered medium models were numerically implemented on Intel multicore CPU and NVIDIA GPU. The optimization of the parallel algorithms was carried out. For a model magnetic problem comparison of the parallel algorithms by relative errors, numbers of iterations and computation times was carried out. Key words: inverse magnetic problem; Newton type method; iterative methods; parallel algorithms; multicore and graphic processors.
About authors:
AKIMOVA, Elena Nikolaevna, Leading research scientist, Institute of Mathematics and Mechanics of UrB RAS, Prof., Dept. Num. Meth. and Eq. of Math. Phys., IRIT of Ural Federal University. Dr. of Phys. and Math. Sciences (Chelyabinsk, SUSU, 2009).
MISILOV, Vladimir Evgenievich, Leading programmer, (PhD) Student, Institute Mathematics and Mechanics of UrB RAS. Dipl. Math. Support of Inf. System (Ekaterinburg, UrFU, 2010). Master of Appl. Math. and Inform. (UrFU, 2012).
SKURYDINA, Aliya Firgatovna, Leading mathematician, Institute of Mathematics and Mechanics of UrB RAS, (PhD) Student, Ural Federal University. Dipl. Analytical software and administration of information systems (Ekaterinburg, UrFU, 2012).