УДК 681.3.013.2: 62-192
О. В. Абрамов
ПАРАЛЛЕЛЬНЫЕ АЛГОРИТМЫ РАСЧЕТА И ОБЕСПЕЧЕНИЯ ПАРАМЕТРИЧЕСКОЙ НАДЕЖНОСТИ*
Аннотация. Рассмотрена проблема проектирования аналоговых технических устройств и систем с учетом требований параметрической надежности при различных уровнях исходной информации о параметрических возмущениях. Обсуждены параллельные алгоритмы решения возникающих при этом задач многовариантного анализа и оптимизации.
Ключевые слова: надежность, параллельный алгоритм, случайные изменения параметров, метод Монте-Карло, оптимизация.
Abstract. The problem of designing of analogue technical devices and systems taking into account requirements of parametrical reliability is considered at various levels of the initial information on parametrical indignations. Parallel algorithms of the decision of problems of the multiple analysis arising thus and optimisation are discussed.
Keywords: reliability, parallel algorithm, random parameters variations, Monte Carlo method, optimization.
Введение
Основные трудности, возникающие при проектировании технических систем и устройств с учетом отклонений их параметров от расчетных значений и требований надежности, связаны с необходимостью решения целого ряда сложных и трудоемких задач. К их числу относится и задача оптимального выбора номинальных значений параметров проектируемых систем (параметрического синтеза) по критериям надежности, основные проблемы решения которой обусловлены вероятностным характером критерия оптимальности и дефицитом информации о случайных закономерностях процессов изменения параметров проектируемых схем.
В последние годы стал активно развиваться достаточно радикальный путь сокращения трудоемкости решения сложных вычислительных задач, в основе которого лежит идея распараллеливания процессов поиска конечного результата. Развитие сетевых технологий, соответствующего программного обеспечения, удешевление элементной базы делает вычислительные комплексы массивно-параллельного и кластерного типа доступными все большему числу пользователей.
1 Параметрический синтез технических систем по критерию надежности
Параметрическая надежность (надежность по постепенным отказам) характеризует способность системы (устройства) сохранять уровень рабочего параметра Y(t) (в общем случае векторного) в допустимых пределах (A, B) в течение требуемого времени T при заданных режимах и условиях работы. Критерием постепенного (параметрического) отказа в данном случае будет нарушение условия работоспособности
A < Y(t) < B,
* Работа выполнена при поддержке грантов ДВО РАН 06-Ш-А-03-070 и 06-!-ЭММПУ-054 Программы № 15 отделения ЭММПУ РАН.
а количественной мерой надежности - вероятность выполнения этого условия в течение времени Т, т.е.
Р(Т) = P{ А < У(г) < В V / е [0, Т]}. (1)
Выходные (рабочие) параметры У(0 связаны некоторым известным оператором с параметрами элементов системы У(0 = F(X(t)). Информация об изменениях параметров доступна обычно на уровне параметров элементов (внутренних параметров), а сам процесс проектирования, связанный с обеспечением необходимой (или оптимальной) параметрической надежности, реализуется путем выбора номинальных значений внутренних параметров хном.
Задача параметрического синтеза по критерию надежности [1] состоит в выборе номинальных значений внутренних параметров исследуемого устройства хном = (х! ном, ..., хп ном), обеспечивающих максимум вероятности его безотказной работы в течение заданного времени:
Хном = аг§ тах Р{X(хНом, t) е Бх, VI е [0, Т]}, (2)
где X(хном, t) - случайный процесс изменения внутренних параметров; Бх -область работоспособности; Т - заданное время эксплуатации устройства.
Область работоспособности Бх, как правило, неизвестна, поэтому условия работоспособности обычно задаются следующей системой неравенств:
а] < У у (х) < Ьу, у = 1,т, (3)
где у = {у у т=1 - вектор выходных параметров устройства, причем
у у = ¥у (Х1,..., хп), а ¥у (•) - известный оператор, зависящий от топологии
исследуемого устройства.
В качестве количественного показателя надежности принимается вероятность
Р(¥(0 е Бу , Vtе [0,Т]) = Р(у(X(t)) е Бу , Vt е [0,Т]) =
т
= Р( п Уу (X^))е [ау,Ьу ], Vtе [0,Т]). у=1
При t = 0 данное выражение можно использовать для оценки серийно-пригодности (выхода годных).
Каждый шаг оптимизации требует проведения статистического анализа для получения оценки критерия оптимальности. При этом на основе метода статистических испытаний (Монте-Карло) многократно рассчитывается исследуемая система (устройство) для различных реализаций случайных значений параметров элементов. Если условия работоспособности выполняются, то реализация относится к числу «хороших». Оценкой вероятности выполнения условий работоспособности (серийнопригодности, параметрической надежности) служит отношение числа «хороших» реализаций к общему числу реализаций случайных значений параметров элементов. Число расчетов N, равное числу реализаций случайного вектора параметров, определяется из условия обеспечения необходимой точности оценки критерия [2]. Обычно
для этого на каждом шаге поиска проводится полный расчет системы от нескольких сотен до тысячи раз. Заметим, что в процессе статистических испытаний и на каждом шаге поиска экстремума приходится проверять выполнение условий работоспособности (3).
2 Расчет параметрической надежности методом критических сечений
Для расчета целевой функции (вероятности безотказной работы) будем использовать метод критических сечений [3], который основан на возможности представления случайного процесса У(0 конечным числом случайных величин У, получаемых во временных Усечениях исследуемого процесса. Использование данного метода позволяет отнести реализацию системы к «хорошим» или «плохим» для заданного времени эксплуатации.
Будем считать характер случайного процесса У(^ таким, что для нахождения любой его реализации в области допустимых значений в течение заданного времени необходимо и достаточно, чтобы эта реализация принадлежала области допустимых значений в ограниченном (и небольшом) числе Усечений процесса У(0, которые назовем критическими. Изучение закономерностей необратимых изменений параметров элементов систем и устройств (резисторов, конденсаторов, транзисторов), а также различных видов аппаратуры (например, измерительных устройств, усилительных блоков и др.) показывает, что для большинства из них принятое предположение является справедливым, причем число критических сечений не превышает трех.
Если реализация процесса обладает вышеописанным свойством, то
Р(Т) = Р{[а < У(^)< Ь п а < У(Ь)< Ь п ... п а < У(К) < Ь]},
где а, Ь - заданные границы допуска; ^0, t\, ..., ^ - точки локальных экстремумов реализации на интервале [0, Т] (критические сечения,), ^ = 0, ^ = Т.
Для монотонных случайных процессов изменения выходных параметров системы У(1) вероятность невыхода У(^ за пределы [а; Ь] в течение заданного времени определится следующим образом:
Р(Т) = Р{[а < У(0) < Ь п а< У(Т) < Ь]}.
Аналогично получаются соотношения для оценки параметрической надежности и при аппроксимации случайных процессов более сложного вида.
Таким образом, вначале рассчитываются выходные параметры устройства для реализации случайной величины X0(xном) и проверяются условия (3). Если эти условия выполняются, то моделируется реализация случайного процесса X(Xo(xНoM, и)) изменения параметров элементов для следующего временного сечения, вычисляются выходные параметры, проверяются условия работоспособности и т.д. в зависимости от числа критических сечений. Как было показано выше, для того чтобы отнести реализацию к числу «хороших», необходимо, чтобы она удовлетворяла условиям (3) во всех критических временных сечениях.
Оценкой параметрической надежности (серийнопригодности) служит отношение числа «хороших» реализаций к общему числу N реализаций случайного процесса изменения параметров элементов, которое определяется из условия обеспечения необходимой точности оценки надежности [2].
3 Выбор номиналов параметров в условиях дефицита информации
Часто необходимая априорная информация о вероятностных свойствах случайных процессов изменения параметров отсутствует или является недостаточно полной. Могут быть известны лишь числовые характеристики (моменты распределений) отклонений параметров (математические ожидания и дисперсии), отсутствовать данные об эксплуатационных (временных) изменениях параметров или полностью какая-либо информация о закономерностях параметрических возмущений. В последнем случае в качестве критерия оптимальности принимаемых решений будем использовать «запас работоспособности» [4].
Запас работоспособности можно рассматривать на уровне внутренних параметров (параметров элементов) или выходных параметров системы.
Запас работоспособности первого типа (на уровне внутренних параметров) позволяет оценить степень удаленности вектора внутренних параметров от границ области работоспособности, а следовательно, пределы возможных вариаций параметров элементов, при которых не нарушаются условия работоспособности. Задача оптимального параметрического синтеза в этом случае сводится к нахождению таких точек внутри области работоспособности Бх (выбору таких номиналов параметров), которые находятся на максимальном в смысле выбранного критерия расстоянии от ее границ.
Если область работоспособности Бх неизвестна, то выполнение условий работоспособности при выбранных внутренних параметрах проверяется в результате вычисления соответствующих выходных параметров и сравнения их с требованиями технического задания (областью допустимых значений выходных параметров Бу).
Можно говорить о запасе работоспособности второго типа, представляющем собой меру удаленности вектора выходных параметров у = (у1(х), у2(х),..., ут(х)) от заданных требованиями технического задания границ области Бу.
Поскольку задача параметрического синтеза состоит в выборе номинальных значений внутренних параметров, будем называть выбор значений параметров по критерию запаса работоспособности первого типа прямой задачей, а выбор по критерию запаса работоспособности второго типа - обратной.
При решении прямой задачи оптимального выбора номиналов параметров по критерию запаса работоспособности необходимо иметь информацию о конфигурации и параметрах области работоспособности Бх .
Если известно, что область Бх выпуклая, задача сводится к нахождению ее центра тяжести. Можно показать, что полученное решение обеспечивает также максимум вероятности нахождения параметров в области допустимых значений в фиксированный момент времени, если плотность распределения параметров симметрична относительно математического ожидания (номинальной точки).
Во многих случаях прямая задача сводится к так называемой задаче центрирования расчетной области, которая состоит в том, что требуется вписать в область Бх замкнутое компактное множество (п-мерный параллелепипед, эллипсоид, шар), центр которого принимают за искомое решение.
При произвольной конфигурации области работоспособности необходимо решать минимаксную (максиминную) задачу: найти такую номиналь-
ную точку хном = (х1 ном, ., хп ном), для которой достигает максимума минимальный запас работоспособности (расстояние от этой точки до границ области Бх ).
Любая комбинация внутренних параметров х = (Х1, Х2,..., хп) однозначно определяет некоторую совокупность выходных величин у = (У1( Х),
У2(х), ..., ут(х)) и, таким образом, некоторую точку у е Ят в т-мерном пространстве выходных параметров. При этом обратное отображение не всегда является однозначным: одному и тому же набору значений выходных параметров могут соответствовать несколько различных векторов внутренних параметров.
Будем говорить, что совокупность внутренних параметров представляет допустимое решение (удовлетворяющее условиям работоспособности), если соответствующий им вектор выходных параметров лежит в т-мерном полиэдре Бу, задаваемом выходными ограничениями (3).
Рассмотрим более подробно задачу выбора оптимальных значений номиналов параметров по критерию запаса работоспособности на уровне выходных параметров.
Пусть условия работоспособности исследуемой системы заданы интервалом допустимых значений выходного параметра у(х) :
Утш < У (Х)< Утах. (4)
При отсутствии какой-либо информации о закономерностях отклонений выходного параметра от номинального значения оптимальным будет такое значение у, при котором обеспечивается максимальный запас работоспо-
собности. Очевидно, что в рассматриваемом случае, это будет
ун = Утах+ Ут»п , (5)
при котором запас работоспособности равен половине интервала допустимых значений.
Для нахождения номинальных значений внутренних параметров необходимо решить следующую оптимизационную задачу:
хн = arg тт
Х
ун - у(Х)
(6)
или
хн = а^ппп (ун - у (х )) , (7)
где Ь - положительное целое четное число.
Можно показать, что номинальное значение параметра, соответствующее середине поля допуска (5), будет оптимальным и в случае любого симметричного закона распределения вероятностей рассматриваемого параметра (например, нормального или равномерного). Оно гарантирует не только максимальный запас работоспособности, но и максимальную вероятность нахождения параметра у(х) в пределах поля допуска [утп, утах ].
4 Параллельные алгоритмы анализа и оптимизации надежности
Как отмечалось выше, расчет параметрической надежности базируется на использовании метода Монте-Карло, который представляет собой многократное повторение типовой процедуры с различными данными. Этот метод обладает потенциальным параллелизмом, при этом единицей распараллеливания выступает однократный расчет выходных параметров и проверка выполнения условий работоспособности.
При организации параллельных вычислений методом Монте-Карло возможны два подхода - централизованный и распределенный. Структура типовой параллельной процедуры метода, количество межпроцессорных пересылок, эффективность и применимость данных подходов зависят от организации получения псевдослучайных чисел для проведения моделирования системы.
В случае вычисления оценки параметрической надежности методом Монте-Карло при использовании метода критических сечений типовая процедура может иметь различную вычислительную емкость для разных реализаций случайного вектора параметров. Это обусловлено следующим. Если для первого временного сечения условия работоспособности не выполняются, то нет необходимости формировать реализацию случайного процесса для последующих временных сечений, т.к. реализация не относится к числу «хороших». Такая структура типовой процедуры метода обусловливает раз-балансировку параллельного вычислительного процесса при использовании централизованного подхода.
Распределенный параллельный метод статистического оценивания предпочтительнее, т.к. он позволяет получить ускорение, близкое к линейному, поддерживать масштабируемость вычислительного алгоритма, обеспечивает равномерность вычислительной нагрузки всех компонентов комплекса вне зависимости от временных характеристик типовых процессов. Является обоснованным использование библиотеки параллельных псевдослучайных чисел для параллельных вычислителей с распределенной памятью.
Универсальным и достаточно эффективным средством решения оптимизационных задач по критерию надежности (2) или запаса работоспособности (6), (7) может стать применение параллельного аналога метода сканирования (слепого поиска).
Сущность метода заключается в том, что вся допустимая область пространства параметров разбивается на элементарные ячейки, в каждой из которых по определенному алгоритму выбирается точка: в центре ячейки, на ребрах или вершинах. В каждой ячейке осуществляется последовательный просмотр значений целевой функции и нахождение среди них экстремального значения. Точность метода, естественно, определяется тем, насколько плотно располагаются выбранные точки в области поиска.
Основным достоинством метода сканирования является то, что при его использовании с достаточно густым расположением точек всегда гарантируется то, что глобальный экстремум будет найден. Однако для этого в данном методе требуется значительный объем вычислений, снизить который можно путем распараллеливания алгоритма. Наиболее простой алгоритм поиска экстремума методом сканирования (поиска на сетке переменных) заключается в том, что по каждой независимой переменной задаются приращения в соот-
ветствующем порядке, обеспечивающем заполнение всей исследуемой области равномерной и достаточно густой сеткой.
Поскольку номинальные значения параметров схемных элементов должны принадлежать ряду стандартных значений, регламентированных техническими условиями или ГОСТами, иногда предпочтительнее искать оптимальный вектор номиналов параметров на дискретном множестве номиналов DK, соответствующем стандартным значениям и ограниченном областью допустимых значений Dx. В случае, когда эта область неизвестна, для каждого из параметров xi необходимо задать пределы их возможных изменений. Делается это, например, путем построения описанного гиперпараллелепипеда [5] или на основе известных допусков на каждый из внутренних параметров.
Пусть известны множества номиналов для каждого из n выбираемых параметров схемных элементов исследуемой системы:
12 r i 1 2 r
nom\ = { xi, xi ,..., x }, xi < xi <...< Xi1 ; ...;
<■12 r ^ i 2 r
nomn = { xn, xn,..., xnn }, xn < xn < ... < xn .
Решение данной задачи предлагается провести как двухэтапную параллельную процедуру.
На первом этапе предлагается ограничить пространство поиска брусом допусков, проведя аппроксимацию области работоспособности путем построения описанного параллелепипеда. Используя изложенный в [5] параллельный алгоритм построения описанного бруса, построим брус В0 с Bd:
В0 = {х е Rn | a0 < xi < bf , i = i,n },
где a0 = min xt; bi = max xt.
xeDx xeDx
Важно отметить, что при построении описанного параллелепипеда нет необходимости нахождения области работоспособности в пространстве внутренних параметров Dx, что существенно уменьшает трудоемкость предлагаемого алгоритма [5].
На втором этапе сформируем дискретное множество номиналов внутренних параметров
D™ = {xf : af < xj < bf , xi е nomi, i = i, n },
в каждой точке x™ которого необходимо найти значение целевой функции.
Искомый оптимальный вектор номиналов х^пт находим, решая задачу (2) или (7).
В простейшем случае нахождение решения этих задач сводится к полному перебору элементов множества D^K, для каждого из которых осуществляется расчет соответствующей целевой функции. Учитывая цикличность процедуры вычисления целевой функции, несложно применить параллелизм по данным.
Множество £>нн разбивается на непересекающиеся подмножества
к
= и }, при этом каждому /-му процессору назначается свое под-
г=1
множество £>нн/ исходных данных. Таким образом, каждый /-й процессор
осуществляет расчет целевой функции для всех элементов множества £>нн/ и
находит оптимальный вектор номиналов параметров для своей подобласти. Результаты передаются главному процессору, который производит выбор
оптимального вектора номиналов по всей области £>нн . Такое разбиение всего множества поиска на непересекающиеся подмножества составляют суть блока диспетчеризации параллельного распределенного процесса.
Для симметричного вычислительного кластера, состоящего из к равных по мощности вычислительных узлов, общее число точек разбивается на равные количества для каждого из подчиненных процессов. В случае несимметричного кластера необходимо провести предварительную оценку трудоемкости типовой процедуры метода оптимизации, в качестве которой выступают однократное моделирование работы системы, проверка условий работоспособности и вычисление значений критерия запаса работоспособности. При этом вычислительная нагрузка делится между компонентами комплекса пропорционально их производительности.
По окончании работы программы диспетчеризации вычислительного процесса каждому вычислительному компоненту комплекса рассылаются
границы его подмножества £>нн/ исходных данных. По окончании счета
главный процессор получает результаты от подчиненных и проводит формирование окончательных результатов дискретной оптимизации на всем множестве £>нн .
Заключение
Параллельный подход обладает достаточно высокими характеристиками производительности, т. к. обмен между процессорами сводится к минимуму - назначению заданий и заключительной передаче результатов. Выполнение испытаний на процессорах не синхронизируется. При одинаковых мощностях подобластей £>нн/ и равных временных затратах на вычисление целевой функции на симметричных кластерах ускорение параллельного алгоритма сканирования практически достигает линейного. Наличие внутренних циклов порождает высокую масштабируемость алгоритма, главным условием эффективной реализации которого является пропорциональная загрузка всех участвующих в вычислениях процессоров.
Список литературы
1. Абрамов, О. В. Параметрический синтез стохастических систем с учетом требований надежности / О. В. Абрамов. - М. : Наука. 1992.
2. Бусленко, Н. П. Метод статистических испытаний / Н. П. Бусленко, Ю. А. Шрейдер. - М. : Наука, 1961.
3. Абрамов, О. В. Параллельные алгоритмы анализа и оптимизации параметрической надежности / О. В. Абрамов, Я. В. Катуева // Надежность. - № 4. - 2005. -С. 19-26.
4. Абрамов, О. В. Оптимальный параметрический синтез по критерию запаса работоспособности / О. В. Абрамов, Я. В. Катуева, Д. А. Назаров // Проблемы управления. - № 6. - 2007. - С. 64-69.
5. Абрамов, О. В. Параллельные алгоритмы построения области работоспособности / О. В. Абрамов, Г. Б. Диго, Н. Б. Диго, Я. В. Катуева // Информатика и системы управления. - № 2. - 2004. - С. 121-133.
Абрамов Олег Васильевич доктор технических наук, профессор, заведующий отделом проблем надежности и качества,
Институт автоматики и процессов управления Дальневосточного отделения РАН
E-mail: [email protected]
Abramov Oleg Vasilevich a Dr.Sci.Tech., the professor, the head of department of problems of reliability and quality,
Institute of automatics and managerial processes of Far East branch of the Russian Academy of Sciences
УДК 681.3.013.2: 62-192 Абрамов, О. В.
Параллельные алгоритмы расчета и обеспечения параметрической надежности / О. В. Абрамов // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2009. - № 1 (9). - С. 31-39.