ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012 Управление, вычислительная техника и информатика № 4(21)
УДК 519.2
Ю.Г. Дмитриев, С.В. Скрипин
О КОМБИНИРОВАННОЙ ОЦЕНКЕ ВЕРОЯТНОСТИ БЕЗОТКАЗНОЙ РАБОТЫ ПО ПОЛНОЙ ВЫБОРКЕ
Строятся статистические оценки для вероятности безотказной работы объекта в виде взвешенной суммы непараметрической оценки вероятности и заданной параметрической оценки вероятности. Находятся асимптотические распределения предлагаемых оценок. Проводится сравнение точности оценок при конечном объеме наблюдений путем имитационного моделирования.
Ключевые слова: случайная наработка, вероятность безотказной работы, непараметрическая оценка, комбинированная оценка вероятности, асимптотическое распределение.
В теории надежности при анализе и статистическом оценивании вероятности безотказной работы (ВБР) объекта используются те или иные вероятностностатистические модели случайной наработки элемента Х до первого отказа [1]. Выбор модели обусловлен наличием априорной информации о виде функции распределения Е случайной наработки Х Функция распределения может принадлежать как непараметрическому семейству Ж, так и параметрическому семейству
О = {О(/;0),9с©} распределений наработки. Для новых объектов эта функция распределения, как правило, полностью неизвестна и поэтому для ее статистической оценки применяют непараметрическую оценку, построенную по результатам испытаний. Однако опыт исследователя позволяет ему выдвинуть некоторые априорные догадки о принадлежности Е некоторому параметрическому семейству. Эта догадка может быть как верной, так и неверной. Возникает желание использовать имеющиеся знания о возможной параметризации распределения в непараметрических оценках с целью улучшения их свойств. В данной работе предлагается подход к построению комбинированных оценок в виде взвешенной суммы непараметрической оценки вероятности и заданной параметрической оценки вероятности. Обсуждаются проблемы, возникающие при реализации таких оценок на практике, анализируются асимптотические свойства, а также свойства при конечном объеме наблюдений путем имитационного моделирования.
1. Постановка задачи
Пусть Е(/) = Р{Х < ,}, , > 0, - функция распределения случайной наработки X. Запишем ВБР объекта, достигшего возраста t, в виде
J (х; t, Е) = 1 - Е ( + х) = Ре (Л+х), (1)
1 - Е (,) Ре (Л)
где событие Л,+х = {Х>+х}, Л, = Х>,.
Имеется полная простая выборка Хь..., Хп объема п случайной наработки Х с Ее Ж. Непараметрическую оценку ВБР (1) возьмем в виде
- 1 - Еп (х + О Р(В)
./(х;,) =----^, (2)
1 - Еп (,) Р(Л)
где Еп(0 = п -1 X с (, - Х), с(,) = {0: ,<0, 1: ,>0} - эмпирическая функция распреде-
1 =1
ления, Р ( ) - эмпирические вероятности, В = Лш, Л = ЛI .
Пусть имеется предположение, что Ее О . В этом случае ВБР запишется в виде
J(х;,, О) = 1 - О(t + x, 9) = Р0 (Л+х) = Т(х;,, 0), 0 е ©. (3)
V ' 1 - 0(,, 9) Р9 (Л) ^
Назовем величину ¥(х;,,0) априорной догадкой. Задача состоит в построении оценки ВБР, учитывающей непараметрическую оценку (2) и априорную догадку (3) совместно.
Рассмотрим разложение непараметрической оценки в окрестности истинных вероятностей Р(В) и Р(А) по формуле Тейлора с остаточным членом Кп(,, х) в форме Лагранжа для произвольных, но фиксированных t, х:
,( х; t) = РЕ(Л^+х) +(Р( В) - Р( В)) - (Р(Л) - Р( Л))+^ (t, х). (4)
Ре (Л) Р( Л) Р 2( Л)
Обозначим главную часть в (4) через
(х; t) = J (х; t, Е) + -1- (Р( В) - Р( В)) - (Р(Л) - Р( Л)). (5)
я Р( Л) Р 2( Л)
Из (5) следует, что математическое ожидание и дисперсия главной части равны соответственно
Ме, (х;t) = J(х;t, Е), Ое, (х;t) = п-1стЕ,
е _2 _2(... Р( В)( Р( Л) - Р( В)) [1 - Е ^ + х)][ Е ^ + х) - Е ^)] (6)
где СТ Е = СТ Е (х; 0 =-------------------------------------------------------------------3-=-3-. (6)
Р3(Л) (1 - Е ^ ))3
Кроме того, из (5) вытекает, что при увеличении объема наблюдений п в силу центральной предельной теоремы последовательность
(х; t) - ,(х; t, Е)) ~ N (0, ст2е ),
т.е. имеет асимптотически нормальное распределение с нулевым математическим ожиданием и дисперсией, определяемой формулой (6). Поскольку вторые производные в остаточном члене Япу, х) являются непрерывными функциями относительно Р(В) и Р(А), то в силу теоремы непрерывности (см. [2], глава 6) последовательность -1п Япу, х) слабо сходится к нулю. Отсюда следует, что и непараметрическая оценка (2) также имеет асимптотически нормальное распределение, т.е. л/й (Д(х; 0-/(х; ,,Е))~МР,с2е).
2. Комбинированная оценка
Совместное использование непараметрической оценки (2) и априорной догадки (3) осуществим с помощью комбинированной оценки следующего вида:
(х; t) = (1 - X)./(х, t) + Х¥(х; t, 9)) =,(х, t) - X(./(х; t) - ¥(х; ^ 9)), (7)
где X - коэффициент взвешивания, выбираемый из заданного критерия качества, х, t, 0 произвольные, но фиксированы. Поскольку определяющим элементом в асимптотическом поведении оценки (2) является ее главная часть, то выберем ко-
эффициент X из условия минимума среднеквадратической ошибки (СКО) главной части
Минимизация выражения (8) по X приводит к оптимальному значению коэффициента
(отклонения) априорной догадки от истинного значения ВБР. Минимум СКО главной части удовлетворяет соотношению
Как показывают выражения (9) и (10), оптимальное значение Х0 изменятся в пределах 0 < Х0 < 1, а выигрыш в точности оценивания комбинированной оценки по сравнению с непараметрической оценкой характеризуется отношением
Формула (11) показывает, что чем V ближе к нулю, тем сильнее влияние априорной догадки на точность оценивания ВБР, и чем ближе V к единице, тем слабее это влияние. При ДЕ = 0 имеем Х0 = 1, V = 0, и в качестве оценки ВБР следует взять априорную догадку ¥(х;,,0). При ДЕ Ф 0, что обычно и бывает на практике, Х0 < 1 и с ростом объема наблюдений (п^-да) Х0^0, влияние априорной догадки уменьшается, выигрыш в точности оценивания убывает, V-^•1.
Оптимальное значение Х0 зависит от функции распределения Е случайной наработки и, как правило, неизвестно. Это обстоятельство затрудняет применение комбинированной оценки (7) на практике и приводит к поиску тех или иных оценок Х0 для Х0, при которых выигрыш в точности еще сохраняется. Комбинированные оценки (7) с Х0 назовем адаптивными. В этом разделе мы рассмотрим некоторые из возможных оценок для Х0 и приведем свойства получающихся при этом адаптивных оценок
1. Первая оценка Х0. Подставим в формулу (9) вместо неизвестной Е эмпирическую функцию распределения Еп (или вместо неизвестных вероятностей Р - их эмпирические оценки Р ). Получим оценку
БЕ (х; t, X) = МЕ [(х; t) - Х((х; t) - Т(х; ^ 9)]2.
(8)
где с2е определяется формулой (6), а ДЕ = ,(х;,,Е) - ¥(х;,,0) - величина смещения
(9)
(10)
БЕ( х; t, Х0)
V = Е\’ ’ = (1 -Хп)
^ (х; t)
(П)
3. Адаптивные оценки
./(х; t, Х0) = ./(х; t) - Х0 (./(х; t) - Т(х, t, 9)).
(12)
где
Д = Д(х;t) = х;t) - Т(х;t, 9) = - Т(х;t,9),
Р( Л)
ст2 = Р( В)( Р(Л) - Р( В))/Р3 (Л).
д2 = (Р( В) -ТР( Л))2 Р( Л) (14)
ст2 Р(в)(Р(Л) - Р(В)) .
Пусть ДЕ Ф 0. Рассмотрим разность
у/п (,(х; t, Х01) - ,(х; t)) — 4п (,(х; t) - ,(х; ^) —ч/п"Х01;Д . (15)
Поскольку (13) и отношение (14) являются непрерывными функциями от Р(Л), Р(В), то в силу состоятельности эмпирических вероятностей, по теореме
непрерывности (см. [2], глава 6) следует, что для каждых фиксированных х, t при
п—ж
д2 р д7 р 1—" " р —2———2~, Х01 — 0, •\/пХ^01'Д — 0.
СТ СТе
Отсюда из (15) вытекает, что при ДЕ Ф 0 асимптотические распределения адаптивной оценки Д(х;,, Х01) и непараметрической Д(х;,) одинаковы и совпадают, как установлено выше, с нормальным законом МР,с2е).
Пусть ДЕ = 0. Тогда при п—ж в силу центральной предельной теоремы и теоремы непрерывности ([2], глава 6) случайная последовательность цп = л/иД/СТ стремится по распределению к стандартной нормальной случайной величине пеМР,1), а оценка Х01 сходится по распределению к случайной величине 1/(1+п2). Отсюда следует, что закон распределения случайной последовательности
л/л (,(х; t, Х01) - ,(х; t)) л/п (,(х; t) - , (х; 0) Х0^ л/пД
сходится к распределению случайной величины
I — П-----= “^“7,П е N(0,1),
1 + п2 1 + п2
с математическим ожиданием М^ = 0 и дисперсией Б = с2^ .
2. Вторая оценка Х0. Желание обеспечить сходимость оценки коэффициента Х0 к единице при ДЕ = 0 приводит ко второй оценке
Х 1 1 7
Х02 — — , а > 2.
1 + п |Д/СТГ 1 + п^^Д/а!
Если Де ф 0, то при п—ж
|Л 1а Р I / |а Р Г”л Л Р
Д/СТ —— Де/сте , Х02 ——0, ■^п/^02Д ——0.
Отсюда следует, что асимптотические распределения оценок Д(х;,, Х0г) и Д(х;,) одинаковы и совпадают с нормальным законом М^0,с2е).
Если ДЕ = 0, то при п——ж имеют место следующие сходимости по распределению
случайных последовательностей: ^/пД/ст| сходится к случайной величине |п|а, оценка Х02 - к единице, а у/п (,(х; t, Х02) - ,(х; t))/СТ = 4пД{1 - СТ - к нулю.
Возможны и другие виды Х0 в адаптивных оценках (12), приводящих к новым свойствам.
4. Имитационное моделирование
С целью выяснения качества предложенных в работе адаптивных оценок ВБР при конечных объемах выборок было проведено имитационное компьютерное моделирование при следующих условиях:
1. Выборки генерировались из экспоненциального закона распределения Е(х) = 1 - ехр(-0х) с параметром 0 = 1,0. Объемы п выборок изменялись в диапазоне от 5 до 125 с интервалом (шагом) равным 5.
2. Генерирование событий Л( и Л,+х проводилось при t = 0,10536, х = 0,5. При этом для каждой сформированной выборки соблюдалось условие: имеется хотя бы одно наблюдение с событием Лг , иначе выборка исключается из рассмотрения.
3. Сравнение СКО оценок с разной величиной смещения Д проводилось при изменении значений параметра 0 в диапазоне от 0,4 до 1,8 с интервалом (шагом), равным 0,2 и фиксированным объёмом выборки п = 15;
4. Для каждого значения п из заданного диапазона числовые результаты эксперимента рассчитывались по серии выборок объема К = 1000000 (с одинаковым объемом наблюдений п в каждой выборке);
5. Квадрат отклонения (ошибки) оценок от истинного значения
Б,2 — (/п] - /)2, , — 13,
где - параметрическая оценка ¥(х;,,0), /п2 - непараметрическая оценка .(х;,), ./„з - комбинированная оценка .(х;,, Х 01), / - истинное значение /(х,,,Е).
6. Критерии оценки СКО, вычисленные по серии К выборок,
е,—Кг £ 1 ,—13,
где 0 - оценка СКО для ¥(х;,,0), 02 - оценка СКО для .(х;,), 03 - оценка СКО для .(х;,, Х 01).
5. Результаты моделирования
Результаты моделирования экспериментов представлены на рис. 1 и 2. Дадим краткий комментарий результатов.
Эксперимент 1. Цель эксперимента - оценка и анализ изменения СКО комбинированной оценки .(х;,, Хм) по сравнению с непараметрической в условиях конечных объёмов выборки п. Параметрической оценкой была взята величина ¥(х;,,0) с СКО равной нулю. Выигрыш СКО определялся только свойствами комбинированной оценки.
На рис. 1 по горизонтальной оси указан объём выборок п, а по вертикальной оси - величина 0 оценок СКО непараметрической и комбинированной оценок. Из рисунка виден почти двукратный выигрыш СКО комбинированной оценки по сравнению с непараметрической уже при п > 5. Этот выигрыш сохраняется и при увеличении объёмов выборок за пределы диапазона условий моделирования, что подтверждает теоретические результаты.
Эксперимент 2. Цель эксперимента - оценить изменение выигрыша СКО комбинированной оценки .(х;,, Х01) по сравнению с оценкой СКО непараметрической оценки при изменении величины 9 . Эксперимент проведён при фиксированном объёме выборок п = 15.
Q
0,05 0,04 0,03 0,02 0,01
0
Рис. 1. Зависимости оценок СКО непараметрической (пунктирная линия) и комбинированной (штрих-пунктирная линия) оценок от объёма выборок n
Q
0,04 0,035 0,03 0,025 0,02 0,015 0,01
0,005 0
Рис. 2. Зависимости оценок СКО параметрической (сплошная линия), комбинированной (штрих-пунктирная линия) и непараметрической (пунктирная линия) оценок от смещения параметра 0 (истинное значение 0 = 1) при объёме выборки n = 15
На рис. 2 по горизонтальной оси указана величина параметра 0. По вертикальной оси указана величина Q оценок СКО параметрической (сплошная линия), непараметрической (пунктирная линия) и комбинированной (штрих - пунктирная линия) оценок. Все кривые статистически значимо различаются на уровне значимости < 0,05, за исключением областей пересечения кривых. Рисунок демонстрирует, что при 0 = 1 СКО параметрической оценки равно нулю, а оценки СКО непараметрической и комбинированной оценок соответствуют величинам, представленным на рис. 1 при n = 15. При смещении параметра 0 в меньшую или большую сторону от 0 = 1 выигрыш СКО комбинированной оценки плавно
\
1
5 15 25 35 45 55 65 75 85 95 105 115 n
уменьшается по сравнению с оценкой СКО непараметрической оценки. При значениях 0 < 0,5 и 0 > 1,7 выигрыш отсутствует. Однако уменьшение оценки СКО и выигрыша происходит значительно медленнее, чем у параметрической. Поэтому при значениях 0,5 < 0 < 0,7 и 1,4 < 0 < 1,7 выигрыш СКО комбинированной оценки имеет место и по сравнению с оценкой СКО параметрической оценки, что подтверждает преимущества комбинированных оценок. Преимущества комбинированных оценок подтверждаются и для J(x;t, Х02) и в других экспериментах, не представленных в данном пункте.
Заключение
В работе предложены статистические комбинированные оценки для ВБР объекта, в которых используется знание исследователя о возможных параметрических моделях функций распределения наработки до отказа или самой ВБР. Оценки являются взвешенными суммами непараметрических и параметрических оценок ВБР. Найден оптимальный коэффициент взвешивания и показано, что при любом конечном объеме выборки комбинированные оценки являются более точными по критерию СКО главных частей оценок. Однако применение таких оценок на практике затруднено незнанием оптимального коэффициента взвешивания. В работе приведены две оценки таких коэффициентов и построены адаптивные комбинированные оценки ВБР. Результаты имитационного моделирования показали, что при конечных объемах выборок адаптивные оценки имеют меньшее СКО по сравнению с непараметрической оценкой.
Результаты моделирования, представленные на рисунках, получены с помощью кластера Межрегионального вычислительного центра ТГУ СКИФ Cyberia (skif.tsu.ru). Авторы выражают благодарность сотрудникам Центра за оказанную помощь.
ЛИТЕРАТУРА
1. Байхельт Ф., Франкен П. Надежность и техническое обслуживание. Математический подход: пер. с нем. М.: Радио и связь, 1988. 392 с.
2. БоровковA.A. Математическая статистика. М.: Наука, 2007. 704 с.
Дмитриев Юрий Глебович
Скрипин Сергей Викторович
Томский государственный университет
E-mail: [email protected], [email protected] Поступила в редакцию 2 августа 2012 г.
Dmitriev Yury G., Skripin Sergey V. (Tomsk State University). On a combined estimating of the probability of failure-free operation for the full sample.
Keywords: the probability of failure-free operation, nonparametric estimation, the combined estimate of the probability, the asymptotic distribution.
There is constructed statistical estimates for the probability of failure-free operation of the system as a weighted sum of nonparametric and parametric estimates of the probability. Asymptotic distributions of combined estimates are found. The accuracy of estimates with finite volume of observations is studied by simulation.