ISSN 0868-5886 НАУЧНОЕ ПРИБОРОСТРОЕНИЕ, 2010, том 20, № 3, c. 49-55 - ОБРАБОТКА СИГНАЛОВ, ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ =
УДК 519.248
© Л. В. Уткин, В. В. Фомин
МИНИМАКСНЫЙ ПОДХОД ДЛЯ ПОСТРОЕНИЯ КЛАССА МОДЕЛЕЙ НАДЕЖНОСТИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ НА ОСНОВЕ КОМБИНАЦИИ ОБОБЩЕННОГО БАЙЕСОВСКОГО ВЫВОДА И ЭЛЕМЕНТОВ ТЕОРИИ ОБУЧЕНИЯ
В работе предлагается новый подход к построению моделей надежности программного обеспечения, использующий комбинацию обобщенного байесовского вывода и элементов теории обучения. Для построения моделей рассматривается множество распределений вероятностей, отражающее недостаток имеющихся статистических данных, и на этом множестве осуществляется поиск максимума функционала риска. Параметры модели вычисляются минимизацией полученного функционала. Этот подход является достаточно общим и позволяет создавать различные модели надежности.
Кл. сл.: надежность, программное обеспечение, статистическое моделирование
ВВЕДЕНИЕ
Проявление ошибок в программном обеспечении (ПО) интенсивно изучалось в литературе в целях улучшения характеристик программ. Огромное количество моделей надежности программного обеспечения (МНПО) было разработано в последние десятилетия, но ни одна модель не дает точного прогноза для различных программ. Это следствие нереалистичности рядя предположений, используемых в моделях. Детальный и всесторонний критический обзор вероятностных моделей надежности ПО был предложен в работах [1, 2].
Основной идеей моделирования надежности ПО является попытка статистически описать процесс отладки программного обеспечения (исправления ошибок и тестирования до момента проявления очередной ошибки). При этом обычно предполагается, что после исправления очередной ошибки их общее количество уменьшается или программа становится лучше в смысле надежности. В данном случае говорят о росте надежности программы. Таким образом, для анализа надежности ПО с использованием статистических моделей их параметры в общем случае оцениваются из набора имеющихся отладочных данных и данных об отказах. Необходимо отметить, что слово "рост" на самом деле используется условно, т. к. для многих статистических данных наблюдается падение надежности из-за внесенных ошибок в процессе исправления выявленных и вследствие ряда других причин.
В работе предлагается новый класс моделей надежности ПО. Основная идея построения моде-
лей заключается в комбинированном использовании обобщенного байесовского вывода [3], где вместо одного априорного распределения вероятностей рассматривается множество распределений, и метода минимизации функционала риска при выборе "наихудшего" в определенном смысле распределения вероятностей. Выбор этого распределения определяет минимаксную стратегию.
Общий алгоритм построения модели надежности программного обеспечения можно представить в виде трех основных этапов.
1) построение множества функций распределения вероятностей (ФРВ) по обучающей выборке на основе обобщенного байесовского вывода;
2) выбор "оптимального" распределения вероятностей, максимизирующего функционал риска в соответствии с минимаксной стратегией;
3) вычисление оптимальных параметров модели, минимизирующих максимальный функционал риска.
1. МОДЕЛИ НАДЕЖНОСТИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
Пусть Xi — случайное время между (7 - 1)-м и 7-м отказами ПО. Случайная величина Х7 имеет некоторое распределение вероятностей с функцией плотности р1 (х) и с вектором параметров а1. Основная цель анализа надежности ПО после исправления п ошибок в процессе отладки заключается в определении функции распределения времени до отказа Fn+1(х) после п -го отказа, т. е. в период эксплуатации.
Большинство моделей надежности ПО различается предположениями о виде функции плотности pi (x) и функции / изменения параметров ai в процессе отладки, которая называется функцией роста надежности ПО, заданной в явном или неявном виде.
Одной из наиболее известных и простых моделей надежности ПО является модель Джелински— Моранда [2]. Эта модель строится на следующих предположениях.
1) Исходное число ошибок в программе равно N. Ошибки не вносятся в программу в процессе отладки.
2) Время между отказами имеет экспоненциальное распределение с параметром Я(N - (/ -1)), который пропорционален числу оставшихся ошибок в ПО. Наработка на отказ равна 1/Я( N - (I -1)).
3) Интенсивность отказов постоянна в пределах интервала между отказами.
4). Каждая ошибка в ПО имеет одинаковые шансы быть обнаруженной.
5) Отказы независимы.
Функция плотности вероятности времени до отказа имеет вид
p(t) = Я(N - (/' -1)) ехр (-Я(N - (/' - 1)У).
Задача построения модели сводится к получению параметров Я и N по статистическим данным в виде множества X = (x1,...,xn) наблюдаемых значений случайных величин ^1,...,Кп времен до отказа в процессе отладки ПО.
2. ОБОБЩЕННЫЕ БАЙЕСОВСКИЕ МОДЕЛИ
ДЛЯ ПОЛУЧЕНИЯ МНОЖЕСТВА РАСПРЕДЕЛЕНИЙ ВРЕМЕНИ ДО ОТКАЗА ПО
Стандартный байесовский подход
Одним из эффективных подходов к оценке параметров модели является байесовский анализ [5]. В соответствии с ним анализируемые параметры рассматриваются как случайные величины, для которых назначается некоторое априорное распределение вероятностей перед получением наблюдений или статистических данных. Если предположить, что случайная величина имеет распределение вероятностей с вектором неизвестных параметров Ь, то эти параметры следует рассматривать, как случайные величины с априорной плотностью вероятностей л(Ь | 0 , которая в свою очередь характеризуется параметрами c. В этом случае байесовский подход применяется для вычисления ФРВ случайной величины
^^ | ^ = | ^^ | Ь) л(Ь |
Здесь О — множество значений параметров Ь .
Центральным элементом байесовского подхода является вывод апостериорного распределения неизвестных параметров при получении статистических данных. Это осуществляется на основе теоремы Байеса. Предположим, что априорное распределение л(Ь | ^ отражает неопределенность относительно Ь до получения статистической информации в виде множества X. Пусть p(k) — функция плотности времени до отказа при условии Ь . Тогда апостериорная плотность л(Ь | X, ^ как условная плотность параметра Ь при полученных наблюдениях X и априорном параметре c вычисляется как
л(Ь | X,ф к p(Xl) ••• p(Xn)-л(Ъ |
Здесь л(Ь | X, 0 отражает модифицированное представление о параметрах Ь с учетом полученной информации X.
Априорное распределение зачастую выбирается таким образом, чтобы упростить вычисления. Наиболее эффективный путь в этом направлении — это выбор согласованных априорных распределений [5]. Если апостериорное распределение л(Ь | X, О и априорное распределение л(Ь | О принадлежат одному семейству распределений, то л и p называются согласованными распределениями, а л называется согласованным априорным распределением для p.
Интервальные априорные модели
Одним из факторов выбора априорного распределения, т. е. его параметров, является то, что при наличии информативных статистических данных даже плохое априорное распределение не повлияет существенно на апостериорное. С другой стороны, до появления каких-либо статистических данных или наблюдений о параметрах зачастую ничего неизвестно. Поэтому если отбросить требование простоты вычислений, то предпочтительное, или хорошее (подходящее), априорное распределение должно минимально влиять на вывод, т. е. на апостериорное распределение, а также учитывать отсутствие априорной информации о параметрах. Априорные распределения, моделирующие отсутствие априорной информации, называются неинформативными.
В литературе существует достаточно большое количество подходов для выбора того или иного неинформативного априорного распределения [3], имеющих свои достоинства и недостатки. Однако наиболее интересным является подход, полностью
отличающийся от большинства традиционных. Суть этого подхода заключается в следующем.
Определим не одно априорное распределение, а целый класс Я распределений ж, для которого можно найти нижнюю и верхнюю вероятности события А как
Р( А) = т{{Рж (А): же Я}, Р(А) = 8ир{Рж(А): же Я}.
При определенных условиях множество Я полностью определяется нижней и верхней функциями распределения вероятностей. Следует отметить, что класс Я следует рассматривать не как класс подходящих априорных распределений, а как подходящий класс априорных распределений. Это значит, что каждое отдельное распределение из класса не является подходящим, или хорошим априорным распределением, т. к. ни одно отдельное распределение не может удовлетворительно моделировать отсутствие информации. Но весь класс в целом, определяемый верхним и нижним распределениями вероятностей, является подходящей моделью отсутствия информации. Когда априорной информации почти нет, Р(А) для этого
класса должно быть близко к 0, а Р(А) близко к 1. Это означает, что априори событие А может иметь любую вероятность.
В большинстве случаев класс распределений Я определяется параметрически. К наиболее известным таким классам априорных распределений следует отнести обобщенную модель Дирихле [6], обобщенные модели экспоненциального семейства распределений [7]. В нашем подходе множество Я используется для того, чтобы учесть статистические данные и сгенерировать множество Т прогнозируемых распределений с нижней и верхней границами.
Обобщенная гамма-экспоненциальная модель
Одной из неинформативных моделей, основанных на определении класса Т, является гамма-экспоненциальная модель, которую можно рассматривать как частный случай моделей, использующих экспоненциальное семейство распределений вероятностей [7]. Эта модель также может рассматриваться как класс распределений Парето с определенным множеством параметров. Если наблюдаем событие отказа в момент времени 7 и предполагаем, что это время имеет экспоненциальное распределение с параметром X, то согласованное априорное распределение для параметра X > 0 является гамма-распределением, имеющим функцию плотности вероятности
ж(Х) = Gamma(a, Ь) = —1— ЬаХа 1 ехр(—ЬХ). Г(а)
Здесь а > 0 и Ь > 0 — параметры сдвига и масштаба гамма-распределения; Г(а) — стандартная гамма-функция. Апостериорная плотность ж(Х| х) после наблюдения события в момент времени х имеет вид
ж(Х | х) = Gаmmа(a +1,Ь + х).
Отсюда апостериорная функция распределения равна
Рг{Х < 7} = F(7) =
да
= ] (1 - в-м) • Gamma(a +1, Ь + х^Х =
= 1 -
Ь + х Ь + 7 + х
Здесь байесовский вывод приводит к распределению Парето времени до отказа программы с параметрами а и Ь . Заменим параметры а = sу и Ь = s — sy и предположим, что новый параметр у может быть любым в интервале от 0 до 1. Изменяя этот параметр, получаем множество всех распределений Парето с фиксированным параметром s и множеством параметров 0 < у < 1. Это множество ограничено некоторой верхней и нижней граничными функциями распределения вида
F() = 1 —
s + х s + 7 + х
1 / \х+1 , =1 -Г 1 .
I 7 + х I
Здесь параметр s > 0 определяет влияние априорного распределения на апостериорное. В частности, если s = 0, то апостериорное распределение полностью определяется только информацией о числе отказов п и k . Используя множество распределений вероятностей вместо одного распределения, можно найти только нижнюю и верхнюю границы для вероятностей событий вместо точных значений. При этом нижняя и верхняя границы для вероятностей событий могут быть получены минимизацией и максимизацией вероятностей событий по всем значениям параметра у в интервале [0,1]. Параметр s также определяет, насколько быстро границы вероятностей сходятся при поступлении статистических данных. Меньшие значения s дают быструю сходимость и более рискованные заключения, в то время как большие значения s приводят к более осторожному статистическому выводу.
Перед получением каких-либо наблюдений имеем х = 0 и, следовательно, нижняя вероятность отказа равна 0, а верхняя вероятность равна 1.
Обобщенная байесовская модель роста надежности ПО
Для моделирования надежности ПО мы используем обобщенную гамма-экспоненциальную модель, предполагая, что 1-е время Х{ до отказа программы имеет экспоненциальное распределение с параметром Я = Я(N - (I -1)), I = 1,..., п .
Заметим, что среднее значение параметра Я, имеющего гамма-распределение с априорными параметрами а1 и Ь, равно а1 / Ь, т. е. ЕЯ,. = а1 / Ь.
Если зафиксировать параметр ai = а, то запи-
шем
Я(N - (I -1)) = а / Ьг.
Ь = а /(Я(N -1 +1)) = Ь • /(I),
где / (I) =
N
N -1 +1
§ (I) =
N -1 N -1 +1
после исправления п ошибок:
Ьп = Ь П§ (I)+% ¡П§ О) .
¿=1 I=1 V j=i /
Заметим, что верны следующие преобразования:
П§ (I)=
I=1
П§ (;) =
N -1N - 2 N - п
N - п
N N -1 N - п +1 N N -1 N -1 -1 N - п
N -1 +1 N -1 N - п
N -1 - п +1
N -1 +1
Отсюда
К = ь
N - п
N
N - п N -1 +1.
Отсюда априорный параметр Ь1 = Ь равен а / (Я^ , и выполняется условие Я = а / (ЬЫ). Другими словами, априорный параметр Ьi, учитывающий рост надежности, равен
Апостериорный параметр ап после п -го отказа равен ап = а + п . Обозначим
В = ^х
N - п N -1 + Г
С =
N - п N '
После исправления соответствующей ошибки I -й параметр Ьi получается равным Ь^ (I), где
Тогда можно записать функцию распределения вероятностей Fn+1(t) после п -го шага отладки программы следующим образом:
Рп+1^) = 1 -
СЬ + В СЬ + В +1
Если априорный параметр гамма-распределения равен Ь1 , то апостериорный параметр после отказа в момент времени х1 равен Ь1 + х . После исправления ошибки в программе мы получим априорный параметр Ь2 =(Ь1 + X) § (1). Тогда апостериорный параметр после отказа в момент времени х2 равен
Ь2 + х2 = (Ь1 + х) § (1) + х2.
После исправления соответствующей ошибки в программе мы получим априорный параметр Ь3 = (Ь2 + х2) § (2). Тогда апостериорный параметр после отказа в момент времени х3 равен
Ь3 + х3 = (Ь2 + х2) § (2) + х3 =
= ((Ь1 + X ) § (1) + Х2) § (2) + Х3.
Последовательно продолжая рассуждения, мы получим выражение для априорного параметра
Для построения обобщенной модели роста необходимо выбрать ограниченное множество векторов (а,Ь). Предлагается выбрать множество векторов (а, Ь) в треугольнике (0,0), (5,0), (0,5). Это означает, что все возможные априорные интенсивности отказов Я учитываются в этом случае, т. к. математическое ожидание интенсивности отказов равно Е Я = а / Ь . При (а, Ь) из приведенного выше треугольника ожидаемая интенсивность отказов изменяется в интервале (0, да).
Нижняя граница функции распределения ^) определяется как
к)=1 -
С5 + В t + Ся + В
Верхняя граница функции распределения Кй ^) определяется как
7^(5) / Ч , I В
к,+1(0 = 1 -
t + В
=1
п
5+ п
Соответствующие функции плотности равны
р*) . = п(В + Cs)n -"+1 (7 + В + Cs)n+1
-м/ч (s + п)В* Рп+1«) =
(7 + В)*
3. ОЦЕНКА ПАРАМЕТРОВ МОДЕЛИ НАДЕЖНОСТИ ПО В РАМКАХ ТЕОРИИ ОБУЧЕНИЯ
Функционал риска
Сформулируем стандартную регрессионную модель в терминах теории обучения. Согласно работе Вапника [10], задача обучения может быть описана следующим образом. Выбирается наилучшая функция /(х,а0) из параметрического множества функций /(х,а) на множестве параметров а е Л . Выбор подходящей функции основан на "зашумленной" обучающей выборке, состоящей из п независимых и одинаково распределенных наблюдений (х1,у1), 1 = 1,...,п . Качество аппроксимации определяется функцией потерь Ь(у — /(х,а)) = Ь(г), например Ь(г) = г2. Основная цель обучения — минимизация функционала риска
R(а) = {]Ь( у — / (х,а)) р( у — / (х,а))&х dy.
Минимизация функционала риска осуществляется в классе функций /(х,а), аеЛ. Другими словами, функция / (х,а0) обеспечивает минимум R(а) так, что R(a0) = ттаеЛ R(а).
Если совместная ФПВ р(х, у) неизвестна, то функционал риска R(a) можно заменить так называемым эмпирическим функционалом риска
1 п
Remp(a) = -X Ьу. — /(х,а)).
п 1=1
Когда распределения вероятностей известны, то общепринятый метод вычисления наилучшей функции /(х,а0) — метод максимума функции правдоподобия [10].
Проблема обучения при условии наличия множества распределений
Предположим, что мы не знаем точное распределение шума, но имеется информация о том, что это распределение принадлежит множеству Т, ограниченному некоторой нижней ¥ и верхней
¥ функциями распределения вероятностей. Эти границы можно получить на основе наблюдений (х{,у{), 1 = 1,...,п . Введем также множество Я со-
ответствующих функций плотности вероятности, т. е. для каждой функции из Т ставим в соответствие функцию р из Я . Рассмотрим минимаксную (пессимистическую) стратегию построения модели.
Обозначим г = у — /(х,а) . Заметим, что значения х при анализе надежности есть номера обнаруженных ошибок. Тогда соответствующая величина (номер обнаруженной ошибки) не является случайной и функционал риска в соответствии с минимаксной стратегией имеет следующий вид:
=тп ртах ^ г) р (г) ^
Приведенное выражение можно объяснить достаточно просто. Мы не знаем точную функцию плотности р ошибки или шума, и каждое распределение из Я может быть выбрано. Поэтому нам следует выбрать наихудшее распределение, приводящее к наибольшему значению функционала риска. Минимаксную стратегию можно рассматривать как некоторую страховку против наихудшей ситуации, т. к. эта стратегия минимизирует ожидаемые потери в наименее благоприятной ситуации.
Главное условие, которое будет использоваться ниже, заключается в том, что функция потерь Ь(у — / (х,а)) имеет один минимум для каждого а е Л. Это предположение верно для самых различных известных типов функций потерь. Например, квадратичная функция потерь имеет минимум 0 в точке у — / (х,а).
В работах [9, 10] доказано, что оптимальная функция распределения вероятностей из множества Т , обеспечивающая верхнюю границу математического ожидания функции Ь, имеет вид
¥и (х)Ч
¥(х) для х < ¥ (г),
г
¥ (х)
¥ (г) < х <¥ (г),
х > ¥ _1(г).
Соответствующая оптимальная функция плот-
ности записывается как
ри (х) =<
d ¥ (х)/ах, х < ¥ ^(г);
0,
¥ (г) < х < ¥ (г);
d¥(х)/&х, х > ¥^(г).
Здесь значение величины г определяется из условия ¥ч(г)+¥ ^(г) = 0.
Используя эти результаты можно получить Я(а) = Цг)ри (г)¿г.
Упростим выражение для Л (а)
Я(а) =\ L(у — /(х,а))йЕ(у - /(х,а)) +
•I —да да
+ \ Ц( у — / (х,а))й Е (у — / (х,а)).
■I Е (т)
Оптимальное значение параметров а находится минимизацией Л (а) на множестве а е А .
Функционал риска в модели надежности ПО
Качество прогнозирования надежности программного обеспечения во многих задачах оценивается некоторым показателем расстояния между прогнозируемым ожидаемым значением времени до отказа программы и фактическим значением времени до отказа. Так как ожидаемое время до отказа (называемое также наработкой до отказа) после п -го этапа отладки программы равно М = 1 / Л(N — п +1), то функцию потерь Ц(у, / (х,а)) можно определить следующим образом:
Ц( у, / (х,а)) = Ц( у — М). Здесь а = (Л, Щ . Можно принять, для примера,
Ц( у, / (х,а)) = ( у — М )2 Ц( у, / (х,а)) = 1 у — М|.
или
Заметим, что функции плотности вероятности, полученные в разделе 2, характеризуют время до отказа X, но не разность между временем до отказа и наработкой на отказ, т. е. X — М . Поэтому необходимо определить нижнюю и верхнюю "смещенные" функции плотности
Р ' ^) =
п(В + Cs)"
(г + В + Cs + М )п
г + С + В + М
Г\о=1—' В
г + В + М
Для вычисления функционала риска необходи-
—1 ——1
мо решить уравнение Е (г) + Е (г) = 0, где
Е—1 (г) = (С + В)(1 — г)17 п — (С + В + М),
Е (г) = В(1 — г)
— т)1/( 5+п) —
(В + М).
Так как мы предположили, что минимум функции потерь Ц достигается в точке у — /(х,а) = 0, то верхняя граница функционала риска, соответствующая минимаксной стратегии, принимает вид
Я( N ,Л) = $
р со
+\ Е 1
Е-1(т) (э + п)В5+п ■ Ц(у — М) —М (г + В + М )5+п+1 п(В + Сэ)п ■ Ц(у — М)
¿у +
¿у.
-(*).. (5 + п)В*+ п
Р (г) = —----.
(г + В + М )5+п+1
Здесь г > —М. Соответствующие "смещенные" границы функций распределения вероятностей равны
Е(*)(0 = 1 — ( С + В
]Е-\т) (у + В + С + М)п+1
Оптимальные значения параметров N,Л могут быть найдены минимизацией функционала Я(Ж,Л) по множеству положительных значений
N ,Л.
ЗАКЛЮЧЕНИЕ
В работе предложен новый подход к построению моделей надежности ПО, использующий комбинацию обобщенного байесовского вывода и элементов теории обучения. Этот подход является достаточно общим и позволяет создавать различные модели надежности, меняя вид функции потерь, вид функциональной зависимости параметров модели в процессе отладки ПО и способ построения множества распределений.
Необходимо отметить, что в работе не приводятся результаты сравнительных статистических экспериментов с разработанной моделью. Целью работы являлась не разработка конкретной модели, а разработка подхода к созданию различных моделей, адекватно отражающих недостаток статистической информации, который обычно имеет место при моделировании надежности ПО.
Необходимо также отметить, что рассматриваемое множество функций распределения вероятностей не является параметрическим множеством распределений одного типа, совпадающего с типом граничных функций. Множество образуется из всех возможных функций распределения с заданными границами. Это — важная особенность предлагаемого подхода, которая отличает его от существующих методов, использующих только параметрические классы функций распределения.
Другой особенностью предлагаемого подхода является возможность сужать множество распределений вероятностей по мере поступления статистической информации об отказах и исправлениях соответствующих ошибок. Очевидно, что величи-
5+ п
на множества распределений влияет на ширину итоговых границ распределений времени до отказа после завершения отладочного процесса. Это позволяет создавать правило остановки отладочного процесса не только по анализу среднего времени до отказа, но и с учетом неточности результатов.
Направлением дальнейшего исследования является поиск методов и эффективных алгоритмов решения задач оптимизации на основе функционала риска для тех случаев, когда в явном виде сложно записать функционал риска и найти соответствующий интеграл.
СПИСОК ЛИТЕРАТУРЫ
1. Уткин Л.В., Шубинский И.Б. Нетрадиционные методы оценки надежности информационных систем. СПб.: Любавич, 2000. 173 с.
2. Cai K.-Y., Wen C.-Y, ZhangM.-L. A Critical Review on Software Reliability Modeling // Reliability Engineering and System Safety. 1991. V. 32, N 3. P. 357371.
3. Уткин Л.В. Анализ риска и принятие решений при неполной информации. СПб.: Наука, 2007. 404 с.
4. Jelinski Z., Moranda P.B. Software Reliability Research // Statistical Computer Performance Evaluation. N.Y.: Academic Press, 1972. P. 464-484.
5. Bernardo J.M., Smith A.F.M. Bayesian Theory // Statistical Methods and Applications. 1994. V. 3, N 1. P. 155-160.
6. Walley P. Inferences from Multinomial Data: Learning about a Bag of Marbles // Journal of the Royal Statis-
tical Society: Series B. 1996. V. 58. P. 3-57.
7. Quaeghebeur E., de Cooman G. Imprecise Probability Models for Inference in Exponential Families // Proc. of the 4rd Int. Symposium on Imprecise Probabilities and Their Applications, ISIPTA'05. Pennsylvania, Pittsburgh: Carnegie Mellon University, July 2005. P. 287-296.
8. Vapnik V. The Nature of Statistical Learning Theory. N.Y.: Springer, 1995. 188 p.
9. Utkin L.V. Risk Analysis under Partial Prior Information and Non-Monotone Utility Functions // International Journal of Information Technology and Decision Making. 2007. V. 6, N 4. P. 625-647.
10. Utkin L.V., Destercke S. Computing Expectations with Continuous P-Boxes: Univariate Case // International Journal of Approximate Reasoning. 2009. V. 50, N 5. P. 778-798.
Санкт-Петербургская государственная лесотехническая академия (Уткин Л.В.)
Российский государственный педагогический университет им. А.И. Герцена, Санкт-Петербург
(Фомин В.В.)
Контакты: Уткин Лев Владимирович, [email protected]
Материал поступил в редакцию 19.04.2010.
THE MINIMAX APPROACH TO THE CONSTRUCTION OF A MODEL CLASS SOFTWARE RELIABILITY BASED ON A COMBINATION OF GENERALIZED BAYESIAN INFERENCE, AND ELEMENTS OF LEARNING THEORY
L. V. Utkin1, V. V. Fomin2
1 Saint-Petersburg State Forest Technical Academy
2Herzen State Pedagogical University of Russia, Saint-Petersburg
The paper proposes a new approach to constructing models of software reliability, using a combination of generalized Bayesian inference, and elements of learning theory. To construct the models we consider a set of probability distributions, reflecting the lack of available statistical data, and on this set, search for the maximum of functional risk is done. The model parameters are computed by minimizing the obtained functional. This approach is quite general and allows to develop various models of reliability.
Keywords: reliability, software, statistical modeling