УДК 658.5
Ермолаев В.А., Юрков Н.К., Романенко Ю.А.
Центр обучения технологиям и предпринимательству", Висагинас, Литва *ФГБОУ ВПО «Пензенский государственный университет», Пенза, Россия Администрация г.Протвино Московской области, Протвино, Россия
РИСКИ ОТКАЗОВ СЛОЖНЫХ ТЕХНИЧЕСКИХ СИСТЕМ
Введение
Современный мир отличается стремительным ростом структурной сложности технических систем, ростом их размерности, усложняющимися условиями эксплуатации, что влечет за собой рост требований по безотказности выполняемых функций сложных технических средств (СТС). Возрастает роль методов и средств контроля и диагностики как СТС, так и программного обеспечения, на основе которого функционируют сложные системы.
Рост размерности и структурной сложности сложных технических систем опережает возможности существующих методов поддержания их в работоспособном состоянии за счет своевременного обнаружения дефектов. Необходима разработка новых эффективных моделей для решения задач диагностики СТС, состоящих из нескольких сотен и даже тысяч единиц, автоматизация процедур построения оптимальных стратегий диагностирования состояния и прогнозирования поведения сложных технических систем на длительный период их эксплуатации.
Обеспечение гарантированной безопасности функционирования СТС за счет своевременного и оперативного предотвращения перехода штатных ситуаций в критические, чрезвычайные или аварийные является основой стратегии управления рисками. Стратегия основывается на своевременном обнаружении и устранении причин перехода работоспособного состояния объекта в неработоспособное на основе системного анализа многофакторных рисков нештатных ситуаций, достоверного оценивания ресурсов допустимого риска различных режимов функционирования СТС и прогнозирования основных показателей живучести системы в течение заданного периода его эксплуатации. Необходима разработка модели оценивания функции риска, пригодной для анализа современных сложных технических систем.
Модель должна обеспечивать оперативное и результативное управление системой безопасности с целью своевременного обнаружения нештатной ситуации, оценивании ее степени и уровня риска, а также предоставлять информацию о возможности ее реализации в пределах ресурса допустимого риска [1].
Следует отметить, что в системе управления безопасностью функционирования сложных технических систем требования к количественным и качественным показателям исходной информации должны быть ситуационно динамическими и адаптивными, подстраиваемыми под реалии современной реализации, при которой необходима полнота и достоверность изначальной информации.
Физико-химические процессы, приводящие к отказам элементов и систем в целом, очень сложны. Их природа до сих пор не до конца исследована. Число параметров, которые необходимо учитывать при построении математических моделей явлений старения, постепенного изменения свойств изделий и др., очень велико. Необходимы новые подходы к построению системы оценки безопасности сложных систем произвольной структуры, требуется серьезная доработка и развитие методов математической статистики, теории вероятностей, теории эксперимента и др.
Согласно предложенному в [2] информационному критерию безопасности, безопасность достигает своего максимума только в том случае, когда все выполняемые элементарные операции (атомы), из которых состоит процесс, как субъект безопасности, имеют минимальную вероятность сбоя, другими словами находятся под постоянным контролем, что задается выбранной частотой контрольных операций.
Модели латентных дефектов СТС.
Многие латентные дефекты (внешне не проявляющиеся, скрытые) не удается выявить традиционными методами визуализации [3] . В ходе эксплуатации СТС необходимо контролировать множество дефектов, физика появления которых разнообразна. При этом следует иметь в виду, что основную информацию о состоянии объекта контроля человек получает непосредственно зрительным осмотром или путем визуализации различных физических эффектов, выявляющих неоднородности поверхности и объема объекта наблюдения. Большая часть признаков внешнего вида является основополагающей при оценке качества печатных плат. Более того, любой другой вид контроля в случае обнаружения дефекта подтверждается внешним осмотром поверхности или вскрытием печатных плат, позволяющим зрительно убедиться во внешних проявлениях дефектов [4] .
Для контроля за наличия как явных, так и латентных дефектов, большинство из которых в процессе эксплуатации неизбежно приводят к отказу аппаратуры, широко применяются традиционные методы анализа отказов в печатных платах, которые включают электрическое тестирование, визуальный контроль и рентгеновский анализ. Эти методы позволяют выявить часть латентных отказов, физика процессов которых формирует визуальные признаки, такие как заужение проводника, трещина или обрыв. Многие из перечисленных дефектов образуются в процессе изготовления печатной платы. Основными требованиями к качеству фотошаблонов является недопустимость дефектов в виде пятен, разрывов, проколов и других дефектов на прозрачных и непрозрачных элементах изображения [5].
Контроль параметров печатной платы позволяет выявить соответствие параметров ПП нормативным, после чего производится поиск мест потенциального сбоя (латентных или скрытых дефектов). Обычно это бывают заужения печатных дорожек, трещины, смещения центров отверстий и ряд других параметров. Выявленные латентные дефекты локализуются, классифицируются и фиксируются в базе данных.
Далее для обнаруженных неявных дефектов необходимо создать модели их поведения во времени и определить вероятности безотказной работы печатной платы в течение заданного времени.
Оценка надежности программного обеспечения.
Печатные платы, которые играют главенствующую роль в развитии дефектов, в превращении отказов в катастрофические, проходят не менее тщательную проверку (контроль и диагностику), во время которой отбраковываются малейшие отклонения от допусков. При этом в печатных платах наличествуют латентные (скрытые) дефекты, которые проявляют себя случайным образом, и которые, подобно ПО, невозможно выявить на начальной стадии отладки.
Считаем возможным применить теорию надежности, разработанную для программного обеспечения, к оценке надежности сложных СТС, в которых основные дефекты проявляются под действием внешних воздействий, причем как указывалось выше, характер проявления столь же сложен, что и ошибки ПО.
Надежность программного обеспечения отличается от надежности СТС следующим [б]:
элементы ПО не стареют;
число способов контроля ПО значительно больше числа способов контроля аппаратуры;
в ПО значительно больше объектов для контроля, чем в аппаратуре;
в ПО гораздо проще вносить исправления и дополнения, чем в аппаратуру, но это трудно делать корректно и безошибочно.
Сложные электронные системы, основанные на перепрограммируемых интегральных схемах, в которых все большая часть ошибок перекладывается на программное обеспечение, все в большей мере удовлетворяют указанным особенностям.
На основе вышесказанного будем определять количество дефектов, которые потенциально могут быть обнаружены на последующих этапах жизненного цикла СТС. Обозначим количество латентных дефектов B
Пусть P(t) - вероятность того, что ни один латентный дефект не проявит себя (не переродится в явный) на временном интервале [0, t ] . Тогда вероятность хотя бы одного явного отказа за этот период будет Q(t) = 1 — P(t) , и плотность вероятности выглядит так: q(t) = dQ / dt = —dP(t) / dt .
Введем функцию риска R(t) , как условную плотность вероятности отказа печатного узла в момент времени t , при условии, что до этого момента отказа не было:
R(t) = lim[Q(t,t + Dt)] = —[1 / P(t)]dP(t) / dt . (1)
Функция риска имеет размерность [1/время] и она будет использована для классификации основных распределений отказов. Распределения с возрастающей функцией риска соответствуют работе сложных СТС, когда статистические характеристики надежности ухудшаются со временем.
Из выражения (1) следует, что dP(t) / P(t) =—R(t) / dt , и, следовательно, ln P(t) = —J R(t)dt ,
или
P(t) = exp{—J0P(t)dt} . (2)
Равенство (2) позволит определить возможности построения моделей надежности СТС. Интенсивность обнаружения явных дефектов (функция риска), вместе с вероятностью безотказной работы и количеством оставшихся латентных дефектов, являются важнейшими показателями надежности СТС.
Для построения модели оценивания риска, применяемой в процедуре диагностирования и анализа режимов функционирования СТС, представим характеристики степени и уровня риска, лежащими в интервале [0,1]
, т. е. схема модели оценивания риска может быть типа чебышевского полосового фильтра (рис. 1).
Здесь интервалы d , d+ , H , а также числа к ляются) для каждой предметной области отдельно.
Характеристики функциональной зависимости степени
полиномов Чебышева Tn(x), n = 2к, к = 1,2,...,N . Например рис. 2.
(количество возвышенностей)
задаются (вычис-
и уровня рис.
М x) =IT*( x)|
1 строим на основе смещенных имеет вид, представленный на
Рис. 2 Представление смещенных полиномов Чебышева f1(x) =| (x) |
В общем виде используем обобщенный полином
N ____ N
fx(x) = X an I T2*( x)|(1), к = 1, N1; N1 = - (3)
п=2к 2
или
N „ ---- N
f1(x) = X [bn(1 + anTn(x))], к = 1,N1; N1 = - . (4)
п= 2к 2
В соответствии с рис. 1, иллюстрирующим схемы моделей оценивания функции риска необходимо построить модели для системы вложенных интервалов, каждый из которых определяет штатный режим функционирования СТС, а также нештатную, v критическую vv, чрезвычайную л и аварийную * ситуации (рис. 3), или ввести характеристики ситуаций риска: риск несущественный, существенный, критический или катастрофический.
Рис. 3 Схема вложенных интервалов возможных ситуаций риска
При формировании модели оценивания функций риска будем выполнять следующие основные принципы: Принцип соответствия модели реальным процессам. Функция риска f (х) возрастает по мере приближе-
ния к границам интервала и достигает на них максимумов (рис. 4).
Рис. 4 Модель изменения функции риска
Принцип правдоподобия модели реальным процессам. Возрастание степени и уровня риска неравномерно растет к краям интервала. Скорость роста функции риска увеличивается по мере приближения к границам интервала.
Принцип адекватности модели реальным процессам. Динамика возрастания функции риска по мере приближения к границам интервала различная под воздействием различных факторов риска.
Принцип однотипности или типичности моделей для разнородных процессов риска. Процессы изменения функций риска могут существенно различаться но структура моделей должны быть одного типа.
Указанным принципам, как показано в работе [1], отвечают обобщенные поллиномы, построенные на множестве полиномов Чебышева. Эти полиномы дают возможность обеспечить равномерное приближение на всем заданном интервале изменения переменных, которые нормируются к интервалу [-1,1] или [0,1] . Для
рассматриваемой задачи целесообразно привлекать смещенные полиномы Чебышева и, соответственно, удобно нормировать переменные к интервалу [0,1].
Математическая модель оценки надежности сложных технических систем
Одной из первых и простейших моделей являются модели, основанные на использовании функции риска, так называемая модель Джелинского-Моранды, которая основана на следующих предположениях:
Интенсивность обнаружения отказов R (t) пропорциональна текущему количеству дефектов, т.е. изначальному количеству латентных дефектов за вычетом количества дефектов, уже обнаруженных на данный момент.
Все дефекты равновероятны и не зависят друг от друга.
Все дефекты имеют одинаковую степень важности.
Время до следующего отказа распределено экспоненциально.
Исправление дефектов происходит без внесения в СТС новых.
R (t) = const в промежутке между двумя соседними моментами обнаружения дефектов.
Согласно этим предположениям, функция риска имеет вид:
R(t) = K[B - (i -1)] .
Здесь t - это произвольный момент времени обнаружения (i - 1) и i - го дефектов; K - неизвест-
ный коэффициент масштабирования; B - начальное количество оставшихся в СТС дефектов (также неизвестное) . Таким образом, если в течении времени t было обнаружено (i — 1) дефектов, это означает, что в СТС еще остается B - (i — 1) необнаруженных дефектов. Полагая, что
X = ti- ti-^ ‘=1 n
И используя предпосылку 6, а также равенство (2) можно заключить, что все Xi имеют экспонен-
циальное распределение
P(Xi) = exp{-K[B - (i -1)]X,.}
и плотность вероятности отказа, соответственно, равна q(Xi) = K[B - (i - 1)]exp{-K[B - (i -1)]Xi} .
Тогда функцию правдоподобия можно записать как
L( Xi,..., Xn) = n?(X) (5)
i =1
или, переходя к логарифму функции правдоподобия, имеем
ln L(XtXn) = £[ln(*(B - t +1) - K(B - i +1)Xt)] .
(6)
Максимум функции правдоподобия можно найти, используя следующие условия:
Э ln L _ h
эв " h
1
B - і +1
- KX
_ 0 ;
Э ln L
ЭК
_ h
1 - (B - і +1)Xt
K
_ 0 .
(7)
(8)
Из выражения (8 получается оценка максимального правдоподобия для К n n
K_
(9)
h (B -1 + і)Xt (B + i)h Xt - h X
1 1 t_1 t_1
Подставляя выражение (9) в (8), находим нелинейное уравнение для вычисления B - оценки максимального правдоподобия для B
n 1
м B -1 +1
nh X,
t=1
(10)
(В + 1)h Xt - h tXt
t_1 t_1
Это уравнение можно упростить перед тем, как искать его решение, если записать его с использованием следующих обозначений
fn (B + 1) _ gn (B + 1, A) , (11)
где
n
1
fn(m) _ h~~; gn(m, A) _ n ; m _ B +1; A _
t _1 m -1 m - A
h tXi
— t_1
hX
t_1
t-1 L
t_1
n
n
n
t_1
Поскольку имеют смысл лишь целочисленные значения B , функции из выражения (9) можно рассматривать только для целочисленных аргументов. Более того, m >n +1 , поскольку n дефектов СТС уже обнаружено. Таким образом, оценка максимального правдоподобия для B может быть получена с помощью вычисления начальных значений функций fn(m)и gn(m) для m _ n +1, n + 2,... , и анализа разницы
\fn (m) - gn (m)\ .
Поскольку правая и левая части выражения (11) одинаково монотонны, это порождает проблему
единственности решения, а также проблему его существования. Конечное решение B в области B > n существует тогда и только тогда, когда выполняется неравенство
nn
h (t -1)x, h Xt
—------>-і_1- . (12) .
nn
h (t -1)
t_1
В противном случае оценка максимального правдоподобия будет B_¥ . Условие (12) можно переписать в более удобном виде
A > (n +1) / 2 , (13)
где A - то же самое выражение, что и в формуле (11). Необходимо отметить, что A является интегральной характеристикой n выявленных в СТС дефектов за время существования, и представляет (в стратегическом смысле) набор интервалов Xt между проявившимися дефектами.
На наш взгляд, целесообразно не применять оценочные модели теории надежности программного обеспечения, поскольку это значительно усложнит задачу исследования. Для анализа и повышения надежности СТС можно пойти путем декомпозиции и представления СТС в виде совокупности взаимосвязанных модулей. В таком случае целесообразно воспользоваться более простым методом последовательных испытаний и биноминальным законом вероятности для получения оценки случайной величины вероятности
*
безотказной работы СТС рстс . Плотность вероятности безошибочного функционирования СТС будет равна:
f (р ) _ (n -1)! pm (1 - р \n~m
JCTCy-LCTC) ~ . 1 стс\1 1 стс) ,
m!
где n - полное число циклов работы СТС, m - число циклов работы СТС, завершившихся без сбоев [7,8] .
Заключение.
Таким образом, на основе предположения о сходстве статистических характеристик ошибок программного обеспечения и латентных дефектов печатных плат, определяемых на стадии выходного контроля их производства, были получены выражения для определения оценки максимального правдоподобия при условии наличия интервалов между проявившимися явными дефектами, на основе чего можно определять среднее время до появления очередного дефекта СТС.
ЛИТЕРАТУРА
1. Панкратова, Н.Д. Системный анализ в динамике диагностирования сложных технических сис-тем/Н.Д. Панкратова// Системні досліжениня та інформаційні технологіі. 2008. - № 1. - С. 33-49.
2. Юрков, Н.К. Безопасность сложных технических систем/ Вестник Пензенского государственного университета - 2013. - №1. - С. 129-134.
3. Хилман, К. Анализ физики отказов/ Печатный монтаж, - № 5, - 2007, - С. 6-8.
4. Медведев, А.М. Контроль печатных плат по признакам внешнего вида/ Технологии в электронной промышленности, - № 3, - 2005, - С. 34-39.
5. Алгоритм выявления латентных технологических дефектов печатных плат методом оптического контроля/Н.К. Юрков, И. И. Кочегаров, И. В. Ханин, А. В. Лысенко, В. Б. Алмаметов//Известия высших учебных заведений. Поволжский регион. Технические науки. - 2013. - № 3(27). - С. 105-114.
6. Кирьянчиков, В.А. Качество и надежность программного обеспечения/В.А. Кирьянчиков, Э.А. Опалева//Конспект лекций. С.-Петербург. Изд-во ЛЭТИ, - 2002, - 85 с.
7. Юрков, Н. К. Оценка безопасности сложных технических систем/Надежность и качество сложных систем. - 2013, - №1. - С. 11-16.
8. Баранов, Н.А. Управление состоянием готовности системы безопасности к отражению угрозы /Н.А. Баранов, Н.А. Северцев//Труды международного симпозиума Надежность и качество. - 2012. - Т.
1. - С. 8-10.