Риски отказов сложных технических систем

Юрков Николай Кондратьевич

Введение

Современный мир отличается стремительным ростом структурной сложности технических систем, ростом их размерности, усложняющимися условиями эксплуатации, что влечет за собой рост требований по безотказности выполняемых функций. Возрастает роль методов и средств контроля и диагностики как технических средств, так и программного обеспечения.

Рост размерности и структурной сложности сложных технических систем (СТС) опережает возможности существующих методов поддержания их в работоспособном состоянии за счет своевременного обнаружения дефектов. Необходимы разработка новых эффективных моделей для решения задач диагностики СТС, состоящих из нескольких сотен и даже тысяч единиц, автоматизация процедур построения оптимальных стратегий диагностирования состояния и прогнозирования поведения сложных технических систем на длительный период их эксплуатации.

Обеспечение гарантированной безопасности функционирования СТС за счет своевременного и оперативного предотвращения перехода штатных ситуаций в критические, чрезвычайные или аварийные является основой стратегии управления рисками. Стратегия основывается на своевременном обнаружении и устранении причин перехода работоспособного состояния объекта в неработоспособное на основе системного анализа многофакторных рисков нештатных ситуаций, достоверного оценивания ресурсов допустимого риска различных режимов функционирования СТС и прогнозирования основных показателей живучести системы в течение заданного периода его эксплуатации. Необходима разработка модели оценивания функции риска, пригодной для анализа современных сложных технических систем.

Модель должна обеспечивать оперативное и результативное управление системой безопасности с целью своевременного обнаружения нештатной ситуации, оценивании ее степени и уровня риска, а также предоставлять информацию о возможности ее реализации в пределах ресурса допустимого риска [1].

Следует отметить, что в системе управления безопасностью функционирования сложных систем длительного функционирования требования к количественным и качественным показателям исходной информации должны быть ситуационно динамическими и адаптивными, подстраиваемыми под реалии современной реализации, при которой необходима полнота и достоверность изначальной информации.

Физико-химические процессы, приводящие к отказам элементов и систем в целом, очень сложны. Их природа до сих пор не исследована досканально. Число параметров, которые необходимо учитывать при построении математических моделей явлений старения, постепенного изменения свойств изделий и др., очень велико. Необходимы новые подходы к построению системы оценки безопасности сложных систем произвольной структуры, требуется серьезная доработка и развитие методов математической статистики, теории вероятностей, теории эксперимента и др.

Согласно предложенному в [2] информационному критерию безопасности, безопасность достигает своего максимума только в том случае, когда все выполняемые элементарные операции (атомы), из которых состоит процесс, как субъект безопасности, имеют минимальную вероятность сбоя, другими словами находятся под постоянным контролем, что задается выбранной частотой контрольных операций.

Модели латентных дефектов СТС

Многие латентные дефекты (внешне не проявляющиеся, скрытые) не удается выявить традиционными методами визуализации [3]. В ходе эксплуатации СТС необходимо контролировать множество дефектов, физика появления которых разнообразна. При этом следует иметь в виду,

что основную информацию о состоянии объекта контроля человек получает непосредственно зрительным осмотром или путем визуализации различных физических эффектов, выявляющих неоднородности поверхности и объема объекта наблюдения. Большая часть признаков внешнего вида является основополагающей при оценке качества печатных плат. Более того, любой другой вид контроля в случае обнаружения дефекта подтверждается внешним осмотром поверхности или вскрытием печатных плат, позволяющим зрительно убедиться во внешних проявлениях дефектов [4].

Для контроля за наличием как явных, так и латентных дефектов, большинство из которых в процессе эксплуатации неизбежно приводят к отказу аппаратуры, широко применяются традиционные методы анализа отказов в печатных платах, которые включают электрическое тестирование, визуальный контроль и рентгеновский анализ. Эти методы позволяют выявить часть латентных отказов, физика процессов которых формирует визуальные признаки, такие как заужение проводника, трещина или обрыв. Многие из перечисленных дефектов образуются в процессе изготовления печатной платы. Основным требованием к качеству фотошаблонов является недопустимость дефектов в виде пятен, разрывов, проколов и других дефектов на прозрачных и непрозрачных элементах изображения [5].

Контроль параметров печатной платы позволяет выявить соответствие параметров 1111 нормативным, после чего производится поиск мест потенциального сбоя (латентных, или скрытых, дефектов). Обычно это бывают заужения печатных дорожек, трещины, смещения центров отверстий и ряд других параметров. Выявленные латентные дефекты локализуются, классифицируются и фиксируются в базе данных.

Далее для обнаруженных неявных дефектов необходимо создать модели их поведения во времени и определить вероятности безотказной работы печатной платы в течение заданного времени.

Оценка надежности программного обеспечения

Печатные платы, которые играют главенствующую роль в развитии дефектов, в превращении отказов в катастрофические, проходят не менее тщательную проверку (контроль и диагностику), во время которой отбраковываются малейшие отклонения от допусков. При этом в печатных платах наличествуют латентные (скрытые) дефекты, которые проявляют себя случайным образом, и которые, подобно ПО, невозможно выявить на начальной стадии отладки.

Считаем возможным применить теорию надежности, разработанную для программного обеспечения, к оценке надежности сложных СТС, в которых основные дефекты проявляются под действием внешних воздействий, причем, как указывалось выше, характер проявления столь же сложен, что и ошибки ПО.

Надежность программного обеспечения отличается от надежности СТС следующим [6]:

- элементы ПО не стареют;

- число способов контроля ПО значительно больше числа способов контроля аппаратуры;

- в ПО значительно больше объектов для контроля, чем в аппаратуре;

- в ПО гораздо проще вносить исправления и дополнения, чем в аппаратуру, но это трудно делать корректно и безошибочно.

Сложные электронные системы, основанные на перепрограммируемых интегральных схемах, в которых все большая часть ошибок перекладывается на программное обеспечение, все в большей мере удовлетворяют указанным особенностям.

На основе вышесказанного будем определять количество дефектов, которые потенциально могут быть обнаружены на последующих этапах жизненного цикла СТС. Обозначим количество латентных дефектов В.

Пусть Р^) - вероятность того, что ни один латентный дефект не проявит себя (не переродится в явный) на временном интервале [0, t]. Тогда вероятность хотя бы одного явного отказа за этот период будет Q(t) = 1 - Р(^), и плотность вероятности выглядит так:

д(^) = dQ / А = -оР(0 / А.

Введем функцию риска Я^) как условную плотность вероятности отказа печатного узла в момент времени t при условии, что до этого момента отказа не было:

Я^) = Нш^^, t + Дt)] = -[1 / Р^)]АР^) / dt. (1)

Функция риска имеет размерность [1/время] и она будет использована для классификации основных распределений отказов. Распределения с возрастающей функцией риска соответствуют работе сложных СТС, когда статистические характеристики надежности ухудшаются со временем.

Из выражения (1) следует, что dP(t) /P(t) = -R(t)/dt, и, следовательно,lnP(t) = -[ R(t)dt

J 0

или

P(t) = exp|-J0P(t )dt\.

(2)

Равенство (2) позволит определить возможности построения моделей надежности СТС. Интенсивность обнаружения явных дефектов (функция риска) вместе с вероятностью безотказной работы и количеством оставшихся латентных дефектов являются важнейшими показателями надежности СТС.

Для построения модели оценивания риска, применяемой в процедуре диагностирования и анализа режимов функционирования СТС, представим характеристики степени и уровня риска, лежащими в интервале [0,1], т.е. схема модели оценивания риска может быть типа чебышевского полосового фильтра (рис. 1).

Рис. 1. Схема модели оценки функции риска

Здесь интервалы d , d+, Н, а также числа к (количество возвышенностей) задаются (вычисляются) для каждой предметной области отдельно.

Характеристики функциональной зависимости степени и уровня (рис. 1) строим на основе

смещенных полиномов Чебышева Тп*(х), п = 2к, к = 1,2,..., N. Например, /1(х) =| Т2*(х) | имеет вид, представленный на рис. 2.

Рис. 2. Представление смещенных полиномов Чебышева /1(х) =| Т2 (х) | В общем виде используем обобщенный полином

N

fl(x) = X an IT2*(x) |(l), к = l,Nl; Nl = N

п=2к

или

N

fl(x) = X [bn (l + anT*n (x))], к = I Nl; Nl =

N

(З)

(4)

п=2к

В соответствии с рис. 1, иллюстрирующим схемы моделей оценивания функции риска, необходимо построить модели для системы вложенных интервалов, каждый из которых определяет штатный режим функционирования СТС, а также нештатную, X критическую и , чрезвычайную Т и аварийную * ситуации (рис. 3), или ввести характеристики ситуаций риска: риск несущественный, существенный, критический или катастрофический.

Рис. 3. Схема вложенных интервалов возможных ситуаций риска

При формировании модели оценивания функций риска будем выполнять следующие основные принципы:

1. Принцип соответствия модели реальным процессам. Функция риска / (х) возрастает по мере приближения к границам интервала и достигает на них максимумов (рис. 4).

Рис. 4. Модель изменения функции риска

2. Принцип правдоподобия модели реальным процессам. Возрастание степени и уровня риска неравномерно растет к краям интервала. Скорость роста функции риска увеличивается по мере приближения к границам интервала.

3. Принцип адекватности модели реальным процессам. Динамика возрастания функции риска по мере приближения к границам интервала различная под воздействием различных факторов риска.

4. Принцип однотипности или типичности моделей для разнородных процессов риска. Процессы изменения функций риска могут существенно различаться, но структура моделей должны быть одного типа.

Указанным принципам, как показано в работе [1], отвечают обобщенные полиномы, построенные на множестве полиномов Чебышева. Эти полиномы дают возможность обеспечить равномерное приближение на всем заданном интервале изменения переменных, которые нормируются к интервалу [-1,1] или [0,1]. Для рассматриваемой задачи целесообразно привлекать смещенные полиномы Чебышева и соответственно удобно нормировать переменные к интервалу [0,1].

Математическая модель оценки надежности сложных технических систем

Одной из первых и простейших моделей являются модели, основанные на использовании функции риска, так называемая модель Джелинского-Моранды, которая основана на следующих предположениях:

1) интенсивность обнаружения отказов R(t) пропорциональна текущему количеству дефектов, т.е. изначальному количеству латентных дефектов за вычетом количества дефектов, уже обнаруженных на данный момент;

2) все дефекты равновероятны и не зависят друг от друга;

3) все дефекты имеют одинаковую степень важности;

4) время до следующего отказа распределено экспоненциально;

5) исправление дефектов происходит без внесения в СТС новых;

6) R(t) = const в промежутке между двумя соседними моментами обнаружения дефектов. Согласно этим предположениям функция риска имеет вид

Здесь t - это произвольный момент времени обнаружения (/ -1) и /-го дефектов; К - неизвестный коэффициент масштабирования; В - начальное количество оставшихся в СТС дефектов (также неизвестное). Таким образом, если в течение времени t было обнаружено (/ -1) дефектов, это означает, что в СТС еще остается В - (/ -1) необнаруженных дефектов. Полагая, что

и используя предпосылку 6, а также равенство (2), можно заключить, что все Х1 имеют экспоненциальное распределение

Подставляя выражение (9) в (8), находим нелинейное уравнение для вычисления В - оценки максимального правдоподобия для В:

R(t) = K[B - (i -1)].

P(Xt) = exp|-K[B - (i -1)]Xt}

и плотность вероятности отказа соответственно равна

п

(5)

i=1

или, переходя к логарифму функции правдоподобия, имеем

п

lnL(X,,...,Xn) = £[ln(K(B -i +1) -K(B -i +1)Xt)].

(б)

i=1

Максимум функции правдоподобия можно найти, используя следующие условия:

(7)

(S)

Из выражения (S) получается оценка максимального правдоподобия для K:

K =

п

(9)

п

i=1

Это уравнение можно упростить перед тем, как искать его решение, если записать его с использованием следующих обозначений

Поскольку имеют смысл лишь целочисленные значения В, функции из выражения (9) можно рассматривать только для целочисленных аргументов. Более того, т > п +1, поскольку п дефектов СТС уже обнаружено. Таким образом, оценка максимального правдоподобия для В может быть получена с помощью вычисления начальных значений функций /п (т) и gn (т) для

Поскольку правая и левая части выражения (11) одинаково монотонны, это порождает проблему единственности решения, а также проблему его существования. Конечное решение В в области В > п существует тогда и только тогда, когда выполняется неравенство

В противном случае оценка максимального правдоподобия будет В = ^>. Условие (12) можно переписать в более удобном виде

где А - то же самое выражение, что и в формуле (11). Необходимо отметить, что А является интегральной характеристикой п выявленных в СТС дефектов за время существования и представляет (в стратегическом смысле) набор интервалов Х1 между проявившимися дефектами.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

На наш взгляд, целесообразно не применять оценочные модели теории надежности программного обеспечения, поскольку это значительно усложнит задачу исследования. Для анализа и повышения надежности СТС можно пойти путем декомпозиции и представления СТС в виде совокупности взаимосвязанных модулей. В таком случае целесообразно воспользоваться более простым методом последовательных испытаний и биноминальным законом вероятности для получения оценки случайной величины вероятности безотказной работы СТС /Стс. Плотность вероятности безошибочного функционирования СТС будет равна

где п - полное число циклов работы СТС; т - число циклов работы СТС, завершившихся без сбоев.

Таким образом, на основе предположения о сходстве статистических характеристик ошибок программного обеспечения и латентных дефектов печатных плат, определяемых на стадии выходного контроля их производства, были получены выражения для определения оценки максимального правдоподобия при условии наличия интервалов между проявившимися явными дефектами, на основе чего можно определять среднее время до появления очередного дефекта СТС и тем самым повысить безопасность систем [7-11].

/ (В +1) = £п (В +1, А),

(11)

где

п

1=1

т = п +1, п + 2,..., и анализа разницы |/п(т) - gn(ш)\.

п

I(і -1)X, IX,

і=1__________________> _і=1

(12)

п

А > (п +1) / 2,

(13)

Заключение

Список литературы

1. Панкратова, Н. Д. Системный анализ в динамике диагностирования сложных технических систем / Н. Д. Панкратова // Системні досліжениня та інформаційні технології. - 2008. - № 1. - С. 33-49.

2. Юрков, Н. К. Безопасность сложных технических систем / Н. К. Юрков // Вестник Пензенского государственного университета. - 2013. - № 1. - С. 129-134.

3. Хилман, К. Анализ физики отказов / К. Хилман // Печатный монтаж. - 2007. - № 5. - С. 6-8.

4. Медведев, А. М. Контроль печатных плат по признакам внешнего вида / А. М. Медведев // Технологии в электронной промышленности. - 2005. - № 3. - С. 34-39.

5. Алгоритм выявления латентных технологических дефектов печатных плат методом оптического контроля / Н. К. Юрков, И. И. Кочегаров, И. В. Ханин, А. В. Лысенко, В. Б. Алмаметов // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2013. - № 3 (27). - С. 105-114.

6. Кирьянчиков, В. А. Качество и надежность программного обеспечения : конспект лекций / В. А. Кирь-янчиков, Э. А. Опалева. - СПб. : Изд-во ЛЭТИ, 2002. - 85 с.

7. Юрков, Н. К. Обеспечение комплексной адекватности авиационных тренажеров / А. И. Годунов, Б. К. Кемалов, Н. К. Юрков // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2011. - № 3 (9). - С. 15-24.

8. Юрков, Н.К. К проблеме создания системы защиты от внешних и внутренних угроз предприятию / Н. К. Юрков, В. И. Медников // Вестник Пензенского государственного университета. - 2013. - № 2. -С. 90-100.

9. Юрков, Н. К. Методика обеспечения информационной безопасности / Н. К. Юрков, В. В. Шишкин, Н. Ж. Мусин // Надежность и качество сложных систем. - 2013. - № 4. - С. 9-13.

10. Теоретические и методологические основы понятия качества сложных технических систем / А. К. Гришко, В. А. Корж, В. А. Канайкин, А. С. Подсякин // Надежность и качество : тр. Междунар. симп. : в 2 т. / под ред. Н. К. Юркова. - Пенза : Изд-во ПГУ, 2012. - Т. 1. - С. 132-134.

11. Еременко, В. В. Информационное пространство отношений элементов информационной системы управления сложным техническим комплексом / В. В. Еременко // Надежность и качество : тр. Междунар. симп. : в 2 т. / под ред. Н. К. Юркова. - Пенза : Изд-во ПГУ, 2012. - Т. 1. - С. 35-36.

УДК 658.5 Юрков, Н. К.

Риски отказов сложных технических систем / Н. К. Юрков // Надежность и качество сложных систем. - 2014. - № 1(5). - С. 18-24.

Юрков Николай Кондратьевич

доктор технических наук, профессор, заведующий кафедрой, кафедра конструирования и производства радиоаппаратуры,

Пензенский государственный университет (440026, Россия, г. Пенза, ул. Красная, 40)

(8412) 56-43-46

E-mail: [email protected]

Аннотация. Представлен механизм образования латентных дефектов печатных плат, предложена математическая модель развития латентного дефекта в явный на основе функции риска, что позволяет определить среднее время до появления очередного дефекта электронных средств сложных технических систем. Приведена модель функции риска в виде смещенного полинома Чебышева. Доказана справедливость применения методологии расчета надежности программного обеспечения к оценке надежности сложных технических систем длительного функционирования.

Ключевые слова: модель, дефект, надежность, безопасность, риск, диагностика, сложная техническая система.

Yurkov Nikolay Kondrat'evich doctor of technical sciences, professor, head of sub-department of radio equipment design and production,

Penza State University

(440026, 40 Krasnaya street, Penza, Russia)

Abstract. The mechanism of formation of latent defects in printed circuit boards, the mathematical model of the development of a latent defect in the clear on the basis of the risk function, which allows to determine the average time until the next defect electronic means of complex technical systems. A model of the risk function as an offset of the Chebyshev polynomial. Establish the validity of the methodology of calculating the reliability of software for assessing the reliability of complex technical systems, long-term operation.

Key words: model, defect, reliability, safety, risk, diagnosis, complex technical system.

Риски отказов сложных технических систем Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Юрков Николай Кондратьевич

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Юрков Николай Кондратьевич

Текст научной работы на тему «Риски отказов сложных технических систем»