Научная статья на тему 'О диагностируемости компонентов цифровых систем со структурой минимального квазиполного графа размера 7х7 с двумя путями между двумя абонентами'

О диагностируемости компонентов цифровых систем со структурой минимального квазиполного графа размера 7х7 с двумя путями между двумя абонентами Текст научной статьи по специальности «Математика»

CC BY
116
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЦИФРОВАЯ СИСТЕМА / МИНИМАЛЬНЫЙ КВАЗИПОЛНЫЙ ГРАФ РАЗМЕРА 7 7 / АБОНЕНТ / КОММУТАТОР / ЛИНИЯ СВЯЗИ / ДИАГНОСТИРУЕМОСТЬ / DIGITAL SYSTEMS / MINIMAL QUASICOMPLETE GRAPH BY DIMENSION 7Х7 / ABONENT / COMMUTATOR / COMMUNICATION LINE / DIAGNOSABILITY

Аннотация научной статьи по математике, автор научной работы — Ведешенков Виктор Алексеевич, Курако Евгений Александрович, Лебедев Виталий Николаевич

Представлен подход к оцениванию величин диагностируемости компонентов (абонентов, коммутаторов и линий связи) цифровых систем (ЦС) с новой структурой – минимального квазиполного графа размера 7 7 с двумя путями между двумя абонентами. Оценки величин диагностируемости компонентов анализируемых ЦС определены на основе анализа результатов диагностирования различных отказовых ситуаций в системе из 7 абонентов и 7 коммутаторов. Показано, что использованные методы и средства диагностирования гарантируют правильное диагностирование не больше чем двух неисправных абонентов и двух неисправных коммутаторов, или одного неисправного абонента и трех неисправных коммутаторов, или двух неисправных линий связи.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Ведешенков Виктор Алексеевич, Курако Евгений Александрович, Лебедев Виталий Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On diagnosability of components in digital systems with structure of minimal quasicomplete 7х7 graph with 2 paths connecting 2 terminals

An approach is suggested to estimate diagnosability of components (a terminal, a router, a communication line) of digital systems (DS) with the novel structure of minimal quasicomplete graph for 7 terminals and 7 routers with 2 paths between 2 terminals. The analysis of typical failures in the system allows proposing estimated component diagnosability metrics. It is shown that diagnosing techniques and methods used guarantee the correct diagnosis for no more than: two faulty terminals and two faulty routers, or one faulty terminal and three faulty routers, or two broken communication lines

Текст научной работы на тему «О диагностируемости компонентов цифровых систем со структурой минимального квазиполного графа размера 7х7 с двумя путями между двумя абонентами»

УДК 004.942 + 004.272.43 ББК 32.973.202

О ДИАГНОСТИРУЕМОСТИ КОМПОНЕНТОВ

ЦИФРОВЫХ СИСТЕМ СО СТРУКТУРОЙ МИНИМАЛЬНОГО КВАЗИПОЛНОГО ГРАФА РАЗМЕРА 7 х 7 С ДВУМЯ ПУТЯМИ МЕЖДУ ДВУМЯ АБОНЕНТАМИ

Ведешенков В. А.1, Курако Е. А.2, Лебедев В. Н.3

(ФГБУН Институт проблем управления РАН, Москва)

Представлен подход к оцениванию величин диагностируемости компонентов (абонентов, коммутаторов и линий связи) цифровых систем (ЦС) с новой структурой - минимального квазиполного графа размера 7 х 7 с двумя путями между двумя абонентами. Оценки величин диагностируемости компонентов анализируемых ЦС определены на основе анализа результатов диагностирования различных отказовых ситуаций в системе из 7 абонентов и 7 коммутаторов. Показано, что использованные методы и средства диагностирования гарантируют правильное диагностирование не больше чем двух неисправных абонентов и двух неисправных коммутаторов, или одного неисправного абонента и трех неисправных коммутаторов, или двух неисправных линий связи.

Ключевые слова: цифровая система, минимальный квазиполный граф размера 7 х 7, абонент, коммутатор, линия связи, диагностируемость.

1 Виктор Алексеевич Ведешенков, доктор технических наук, старший научный сотрудник ([email protected], Москва, ул. Профсоюзная, д.65, тел. (495) 334-75-90).

2 Евгений Александрович Курако, научный сотрудник ([email protected], Москва, ул. Профсоюзная, д.65, тел. (495) 334-75-90).

3 Виталий Николаевич Лебедев, кандидат технических наук, доцент ([email protected], Москва, ул. Профсоюзная, д.65, тел. (495) 334-92-81).

1. Введение.

Минимальный квазиполный граф образуется на основе однородного двудольного графа, одну долю которого составляют коммутаторы т х т, а другую - т-портовые абоненты. В одной доле имеется N коммутаторов, а в другой - N абонентов. Для минимального квазиполного графа параметры N и т связаны соотношением N = т (т - 1) / а + 1 и не могут быть взяты произвольно. Значение т выбирается минимальным, при котором любые два узла в одной доле связаны а путями длины два через разные узлы в другой доле. Каждый такой путь проходит через один коммутатор, и разные пути проходят через разные коммутаторы [5, 6].

В числе возможных областей применения графов с подобной новой структурой называют отказоустойчивые многомашинные вычислительные системы (МВС) реального времени, где, например, подмножество вершин одной доли представляет совокупность процессорных элементов или вычислительных машин, а подмножество вершин другой доли -коммутаторы [8].

Пример такого графа приведен на рис. 1 для N = 7, т = 4, а = 2.

Цифровыми системами (ЦС) называются модели многомашинных или многопроцессорных вычислительных систем, отражающие необходимые диагностические свойства и параметры анализируемых МВС.

Целью работы является получение оценок величин диагно-стируемости компонентов (абонентов, коммутаторов, линий связи) по результатам однократного диагностирования (без ремонта) ЦС со структурой минимального квазиполного графа размера 7 х 7 с 2 путями между 2 абонентами.

Максимальное число одновременно неисправных и произвольно расположенных компонентов, однозначно диагностируемых по результатам однократного тестирования системы (без ремонта), называется величиной ^ диагностируемости системы [9]. Знание оценок величин диагностируемости компонентов анализируемой системы позволяет оценить достоверность ре-

зультатов, полученных системой диагностирования, а также задавать разумные требования к точности диагностирования на этапе проектирования системы.

Аналитические оценки величин диагностируемости ЦС, построенных с использованием трех типов компонентов, неизвестны. С целью единообразия в приводимых ниже соотношениях и таблице 3 абоненты названы компонентами 1-го типа, коммутаторы - 2-го типа, линии связи - 3-го типа.

Представляется целесообразным для подобных ЦС ввести следующие оценки величин диагностируемости:

¿120 - оценка величин диагностируемости смеси компонентов 1 -го и 2-го типов,

¿ооз - оценка величины диагностируемости компонентов 3-го типа.

Для получения искомых оценок выполним в рассматриваемой ЦС серию процедур диагностирования отказовых ситуаций, включающих неисправные компоненты различных типов и кратности. Сравнение полученного диагноза с составом исходной отказовой ситуации позволит заключить: диагноз является правильным (при совпадении диагноза с составом отказовой ситуации) или нет: состояние некоторых компонентов не идентифицировано. По результатам такого сравнения для выполненной серии процедур диагностирования определим оценки величин диагностируемости - количество компонентов различных типов, для которых независимо от их расположения данная система диагностирования дает гарантированно правильный диагноз.

2. Постановка задачи

Исходная МВС со структурой минимального квазиполного графа представлена диагностическим графом, у которого N вершин одной доли представляют абонентов (процессоры), N вершин другой доли - коммутаторы, причем каждый абонент связан с каждым другим абонентом двумя линиями связи, проходящими через 2 разных коммутатора.

12 3 4 5 6 7

дм

Рис. 1. Схема цифровой системы со структурой минимального квазиполного графа 87,4,2 размера 7 х 7 с двумя путями между двумя абонентами: 1-7 - абоненты; 8-14 - коммутаторы, ДМ - диагностический монитор

Будем считать, что допускаются устойчивые отказы ограниченного числа компонентов: абонентов, коммутаторов и линий связи, причем неисправности компонентов таковы, что прекращают работу тех компонентов, в которых они возникли, и не влияют на работоспособность смежных компонентов.

В диагностировании ЦС участвует исправный диагностический монитор (ДМ), который находится в модуле, внешнем по отношению к диагностируемой ЦС.

Требуется определить оценки величин диагностируемости компонентов (абонентов, коммутаторов, линий связи) по результатам однократного диагностирования (без ремонта) ЦС со структурой минимального квазиполного графа размера 7 х 7 с 2 путями между 2 абонентами.

3. Подход к диагностированию компонентов ЦС со структурой минимального квазиполного графа размера 7 х 7 с 2 путями между 2 абонентами

Для проверки работоспособности компонента с предполагаемым характером неисправности (работа - отказ) со стороны проверяющего модуля достаточно послать к нему запрос, на который проверяемый компонент должен дать ответ в течение заданного интервала времени Дт. Отсутствие ответа в течение интервала Дт является признаком проявления (обнаружения) неисправности компонента.

Использование более сложных моделей неисправности компонентов потребует соответствующего усложнения проверок, необходимых для обнаружения таких неисправностей. Но и в этом случае результатом работы системы диагностирования будет диагноз: номера исправных компонентов и компонентов, подозреваемых в неисправности.

Процесс диагностирования компонентов ЦС включает такие процедуры [1, 3]:

- исполнение исправным модулем функций проверяющего модуля;

- нахождение пути от одного исправного модуля к другому исправному для передачи ему функций проверяющего модуля;

- раскодирование результатов выполненных проверок.

Для реализации этих процедур в ЦС со структурой минимального квазиполного графа размера 7 х 7 с 2 путями между 2 абонентами поступим следующим образом.

Проверяющим модулем т- назначим абонент Л-(/ = 1, ..., 7), а в проверяемую подсистему и^к включим следующие компоненты: коммутатор р абонента Лк, линию связи ¡-к между ними и линию связи ¡-ц соединяющую Л- с р причем к Ф]. Например, для системы 57,4,2 на рис. 1 для реализации одной из проверок абонент 5 будет исполнять функции проверяющего модуля т5, а в проверяемую подсистему будут входить коммутатор 9, абонент 2 и линии связи ¡5-9 и ¡9-2.

Таким образом, индекс (1, к) подсистемы и,,к состоит из номера 1 (/ = 8, ..., 14) проверяемого коммутатора и номера к

(к = 1, ..., 7) проверяемого абонента, а индекс линии связи /,-к (например, линии связи /9-2) состоит из номера 7 коммутатора и номера к абонента, которые она соединяет (в примере - коммутатор 9 и абонент 2). Аналогично формируется индекс линии связи /]4.

Тогда отдельная проверка (тест р-хк) будет выполняться следующим образом. Получив управление в процессе диагностирования, проверяющий абонент Л- передает через коммутатор р, и линии связи /]-7 и /,-к проверяемому абоненту Лк запрос о его состоянии. Исправный абонент Лк передает ответ через коммутатор р, и линии связи /,-к и /-7 проверяющему абоненту Л-, который формирует оценку г,,к := 0; если в течение интервала Лт ответ не придет, то г,,,к := 1.

На основании полученных оценок абонент Л- выбирает исправную подсистему и,*, к*, абоненту Лк* из состава которой передает управление и необходимую информацию для продолжения процесса диагностирования. Здесь следует подчеркнуть, что передача управления исправному абоненту Лк* (из состава проверенной подсистемы и,*, к*) приводит к тому, что следующим проверяющим абонентом не будет назначен абонент, попавший в число подозреваемых в отказе (получивший оценку 1). Вследствие этого в число тестов, на которых диагностируется конкретная отказовая ситуация, не могут попасть тесты, проверяющий абонент которых попал в число подозреваемых в отказе.

В таблице 1 показана информация о составе проверяемых подсистем и,,к и номерах проверяющих их абонентов Л-. В таблице 1 для абонента Л- (/ = 5, 2, ..., 7) записаны номера компонентов и линий связи, входящих в состав подсистем и,1, и, и,2, к2, проверяемых абонентом Л- при исполнении проверок строки 7-1, Т/2, Т-з. (Проверки, относящиеся к одному проверяющему абоненту, в таблице 1 разбиты на три части из-за невозможности размещения в одной строке 6 подсистем, проверяемых одним абонентом.) Отметим, что в клетках строк Т51, ..., Т73 таблицы 1 показаны номера индексов проверяющего абонента и проверяемых подсистем без символов абонента Л, проверяемой подсистемы и и линии связи /.

Таблица 1 Таблица состава проверяемых подсистем

Строки Або- Проверяемые подсистемы и,,к,

тА, нент оценки результатов их проверок г,к

тА, Тз Л- Цг к1 ГЦ, к1 и,2, к2 Г12, к2

Т51 5 (5-9), 9, (9-2), 2 (5-10), 10, (10-6), 6

Т52 5 (5-14), 14, (14-3), 3 (5-9), 9, (9-7), 7

Т53 5 (5-13), 13, (13-4), 4 (5-10), 10, (10-1), 1

Т21 2 (2-8), 8, (8-1), 1 (2-13), 13, (13-5), 5

Т22 2 (2-9), 9, (9-1), 1 (2-12), 12, (12-3), 3

Т23 2 (2-13), 13, (13-6), 6 (2-8), 8, (8-4), 4

Т11 1 (1-10), 10, (10-3), 3 (1-9), 9, (9-7), 7

Т12 1 (1-8), 8, (8-4), 4 (1-9), 9, (9-5), 5

Т13 1 (1-10), 10, (10-6), 6 (1-11), 11, (11-7), 7

Т31 3 (3-12), 12, (12-6), 6 (3-14), 14, (14-4), 4

Т32 3 (3-10), 10, (10-5), 5 (3-8), 8, (8-1), 1

Т33 3 (3-14), 14, (14-7), 7 (3-8), 8, (8-2), 2

Тб1 6 (6-13), 13, (13-4), 4 (6-11), 11, (11-1), 1

Тб2 6 (6-12), 12, (12-7), 7 (6-12), 12, (12-2), 2

Тб3 6 (6-10), 10, (10-3), 3 (6-13), 13, (13-5), 5

Строки Або- Проверяемые подсистемы и,,к,

Т-1, нент оценки результатов их проверок г,,к

7-2, 7з Л- и,1, к1 Гц, к1 и,2, к2 Г72, к2

Т41 4 (4-14), 14, (14-7), 7 (4-8), 8, (8-3), 3

Т42 4 (4-13), 13, (13-2), 2 (4-11), 11, (11-6), 6

Т43 4 (4-11), 11, (11-1), 1 (4-14), 14, (14-5), 5

Т71 7 (7-14), 14, (14-5), 5 (7-12), 12, (12-2), 2

Т72 7 (7-11), 11, (11-6), 6 (7-11), 11, (11-4), 4

Т73 7 (7-9), 9, (9-2), 2 (7-12), 12, (12-3), 3

Отметим также, что в рассматриваемой ЦС линии связи являются двунаправленными. В таблице 1 показаны индексы линий связи того направления, которое нужно для реализации данной проверки. Для обеспечения полноты проверки линий связи таблицу 1 нужно было бы расширить, добавив проверки с инверсным направлением линий связи, это удвоило бы размерность таблицы 1 и трудоемкость последующих операций. Поскольку одной из целей данной работы является получение оценок величин диагностируемости компонентов рассматриваемой ЦС, то для определения порядка этих оценок можно ограничиться анализом таблицы меньшей размерности (с общим номером для двунаправленных линий связи).

Как видно из таблицы 1, каждый абонент Л- проверяет других абонентов 6 раз в составе различных подсистем, что в 6 раз больше, чем нужно для контроля работоспособности. Но приведенные 42 проверки необходимы для исключения исправного коммутатора из числа подозреваемых в отказе при неисправности двух абонентов, которые он соединяет.

В целом диагностирование состояния компонентов ЦС со структурой минимального квазиполного графа размера 7 х 7 с 2 путями между 2 абонентами организовано следующим образом.

По сигналу об ошибке, полученному от средств функционального контроля, диагностический монитор (ДМ) выдает запрос о состоянии абоненту Л-1, выбранному заранее (например, абоненту 5 - первому абоненту в таблице 1). Если в пределах интервала Дт ДМ не получает ответа на свой запрос, он отправляет запрос следующему абоненту Л-2 (например, абоненту 2 в таблице 1).

После получения ответа в пределах интервала Дт ДМ выдает этому же абоненту Л-1 (Л#) команду на начало диагностических процедур.

По команде ДМ о начале диагностирования начальный абонент Л-1 (в примере - абонент 5) выполнит следующие действия (для упрощения в последующих двух абзацах вместо символьных индексов используются цифровые индексы из таблицы 1):

- образует промежуточную таблицу РТ5, перепишет в нее из таблицы 1 строки Т51, Т52, Т53, найдет в них индексы (9, 2), (10, 6), (14, 3), (9, 7), (13, 4), (10, 1) проверяемых подсистем С/9,2, ию,6, С/14,3, С/9,7, С/13,4, С/10,1, передаст абоненту 2 (6, 3, 7, 4, 1) запрос о состоянии соответствующей подсистемы, ответ на который абонент 2 (6, 3, 7, 4, 1) должен вернуть абоненту 5.

- В соответствии с полученными и неполученными ответами абонент 5 формирует оценки проверенных подсистем, записывает их в соответствующие клетки строк Т51, Т52, Т53, выбирает среди них исправную подсистему С/*, к*, (с оценкой 0), абоненту Л к* которой передает строки Т51, Т52, Т53 с оценками и управление для продолжения процесса диагностирования.

Абонент Лк* (и каждый последующий исправный абонент из проверенных подсистем) выполнит действия, аналогичные действиям абонента 5, и передаст таблицу РТ5 с накопленными оценками и управление продолжением процесса диагностирования следующему исправному абоненту.

Наконец, абонент Лк**, выполнив функции проверяющего и не обнаружив в строках таблицы РТ5 ни одного исправного абонента, не исполнявшего функций проверяющего, закончит процесс диагностирования и перейдет к раскодированию полученных оценок проверок. Результаты раскодирования абонент Лк** через ДМ передает обслуживающему персоналу для проведения восстановительных работ (замены исправными компонентов, подозреваемых в неисправности).

Цель раскодирования - преобразовать полученные оценки проверок в списки исправных компонентов и компонентов, подозреваемых в неисправности.

Для раскодирования результатов проверок и формирования диагноза воспользуемся алгебро-логическим методом, основы которого опубликованы в [2, 4, 7].

А. Обозначим переменной тп исправное состояние компонента с номером п, а переменной тп неисправное состояние компонента с номером п, т.е. для этих переменных справедливы логические соотношения:

- компонент п исправен - тп = 1, тп = 0;

- компонент п неисправен - тп = 0, тп = 1.

Функцию технического состояния компонентов с номерами п1, п2, ..., пк:

- при нулевом результате их проверки тестом г- (обозначим оценку Г ) запишем так:

= ти1 л тп2 ... л тл (все компоненты исправны);

- при единичном результате их проверки тестом г- (обозначим оценку г-) запишем так:

¥] = тп1 л тп2 л ... л тпк (хотя бы один из компонентов неисправен).

Б. Предлагаемый метод раскодирования результатов тестирования ЦС на множестве проверок р\,р2, ...,рк состоит из следующих этапов.

1. Для каждого результата (г-) записать функцию ^ №),

в которую подставить номера компонентов, взятые из состава проверки р-.

2. Построить функцию Ф как конъюнкцию всех функций ^ .

3. Построить функцию Ф как конъюнкцию всех функций

4. Вместо нахождения конъюнкции Ф л Ф упростить отдельные дизъюнктивные члены функции Ф, вычеркнув те переменные, для которых в функции Ф есть одноименные переменные с отрицанием (с чертой сверху).

5. Произвести конъюнктивное перемножение оставшихся членов функций выполнить поглощение членов большей длины членами меньшей длины. При этом будут полезны известные формулы:

т„ а //;„ = 0. /7;„ V ///,. = 1 /»,.• (/»,. V тр) = тп

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

тп л тп = 0, тп V тп = 1, тп л (тп V тр ) = тп .

6. Выделить из полученного логического выражения члены минимальной длины. Они определяют диагноз - подмножество компонентов, подозреваемых в неисправности по результатам выполненных проверок.

4. Пример

Предположим, что из-за большого перерыва между циклами контроля в рассматриваемой ЦС накопились отказы абонентов 3, 6, коммутатора 8 и двух линий связи (9-2) и (5-9).

После подтверждения исправности абонента 5 по сигналу ДМ о начале диагностирования начальный абонент 5 выполнит следующие действия:

- образует промежуточную таблицу РТ5, перепишет в нее из таблицы 1 строки Т51, Т52, Т53, найдет в них индексы (9-2), (10-6), (14, 3), (9, 7), (13, 4), (10, 1) проверяемых подсистем С/9,2, С/ю,6, С/14,3, С/9,7, С/13,4, С/10,1, передаст абоненту 2 (6, 3, 7, 4, 1) запрос о состоянии своей подсистемы, ответ на который абонент 2 (6, 3, 7, 4, 1) должен вернуть абоненту 5.

В соответствии с полученными ответами абонент 5 формирует оценки Г9,2 = 1, Г10,6 = 1, Г14,3 = 1, Г9,7 = 1, Г 13,4 = 0, Г10,1 = 0, записывает их в соответствующие клетки строк Т51, Т52, Т53 (для

сокращения числа таблиц будем записывать результаты проверок, находящиеся в разных модулях, в общую таблицу 2), анализирует сформированные оценки: так как среди этих оценок есть нулевые, то передает абоненту 4 подсистемы Ц^д таблицу РТ5 (со строками Т51, Т52, Т53) и управление для продолжения процесса диагностирования. (Следует отметить, что в строке Т53 и в последующих полужирным шрифтом в результатах проверки выделен 0 того исправного абонента, которому передается управление продолжением процесса диагностирования.)

Абонент 4 выполнит следующие действия:

- в полученную таблицу РТ5 перепишет из таблицы 1 строки Тп, Т42, Т43, найдет в ней индексы (13, 2), (11, 6), (11, 1), (14, 5), (14, 5), (12, 2) проверяемых подсистем, передаст в эти подсистемы запрос об их состоянии, ответ на который абонент 2 (6, 1, 5, 5, 2) должен вернуть абоненту 4;

- абонент 4 сформирует соответствующие оценки (показаны в строках Т,«, Т42, Т43) и абоненту с нулевой оценкой (абоненту 2) передаст таблицу РТ5 и управление процессом диагностирования.

Получив управление, абонент 2 выполнит действия, аналогичные действиям абонентов 5 и 4. Так как только для подсистемы (13, 5) сформирована нулевая оценка и абонент 5 уже выполнял функции проверяющего модуля, то абонент 2 должен найти среди ранее проверенных другого абонента для выполнения этих функций. Таким модулем является абонент 1 (отмечен 0 в строке Т42 таблицы 2). Поэтому абонент 2 через коммутатор 13 передаст таблицу РТ5 и управление процессом диагностирования абоненту 4, который через коммутатор 11 передаст таблицу РТ5 и управление процессом диагностирования абоненту 1.

Получив управление, абонент 1, а затем абонент 7 выполнят действия, аналогичные действиям абонентов 5 и 4, сформированные оценки запишут в строки Тп, Т^, Т^ и Тп, Т72, Т73 таблицы 2 соответственно.

После выполнения своих проверок абонент 7 по записям в таблице 2 не обнаружит исправных абонентов, не выполнявших функций проверяющих, закончит процесс диагностирования и

перейдет к раскодированию полученных оценок проверок. Результаты раскодирования абонент 7 через ДМ передаст обслуживающему персоналу для проведения восстановительных работ (замены исправными компонентов, подозреваемых в неисправности).

Таблица 2. Информация к примеру

Стро ки Ть ТА, Тз Проверяющий абонент А Проверяемые подсистемы Ц-, к, оценки результатов их проверок гг-, к

и,1,к1 ГЦ, к1 и,2, к2 Г12, к2

Таблица РТ5

Т51 5 (5-9), 9, (9-2), 2 11 (5-10), 10, (10-6), б 12

Т52 5 (5-14), 14, (14-3), 3 13 (5-9), 9, (9-7), 7 14

Т53 5 (5-13), 13, (13-4), 4 01 (5-10), 10, (10-1), 1 02

Т41 4 (4-13), 13, (13-2), 2 03 (4-11), 11, (11-6), 6 15

Т42 4 (4-11), 11, (11-1), 1 04 (4-14), 14, (14-5), 5 05

Т43 4 (7-14), 14, (14-5), 5 Об (7-12), 12, (12-2), 2 07

Т21 2 (2-8), 8, (8-1), 1 1б (2-13), 13, (13-5), 5 08

Т22 2 (2-9), 9, (9-1), 1 17 (2-12), 12, (12-3), 3 18

Стро ки Т'Ь тА, Тз Проверяющий абонент 4 Проверяемые подсистемы СД к, оценки результатов их проверок г,, к

и,1,к1 ГЦ, к1 и,2, к2 Г12, к2

Таблица РТ5

Т23 2 (2-13), 13, (13-6), 6 19 (2-8), 8, (8-4), 4 110

Т11 1 (1-10), 10, (10-3), 3 111 (1-9), 9, (9-7), 7 09

Т12 1 (1-8), 8, (8-4), 4 112 (1-9), 9, (9-5), 5 113

Т13 1 (1-10), 10, (10-6), 6 114 (1-11), 11, (11-7), 7 010

Т71 7 (7-14), 14, (14-5), 5 011 (7-12), 12, (12-2), 2 О12

Т72 7 (7-11), 11, (11-6), 6 115 (7-11), 11, (11-4), 4 013

Т73 7 (7-9), 9, (9-2), 2 116 (7-12), 12, (12-3), 3 117

Применим алгебро-логический метод для раскодирования результатов проверок, показанных в таблице РТ5 (таблица 2). (С целью сокращения объема текста некоторые из производимых операций будем опускать.)

В таблице 2 пятнадцать строк, содержащих 30 проверок: результаты 13 из них получили оценку 0 (проверенные подсистемы исправны), а 17 проверок получили оценку 1 (некоторые из компонентов этих подсистем неисправны). Для того чтобы в последующем упростить ссылки на эти проверки и их оценки, в клетках с оценками таблицы 2 в качестве нижнего индекса

указан порядковый номер оценки, причем нулевые и единичные оценки подсчитаны отдельно.

Для некоторых из этих проверок приведем функции — и где в качестве индекса] указан порядковый номер оценки:

—1 4-13 ^ Аз-4 ^ С13 ^ а4 ; —2 4-10 ^ ^10-1 ^ С10 ^ а1 ;

-3 = 4-13 • 4з-2 • С13 • а2 ; -4 = 4-11 • Ан • С11 • а1 ;

^12 4-12 ^ /12-2 ^ С12 ^ а2 ; ^13 4-11 ^ 1-4 ^ С11 ^ й4 ; - = /5-9 V /9-2 V с9 V а2; — = 4-ю V ^ю-6 V с10 V а6; -з = /5-14 V /14-3 V с14 V аз; — = /5_9 V /9-7 V С9 V 07;

16 /7-9 V /9-2 V С9 V а2 ; 17 /7-12 V /12-3 V С12 V а3 *

Для построения функции Ф нужно образовать конъюнкцию 13 функций — Ниже показана часть полученной функции Ф, содержащая переменные абонентов, коммутаторов и тех линий связи, которые оказались полезными для последующего упрощения функции Ф:

Ф = - а1 • а2 • а4 • а5 • а7 • а9 • аю • ац • а12 • а1з • а14 •

(1) /5-10 ^ /14-5 ^ /11-7 ^ 4-7 ^ /1-9 ^ /2-13 ^ /4-11 ^ /10-1 ^ /7-12 ^ /2-12 (отсутствуют Оз, Об, О8)*

После построения функции Ф как конъюнкции 17 функций (часть которых показана выше), проведено упрощение полученного выражения: вычеркнуты те переменные абонентов, коммутаторов и линий связи, для которых в функции Ф есть одноименные переменные с отрицанием, проведено поглощение членов большей длины членами меньшей длины. Ниже показана часть преобразованной функции Ф, содержащая несколько членов наименьшей и близкой к ней длины. Ф = ¡9-2 • ¡5-9 • Оз • Об • С8 V

(2) V ¡9-2 • ¡5-9 • Оз • Об • (¡2-8 • ¡1-8 V ¡2-8 • ¡4-8 V ¡1-8 • ¡4-8)

V 19-2 • 15-9 • aз • С 8 • 1x0-6 • 1x1-6 • 1x3—6 V

V ^-2 • l5-9 • a6 • C8 • 1x0-3 • 1x2-3 • 1x4-3 .

Поскольку в функции Ф только один член минимальной длины (показан первым), то возможно, что полученный диагноз является правильным: подозреваются в неисправности абоненты 3 и 6, коммутатор 8, линии связи (9—2) и (5—9) (в данном случае он совпадает с составом отказовой ситуации, рассмотренной в начале примера). Вместе с тем этот вариант диагноза не удовлетворяет показанным ниже оценкам величин диагностируемое™ из соотношений (3), т.е. достоверность полученного диагноза не гарантируется.

У обслуживающего персонала есть два варианта действий:

— поверить полученному диагнозу: заменить исправными все компоненты, подозреваемые в неисправности, повторить диагностику для подтверждения работоспособности восстановленной системы;

— для повышения достоверности диагноза заменить исправными часть компонентов, подозреваемых в неисправности, и повторить диагностирование частично восстановленной системы. В качестве заменяемых целесообразно брать компоненты, входящие во все или большинство вариантов. В данном примере целесообразно заменить линии связи 19-2 и ^-9 (входят во все варианты).

5. Подход к оцениванию величин диагностируемости

Известно следующее

Определение 1. Система 5 из п модулей является однократно диагностируемой относительно ^ отказов, если все отказавшие модули можно идентифицировать по результатам раскодирования результатов диагностирования при условии, что число отказавших модулей не превышает ^ [9].

В дальнейшем будет полезно определение 2, противоположное определению 1.

Определение 2. Система 5 из п модулей не является однократно диагностируемой относительно ^ отказов, если диагноз

хотя бы одной отказовой ситуации мощностью ^ является неполным, т.е. состояние некоторых компонентов не идентифицировано, или неоднозначным.

Представленные ниже оценки величин диагностируемости компонентов (¿100, ¿020, ¿003, ¿120) ЦС со структурой минимального квазиполного графа размера 7 х 7 с 2 путями между абонентами получены на основе анализа серии результатов диагностирования типичных отказовых ситуаций. Для диагностирования использован подход к диагностированию компонентов рассматриваемой ЦС, приведенный в разделе 3.

В таблице 3 показаны результаты диагностирования отка-зовых ситуаций различной кратности рассматриваемой системы. В столбцах д1, ^2, ^3 таблицы 3 приведены числа неисправных компонентов 1-го, 2-го и 3-го типов в отказовой ситуации, номер которой показан в левом столбце; в столбце, озаглавленном «Неисправные компоненты», приведены номера отказавших компонентов; в столбце «Диагноз» — номера компонентов, подозреваемых в отказе при дешифрации результатов диагностирования этой отказовой ситуации, и комментарии. В клетках на пересечении столбца «Диагноз» и строк 20, 23 (с неоднозначным диагнозом) знак V использован для разделения возможных результатов диагноза данной отказовой ситуации.

1) В строках 8—24 таблицы 3 показаны примеры некоторых отказовых ситуаций различной мощности для которых получен неполный или неоднозначный диагноз.

Диагноз отказовых ситуаций строк 8—11, 13 отнесен к неполному, так как в соответствующих отказовых ситуациях остались не идентифицированными технические состояния компонентов 13, 13, 10, 10, 4 и 8, что отмечено знаком тильда (~ ) над этими номерами.

Поясним результаты диагноза для ситуации 8. Структура рассматриваемой ЦС такова, что для проверки любого коммутатора нужно два исправных абонента из четырех, присоединенных к данному коммутатору. К коммутатору 13 присоединены абоненты 2, 4, 5, 6, при неисправности трех абонентов (в отказовой ситуации 8 —это 2, 4. 6) для коммутатора 13 нельзя найти ни одной проверки с двумя исправными абонентами из этих

четырех. При диагностировании ситуации 8 коммутатор 13 тестируется в составе подсистемы [(5-13), 13, (13-4), 4] (строка T53 в таблице 1) вместе с неисправным абонентом 4; по результатам тестирования эта подсистема получает оценку 1. При последующем раскодировании оценок тестирования коммутатор 13 исключается из числа подозреваемых в неисправности, так как входящий в эту проверяемую подсистему абонент 4 получает также единичные оценки в составе подсистем, где коммутаторы исправны.

Поэтому коммутатор 13 остается не идентифицированным, что отмечено тильдой в клетке «Диагноз» для ситуации 8. В строке 9 приведены результаты диагностирования для ситуации, отличающейся от ситуации 8 добавлением неисправного коммутатора 13. Одинаковый диагноз для отказовых ситуаций 8 и 9 подтверждает факт влияния трех неисправных абонентов на отсутствие идентификации состояния соответствующего коммутатора (коммутатора 13 в примерах ситуаций 8 и 9).

Аналогичный диагноз (не идентифицирован коммутатор 10) показан для отказовых ситуаций 10 и 11, включающих 3 неисправных абонента: 1, 3, 6.

Таблица 3. Таблица результатов диагностирования

NN п/п qi q2 q3 Неисправные компоненты Диагноз

1 1 1 0 7, 14 7, 14

2 2 0 0 4, 6 4, 6

3 2 1 0 1, 6, 11 1, 6, 11

4 0 2 0 8, 13 8, 13

5 0 3 0 8, 12, 14 8, 12, 14

6 1 2 0 4, 8, 13 4, 8, 13

7 2 2 0 4, 6, 10, 12 4, 6, 10, 12

8 3 0 0 2, 4, 6 2, 4, 6 13 - неполный

9 3 1 0 2, 4, 6, 13 2, 4, 6 13 - неполный

NN п/п Яг Я2 Я3 Неисправные компоненты Диагноз

10 3 1 0 1, 3, 6, 11 1, 3, 6, 11 10 - неполный

11 3 2 0 1, 3, 6, 11, 14 1, 3, 6, 11, 14 10, - неполный

12 1 3 0 2, 10, 13, 14 2, 10, 13, 14

13 2 3 0 1, 2, 11, 13, 14 1, 2, 11, 13, 14 4,8- неполный

14 2 3 0 1, 2, 10, 12, 14 1,2, 10, 12, 14

15 0 4 0 8, 11, 13, 14 8 • 11 • 13 • 14 4 - неполный

16 0 1 1 9, (9-1) 9 9 -1 - неполный

17 0 1 1 9, (14-4) 9• (14-4)

18 1 1 1 1, 9, (8-1) 1 • 9 8 -1 - неполный

19 1 1 1 1, 9, (14-4) 1 • 9• (14-4)

20 2 1 2 1, 7, 9, (8-1), (14-4) 1 • 7 • 9 • (14-4) V 1*7*(9-2)*(14-4) V 1*7*(9-5)*(14-4) неоднозначный, 8 -1 - неполный

21 2 1 2 3, 6, 8, (9-2), (9-5) 3*6*8*(9-2)*(9-5)

22 0 0 2 (9-1), (9-2) (9-1)• (9-2)

23 0 0 3 (9-1), (9-2), (9-7) 9 V (9-1).(9-2).(9-7) V (9-1)*(9-2)*(9-5) V (9-1)*(9-5)*(9-7) V (9-2)*(9-5)*(9-7) неоднозначный

24 0 0 3 (2-8), (2-9), (2-13) (2-8)*(2-9)*(2-13)

Подобное положение имеет место, если в отказовую ситуацию входит 4 неисправных коммутатора: из-за особенностей структуры эта четверка блокирует пути к одному из абонентов и исключает возможность его тестирования. Пример — отказовая ситуация 15, в которой коммутаторы 8, 11, 13, 14 блокируют возможность идентификации абонента 4.

Различие диагноза для ситуаций 13 и 14 подтверждает то, что диагноз зависит не только от количества неисправных компонентов, но также от номеров этих компонентов (их взаимного расположения).

2) В процессе проведенных сеансов диагностирования замечено, что для исключения исправного коммутатора из числа подозреваемых при неисправности двух абонентов, которые он соединяет, нужна конкретная проверка, включающая данный коммутатор и 2 исправных абонента из тех четырех, которые присоединены к данному коммутатору. Из четырех абонентов, присоединенных к одному коммутатору, можно образовать 6 различных пар абонентов, каждая из которых требует проверки, отличной от других.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таким образом, диагностический тест, различающий каждый из 7 исправных коммутаторов от двух неисправных абонентов, которые он соединяет, для данной системы должен включать Р = 7 х 6 = 42 различные проверки. Возвращаясь к параметрам структуры, значение Р можно записать так:

Р = N • т(т — 1) / 2 = 7 Ч • 3 / 2 = 42.

Эти 42 различные проверки участвуют при тестировании проверяемых подсистем, показанных в таблице 1.

3) В строках 16—24 приведены отказовые ситуации, в состав которых входит различное количество неисправных линий связи (компонентов 3-го типа).

Хорошо известен факт: последовательно включенные неисправные модуль и линию связи нельзя разделить по результатам одной проверки. В таких ситуациях предполагается, что более вероятна неисправность модуля, в диагноз вставляется номер модуля, который «маскирует» прилегающую неисправную линию связи. С учетом этой гипотезы получен диагноз для

ситуаций 16, 18, 20. В ситуациях 17, 19, 21 неисправные линии связи не прилегают ни к одному из неисправных модулей: результат диагностирования правильный (и полный).

Для уточнения диагноза в подобных ситуациях нужны дополнительные проверки, в которых участвует только один из компонентов проверяемой ситуации.

Если отказовая ситуация включает только неисправные линии связи, то при двух неисправных линиях (строка 22) диагноз правильный (и полный), а при трех неисправных линиях диагноз может быть как правильным (строка 24), так и неоднозначным (строка 23) - в зависимости от расположения этих компонентов. В ситуации 23 три неисправные линии примыкают к общему коммутатору 9. Диагноз этой ситуации с учетом приведенной ранее гипотезы (о приоритете отказа модуля по сравнению с отказом линии связи) оказывается неоднозначным. Диагноз содержит один член длины 1 (коммутатор 9) и 4 члена длины 3: различные сочетания трех из четырех линий связи, примыкающих к коммутатору 9, включая исходную отказовую ситуацию.

Как отмечалось, чтобы различить исправный коммутатор от неисправной линии связи, нужна проверка, включающая данный коммутатор и две исправные линии связи, подходящие к нему. В рассматриваемой ситуации к коммутатору 9 прилегают три неисправные линии связи, а одной оставшейся исправной линии связи недостаточно для организации искомой проверки.

В отличие от проверок коммутатора для проверки абонента с получением правильного диагноза достаточно одной исправной линии, что имеет место в ситуации 24*

4) На основе анализа данных таблицы 3 можно заключить, что достоверный диагноз отказовых ситуаций в ЦС со структурой минимального квазиполного графа размера 7 х 7 на выбранной системе тестов гарантирован:

- для ситуаций, содержащих неисправные компоненты 1-го и 2-го типов;

- для ситуаций, содержащих только неисправные компоненты 3-го типа;

причем и в том, и другом случаях количество неисправных компонентов должно удовлетворять следующим соотношениям:

tu0l = (q1 < t1 = 2; q2 < ti = 2; q3 = 0);

(3) t1202 = (q1 < t1 = 1; q2 < t2 = 3; q3 = 0);

t003 = (q1 = q2 =0; q3 < t3 = 2).

(Отказовые ситуации, подтверждающие эти цифры, показаны в строках 7, 12, 22 таблицы 3.)

Сравнение количеств компонентов первого (q0, второго (q2) и третьего (q3) типов в смеси компонентов, подозреваемых в отказе по результатам диагностирования, с оценками из (3) позволяет оценить достоверность полученных результатов:

- если количества компонентов, подозреваемых в отказе, не превышают соответствующих оценок, то полученный диагноз является правильным;

- если же хотя бы для одного из компонентов количество подозреваемых в отказе превышает соответствующую оценку, то возможно, что диагноз неправилен, нужны дополнительные проверки для его уточнения.

Очевидные и достаточно эффективные действия - замена исправными части компонентов, подозреваемых в неисправности в полученном диагнозе. К вопросу о том, в каком количестве и какие именно компоненты нужно заменить в первую очередь, возможны различные подходы. Первое, что приходит в голову, - заменить компоненты, входящие в состав члена наименьшей длины в полученных вариантах диагноза. Но варианты диагноза отказовой ситуации 23 опровергают правильность этого соображения, если использовать только его.

Диагноз для ситуации 23 содержит один член длины 1 (коммутатор 9) и 4 члена длины 3: различные сочетания трех из четырех линий связи, примыкающих к коммутатору 9, включая исходную отказовую ситуацию). Понятно, что в этом случае замена на исправный коммутатора 9 и повторный запуск системы диагностирования приведет к тем же вариантам диагноза.

Зная, что подобный диагноз является характерным для отказа трех линий связи, примыкающих к одному (общему) коммутатору, напрашивается другой вариант: заменить на исправные 2 линии связи, например, (9-5) и (9-7). Последующий запуск системы диагностирования даст единственный вариант диагноза: отказали линии связи (9-1) и (9-2). Этот диагноз является правильным и

достоверным, что подтверждают записи для отказовой ситуации 22 в таблице 3 и соотношение Ц3 ^ ^003 = 2 из (3)*

6. Заключение.

Представлен подход к оцениванию величин диагностируе-мости компонентов (абонентов, коммутаторов и линий связи) цифровых систем (ЦС) с новой структурой - минимального квазиполного графа размера 7 х 7 с 2 путями между 2 абонентами. Оценки величин диагностируемости компонентов анализируемых ЦС установлены на основе анализа серии результатов диагностирования отказовых ситуаций различной кратности в системе из 7 абонентов и 7 коммутаторов.

Как показал анализ, оценки величин диагностируемости компонентов анализируемых ЦС зависят от ряда факторов:

- структурных особенностей анализируемой ЦС, в частности, от параметра т - числа портов абонентов;

- полноты диагностического теста относительно числа и видов обнаруживаемых неисправных компонентов;

- выбранного метода диагностирования;

- выбранного метода раскодирования результатов выполненных проверок.

Установлено, что выбранные (и показанные в тексте) таблица проверок, методы диагностирования и раскодирования обеспечивают в рассматриваемой ЦС достоверное правильное однократное (без ремонта) диагностирование не больше:

- 2-х неисправных абонентов и 2-х неисправных коммутаторов, или

- 1-го неисправного абонента и 3-х неисправных коммутаторов, или

- 2-х неисправных линий связи.

Приведенные величины оценок определены для «вредных» (как правило, смежных по взаимному расположению) неисправностей различных компонентов. Это не означает, что не могут быть получены правильные диагнозы при более разбросанном размещении неисправных компонентов по структуре ЦС.

Приведен пример диагностирования кратного отказа двух

абонентов, коммутатора и двух линий связи.

Литература

1. ВЕДЕШЕНКОВ В. А., КУРАКО Е.А., ЛЕБЕДЕВ ВН.

О диагностировании цифровых систем со структурой минимального квазиполного графа размера 7 х 7 // Проблемы управления. — 2014. — №6. — С. 68—76.

2. ВЕДЕШЕНКОВ В.А. Алгебро-логический метод дешифрации результатов тестирования цифровых систем // Сборник научных трудов «Международной научно-практической конференции «Актуальные вопросы образования и науки». Тамбов: ООО «Консалтинговая компания Юком», 2014, Часть 2. — С. 33—36.

3. ВЕДЕШЕНКОВ В.А. Организация диагностирования цифровых систем со структурой симметричного двудольного графа // Проблемы управления. — 2009. — №6. — С. 59—67.

4. ВЕДЕШЕНКОВ В.А., НЕСТЕРОВ А.М. О двух методах дешифрации результатов диагностирования цифровых систем // Электронное моделирование. — 1981. — Т. 3, №2. — С.53—58.

5. КАРАВАЙ М.Ф., ПОДЛАЗОВ В С. Распределенный полный коммутатор как «идеальная» системная сеть для многопроцессорных вычислительных систем // Управление большими системами. — 2011. — №34. — С. 92—116.

6. КАРАВАЙ М.Ф., ПАРХОМЕНКО П.П., ПОДЛАЗОВ В С. Комбинаторные методы построения двудольных однородных минимальных квазиполных графов (симметричных блок-схем) // Автоматика и телемеханика. — 2009. —№2. — С. 153—170.

7. ЛОБАНОВ А.В. Обнаружение и идентификация неисправностей в распределенных управляющих вычислительных системах с программно-управляемой сбое - и отказоустойчивостью // Автоматика и телемеханика. — 1998. — №1. — С. 155—164.

8. ALVERSON R., ROWETH D., KAPLAN L. Cray XC® Series Network [Электронный ресурс] - URL: http://www.cray.com/Assets/PDF/products/xc/CrayXC30Netwo rking.pdf. (дата обращения 18.11.2015)

9. PREPARATA F.P., METZE G., CHIEN R.T. On the connection assignment problem of diagnosable systems // IEEE Trans. Electr. Comput. - 1967. -Vol. 16, №6. - P. 848-854.

ON DIAGNOSABILITY OF COMPONENTS IN DIGITAL SYSTEMS WITH STRUCTURE OF MINIMAL QUASICOMPLETE 7x7 GRAPH WITH 2 PATHS CONNECTING 2 TERMINALS

Victor Vedeshenkov, Institute of Control Sciences of RAS, Moscow, Doctor of Science, senior researcher associate (Moscow, Profsoyuznaya st., 65, [email protected]).

Eugene Kurako, Institute of Control Sciences of RAS, Moscow, researcher associate (Moscow, Profsoyuznaya st., 65, [email protected]). Vitaly Lebedev, Institute of Control Sciences of RAS, Moscow, Cand.Sc., associate professor (Moscow, Profsoyuznaya st., 65, [email protected]).

Abstract: An approach is suggested to estimate diagnosability of components (a terminal, a router, a communication line) of digital systems (DS) with the novel structure of minimal quasicomplete graph for 7 terminals and 7 routers with 2 paths between 2 terminals. The analysis of typical failures in the system allows proposing estimated component diagnosability metrics. It is shown that diagnosing techniques and methods used guarantee the correct diagnosis for no more than: two faulty terminals and two faulty routers, or one faulty terminal and three faulty routers, or two broken communication lines.

Keywords: digital systems, minimal quasicomplete graph by dimension 7x7, abonent, commutator, communication line, diagnosability.

Статья представлена к публикации членом редакционной коллегии М. Ф. Караваем

Поступила в редакцию 15.04.2015.

Опубликовано 30.11.2015.

i Надоели баннеры? Вы всегда можете отключить рекламу.