достаточно для вычисления в вершине а при помощи функции мажорирования правильного согласованного значения /-го комплекса-источника. Аналогично, достаточными условиями являются: У6) наличие 2(тг+т;)+1 путей в орподграфе вида АЕ либо вида СЕ, либо вида АСЕ; У7) наличие 2(т+т,+ т1^ . )+1 путей в орподграфе любого другого из оставшихся видов.
Орподграф, удовлетворяющий хотя бы одному из достаточных условий У1 - У7 и найденный первым в процессе поиска таких орподграфов, является орподграфом посылки а, и он приписывается вершине а, в процессе поиска достаточных условий межкомплексного ВИС.
Сочетание в одном алгоритме метода выделения заданного множества комплексов [1], представленного метода определения достаточной среды посылки и метода построения алгоритма межкомплексного ВИС является открытой темой исследований.
Литература
1. Лобанов А. В. Алгебраический подход к задаче выделения комплексов при организации сбое- и отказоустойчивых параллельных вычислений в сетях ЦВМ // Открытое образование. 2011. №2 (85). Ч. 2. С. 36-39.
2. Ашарина И. В., Лобанов А. В. Взаимное информационное согласование в неполносвязных гетерогенных многомашинных вычислительных системах / Автоматика и телемеханика. 2010. № 5. С. 133-146.
УДК 681.518.54+ 004.3.001.4
О СИСТЕМНОМ ДИАГНОСТИРОВАНИИ НЕОДНОРОДНЫХ ЦИФРОВЫХ СИСТЕМ СО СТРУКТУРОЙ СИММЕТРИЧНОГО
ДВУДОЛЬНОГО ГРАФА
В. А. Ведешенков, д. т. н., главный научный сотрудник Тел/факс: (495) 334 7590, e-mail: [email protected] Учреждение Российской академии наук Институт проблем управления
им. В. А. Трапезникова РАН www.ipu.ru
The heterogeneous digital systems (DS) structured as symmetric bipartite graphs consisting of processors, memory units and commutator units are considered. For DS with such structures, the approach of diagnosing with a separate component accuracy is proposed. During the period of diagnosing the polytypic units are combined in tested subsystems of the same composition.
Рассмотрены неоднородные цифровые системы (ЦС) со структурой симметричного двудольного графа, состоящие из процессоров, блоков памяти и блоков коммутаторов. Предложен подход к диагностированию ЦС с такой структурой с точностью до отдельного компонента. На время проведения диагностирования разнотипные устройства объединяются в проверяемые подсистемы одинакового состава.
Ключевые слова: неоднородные цифровые системы, симметричный двудольный граф, блок коммутатора, диагностирование, проверяемые подсистемы.
Keywords: heterogeneous digital systems, symmetric bipartite graph, commutator unit, diagnosis, tested subsystems.
Введение
Поиск исследователями новых, более эффективных, чем известные, структур связей сложных вычислительных систем показал, что симметричные двудольные графы предпочтительнее полных графов и полнодоступных двудольных графов по ряду параметров [1]. Симметричным
двудольным графом называется граф, состоящий из двух подмножеств вершин X и У равной мощности и имеющий ребра, одна из концевых вершин которых принадлежит подмножеству X (У), а другая — подмножеству У (X). Пример такого графа для п = 7 показан на рис. 1, где вершины подмножества X обозначены кружками, а подмножества У - прямоугольниками.
В [1] названы две возможные области использования подобных графов для построения структур вычислительных систем:
- многопроцессорные и многомашинные вычислительные системы, в которых подмножество вершин X представляет совокупность процессорных элементов или вычислительных машин, а подмножество вершин У — блоки или банки памяти;
- сложные системы связи, в которых связи между источниками и приемниками информации, представленными вершинами подмножества X, осуществляются блоками локальных полнодоступных коммутаторов, представленных вершинами подмножества У. Для сокращения в дальнейшем будем называть цифровые системы (ЦС), включающие блоки коммутаторов, неоднородными.
В [2] представлен метод организации самодиагностирования дискретных многокомпонентных систем со структурой типа двудольных квазиполных графов (ДКПГ), в основу которого положены проверки технического состояния контуров графа.
В [3] представлен подход к организации контроля и самодиагностирования (СД) состояния компонентов однородных ЦС, использующий объединение связанных разнотипных устройств в проверяемые подсистемы одинакового состава, обладающие функциональными возможностями, необходимыми для реализации диагностических процедур.
Постановка задачи
Исходная неоднородная ЦС со структурой симметричного двудольного графа Qn,s представлена графом, у которого П1 вершин подмножества X соответствуют процессорам, п2 вершин подмножества X - блокам памяти (п! + п2 = п), содержащим серверы памяти с необходимыми функциональными возможностями для выполнения диагностических процедур, п вершин подмножества У - блокам коммутаторов; 5 - степень вершин двудольного графа, т.е. каждая вершина подмножества X (У) связана дугами с 5 вершинами подмножества У (X ). (Для графа на рисунке 5 = 3.)
На время проведения контроля и диагностирования (КиД) разнотипные устройства объединяются в проверяемые подсистемы, состоящие из блока коммутатора, двух прилегающих линий связи и процессора или блока памяти. Допускаются устойчивые отказы ограниченного числа вершин и дуг, причем неисправности модулей таковы, что не влияют на работоспособность смежных модулей. Запуском процессов КиД в различных подсистемах ЦС и обработкой полученных результатов занимается исправный диагностический монитор (ОМ), который находится в модуле, внешнем по отношению к анализируемой ЦС. Для описания результатов тестирования компонентов используется модель Барси-Грандони-Маестрини [4].
Требуется разработать подход к организации системного диагностирования неоднородных ЦС, обеспечивающий ОМ достоверной информацией для диагностирования состояния компонентов (процессоров, блоков памяти, блоков коммутаторов, линий связи) системы.
Подход к диагностированию неоднородных цифровых систем со структурой симметричного двудольного графа
Процесс диагностирования компонентов однородных цифровых систем включает две основные процедуры [3]:
- исполнение исправным модулем функций проверяющего модуля;
- нахождение пути от одного исправного модуля к другому исправному модулю для передачи ему функций проверяющего модуля.
Как видно, для реализации этих процедур от проверяющего модуля не требуется выполнения сложных вычислительных и логических функций. Поэтому будем предполагать, что сервер памяти содержит аппаратно-программные средства с функциональными возможностями, достаточными для реализации этих процедур. Таким образом, можно считать, что процессор и блок памяти с сервером памяти являются функционально эквивалентными для реализации диагностических процедур.
Контроль работоспособности цифровой системы заключается в том, что каждый проверяющий модуль должен проверить техническое состояние своих преемников и соответствующих линий связи. Простейший способ выполнения проверок одного модуля
разными проверяющими модулями - последовательный. Для экономной реализации этого способа на диагностическом графе ЦС нужно построить цикл, который обеспечит однократный обход всех модулей исправной системы.
Ниже приведен пример такого цикла, в котором модули подмножества X чередуются с модулями подмножества Y (блоками коммутаторов):
1 —>8—^2—^ 11 —^6—> 10—>7—> 12—>5—^14—>3—^13—^4—>9—> 1.
Проверяющим модулем mj назначим один из модулей подмножестваX(вершины/=1,...,7 на рисунке), а в проверяемую подсистему Ц-,^ включим следующие компоненты: блок коммутатора ег (для рисунка, g = 8, ., 14), модуль тА: подмножества X ^ = 1, .,7), линию связи ¡^ между проверяющим модулем Ш/ и блоком коммутатора cg , линию связи между блоком коммутато-
ра ^ и проверяемым модулем т/{.
Информацию о составе проверяемых подсистем и номерах их проверяющих модулей Ш/, сформированных для системы Q7,3 (рисунок), запишем в табличной форме. Для краткости, в таблице показаны 2 строки Т/ таблицы состава Т5 строки, в каждой из которых для проверяющего модуля Ш/ (/=1, 2) записаны номера компонентов, входящих в состав проверяемых им подсистем Цш,и, Ц,#, 1с2, Цъ\к3, , в ней также есть поля для записи оценок результатов проверки г/,^, и, /2,п, / %3, к3 этих подсистем модулем Ш/.
Тогда отдельная проверка (тест ^-,&к) будет выполняться следующим образом. Получив управление (в процессе КиД), проверяющий модуль Ш/ через блок коммутатора cg и линии ¡/_& ¡^ передает в модуль т^^ команду на проведение его самоконтроля. Результаты выполненного теста из модуля т]^ передаются через блок коммутатора с& и линии ¡/^, ¡^ в процессор ш/, который сравнивает их с эталонами из блока собственной памяти и формирует оценку Т/,&^ =0, если результаты совпали с эталонами, =1 - в противном случае. На основании полученных оценок процессор Ш/ выбирает среди проверенных им исправную подсистему Ц/,&**, модулю тиз состава которой передает управление и необходимую информацию для продолжения процесса КиД. Модуль т^, получив разрешающую команду, перейдет в режим продолжения проводимого процесса, а после завершения своего этапа проверок передаст управление следующему модулю одной из исправных подсистем, проверенных им.
По сигналу ДМ начальный модуль тп процесса контроля с помощью записей таблицы Т5 находит проверяемые им подсистемы ^,и, ^, а, Цп,^, в и передает им команду «Выполнить
самоконтроль и передать результаты проверок в модуль тп». Получив эти результаты, модуль тп формирует оценки: 0, если результаты совпали с эталонами, и 1 - при несовпадении. Если все оценки - нулевые, то начальный модуль тп передает своему преемнику - модулю т^ управление для продолжения контроля системы. Этот процесс проверок и «хождения» по вершинам выбранного цикла заканчивается, когда управление возвращается к начальному модулю тп. Если
же на одном из этапов контроля получена хотя бы одна
единичная оценка,
свидетельствующая об
обнаружении одного или
нескольких отказавших
компонентов, то процесс контроля заканчивается, и система переходит к
диагностированию отказавших компонентов.
Очередной исправный модуль ту, получив управление процессом диагностирования, с помощью записей таблицы Т5 находит проверяемые им подсистемы Ц^и, Ц^2,и,.Ц^3,и и передает им команду «Выполнить самоконтроль и передать результаты проверок в модуль ту «. Получив эти результаты, модуль ту формирует их двоичные оценки, которые записывает в промежуточную таблицу РТ/. Затем по нулевым оценкам проверок своих преемников находит один из исправных модулей, еще не исполнявших функции проверяющего, и передает ему таблицу РТ/ и управление диагностированием. Если среди преемников ту нет такого модуля, то ту ищет необходимый модуль среди ранее проверенных с помощью записей таблицы РТ/ . Если окажется, что
Рис. 1. Цифровая система 27,з со структурой симметричного двудольного графа
нет ни одного исправного модуля, не исполнявшего функций проверяющего модуля, то поиск прекращается, и модуль ту пересылает в ДМ таблицу РТ] для обработки полученных результатов проверок.
Обработка полученных результатов проверок основана на двух правилах:
- если при проверке очередной подсистемы получена оценка 0, то все компоненты этой подсистемы исправны;
- если получена оценка 1, то неисправны один или несколько компонентов этой подсистемы; так как каждая проверяемая подсистема состоит из 4-х компонентов, то при единичной оценке точность диагностирования включает 4 компоненты.
Для формирования диагноза с точностью до отдельной компоненты (процессор, блок памяти, блок коммутатора, линия связи) нужно выполнить операцию «логическое пересечение» технических состояний компонентов, полученных для отдельных проверок. Процедурно такое пересечение реализуется с помощью специальной таблицы.
Заключение
Автор считает, что в данной работе новыми являются следующие результаты:
- представлен подход к диагностированию нового класса ЦС - неоднородных цифровых систем со структурой симметричного двудольного графа, состоящих из процессоров, блоков памяти и блоков коммутаторов; данный подход обеспечивает диагностирование одиночных отказов рассматриваемых ЦС с точностью до отдельной компоненты: процессор, блок памяти, блок коммутатора, линия связи;
- предполагается, что для реализации такого подхода блоки памяти содержат серверы памяти, обладающие необходимыми функциональными возможностями;
- рассмотрение примеров диагностирования отказавших компонентов в ЦС, состоящей из 7 модулей подмножества X (процессоров и блоков памяти) и 7 блоков коммутаторов, показало, что рассматриваемая структура не гарантирует правильного диагностирования двух любых отказавших компонентов, т.е. не является 2-однократно диагностируемой. Причина - в «слабой» разветвленности выходов блоков коммутаторов: с каждым выходом связаны только 2 линии [5].
Таблица.
2 строки таблицы Т5 состава проверяемых подсистем
Строка T Проверя- ющий модуль Проверяемые подсистемы Uj,g,k , оценки результатов их проверок
mj Uj,g1,k1 rj,g1,k1 Uj,g2,k2 rj,g2,k2 Uj,g3,k3 rj,g3,k3
Ti 1 (1-8), 8, (8-2), 2 (1-9), 9, (9-5),5 (1-10), 10, (10-6), 6
T2 2 (2-11), 11, (11-6), 6 (2-8), 8, (8-3),3 (2-12), 12, (12-7), 7
Литература
1. Каравай М. Ф., Пархоменко П. П., Подлазов В. С. Комбинаторные методы построения двудольных однородных неизбыточных квазиполносвязных графов (симметричных блок-схем) // АиТ. 2009. № 2. С. 153-170.
2. Пархоменко П. П. Организация самодиагностирования дискретных многокомпонентных систем со структурой типа двудольных квазиполных графов (ДКПГ) // АиТ. 2009. № 5. С. 180-188.
3. Ведешенков В. А. Организация диагностирования цифровых систем со структурой симметричного двудольного графа // Проблемы управления, 2009. №6. С. 59-67.
4. Barsi F., Grandoni F., Maestrini P. A theory of diagnosability of digital systems // IEEE Trans. Comput. 1976. V. C-25. № 6. P. 585-593.
5. Ведешенков В. А. Подход к диагностированию неоднородных цифровых систем со структурой симметричного двудольного графа // Проблемы управления. 2010. №5. С. 48-56.