УДК 681.3
АНАЛИЗ АЛГОРИТМОВ РЕКОНФИГУРАЦИИ СТРУКТУРЫ ПРОЦЕССОРНОЙ МАТРИЦЫ НА ОСНОВЕ СИГНАЛОВ СОГЛАСИЯ
Н.В.Лаходынова
Проводится моделирование алгоритмов реконфигурации структуры процессорной матрицы с отказами, основанных на сигналах согласия между процессорными элементами. Цель моделирования - исследование работоспособности и эффективности алгоритмов реконфигурации, оценка требований, предъявляемых к надежности отдельных процессорных элементов и связей между ними.
Modeling of reconfiguration of processor matrix algorithm with refusal based on signals of agreement. The aim of modeling is researching of efficiency of algorithm's reconfiguration, evaluation of the requirements for safety of separate processor and their connections.
ПОСТАНОВКА ЗАДАЧИ
Алгоритмы реконфигурации [1-3] процессорной матрицы (ПМ) на СБИС обеспечивают отказоустойчивость, то есть сохранение работоспособности системы при множественных отказах. Матрица, выполненная на неразрезной СБИС, представляет собой решетку, в узлах которой находятся процессорные элементы (ПЭ). Избыточная система связей между ПЭ позволяет вкладывать в физическую структуру матрицы решетки заданного типа. Количество физических соседей одного ПЭ может достигать 14-16. Количество логических соседей определяется типом решетки. Так в квадратной решетке ПЭ(1,_/'), i, j -физические координаты, имеет связи с четырьмя соседями (i - 1 , j), (i, j - 1 ), (i + 1 , j), (i, j + 1 ). В решетке, сопряженной с квадратной, кроме вертикальных и горизонтальных соседей ПЭ(г',/) имеет связи с ближайшими соседями, расположенными по диагонали: (i - 1, j - 1), (i - 1, j + 1), (i + 1, j - 1), (i + 1, j + 1 ). Наибольший интерес представляют квадратная решетка (К), а также треугольная (Т), шестиугольная (Ш), сопряженная с квадратной (К+) и некоторые другие типы решеток. При кратных отказах ПЭ логическая структура исходной решетки нарушается, матрица теряет работоспособность. При изготовлении СБИС по неразрезной технологии замена ПЭ исключена. Применение алгоритмов реконфигурации структуры ПМ позволяет максимально использовать исправную часть матрицы для получения исходной решетки. По мере появления новых отказов ПЭ в процессе функционирования реконфигурация структуры дает возможность построения ПМ меньших размеров, что обеспечивает живучесть системы в целом. Таким образом, задача реконфигурации структуры ПМ сводится к отображению логической структуры исходной решетки в избыточную физическую структуру. Избыточность структуры ПМ предполагает наличие резервных ПЭ и линий связи между ними.
Ранее мы развивали два направления в разработке алгоритмов реконфигурации. Первое направление основано на использовании сигналов неисправности ПЭ. Множество таких сигналов образует синдром неисправностей, на основе которого происходит перестройка структуры ПМ. Резервные элементы располагаются по краям матрицы [1], или назначаются программно [2]. Реконфигурация структуры производится схемами коммутационного окружения аппаратно или программно, при этом предполагается их абсолютная надежность.
Второе направление представляется более перспективным и заключается в следующем. Каждый ПЭ решает тестовую задачу и сравнивает результаты тестирования с результатами соседей. По результатам сравнения создается список согласных с ним соседей. На основе логических номеров согласных соседей ПЭ(г,/) вычисляет свой логический номер в требуемой решетке, где все соседи согласны между собой и образуют консенсус [3,4]. При несогласии между ПЭ структура решетки создается путем использования резервных связей. Резервные элементы специально не выделяются. Алгоритм реконфигурации не зависит от физической структуры связей. Все связи функционально эквивалентны. Не требуется аппаратуры самодиагностики. Этот подход уместно назвать методом консенсуса. Независимо от подхода и способа реализации результатом работы алгоритма реконфигурации должна быть решетка необходимого или максимально возможного размера, либо сообщение об отказе (невозможности создать такую решетку). Учитывая, что ПМ может содержать десятки тысяч ПЭ, а также то, что каждый ПЭ может иметь большое количество соседей, актуальным становится вопрос проверки работоспособности указанных алгоритмов, исследование их эффективности. Особый интерес представляет оценка минимальных требований к надежности ПЭ на неразрезных СБИС.
1. АРХИТЕКТУРА СИСТЕМЫ С
ОТКАЗОУСТОЙЧИВОЙ ПРОЦЕССОРНОЙ
МАТРИЦЕЙ
Система, использующая отказоустойчивую ПМ, согласно [3,4], состоит из трех подсистем: мониторной, решающего поля и массовой памяти. Решающее поле - это множество ПЭ на одной или нескольких неразрезных пластинах. ПЭ соединены двумя каналами: регулярным и магистральным. Регулярный канал обеспечивает локальные информационные связи между соседними (достаточно близко расположенными друг к другу) ПЭ, а также связывает решающее поле с массовой памятью с параллельным доступом. Связи, обеспечиваемые регулярным
каналом, функционально эквивалентны, информация передается по связи в обоих направлениях. Магистральный канал связывает все ПЭ с мониторной подсистемой, включающей в себя управляющую ЭВМ, и служит для передачи общей для всех ПЭ информации. Каждый ПЭ имеет триггер активности, который блокирует прием информации по связям с соседями, с которыми он не согласен, а также запоминание вновь вычисленных значений в памяти ПЭ.
2. ВОЛНОВОЙ АЛГОРИТМ ПОИСКА
КОНСЕНСУСА
В соответствии с [3, 4], реконфигурация структуры ПМ на основе сигналов согласия проводится в четыре этапа: прямой ход, обратный ход, фиксация и настройка. На этапе прямого хода каждый ПЭ составляет список своих возможных логических номеров, основываясь на логических номерах согласных с ним соседей. Начиная с верхнего левого угла ПЭ передают свои возможные логические номера согласным соседям с большими физическими номерами. Если физические номера несравнимы, то передача делается только в одном направлении, например от (i + 1 , j) к (i, j + 1 ). ПЭ получает логический номер (i, j), если возможные логические номера согласных с ним соседям удовлетворяют определенным условиям.
Для квадратной решетки ПЭ получает логический номер (i, j), если среди соседей с которыми он согласен имеется пара с логическими номерами (ii, ji), (¿2, j'2), таких, что выполняются условия
[|¿i - ¿2| = 1 ] & [| ji - j2\ = 1] , (1)
[(i1 < i2) ^ C1 >j'2)] V [(i1 > i2) ^ 0*1 < j'2)] . (2)
Для треугольной решетки требуется тройка соседей с логическими номерами (i0, jo), (¿1, j1), (¿2, j2), удовлетворяющих условиям (1), (2) и еще одному дополнительному условию
(i0 ,j0) = (min(i1; i2),minOV^) . (3)
Для решетки К+ требуется четверка соседей (¿o, jo) ,
(i 1, j 1) , (i2,j2) , (¿з,*'з) и выполнение условий (1), (2), (3) и дополнительное условие
(¿3, j3) = (max(i1, i2)+ 1, min (j^j,)). (4)
Для шестиугольной решетки требуются условия (1) и (2), если четности номеров строк и столбцов совпадают. В противном случае достаточно одного передающего и согласного соседа слева.
Логический номер (i, j) во всех случаях вычисляется как
(i, j) = (max(i1, i2), max( j1, j2)).
Фиктивные элементы левого и верхнего краев не могут
принимать логических номеров с ненулевым номером столбца и строки соответственно. Такая договоренность обеспечивает связь других ПЭ с краями пластины. В результате прямого хода каждый ПЭ имеет множество возможных логических номеров. Количество логических номеров ПЭ можно ограничить, меняя направления передачи номеров соседям. Если из списка логических номеров ПЭ выбирать только его верхнюю границу, то будет задана текущая решетка максимального размера. Фиктивные элементы (входы и выходы пластины) нумеруются как продолжение ПМ и снабжаются признаком края пластины. Если в результате прямого хода правый и нижний края ПМ оказались недостижимы, вырабатывается глобальный сигнал фатального отказа. Реконфигурация невозможна. В противном случае начинается обратный ход. При обратном ходе направления передачи логических номеров меняются на противоположные. Возможные логические номера вычисляются аналогично вычислениям прямого хода, а логический номер (I, ]) вычисляется как (I, ]) = (тт^, г2),тт(72)) ,
где (11,¿2) , 0\,]2) - логические номера соседей, удовлетворяющих условиям для решетки заданного типа. Логический номер (I,)) считается допустимым для ПЭ, если он уже был получен в результате прямого хода. После обратного хода в списке допустимых логических номеров ПЭ остается пересечение множеств логических номеров прямого и обратного хода. Каждый ПЭ, имеющий несколько возможных логических номеров вырабатывает сигнал неоднозначности, который по магистральному каналу поступает в управляющую ЭВМ. На этапе фиксации выбирается единственный вариант решетки, после чего выполняется настройка физической структуры связей на полученную логическую нумерацию.
3. МОДЕЛИРОВАНИЕ ВОЛНОВОГО
АЛГОРИТМА
Волновой алгоритм реконфигурации структуры ПМ является параллельным. Прием, передача и вычисление логических номеров делаются множеством ПЭ одновременно. Для последовательной реализации алгоритма достаточно выполнять прямой ход алгоритма, двигаясь по столбцам, начиная с левого верхнего угла матрицы. Для проверки работоспособности алгоритма и оценки его эффективности в среде ¡ЪйгапЭО разработана программа, моделирующая волновой алгоритм. Процессорный элемент представлен структурой данных производного типа, которая включает в себя массив сигналов согласия с соседями, признаки фиктивных ПЭ (входов и выходов пластины), массив возможных логических номеров ПЭ. Процессорная матрица представляет собой матрицу (двумерный массив) с элементами типа "процессорный элемент". Таким образом, физические номера ПЭ - это номера строк и столбцов ПМ. Для накопления логических номеров согласных соседей и вычисления возможных логических номеров с целью экономии памяти, используется массив, не входящий в структуру ПЭ. Физическая структура связей задается неявно в массивах, содержащих сигналы согласия ПЭ с соседями. Процедуры вычисления
логических номеров ПЭ для разных типов решеток представлены подпрограммами. Программная реализация волнового алгоритма позволяет убедиться путем перебора различных конфигураций согласных и несогласных соседей, что результатом работы алгоритма является либо решетка заданного типа, либо фатальный отказ - сообщение о невозможности реконфигурации.
4. ОЦЕНКА ЭФФЕКТИВНОСТИ ВОЛНОВОГО
АЛГОРИТМА
Эффективность алгоритмов реконфигурации обычно характеризуется вероятностью сохранения работоспособности ПМ. Под вероятностью сохранения работоспособности понимается отношение числа конфигураций, не дающих фатального отказа, к общему числу испытаний при заданной доле исправных ПЭ. Для алгоритмов реконфигурации, основанных на синдроме неисправности, соответствующие исследования проводились в работах [1, 5]. Вероятность сохранения работоспособности P(n, p) рассматривалась в зависимости от вероятности исправности ПЭ, где n - количество ПЭ в матрице, p - вероятность исправности отдельного ПЭ. При этом считалось, что коммутационное окружение и связи между ПЭ абсолютно надежны. Следующие предположения позволяют сравнить эффективность волнового алгоритма и алгоритмов рассмотренных в [1, 5].
Будем считать, что два ПЭ согласны друг с другом, если оба они исправны и связь между ними исправна. Тогда вероятность того, что ПЭ имеет хотя бы одного согласного соседа, равна
pc = Р( 1 - (1 -pr)k), (5)
где p - вероятность исправности ПЭ, r - вероятность исправности связи, k - количество физических соседей ПЭ. Для сравнения эффективности алгоритмов рассматривалась структура, в которой каждый ПЭ имеет 12 физических соседей, k = 12; при r = 1 (связи абсолютно надежны), pc = p( 1 - (1 -p)12) . Для этого случая на рисунке 1 представлена зависимость P( n, p) для волнового алгоритма (А) и алгоритма свободного захвата с программируемым резервом (В) - самого эффективного алгоритма из [1,2], основанного на синдроме неисправности. Результаты получены для матрицы размером 20 X 20 . Учитывая результаты моделирования и уменьшение аппаратных издержек, можно сделать вывод о большей эффективности волнового алгоритма.
Р(п.Р) 1 -0,8 -0,6 -0,4 -0,2 -0 — 0,75
Рисунок 1
5. ВОЛНОВОЙ АЛГОРИТМ И ЗАДАЧА ПРОСАЧИВАНИЯ
Методы теории просачивания применялись для оценки минимальных требований к надежности отдельного ПЭ, обеспечивающей живучесть ПМ [5]. Под живучестью вычислительной системы обычно понимается вектор, элементами которого являются вероятности существования связной подсистемы (кластера) заданного размера при вероятности исправности узла р и вероятности исправности связи г. В [5] рассматривалась классическая задача просачивания - задача узлов. Процессорные элементы (узлы решетки) исправны с вероятностью р и неисправны с вероятностью (1 - р), узлы выходят из строя (становятся непросачиваемыми) независимо друг от друга. Связи считаются абсолютно надежными. В решетке есть просачивание, если существует связное подмножество просачивае-мых узлов, соединяющее левый и правый края решетки. Задача просачивания по связям, при условии, что узлы абсолютно надежны, сводится к задаче узлов. Бесконечные решетки, в которых исследуется существование бесконечных связных подграфов (кластеров), дают асимптотические оценки для реальных систем. В реальных системах ПЭ (узлы) и связи ненадежны, причем около 40% неисправностей приходится на долю соединений. Таким образом, более адекватной представляется смешанная задача просачивания, когда и узлы и связи могут быть неисправными (непросачиваемыми). Следует заметить, что классическим задачам просачивания посвящено большое количество публикаций. Смешанная задача мало изучена, практические оценки значений вероятностей просачивания автору неизвестны.
Пусть Р(п, р, г, t) - вероятность просачивания в решетке, содержащей п узлов, р - вероятность просачивания узла, г - вероятность просачивания связи, t - тип решетки. Исходным утверждением теории просачивания для задачи узлов (г = 1 ) является утверждение о существовании критической вероятности рн (порога просачивания), такой, что бесконечный кластер в бесконечной решетке существует с вероятностью 1 при р > рн, и с вероятностью 0 при р < рн. Аналогичное утверждение имеет место и для задачи связей. Для конечных решеток функция Р(п, р, г, t) имеет точку перегиба и при увеличении количества узлов приближается к ступенчатой. Точка перегиба дает приближенное значение рн [5]. Значение критической вероятности зависит от типа решетки. Критические вероятности рн позволяют оценить влияние надежности ПЭ и структуры связей на отказоустойчивость и живучесть процессорной матрицы в целом. Моделирование волнового алгоритма позволяет исследовать просачивание информации по пластине от входов к выходам по согласным ПЭ. При этом в качестве физической структуры берется исследуемая решетка (К, Т и т.д.). Логические номера ПЭ не вычисляются. Каждый ПЭ передает согласным с ним соседям признак связности с левым краем решетки. Таким образом, если ПЭ, находящийся на правом краю пластины имеет признак связности, то он
принадлежит кластеру, соединяющему левый и правый края пластины. При моделировании просачивания по согласным ПЭ вероятность просачивания Р(п, рс, г) , так же
как и в классической задаче узлов, приближается к ступенчатой при увеличении п. Так же существует критическое значение доли ПЭ, имеющих хотя бы одного согласного соседа, рсН. Если рс < рсН , то функция Р(п, р , г)
близка к нулю, в противном случае Р(п, р , г) приближается к 1. Таким образом, доля ПЭ, имеющих хотя бы одного согласного соседа, меньше порогового значения, то ПМ рассыпается на несвязные куски, если доля таких ПЭ больше порогового значения, то при достаточно больших п, (уже при п > 9 ) вероятность существования кластера, соединяющего входы и выходы, близка к 1. На рисунке 2 приводятся результаты моделирования просачивания по согласным ПЭ для некоторых типов решеток при п = 20. Точки перегиба соответствующих кривых дают приближенные значения рс#.
Рисунок 2
Таблица 1
Пороги просачивания
Решетка k Рн rH PcH
К 4 0,59 0,5 0,53
Т 6 0,5 0,35 0,46
Ш 3 0,7 0,65 0,64
К* 8 0,41 0,25 0,39
Порог просачивания по согласным ПЭ характеризует живучесть системы с учетом ненадежности узлов и связей. В исследуемом алгоритме неисправности процессорных элементов и связей не рассматриваются. Неисправности представлены только сигналами согласия между соседними ПЭ. Тем не менее интересно попутно оценить вероятность просачивания по ненадежным связям и ненадежным узлам в зависимости от p и r. Сделать это можно не прибегая к непосредственному моделированию смешанной задачи.
Вероятность того, что ПЭ имеет хотя бы одного согласного соседа, pc является функцией от p и r, вероятностей исправности узла и связи, соответственно. Используя формулу (5), можно построить кривые при pc = c = const, вдоль которых вероятность просачивания через процессорную матрицу P(n, p, r, t) постоянна и равна P(n, p , t) .
Таким образом, аппроксимировав значения P(n,pc, t) (например, методом наименьших квадратов), можно получить значения P(n, p, r, t) для любых p и r. Ниже в таблице 2 приводятся значения P(20, p, r, K) , на рисунке 3 изображена соответствующая поверхность. Три знака после запятой в значениях P(20, p, r, K) получены в результате аппроксимации и используются для построения поверхности. Для оценки значений вероятности просачивания нужны только два знака после запятой. Следует заметить, что данные приведенные в таблице, получены попутно при моделировании волнового алгоритма и при определенных предположениях. Значения вероятности просачивания при p = 1 выглядят несколько завышенными и могут быть использованы в качестве верхних грубых оценки; при r = 1 результаты совпадают с ранее полученными результатами для задачи узлов. Более точные результаты может дать непосредственное моделирование смешанной задачи просачивания.
Рисунок 3
Таблица 2
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
1 0 0,034 0,118 0,228 0,348 0,469 0,585 0,694 0,799 0,900 1
0,9 0 0,031 0,109 0,215 0,333 0,454 0,573 0,687 0,795 0,899 0,999
0,8 0 0,028 0,100 0,200 0,315 0,435 0,556 0,674 0,787 0,895 0,998
0,7 0 0,025 0,091 0,183 0,293 0,411 0,532 0,653 0,770 0,883 0,992
0,6 0 0,022 0,080 0,164 0,267 0,380 0,499 0,621 0,742 0,860 0,974
0,5 0 0,019 0,069 0,143 0,236 0,342 0,456 0,575 0,696 0,818 0,938
0,4 0 0,015 0,057 0,120 0,201 0,295 0,400 0,512 0,629 0,749 0,870
0,3 0 0,012 0,044 0,094 0,160 0,239 0,329 0,427 0,533 0,644 0,759
0,2 0 0,008 0,003 0,067 0,113 0,172 0,240 0,317 0,402 0,493 0,590
0,1 0 0,004 0,015 0,034 0,060 0,093 0,132 0,176 0,227 0,283 0,344
0 0 0 0 0 0 0 0 0 0 0 0
ЗАКЛЮЧЕНИЕ
ПЕРЕЧЕНЬ ССЫЛОК
Моделирование волнового алгоритма реконфигурации структуры процессорной матрицы на основе сигналов согласия позволило убедиться в его работоспособности и преимуществе по сравнению с другими алгоритмами реконфигурации, оценить, какая часть процессорных элементов и связей может отказать без полного разрушения системы на отдельные несвязные куски.
1. Сами М., Стефанелли Р. Перестраиваемые архитектуры матричных процессорных СБИС. -ТИИЭР, Т.74, № 5. 1986. - С. 107-118.
2. Воробьев В.А., Лаходынова Н.В. Процессорная матрица с перестраиваемой структурой и перестраиваемым резервом // Автометрия, № 5. 1994. - С. 90-98.
3. Воробьев В.А., Лаходынова Н.В. Реконфигурация отказоустойчивой процессорной матрицы на основе сигналов согласия // Автометрия, № 6.-1997
4. Воробьев В.А., Лаходынова Н.В. Вложение решеток в процессорную матрицу с отказами на основе сигналов согласия // Новые информационные технологии в исследовании дискретных структур: Доклады всероссийской конференции. - Екатеринбург: УрО РАН, 1998.- С. 153-156.
5. Воробьев В.А., Лаходынова Н.В. Пределы надежности однородных вычислительных структур// Известия АН СС СР. Техническая кибернетика. 1989
УДК 517.91 + 681.3
КОМПЬЮТЕРНО-МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПРОЦЕССОВ С
ПОСЛЕДЕЙСТВИЕМ В МЕДИЦИНЕ
В.П.Марценюк
В работе предложен метод численного интегрирования систем с последействием, применимый для компьютерной реализации. Компьютерное описание проведено с использованием объектно-ориентированного подхода. Показано применение метода на задачах медицинской информатики.
У роботг запропоновано метод чисельного ттегрування систем з тслядгею, який припускае комп'ютерну реал1защю. Комп'ютерний опис здшснений гз застосуванням об'ектно-ор1ентованого тдходу. Показано використання методу на задачах медичноЧ iнформатики.
The method of numerical integration of hereditary systems is proposed. In this work it allows computer implementation. Computer description is performed using object-oriented approach. Applications of this method for medical informatics problems are shown.
ВВЕДЕНИЕ
Динамические системы с последействием играют важную роль в экономике, биологии, медицине, инженерии. Многочисленные приложения эредитарных систем показаны в работах [1-3]. В то же время широкое практическое использование указанного класса систем сопряжено с определенными трудностями, возникающими при численном интегрировании (решении) соответствующих дифференциальных уравнений. Одной из причин является, по-видимому, бесконечномерность задач. Показано [4,5], что системы с последействием можно рассматривать как динамические системы в банаховом пространстве. В результате отсутствия признанных методов численного решения эредитарных систем популярные математические