at: http://sovman.ru/all-numbers/archive-2013/august-2013/item/193-03-32.html.
2. Lasy Alexander. Of what there is a data processing center cost: "Technologies and means of communication". Available at: http://automation.croc.ru/about/media/ detail.php?ID = 16766.
3. Kirillov Igor. Monitoring in data center new tasks -new decisions: "networks and business". Available at: http://asp24.com.ua/blog/monitoring-v-cod-novye-zadachi-novye-reshenija/.
© Алферов П. И., Потуремский И. В., Бородавкин Д. А., 2014
УДК 62-501.72:681.326.7
СОГЛАСОВАНИЕ ИНФОРМАЦИИ В МНОГОКОМПЛЕКСНЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ
И. В. Ашарина
НИУ «МИЭТ»
Российская Федерация, 124498, г. Москва, Зеленоград, проезд 4806, 5 E-mail: [email protected]
Рассматривается метод построения распределенного алгоритма системного взаимного информационного согласования во всех ЦВМ многокомплексной вычислительной системы, обеспечивающего согласование при наличии возможных совокупностей допустимых враждебных неисправностей.
Ключевые слова: многопроцессорные системы, репликация задач, отказоустойчивость, взаимное информационное согласование.
THE INFORMATION AGREEMENT IN MULTICOMPLEX PROCESSOR NETWORKS
I. V. Asharina
National Research University of Electronic Technology 5, Pas. 4806, Zelenograd, Moscow, 124498, Russian Federation E-mail: [email protected]
The method for constructing the distributed algorithm of the system mutual informative agreement in multi-complex processor networks is considered. The aim of the algorithm is to ensure the system mutual informative agreement even some admissible Byzantine malfunctions available.
Keywords: multiprocessor systems, task replication, fault-tolerance, mutual information agreement.
Рассматривается задача построения многокомплексной вычислительной системы (МВС) в сети, в которой для каждой задачи выделяется комплекс -подсистема, удовлетворяющая определенным структурным требованиям [1-3], все ЦВМ которой решают копии данной задачи (репликация задачи), обмениваются результатами и выбирают из них правильный. В качестве модели сети применяется ориентированный граф (орграф), пронумерованные от 1 до п вершины которого отображают ЦВМ с соответствующими номерами, а дуги - существующие каналы межмашинной связи.
Комплексы взаимодействуют между собой через соответствующие выделенные среды межкомплексных посылок (СМП), отображаемые соответствующими ориентированными подграфами (орподграфа-ми) [1; 4] и включающие среды взаимообмена между каждой парой задач. Комплекс содержит орподграф, гомеоморфный полному орграфу с количеством вершин более 3 ц, где ц - допустимое количество неисправных ЦВМ в комплексе. Вершины орподграфа
комплекса, взаимно однозначно соответствующие вершинам полного орграфа, называются основными, остальные вершины орграфа комплекса называются неосновными.
Процесс системного взаимного информационного согласования (СВИС) состоит из следующих этапов: 1) посылка согласуемых значений из неосновных ЦВМ каждого комплекса в основные ЦВМ этого комплекса; 2) внутрикомплексное взаимное информационное согласование (ВКИС) [5] с вычислением в каждой основной ЦВМ каждого комплекса вектора согласованных значений этого комплекса; 3) посылка векторов согласованных значений из основных ЦВМ каждого комплекса в неосновные ЦВМ этого комплекса; 4) межкомплексный обмен векторами согласованных значений комплексов через соответствующие СМП; 5) внутрикомплексное согласование векторов согласованных значений комплексов-источников в комплексах-получателях [2] и формирование вектора согласованных значений МВС (ВСЗС) в каждой из ее ЦВМ.
Решетневскуе чтения. 2014
В процессе СВИС происходит многократный обмен сообщениями между ЦВМ, организованный по квантам, т. е. периодам обмена сообщениями между соседними ЦВМ, включающий действия по формированию и обработке этих сообщений внутри ЦВМ. Собственное согласуемое значение /-й ЦВМ МВС формируется в первом кванте процесса. Согласуемое значение основной ЦВМ, кроме собственного согласуемого значения этой ЦВМ, также может содержать согласуемые значения некоторых неосновных ЦВМ, поступивших в нее на первом этапе.
Согласуемые значения являются элементами сообщения и передаются между ЦВМ в процессе СВИС в составе сообщений ^ к , где и - номер кванта передачи; / - номер ЦВМ-передатчика; } - номер ЦВМ-приемника [1; 2]. Каждой ЦВМ известно, откуда, в каком кванте и какого формата поступают к ней входные сообщения, а также выходные сообщения каких форматов должны быть составлены ею из элементов поступивших входных сообщений и когда и куда должны быть переданы эти выходные сообщения.
Рассматривается задача построения алгоритма, который должен строить распределенный алгоритм, реализованный в виде множества взаимодействующих между собой алгоритмов, индивидуальных для каждой ЦВМ, каждый из которых реализуется на своей ЦВМ в составе МВС, обеспечивая в каждой ЦВМ вычисление вектора СВИС, одинакового во всех исправных ЦВМ МВС.
Количество принимаемых сообщений, их состав, форматы и кванты передачи определяются на основе анализа выражений, построенных при работе алгоритмов А1-А4 [3; 4], которые разбивают МВС на требуемое число комплексов с заданными степенями отказоустойчивости, выделяют СМП, ранжируют вершины каждого комплекса в процессе СВИС. Для всех передаваемых и принимаемых сообщений в каждой ЦВМ МВС строятся соответствующие входные и выходные контейнеры (специально организованные области памяти ЦВМ), соответствующие форматам входных и выходных сообщений, и определяются каналы, по которым эти сообщения должны быть приняты и переданы. В каждой ЦВМ определяется объект ВСЗС требуемого формата, имеющий отдельный элемент, соответствующий каждой ЦВМ МВС. Затем над элементами всех выходных сообщений выполняется процесс связывания, при котором для каждого элемента выходного контейнера определяются элементы входных контейнеров, участвующие в формировании данного элемента, и квантовые действия, которые при этом должны быть выполнены. Определяются номера квантов, в которых сформированные выходные сообщения должны быть переданными из ЦВМ-передатчиков и приняты в ЦВМ-приемниках. В указанных квантах в некоторых или всех ЦВМ МВС определяются действия по вычислению некоторых элементов вектора СВИС этой ЦВМ. Процесс связывания завершается тогда, когда определены квантовые действия по формированию всех элементов ВСЗС в каждой ЦВМ МВС. Результаты процесса связывания являются основой построения индивидуального алгоритма СВИС для каждой ЦВМ МВС, который
должен выполнять только действия, предписанные процессом связывания, над элементами сформированных выходных и входных контейнеров. По результатам процесса связывания для каждой ЦВМ МВС строится индивидуальный алгоритм выполнения СВИС, который, как и весь распределенный алгоритм СВИС, завершается, когда во всех ЦВМ МВС будут вычислены все элементы ВСЗС. ВСЗС, сформированный в каждой исправной ЦВМ МВС, является выходным параметром процедуры процесса СВИС в каждой ЦВМ МВС. Результаты процесса связывания формируются в виде набора индивидуальных алгоритмов для каждой ЦВМ МВС, представленных на специальном объектно-ориентированном языке. Затем каждый такой алгоритм транслируется в исполняемый код на машинном языке соответствующей ЦВМ и переносится в эту ЦВМ в виде вызываемой процедуры.
Целевая работа МВС организуется на основе создаваемой подсистемы единого системного времени. В соответствии с такой организацией время работы МВС может делиться на этапы, циклы, фазы, периоды, раунды, кванты [1; 2]. При необходимости выполнения СВИС все ЦВМ МВС в один и тот же момент времени вызывают собственную процедуру процесса СВИС, и по этому вызову каждая ЦВМ МВС переходит к выполнению собственного индивидуального алгоритма СВИС. Организация распределенного алгоритма СВИС в МВС, взаимодействие индивидуальных алгоритмов отдельных ЦВМ, основанное на результатах выделения в сети комплексов и сред межкомплексного обмена, гарантируют, что при наличии допустимых неисправностей во всех комплексах и средах межкомплексных обменов в один и тот же момент времени (квант) завершится процесс СВИС такой, что в каждой исправной ЦВМ будет сформирован одинаковый вектор СВИС.
Представленные в работе подходы, методы и алгоритмы применимы при организации вычислений с заданной достоверностью в grid- и «облачных» вычислениях и будут также полезными при проектировании обслуживаемых и необслуживаемых распределенных вычислительных и управляющих систем критического применения.
Библиографические ссылки
1. Ашарина И. В. Метод системного взаимного информационного согласования в многокомплексных вычислительных системах // Труды XII Всерос. совещания по проблемам управления (ВСПУ'14) / ИПУ РАН (16-19 июня 2014, г. Москва). М., 2014. С. 7219-7223.
2. Ашарина И. В., Лобанов А. В. Системное взаимное информационное согласование в сбое- и отказоустойчивых сетецентрических системах // Труды XII Всерос. совещания по проблемам управления. (ВСПУ'14) / ИПУ РАН (16-19 июня 2014, г. Москва). М., 2014. С.7387-7392.
3. Ашарина И. В., Лобанов А. В. Выделение комплексов, обеспечивающих достаточные структурные условия системного взаимного информационного согласования в многокомплексных системах // АиТ. 2014. № 6. С. 115-131.
4. Ашарина И. В., Лобанов А. В. Выделение структурной среды системного взаимного информационного согласования в многокомплексных системах // АиТ. 2014. № 8. С. 146-156.
5. Pease M., Shostak R., Lamport L. Reaching Agreement in the Presence of Faults // J. Ass. Comput. Mach. 1980. Vol. 27, No. 2. P. 228-237.
References
1. Asharina I. V. VSPU2014.ipu.ru pp. 7219-7223.
2. Asharina I. V., Lobanov A. V. VSPU2014.ipu.ru pp. 7387-7392.
3. Asharina I. V., Lobanov A. V. Autom. and Remote Control, 2014, Vol. 75, No. 8, pp. 1078-1089.
4. Asharina I. V., Lobanov A. V. Autom. and Remote Control, 2014, Vol. 75, No. 6, pp. 1471-1478.
5. Pease M., Shostak R., Lamport L. J. Ass. Comput. Mach. 1980. V. 27. No. 2. P. 228-237.
© Ашарина И. В., 2014
УДК 62-501.72:681.326.7
ОБЕСПЕЧЕНИЕ ВЗАИМНОГО ИНФОРМАЦИОННОГО СОГЛАСОВАНИЯ В МНОГОКОМПЛЕКСНЫХ СЕТЕЦЕНТРИЧЕСКИХ СИСТЕМАХ
И. В. Ашарина1, А. В. Лобанов2 1НИУ «МИЭТ»
Российская Федерация, 124498, г. Москва, Зеленоград, проезд 4806, 5. E-mail: [email protected]
2ОАО «НИИ «Субмикрон» Российская Федерация, 124460, г. Москва, Зеленоград, проезд 4806, д. 4, стр. 2. E-mail: [email protected]
Рассматривается возможность организации решения в сети произвольной структуры заданного множества взаимодействующих задач с заданными для каждой задачи характеристиками по сбое- и отказоустойчивости. Ключевой проблемой таких вычислений является системное взаимное информационное согласование в условиях возникновения допустимых неисправностей. Представлены достаточные структурные условия достижения такого согласования и методы их поиска.
Ключевые слова: многопроцессорные системы, репликация задач, отказоустойчивость, взаимное информационное согласование.
THE ENSURING OF THE MUTUAL INFORMATIVE AGREEMENT IN MULTICOMPLEX NETWORK-CENTRIC SYSTEMS
I. V. Asharina1, A. V. Lobanov2
1National Research University of Electronic Technology 5, Pas. 4806, Zelenograd, Moscow, 124498, Russian Federation. E-mail: [email protected]
2 JSC "Scientific research institute "Submicron" State 2, Bld. 4, Pas. 4806, Zelenograd, Moscow, 124498, Russian Federation. E-mail: [email protected]
We study the possibility to organize a solution in a network of arbitrary structure for a given set of interacting tasks with fault- and transient-fault-tolerance characteristics specified for each problem. The key problem in such computations is system mutual information agreement that ensures coherence of system information in all computers of all complexes under admissible faults. The sufficient structural conditions for reaching such aт agreement and methods for finding them are presented.
Keywords: multiprocessor systems, task replication, fault-tolerance, mutual information agreement.
Рассматривается сеть ЦВМ известной произвольной структуры, в которой ЦВМ соединены между собой двухточечными дуплексными и / или симплексными каналами связи. Модель неисправности ЦВМ - враждебная («византийская») неисправность, при которой поведение неисправной ЦВМ может быть произвольным, неодинаковым по отношению к взаимодействующим с ней другим ЦВМ системы и даже подобным «злонамеренному». В такой сети нужно построить сетецентрическую систему для ре-
шения целевого задания, содержащего заданное множество взаимодействующих задач с заданными характеристиками по сбое- и отказоустойчивости для каждой задачи и для среды взаимообмена между каждой парой задач [1-4]. Сбое- и отказоустойчивость для задачи обеспечивается путем ее репликации - решения нескольких копий задачи на различных ЦВМ подсистемы, называемой комплексом, с обменом результатами и выбором из них правильного, а для среды взаимообмена - посредством обеспечения необхо-