УДК 681.3.06 Е.Е. Слядников
Модель распределенной информационно-
телекоммуникационной системы с пакетной передачей данных
Сформулирована модель распределенной информационно-телекоммуникационной системы с пакетной передачей данных для труднодоступных объектов. Показано, что такая система описывается степенным законом распределения для вероятности реализации связи между двумя узлами и проявляет свойства безмасштабной сети (малого мира), обладая ближней структурой, как у однородных систем, и дальней структурой подобно случайным системам.
Ключевые слова: распределенная информационно-телекоммуникационная система, модель малого мира.
Предметом исследования данной статьи являются распределенные информационно-телекоммуникационные системы с пакетной передачей данных. При проведении анализа таких систем необходимо учитывать следующие особенности: системы являются многоканальными, их каналы связи имеют различную физическую природу, системы имеют иерархическую структуру и распределенную топологию [1].
В работе [2] исследовалась распределенная информационно-телекоммуникационная система с пакетной передачей данных для труднодоступных объектов, исходя из предположения, что она имеет упорядоченную пространственную конфигурацию и строго определенные взаимодействия между ее составляющими. Развивая подход [2], в настоящей работе приняты во внимание эффекты неупорядоченности (случайности), которые присущи любой реальной системе связи. Хотя наличие или отсутствие связи является исключительно геометрическим свойством, не имеющим отношения к тепловым флуктуациям, многие характеристики рассматриваемой системы, среди них разрыв связей и возникновение перколяций, критические индексы и применимость методов ренорм-групп, схожи с характеристиками фазовых переходов [3, 4].
Техническая и программная конфигурация системы передачи данных определяется исходя из топологии и условий местности ее развертывания и строится на основе иерархической комбинации трех функционально-ориентированных аппаратно-программных комплексов (АПК): АПК-ЦСД - центра сбора данных (обычно размещается в управлениях или территориальных гидрометеоцентрах); АПК-КРС - кустовых центров сбора данных (обычно размещается на одной из наиболее доступных радирующих станций); АПК-МЕТЕО - для метеостанций.
Простейшую модель рассмотренной выше распределенной системы с пакетной передачей данных для труднодоступных объектов можно сформулировать как совокупность множества узлов и множества ребер, соединяющих узлы. Множество узлов системы состоит из пунктов сбора первичных данных, кустовых центров сбора данных, центров сбора данных. Ребра системы образованы пучком каналов связи, которые могут иметь различную физическую природу. Топологию сети пакетной передачи данных удобно представлять с помощью плоского графа, состоящего из множества узлов и множества ребер связи, соединяющих смежную пару узлов. Примем во внимание эффекты случайности, присущие любой реальной системе связи, тогда плоский граф становится случайным, т.е. в его узлах существует конечная вероятность возникновения связи между смежными узлами.
Рассмотрим случайный граф, между соседними узлами которого существуют связи и часть х этих связей произвольно удаляется. В такой системе случайность определяется параметром х - частью связей, которые были удалены, или частью р = 1 - х связей, которые остались. Для х = 0 или р = 1 непрерывная сетка связей покрывает всю систему полностью, и ситуация не изменится, даже если х незначительно увеличится, а р уменьшится. При р = 0 сетки связей не существует, и картина существенно не изменится и при малых ненулевых значениях р. Поэтому разумно предположить, что имеется некоторое критическое значение рс такое, при котором для р < рс непрерывной бесконечной траектории, идущей через узлы по связям, не существует, а реализуются лишь отдельные изолированные кластеры из связанных узлов. В случае р > рс существуют бесконечные кластеры, покрывающие всю систему.
Критическое значение рс известно как порог протекания, это явление называется протеканием по связям (перколяцией), поскольку если представить, что связи - это поры в некотором материале, то существование бесконечного кластера приводит к протеканию жидкости через этот материал. Перколяционный переход - это своего рода геометрическое фазовое превращение, в котором критическая концентрация рс разделяет фазу конечных кластеров при р<рс и фазу бесконечных кластеров при р > рс. Это аналогично температурным фазовым превращениям, где концентрация р играет роль температуры.
Проанализируем переход от однородного графа к случайному. Однородный граф - это граф, в котором каждый узел связан с k ближайшими соседями, а в случайном графе связан с k случайными соседями. Два параметра характеризуют свойства «ближнего порядка» графа и «дальнего порядка» графа, содержащего N вершин и Nk/2 хорд. Параметр «дальнего порядка» - это среднее минимальное число хорд ), необходимое для того, чтобы перейти из одной вершины в другую, находящуюся на расстоянии I, и оно определяет кратчайший путь между двумя вершинами. Характер зависимости кратчайшего пути от I различен для однородных и случайных графов в то время как для однородного графа ^1) ~ I, а для случайного графа ^1) ~ 1п(1). Можно также определить коэффициент кластеризации С, который является средней долей соседних вершин, соединенных с заданной вершиной. Этот параметр определяет ближний порядок и очевидно, что он приближается к единице для однородного графа и мал для случайного графа. Отсюда следует, что h и С велики для однородного графа и малы для случайного графа. Еще один тип графа, занимающий промежуточное положение между однородным и случайным, предложен в [5].
При формулировке модели информационно-телекоммуникационные системы с пакетной передачей данных для труднодоступных объектов возьмем за основу модель малого мира [5]. Рассмотрим граф G с N вершинами и К ребрами, который является невзвешен-ным (ребра эквивалентны), редким (К<< NN - 1)/2) и связанным. Поэтому G можно представить, просто задавая матрицу смежности NЧN, чей матричный элемент ац равен 1, если есть ребро, соединяющее вершину Ь с вершиной Ц , и равен 0, если ребра нет. Важным свойством G является степень вершины Ь, т.е. число ^ ребер, выходящих из вершины Ь. Среднее значение ^ равно k=2K/N. Когда матрица ац задана, ее можно использовать для вычисления матрицы путей с самой короткой длиной йц между двумя вершинами Ь и Ц. Тот факт, что G - связанный граф, подразумевает, что матричные элементы йц положительные и конечные для любого Ьфц. Для количественного описания структурных свойств О вводятся две различных величины: характерная длина пути L и коэффициент кластеризации С. L есть среднее расстояние между двумя вершинами L = NN — 1)]_1Хйц, а С - локальная характеристика, равная С = N"1XC¿. Здесь С - число ребер, составляющих Оь - подграф ближайших соседей вершины Ь, разделенный на максимальное возможное число ^ (^ - 1)/2.
При описании реальной распределенной информационно-телекоммуникационной системы с пакетной передачей данных для труднодоступных объектов ограничения модели малого мира (невзвешенность, редкость, связанность) являются неприемлемыми, поэтому необходимо формулировать более общую модель. Покажем, что, во-первых, поведение такой системы можно описать с помощью единственной переменной с ясным физическим значением - эффективность передачи информации Е; во-вторых, величины и С могут быть получены как предельные случаи переменной Е соответственно в глобальном и локальном масштабе; в-третьих, можно убрать перечисленные ограничения на модель. Представим распределенную сеть связи с пакетной передачей данных как взвешенный (и, возможно, даже нередкий и несвязанный) граф О. Такой граф нуждается в двух матрицах: матрице смежности ац и матрицы 1ц физических расстояний, имеющей
смысл некоторой метрики. Число 1ц может быть расстоянием между этими двумя вершинами или силой их возможного взаимодействия. Предполагаем, что 1ц известно, даже если в графе нет никакого ребра между Ь и ц. Конечно, в специфическом случае невзве-шенного графа 1ц = 1 для любого Ь ф ц. Элемент матрицы путей с самой короткой длиной йц между двумя вершинами Ь и ц является наименьшей суммой физических расстояний по всем возможным путям в графе от Ь до ц.
Поскольку система с пакетной передачей данных параллельна (каждая вершина одновременно посылает информацию по сети, через ее ребра), то эффективность связи £у между вершинами i и j тогда может быть определена как величина, обратно пропорциональная самому короткому расстоянию: £у = 1/ dj для любого i, j. Когда нет никакого пути в графе между i и j, dj = +да и, следовательно, £у = 0. Средняя эффективность передачи информации в графе G может быть определена как
E(G) = [N(N -1)]-1 X £ij =[N(N -1)]-1 X d~1ij ■ (1)
i* jeG i* jeG
Чтобы нормировать E, рассмотрим идеальный случай Gid, в котором граф G имеет все N(N - 1)/2 возможных ребра. В таком случае информация распространяется самым эффективным способом для dj > 1ц для любого i, j, и E принимает максимальное значение при E(Gjd)=[N(N-1)]-1Xl-1jj. Эффективность E(G), используемая ниже, всегда делится на E(Gid) и поэтому 0<E(G)<1. Хотя равенство E=1 выполняется, когда есть ребра между всеми вершинами, реальные сети тоже могут достигнуть высокого значения E.
Используем единственную величину E, чтобы одновременно анализировать и локальное, и глобальное поведение системы, а не две различных переменные L и C. Величина E в (1) есть глобальная эффективность G, и поэтому определим ее как Egiob. Определим локальную эффективность как среднюю эффективность локальных подграфов, Eiok=N-1 XE(Gj). Так как i не принадлежит Gj, локальная эффективность Eiok показывает насколько система толерантна к ошибкам (сбоям). Она показывает, насколько эффективна связь между первыми ближайшими соседями i, когда i удален.
Таким образом, определение распределенной информационно-телекоммуникационной системы с пакетной передачей данных для труднодоступных объектов может быть качественно сформулировано в терминах информационного потока: система имеет высокие Egiob и Eiok, т.е., очень эффективна в глобальной и локальной связи. Это определение правильно, как и для невзвешенного, так и для взвешенного графа и может быть применено к несвязанным и (или) нередким графам.
Введем вероятность P(l)~l-5 существования связи между двумя вершинами в графе на расстоянии l. Если 5 = 0, P(l) постоянная и связи всех размеров одинаково вероятны, как в случайном графе. С другой стороны, если величина 5 очень велика, то дальние связи малы, поэтому получается однородный граф, содержащий только ближние связи. При 5, принимающей промежуточное значение, получаем модель малого мира. Получается, что при 5 < 51 система ведет себя как случайный граф, при 5 < 51 < 52 - как граф малого мира, а при 5 > 52 - как однородный граф. Предположим, что степенной закон распределения P(l) ~ l-5 вероятности реализации связи между вершинами выполняется для распределенной системы с пакетной передачей данных. Центральная предельная теорема утверждает, что для независимых случайных событий с конечным средним a и дисперсией с случайная переменная x подчиняется нормальному закону распределения:
P(x) = (2тсст)-1/2 exp[-(x - a)2 /2а].
Колоколообразная кривая нормального закона распределения, вероятно, является наиболее часто встречаемой в литературе. В нашем случае вместо закона нормального распределения имеет место степенной. То есть наша система - безмасштабная система, т. к. степенной закон является масштабно-инвариантным и не включает в себя характерные длины. Эти случаи аналогичны равновесной системе вблизи критической точки, в которой малые длины не имеют значения, а важна только характерная длина, являющаяся длиной корреляции. Последняя расходится в критической точке, поэтому в этом состоянии характерная длина отсутствует.
Наш граф, состоящий из N вершин, имеет k связей с другими вершинами. Разные вершины могут иметь разное количество связей, поэтому необходимо ввести распределение количества связей k, функцию P(k). Для безмасштабных систем P(k) является степенной функцией вида P(k)~k"y. Чтобы показать, как проявляется степенной закон, сопоставим каждой вершине i случайное число Xi [Xj принадлежит (0, да)], которое назовем рангом вершины i и будем использовать для обозначения приоритетности этой вершины. Пусть функция f(x) определяет распределение рангов и представляет собой степенную функцию. Кроме того, предположим, что вероятность существования связи между двумя вершинами i и j равна ¥(Xi, Xj). В случайных графах эта вероятность будет одинакова и постоянна для всех соединенных вершин: ¥(Xi, Xj) = b.
Средняя инцидентность вершины ранга х равна
да
< к(х) >= | Ч(х.у^(у)йу = ^(х), (2)
0
поэтому х = ^_1(< к > /N). С другой стороны, по определению
да
< к >= | кР(Щк. (3)
0
Поскольку
Р(к) = f (х)йх/йк, то, объединив уравнения (2) и (3), получим
Р(к) = Я^_1(<к > /к > /^]/йк. Пусть хц)= (хь хц)/ х2тах, где хтах - максимальный ранг в сети. Тогда
да
< к >= (Ых/хтах) | yf(y)dy = ^ < х > / хтах и Р(к) = (хтах/N < х >У(к[х2ах/N < х >]) . (4) 0
Из соотношения (4) следует, что распределение инцидентности Р(к) полностью определяется распределением рангов Дх), поэтому если Дх) подчиняется степенному закону распределения, то аналогичное распределение будет у инцидентности Р(к).
Для дальнейшего анализа модели системы используем теорию среднего поля Ландау для фазовых превращений [4]. Для этого сопоставим системе термодинамический потенциал О, который является функцией параметра порядка Д и внешнего поля ^ О=О(Д, К). Как обычно, используем условие, чтобы параметр порядка обращался в ноль в неупорядоченной фазе.
Вершина с инцидентностью к испытывает на себе воздействие в среднем к соседних вершин, т.е. кроме внешнего поля h на нее действует среднее поле кЬ. Разложение Ландау для О(Д, К) содержит оба поля h и кЬ, , и это разложение можно записать как
в(Д,Н) = -ДН + ЕР(к)Ф(Д,кД). (5)
к
То есть оно зависит от функции распределения Р(к). Дальнейший анализ (5) основывается на разложении в ряд Тейлора функции Ф(х, у) для малых х и у
Ф(х,у) = Е Е Уш1хту1
т I
и исследовании первых членов этого ряда. Коэффициенты данного разложения имеют вид
(йпО(Д,Н)/йДп)д=0 = п! £ Фп-у <к1 > . (6)
1=0
Средние значения <к1>, входящие в уравнение (6), полностью определяются функцией распределения Р(к) . Для степенного распределения Р(к)~к~1 получаем, что
да
< к1 >= | к1Р(к)йк « к1-'<+1, при к ^ да . 1
Это означает, что все моменты, для которых I > у, расходятся. Функция (5) содержит в качестве коэффициентов эти моменты, поэтому теория среднего поля Ландау не работает. Равновесное состояние разрушается сильными флуктуациями. В графе наиболее сильно связанные вершины, в которых имеют место сильные флуктуации локальной инцидентности, являются причиной того, что теория среднего поля неприменима. С увеличением у в Р(к)~к~1 случайное число вершин с большим числом связей уменьшается, и фазовое превращение происходит по типу среднего поля. Расчеты показывают, что это происходит при у > 5, а при у = 5 появляются логарифмические поправки. Таким образом, О будет содержать следующие члены:
Д 1п Д при у = 5,
Ду-1 при 2<у < 3 и 2<у < 3,
Д 1п Д при у = 3. Полученные результаты позволяют сделать следующие выводы:
1. Распределенная информационно-телекоммуникационная система с пакетной передачей данных для труднодоступных объектов проявляет свойства безмасштабной сети (малого мира), обладая ближней структурой, как у однородных систем, и дальней структурой подобно случайным системам.
2. Безмасштабная сеть очень неоднородная и очень немного вершин (концентратов) имеют большое количество связей, а большинство вершин имеют лишь несколько связей. Такая структура довольно типична для распределенной информационно-телекоммуникационной системы с пакетной передачей данных для труднодоступных объектов, которая соединяет множества узлов связи, используя концентраторы (например, АПК-КРС) в качестве промежуточных станций для соединения маршрутов. Динамика этих сетей такова, что отвечает принципу «богатый богатеет еще больше» или «концентратор получает все».
3. Такая сеть описывается степенным законом распределения для вероятности реализации связи между двумя вершинами и имеет топологическую структуру, заметно отличающуюся от обычной, которая характерна для сетей, подчиняющихся нормальному закону распределения. Главное условие, которое приводит к степенному закону распределения, - это избирательное присоединение, обозначающее, что новые связи стремятся соединить уже существующие вершины, имеющее множество других связей.
4. Распределение инцидентности полностью определяется распределением рангов, поэтому если распределение рангов подчиняется степенному закону распределения, то аналогичное распределение будет у инцидентности.
5. Для явлений малых миров небольшая доля дальних связей приводит систему в класс универсальности, характерной для приближения среднего поля. Однако в безмасштабных системах, несмотря на наличие дальних связей, ситуация иная. Поведение по типу среднего поля проявляется только при достаточно больших значениях у в функции распределения k, у > 5, в то время как при малых значениях у, критические свойства не зависят от модели, но не универсальны, так что критические индексы зависят от у.
6. Важное отличие между экспоненциальной и безмашстабной сетью - это различная реакция на повреждение. Под повреждением понимается устранение некоторых вершин и всех связей, идущих от вершины. Безмасштабные сети весьма устойчивы по отношению к случайным повреждениям, однако очень чувствительны к намеренным повреждениям, направленным на концентраторы, которые приводят к разрушению большого количества связей и нарушению взаимодействия между различными частями сети. Если агрессивное воздействие будет направлено на уничтожение концентраторов, то даже если устранить менее 10 % таких узлов, сеть связи распадется на несвязанные между собой кластеры.
Литература
1. Сонькин М.А. Архитектура и общая технология функционирования территориально распределенных аппаратно-программных комплексов с пакетной передачей данных / М.А. Сонькин, Е.Е. Слядников // Известия Том. политех. ун-та. - 2006. - Т. 309, № 5. -C. 131-139.
2. Сонькин М.А. Об одном подходе к оптимизации функционирования многоканальной системы связи для труднодоступных объектов / М.А. Сонькин, Е.Е. Слядников // Вычислительные технологии. - 2007. - Т. 12. - Спец. вып. 1. - С. 17-22.
3. Хакен Г. Синергетика. - М.: Мир, 1980. - 404 с.
4. Ландау Л.Д. Статистическая физика. Часть 1. / Л.Д. Ландау, Е.М. Лифшиц. -М.: Наука, 1989. - 521 с.
5. Watts D.J. Collective dynamics Small-World Networks/D.J. Watts, S.H. Strogatz // Nature. - 1998. - Vol. 393, - № 4. - P. 440-442.
Слядников Евгений Евгеньевич
Д.ф.-м.н., с.н.с. отдела проблем информатизации
ТНЦ СО РАН, профессор каф. электронных приборов ТУСУРа
Тел.: (382-2) 49-13-12
Эл. адрес: [email protected]
E.E. Slyadnikov
Model of the distributed information-telecommunication system with batch data transmission
The model of the distributed information-telecommunication system with batch data transmission for remote objects is formulated. It is shown, that such system is described by the sedate law of distribution for probability of realization of connection between two units and shows properties without scale networks (the small world), possessing near structure, as at homogeneous systems, and distant structure, similarly to casual systems.
Keywords: distributed information-telecommunication system, model of small world.