Научная статья на тему 'Макросистемы и GRID-технологии: моделирование динамических стохастических сетей'

Макросистемы и GRID-технологии: моделирование динамических стохастических сетей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
197
30
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Попков Ю. С.

Рассмотрено развитие Интернета в ближайшей перспективе (GRID) как динамической стохастической сети, состояние которой характеризуется пространственными распределениями информационно-вычислительных ресурсов и информационных потоков. На базе обобщенного принципа максимизации энтропии предложены модели локально-стационарных состояний сети, входящие в качестве составной части в модель эволюции информационно -вычислительных ресурсов, которая относится к классу позитивных динамических систем с энтропийным оператором.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Попков Ю. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Макросистемы и GRID-технологии: моделирование динамических стохастических сетей»

И нформационные технологии в управлении

УДК 681.518.62-181.2:519.673

МАКРОСИСТЕМЫ И СНШ-ТЕХНОЛОГИИ: МОДЕЛИРОВАНИЕ ДИНАМИЧЕСКИХ СТОХАСТИЧЕСКИХ СЕТЕЙ1

Ю.С. Попков Институт системного анализа, г. Москва

Рассмотрено развитие Интернета в ближайшей перспективе (GRID) как динамической стохастической сети, состояние которой характеризуется пространственными распределениями информационно-вычислительных ресурсов и информационных потоков. На базе обобщенного принципа максимизации энтропии предложены модели локально-стационарных состояний сети, входящие в качестве составной части в модель эволюции информационно-вычислительных ресурсов, которая относится к классу позитивных динамических систем с энтропийным оператором.

ВВЕДЕНИЕ

Развитие и совершенствование характеристик всемирной паутины (Интернета), реализованных в огромных скоростях информационного обмена, гигантских объемах информационных ресурсов и вычислительных мощностей, способствовало укреплению восприятия сети как общедоступного и универсального компьютера. До настоящего времени Интернет используется в основном как информационно-коммуникационная система, а распределенные в ней огромные вычислительные ресурсы используются для решения уникальных задач в так называемом пакетном режиме. При этом сеть есть коммуникационный инструмент между уникальным пользователем и уникальным вычислителем (суперкомпьютером).

Но если программно-технические характеристики сети приближаются к внутрикомпьютерным, то существуют все основания рассматривать ее как компьютер с заключенным в нем пространственно распределенным информационно-вычислительным ресурсом. Когда пользователь обращается к

1 Работа доложена на Второй международной конференции по проблемам управления (Москва, 2003 г.).

каким-либо компьютерным ресурсам, его не интересует их локализация на твердом диске. Иллюстрация этой ситуации приведена на рис. 1, где изображен пример магистральных коммуникаций в компьютерной сети и пользователь, воспринимающий сеть как интегрированный компьютер. Здесь ситуация аналогична той, с которой мы сталкиваемся, общаясь с электрической сетью: мы пользуемся электрическим ресурсом, не интересуясь, где он локализован.

Реализация этих свойств в Интернете превратит его в сеть с принципиально новыми качествами, которые отражены и в новом термине — GRID. Выбор этого термина не случаен. В нем подчеркивается идентичность восприятия пользователем компьютерной и электрической сетей в смысле инвариантности к пространственному распределению информационно-вычислительных ресурсов.

Принципиальные особенности GRID проявляются тогда, когда сеть используется для распределенных вычислений, причем таких, которые должны воспроизводить реальную динамику. Но вначале рассмотрим более простую задачу. На рис. 2 изображен участок GRID, в котором циркулирует информация от некоторого количества пользователей (светлые экраны). В результате в данном участке сети реализуется в каждый момент време-

ни какое-то распределение информационных потоков. Поскольку количество пользователей, их информационные запросы, а также внешние для данного участка сети потоки нерегулярны, то распределение информационных потоков в данном участке сети можно рассматривать как случайное. В какой-то момент времени к сети подключается новый пользователь (темный экран), например, расположенный на острове Пасхи и занимающийся туристическим бизнесом. В силу его профессиональной ориентации он нуждается в определения кратчайших по времени или по стоимости маршрутов на о. Пасхи и обращается с соответствующим заданием в GRID, где производится сборка необходимых вычислительных ресурсов и решается эта задача. Пользователю неважно, какой для этого используется вычислительный ресурс и где он размещен. Ему важно, чтобы соответствующие программно-технические средства обеспечивали в разумное время решение этой задачи. С другой стороны, время отклика не слишком критично для него (разумное время), так как сама задача статическая, в том смысле, что она не связана с предысторией.

Рассмотрим теперь простую динамическую задачу — решение в некоторой принятой временной шкале t двух обыкновенных дифференциальных уравнений, но каждое размещено на пространственно отдаленных компьютерах. Пусть на компьютере А размещено уравнение

X j(W) = fi(xl(t), x2(t)), а на компьютере { — уравнение

X2(t) = /2(Xj(t), x2(t)).

Пусть также для их решения применяется метод Эйлера, т. е.

x1[(n + 1)h] = x1[nh] + hf1(x1[nh], x2[nh])

x2[(n + 1)K] = x2[nh] + h/2(x1[nh], x2[nh]), (1)

где h — шаг разностной схемы в принятой временной шкале t.

Какова процедура (конечно, виртуальная) распределенного решения этих уравнений (рис. 3)? На обоих компьютерах задаются начальные условия x1[0], x2[0] и вычисляются x1[h], x2[h]. Эти значения по каким-то маршрутам в сети передаются от компьютера А в комп ьютер { и наоборот. Но соответствующие маршруты в силу общественного использования сети могут быть загружены так, что возникает некоторое запаздывание н в передаче этих данных, длительность которого случайна. Следовательно, компьютер А получит информацию о x2[h — н] вместо x2[h] и компьютер { получит информацию о x1[h — н] вместо x1[h]. Таким образом,

Распределенный компьютер - GRID

Хельсинки

Пользователь

Рис. 1. Пример магистральных коммуникаций в компьютерной сети

Рис. 2. Пример участка GRID

Внешние потоки

Внешние потоки

Рис. 3. Иллюстрация процедуры распределенного решения уравнений (1)

вместо разностной схемы (1) мы имеем разностную схему следующего вида:

x1[(n + 1)h] = x1[nh] + h/1(x1[nh], x2[n(h — е)])

x2[(n + 1)h] = x2[nh] + h/2(x1[n(h — е)], x2[nh]).

Она моделирует совсем другие уравнения, которые могут обладать принципиально иными свойствами.

Здесь просматривается еще одна особенность сети как динамического объекта. Ощутимые запаздывания в сети есть следствие перегрузки каких-то ее звеньев из-за ограниченной пропускной способности, а перегрузки связаны с информационными потоками, которые могут быть как внешними по отношению к данной задаче, так и генерируемыми ею. Иными словами, запаздывание е есть функция состояния сети.

Разумеется, этот пример приведен не для того, чтобы показать, что распределенные динамические вычисления невозможны. Он предназначен для понимания того, что сеть есть динамический объект (даже суперскоростная), причем ее динамические характеристики случайным образом зависят от ее состояния, описываемого в терминах случайного распределения информационных потоков.

На феноменологическом уровне GRID представляет собой стохастическую динамическую сеть, распределение информационных потоков в которой характеризует её состояние. Это распределение — случайное, причем случайность понимается именно в терминах теории вероятностей: существует множество элементарных событий (информационных транзакций), на котором можно определить v-алгебру и вероятностную меру.

Динамичность GRID, иными словами, ее инерция, возникает на уровне эволюции распределения информационных потоков. Если наблюдать за этой эволюцией в дискретные моменты времени t1, ..., tp, ..., tn, ..., то состояние сети в произвольный момент времени tn в общем случае будет зависеть от ее состояний на некотором конечном интервале времени [tp, tn — 1], причем tp < tn — 1 < tn. Но в силу того, что скорости передачи информации и пропускные способности коммуникаций весьма высокие, «память» сети tn — 1 — tp вряд ли будет столь «глубокой». Вполне правдоподобной может быть гипотеза о том, что динамика GRID — марковская, т. е. состояние сети в момент времени tn определяется ее состоянием в момент времени tn _ 1 и дополнительными информационными потоками, порождаемыми пользователями, которые присоединились к сети в момент времени tn.

Исследования GRID как стохастической динамической сети только начинаются. Большинство

работ в этой области посвящено проблемам маршрутизации в стохастических сетях. В частности, в работах [1—3] развивается подход, основанный на максимизации функции полезности с помощью нейронных сетей. Предлагаемые здесь алгоритмы экспериментально исследуются на тестовой модели. Синтезированные маршруты сравниваются по длительности среднего запаздывания для типовых нагрузок в сети. Другое направление связано с анализом влияния различных случайных факторов, прежде всего, случайного изменения маршрута, на качество функционирования сети. Обычно под качеством имеется в виду среднее запаздывание [4—6].

Ранее уже отмечалось, что GRID — это динамическая система, которая может иметь несколько стационарных состояний. Среди них могут быть такие, в которых фактически нарушается нормальная работа сети. Если пользоваться физической терминологией, в GRID могут возникать фазовые переходы. Этой проблеме посвящены, в частности, работы [7, 8], где рассматривается сеть со структурой двоичного дерева (Cayley tree) и экспериментально (методом Монте-Карло) определяются некоторые ее характеристики в зависимости от активности пользователей. Оказывается, что при определенном уровне активности пользователей сеть скачком переходит в состояние, где среднее запаздывание становится неприемлемым.

Как система GRID состоит из частей — сетей национального, регионального и других уровней. Поэтому естественен интерес к системным (коллективным) свойствам этой большой системы. Отметим, что универсального и общепринятого определения системных свойств не существует. Казалось бы, очевидное определение — «системным является свойство, отличное от свойств частей» — часто оказывается неконструктивным, так как установить свойства частей невозможно. В некоторых работах, посвященных стохастическим динамическим сетям, под системным свойством понимается возникновение в сети потоков, спектр

мощности которых имеет вид 1// а, где а е (0, 2) и / — частота. В частности, этим проблемам посвящены работы [9—14].

Важным компонентом распределённого вычислительного процесса является поиск необходимого или подходящего вычислительного ресурса. В среде GRID предполагается осуществлять его автоматически. Разработка такого программного обеспечения в значительной степени опирается на изучение поискового поведения различных типов пользователей Интернета. В частности, в работах [15, 16] рассматривается количество связей в дереве поиска (clicks), которые проходят различные типы пользователей для обнаружения необходимой им

информации. На весьма внушительных выборках (27000 пользователей, 1 млн. web-сайтов) показано, что инверсное гауссово распределение достаточно точно описывает интегральное распределение числа связей, причем его «насыщение» (интегральная вероятность равна -1) достигается при числе связей порядка 10. Этот же результат имеет место при исследовании распределения частот (дискретный аналог плотности распределения).

Пожалуй, наиболее продвинуты исследования тдоясяортяь/.х; сетей, т. е. таких стохастических динамических сетей, по которым перемещаются пассажиры либо грузы, либо транспортные средства. Список литературы, посвященной изучению, оптимизации, моделированию транспортных потоков исследованию возможностей управления ими, огромен; он насчитывает не менее тысячи наименований (см. например, сайт Traffic Forum: http// ywisb7.vkw.tu-dresden.de/TrafflcForum/library.html). Упомянем также специализированный журнал «Transportation Research» и некоторые монографии ([17-20]).

Другим примером стохастических динамических сетей являются тдо^оя^отодяь/е сети. Отметим, что уровень стохастичности довольно сильно зависит от типа перемещаемого по сети материала. Так, если это нефть или газ, то источники и стоки в такой сети, как правило, определены, и их объемы не меняются в течение значительного промежутка времени. Стохастические явления в сети связаны обычно с какими-то внешними воздействиями (природными, техническими и др.) [21]. Если же трубопроводная сеть предназначена для транспортировки сыпучих материалов, то, в силу физико-химических свойств этого потока, уровень стохастичности состояния такой сети может быть значительным [22].

И, наконец, еще одним примером стохастических динамических сетей являются элеятроэяе^-гети^ес^ие сети. Здесь также основным источником стохастичности являются потребители. Однако из-за того, что энергетический ресурс является часто источником жизнедеятельности, основная часть исследований таких сетей связана с разработкой систем оперативного управления при переменной нагрузке.

Мы уже отмечали, что исследования сетевых свойств GRID только начинаются, и одно из направлений связано с применением методов, принципов и моделей теории макросистем. Базовые феноменологические основы теории макросистем кажутся весьма адекватными тем явлениям и процессам, которые происходят в GRID. Конечно, при этом имеется в виду не технология сети, не программно-технические средства, заложенные в ней, а ее качественные макросвойства как динамической системы.

ФЕНОМЕНОЛОГИЯ GRID И ЗАДАЧИ ЕЕ ИССЛЕДОВАНИЯ КАК ДИНАМИЧЕСКОЙ СТОХАСТИЧЕСКОЙ СЕТИ

Не углубляясь в технологические детали, GRID можно рассматривать как обычную сеть — неориентированный граф, пример которого показан на рис. 4. В узлах сети размещены носители информационно-вычислительных ресурсов. В реальной сети устройства, обеспечивающие доступ, и носители ресурса могут быть функционально и пространственно разделены. Однако для наших целей это разделение не важно, так как информационные потоки между пользователями, устройствами доступа и носителями ресурса, хотя и могут быть критическими для соответствующих коммуникаций, значительно меньше тех, которые циркулируют в сети, и не оказывают заметного влияния на ее состояние.

Таким образом, можно предположить, что в каждом узле сети расположен носитель информационно-вычислительного ресурса с объемом ; (t) и

потребитель этих ресурсов (пользователи), которого также можно характеризовать некоторым объемом необходимой информации QL (t). И тот, и другой показатели соответствуют определенному моменту времени t.

Объем информационно-вычислительного ресурса (t) меняется сравнительно медленно (обновление программных средств, баз данных и т. п.). Но эти изменения стимулируются в значительной степени потребностями пользователей и потоками информации, циркулирующей в сети. Объем потребности в информационных ресурсах QL (t), напротив, изменяется достаточно быстро. Поскольку

/

Рис. 4. Пример представления участка GRID неориентированным графом

Информационно- Потребность в

вычислительные ресурсах

ресурсы

Рис. 5. Граф корреспонденций между носителями и потребителями ресурсов

потребность в информационных ресурсах связана с непредсказуемым количеством пользователей, оккупирующих сеть через узел /, то объем Qi (/) для каждого момента времени / есть случайная величина. Более тонкая структура Qi (/) как случайного

процесса может быть установлена в результате специальных исследований.

Наряду с графом сети (см. рис. 4) рассмотрим граф корресяоядеяций (связей) между носителями и потребителями ресурсов (рис. 5). Этот граф представляет собой идеальную сеть, где каждая пара (/, у) узлов имеет собственный канал связи. В результате обмена между носителями и потребителями информационно-вычислительных ресурсов возникают яотоки корресяоядеяций (количество информации в единицу времени) <(/) = [^(01*,У, ..., я]. Реальная сеть имеет собственную конфигурацию, и связь между узлами / и у, т. е. (/ ^-корреспонденция, осуществляется по соответствующему маршруту, вообще говоря, неединственному. Кроме того, маршрут (/^-корреспонденции может пересекаться на каком-то участке сети с маршрутами других корреспонденций.

Очевидно, что существует некоторый, достаточно малый интервал времени А/, внутри которого размеры потоков корреспонденций У/Д/) сохраняются. Это означает, что объем информации £/.(/) в (/^-корреспонденции (обзем ^//^-корресяоядеяции) в интервале времени [/, / + А/) определяется следующим равенством:

%(/) = \/,-(/)А/. (2)

Матрица объемов корреспонденций * (/) на интервалах длины А/ имеет случайные, быстро ме-

няющиеся компоненты Jy(t). Напомним, что на интервалах длины At объемы информационно-вычислительных ресурсов в носителях практически не меняются, а потребность в них, напротив, меняется достаточно быстро в шкале t, и ее объемы — случайные.

Таким образом при рассмотрении GRID в шкале календарного времени t в ней обнаруживаются, по крайней мере, два процесса с существенно различающимися временами релаксации.

Один из них — яроцесс восяроизводства инфор-мационно-вь/числительнь/х ресурсов. Здесь имеется в виду, что происходит пополнение, модификация программных средств, замена оборудования более совершенным, прокладка новых коммуникаций и т. п. Реализация этих мероприятий происходит достаточно медленно: в шкале календарного времени это месяцы или годы. Обозначим тг — характерное время (время релаксации) процессов воспроизводства информационно-вычислительных ресурсов. Важная особенность этих процессов состоит в том, что они в значительной степени стимулируются потребностью в ресурсах, а следовательно, зависят от распределения потоков <(t).

Другой процесс — формирование яотоков корреспонденций — происходит достаточно быстро в шкале календарного времени t: его время релаксации Ту- имеет порядок часов или суток. Динамичность этого процесса объясняется достаточно быстрыми изменениями потребностей в ресурсах.

Итак, между временами релаксации соответствующих процессов имеет место следующее соотношение:

Тг » Ту. (3)

В соответствии с приведенной феноменологией можно сформулировать следующие две задачи.

• А. Исследование квазистационарнь/х режимов формирования информационных яотоков корреспонденций, которые возникают в связи с малыми временами релаксации соответствующих процессов.

• Б. Исследование яространственно-временной эволюции сети, возникающей вследствие взаимодействия «медленных» яроцессов восяроизводства информационно-вычислительных ресурсов с «быстрыми» яроцессами формирования информационных яотоков.

В заключение этого параграфа заметим, что проблемы GRID весьма обширны. Но пока большинство из них в значительной степени технические и технологические. Здесь мы предпринимаем попытку внести определенный вклад в зарождаю -щееся направление исследования GRID как динамической стохастической сети с целью выявления ее общесистемных свойств.

МОДЕЛИРОВАНИЕ КВАЗИСТАЦИОНАРНЫХ СОСТОЯНИЙ (ЗАДАЧА А)

Рассмотрим граф корреспонденций (см. рис. 5), который характеризует связи между информационно-вычислительными ресурсами ;1(/), ..., ;„(/) и потребностями 41(/), ..., 4я(/). Объемы корреспонденций (2) представляют собой количество единиц информации или агрегированных порций. В силу того, что потребности случайны, естественно предположить, что порции информации случайно и независимо друг от друга попадают в (/„/^корреспонденцию. Характеристикой случайного распределения порций информации по корреспонденциям служат априорные вероятности я.., /, у = 1, ..., я попадания порции информации в (/у)-корреспонден-цию в единицу времени. Значения априорных вероятностей в общем случае зависят от времени / и от объемов информационно-вычислительных ресурсов, точнее, от их распределения ;(/) = {;1(/), ..., ;й(/)}, т. е.

$(;(/), /) = [а/.Щ/), /)|/, 7 = 1, ..., я].

Априорная вероятность того, что порция информации попадет в (/^-корреспонденцию за время А/,

/) = А//(;(/), /)А/. (4)

В результате реализации случайного распределения порций информации по корреспонденциям в системе корреспонденций (см. рис. 5) могут возникать различные случайные макросостояния [18], которые характеризуются матрицами *(/) со случайными элементами [г..(/)|/, у = 1, ..., я]. Этот распределительный механизм, как нетрудно заметить, описывается статистикой Больцмана (см., например, книгу [23]) в предположении, что загрузка системы корреспонденций невелика (т. е. элементы матрицы * (/) малы по сравнению с реальными возможностями сети).

В работе [18] показано, что в этом случае можно ввести обобщенную информационную энтропию Больцмана, характеризующую ансамбль случайных макросостояний * (/). В общем случае она зависит от «медленного» времени / и интервала А/:

,, А/) = -£*//(№(5)

Реальная сеть имеет конечную пропускную способность (допустимое количество информации в единицу времени — яоток информации). Сле-

довательно, элементы идеальной сети - корреспонденции — имеют конечные емкости, т. е. допустимые яотоки информации. Обозначим их с..(/), /, у = 1, ..., я, имея в виду, что они зависят от времени. Далее мы поясним, в каком смысле понимается эта зависимость.

Важным является вопрос, как емкости корреспонденций связаны с пропускными способностями элементов реальной сети. Напомним, что (/^-корреспонденция реализуется различными

маршрутами , ..., 5/.. Каждый из них характе-

ризуется пропускной способностью, т. е. максимальными потоками информации (//, ..., (//, которые могут быть перемещены по маршруту в единицу времени без изменения скорости передачи.

В процессе работы пользователя в сети, т. е. с течением времени, происходит переключение с маршрута на маршрут (хороший английский термин «'^№ш-8игйщ») в зависимости от загрузки отдельных элементов сети. Поэтому емкость (/ у)-кор-респонденции в момент времени / равна пропускной способности того маршрута 5гЦ/( , который в момент / реализует эту корреспонденцию, т. е.

*//М = (/" •

Однако такое определение емкости весьма громоздкое, так как требует оперативного решения задачи маршрутизации и мониторинга сети с точки зрения ее текущей загрузки.

Другой путь связан с построением верхних оценок величин £/.(/), уже не зависящих от времени:

/.

Если тем или иным способом емкости определены, то допустимое количество информации, перемещаемое в (/^-корреспонденции за время А/,

Су(/) = су(/)А/. (7)

В этом случае объемы корреспонденций (2) должны удовлетворять следующим очевидным условиям:

о р gij(i) р &.(/), /, ] = 1, ..., я. (8)

Случайное с априорными вероятностями $(;(/), /) распределение порций информации по системе корреспонденций (см. рис. 5) при условиях (8) характеризуется статистикой Ферми—Дирака [23]. Ансамбль случайных макросостояний * (/) системы корреспонденций описывается обобщен-

ной информационной энтропией Ферми-Дирака [18]:

+)(*, W, AW) = -a gL/( ° +

IT ¿//Д W), W)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ (&lm(W) - Ji/(W))ln(Ci/(W) - Ji/(W)), (9)

где

E (;(W), W) = W)’ W)

1 - Еу(;(/), /)

Итак, если загрузка сети невелика (например, для Интернета — в ночные часы), а именно

%(/) ^ &/(/), /,. = 1, ..., я,

то распределение порций информации по корреспонденциям реализуется в соответствии со статистикой Больцмана (5).

Если же загрузка сети значительная, и некоторые ее участки работают на пределе своей пропускной способности (8), то ансамбль возможных макросостояний системы корреспонденций характеризуется статистикой Ферми—Дирака (9).

Возможные макросостояния * (/) системы корреспонденций должны удовлетворять некоторым ограничениям. Мы будем рассматривать о граничения двух типов: стоимостные и балансовые.

Рассмотрим первые из них. Обычно известны цены л.. передачи порции информации для /.

(/^-корреспонденции и цены передачи юг порции информации в единицу времени для /-го ресурса. Тогда цена порции ресурса, переданной за время А/, ю г = юг А/;, и стоимость 7/(;) передачи всего объема информационно-вычислительного ресурса за время А/ определяется следующим выражением ад) = ; (/) юг Таким образом, стоимостные ограничения выглядят следующим образом:

(10)

Ограничения балансового типа связаны с объемом потребностей 4г-(0 за интервал А?. Введем поток потребности тг(?). Тогда ограничения балансового типа для интервала времени длиной А? примут вид:

Z gy(W) P tl(w)aw = 4 (W), j = 1,

(11)

В случае малой загрузки сети ограничения (1о) и (11) полностью описывают множество ее допустимых макросостояний. Если загрузка велика, то ограничения по пропускной способности оказываются необходимыми в случае, когда емкость корреспонденций принимается в виде (5).

Для формирования соответствующих условий обратимся к графу сети (см. рис. 4), который имеет р узлов и г дуг. Перенумеруем все дуги от 1 до г. Ранее отмечалось, что корреспонденция реализуется в сети различными маршрутами. Маршруты, принадлежащие различным корреспонденциям, могут пересекаться на каких-то дугах сетевого графа.

Введем функцию принадлежности:

1, если маршрут (/у)-корреспонденции проходит по дуге к;

0, если никакой маршрут (/у)-корреспонденции не проходит по дуге к.

(12)

Обозначим : — максимальный поток, который может пройти через дугу к. Тогда ограничения по пропускной способности будут выглядеть следующим образом:

p :naw, n = 1,

(13)

где Мк — множество всех корреспонденций, маршруты которых проходят через дугу к.

Для моделирования квазистационарных состояний стохастической сети будем пользоваться принципом локальных равновесий и обобщенным принципом максимизации энтропии [18, 23]. Возможность применения первого из них основана на существенном различии времен релаксации (3) процессов воспроизводства информационно-вычислительных ресурсов и распределения информационных потоков в сети. Принцип локальных равновесий позволяет рассматривать распределение информационных потоков при «замороженных» ресурсах. Ответ на вопрос, какое из распределений будет реализовано, дается принципом максимизации энтропии.

Таким образом, модель квазистационарных состояний стохастической сети имеет вид:

+[*, W, AW, ;(W)] ^ max, G

G є " >;(w), w, aw],

(14)

где допустимое множество D определяется комбинацией ограничений (10)—(13). Нетрудно заметить, учитывая выражения (4), (5), (7) и (9), что задача (14) может быть сформулирована относительно потоков корреспонденций <(W). Для удобства дальнейшего исследования будем различать следующие типы моделей.

Модели квйзистиционирнь/х состояний яри постоянной емкости кодоесяонденций

НР[< ;(W), С] ^ max ,

r < е D (; w )

где множество D описывается следующей системой неравенств:

ZV'H P “¿X^ L = 1 ”

X y/(t) P t • J = 1 •••»”

i

X y/t)p :N, к = i, •••, U.

У е

1одели квязистяционарнь/х состояний ири нерешенной емкости корреснонденций

HF[< t, X(t), C(t)] ^ max ,

F < е D (X, t)

где множество D описывается следующей системой неравенств:

Xy/(t)ni/ P «¿X^ L = 1 •••’ ”

X\i/-(t) p t, M = i, •••, ”• (15)

i

1одели квязистяционарнь/х состояний для .малой загрузки сети

Н% [< X(t)] ^ max ,

% G е D(X, t)

где множество D описывается системой неравенств (15)

В этих выражениях

HF[< t, X(t)] = -Xy,(t)ln У/( 1) +

X y D^/(X(t), t)

+ (F/t) - \i/.(t))ln(ci/.(t) - \i/(t)), (16)

H%[< t, X(t)] = -Xy..(t)ln —\/P— • (17)

% X efli^(X( t), t)

Все три типа моделей квазистационарных состояний позволяют восстановить энтропийно оптимальную матрицу потоков корреспонденций <*(/)• Процедуры «наложения» ее на реальную сет ь (assignment problem) в значительной степени зависят от критериев оптимальности маршрутов, реализующих корреспонденции (например, маршруты, кратчайшие по времени, с максимальной безопасностью, минимальные по стоимости и т п.) Кроме того, переключение с одного маршрута на другой зависит от случайной загрузки сети в текущий момент времена Случайный характер генерации реальных маршрутов должен адекватно отражаться в процедурах «наложениям Возможно, здесь окажется полезной вероятностное описание распределения потока корреспонденций по маршрутам, активно используемое при моделировании транспортных сетей [24] Правда, в транспортной сети маршруты выбирает человек, мотивация которого неизвестна^ Исследование индивидуальных мотиваций заменяется вероятностным описанием коллективных мотиваций В GRID выбор маршрутов алгоритмизирован, но включение того или иного алгоритмического правила случайно^

ДИНАМИЧЕСКИЕ МОДЕЛИ СТОХАСТИЧЕСКОЙ СЕТИ (ЗАДАЧА Б)

Обратимся к примеру магистрального слоя GRID, пример которого изображен на рис 1 По-прежнему, объем информационно-вычислительного ресурса в регионе i обозначаем X. (t), а поток корреспонденций между регионами i и j — y,.,.(t),

i/

i, j = 1, •••, ”• Естественно, что

О P ;(t) P 0(t),

0 P \i/(t) « сг>. или (18)

О P y,j(t) P сг>., i, j = 1, •••, ”, где 0.(t) — максимальный объем информационно-вычислительного ресурса, размещенного в регионе /•

Изменение объема информационно-вычислительного ресурса в регионе i происходит «медленно» под влиянием трех групп факторов^ Первая из них связана с естественной амортизацией и старе-нием^ Эти процессы в основном зависят от текущего объема ресурса Х{ (t )• Вторая группа факторов связана с внешними воздействиями 8i(t) на ресурс с целью его обновления^ Эти воздействия генерируются как вне, так и внутри данного региона^ И, наконец, последняя группа факторов характеризует влияние информационных потоков в сети <(t) на ресурсьь Однако характер влияния отличен от влияния первых двух групп факторов^ Его можно квалифицировать как косвенное влияние: изменения информационных потоков в сети являются индикаторами необходимости изменения ресурса^ С другой стороны, распределение информационных потоков <(t) также меняется во времени под влиянием информационно-вычислительных ресурсов X(t) и потребности 4(t) в них, т е^ существует определенная обратная связь

Следуя этой феноменологии, эволюцию пространственного распределения информационновычислительных ресурсов в общем случае можно описать системой дифференциальных уравнений следующего вида:

GX = F [X(t), 8(t), <(t)] (19)

= n[<(t), X(t), 4(t)], (20)

где X(t) = {X1(t), •••, XQ(t)}, F — вектор-функция из

5”, <(t) — (” x ”)-матрица, Ф — (” x ”)-матричная функция и 4(t) = {41(t), •••, 4”(t)} — объем потребности

Рассмотрим, как феноменологические особенности динамической стохастической сети отображаются в уравнениях (19) и (20)

Вначале обратимся к уравнению (19), описывающему эволюцию информационно-выгчисли-тельныгх ресурсов. Пусть переменные 8 и < фиксированы.

Согласно первому из соотношений (18) ;.(?) О 0.

Поэтому вектор-функция ) в уравнении (19) должна обладать следующим свойством:

)\[;.(?), ..., ;_ 1(0, о, ; + 1<а), ...,

..., ;и(?)/8(?), <(?)] = о, / = 1, ..., и.

Отсюда следует, что ^.(Х|8, <) = ф(;.))(Х 8, <), где ).(Д 8, <) < *, ф(0) = 0.

В простейшем случае ф(;.) = ;. Тогда дифференциальное уравнение (19) примет вид:

^ = ;(о ® ) >т 8(о, <(; ?)], (21)

где символ ® означает покоординатное умножение.

Вернемся к первой группе неравенств (18). Из них также следует, что компоненты ;.(?) ограничены сверху объемами максимального ресурса 0.(?). Это обстоятельство также накладывает определенные ограничения на вид функций ) в уравнении (21). На качественном уровне эти ограничения можно пояснить следующим образом. Пусть начальные состояния X(0) е т![0, 0(?)] и переменные 8 и < фиксированы. Если при этом хотя бы одна компонента вектора Х(?), возрастая (т. е.

;(?) = )(;\8 <) > 0), достигнет границы 1(?), то знак соответствующей компоненты функции )дол-жен стать отрицательным.

Рассмотрим множества:

Ц(?) = {X: 0 Р ; (?) < 0 (?); ;(?) О 0.(?);

у = 1, ..., и; у ф /}, / = 1, ..., и;

и вектора 8 е Г и < е Т, где Г и Т _ компактные

подмножества в 5+ . Тогда семейство подходящих функций ) может быть описано следующим образом: для любых 8 е Г и < е Т

)(X 8, <) Р 0 для X е Ц, / = 1, ..., и. (22)

Это семейство достаточно обширное, и его параметризация, необходимая для прикладных исследований, неединственная и может быть весьма разнообразной. Поэтому, имея в виду прикладную полезность таких моделей, желательно иметь простые формы параметрического представления семейства (22). Одна из них _ линейная и сепарабельная по X, с параметрами, зависящими от 8 и <:

).(;, 8, <) = —¿¿(8 <) + (8, <),

/ = 1, ..., и. (23)

В этом представлении Ь > 0 и V >0 — параметры. Заметим, что если Ь и V — константы, то функ-

ция ) есть компонента функции Лотки—Вольтер-ра [25]

В рамках представления функции F. (23) рассмотрим следующие феноменологические особенности динамики информационно-вычислительных ресурсов^

7. Старение с постоянной скоростью и линейньш влияниеж иотоков,

F(X, <) = —e + x-p'^,

где b. = const

2. Старение и обновление с иостоянньши скоростями и линейньш влияниеж иотоков,

F (X, 8, <) = —b. + + X^^,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где Ьг = const, b . = const

Обновление с иостоянной скоростью и линейныж влияниеж иотоков,

F (X, 8, <) = bai8 + X^^,

где b l = const

Здесь С — (” x ”)-матрица, Pl и — i-я строка

и i-й столбец соответствующих матриц

Теперь рассмотрим уравнение (20) В силу соотношения (3) релаксация распределения информационных потоков к квазистационарному состоянию происходит существенно быстрее, чем изменение пространственного распределения информационно-вычислительных ресурсов^ Поэтому можно применить принцип локальных равновесий и вместо дифференциального уравнения (20) рассматривать квазистационарное состояние распределения <*(t) информационных потоков, которое есть состояние с максимальной на допустимом множестве энтропией

Таким образом, динамическую модель GRID можно представить в следующем виде:

GX = X® (—b(8, y*(X, t)) + X® v(8, y*(X, t))),

y*(X, t) = argmax(H(< X, t)/< е D(X))

Эта модель принадлежит к классу позитивных динамических систем с энтропийным оператором, некоторые свойства которых изучены в работе [17]

Введем классификацию моделей GRID, используя две группы характеристик: локально- стационарных состояний и эволюционной динамика Соответствующие модели будем обозначать двумя индексами Первый из них обозначает особенности сетевых корреспонденций: 1 — постоянная емкость; 2 — переменная емкость; 3 — малая загрузка сети Второй индекс обозначает особенности процессов, влияющих на динамику ресурса: 1 — ста-

рение с постоянной скоростью; 2 — старение и обновление с постоянными скоростями; 3 — обновление с постоянной скоростью^ Во всех трех типах процессов воспроизведения ресурса предполагается линейное влияние информационных потоков в сети

Таким образом, возникает девять моделей GRID следующего вида^

Модель 77. Обновление информационно-вычислительного ресурса в сети не происходит и емкость корреспонденций не меняется во времени;

^ = Xt(—bt + ХРгУ*г(Х)), i = 1, •••, q;

<*(X) = argmax(H)(< X, С )/{<: Xy,^ P «¿X;

/

X y. P т; X у./4 P :N;

i i, у е 0n

i, j = 1, •••, q; N = 1, •••, и })•

Модель 72. Полное воспроизводство информационно-вычислительного ресурса в сети и емкость корреспонденций не меняется во времени;

^ = X^—b. + b ¿8 + xp<*l(X)), i = 1, •••, ”;

<*(X) = argmax(H)(< X, С )/{<: X^,^ P ©¿X?;

/

X \i/ P т; X y/Oi P :N;

i i, у е 0n

i, j = 1, •••, q; N = 1, •••, и })•

Модель 75. Процесс старения информационно-вычислительного ресурса значительно медленнее, чем его обновление, и емкость корреспонденций не меняется во времени;

GX ~

^ = XL( b ¿8 + Х3гУ*г(Х)), i = 1, •••, q;

<*(X) = argmax(H)(< X, С )/{<: X^,^ P «¿Х.;

/

X \i/ P T/; X y^°i/ P :N;

i i, у е 0n

i, j = 1, •••, q; N = 1, •••, и })•

Модель 27^ Обновление информационно-вычислительного ресурса отсутствует и емкость корреспонденций меняется во времени;

GX

^ = XL(—bL + Х3гУ*г(Х, t)), i = 1, •••, q;

У*(Х, t) =

= argmax(H)(< t, X, C(t))/{<: X^,яг7 P ^¿Х.;

/

Xy/ p т.; ¿, j = 1, •••, ”; n = 1, •••, и})

Модель 22. Полное воспроизводство информационно-вычислительного ресурса в сети и емкость корреспонденций меняется во времени;

л; ~

= х(—ь, + ь ¿8 + хзгУ*и ?)), / = 1, ..., и; у*(д ?) =

= агётах(+)(У, ?, X, С(?))/{<: Xяг7 Р ю,Х;

1

XУ/ Р т; ¿, 7 = 1, ..., и; N = 1, ..., и}).

.

Модель 25. Обновление информационно-вычислительного ресурса отсутствует и емкость корреспонденций меняется во времени;

^ = ;,(—Ь, + ХРг7*г(Д ?)), , = 1, ..., и;

у*(д ?) =

= агётах(+)(У, ?, X, С(?))/{<: XУ7яг7 Р ю,Х;

1

XУ/ Р т; ¿, 7 = 1, ..., и; N = 1, ..., и}).

.

Модель 57. Обновление информационно-вычислительного ресурса отсутствует и малая загрузка сети;

^ = Х(—Ь, + ХРТПД ?)), , = 1, ..., и;

У*^) = агётах(+%(У, ^))/{<: яг7 Р ю,Х;

1

XУ/ Р т; ¿, 7 = 1, ..., и; N = 1, ..., и}).

Модель 52. Полное воспроизводство информационно-вычислительного ресурса в сети и емкость корреспонденции меняется во времени;

= Х(—Ь, + Ь ¿8 + ХРгУ*и ?)), , = 1, ..., и;

У*^) = агётах(+%(У, ^))/{У: Х\/>"у Р юА

1

X У/ Р т; /, 7 = 1, ..., и; N = 1, ..., и}).

/

Модель 55. Обновление информационно-вычислительного ресурса отсутствует и емкость корреспонденций меняется во времени;

= Х(—Ь, + ХРгУ*г(Д ?)), / = 1, ..., и;

У*(^) = агётах(+%(У, ^))/{У: XV,, Р cj;;;

1

X Р т; ,, 7 = 1, ..., и; N = 1, ..., и}).

В этих выражениях энтропийные функции определяются выражениями (16) и (17) Матрица емкостей корреспонденций имеет вид:

С = [ max (P; i, j = 1, •••, ”]

1 < m < s 1

для случая постоянных емкостей и

C(t) = w) ; i, j = 1, •••, Q

для случая переменных емкостен

Здесь (¿pm — пропускная способность маршрута m, реализующего (¿/)-корреспонденцию; u(t) — номер маршрута, реализующего (¿/)-корреспонденцию в данный момент времени

ЗАКЛЮЧЕНИЕ

Сетевые технологии достигли такого уровня развития, что вполне реальным в недалеком будущем становится восприятие сети как распределенного компьютера, в котором сосредоточены гигантские информационно-вычислительные ресурсы^ В процессе реализации этой амбициозной цели приобретает особую актуальность «системный взгляд» на всемирную паутину^ Его инструментом является моделирование сети Естественно, что подходов к моделированию может быть мно го^ Мы здесь основывались на том, что природа функционирования сети — случайная^ Макросистемный подход, развиваемый в данной статье, кажется адекватным представлению о реальных процессах, происходящих в существующей всемирной сети и в ее модификации — GRID^

Математические модели равновесных и неравновесных состояний сети в той или иной степени используют принцип максимизации энтропии Они позволяют имитировать распределение информационных потоков (стационарное и нестационарное), выявляя и прогнозируя «узкие места» в сети Эта информация весьма ценна для формирования эффективных (например, по времени ожидания) маршрутов достижения необходимых пользователю информационно-вычислительных ресурсов, а также для стратегического планирования развития GRID, связанного с пространственным размещением новых информационно-вычислительных ресурсов, аппаратно-технических средств и трассировкой линий связи

ЛИТЕРАТУРА

1. RRpert". P«uweuXv PrawN -. Using Collective Intelligence to Route Internet Traffic / Advances in Information Processing Systems, ed. M. Kearns, S. Solla, D. Cohn, MIT Press, Massachusetts, 1999.

2. Poya« /., ¿/¿¿маи P. Packet routing in dynamically changing networks: A reinforcement learning approach / Advances in Neural Information Processing Systems - 6, Morgan Kaufmann, 1994. - P. 671-678.

3. бибгамаиши "., PrascAe/ P., Сйеи /.Ants and reinforcement learning: A case study in routing in dynamic networks / Proceedings of the Fifteenth International Conference on Artificial Intelligence, 1997. - P. 832-838.

4. P«Ns +., ¿aw«/'c]aN $. 7. Performance of data network with random links // Mathematics and Computers in Simulation. -1999. - Vol. 51. - P. 103-119.

5. P«Ns +.; ¿aw«/'c]aN k. P., 9o/Nov 6. Packet delay in models of data networks // ACM Transactions on Modeling and Computer Simulation. - 2001. - Vol. 7.

6. Гадди 0. 6., MW/Qgeu Ж, (игам//// $. A bibliographical guide to self similar trafic and performance modeling for modern high-speed network / Stochastic Networks: Theory and Applications, ed. F. R. Kelly. S. Zachary, I. Ziedins, Clarendon Press (Oxford University Press), Oxford, 1996. - P. 339-366.

7. TueWyaNov $. Гию., TaNayas« +., TaNayas« 0. Phase transition in a computer network model // Physica A. 1998. - Vol. 253. -P. 315-322.

8. OA/ua P., 6awaWau/ 5. Phase transition in computer network traffic model // Physics Review E. 1998. - Vol. 58. - N. 1. -P. 193-195.

9. //аи <иаи, 0/7/s .. Exploring Collective Dynamics in Communication Networks. National Institute of Standarts and Technology, 2001. - Vol. MD 20899-0001, Gaithersburg.

10. Cow/e /.. ¿/и +.' 1/co/ "., Oj/'e&N/' $. Towards Realistic Million-Node Internet Simulation / Proceedings of the 1999 International Conference on Parallel and Distributed Processing Techniques and Applications. Lay Vegas, Nevada, 1999.

11. Csaôa/' ,. l// Noise in Computer Network Traffic // Journal of Physics, A, 1994. - Vol. 27. - N. 12. - P. 417-421.

12. <иаи /., 5еи Y., ¿/и P., 6Ааи X.Phase transition and collective correlation behavior in the complex computer network // Acta Physica Smicia. 2001. - Vol. 50. - N. 7. - P. 1221-1225.

13. TaNayas« 0., TaNayas« +. Critical behaviors and l// noise in information traffic // Physica A. 1996. - Vol. 233. - P. 824-834.

14. PwAwrfa .., TaNayav« 0., TaNayav« +. Spatial and temporal behavior of conjestion in Internet traffic // Fractals. 1999. -Vol. 7. - P. 23-31.

15. +M0errna« P. $., ¿«Nove 5. 0. Social dilemmas and Internet conjestion // Science. 1997. - Vol. 277. - P. 535-537.

16. Либеттаи 5. $., P/uo/// P. ¿.Г., P/WNow /. (., ¿«Nove 5. 0. Strong Regularities in World Wide Web Surfing // Science. 1999. - Vol. 280. - P. 95-97.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

17. Рильсон k. Дж. Энтропийные методы моделирования сложных систем. - М.: Наука, 1978.

18. Лоиков Ж. С. Теория макросистем и ее приложения. - М.: YPCC, 1999.

19. Реленький k. С. Исследование операций в транспортных системах. - М.: Мир, 1992.

20. Лившиц Р. j. Оптимизация планирования и управления транспортными системами. - М.: Транспорт, 1987.

21. Рирфанов Р., Журавлев Р., Лмельйаев Ж, Софронова С. Статистический метод анализа эффективности нефтепрово д-ных систем // Надежность магистральных нефтепроводов. -Уфа, 1980.

22. Ду^ов Ж. k., Журавлев Р., Лмельйаев b. Прогнозирование малых отклонений в сетях / Динамика нео днородных систем. - М.: Труды ВНИИСИ, 1982.

23. Ландау Л. Д., Лифши^ p. S. Статистическая физика. - М.: Наука,1964.

24. Pn'es] Г. ¿., ¿Mç«eP./., To ô/'и 5. ¿., Me Р. Ж Dynamic network traffic assignment considered as a continuous time optimal control problem // Operation Research. 1989. - Vol. 37. -P. 893-905.

25. Рольтерра Р. Математическая теория борьбы за существование. - М.: Наука, 1973.

S (Ш5; 255-42-22

(-та/7: sopNov@«a.UM □

i Надоели баннеры? Вы всегда можете отключить рекламу.