Научная статья на тему 'Обеспечение и методика расчета надежности узла предоставления мультисервисных телекоммуникационных услуг'

Обеспечение и методика расчета надежности узла предоставления мультисервисных телекоммуникационных услуг Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
394
69
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УЗЕЛ ПРЕДОСТАВЛЕНИЯ МУЛЬТИСЕРВИСНЫХ ТЕЛЕКОММУНИКАЦИОННЫХ УСЛУГ / НАДЕЖНОСТЬ / ОТКАЗОУСТОЙЧИВОСТЬ / ГОТОВНОСТЬ СИСТЕМЫ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ковальков Д. А., Гаврилин Е. А., Галин О. С., Антонов Р. Д.

В работе предложены способы обеспечения надежности узлов предоставления мультисервисных телекоммуникационных услуг и проведен расчет предложенных способов. Предлагаются способы оценки коэффициента готовности для различных систем.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ковальков Д. А., Гаврилин Е. А., Галин О. С., Антонов Р. Д.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Обеспечение и методика расчета надежности узла предоставления мультисервисных телекоммуникационных услуг»

УДК 621.39

Ковальков Д.А., Гаврилин Е.А., Галин О.С., Антонов Р.Д.

Военная академия РВСН имени Петра Великого, Серпухов, Московская обл., Россия ОБЕСПЕЧЕНИЕ И МЕТОДИКА РАСЧЕТА НАДЕЖНОСТИ УЗЛА ПРЕДОСТАВЛЕНИЯ МУЛЬТИСЕРВИСНЫХ ТЕЛЕКОММУНИКАЦИОННЫХ УСЛУГ

В работе предложены способы обеспечения надежности узлов предоставления мультисервисных телекоммуникационных услуг и проведен расчет предложенных способов. Предлагаются способы оценки коэффициента готовности для различных систем. Ключевые слова:

узел предоставления мультисервисных телекоммуникационных услуг, надежность, отказоустойчивость, готовность системы

Введение. Уровень доступа (точки входа в сеть Интернет) оператора (провайдера) играет важную роль в обеспечении услуг связи конечным пользователям и в значительной мере определяет качество предоставляемых услуг. Поэтому обеспечение надежности функционирования узлов предоставления мультисервисных услуг является одной из важнейших задач.

Живучесть сетевых соединений, способность системы к самовосстановлению в случае отказа каналов связи и к оптимизации при наличии нескольких работающих каналов - критически важные характеристики связи для бесперебойной работы удаленного терминального оборудования.

Технологии обеспечения надежности (готовности) узлов предоставления мультисервисных телекоммуникационных услуг.

С точки зрения базовой архитектуры сетей IP надежность может быть заложена в различные уровни сетевой иерархии. На физическом уровне (уровень 1 согласно модели OSI) возможно применение таких механизмов защиты соединений и интерфейсов, как Remote Failure Indication (RFI), Far End Fault Identification (FEFI), а также различные фирменные схемы защиты соединений [1].

На канальном уровне (уровень 2 согласно модели OSI) также существует большое количество протоколов защиты и дублирования, таких как Multi-Link Trunk (MLT), Spanning Tree (STP) и т.д. Кроме того, сетевой уровень (уровень 3 согласно модели OSI) предоставляет дополнительную степень защиты, осуществляемую с помощью протоколов маршрутизации RIP, OSPF, BGP и т.д.[3,8]

Сегодня все больше сетей обрабатывают проходящие данные на всех уровнях, вплоть до 7-го (согласно модели OSI). Поэтому сетевое проектирование должно предусматривать оптимизацию отказоустойчивости сети и минимизацию расходов за счет исключения ненужной избыточности и дублирования. Ключом к оптимизации проектирования является понимание того, как различные методы и

Рисунок 1

Отказоустойчивость аппаратной части системы предполагает такую реализацию по ее составу, при которой сбои отдельных модулей не приводят к от-

протоколы обеспечения отказоустойчивости, работающие на различных уровнях сетевой иерархии, функционируют и взаимодействую между собой.

Если мы взглянем на первые три уровня сетевой иерархии (согласно модели OSI), которые обычно используются при построении сетей, то именно они определяют уровень отказоустойчивости и надежности. [5].

С учетом вышесказанного предлагается следующая концептуальная схема узла предоставления мультисервисных телекоммуникационных услуг, представленная на рисунке 1.

Повышение надежности узла предоставления мультисервисных телекоммуникационных услуг заключается в резервировании критичных узлов на основе кластерных технологий, внедрении улучшенной технической поддержки со стороны производителя и привлечении для обслуживания специалистов высокого класса.

Проще всего кластер можно определить как совокупность взаимодействующих независимых элементов, предназначенных для решения общих задач.

Среди коммуникационных систем, построенных на основе кластеров, выделяют два основных типа: кластеры высокой готовности и отказоустойчивые кластеры повышенной надежности. В этом вопросе зачастую возникает путаница, поскольку системы одного из типов ошибочно наделяют характеристиками обоих типов. Для более точного понимания следует различать параметры высокой готовности и отказоустойчивости.

Так, готовность системы - это свойство, характеризующееся временем, в течение которого система способна предоставлять требуемые сервисы своим пользователям. Базовый показатель готовности системы - это отношение времени фактического предоставления услуг к общему времени работы системы, выраженное в процентах [2]. Для телекоммуникационной системы высокой готовности характерно значение коэффициента готовности порядка 99,999% [4]. В реальной ситуации для таких комплексов время незапланированного простоя составляет несколько минут в год.

услуг

казу всей системы в целом [2]. Для этого применяются самые различные методы: дублирование, коррекция ошибок, №егта!-мониторинг и т. д.

Очевидно, что отказоустойчивость влияет на готовность системы и, следовательно, понятие готовности системы шире. Далее будет рассмотрена готовность системы.

На практике применяются две основные схемы построения отказоустойчивых кластеров: Active-Active и Active-Passive, каждая из которых имеет свои преимущества и недостатки [4]. Первая из них предусматривает равномерное распределение выполняемой задачи между всеми элементами кластера, а в случае выхода из строя одного узла -между оставшимися. Основным преимуществом - увеличение скорости выполнения задачи.

Во второй схеме, Active-Passive в отличие от предыдущей, задача выполняется только на активном элементе, а в случае его выхода из строя -на пассивном. Наряду с несомненными достоинствами есть и недостаток - невозможность наращивания скорости выполнения задач.

При построении узла предоставления мультисер-висных телекоммуникационных услуг необходимо использовать следующие кластеры: кластеры канального и сетевого уровней.

Кластеры канального уровня используют базовые Ethernet протоколы STP (Spanning Tree Protocol) (стандарт IEEE 802.1D), RSTP (Rapid Spanning Tree Protocol) (стандарты IEEE 802.1w, IEEE 802.1D - 2004).

Протоколы STP и RSTP поддерживаются большинством производителей сетевых коммутаторов. Для виртуальных сетей используется протокол MSTP (Multiple Spanning Tree Protocol), который является расширением протокола STP и описан в стандарте IEEE 802.1s.

Недостатком STP и RSTP протоколов является часто недопустимо большое время перехода на резерв (от нескольких до нескольких десятков секунд), а также невозможность резервирования связей между коммутатором и устройством, которое является участником сети.

Поэтому кластеры канального уровня целесообразно строить с использованием нестандартных методов резервирования фирм разработчиков оборудования. В основе этих методов лежит использование сети с кольцевой физической топологией. Одна из ветвей сети блокируется коммутатором, и поэтому в режиме нормального функционирования сеть приобретает логическую шинную топологию. В случае отказа одной из ветвей мастер включает резервный порт. При этом подключается резервная ветвь, и граф сети вновь становится связным, то есть работоспособность сети оказывается полностью восстановленной. В настоящее время таких методов с временем сходимости (переключением на резерв) до 0,3 секунды насчитывается более 15. [7]

Метод физического кольца имеет два существенных достоинства: во-первых, он предельно экономичен, поскольку способен восстановить работу сети при отказе любой её ветви практически без затрат оборудования (дополнительно требуется всего один кабель для замыкания кольца и два лишних порта в двух коммутаторах); во-вторых, он позволяет примерно на порядок сократить время восстановления сети после отказа по сравнению со стандартным методом, использующим RSTP протокол.

К недостаткам метода относятся неудобство кольцевой архитектуры, невозможность резервирования коммутаторов и сетевых адаптеров, а также ветвей, идущих от коммутаторов к оконечным устройствам. При отказе коммутатора сеть оказывается разорванной и устройства, подключённые через коммутатор, становятся недоступны.

Данный недостаток можно преодолеть, если в методе физического кольца использовать оконечные сетевые устройства с двумя Ethernet портами и каждый из этих портов подключить к двум соседним коммутаторам. При отказе одного коммутатора мастер включает резервную ветвь, и в сети появляется резервный путь к оконечному устройству через резервную ветвь и второй коммутатор.

Кроме того, к недостаткам данных методов относится отсутствие стандартов и, как следствие, несоответствие идеологии открытых систем.

Для резервирования линий связи используется технология Multi-Link Trunks (MLT). Технология MLT описана в стандарте IEEE 802.3ad. MLT обеспечивает метод объединения нескольких каналов между двумя коммутаторами или между коммутатором и рабочей станцией/сервером. Объединение этих каналов обеспечивает единое логическое соединение между двумя устройствами.

Одной из проблем стандартного MLT (IEEE 802.3ad) является то, что все каналы внутри MLT соединения должны заканчиваться внутри одного коммутатора. В результате этого ограничения, в случае отказа, переключение потока данных с одного коммутатора на другой может быть осуществлено только с использованием такого протокола, как Spanning Tree или с помощью протоколов маршрутизации уровня 3 (согласно модели OSI). Из-за этого, при использовании стандартного MLT, невозможно достичь времени восстановления сети в доли секунды при отказе коммутаторов, и поэтому обеспечение надежности сети в 0, 99999 так же почти невозможно.

Для решения этой проблемы и обеспечения времени восстановления в доли секунды после отказа коммутатора компания Nortel Networks разработала технологию Split MLT, которая позволяет одной стороне каналов внутри многоканальных соединений заканчиваться на разных коммутаторах. Огромным преимуществом технологии SMLT является то, что она совместима с многоканальными протоколами других производителей. Таким образом, пользователи могут легко использовать самые различные пограничные коммутаторы или коммутаторы доступа, не теряя преимуществ, которые дает SMLT.

Кластеры сетевого уровня используют протоколы маршрутизации, такие как RIP, OSPF, BGP и т.д. и по своей сути являются протоколами обеспечения отказоустойчивости, они обеспечивают передачу данных по лучшему (оптимальному) маршруту, и в случае отказа на этом маршруте переключаются на альтернативный [3].

Для оптимизации работы сети на уровне 3 (согласно модели OSI) возможно использование таких протоколов, как Equal Cost Multi-Path (ECMP IETF RFC-2992.) и Virtual Router Redundancy Protocol (VRRP IETF RFC-2338.), которые обеспечивают балансировку нагрузки между несколькими маршрутами в сети и гарантируют очень быстрое время восстановления в случае аварий.

Методика оценки коэффициента готовности узла предоставления мультисервисных телекоммуникационных услуг.

При оценке надежности очень важна формулировка критерия отказа системы, в зависимости от которого разрабатывается схема надежности. При задании критерия надежности указывается допустимое число отказавших устройств от их общего числа, предельное время неработоспособности (недоступности сервиса, например, при переключении на резерв) и другие параметры и условия [2,6].

Для оценки надежности конфигурации узла предоставления мультисервисных телекоммуникационных услуг используется схема, элементы которой представляют собой последовательно соединенные укрупненные кластерные структуры. В практической реализации каждый из них может представлять собой набор нескольких кластеров.

Оценка надежности сводится к расчету схемы, составленной по заданному критерию отказа последовательно соединенных кластерных структур, представленных дублированной группой элементов. Не следует забывать о необходимости учета надежности инфраструктуры узла, в первую очередь, системы электропитания и кондиционирования, без которых основные системы неработоспособны. Как правило, инфраструктурные элементы также задублированы, и рассчитывать их можно аналогично.

Выберем в качестве модели надежности кластера марковскую модель, граф состояний которой представлена на рисунке 2.

Рисунок 2 - Граф состояний марковской модели

Кластер абонентской

Основной Основной Основной

элемент элемент элемент

Резервный элемент Резервный элемент Резервный элемент

Кластер коммутаторов

Кластер линии коммутаторов

Исток

Рисунок 3 - Структурная схема надежности узла

предоставления мультисервисных телекоммуникационных услуг при использовании протокола OSPF

Возможные состояния процесса: «0» - оба элемента исправны; «1» - отказ одного элемента; «2»

- отказ обоих элементов; «3» - работа протокола восстановления кластера (например, по протоколу VRRP).

Таким образом, состояния исправности кластера

- «0», «1», отказа - «2» и «3». В случае отказа одного из элементов кластера он автоматически заменяется резервирующим со случайным временем включения, распределенным по экспоненциальному

закону с параметром / = — , где © - среднее время

схождения алгоритма восстановления. Во время переключения кластер находится в нерабочем состоянии. Отказавший элемент ремонтируется (заменяется) без остановки системы и после восстановления через случайный промежуток времени, распределенный по экспоненциальному закону с параметром ц, включается в состав дублированной группы: ц=1/Тв, где Тв - среднее время восстановления. Допустим, что одновременно может восстанавливаться один элемент.

Тогда коэффициент готовности кластера

Кг = Ро + Pi =-

/и1(Х + ф + 2Х^(Х+г[)

(1)

2Х/ + 2Х + 3Х/и + 2Х/ + 4Х1ц

Общий коэффициент готовности узла предоставления мультисервисных телекоммуникационных услуг, структурная схема надежности которой представляет N последовательно соединенных кластеров, определяется по формуле

N

K

г Е

П K г, ,

(2)

i=1

где Kri - коэффициент готовности i-го кластера.

Недостатком предложенной схемы является то, что протоколы VRRP и RSTP работают независимо, но возможна ситуация, при которой VRRP «назначит» на роль основного устройства (master) один маршрутизатор, а RSTP в качестве предпочтительного выберет маршрут к другому (резервирующему «с точки зрения» VRRP). В лучшем случае этот маршрутизатор немедленно перенаправит трафик на

обработку основному устройству, что будет означать дополнительный переход (hop). Кроме того, такая схема может содержать дополнительные коммутаторы, необходимые для организации работы протокола VRRP.

Рассмотрим второй вариант схемы, где на уровне агрегации используются коммутаторы, поддерживающие функции L3. Тогда в маршрутизаторах и в коммутаторах мультисервисного узла предоставления мультисервисных телекоммуникационных услуг можно задействовать протокол маршрутизации OSPF. Он контролирует состояние каналов, и при выходе из строя одного из каналов переключение на другой занимает менее 1 с. Большинство современных OSPF-маршрутизаторов и коммутаторов поддерживают и алгоритм ECMP; это новейшее дополнение к OSPF обеспечивает равномерное распределение нагрузки по двум каналам. В данном случае всегда активны оба канала и, когда отказывает один из них, затрагивается только половина трафика.

Распределение нагрузки означает также, что теоретически в вашем распоряжении находится суммарная пропускная способность обоих каналов. Однако, если оба канала будут заполнены трафиком, вы не обеспечите полноценной избыточности. При отказе одного канала суммарный объем трафика превысит пропускную способность оставшегося канала, и результаты окажутся непредсказуемыми. Эту проблему в какой-то мере можно смягчить посредством механизмов качества обслуживания (QoS): они позволят пересылать наиболее приоритетный трафик и сбрасывать низкоприоритетный [3].

Критерием исправной работы домена OSPF в данном случае является наличие хотя бы одного маршрута передачи информации между «истоком» и «стоком» (см. рисунок 3) [2]. Предположим, что имеется список возможных маршрутов. Для рассматриваемого варианта ограничимся маршрутами с количеством переходов (hop) не более 3. Увеличение числа переходов в маршруте может привести к необоснованному увеличению задержки. В общем случае маршруты будут зависимы, поскольку любой элемент может входить в несколько маршрутов.

Надежность k-го маршрута Pk можно вычислить по формуле последовательного соединения

Pk =ПPik , (3)

i

где p - надежность (коэффициент готовности) i-го элемента k-го маршрута.

Искомая надежность зависит от надежности каждого маршрута и вариантов их пересечений по общим элементам. Обозначим надежность, которая обеспечивается первыми r маршрутами, через Pr . Добавление очередного маршрута (r+1), с надежностью P , очевидно, приведет к увеличению

структурной надежности, которая теперь будет определяться объединением двух событий: исправен хотя бы один из первых r маршрутов или исправен (г+1)-й маршрут. Вероятность наступления этого объединенного события, с учетом возможной зависимости отказов (r+1)-го и остальных маршрутов, будет определяться по рекуррентной формуле

Pr+1 = Pr + Pr+1 - Pr+1Pr/(r+1) , (4)

где Pr/(r+1) - вероятность исправности хотя бы одного из первых r маршрутов при условии, что (r+1)-й маршрут исправен.

Из определения условной вероятности P-/(r+1)

следует, что при ее расчете вероятность исправной работы всех элементов, входящих в (г+1)-й маршрут, необходимо положить равной единице. Для удобства дальнейших расчетов представим последний член выражения (4) в следующем виде

Pr+1 = Pr + Pr+1 - Pr+1 * Pr , (5)

где символ ( ) означает, что при перемножении показатели надежности всех элементов, входящих в

первые г путей и общих с (г+1)-м маршрутом, заменяются единицей.

При расчетах бывает удобным оценивать неготовность домена Q по следующему рекуррентному соотношению

Й.+1= &-Рг+1*<2Г ■ (6)

При начальном условии < = 1 , на каждом последующем шаге из полученного ранее выражения для вычисления < следует вычесть произведение надежности очередного (г+1) маршрута на это же выражение, в котором показатели надежности всех

Р = ас/ , Р2 = ас/ + bdg - acjbdg , р = ас/ + bdg - acfbdg + ahg - ahg (с/ + bd - cfbd) , Р4 = ac/ + bdg - acjbdg + ahg - ahg (с/ + bd - с/М) + Ы- ЫЬ/ (ac + - acdg + ahg-ahg (с + d - cd))

элементов, входящих в маршрут (г+1), нужно положить равными единице.

Определим связность домена OSPF. Предположим, что все сетевые устройства (узлы графа рисунка 3) исправны. Вероятность такого события равна

/jjjj = . (7)

Индекс 1111 - представляет собой позиционный код, обозначающий исправность всех узлов графа.

При ограничении числа транзитных участков Гтах=3 имеем следующее множество маршрутов {acf, bdg, ahg, bkf}. Тогда, используя выражения (3) и (5), получим

(8)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(6)

Аналогично можно воспользоваться выражением

Ql = 1 - acf , Q2 =(1 - acf )(l - bdg ) , Q3 =(1-acf )(l - bdg )-ahg (1 - cf )(l - bd ),

Q4 = (1 - acf ) (1 - bdg) - ahg (l - cf )x

KzOSPF = ^

hxxxPxxxx

(13)

хххх=0000

Коэффициент готовности уровня агрегации определяется в соответствии с выражением

4

х(1 - bd)- bkf ((1 - ac )(l - dg) - ahg (l - c )(l - d ).

Тогда

Р1111 = P 4 = 1 ^4

(9)

K

гУА

3

Г! K г, ,

(14)

1=1

--P4 = 1 -Q4 • (10)

Предположим, что отказал 1 узел графа (код события 0111). Вероятность такого события равна

70Ш =(1 -Ж1 • (11)

В этом случае вероятность готовности (связности) узла будет равна

(12)

P0111 = b (1 -(1 - kf )(1 - dg ))

Формулы для расчета вероятностей готовности (связности) узла при различных вариантах деградации определяются аналогичным образом. Полученные выражения позволяют определить общий коэффициент готовности домена OSPF

где Kri - коэффициент готовности 1-го кластера уровня агрегации определяемый в соответствии с выражениями (1), (2).

Общий коэффициент готовности узла предоставления мультисервисных телекоммуникационных услуг, построенного по рассматриваемому варианту, определяется по формуле

Кг Z = KгУАKгOSPF • (15)

Проведенные по рассмотренной методике расчеты показывают, что для обеспечения коэффициента готовности узла предоставления мультисервисных телекоммуникационных услуг Кг=0, 99999 необходимо, чтобы коэффициент готовности сетевых устройств (коммутаторов, МСЭ, маршрутизаторов) был не менее 0,9998, а линий связи (link) не менее 0,999.

ЛИТЕРАТУРА

1. Бакланов И.Г. NGN: принципы построения и организации / под ред. Ю.Н. Чернышова. - М.: Эко-Трендз, 2008. - 400с.: илл.

2. ГОСТ Р 53111-2008. Устойчивость функционирования сети связи общего пользования. Требования и методы проверки.

3. Манн С., Крелл М. Linux. Администрирование сетей TCP/IP: Второе издание. Пер. с англ. - М.: ООО «Бином-Пресс», 2008г. - 672 с.: ил.

4. ITU-T Recommendation Y.1541, Network Performance objectives for IP- based services -2002.

5. Ибрагимов Б.Г., Мамедов Ш.М. Отказоустойчивость сигнальных терминалов сетей общеканальной системы сигнализации на физическом уровне. - Труды международного симпозиума «Надежность и качество». - 2008 - №1 с. 35-36.

6. Ибрагимов Б.Г. Метод оценки отказоустойчивости терминальных комплексов систем телекоммуникации. - Труды международного симпозиума «Надежность и качество». - 2007 - №1 с. 209-211.

7. Ковальков Д.А., Шиманов С.Н. Современные технологии обеспечения высокой готовности мульти-сервисного узла доступа. - Труды Российского научно-технического общества, радиотехники, электроники и связи имени А.С.Попова. М.: 2012. - 263 с.

8. Ковальков Д.А., Зимин Н.Г. Особенности развития глобальных сетей с коммутацией пакетов. -Научно-технический журнал «Информационные технологии в проектировании и производстве». - 2008 - №1 с. 99.

УДК 621.391

Пальцев Б.В., Позывайлов В.С., Лещинский А.В., Виноградов С.А.

Военная академия РВСН имени Петра Великого (филиал в г. Серпухове Московской области), Серпухов, Россия

ОБЕСПЕЧЕНИЕ НАДЕЖНОСТИ ПЕРЕДАЧИ ДАННЫХ В ЦИФРОВЫХ КАНАЛАХ РАДИОСВЯЗИ НА ОСНОВЕ НЕДВОИЧНОГО КОДИРОВАНИЯ С ПАКЕТИРОВАНИЕМ ОШИБОК

Рассматривается вариант решения актуальной задачи обеспечения надежности передачи данных в цифровых каналах радиосвязи с пакетированием ошибок на основе синтеза оптимального каскадного недвоичного кода с параметрами [(25,8/5,12),(3,1,3)]. В работе обосновывается эффективность полученного каскадного кода по критериям энергетической эффективности, помехозащищенности и надежности доставки. Для верификации свойств полученного кода был проведен сравнительный анализ помехозащищённости группы кодов, обеспечивающих передачу выборки Б=8, исправляющих пакет ошибок ТИ = 75 двоичных символов и имеющих длину 375 двоичных

символов, в результате которой был подтвержден приоритет кода [(25,8/5,12),(3,1,3)] по критериям помехозащищенности и вероятности ошибочного приёма цифровой выборки для систем радиосвязи, функционирующих в условиях пакетирования ошибок. Длина пакета ошибок, которые гарантированно исправит оптимальный код [(25,8/5,12),(3,1,3)]равна ТП = 75 двоичных символов. Предложенный в качестве оптимального каскадный код [(25,8/5,12), (3,1,3)] технически реализуем. Его декодирование возможно по методу максимума правдоподобия, для этого достаточно иметь запоминающее устройство на 125 и 15 двоичных символов, способных хранить в памяти 256 и 32 кодовых комбинаций. Ключевые слова:

каскадное кодирование, помехоустойчивость, пакетирование ошибок, канал радиосвязи

i Надоели баннеры? Вы всегда можете отключить рекламу.