Представлет теоретичш основи побудо-ви моделей лтшного передбачення часових рядiв, що характеризують функщонуван-ня системи стшьникового зв'язку. Наведет результати дослиджень ефективностi про-гнозування для часових рядiв, отриманих у процеы реально1 роботи мережi мобшьного зв'язку стандарту WCDMA
Ключовi слова: нестащонарний процес, прогнозування
Представлены теоретические основы построения моделей линейного предсказания временных рядов, характеризующих функционирование системы сотовой связи. Приведены результаты исследований эффективности прогнозирования для временных рядов, полученых в процессе реаль-нойработы сети мобильной связи стандарта WCDMA
Ключевые слова: нестационарный про-цесс,прогнозирование
Theoretical bases are presented of construction of models of linear prediction of time series, characterizing functioning of cellular communication network. Results of researches efficiency of forecasting are represented for time series. This results are obtained in real work of mobile communication of standard of WCDMA network
Keywords: nonstationary process, forecasting
УДК 621.396.2:625.316.2
ИССЛЕДОВАНИЕ ВОЗМОЖНОСТЕЙ ПРОГНОЗИРОВАНИЯ ТРАФИКА СЕТИ МОБИЛЬНОЙ СВЯЗИ
В.М. Безрук
Доктор технических наук, профессор, заведующий
кафедрой Кафедра «Сети связи»** Контактный тел.: 067-722-31-18 E-mail: [email protected]
И.В. Корсун
Фирма «Эриксон» г. Киев
Контактный тел.: 067-294-83-69 E-mail: [email protected]
В.А. Тихонов
Доктор физико-математических наук, профессор* Контактный тел.: 067-575-70-36 E-mail: [email protected]
Н.В. Кудрявцева*
Контактный тел.: 093-829-00-25 *Кафедра «Радиоэлектронные системы»** E-mail: [email protected] **Харьковский национальный университет радиоэлектроники пр. Ленина, 14, г.Харьков, Украина, 61166
Введение
При решении задач планирования сетевых ресурсов, а также эффективного управления и оптимизации сети мобильной связи зачастую необходимо прогнозировать возможные сценарии развития поведения сети при изменении параметров эксплуатации. К таковым могут относится: введение в эксплуатацию нового оборудования каналов связи, изменение маршрутизации трафика зональности (кластеризации) контроллеров базовых станций, введение в сервис новых мультимедийных услуг и дополнительных сервисов. Поэтому актуальным является применение математических методов, позволяющих на основе статистики, собранной автоматизированными измерительными комплексами, выполнить прогнозирование изменения характеристик сети.
В данной статье представлены теоретические и практические аспекты построения моделей линейного прогнозирования временных рядов, характеризующих функционирование сети сотовой связи. Адекватность построенных моделей проверялась по эффективности прогнозирования временных рядов, накопленых в процессе реальной работы сети сотовой связи стандарта WCDMA. Представлены некоторые результаты исследований эффективности прогнозирования на примере трафика передачи данных абонентов вниз.
1. Анализ исходных данных о функционировании сети сотовой связи
Анализировались следующие данные о функционировании сети сотовой связи: запросы на установление
высокоскоростной сессии передачи данных, успешно установленные высокоскоростные сессии передачи данных, попытки установления вызова, отвеченные вызовы, проключенные вызовы, трафик передачи данных абонентов вверх и вниз, статистика передачи данных по радиоподсистеме, на одной сектор-несущей частоте для одной базовой станции. В настоящей статье представлены результаты исследования и прогнозирования лишь для некоторых данных - трафика передачи данных абонентов вниз.
Данные о функционировании сети сотовой связи связи стандарта WCDMA за 222 суток, полученные для трафика передачи данных абонентов вниз через каждые 30 минут, приведены на рис. 1. Предварительный анализ данных показывает, что они имеют нестационарность в виде тренда и две сезонные составляющие. В данных ярко выражена сезонная составляющая, связанная с суточной периодичностью интенсивности переговоров. Наблюдается также устойчивая сезонная составляющая с недельным периодом. Растущий тренд интенсивности трафика хорошо заметен на графике просуммированных за каждые сутки трафика передачи данных (рис. 2). Однако в целом тренд неоднороден, так как в нем присутствуют участки с разной скоростью роста и даже спада.
Рис. 1. Трафик передачи данных
и успешно установленных высокоскоростных сессий передачи данных. У этих близких по характеру изменения данных циклы менее устойчивы как по периоду, так и по амплитуде колебаний. Кроме того, их суточные тренды менее однородны, чем у других данных, что существенно влияет на точность прогноза.
2. Выбор и обоснование математической модели данных
Анализ прогнозируемых данных и их статистических характеристик показал, что на первом этапе исследований рационально использовать модели линейного предсказания. Для синтеза модели линейного предсказания интерес представляют статистические характеристики коррелированных стационарных данных, характеризующих функционирование системы. Анализ этих данных затруднен наличием сезонных колебаний процесса и трендом. Внутрисуточные колебания интенсивности приводят к тому, что корреляционная функция процесса описывает в основном сезонные колебания и тренд. Для получения модели стационарного процесса необходимо вначале устранить тренд и сезонные колебания.
Полная модель нестационарного процесса, используемая для прогнозирования, будет мультипликативно включать модели стационарной, трендовой и сезонной составляющих.
Нестационарные данные, характеризующие функционирование системы сотовой связи, рационально моделировать процессами авторегрессии-про-интегрированного скользящего среднего (АРПСС) [1]. Для исключения сезонной составляющей применяется упрощающий оператор взятия разности
= 1 -z-s, где z-s - оператор сдвига, действие которого определяется выражением z-sx[t] = х^ - 8]. Так как прогнозируемые данные представляют собой значения интенсивности за каждые 30 минут, то для исключения внутрисуточных колебаний нужно выбрать 8 = 48 , т.е. сдвиг равный количеству отсчетов за одни сутки. После действия оператором на исходный процесс
Ю1 И = У5х= х^]-х^-48],
(1)
получаем новый случайный процесс ю1 [^ без вну-трисуточных колебаний.
Для устранения тренда используется метод, применяемый для синтеза нестационарных моделей АРПСС [1], основанный на применении к случайным процессам с трендом оператора взятия разности
юМ=^ах И=(1 - ^х М ,
(2)
Рис. 2. Трафик передачи данных, просуммированных за каждые сутки
Другие данные о функционировании сети имеют подобные характеристики, за исключением запросов
где <1 - порядок стационарных приращений процесса.
Для линейного тренда полагаем <1 = 1, а для квадратичного необходимо брать <1 = 2 . Заметим, что для нестационарных процессов с произвольным законом изменения тренда применение этого метода дает существенные погрешности прогноза. Для линейных
участков тренда (рис. 2) из (1) с учетом (2), получаем при <1 = 1
ю2 [^] = Ую1 [t -1]. (3)
Исключение из нестационарного процесса сезонной составляющей и тренда позволяет синтезировать модели линейного предсказания стационарного процесса. На графике корреляционной функции процесса трафика передачи данных абонентов вниз, представленной на рис. 3а, видно, что в процессе присутствуют значимые корреляции для малых сдвигов времени. Кроме этого, вблизи сдвига 48 отсчетов наблюдаются отрицательные значения корреляции. Анализ корреляционной функции при больших сдвигах указывает на цикличность корреляционной функции, которая наблюдается для сдвига равного недельному интервалу Тн = 48 х 7 дней = 366 отсчетов. При долгосрочном прогнозе для устранения этой сезонной составляющей можно также использовать упрощающий оператор У5, где 8 = 336.
Для сезонных процессов с трендом существует проблема выбора подходящей модели из множества возможных. Как показали исследования, для анализируемых данных при краткосрочном прогнозе нестационарная модель, соответствующая корреляционной функции (рис. 3), имеет вид
(1 - z48)(1 -Фй)хИ = аИ, (4)
где Ф - коэффициент модели авторегрессии (АР) первого порядка стационарного процесса ю2 [^ . Тогда сезонная модель описывается разностным уравнением
хМ = Фх^ -1] + х^ -48] - Фх^ - 49] + a[t]. (5)
тим, что применение нелинейного логарифмического преобразования уменьшает разброс данных для больших интенсивностей трафика, но увеличивает разброс данных при низких интенсивностях. На графике корреляционной функции (рис. 3б) прологарифмированного процесса х^] видно, что уменьшились колебания корреляционной функции относительно нулевой линии, а при сдвиге 48 ее значения стали более значимы. Для такой корреляционной функции можно применить более точную модель АР первого порядка.
3. Методы прогнозирования процессов функционирования сети
Рассмотрим теоретические и практические особенности прогнозирования процессов функционирования сети мобильной связи. Прогнозы с использованием разностного уравнения получаются с минимальной среднеквадратической ошибкой на момент t с упреждением 1. Известно [1], что такой прогноз есть условное математическое ожидание х^ +1] в момент ^ при условии, что все х[^ до момента t известны. Условные математические ожидания случайных величин, входящих в (5), равны
г г Гх[t + Л, i <0, г г Га[t + i], i < 0,
{х ^ + 1 {а [t + ±]} = ^ 1 '(7)
1 1 11 + i], i > 0, 11 11 [0, i > 0,
где X[t + ^ - прогноз х[^ в момент t на i шагов.
Разностное уравнение, применяемое для прогноза на момент t на 1 шагов, получим из (4)
х^ +1] = Фx[t +1 -1] + х^ +1 -48]-Фх^ +1 -49] + аМ (8)
Выражение для расчета Ф получим, умножив (5) на х^ -1] и усреднив. В результате преобразований получим
Ф=
R[47] - R[1] R[48] - R[0]
(6)
а) б)
Рис. 3. Корреляционная функция процесса ю2 [^ трафика передачи данных: а - для данных без предварительного логарифмирования, б - для логарифмов данных
В ряде случаев для анализа временных рядов, а также при решении задачи прогнозирования, применяется предварительное нелинейное преобразование данных. В данной работе прогнозирование проводилось как по исходным данным, так и по их нелинейно преобразованным значениям. Заме-
Краткосрочный прогноз на упреждение 1 получаем как условное математическое ожидание от (8). Выражения для прогноза для разных упреждений 1 с учетом (7) принимают вид:
х^ +1] = ФхИ + х^ - 47] - Фх^ - 48], 1 = 1,
х^ +1] = Фх^ +1 -1] + х^ +1 - 48] - (9)
-Фх^ +1 -49], 2 < 1 < 48,
х^ + 49] = Фх^ + 48] + х^ +1] - ФхИ ,1 = 49,
х^ +1] = Фх^ +1 -1] + х^ +1 - 48]-Фх^ +1 - 49], 1 > 49.
Формулы для коррекции и дисперсии ошибки прогноза выражаются через импульсную характеристику линейной системы, описываемой разностным уравнением (5). Процесс на выходе линейной системы с импульсной характеристикой Ь [^ может быть представлен в виде свертки
х М = Ьфа М = £ Ь[ф [t - i].
(10)
Подставляя (10) в (4) и приравнивая коэффициенты при одинаковых z-1, можно получить выражения для вычисления импульсной характеристики линейной системы.
0
Информационно-управляющие системы
Ошибка прогноза для упреждения 1 равна [1] е^ +1] = а^ +1] + Ь[l]a[t +1 -1] + ...+Ь[1 - 1]а[t +1] . (11)
Прогноз будет несмещенный, так как условное математическое ожидание ошибки прогноза удовлетворяет равенству е^ +1] = 0. Дисперсия ошибки прогнозирования Da находится из (11)
De (1) = (1 + Ь2 [1] + Ь2 [2] + .+Ь2 [1 - 1])^.
При доверительной вероятности 1 -£ , интервальная оценка прогноза х^ +1] определяется соотношением [2]
( '-1 ^ ф +1](±) = х^ +1]± И + ХЬ2 I о„
где оа - среднеквадратическая ошибка прогнозирования, и1-е/2 - квантиль нормального распределения уровня значимости £.
4. Результаты исследований возможностей прогнозирования трафика
Ниже представлены результаты краткосрочных прогнозов трафика передачи данных сети сотовой связи с учетом сезонной составляющей с периодом 48 отсчетов. На рис. 4 представлены графики прогнозов логарифмов данных трафика передачи данных абонентов вниз. Для прогноза использовались модели АР первого порядка с коэффициентом Ф = 0,7728. Прогнозы с использованием предварительного нелинейного предсказания более точны в наиболее интересной области - при высокой интенсивности трафика. Неточности прогноза в области низкой интенсивности также могут дать существенный вклад в дисперсию погрешности прогноза.
предыдущих циклах, которое имеет обратный знак. Поэтому точность прогноза зависела от положения цикла, с которого начинался прогноз и от длины прогноза.
Исследовалась зависимость ошибки прогноза от положения начального цикла прогноза. Интервал прогноза составлял 336 отсчетов, а корреляционная функция рассчитывалась по предшествующим 200 отсчетам.
На рис. 5 показана зависимость дисперсии ошибки прогноза при сдвиге начала прогноза на сутки (48 отсчетов). Дисперсия ошибки прогноза вычислялась по формуле
11-
ад=т£ [(х(1) - х(1)) - (х(1) - х )]2.
1 м
Из данных трафика следует, что в субботу и воскресенье трафик существенно меньше, чем в будние дни. Поэтому если прогноз на будние дни строится по данным субботы или воскресенья, то это существенно увеличивает дисперсию прогноза. На точность прогноза заметное влияние оказывают аномальные значения вблизи верхних (в дневное время суток) и нижних (в предутреннее время суток) значений трафика. Поэтому значения дисперсии погрешности прогноза на графике рис. 5 не имеют строгой недельной цикличности.
Рис. 4. Прогнозирование прологарифмированной выборки данных трафика передачи данных абонентов вниз
Анализ показал, что точность прогноза существенно не зависит от коэффициентов АР. Это связано с тем, что в выражении (5) первое слагаемое компенсируется третьим слагаемым, при достаточно близких значениях соответствующих данных в
Рис. 5. Изменение дисперсии прогноза на неделю вперед от начала прогноза
Как отмечалось выше, кроме суточного цикла, в данных присутствует недельный цикл. Поэтому рационально построить модель линейного предсказания недельных данных и получить среднесрочный прогноз на несколько недель вперед. Если на этом интервале трендом данных можно пренебречь, то можно использовать модель
(1 - z336)(1 -Фz)x[t] = аМ.
Из этого уравнения следует, что разностное уравнение, применяемое для прогноза на момент t на 1 шагов имеет вид
х^ +1] = Фх^ +1 -1] +
+х^ +1 - 336] - Фх^ +1 - 337] + аЩ
Восточно-Европейсний журнал передовых технологий 4/9 ( 46 ) 2010
Выражение для расчета коэффициента АР получается из (12)
Выводы
Ф
R[0] - R[335] R[0] - R[336]
Исследовалась точность прогноза от положения начального цикла прогноза. Интервал прогноза составлял 672 отсчета (2 недели), а корреляционная функция рассчитывалась по предшествующим 200 отсчетам. На рис. 6 показана зависимость дисперсии ошибки прогноза при сдвиге начала прогноза на сутки (48 отсчетов). На дисперсию ошибки среднесрочного прогноза оказывает влияние наличие неустойчивого тренда. Поэтому дисперсия ошибки вначале растет, а потом падает.
Рис. 6. Изменение дисперсии прогноза данных на 2 недели вперед от начала прогноза
1. Проведен статистический анализ реальных данных о функционировании сети мобильной связи стандарта WCDMA.
2. На основе результатов анализа данных проведено обоснование и выбор математической модели линейного предсказания для адекватного описания реальных данных и прогнозирования процессов функционирования сети мобильной связи.
3. С использованием накопленных данных о функционировании сети мобильной связи исследованы практические возможности и особенности прогнозирования трафика при различных исходных условиях.
4. Получены положительные результаты прогнозирования трафика, которые могут быть использованы для эффективного управления и оптимизации ресурсов в процессе функционировании сети мобильной связи.
Литература
1. Бокс Дж., Дженкинс Г. Анализ временных рядов: Пер. с.
англ. - М.: Мир, 1974. - Вып.1. - 406с.
2. Боровиков В.П., Ивченко Г.И. Прогнозирование в системе
STATISTIKA в среде Windows. - М.: Финансы и статистика, 1999. - 384 с.
3. Montgomery D.C., Johnson L. A., Gardiner J. S. Forecasting
& Time Series Analysis. - McGraw-Hill Inc., 1990. - Р. 384.