А.В. Душкин, Ю.В. Щербакова,
доктор технических наук, доцент. Воронежский институт ФСИН
Воронежский институт ФСИН России России
МЕТОДЫ РАСЧЕТА И АНАЛИЗА ПРОЦЕССОВ ОБРАБОТКИ ЗАПРОСОВ В ВЕДОМСТВЕННОЙ СЕТИ
METHODS OF CALCULATION AND ANALYSIS OF THE REQUEST HANDLING PROCESSES IN A DEPARTAMENTAL NETWORK
Представлена модель обработки запросов к распределению баз данных для автоматизированных информационных систем. Показан агрегативный подход для разработки систем; в качестве агрегатов применены объекты, с помощью которых генерируются и преобразуются моделируемые процессы. Показана динамическая связь между этими агрегатами.
The model of the query to the distribution database for automated information systems is presented. The aggregativ e approach to systems dev elopment is shown. As aggregates are used the objects with which the simulated processes are generated and transformed. The dynamic relationship between these units is shown.
В настоящее время интенсивно проводятся работы в сфере комплексной информатизации подразделений и органов силовых ведомств. Основу процессов информатизации составляют автоматизированные информационные системы (АИС). Цель внедрения этих систем в практику состоит в повышении оперативности и обоснованности принимаемых решений. Накопление, хранение и выдачу информации для решения задач управления в автоматизированном режиме обеспечивают интегрированные системы хранения и обработки данных. Территориальная удаленность элементов системы управления определяет необходимость построения и использования распределенных баз данных (РБД). Очевидно, что временные показатели процессов решения задач в существенной степени зависят от характеристик РБД. В связи с этим оценка оперативности АИС и своевременности информационного процесса в системе управления требует построения и использования двухуровневого комплекса математических моделей. На нижнем уровне анализу подлежит процесс обработки запросов к РБД с целью оценки реактивности базы данных. Результаты этой оценки должны выступать в качестве исходных данных для получения интегрированных характеристик на верхнем уровне, что способствует получению вероятностно-временных показателей процесса решения задач управления в АИС.
Целью работы является разработка методов расчета и анализа процессов обработки запросов в автоматизированной информационной системе, с помощью которых можно оценить реактивность распределенных баз данных, и соответственно получить вероятностно-временные показатели процесса управления АИС.
Автоматизированные информационные системы по характеру функционирования относятся к стохастическим сетям массового обслуживания. Сеть представляет собой совокупность взаимосвязанных систем массового обслуживания (СМО), каждая из которых интерпретирует один из элементов АИС.
Основным показателем оперативности функционирования подобных сетей является функция распределения времени между поступлением и удовлетворением запроса и/или его моменты [1].
АИС как стохастическая сеть массового обслуживания, определяется следующей совокупностью характеристик:
множеством СМО $2 ■■£п}, образующих сеть;
числом каналов ^ К 2:Х„ в системах $1, $ 2^„ соответственно;
где Г:: — номер СМО, на кото-и
матрицей траекторий движения заявок Я = рую переходит заявка, продвигающаяся по /-му пути на у -й фазе обслуживания при детерминированной процедуре маршрутизации, или матрицей вероятностей перехода за-
Р
где Р/у — вероятность того, что заявка, поки-
явок из одной СМО в другую Р = дающая Б,, поступает в Б .■;
1 J
числом заявок, циркулирующих в замкнутой сети ^);
интенсивностью источников заявок в разомкнутой сети Л = \Л]^)}, где ] — тип заявки; к — категория срочности;
законами распределения времени ^(к \г), ^(к \г ),....Р„(к \г) и дисциплинами обслуживания заявок в системах Б^,Б^...»^.
Элементами, участвующими в обработке запросов к РБД и представляющими различные СМО, являются:
сети передачи данных (моноканалы) локальных вычислительных сетей, входящих в состав общей сети АИС;
серверы базы данных (СБД), на которых размещены фрагменты данных; коммутационные устройства, обеспечивающие обмен данными между удаленными узлами;
каналы передачи данных.
Помимо числа обслуживающих приборов, каждый тип СМО характеризуется следующими параметрами [2]:
(к)
интенсивностью обслуживания заявок т] , где I — тип системы; ] — тип
заявки; к — ее категория срочности;
длиной очереди (если таковая имеется);
я (к) я (к)
интенсивностями входного Яд и выходного потоков заявок;
механизмом дообслуживания прерванных заявок.
Заявки описываются вектором V = (?,к,],d,а^,^2), где t — время поступления заявки в сеть массового обслуживания; к — категория срочности; ] — тип; d —
длина; а^ и а2 — адреса отправителя и получателя соответственно.
Расчет показателей реактивности РБД сводится к отысканию функции распределения времени пребывания заявок в сети. Как показано в теории распределений, для удовлетворительного описания функции распределения случайной величины достаточно найти первые четыре центральных момента этой величины и при необходимости аппроксимировать закон распределения с помощью семейств кривых.
При построении модели целесообразно применить агрегативный подход. В качестве агрегатов выступают объекты, с помощью которых генерируются и преобразуются моделируемые процессы. Для моделирования процесса обработки запросов к РБД, представленной в виде сети массового обслуживания, в качестве агрегатов выступают: источники заявок, системы массового обслуживания и управляющие процедуры. Учитывая конкретную предметную область, можно выделить конечное множество типовых агрегатов — СМО, интерпретирующих элементы АИС, а также источники заявок в со-
ответствии с типами запросов, поступающих в систему. По своей сути эти агрегаты представляют собой модели источников запросов и элементов АИС. Динамические связи между этими агрегатами осуществляются с помощью процедуры, моделирующей процесс движения заявок и выполняющей функции коммутации входов и выходов агрегатов. В качестве результатов моделирования выступают значения показателей реактивности РБД и характеристики необходимые для работы модели верхнего уровня.
В модели верхнего уровня процесс решения задачи в АИС представляется ориентированным графом, узлы которого отображают операции по обработке запросов к РБД, а дуги — связи между операциями (рисунок).
Граф процесса решения задачи Узел 0 является начальным, а узел к + 1 — конечным. Каждому узлу ставится в соответствие вектор, определяющий параметры закона распределения времени его обработки. Дуги характеризуются вероятностями Ркі перехода от к-го запроса к 1-му
(к = 0, К; і = 1, К + 1) . Если из узла выходит единственная дуга, то переход по ней идет с вероятностью, равной 1. Если из узла выходит несколько дуг (к, і), (к, т), ...,(к, м) , то выбор направления рассматривается как случайное событие, характеризуемое вероятностями исходов Ркі, Ркт, ■■■,Ркм, причем X Рку = 1.
У=1
Исследование представленной модели с помощью аппарата марковских цепей сводится к расчету числовых характеристик многомерной случайной величины X = (х^ Х2,..., Хм) — количества попаданий случайного процесса в состояния
^1, S2,■■■, , соответствующие выполнению запросов [3]. На основе законов распре-
деления времени обработки запросов определяются вероятностно-временные характеристики процесса решения задач.
Следует отметить, что неотъемлемым свойством непрерывного марковского процесса является экспоненциальность распределения времени пребывания запроса в
состоянии Sk (к = 0, К +1).
В общем законы распределения времени выполнения запросов отличны от экспоненциального. Применительно к нашему случаю процесс решения задач описывается с помощью вложенных марковских цепей (полумарковский процесс). Характеристики полумарковского процесса определяются значительно сложнее, чем для марковского процесса, и вычисление стационарных вероятностей состояний выливается в сложную математическую задачу. Граф, описывающий процесс решения задачи, может быть интерпретирован разомкнутой сетью массового обслуживания, в которой характеристики законов распределения времени обработки запросов определяются на представленной ранее модели. Узел 0 представляет собой источник заявок, а узел к +1 — выход из сети. Конкуренция заявок за ресурсы АИС учитывается во временных параметрах узлов, что позволяет рассматривать процесс решения различных задач, а также одной и той же задачи в разные моменты времени независимо друг от друга.
Для определения функции времени пребывания заявок в сети достаточно знать первые четыре центральных момента этой величины. Дальнейший переход к искомой функции осуществляется с помощью семейств кривых, охватывающие различные виды распределений, конечных рядов и т.д.
Использование взвешенного суммирования при решении такой задачи требует существенных затрат вычислительных ресурсов для многократного нахождения величины ^ (/ £ !аи ). Упростить решение данной задачи позволяют особенности исследуемой сети массового обслуживания:
в произвольный момент в сети присутствует только одна заявка и никакая другая не поступает на вход до тех пор, пока не будет обслужена предыдущая;
при обслуживании заявка продвигается строго по одному пути, определяемому вероятностью его выбора.
Учитывая эти особенности, можно рассматривать сеть как состоящую из независимых путей. Поскольку операция взвешенного суммирования применима по отношению к законам распределения случайных величин, уместно предположить возможность ее использования и для нахождения некоторых других числовых характеристик времени пребывания заявки в сети [4]. В доказательство этой гипотезы решим следующую задачу.
Предположим, что дано множество случайных величин ^, X2,...,Хт , для которых указаны их возможные значения X . = {X}. (/ = 1, п; ] = 1, т) и соответствующие им вероятности (Р]=р (Х] = х/)).
] =1
й начальный момент
множества
начальный момент ] -й случайной вели-
чины, входящей в множество, а] — весовой коэффициент этой величины, выбранный
т
при условии ^ аі = 1 ■
(г) т
По определению начальных моментов Мк = X а, . Так как события
]='1
X] = Х1, X] = X2, ..., X] = хп образуют полную группу попарно несовместных соп
бытий, то 2 Р] = 1 .
/■=1
Обобщая на случай множества случайных величин, получим
Мк) = Ъкр, , где Р, = Р^, V X2 V ... V Xт ) = X, ]. (1)
Учитывая, что события, заключающиеся в выборе различных случайных величин из множества, несовместны, а выбор одной из величин и выпадение ее возможного значе-
т
ния есть события независимые, можно записать Р, = X Р]Р] , где р. — вероятность
] =1
выбора случайной величины X ..
Следовательно,
(,) п к т п т к т п к т п к т (,)
Щ = Iх I ЕР]Р] = ЕЕXРгРг] = I ГX Р]Р] = IР]Iх/ Р] = ГР]Щ]’. (2) /=1 ]=1 1=\]=\ ]=1/=1 ]=1 /=1 ]=1
Для несовместных событий выбора случайной величины X . из множества вы-
т
полняется условие Е Р ] = 1 , поэтому вероятности Р ] являются весовыми коэф-
]=1
фициентами а. (] = 1,т) и справедливо утверждение
Мк > = 1р]М1] >. (3)
]=1
Применительно к исследуемой сети можно утверждать, что к -й начальный момент времени пребывания заявки в сети равен взвешенной сумме начальных моментов того же порядка времени прохождения каждого из путей, причем в качестве весовых коэффициентов используются вероятности выбора путей.
Значения начальных моментов времени прохождения / -го пути М,^) могут быть получены на основе выражения:
Г (г (*ж (/)
-5 (м(г) У. (4)
Для Г = 1,4 имеем
1) м1'>=м<?>,м3;> = м3?>+зм2°)м;/> +(м<;))5,
2) м2/. > = м2?> +(м2/ > )2
М4/1 = М4?1 + 4М4?)M\(/) + 6М2?» (м\,; 1 ^ + М()4 , (5)
где мГ) — г-й начальный момент случайной величины ; мГ/ ) — г -й центральный момент той же величины.
Таким образом показано, что начальные моменты к-го порядка множества случайных величин равны взвешенной сумме начальных моментов того же порядка входящих в множество величин при условии несовместности событий выбора случайных величин. Дуальность свойств моментов позволяет оперировать только этими числовыми характеристиками при вычислении промежуточных расчетов и однократно вычислять значение функции распределения времени пребывания заявки в сети массового обслуживания.
В вопросе о восстановлении функции распределения широкое распространение получил метод кривых Пирсона. В основе метода лежит нахождение выражений для функции плотности случайной величины по значениям первых четырех центральных моментов и дальнейшее численное интегрирование этих выражений, так как для основных типов распределений интегралы от функций плотности через элементарные функции не выражаются. В общем виде функция распределения может быть описана как
х
Р(х) = {1 + ехр[- 0(х)]}- , где 0(х) = {g(t)dt. (6)
о
Здесь ^(1) — некоторая функция, которая должна быть неотрицательной при 0 £ Р(х) £ 1 и в области изменения х .
Существует ряд функций, таких как П, С 1, ((с — t)), С + Бес2 t, СX ск{(), где С > 0, для которых интеграл на интервале — ¥ < х < ¥ таков, что 0 £ Р(х) £ 1. При этом задача аппроксимации сводится к отысканию функции g (^), через которую находятся значения функции Р(х).
Известны функции, удовлетворяющие признакам функции распределения. Среди них следующие:
II * 0 £ х £ 1 (7)
\ ^ + х 1 II — ¥ £ х £ ¥ (8)
\ ^ + к 1 х II 0 £ х £ ¥ (9)
Р(х) = (ке - ^х +1)— Г, р/2 £х £р/2 (10)
Р (х) = (ке - с'фх +1)~Г, — ¥ < х < ¥ (11)
Р (х) = 1 — (1 + хП)“к, 0 £ х £ ¥ (12)
и другие, причем П, к и Г — некоторые положительные константы.
В общем случае вычисление значений функции распределения включает в себя три этапа: выбор типа функции, определение параметров распределения, расчет значения функции.
Для отыскания функции Р(х) требуется найти ее параметры п, к и г через значения числовых характеристик, таких как среднее значение (х), стандартное отклонение (^), параметр асимметрии Ш) и параметр эксцесса (Ь) • в еличины 4Ж и
Р2 находятся по соотношениямЛ/Ь" = тз/д/т|"; ь = , где Шк — к -й цен-
тральный момент случайной величины (к = 2, 4).
В своей сущности метод основан на вычислении кумулятивных моментов, определяемых [5] как
¥ 0
М ] = {х} [1 - ^(х)\ёх - {х} ^(х)ёх, (13)
0 ¥
и перехода от них к значениям X, О, л/А? Рг-
С точки зрения практического использования особый интерес представляет функция
/ \ [ 0, X < 0
р (х ) = \ ( С Vк Л (14)
|_1 -(1 + хс) , х > 0.
Вычисленные для этой функции возможные значения д/Р" и Рг образуют широкий диапазон, который охватывает многие распределения. При этом в область этих распределений попадают только функции плотности колоколообразного вида, к которым относятся и функции плотности времени пребывания заявок в сети.
Применительно к функции выражение для нахождения кумулятивных моментов выглядит следующим образом:
М = ■
А \ ] +1] А 1 1 + |
С С
С А (к)
(15)
где А — гамма-функция, ] = 0,1,..., кроме ] < С к — 1, Пи к — действительные числа, лежащие на оси от 1 до ¥ .
Полагая т]) = ]Мj -1(] > 0) и
т]) = ] Т!\—1'1 (- М0 )гМ]-1-г+(-М 0)] (] > 1), (16)
]=0^ 1 )
получим соотношения для первых четырех центральных моментов распределения
т1(й) = т§) = М0, т(3д) = 3М2 -12М1М0 + 2М03, (17)
т{°) = 2М1 = М02, т{°) = 4М3 - 12М2М0 + 12М1М02 -3М04, (18)
от которых осуществляется переход к параметрам х, О, .^Д", Д2и далее к коэффициентам с и к.
Таким образом, в ходе исследования разработаны модель реализации запросов в РБД, построенная на основе представления процесса обработки запросов с позиций обслуживания заявок в стохастической сети массового обслуживания, и модель решения задач в АИС, основанная на методах теории распределений, таких как метод моментов и метод аппроксимации функции распределения. Представленные методы расчета и анализа процессов обработки запросов в сети позволяют объективно оценить реактивность баз данных, а это способствует получению точных вероятностно-временных показателей процесса управления автоматизированными информационными системами в территориальных органах и подразделениях силовых ведомств.
ЛИТЕРАТУРА
1. Васильев К.К., Служивый М.Н. Математическое моделирование систем связи: учебное пособие. — Ульяновск: УлГТУ, 2008. — 170 с.
2. Каштанов В. А., Кондрашова Е. В. Анализ входного потока, управляемого цепью Маркова // Надёжность. — 2012. — №°1 — С. 52 — 68.
3. Емельянова Н.З., Партыка Т.Л., Попов И.И. Основы построения автоматизированных информационных систем: учеб. пособие. — М.: Форум, Инфра- М, 2011. — 158 с.
4. Автоматизированные информационные технологии / под ред. В.Б. Либермана, А.И. Никифорова. — М.: Инфра- М, 2010. — 348 с.
5. Бояринов Ю.Г., Дли М.И., Круглов В.В. Оценка диапазона возможных значений вероятности пребывания в заданном состоянии марковской модели производственно-экономической системы // Программные продукты и системы. — 2009. — № 4. — С. 88—91.