УДК 519.2
ОБОБЩЕННЫЕ ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН
АВРАМЕНКО В.В.,КАРПЕНКО А.П.
Предлагаются новые числовые характеристики случайных величин, обобщающие ряд свойств энтропии и математического ожидания. Их применение упрощает оценивание изменений вида кривых плотностей распределения и их положений на числовой оси. Это, в частности, позволяет упростить исследование систем стохастических объектов.
Существует класс задач, для решения которых требуется числовая характеристика, определяемая видом кривой плотности распределения случайной величины, а также ее положением на числовой оси. Например, необходимо количественно оценить эффект от управляющего воздействия на технол огичес -кий процесс, описываемый значениями нескольких независимых случайных величин (режимных параметров) . Результатом воздействия может быть изменение кривых плотностей распределения некоторых из них при постоянных математических ожиданиях. Для других случайных величин кривые плотности распределения только переместятся параллельно самим себе вдоль числовой оси. А в общем случае могут одновременно изменяться как кривые плотности распределения, так и математические ожидания случайных величин. Эти изменения для каждой из случайных величин можно оценить в отдельности, сравнивая энтропии и математические ожидания до и после воздействия. Однако для решения приведенной задачи требуется одна обобщенная числовая характеристика, которая для случайной величины X, подобно энтропии, определялась бы через плотность
распределения fx (x)Ап и одновременно, подобно математическому ожиданию, отражала положение случайной величины на оси OX.
Чтобы оценить суммарный эффект от управляющего воздействия, нужно для каждой контролируемой случайной величины найти значения требуемой обобщенной числовой характеристики до и после этого воздействия, вычислить приращения и сложить их модули. Естественно, это можно сделать лишь в том случае, если обобщенная числовая характеристика будет измеряться в единицах, не связанных с единицами измерения случайных величин. Такой единицей может быть БИТ, ДИТ, НИТ как у энтропии, т.е. обобщенная числовая характеристика должна быть информационной.
1. Постановка задачи
Требуется разработать обобщенную числовую характеристику случайной величины, отвечающую следующим требованиям:
1. Она должна быть интегральной, т.е. ее текущее значение в фиксированный момент времени t должно вычисляться по всем значениям плотности распределения fx (x) А п случайной величины Xв области ее исследования.
2. Изменение кривой fx (x)Ап должно приводить к соответствующим изменениям обобщенной числовой характеристики.
3. Значение этой характеристики должно изме -
няться, если кривая fx (x) Ап перемещается параллельно самой себе вдоль числовой оси OX.
4. Обобщенная числовая характеристика должна быть информационной, т.е. измеряться в БИТ, ДИТ, НИТ.
2. Решение задачи
Известной числовой характеристикой, измеряемой в БИТ, ДИТ, НИТ, является энтропия. Однако
она не чувствительна к положению кривой fx (x)Ап на оси OX и поэтому не отвечает условию 3.
В принципе, оценку, обобщающую некоторые свойства энтропии и математического ожидания, можно получить, введя в подынтегральное выражение для усредненной энтропии абсолютное значение случайной величины. Например, для непрерывной величины Xв случае, когда весь диапазон ее значений разбит на
участки величиной А п, можно получить оценку
” (x)
U [x] = — lim J J і. log[ fx (x) Агп/ix . (i)
Ап^-0 —да lxl
Однако она измеряется в бит/ед. измер. X и не отвечает требованию 4. Это требование можно выполнить, если под интеграл в (1) вместо |x| ввести
/og|x\. Но такое решение, помимо нежелательного вычисления логарифма от размерной величины, имеет недостаток, который заключается в зависимо -
сти знака /og|x| от значения |x|. В результате оценка
(1) становится зависимой от того, является ли |x| меньше или больше единицы. Это затрудняет выделение информации об изменении кривой fx (x) А п и ее положении на оси OX.
Требование 4 можно также удовлетворить, убрав
под интегралом в (1) сомножитель fx (x) Ап. В результате получим оценку
I[x] = — lim J |-| log[fx(x)Ап]dx. (2)
Ап^-0 —да lxl
Логарифм fx (x) Ап представляет собой вероятность попадания Xв интервал шириной Ап в зависимости от положения этого интервала на оси OX. Эта вероятность всегда < 1, значит, при fx (x)Ап^■ 0 log[fx (x)Ап] ^ —да. Отсутствие под интегралом в (2) сомножителя fx (x)Ап приводит к тому, что веса малых значений fx ( x) А п неоправданно большие по модулю. Вследствие этого изменения кривой fx (x) Ап в области величин fx (x) Ап, заметно превышающих
136
РИ, 1998, № 3
нуль, будут практически незаметными при вычислении оценки (2).
Чтобы устранить этот недостаток, необходимо под логарифмом в (2) иметь всегда положительное число, больше единицы. При этом отпадает необходимость ставить минус перед интегралом. Такому требованию отвечает оценка, предложенная в [1] без обоснования ее вида. Для фиксированной в момент
времени t плотности распределения fx (x, t) случайной величины X эта оценка имеет вид
GI[ x, t ] = J і1 log fx (X ,t) dx (3)
fx (xSЛ , W
здесь Ax — погрешность измерения для fx (x) A n . При получении статистической плотности рас-
пределения fx*( x, t) значение Л: ется как
1
^АПопределя-
Л =
1
(3а)
NAn ’
где N — общее количество значений случайной величины, использованных для получения f* ( x, t);
An - имеет тот же смысл, что в (1).
Наименьшая различимая частота попадания точек в интервал An равна 1/N. Отсюда и следует выра-
жение (3а) для Ах . При известной теоретической fx (x, t) значение Ax задается исследователем в зависимости от решаемой задачи. Фактически от Ax зависит смещение начала отсчета оценки (3) на
величину
[log Ax ] J
f ( x ,t )>Л
dx
Ixl
Таким образом, для случайного X в качестве информационной обобщающей числовой характеристики предлагается использовать оценку (3). Обозначим ее GIот английского generalized information.
Для системы случайных величин Xи Y, описываемой плотностью распределения f(x,y), информационная обобщенная числовая характеристика предлагается в виде
GI [ X, Y ]
J
f (x) >Л
1
Ixl
log fixІ dx +
Ax
+ J
f (y\x)>Лу
1 , f (y\x) , уlog 1— dy
(4)
здесьf(y\x) - условная плотность распределения; Лу
имеет тот же смысл для f(y\x), что Ax для fx (x)A n . Для системы независимых случайных величин х1,
Х2, ...Xn
n
GI[xi, x2,... xn ] = X GI[xj ]. (5)
j = 1
Свойства информационной обобщенной числовой характеристики (3) рассмотрим на примере равномерного и нормального законов распределения
(рис. 1,2). Характерно, что приах ^ 0 (рис.2)
GI[x] ^ 0 . Следует отметить, что при практическом вычислении GI[x], во избежание деления на нуль, из области интегрирования fx (x) > Ax в окрестности нуля вырезается интервал (-8Х ,5Х ) . Конкретная величина \$х\ назначается исследователем в зависимости от решаемой задачи.
a=const; a=5
Рис. 1. Зависимость информационной обобщенной числовой характеристики от математического ожидания: 1 — нормальный закон распределения, 2 — равномерный закон распределения
M=const; M=5
105,164 :
90,143 75,122 60,101 GI 45,08 30,059 15,038 0,017
0,001 3,001 6,001 9,001 12,001 15,001
a
Рис. 2. Зависимость информационной обобщенной числовой характеристики от среднеквадратического отклонения: 1 — нормальный закон распределения, 2 — равномерный закон распределения
3. Абсолютная обобщенная числовая характеристика
Существуют задачи, при решении которых рассматривается отдельная случайная величина, а не их система. В этом случае удобнее использовать обобщенную числовую характеристику, измеряемую в тех же единицах, что и сама случайная величина. Например, нагляднее представить изменения, происходящие с плотностью распределения fx(x)An и положением на оси OX в единицах измерения X, чем в единицах измерения количества информации. Точно так же более наглядно оценивать систематические и случайные погрешности измерительных приборов и погрешности регулирования случайных режимных параметров в тех же единицах, в которых измеряется контролируемая величина. Такую оценку можно
РИ, 1998, № 3
137
получить на основе информационной обобщенной числовой характеристики (3). Под интегралом в (3)
исключим сомножитель 1/ |х|. Получим при фиксированном t оценку
I
f (x, t)
log-------- dx
2-x
(6)
f (x,t)>lx
Эта оценка определяется кривой плотности распределения fx(x)Ап, но, в отличие от (3), нечувствительна к ее положению на оси OX. Она измеряется в бит • ед. измер. х .
Разделим оценку (6) на GI[x] (3) и получим
значение х, определяемое как видом кривой fx (x)Ап, так и ее положением на числовой оси. Назовем ее абсолютной обобщенной числовой характеристикой или абсолютным обобщенным значением случайной величины. Это значение x обозначим через GA от
английского generalized absolute или fx (x)Ап. :
GA[ xt ] = xg (t) = 1 I log f (Ґ) dx .(7)
" GI[x t] f (xJt)>Л 4
Свойства абсолютного обобщенного значения Xg (7) для равномерного и нормального законов видны из рис. 3, 4. Характерно, что при постоянном
математическом ожидании уменьшение с.к.о. ах ^ 0
приводит к x ^ mx .
с=const; а=5
M
Рис. 3. Зависимость абсолютной обобщенной числовой характеристики от математического ожидания
Рис. 4. Зависимость абсолютной обобщенной числовой характеристики от среднеквадратического отклонения
4. Применение обобщенных числовых характеристик
1. Информационная числовая характеристика (3), помимо использования для получения абсолютной
138
обобщенной числовой характеристики (7), может быть применена также для описания в БИТ, ДИТ, НИТ
изменений, происходящих с fx (x) А п и fx (x) А п.
2. Разность между числовой характеристикой (3) и усредненной энтропией может служить в качестве информационного эквивалента положения кривой fx(x,t) на числовой оси. Он может быть использован при анализе информационных процессов в системах управления.
3. Числовые характеристики (4), (5) рекомендуются для количественной оценки изменений плотно -сти распределения и математических ожиданий системы случайных величин.
4. Абсолютное обобщенное значение случайной величины (7) удобно использовать для описания изменений плотностей распределения и положения на числовой оси каждой из случайных величин в отдельности.
5. Разность между абсолютным обобщенным значением fx (x)Ап (7) и математическим ожиданием mx , наряду с другими числовыми характеристиками, может служить абсолютной оценкой неопределенности случайной величины X. Как видно из рис.
4, при ох ^ 0 абсолютная оценка неопределенности тоже стремиться к нулю.
6. Информационная и абсолютная обобщенные числовые характеристики могут использоваться для обнаружения связей между статистическими характеристиками (математическими ожиданиями, плотностями распределения) квазистационарных случайных процессов [2]. Необходимость в изучении таких связей возникает при решении задач технической диагностики.
Пример. Диагностируется система из двух стохастических квазистационарных объектов, например, каналов телеметрии. Выходными процессами для первого и второго объектов являются x(t) и y(t). Оба - квазистационарные, эргодические случайные процессы. На параметры первого объекта влияет неконтролируемое воздействие £(t) . На параметры
второго — п(t) . Возможно появление общего для обоих объектов неконтролируемого параметрического воздействия Q(t) . g(t) , п(t) , Q(t) — квазистационарные, эргодические, независимые случайные процессы. Необходимо по x(t) и y(t) обнаружить факт
появления Q( t), что может свидетельствовать о нарушении стабильности режима работы общего для этих объектов устройства. Использование с этой целью взаимной корреляционной функции (ВКФ) для x(t) и y(t) исключается, так как в общем случае они могут быть коррелированы между собой и без
появления Q(t), например, при наличии связи между входными процессами. Поскольку Q(t) может изменять как вид кривых fx (x)Ап, fx(x)Ап,
так и математические ожидания fx (x)Ап, fx (x)Ап, для решения задачи следовало бы одновременно контролировать связи между fx (x)Ап, fx (x)Ап, а также энтропиями H[X,t], H[Y,t]. Например, вычис-
РИ, 1998, № 3
лять текущие ВКФ M[mx (tj) my (t 2)]
M[mx(tj)H[X,12]] , M[H[X,ti]my(t2)]
M[H[X, tj]H[Y, t2]], где mx (t) , my (t)
іде RQQ (tj, 12) — автокорреляционная функциядля Q( t). В соответствии с (8) - (13)
PQ(mQ, mg) =
= ln
cl
cl
2Axax43 |mx + стх-/з| |mx - ctxV3|
(15)
i
H[X t]], H[Y t]] — центрированные случайные
процессы. В то же время использование информационной (3) или абсолютной (7) обобщенных числовых характеристик позволяет исследовать лишь одну ВКФ, в частности, между GI[X,t] и GI[Y,t], т.е.
M[GI[X,ti]GI[Y,12]. Пусть каретто Q(t) изменяет fx (x)An и с.к.о. oy (t) . Убедимся, что в
этом случае появление Q(t) приведет к возникновению статистической связи между GI[X,t] и GI[Y,t]. Для упрощения предположим, что законы распределения fx (x)An и fx (x)An — равномерные. Тогда
GI[ X, t ] = ln
GI[Y, t ] = ln
i
ln
x x
i
ln
m + a.
.s
-aJ3
m.
my +CTyV3
my -Оу4ъ
Пусть
mx(t) = mx0 + cjQQ) + C2g(t),
CTy (t) = CTy0 + C3Q(t) + C4 n(t) .
Здесь mx0 ,ax0 ,cj,C2,C3,C4 — постоянные.
(8)
(9)
(10)
(11)
Применим метод статистической линеаризации:
GI [ X, t ] = (р\ (Q, g, t) = (p\ (mQ, mg) +
+ PQ(mQ,mg)Q(t) + p\g(mQ,mg)g(t), GI[Y,t] = p2(Q, n,t) = P2(mQ,m^) +
О О
+ P2 Q (mQ, m n) Q(t) + P2' (mQ, m n) n(t).
(12)
(13)
Здесь mQ, mg, mn — математические ожидания для
f f
Q(t),g(t ),n(t) ; Pj Q(mQ, mg) , Pj g(mQ, mg) , ff
p2 q(mQ,mn) ,p2 n(mQ,mn) - производные функций p(Q,g, t) , p2(Q, n, t) поQ,g, n в точках
(m q->mg) , mmn) ;Q(t) ,g(t) , n(t) - центрированные случайные процессы. С учетом того, что по
условию Q(t), g(t) , n(t) независимые, найдем ВКФ
для Pj(Q,g, t) и p^dnt) :
Мірі (Q, g, П) P2 (Q, n, 12)] =
' ' (14)
= Рі Q(mQ,mg)P2в(mQ,mn)RQQ(ti,12),
где mx = m + CjmQ + c2mg,
P2 ^(mQ, m^) = HyaySln
V3[
my +CTyV3
, j r C3
+ ln —
my - CTyV3 C3
(16)
llyaY'
my +CTy4b
my - cry4b
Здесь <jy = оуй + c3 m Q + c4 mn. В общем случае pje(mQ,mg) (15) иРз^)™,,,mn) (16) не равны нулю. Следовательно, если RQQ (tj, 12) Ф 0, то не равна нулю
+
и ВКФ (14). Появление Q(t) , вызывающее в данном
примере связь между mx (t) и оy (t), обнаруживается
по факту появления корреляции между информационными обобщающими числовыми характеристиками GI[X,t] (8) и GI[Y,t] (9) для x(t) и y(t).
Для обнаружения с помощью GI[X,t], GI[Y,t] связи между статистическими характеристиками квазистационарных эргодических случайных процессов x(t) и y(t) по их реализациям необходимо:
1. Каждую из реализаций x(t) и y(t) разбить на m интервалов длиной T.
2. На каждом из интервалов сделать по Уотсче-тов (mQ,mg), (mQ,mg) (/ = j, N) . По ним получить статистические плотности распределения fx * (x, j), fy (y, j) и оценки информационных обобщенных
числовых характеристик (3) GI[Xj] и GI[Yj] (j = і, m).
3. Исследовать связь между GI[Xj] и GI[Yj] ( j = і,m) , например, вычислив для них ВКФ.
Указанные операции можно выполнять как с помощью специальной аппаратуры [3], так и с помощью сопряженной с объектом ЭВМ.
Литература: 1. Авраменко В. В., Карпенко А. П. Интегральная оценка плотности распределения случайной величины// Совр. технологии машиностроения. Прогр. технологии в вузе.: Темат. сб. научн. ст. СумГУ, 1997. Вып.1. С. 241-245. 2. Карпенко А. П, Авраменко В.В. Использование интегральной оценки плотности распределения случайной величины в технической диагностике/ / Вест. Сум. гос. ун-та, 1997. № 2(8). С. 110-113. 3. Мирский Г. Я. Характеристики стохастической взаимосвязи и их измерения. М: Энергоиздат, 1982. 320 с.
Поступила в редколлегию 23.09.98 Рецензент: д-р техн. наук Хаханов В.И.
Авраменко Виктор Васильевич, канд. техн. наук, доцент кафедры прикладной математики Сумского гос. ун-та. Научные интересы: исследование и разработка характеристик стохастических взаимосвязей для случайных величин и процессов. Разработка новых характеристик числовых функций. Адрес: Украина, 244007, Сумы, ул. Римского-Корсакова, 2, тел. 33-50-55.
Карпенко Анжела Петровна, аспирантка Сумского гос. ун-та. Научные интересы: разработка и исследование критериев эффективности информационных процессов. Адрес:Украина, 244007, Сумы, ул. Римского-Корсакова, 2, тел. 33-50-55.
РИ, 1998, № 3
139