УДК 528.1 В.А. Падве СГГ А, Новосибирск
МАТЕМАТИЧЕСКАЯ ОБРАБОТКА КОРРЕЛИРОВАННЫХ ПАРНЫХ ДАННЫХ
Геодезистам приходится сталкиваться с ситуацией, когда необходимо обрабатывать и анализировать парные данные, относящиеся к одному и тому же геодезическому построению. Это могут быть данные, полученные в разное время или по различным технологиям.
Простейшие варианты этой задачи хорошо известны. Это двойные измерения. Они могут быть равноточными или нет, зависимыми или нет. Пусть «п» - общее число данных, образующих две совокупности парных величин, по «к» значений в каждой, т. е. п = 2к.
Векторную модель истинных значений УП1 дважды измеряемых одних и тех же величин Хк1 можно представить в форме блочной матрицы:
¥т = (Хт; Хт), (1)
обозначив малыми буквами соответствующие числовые данные:
ут = (хт; х'т). (2)
Трём случаям независимых совокупностей числовых данных соответствуют такие ковариационные матрицы:
а2 I 0
0 I
(3)
В 0
Ку = 0 в
(4) в 0
ку = 0 В'
совокупности и пары равноточные;
пары равноточные, совокупности - нет;
- неравноточные совокупности и пары [1].
(5)
в к
Ку = к В'
Обработка данных, коррелированных внутри пар, но независимых внутри совокупностей [1], характеризуется «полной» матрицей:
- независимые совокупности, коррелированные пары.
(6)
Матрицы (3) - (6) состоят из таких блоков: I - единичная матрица; О -диагональная дисперсионная матрица первой совокупности; О' -диагональная дисперсионная матрица второй совокупности; К -диагональная матрица корреляционных моментов пар данных; ст2 - дисперсия равноточных данных.
Данные, коррелированные внутри совокупностей, но попарно независимые, характеризуются блочно-диагональной ковариационной матрицей (стохастическая составляющая модели):
У
Ку =
к.
0
0 к
(7)
Они могут быть обработаны с использованием одной из классических (коррелатной или параметрической) версий МНК-оптимизации данных, укрупнённая блок-схема которых приводится ниже.
Моделирование Линеаризация Нормализация
Ф(У)=0 BV+W=0 1\1Л-\Л/=0
У=Р(Х)
Уравнивание М НК-коррекция Решение НУ
X =х+ XX V =-к,ктЛ Л=N"1W
Детерминированная часть математической модели парных данных (уравнения связи) принимает вид, определяемый как структурой данных, так и версией МНК-оптимизации: коррелатной (КВ) или параметрической
(ПВ).
При обработке парных данных уравнения связи (УС) - это простые линейные функции:
Фк1(¥п1) = Хк1 - Хк1 = 0к1 - КВ- (8)
Ак1
¥п1 = ^(Хы) =
- ПВ.
(9)
В параметрических уравнениях связи (9) в качестве параметров используются измеряемые (определяемые) величины Хк1. Их приближённые значения Х0к1 полагаются равными первичным данным, т. е.:
Х0Ы = Хк1. (10)
Коэффициенты линеаризованных условных или параметрических уравнений поправок представляют собой блоки единичных матриц:
Вкп - Скк (I
Апк -
-I
кк
Ч1ккУ
кк
ПВ.
КВ;
(11)
(12)
Свободные члены этих уравнений, с учётом (2) и (8), будут равны: 4^1 = Фк1(уш) = хи - х'и = Е>ы, КВ, (13)
(т. е. «разности» пар - это «невязки» условных УС).
Ьп1 = Уп1 - Рді(хкі) =
ҐХ Л Хк1
Х
Хк1
0і
ПВ.
(14)
'к1
ЧХк1^ ^_Вк1У
Дальнейшее развитие процесса МНК-оптимизации коррелированных парных данных имеет смысл, если разности-невязки не превышают допустимых значений:
4°"=<1-а/2*Л/(К*+К*'Ь> (У) = 1,2,...,к). (15)
Здесь 1:1_а/2 - (ЮО - а/2)%-ая квантиль нормального распределения. Единичные недопустимые разности свидетельствуют о грубых промахах в отдельных первичных или вторичных данных. Такие пары данных должны быть исключены из дальнейшей обработки. Массовые недопустимые разности свидетельствуют о систематических расхождениях между совокупностями первичных и вторичных данных.
Коэффициенты нормальных уравнений, для обеих версий, - это функции ковариационных матриц данных (7):
Мкк = ВКВ1 =КХ + КХ- КВ; К-кк = АТК-1 А = К'1 +К
(16)
ПВ.
(17)
Свободные члены нормальных параметрических уравнений являются функциями как разностей Dk1, так и ковариационной матрицы повторных данных Кх-:
=АТК'1Ь= -КХЬ. (18)
Решение нормальных уравнений с коэффициентами (16) или (17) и свободными членами (13) или (18), соответственно, даёт коррелаты или V/11 К-п о правки к параметрам.
Л
к1
Х
к1
^к1; = Ккк^к1.
(19)
(20)
Переход к МНК-поправкам в данные (2) зависит от версии: ук1 = -КхЛк1; Уы = +Кх.Лк1 КВ; (21)
ПВ. (22)
^к1 - Хк1
В
к1
Наконец, уравненные значения данных и параметров будут равны:
Хк1 = Хкі + ^кі= хкі + ^кі КВ; (23)
Хкі=хкі+хкі ПВ. (24)
Оценку точности данных можно выполнить, вычислив апостериорное значение масштабного показателя точности. Априори он полагался равным единице. Формулы будут зависеть от версии:
И
ВІА
Ік^кі
к
^Тт^-Ь
-х'
у1кКх- Эк1
к
КВ;
ПВ.
(25)
(26)
Апостериорные ковариационные матрицы
данных и параметров равны, соответственно:
уравненных значении
Ку =
Кх К Кх К
X
X
; Кх = М' (к
х(х')
■кх(х0м-1кх(х>)) = ку АВ;
я-1 я я-1 я
-1
-1
-1
ПВ.
(28)
Обработка парных данных обычно ограничивается оценкой точности измерений и средних значений пар. Важнейший практический вопрос -«Существенна ли разница между технологиями, с помощью которых были получены первичные и вторичные данные?» явно не ставится. Его можно перефразировать в форме статистической гипотезы: «Значимо ли среднее значение разностей, как остаточных систематических факторов, воздействующих на исследуемые технологии»?
Для ответа на этот вопрос необходимо проверить нулевую гипотезу «о незначимости среднего значения разностей», т. е.
Н0 = { Е(Н) = 0 } (29)
против альтернативной На={Е(Н)*0}. (30)
Воспользуемся тестом [2]
tэ
d
ш-
(31)
где ё - среднее значение равноточных (или неравноточных), зависимых (или независимых) разностей, а ш^ - средняя квадратическая погрешность
этого среднего. Полагая распределение данных нормальным, мы будем иметь нормальным распределение любых линейных функций таких данных, каковыми являются все вышеназванные средние значения разностей. Тест (31) сравнивается с квантилью стандартного нормального распределения на уровне значимости «а»:
1т = 1:1-а/2. (32)
Если % > 1г, то нулевая гипотеза (29) «о незначимости среднего значения разностей» - отвергается, т.е. использованные технологии приводят к результатам, имеющим систематические отличия. Эти отличия, оцениваемые в виде средних значений разностей, вводятся в исходные разности:
(1' = (1-Н.
Приводимая ниже таблица (таб. 1) содержит необходимые формулы.
Таблица 1
*
Данные Параметры Независимые равноточные Независимые неравноточные Зависимые неравноточные
Среднее значение Н = [сЦ/к (33) 5 = М/[р] (37) 3 = [Р<Ч/[Р] (41)
СКО среднего =л/вд/к (34) =л/[Р^]/к(38) т| = 1" *М*1:'Т(42)
Точность данных ц2 = [ёё]/2к (35) \х2 =[рё(1]/2к(39) \12 = [Рё(1]/к (43)
Точность исправленных данных 2 [сГсГ] а = — — (36) 2(к -1) 2 [рй'сГ] Ц = — (40) 2(к-1) 2 [РС1'СГ] Ц = 1 (44) 2(к-1)
В формулах (33) - (44) введены обозначения, частично согласованные с учебником [1]. Нормальная матрица коррелат (16) является ковариационной матрицей разностей-невязок, т. е. = К0. По зависимым неравноточным разностям вычисляется их среднее (41). Обозначим обратную матрицу нормальных уравнений через Ркк, и назовём её «квази-весовой» матрицей разностей т. е.
^=Ркк={Р,}- (45)
Элементы этой матрицы используются для вычисления числителя и знаменателя формул (41) и (42):
[Р] = ЦР„; Р, = 1РЙ; [РА = * <1;); [Р<И] = да,.
1 j j 1 1 j
(43)
Формулы (37) - (40) описывают случай независимых неравноточных данных. Матрица (45) становится диагональной:
^ =ркк = (11ае{р1,р2,...,рк} = . (44)
СТ1 ст2 стк
Обозначения в формулах (37) - (39) - стандартные:
[р]=Ер, ; [р<4=Кр, * а, ); [Раа]=Хр, * ^. (45)
1 1 1
1. Машимов М.М. Методы математической обработки астрономо-геодезических измерений. Москва, Издание ВИА, 1990.
2. Дж. Лоллард. Справочник по вычислительным методам статистики. Москва, «Финансы и статистика», 1982.
© В.А. Падве, 2005