Чепасов В.И., Рычко О.К., Никонорова О.А.
Оренбургский государственный университет
ОБУСЛОВЛЕННОСТЬ ТЕМПЕРАТУРЫ ВОЗДУХА ПРИЛИВНЫМИ ИЗМЕНЕНИЯМИ СИЛЫ ТЯЖЕСТИ
Детерминированными методами строится матрица исследования с усредненными по часовым сечениям приливными изменениями силы тяжести (поправками) и исследуемыми параметрами. Статистическими методами определяется качественная и количественная обусловленность параметров. Приводятся полиномиальные и гармонические модели прогноза.
Для определения обусловленности была построена матрица исследования со следующими параметрами-столбиками: 1 - месяцы, 2 - поправка в момент времени = 1, 3 - поправка в момент времени = 2
25 - поправка в момент времени = 24
26 - слой стока в Сакмаре (месяцы)
27 - осадки по Сакмаре (месяцы)
28 - Т воздуха (Цельсий) в бассейне Сакма-ры (месяцы)
29 - испарение а (Е, мм) в бассейне Сакма-ры (месяцы)
30 - расход воды (куб.м/сек) в Сакмаре (месяцы)
Строчки-наблюдения в матрице исследования - это средние месячные значения приливных изменений силы тяжести (поправки) по временным сечениям 1, 2... 24 часа и месячные значения параметров исследования.
В нашем исследовании:
- слой стока в Сакмаре (месяцы); - осадки по Сакмаре (месяцы); - Т воздуха (Цельсий) в бассейне Сакмары (месяцы); - испарение а (Е, мм) в бассейне Сакмары (месяцы);
- расход воды (куб. м/сек) в Сакмаре (месяцы).
Рассматривались четыре матрицы исследования:
1. Месячные значения параметров за 1991 год (размер 12 *30).
2. Месячные значения параметров за 1992 год (размер 12 *30).
3. Месячные значения параметров за 1991, 1992 годы (размер 24 *30).
4. Месячные значения параметров за 19911995 годы (размер 60 *30).
Для определения парных обусловленностей был проведен корреляционный анализ для всех матриц исследования [1].
Предположим, что производится выборка из случайных величин X и У, в результате чего получается N пар их наблюденных значений. Ко-
эффициент корреляции можно оценить по этим выборочным значениям следующим образом:
£ (X, - ХБ) • (У; - УБ)
Г =
х,у
£(X, -ХБ)2 •£(У, -УБ)
(1)
где Х8,У8 - выборочные средние.
Выборочный коэффициент корреляции Гху лежит в пределах между -1 и +1. Граничные значения достигаются только в том случае, когда наблюдения обнаруживают идеальную линейную зависимость. Если же зависимость отлична от линейной и (или) наблюдается разброс измеренных значений, то независимо от того, обусловлено ли это обстоятельство ошибками измерений или нелинейным характером связи исследуемых величин, коэффициент уменьшается.
Для того чтобы оценить точность полученной оценки гху, целесообразно ввести в рассмотрение следующую функцию коэффициента гху:
W=(1/2)ln[(1^xy)/(1-Гxy)]. (2)
Как известно, случайная величина W приближенно подчиняется гауссовскому распределению со средним значением:
т=(і/2)іп[(і+рхт-р)]
(3)
и дисперсиеи:
с2=1/(К-3)
(4)
Зная оценку гху, нетрудно найти на основании этих соотношений доверительные интервалы для коэффициента рху.
Область принятия гипотезы о равенстве коэффициента корреляции нулю определяется неравенством:
-га,2<^(Н-3)/2*1п[(1+Гху)/(1-Гху)]<2а,2, (5)
где Za/2 - величина, подчиняющаяся нормированному гауссовскому распределению. Если рассматриваемая величина W лежит вне приведенного интервала, то это означает наличие корреляционной зависимости при уровне значимости а.
Результаты корреляционного анализа для 1991 года
Таблица 1. Корреляционная матрица Я (фрагмент). Параметр 28 - Т воздуха (Цельсий) (месяцы)
0,20 -0,93 -0,88 -0,82 -0,73 -0,59 -0,36 -0,01 0,43 0,78
0,95 0,99 0,98 0,93 0,87 0,78 0,68 0,54 0,33 0,02
-0,40 -0,76 -0,92 -0,97 -0,97 0,10 0,19 1,00 0,91 0,10
Значимые коэффициенты парной корреляции для параметра 28: с параметрами 2, 3, 4, 5,
10, 11, 12, 13, 14, 15, 16, 22, 23, 24, 25, 29.
Для определения групповых обусловленностей между параметрами исследования был использован факторный анализ [4, 5].
В факторном анализе основным предположением является равенство:
Х, =£аіг • рг + е, , (і = 1, 2,...,р),
(6)
где X - 1-я переменная,
Б - г-й фактор, а1г - факторная нагрузка, к - количество факторов, е1 - остатки, которые представляют источники отклонений, действующие только на X Матрицу факторных нагрузок А находим методом главных компонент.
Алгоритм метода главных компонент:
1. Расчет корреляционной матрицы Я:
г* = , (7)
где
Б* =Х(ХЦ-Т) • (Х1к -Тк)-1=1
- 1/и]Г (Хц - Т) • £ (Х1к - Тк), Т = Г]Гхц 1/П
1=1 1=1 1-1
1 = 1, 2,..., п - наблюдения, j = 1, 2,..., т - переменные.
2. Вычисление собственных значений, собственных векторов корреляционной матрицы.
3. Вычисление накопленных отношений собственных значений корреляционной матрицы, больших или равных заданной пользователем константе.
4. Вычисление матрицы факторных нагрузок по собственным значениям и соответствующим собственным векторам корреляционной матрицы.
5. Ортогональное вращение матрицы факторов.
Результаты факторного анализа для 1991 года
Таблица 2. Сумма квадратов нагрузок по факторам
Номер фактора Сумма квадратов нагрузок
1 16,841
2 9,141
3 2,254
4 1,004
В первом факторе объединились параметры под номерами (смотри выше): 2, 3, 4, 5, 6,
11, 12, 13, 14, 15, 16, 17, 18, 23, 24, 25, 28, 29.
Для определения количественных обусловленностей параметров исследования использовались полиномиальные модели, построенные по разработанному алгоритму упрощенного метода Брандона [3].
При решении задач, связанных с отысканием оптимальных условий протекания сложных многопараметрических процессов, широкое распространение получили полиномиальные математические модели процесса [2]
т т
У = ьо +Х Ь1 - Х1 + Х • Х1 • XJ + ••• (8)
1=1 1<
где у - параметр оптимизации;
Ь0, Ь1, blj, Ь11 - выборочные коэффициенты регрессии, полученные по результатам эксперимента;
Х1, Х1Х. - параметры и их взаимодействия, 1, . = 1, '2.
Упрощенный метод определения коэффициентов уравнения регрессии (8) предложен в работе Д. Брандона [3].
Разработанный алгоритм упрощенного метода Д. Брандона
Пусть задан процесс в виде матрицы наблюдений:
у1Х,1...Х Х
1 11 ]1 т1
у Х1 ...Х,...Х
^ п 1п ] 1 т]
где т - число независимых параметров; п - число наблюдений; у - зависимый параметр;
X - матрица наблюдений независимых параметров.
1. Последовательно для всех пар массивов у-Х у-Х ., у-Хт вычислить остаточную дис-
(к-1)1’ Цк-І^
(к-1)ш‘
характеризующую
г=1
степень влияния независимого параметра на зависимый у.
Для этого воспользуемся ортогональными многочленами Чебышева.
Искомая зависимость условного среднего у от X. имеет вид:
У к =Ф^ХР = £ Ьа • Ба(Хр,
(9)
где Sk(X.) - ортогональный многочлен Чебышева к-го порядка.
Б0(Хр = 1 - полином нулевоИ степени. Общая дисперсия:
О0 = 1/п£ (У, - Ь0) ,
,=1
где Ь0 = 1/п£у, , Sl(XJ)=XJ+fl,
1=1
1 =-1/п]ТХц
1=1
2
п п
Ь = £у, • Б1(ХІ,)/£[Б1(ХІ,)]
(10)
,=1
,=1
Ук^^Л^)
Остаточная дисперсия:
Ок = 1/п£(У, -Ук,)2,
,=1
где к = 1.
Если В(к-1)./Бк. < Бкр где Бкр - табличное значение для распределения Фишера, то осуществляется переход к следующему _|.
Иначе к = к+1 и переход к пункту 2.
2. Вычисляем:
Sk(x)=(Xj+Bk)•Sk_l(x)+gk•Sk_2(x),
где
П П 2
Вк = -£Х [Бк-1(Х^)]2/£[Бк-1(Хл)1 , (11)
Ек =£Х • Sk-2(XJ 1)• (Х, 1)/£[Sk-2(XJ 1)]
1=1 ^ 1=1
Уk=Уk-l+Ьk•Sk(Xj),
2
П П ^
Ьк =£ У1 • Бк(Х^)/£ [Бк(Х^)]
1=1 1=1
Если Ол ,У/Ц < Б , то запоминается Ол 1У,
(к-1) к] — кр’ (к-1)]?
иначе к = к+1 и возврат к пункту 2 и так до тех пор, пока О(к-1) для всех ]=1, 2,..., т.
3. Выбрать из всех минимальное, где ]=1, 2,..., т. j
Если минимальных остаточных дисперсий получится несколько равных между собой, то выбрать последнюю при переборе.
4. Если D(k1)j= Бп, начальной промежуточной дисперсии, то конец решения. Иначе перейти к пункту 5.
5. Произвести как бы разглаживание поверхностей отклика в направлении переменной Х., вычитая из выборочных значений у1 величины, рассчитанные по Ф.(Х.).
Сформировать массив:
Уц=У1-Ф](Х])
6. Заменить в матрице наблюдений массив
У1 на Уц.
7. Повторить вычисления с пункта 1 до пункта 6 для матрицы наблюдений с учетом замененных массивов у1 на у11 до тех пор, пока последняя остаточная дисперсия О(к 1)j = О/г уменьшится в г раз по сравнению с начальной общей дисперсией величины у.
Результаты регрессионного анализа
Модель - 28 - Т воздуха (Цельсий) (месяцы) за 1991 год: значимый по вкладу параметр -12 - поправка в момент времени = 11
у = +(-24,26081)+(0,3432284)-(х 12) (12)
Таблица 3. Характеристики модели
ХАРАКТЕРИСТИКИ МОДЕЛИ ЗНАЧЕНИЯ
Коэффициент детерминации 0,99
Средняя абсолютная ошибка 1,48
Средняя ошибка в процентах 11,23
По модели (12) был сделан прогноз температуры воздуха на 1992 год:
Таблица 4. Прогноз температуры
Месяцы 1992 года Прогнозируемое значение Истинное значение
Январь -12.77 -8.9
Февраль -11.68 -11.4
Март -4.19 -7.1
Апрель 6.79 6.1
Май 17.86 13.6
Июнь 22.94 18.5
Июль 22.27 19
Август 17.98 17.1
Сентябрь 13.37 14.7
Октябрь 6.09 4.2
Ноябрь -1.82 -1.6
Декабрь -8.32 -10.8
Средняя абсолютная ошибка при прогнозе - 2,212185.
С целью проверки правильности полиномиальных моделей и с целью временного прогноза был использован спектральный анализ [1].
а =0
2
,=1
!=1
2
Пусть периодический процесс представлен функцией /(1), кусочной или непрерывной на отрезке [-Т/2, Т/2] с периодом Т.
Тогда процесс может быть представлен следующим тригонометрическим рядом:
/(1;)=а0/2+Е (ак*со8(2лк1/Т)+Ьк*8т(2лк1;/Т)), (13)
к=1
где
Т/2
Ак=(2/Т)* 1//)*со8(2лк!/Т)*&, (к=0, 1, 2, 3,...) (14)
-Т/2
Т/2
Ьк=(2/Т)1/(1)*8т(2лк1/Т)Л, (к=1, 2, 3,...)
-Т/2
Амплитудный спектр:
А=л/ак + Ь2, (к=0, 1, 2, 3...) (15)
Фазовый спектр:
фк=-агс1е(Ьк/ак), (к=1, 2,...) (16)
Фурье-анализ [1] подтвердил своими спектральными характеристиками правильность количественных оценок, полученных по регрессионным моделям.
Результаты спектрального анализа для 1991 года
Температура воздуха (Цельсий) имеет с поправкой в момент времени -11 максимальный
коэффициент корреляции (модуль) -0,99 (истинное значение Я= 0,99).
Таблица 5. Спектральные характеристики по 1991 году
Параметры Период процесса Максимальная по амплитуде гармоника Период гармоники Фаза гармоники
Т воздуха 12 1 12 -3,694
Поправка-11 12 1 12 -3,664
Модель по максимальной гармонике для температуры воздуха (Цельсий):
У(1) = 6.9352+(16.3085)*со8((2*р1П/Т)*1+(-3.6939)) (17)
где р1 = 3,14....Т - период процесса = 12.00.
Модель по максимальной гармонике для поправки в момент времени -11:
У(г) = 84.9698+(58.9308)*со8((2*р1П/Т)*1+
+(-3.6638)) (18)
где р1 = 3,14....Т - период процесса = 12.00.
Аналогичные результаты были получены по остальным матрицам исследования.
Таким образом, мы можем по приливным изменениям силы тяжести осуществлять прогноз температуры воздуха как по полиномиальным моделям, так и по гармоническим.
Список использованной литературы:
1. Бендат Д. Ж., Пирсол А. Измерение и анализ случайных процессов. - М.: Мир, 1974.
2. Драйпер Н., Смит Г. Прикладной регрессионный анализ. - М.: Статистика, 1973.
3. Brandon D. B. Developing Mathematical Models for Computer Control, USA Journal, 1959, V.S, N7.
4. Харман Г. Современный факторный анализ. - М.: Сатистика, 1972.
5. Иберла К. Факторный анализ. - М.: Статистика, 1980.