Научная статья на тему 'Методы и технологии прогнозирования погодных факторов'

Методы и технологии прогнозирования погодных факторов Текст научной статьи по специальности «Математика»

CC BY
261
71
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Хворова Любовь Анатольевна, Брыксин Виталий Михайлович

В статье излагаются теоретические основы, методы и технологии составления прогнозов основных погодных факторов, наиболее влияющих на урожайность сельскохозяйственных культур. Описывается технология поисков года-аналога с применением дискриминантного и кластерного анализа.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Хворова Любовь Анатольевна, Брыксин Виталий Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Methods and technologies of forecasting of the weather factors

In article stated the theoretical bases, methods and technologies of drawing up of the forecasts of the basic weather factors most influencing productivity of agricultural cultures. The technology of searches of year analogue is described with application of the discriminant and cluster analysis.

Текст научной работы на тему «Методы и технологии прогнозирования погодных факторов»

Методы и технологии прогнозирования погодных факторов

УДК 591.5

Л.А. Хворова, В.М. Брыксин

Методы и технологии прогнозирования погодных факторов

Составление долгосрочных прогнозов погоды до сих пор является трудной задачей. Эти трудности вытекают из того, что данная область знаний еще не достигла такого научного уровня, при котором ее основные положения и принципы были бы окончательно установлены. Кроме того, традиционные методы долгосрочных прогнозов связаны с закономерностями общей циркуляции атмосферы, которая представляет собой систему всех атмосферных процессов, наблюдающихся в воздушной оболочке Земли, непрерывно изменяющихся во времени и пространстве (заметим, что различные стороны деятельности земной атмосферы, а следовательно, и ее общую циркуляцию, изучают многие разделы метеорологии такие, как аэрология, синоптическая метеорология, актинометрия, климатология, атмосферная оптика, атмосферное электричество и др.) [1]. И, наконец, в связи с глобальными и порой непредсказуемыми изменениями климата происходит нарушение основных климатических закономерностей, на чем, в основном, базируются традиционные методы прогнозирования погодных факторов.

Однако, для целей моделирования (в нашем случае урожайности) в некоторых случаях нет необходимости учитывать все детали циркуляции и погоды за отдельные дни, которые могут лишь затушевывать устойчивые особенности атмосферных процессов. Поэтому задача прогноза на данном этапе заключалась в учете и изучении закономерностей изменения основных погодных факторов, существенно влияющих на величину урожая, выборе и разработке методов и технологий их прогнозирования с получением при этом минимальной ошибки. В качестве основных факторов на данном этапе были взяты: сумма эффективных температур, количество осадков за вегетационный период и число дней с осадками.

Методика прогноза суммы эффективных температур. Еще в начале 19 века было установлено, что все элементы солнечной активности претерпевают многолетние из-

менения и явно обнаруживается цикличность. В результате обстоятельных исследований циклического характера колебаний солнечной активности было определено, что средняя продолжительность цикла колебаний числа солнечных пятен близка к 11 годам (в отдельных случаях продолжительность этих циклов может изменяться от 8 до 17 лет). Этот факт позволил прогноз суммы эффективных температур осуществлять на основе тригонометрического тренда [2; 3].

Методика прогноза количества осадков за вегетационный период и числа дней с осадками. Как показал анализ специальной литературы [1-3] единой и достаточно хорошо разработанной методики прогноза суммы осадков и числа дней с осадками за вегетационный период не существует. Поэтому перед авторами встала задача попытаться разработать технологию прогноза указанных факторов по годам-аналогам. Цель разработки поиска года-аналога состояла в том, чтобы на основе различных характеристик объекта классифицировать его, то есть отнести к одной из нескольких групп (классов) некоторым оптимальным способом. Под оптимальным способом можно понимать либо минимум математического ожидания потерь, либо минимум вероятности ложной классификации.

Задачи, связанные с классификацией, можно решать методами дискриминантного анализа, суть которого заключается в следующем: пусть имеются п объектов с т характеристиками. Каждый объект характеризуется вектором х1,..., хт , т> 1. Задача состоит в том, чтобы по имеющимся характеристикам объектов отнести их к одной из нескольких групп G1,...,Gk, к > 2, т.е.

фактически нужно построить решающие правило, по которому объект будет отнесен к той или иной группе. Причем, число групп должно быть заранее известно, а также должно быть известно, что объект заведомо принадлежит к определенной группе.

При использовании решающего правила могут возникнуть ситуации неправильной

вычиталось среднее и производилось деление на среднеквадратическое отклонение. Полученные в результате стандартизации данные имеют нулевое среднее и единичную дисперсию.

Таким образом, технология подбора года-аналога к прогнозируемому году для определения суммы осадков и числа дней с осадками за вегетационный период осуществляется по следующей схеме:

1. Тригонометрическим трендом делается прогноз суммы эффективных температур на расчетный год.

2. Применяем метод кластеризации, который производит первоначальное разбиение комплекса факторов по различным годам на кластеры.

В нашем случае был выбран агломера-тивный метод кластеризации - k-means clas-tering, который объект относит к тому классу, расстояние до которого минимально. Расстояние понимается как евклидово расстояние, то есть объекты рассматриваются как точки евклидова пространства. Результаты применения кластерного анализа оформляются в виде таблиц (табл. 1) или графиков (рис. 1). При этом производится усреднение данных внутри кластера, определяются минимальное и максимальное значения каждого фактора внутри группы, по которым новый объект можно отнести к конкретному кластеру.

Таблица 1

Результаты применения кластерного анализа

Факторы Кластеры

1 2 3 4

Сумма эффективных темпе->атур (XI) (1022.2; 1110) 1074.71 (1147.6;1208.4) 1182 (950.2;1018.7) 994.25 (889.8;952.9) 921.4

Количество осадков за веге-ационный период (Х2) (111;204.3) 156.87 (103.5;188) 147.3 (149.6;269.8) 196 (108.8; 165.6) 137.2

Число дней с осадками (Х3) (17;29) 23 (11;27) 20 (22;32 26 (17;32) 24.5

Количество осадков за ок-ябрь-ноябрь (Х4) (29.4;102.2) 57.3 (42.4;96) 70.9 (60.8;116.7) 81 (98.3;113.7) 106

Количество осадков за де-:абрь-март (Х5) (35.3;125) 85.2 (69.7;140.4) 89.6 (62.5;88.8) 76 (61.3;87.9) 74.6

Средняя температура за ап->ель (Х6) (-2.45;9.8) 2.47 (3.65;6.41) 4.8 (-0.7;6.29) 2.9 (4.2;4.67) 4.44

Сумма температур выше 0 за прель (Х7) (56.8;295.1) 119.9 (129.4;194.6) 155.4 (76.8;188.7) 122.8 (127.9;169.2) 148.6

Урожайность (12.8;25.3) 19.6 (13.4;20) 16.8 (19;25) 22 (16;22.7) 19.3

классификации, так называемые «потери», т.е. когда объект отнесен к классу ¡, а на самом деле он принадлежит к классу Для учета «потерь» при неправильной классификации вводится функция убытка которую пытаются минимизировать.

Близкими к методам дискриминантного анализа являются методы кластерного анализа, которые также используются для проведения классификации. Отличие кластерного анализа от дискриминантного в том, что в нем заранее не фиксировано число групп (кластеров). В результате применения процедур кластерного анализа исходная совокупность объектов разделяется на кластеры схожих между собой объектов (под кластером обычно понимают группу объектов, обладающую свойством плотности: плотность объектов внутри кластера выше, чем вне его; дисперсией; отделимостью от других кластеров; формой).

Реализация данных методов осуществлялась при помощи пакета Statistica 5.0 [4] по сочетанию комплекса факторов: суммы эффективных температур, количества осадков и числа дней с осадками за вегетационный период; суммы осадков за октябрь-ноябрь и декабрь-март текущего сезона; средней температуре и сумме положительных температур за апрель; урожайности. Перед началом классификации была проведена стандартизация данных: от каждого значения фактора

Методы и технологии прогнозирования погодных факторов

Рис. 1. График средних для каждого кластера

По прогностической сумме эффективных температур определяется кластер, а соответствующие средние суммы осадков и числа дней с осадками данного кластера принимаются за прогностические.

1. На основе прогностических данных по модели [5] делается прогноз урожайности.

2. Проводим дискриминантный анализ для уточнения классификации данных и проверки правильности построенного классификатора. Дело в том, что связь между комплексом рассматриваемых факторов достаточно сложная и порой противоречивая, поэтому возникают ситуации ложной классификации. В ходе исследования производится новое разбиение на кластеры, причем основным критерием разбиения является сведение к минимуму ситуаций ложной классификации объектов. В результате применения методов дискриминантного анализа производится построение классификацион-

ных функций, с помощью которых вычисляются классификационные значения (табл. 2) для новых объектов по следующей формуле:

m

fj(b) = 2 аг] • bi + am+1,j ,

1=1

где a. - значение функции классификации для фактора i и группы j, bt - значение фактора i нового объекта, am+1 j - константа.

Объект следует отнести к той группе, для

которой выполнено: f. (b) = max f. (b), т.е. в

j j 3

результате по сумме эффективных температур получаем оценочный интервал для прогнозируемой урожайности. Производим уточнение разбиения на кластеры уже по сумме эффективных температур и прогнозируемой урожайности.

Таблица 2

Таблица классификационных функций

Факторы Номер кластера

1 2 3 4 5

X1 0.22 0.21 0.21 0.22 0.21

X2 0.04 -0.01 0.05 0.05 0.02

X3 3.05 3.44 1.43 2.32 2.87

X4 0.30 0.46 0.10 0.32 0.42

X5 0.03 -0.08 0.20 0.13 0.02

X6 -6.80 -8.01 -5.86 -5.75 -5.35

X7 0.40 0.35 0.52 0.37 0.25

Константа -187.74 -177.93 -181.43 -183.79 -165.55

Производим уточнение разбиения на кластеры уже по сумме эффективных температур и прогнозируемой урожайности. В результате классификации получили значение статистики ^-Уилкса 0,023283, которое свидетельствует о хорошей дискриминации (значения статистики ^-Уилкса лежат в интервале [0,1]. Чем ближе полученное значение к нулю, тем лучше дискриминация).

Кроме того, дискриминантный анализ позволяет получить апостериорные вероятности принадлежности объекта к определенному классу (табл. 3).

В первом столбце таблицы указаны годы. Во втором столбце соответствующие им кластеры с интервалами урожайности (ц/га). Во втором, третьем и т.д. столбцах даны апостериорные вероятности отнесения каждого

фактора к определенному кластеру. В результате год относится к кластеру с максимальной апостериорной вероятностью. Знаком * отмечены неправильно классифицированные случаи.

В результате проделанной работы построен классификатор, позволяющий с определенной степенью вероятности утверждать, что те сочетания факторов, которые наблюдались в годах-аналогах, будут наблюдаться и в году, для которого составляется прогноз.

Данная методика позволяет давать несколько прогнозов, уточняющих друг друга: в октябре, декабре, апреле и мае.

Оценка точности проведенного прогноза была проверена по данным Алтайского центра по гидрометеорологии. Погрешность прогноза составила 10%.

Таблица 3

Апостериорные вероятности классификации

Годы Номер кластера по урожайности Номер кластера по апостериорной вероятности

1 2 3 4 5

1978* 1 (19-22) 0.460 0.000 0.000 0.533 0.008

1979 1 (19-22) 0.951 0.036 0.000 0.012 0.001

1980 2 (22-25) 0.001 0.997 0.000 0.000 0.003

1981 3 (11-15) 0.000 0.000 0.994 0.006 0.000

1982 4(15-19) 0.001 0.000 0.001 0.998 0.000

1983* 2 (22-25) 0.001 0.464 0.000 0.002 0.534

1984 2 (22-25) 0.007 0.992 0.000 0.000 0.002

1985 2 (22-25) 0.000 0.989 0.000 0.000 0.011

1986 5 (>с25) 0.001 0.369 0.000 0.001 0.629

1987 2 (22-25) 0.015 0.963 0.000 0.000 0.022

1988 4(15-19) 0.007 0.001 0.000 0.987 0.005

1989 5 (>с25) 0.044 0.016 0.000 0.078 0.862

1990 4(15-19) 0.002 0.000 0.000 0.998 0.000

1991 4(15-19) 0.082 0.012 0.000 0.873 0.033

1992 4(15-19) 0.146 0.000 0.000 0.816 0.038

1993 1 (19-22) 0.956 0.001 0.000 0.040 0.002

1994 1 (19-22) 0.957 0.001 0.000 0.041 0.001

1995 1 (19-22) 0.996 0.000 0.000 0.004 0.000

1996* 4(15-19) 0.683 0.000 0.000 0.316 0.001

1997 3 (11-15) 0.000 0.000 1.000 0.000 0.000

Литература

1. Гирс А.А. Основы долгосрочных прогнозов погоды. Л., 1960.

2. Руководство по агрометеорологическим прогнозам. В 2-х т. Л., 1984.

3. Белов П.Н. Численные методы прогноза погоды. Л., 1975.

4. Боровиков В.П. Популярное введение в

программу STATISTICA. М., 1998.

5. Хворова Л.А., Брыксин В.М. Применение математических методов и математического моделирования для оценки агроклиматического потенциала территорий // Известия АГУ. №1(23), Барнаул: Изд-во АГУ. 2002.

i Надоели баннеры? Вы всегда можете отключить рекламу.