Международный информационно-аналитический журнал «Crede Experto: транспорт, общество, образование, язык». № 4 (11). Декабрь 2016 (http://ce.if-mstuca.ru)
УДК 004.588 ББК 74.5 4-751
В. 3. Чокой Иркутск, Россия
ИНСТРУМЕНТЫ РЕГРЕССИОННОГО АНАЛИЗА И ПРОГНОЗИРОВАНИЯ ПРОЦЕССОВ В АВИАЦИОННО-ТЕХНИЧЕСКИХ СИСТЕМАХ
Проведен обзор подходов к подбору для наблюдаемых процессов адекватных регрессий и нх последующему использованию для решения практических задач интерполяции, экстраполяции и факторного анализа. Также рассмотрены вопросы формирования для наблюдаемых процессов прогнозных моделей на основе комбинации параболической регрессии, автокорреляционной функции и гармонических весов. Представлен обзор авторских средств компьютерного решения задач аппроксимации, интерполяции и экстраполяции, ориентированных на использование в образовательном процессе инженерных вузов и в эксплуатирующих организациях гражданской авиации.
Ключевые слова: наблюдаемый процесс, регрессионный анализ, парная и множественная регрессия, линеаризация нелинейных функций, метод наименьших квадратов, прогнозирование процессов, доверительные границы прогноза
V. Z. Chokoj Irkutsk, Russia
TOOLS FOR REGRESSION ANALYSIS AND FORECASTING OF PROCESSES IN AIR-TECHNICAL SYSTEMS
© Чокой B. 3., 2016
The paper reviews the approaches of adequate regressions selection for observed processes and their use for solving practical problems of interpolation, extrapolation of factor analysis. The issues of forming the predictive models for the observed processes on the base of combining the parabolic regression, autocorrelation function and harmonical weight are considered. The paper reviews the author's means of computer solutions of approximation, interpolation and extrapolation problems oriented toward educational process at engineering higher educational establishments and operating organizations of civil aviation.
Key words: observed process, regression analysis, double and multiple regression, linearization of nonlinear functions, least square method, forecasting of processes, confident limits of forecasting
Вопросы подбора адекватных математических моделей для наблюдаемых процессов актуальны для всех отраслей человеческой деятельности, и особенно - для управления. Остро проблема эффективного управления стоит там, где цена ошибок и риска весьма велика, например, в гражданской авиации. Представляется, что определяющим фактором эффективного управления в авиационной сфере является должное методическое, математическое, и программное обеспечение, позволяющие формировать и эффективно использовать корректные прогнозные модели. При этом важно, чтобы рекомендуемые решения и средства прогнозирования были доступны для широкого круга пользователей, не имеющих углубленной математической и компьютерной подготовки.
Традиционным подходом к моделированию процессов является регрессионный анализ, часто сводящийся к формированию уравнения линии, наилучшим образом аппроксимирующей облако точек из наблюдаемых значений. В большинстве случаев функция у и аргумент x - случайные величины, подверженные действию многочисленных факторов. Если на случайную величину x действуют факторы z1,z2,^,v1,v2,..., а на y действуют zo,zi, v1, то наличие двух общих факторов z2 и v1 позволяет говорить об определенной зависимости (регрессии) между x и у. Формальными задачами регрессионного обычно явля-
ются: установление формы зависимости (линейная, нелинейная, положительная, отрицательная); определение функции регрессии; оценка влияния на функцию отдельных факторов; решение задач экстраполяции и интерполяции. Ниже рассмотрены лишь задачи определения функции (уравнения), которая в последующем может быть использована для решения задач прогнозирования.
Для однофакторных (парных) линейных регрессий уравнение функции формируют по зависимости вида у = а+Ьх. Численные значения свободного члена а и коэффициента Ь определяют с использованием метода наименьших квадратов (МНК) по формулам:
, у-х—у-х х —X
а = у — Ь • х,
где п - число измерений функции и аргумента наблюдаемого процесса;
х - среднее значение аргумента по всем измерениям;
у - среднее значение функции по всем измерениям;
у • х - среднее произведений значений функции и аргумента;
х2 - среднее значений квадратов аргумента;
—2
х - квадрат среднего значения аргумента.
Для однофакторных (парных) нелинейных регрессий уравнение функции обычно формируют в классе типовых нелинейных зависимостей (степенной, экспоненциальной, показательной гиперболической, логарифмической и т. д.), которые, в первом приближении, умозрительно лучше аппроксимируют облако точек, полученных при наблюдениях. При этом применяют тот или иной способ линеаризации нелинейной функции, например, логарифмируют левую и правую части нелинейной зависимости, а затем для логарифмов вводят новые переменные. С учетом новых переменных получают линейное (линеаризованное) уравнение, коэффициенты которого рассчитывают рассмотренным выше способом. Для перехода к исходному нелинейному виду функции, после подстановки найденных численных значений а и Ь, выполняют обратную исходной
операцию - например, потенцирование, если при линеаризации выполнялось логарифмирование.
Для случаев, когда среди нелинейных зависимостей предпочтение отдается параболе, уравнение функции формируют по зависимости вида у = а • х2 + Ь • х + с. Численные значения свободного члена а, коэффициентов Ь и с,как и в предшествующих случаях, определяют с использованием МНК, решая систему уравнений:
ЧЕГ=1 X?) • а + (2?=1 X?) • Ь + (Е?=1 х?) • с = 2?=1 X? • у,
(Е?=1 *?) • а + (Е?=1 *,) • Ь + п • с = Е?=1 у, . (1)
^ (Е?=1 X,3) • а + (£?=1 х?) • Ь + (Е?=1 X,) • с = 2?=1 X, • У,
Для многофакторных (множественных) регрессий уравнение функции формируют на основе полиномов, свободный член и коэффициенты которых также определяют с помощью МНК.
Найденные тем или иным способом уравнения регрессий могут быть использованы в качестве прогнозных моделей лишь в том случае, если наблюдаемый процесс является временным массивом (то есть, одним из аргументов является время, или эквивалентные ему меры, например, кванты времени, этапы, шаги). Однако надо помнить, что вне диапазона экспериментальных значений регрессии корректны лишь в ближайших окрестностях правой границы диапазона, что обеспечивает возможность выполнения только краткосрочных прогнозов.
Прогнозные модели процессов. Модели процессов, пригодные для среднесрочных и долгосрочных прогнозов, чаще формируют не на основе «чистых» регрессий, а на базе других подходов, например, с использованием методов конечных разностей, комбинации регрессий с автокорреляционными функциями и гармоническими весами. Ниже представлен вариант прогнозной модели на основе последнего из упомянутых подходов - при допущении, что аргументом параболической парной регрессии являются равные кванты времени
Вначале с использованием системы (1) определяют значения свободного члена и коэффициенты уравнения параболы. Далее последовательно выполняются следующие процедуры.
1. Вычисление значений автокорреляционной функции наблюдаемого процесса, определение с помощью МНК отдельных фаз движения скользящего параболического тренда = щ • + • t + с; и проверка гипотезы о том, что отклонение от скользящего тренда исходного процесса является стационарным (процедуры проверки стационарности в данной статье не рассматриваются).
2. Вычисление гармонических коэффициентов и весов
™С+1 = £¿=1 1/(п — 1);; = ^^ + 1У(п—1)'1: = г, П — 13. Вычисление приращений процесса и средней приращений:
= — Уг,г = 1 , п — 1;
^ср = £с=1 • Щ+1;
4. Определение переменных и fп(V) - точечных значений верхней и нижней доверительных границ прогноза на /-м шаге:
П1)=Г{1)^\+=\(1п—г+1;
Г (0 = Г(0^,/ = ЪЖ—л.
5. Вычисление прогнозных значений процесса и доверительных интервалов:
У^ = у*+и/срД = п—1 + /;
— Г(1) < < + Г(1), I =
В выражениях пунктов 1.. .5 переменные обозначают: ? - дискретное время (квант времени, шаг); / - глубина прогноза (число шагов); п - число шагов (замеров значений функции) по результатам наблюдений за процессом.
Функциональность и интерфейсные решения по инструментам регрессионного анализа и прогнозирования. В соответствии с рассмотренными выше подходами на факультете Эксплуатации летательных аппаратов Иркутского филиала МГТУ ГА сформирован пакет инструментов регрессионного анализа не-
прерывных процессов и прогнозирования квантованных процессов, характерных для систем типа авиапредприятий. Эти инструменты интегрированы в пакет Модельер 2.0 и для пользователей доступны через группу «Процессы в системах» головного меню (рис. 1).
Рис. 1. Головная панель пакета Модельер 2.0 (раскрыта группа «Процессы в системах» головного меню) Из охваченной в статье предметной области в данной группе головного меню представлены следующие инструменты:
- аппроксимация процесса парными регрессиями (рис. 2);
- аппроксимация процесса регрессией в виде степенного полинома (рис. 3);
- прогнозирование процесса комбинированным способом - параболическая регрессия + автокорреляционная функция + гармонические веса (рис. 4);
- моменты пересечения прогнозом линий-ограничений (рис. 5).
Рис. 2. Панель инструментов «Аппроксимация процесса типовыми функциями
(парными регрессиями)» На панелях всех перечисленных инструментов предусмотрена закладка «Справка по инструментальной оболочке», в которую загружается справочная информация, необходимая пользователям с недостаточным опытом работы (рис. 6). Справка содержит следующую информацию: проверка работоспособности инструмента, показания к применению инструмента, примеры решаемых задач, особенности подготовки исходных данных и интерпретации получаемых результатов.
Исходные данные вводятся с клавиатуры в редактируемые одиночные поля и в таблицы, выбираются курсором из списков. Кроме этого табличные исходные данные могут загружаться из предварительно подготовленных файлов (активацией кнопки с пиктограммой папки).
g
fc^ — 5» ».. ■■ >-.«■< а ■ т чв ■ ян <• а
Isa В гт~* р~ IT^ri в 5'са •тяЬпв • жог з вас t i «га 1 ajr а асл 1 а J*t | ООП т№ 1 глп im 1 жлг* 10СК а зла 11Ш з* ~trt мам yew ua ';ВДС О ЮС ЧП " ti >1
•в
•Л
аго Т*ЯМ СП fO> » V- • ■41 F- [щ^ I*» ■;« и * — мсу :
шшшьт мкн ■Г^П^И ожтм car««« С ОООСГ1М с ссо г с S' ш хо X
К - * ,7 - Kvii** sa
Ofc*»МБмч^ IW4U« «ля *
* : щ ■ щ
1 Г
( 1" • * — H KfM
к
it Г-' 5. Г I иТ
г • « V) л ;м«икеи«а> 179т» пня
Рис. 3. Панель инструмента «Аппроксимация процесса степенным полиномом
(парная регрессия)»
3 Пру...............
fw ■»«» ч >аш| Ш 11II 11 ■ > ' :
Ц ВСЯ ■ asm sa aar? аеэт аж ЛЯ01 Я ВТ* яг« я VI Л 2543 у яи|
■ЧУ«» ■ t mo 1 2 l«W <nt л inn 1 4 ВСв t тис «тс now 1 II от 12 мо n U 1WP 1
H . f > 1.1 -»J
1 «Г* «ш ЩШ tan* •ли W1 •Ml-Л 'ИСТ
ТОО^в! С ш мне Ю I2M ttJff vzn МЯ1
■С WIIM tt ЛМ СО« 13 4,-« им iin ма «♦21 ■ ш
КОСО «} ООО «10«' м» II Ж И жо row «ООО «0«
It В а 9* п « II я» 1» п и Г) 1
.................... .........................................................I.........■ .............I II I
i (t'iaasa«4)ss8un,,.KU « s a в
Рис. 4. Панель инструмента «Прогнозирование процесса»
Запуск инструмента на решение задачи осуществляется активацией курсором кнопки с пиктограммой стрелки. Результаты решения выводятся: в единичные не редактируемые поля, в не редактируемые таблицы и на графики. Таблицы исходных данных и результатов могут быть сохранены в файлах, для
чего активируется кнопка с пиктограммой дискеты. Дополнительно графические результаты могут быть: распечатаны на принтере (для чего активируется кнопка с пиктограммой принтера) и масштабированы (для чего активируются кнопки с пиктограммами лупы).
Рис. 5. Панель инструмента «Моменты пересечения прогнозом линии
ограничения процесса»
Рис. 6. Пример закладки «Справка по инструментальной оболочке»
Для съема информации с графика о промежуточных значениях аргумента и функции используется визирка, активируемая кнопкой с пиктограммой перекрестия. Цвет визирки может быть подобран при активации кнопки с пиктограммой палитры. Текущие значения функции и аргумента, снимаемые визиркой с графика, выводятся в поля под кнопками графиков.
Для информационного обеспечения работы пользователей в пакет включены информационные карты, доступ к которым возможен через группу «Информационные карты» головного меню. Эти карты содержат иллюстрированные материалы как теоретического, так и практического характера и предназначены для самостоятельной проработки актуальной предметной области перед использованием инструментальных оболочек. Данные материалы также могут быть использованы и при проведении лекций.
Пакет Модельер 2.0 представляет собой автономное полнофункциональное windows-приложение, функционирующее на типовых IBM-подобных ЭВМ с операционной системой Windows-xx. Для инсталляции пакета на жестком диске достаточно 1,8 Гб памяти.
Библиографический список
1. Головченко В. Б. Комбинирование моделей неопределенности. Новосибирск: Наука, 2002. 122 с.
2. Головченко В. Б. Прогнозирование временных рядов по разнородной информации. Новосибирск: Наука. Сибирская издательская фирма РАН, 1999. 88 с.
3. Дрейпер Н. Смит Г.. Прикладной регрессионный анализ / Н. Дрейпер, Г. Смит. М.: Статистика, 1973. 342 с.
4. Лейфер Л. А.. Индивидуальное прогнозирование изменения технического состояния. Авторегрессионная модель / Л. А. Лейфер и др. // Надежность и контроль качества, 1987, № 12. С. 27-31.
References
1. Golovchenko V.B. (2002). Combining the uncertainty models. Novosibirsk: Science, 2002.
122 p.
2. Golovchenko V.B. (1999). Forecasting of temporal series by miscellaneous information. Novosibirsk: Science. Siberian publishing company of the RAS, 1999. 88 p.
3. Draper N., Smith G. (1973). Applied regression analysis / N. Draper, G. Smith. M.: Statistics, 1973.342 p.
4. Lafer L.A. (1987). Individual forecasting of changes of the technical condition. Autoregression model / L.A.Lafer et al. // Reliability and quality control, 1987, № 12. P. 27-31.