Научная статья на тему 'Методика построения многомерных регрессионных математических моделей'

Методика построения многомерных регрессионных математических моделей Текст научной статьи по специальности «Математика»

CC BY
243
57
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОГОМЕРНЫЕ РЕГРЕССИОННЫЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ / МЕТОДИКА ПОСТРОЕНИЯ МОДЕЛЕЙ

Аннотация научной статьи по математике, автор научной работы — Кубланов Михаил Семенович

Рассматривается построение регрессионных математических моделей явлений, описываемых 4 и более факторами. Предлагается методика, основанная на обобщении опыта прикладных исследований.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Кубланов Михаил Семенович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHOD OF MULTIDIMENSIONAL REGRESSION MATHEMATICAL MODELS BUILDING

There is considered regression mathematical models building which are described by 4 or more factors. There is proposed the method based on exploratory development experience summering.

Текст научной работы на тему «Методика построения многомерных регрессионных математических моделей»

КРАТКИЕ СООБЩЕНИЯ

УДК 629.7:681.3

МЕТОДИКА ПОСТРОЕНИЯ МНОГОМЕРНЫХ РЕГРЕССИОННЫХ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ

М. С. КУБЛАНОВ

Рассматривается построение регрессионных математических моделей явлений, описываемых 4 и более факторами. Предлагается методика, основанная на обобщении опыта прикладных исследований.

Ключевые слова: многомерные регрессионные математические модели, методика построения моделей.

Построение многомерных математических моделей в последние годы занимает умы многих ученых в различных областях знаний. Объясняется это объективной необходимостью моделирования сложных, плохо организованных систем, описываемых большим количеством факторов. Ранее человечество занималось выявлением законов природы, связывающих между собой не более 4 факторов, что укладывалось в возможности логического мышления и осмысления. Нынешнее развитие техники привело к необходимости изучения многофакторных систем, для которых человек уже не в состоянии составить осмысленное умозрительное представление. Следствием такого положения явилось появление нескольких теорий, позволяющих строить и применять многомерные математические модели на основе тензорных полей, нейронных сетей и т.п. Эти теории, безусловно, эффективны в случае больших систем, связывающих более 10 параметров.

В данной статье делается попытка на основании обобщения опыта прикладных исследований в области разработки регрессионных математических моделей [1 - 3] предложить методику такой разработки для систем с небольшим числом факторов - от 4 до 8 - 10. В этом случае основной целью построения моделей является отображение физических свойств взаимосвязей факторов, выявленных в экспериментальных исследованиях и логически обоснованных. Такие модели, по мнению автора, именно на основании своей "физичности" имеют право применения в области, несколько более широкой, чем собранный статистический материал. В русло таких математических моделей не попадают формальные модели, разрабатываемые, например, на основе нелинейных мультипликативных форм (степенных комплексов) [4]. Формальные модели, не воспроизводящие важнейшие физические свойства оригинала, с успехом могут применяться лишь в ограниченном диапазоне изменения аргументов.

Стандартный регрессионный анализ проводится на основании метода наибольшего правдоподобия. Однако в большинстве случаев для технических систем такой подход невозможен по каким-либо причинам (недостаточный объем выборки, сложный вид исследуемой зависимости, вычислительные трудности реализации метода наибольшего правдоподобия). Поэтому в дальнейшем будем отдавать приоритет не формальным математическим строгостям, а правильному отображению важнейших физических свойств зависимостей. В этом случае вместо метода наибольшего правдоподобия, требующего затратного выявления законов распределения, можно воспользоваться методом наименьших квадратов, имеющим самостоятельный физический смысл. В такой постановке успех решения общей задачи находится в прямой зависимости от глубины проработки каждого шага предлагаемой методики с оглядкой на физическое его обоснование.

Изложение методики, представленное последовательностью пунктов алгоритма, будем иллюстрировать (с помощью значка ^) модифицированным примером из [2], где, в частности, строилась регрессионная модель зависимости цпр = f (V, тВПП, Рщ), где цпр - предельный коэффициент сцепления пневматика с поверхностью взлетно-посадочной полосы (ВПП); V - скорость движения колеса, км/ч; цВПП - коэффициент сцепления, замеренный на аэродроме штатными средствами (характеристика состояния ВПП, подчас далекая от физического смысла коэффициента сцепления); РПН - давление в пневматике, атм.

1. Ранжирование аргументов исследуемой зависимости для определения последовательности построения регрессий (предпочтение отдается тем аргументам, зависимость от которых более объемно представлена экспериментальными данными и лучше изучена). Иными словами, проводится некое "расслоение" многомерной зависимости, на каждом слое которой рассматривается зависимость только от одного - двух аргументов. От остальных аргументов предполагаются зависимыми коэффициенты выстраиваемой регрессии. Полученных слоев не должно быть много, так, например, на первом слое рассматривается аппроксимация по одному - двум основным аргументам, на втором - аппроксимация полученных коэффициентов по двум оставшимся аргументам и, может быть, по одному из первых. В такой ситуации построение третьего слоя - аппроксимация коэффициентов аппроксимации коэффициентов - нежелательно ввиду опасности потери важных физических свойств исследуемой зависимости.

^ 1-й слой: V, 2-й слой: тВПП, РПН.

2. Далее в пп. 3 - 6 действия осуществляются последовательно по каждому из проранжированных слоев.

3. Выявление физических свойств исследуемой зависимости в целом, которые будут диктовать математические свойства (область определения, область принимаемых значений, замечательные точки, симметрия (четность, нечетность), периодичность, постоянство знака, монотонность, выпуклость, точки разрыва, асимптоты, экстремумы и точки перегиба).

^ 1) тпр = тВПП при скорости 40 км/ч;

2) 0,25 не должно быть безусловно минимальным замеряемым значением для тВПП;

3) замеренные деселерометром значения коэффициента сцепления на ВПП для транспортных самолетов (при РПН = 10 атм) принимают значения: на сухой ВПП - 0,6, на мокрой - 0,4, на снежной слякоти - 0,35.

4. Выбор аналитической зависимости наиболее общего вида, имеющей все выявленные физические свойства.

^ тПР = МПР (МвПП , РПН )ЯМ ПР (МвПП , РПН ) — А) + (1 ~ л]МПР (МвПП , РПН ) — А) )е ( )].

5. Конкретизация особых значений коэффициентов исследуемой зависимости для реализации выявленных конкретных физических свойств и рассмотрение возможности упрощения уравнения регрессии. Здесь может быть и даже приветствуется детальный анализ и сравнение нескольких гипотез о значениях отдельных коэффициентов с помощью любых средств статистического анализа.

^ т = 0,2; а = 0,009.

6. Построение регрессии с помощью метода наименьших квадратов (определение коэффициентов регрессии по методу наименьших квадратов). Здесь возможны несколько приемов, облегчающих достижение результата:

- не обязательно решать оптимизационную задачу - быстродействия нынешних компьютеров достаточно, чтобы с необходимой точностью перебрать узлы сетки значений коэффициентов, вычислить по ним регрессии, сравнить с исходной выборкой и вычислить значения дисперсионной суммы для выявления случая (узла значений коэффициентов) ее минимума;

- сложные функции можно редуцировать с помощью исследуемого регрессионного уравнения (так как известное значение функции у1 зависит от известных узловых значений аргумента х1 через регрессионные коэффициенты, например, в виде у; = а-ехр(Ьх^ + с, то можно заранее для очередного просматриваемого значения Ь вычислить все значения ехр(Ьх^ = 21 и в итоге свести задачу к отысканию линейной регрессии у! = а^ + с; возможны и более изощренные алгебраические преобразования с целью упрощения процесса вычисления регрессионных коэффициентов);

- в том случае, когда количество экспериментальных точек меньше или равно количеству коэффициентов регрессии, задача приобретает вид не регрессионного анализа, а построения интерполяции; однако обычно в этом случае рассматривается целое семейство таких регрессий по другому, следующему аргументу, поэтому представление об общем виде таких регрессий в семействе можно составить, изучая всю совокупность статистических зависимостей, а затем построить конкретные регрессии выявленного вида для каждого частного случая опять же методом перебора узлов, при необходимости замораживая значения "лишних" коэффициентов.

^ Определение оптимальных по методу наименьших квадратов значений оставшегося коэффициента Мпр^ВПШ РПН)

7. Полученные на предыдущем этапе коэффициенты для всех регрессий семейства кривых по другому аргументу следует исследовать по пп. 1 и 2 на предмет выявления вида зависимости от этого другого аргумента и повторить пп. 3 - 6 для построения этих регрессий.

^ 1) при скорости движения 40 км/ч МПР(тВПП, РПН) = Цвпп;

2) МПР должен быть монотонным по своим аргументам;

3) МПР < 0,75;

4) рост МПР при уменьшении давления должен отслеживать зависимость от четной степени РПН в связи с ростом площади пятна контакта пневматика с ВПП;

5) естественно полагать наличие максимума зависимости МПР от РПН при РПН = 0;

6) ход изменения полученной регрессии МПР от РПН диктует наличие точки перегиба;

7) существует такое пороговое значение давления, выше которого пятно контакта пневматика практически не меняет своей формы, т.е. при достаточно больших значениях РПН коэффициент МПР должен асимптотически стремиться к своему минимальному значению.

^ М ПР = т • е_кРгш + д,

Замечание. О физических свойствах статистически выявленных зависимостей можно спорить - каждая точка зрения может опираться на свой опыт и свои эксперименты. Однако всегда можно найти несколько таких незыблемых свойств, с которыми согласятся все оппоненты. Если таких свойств недостаточно для однозначного выбора вида регрессии, то вину за возможные варианты следует возложить на недостаточный статистический материал, не позволяющий увидеть недостающие свойства. С одной стороны, такая ситуация дает пищу для планирования новых экспериментов, а с другой стороны, порождает необходимые в этом случае научные дебаты.

ЛИТЕРАТУРА

1. Бехтина Н.Б., Кубланов М. С. Факторы, определяющие взаимодействие авиационного шасси с взлетно-посадочной полосой // Научный Вестник МГТУ ГА, серия Аэромеханика и прочность, № 81, 2005. - С. 80 - 86.

2. Бехтина Н.Б. Комплексная методика определения коэффициента сцепления колес шасси с взлетно-посадочной полосой для математического моделирования // Научный Вестник МГТУ ГА, серия Аэромеханика и прочность, № 81, 2005. - С. 87 - 95.

3. Бехтина Н.Б. Математическая модель бокового коэффициента сцепления колеса пневматика шасси при движении ЛА по ВПП // Научный Вестник МГТУ ГА, серия Аэромеханика и прочность, № 97, 2006. - С. 134 - 140.

4. Асовский В.П. Аэродинамические особенности процессов авиационного опрыскивания перспективными автожирами // Научный Вестник МГТУ ГА, № 138, 2009. С. 150 - 157.

METHOD OF MULTIDIMENSIONAL REGRESSION MATHEMATICAL MODELS BUILDING

Kublanov M.S.

There is considered regression mathematical models building which are described by 4 or more factors. There is proposed the method based on exploratory development experience summering.

Key words: many-dimensional regressive mathematical model, methodology of model building.

Сведения об авторе

Кубланов Михаил Семенович, 1945 г.р., окончил МГУ им. М.В. Ломоносова (1968), доктор технических наук, профессор кафедры аэродинамики, конструкции и прочности летательных аппаратов МГТУ ГА, ведущий научный сотрудник, автор более 100 научных работ, область научных интересов - механика, математические методы моделирования.

сухой ВПП, мокрой ВПП,

ВПП с мокрым снегом.

i Надоели баннеры? Вы всегда можете отключить рекламу.