УДК 519.25; 519.65 С.Н. Думнов, В.А. Русанов, Д.Б. Лабаров, Е.А. Босхолов
ОПТИМИЗАЦИИ ПАРАМЕТРОВ ВЕКТОРНОЙ РЕГРЕССИИ МНОГОФАКТОРНОГО ФИЗИКО-ТЕХНИЧЕСКОГО ПРОЦЕССА ВОССТАНОВЛЕНИЯ ПРЕЦИЗИОННЫХ ДЕТАЛЕЙ
СЕЛЬСКОХОЗЯЙСТВЕННОЙ ТЕХНИКИ
В статье предлагается универсальный способ тензорного моделирования оптимальных параметров многофакторного физико-технического процесса (ФТП). Он основан на представлении регрессионной математической модели исследуемого ФТП в виде заданной суммы ковариантных тензоров конечной валентности и предъявляет минимальные требования как к «объему» экспериментальных данных, необходимых для параметрической идентификации тензорной модели, так и вычислению, согласно этой модели, оптимальных функциональных характеристик ФТП.
Ключевые слова: параметр, векторная регрессия, тензорное моделирование, физикотехнический процесс.
S.N. Dumnov, V.A. Rusanov, D.B. Labarov, Ye.A. Boskholov
PARAMETERS OPTIMIZATION OF VECTOR REGRESS OF MULTIFACTORIAL PHYSICOTECHNICAL PROCESS OF RESTORATION OF AGRICULTURAL MACHINERY PRECISION DETAILS
The universal way of tensor modeling of the multifactorial physicotechnical process optimum parameters (PTP) is offered in the article. It is based on the representation of regress mathematical model of the investigated PTP in the form of the set sum of the final valency covariant tensors and shows minimal requirements both to the "volume" of the experimental data necessary for tensor model parametrical identification and to the PTP optimum functional characteristics calculation according to this model.
Key words: parameter, vector regress, tensor modeling, physicotechnical process.
Введение. Значительный теоретико-прикладной интерес регрессионный анализ первоначально приобрел в задачах определения оптимальных параметров линейных стационарных статических систем типа «вход-выход»; в большинстве случаев исследователи ограничивались применением этого анализа к конечномерным системам [1-2]. При этом по существу задача регрессии формулировалась в терминах вычисления оптимальной (как правило, квадратичной) оценки этих параметров по методу наименьших квадратов с последующим применением [3] алгоритма построения соответствующей псевдообратной матрицы.
Анализ означенных выше вопросов в данной работе отличается от традиционного изложения, поскольку авторы стремились выявить геометрическую, качественную сторону регрессионного моделирования и его приложений. В соответствии с этим ниже нет ни одной сколько-нибудь сложной формулы, зато появляется (в отличие от [1-2]) целый ряд фундаментальных понятий, которые ранее были в тени; поэтому пришлось излагать их достаточно подробно, не предполагая по их поводу каких-либо предварительных знаний, выходящих за рамки стандартных элементов тензорной алгебры [4], а также функционального [5] и системного [6] анализа. Прикладной стороной в использовании нелинейной векторной регрессии в работе выступает задача аналитического решения линейно-квадратичной оптимизации, как способа обеспечения удовлетворительных (оптимальных) характеристик многофакторного физико-технического процесса (ФТП) при условиях достаточно ограничительных объемов потребных вычислений. Против этого утверждения трудно возразить, поскольку, очевидно, оно основывается как на опыте численных, так и на бесспорных теоретических соображениях.
1. Постановка задачи. Пусть [1 - поле вещественных чисел, Я" - л-мерное векторное пространство над евклидовой нормой ||-||яп, С01(У1,...,У„)€#?П - вектор-столбец С элементами у1,...,у„е#? И пусть Мп,т{Я) -пространство всех лхт-матриц с элементами из Я и фробениусовой матричной нормой ||0||ь=(Цс(}2)1/2, 0=[су. Далее, через Ттк обозначим пространство всех ковариантных тензоров к-й валентности (вещественных полилинейных форм Ятх...хЯт->Я) С тензорной нормой II fk■m\\f■=Шi■■■J2Уl2> гДе Ь..]- коэффициенты (координаты [4, 96]) тензора /*т, значения которых заданы относительно стандартного базиса в Ят.
Пусть сое#?™ - некоторый «фиксированный режим» заданного ФТП. Выделим к рассмотрению класс многомерных статических нелинейных систем типа «вход-выход», описываемых векторно-тензорным уравнением регрессии вида
w{a+v)=c+Av-nx)\(Lp2 k . ,£/=2 к Um(v,..., i/))+e(co, v), (1)
и/(ю-н/)€#?п, \/(Rw, c<Rn, A(Mn_m{R), freTJ, вектор-функции s(ro,-): Rm->Rn класса
||s(ffl,i/)||Rn=o((i/i2+...+i/m2)fc'2), i/=col(i/i,...,i/m).
Постановка задачи:
а) для заданного значения сое#?™ аргумента исследуемой вектор-функции ФТП w(-)\ Q->Rn, где Q -открытая область в Rm и фиксированного индекса к определить аналитические условия, при которых отображение i/i/(-) удовлетворяет системе (1) с некоторыми С, A, ffm, '\<i<n, 1 <j<k]
б) построить векторно-матрично-тензорные апостериорные оценки для с, A, ffm, '\<i<n, 1 <j<k из решения двухкритериальной задачи параметрической оптимизации (параметрическая идентификация нелинейной регрессионной модели ФТП):
Гтт(1м.....,(|||%-с-Д%со1(Х/=2.....*^;т(%.. .,(/(/>),.■ .,Х/=2.kUm{v®,.. .,1/(/)))1И2)1/2.
^ (2)
1тт(||с||яп2+||Д||^+Б=1...„Е/=2../с||/7’т||т2)1/2;
здесь i/i/(/)rf?n, i/(/)rf?m, 1 <l<q - суть векторы экспериментальных данных (щц - «реакция» на «вариацию» (/и относительно режима corf?™), q - общее число экспериментов, при этом ограничений на величину q не накладываем (см. замечание 2);
в) для заданного вектора сое#?™ определить вектор «входных» переменных v*e еRm, обеспечивающий из решения задачи нелинейной «(/-оптимизации» взвешенно-осредненную оценку «выходных» характеристик ФТП вида:
min{F(v): V(Rm}, F(i/):=E=i....п/ж(ю-н/), (3)
где переменные у вектор-функции col(i/i/i(ro+i/),...,i/i/„(ro+i/))=i/i/(ro+i/)rf?n имеют аналитические представления в силу идентифицированной модели (1) (согласно п. б); г, - заданные весовые коэффициенты взве-шенно-осредненной оценки ФТП.
2. Существование векторной регрессии с переменными в тензорных классах TJ, }<к. В настоящем разделе кратко исследуем некоторые аналитические свойства нелинейных векторных регрессий многих переменных, которые «внешне» похожи на поведение голоморфных функций (задача а) из п. 1). В связи с этим изложение будет в основном основываться на понятии сильной производной (производной Фреше) [5, 481]. Последнее ставит задачу определения остальных аналитических понятий и, в частности, дифференциалов высших порядков, через конструкции сильных производных; известно [5, 491], что данные производные по существу можно (и удобно) трактовать как некоторые математические конструкции со специальной геометрической полилинейной структурой.
Определение 1 [5, 480]. Пусть Q - открытая область в Rm,w- отображение множества Q е Rn и со - некоторая точка из Q. Если существует такая матрица A&Mn,m{R), что имеет место
lim{||i/i/(ffl+i/)-i/i/(ro)-/Ai/||Rn/||i/||Rm: i/->0eRm}=0, (4)
то данная матрица А называется производной Фреше от функции w в точке со.
Замечание 1. Нетрудно установить, что производная Фреше определяется матрицей частных производных dWildVj, "l^n, 1 <j<m в точке со (матрица Якоби); отметим, однако, что факт существования в точке со частных производных функций и/2, ..., wn (здесь и/=со1 (и/1,...,wn)) не обеспечивает еще наличие производной Фреше, как показывает следующий достаточно простой пример:
Пример 1. Пусть /7=1, /77=2, W(V],V2)=V]V2l{V]2+V22)2 и и/(0,0)=0, ю=(0,0). Ясно, что
ди/(0,0)/ЭУ1=ди/(0,0)/ЭУ2=0. Поэтому, если бы соответствующая производная Фреше существовала, то, очевидно, это дало бы ее нулевой оператор и, следовательно, соотношение (4) дало бы Iim{w(fvi,fv2)/|f|: f->0eR}=0, между тем в действительности этот предел равен да, если только vi*0 и v^O.
Производную Фреше от w в точке со будем обозначать через и/(со)<1). При этом, если производная w(co)<1> существует для каждой точки coeQ и если кроме того со->и/(со)<1) есть непрерывное отображение из
области О в Мп,т{Н), то отображение ш называется непрерывно дифференцируемым в О. В силу отмеченного, имеет смысл говорить о производной для отображения иД1>: П->М„,т(Я) в точке сое О, которую, если она существует (при очевидном изоморфизме пространств Мп,т(Я) и RnУm), называют второй производной отображения \м и обозначают и/(со)<2). Если вторая производная существует в каждой точке множества О, то тем самым корректно определен оператор \/\Р\ производная которого называется третьей производной отображения и/, и вообще производная и/(со)М порядка к в точке со есть по определению производная оператора П->ЯпХ('(-1)т, при этом можно каждой производной и/(со)М естественным образом поставить в соответствие элемент пространства /(-линейных (при к=2 билинейных) отображений из Rmx...xRm в Rn [5, 488]. В такой постановке дифференциал к-го порядка допускает более удобную (и наглядную) интерпретацию в конструкциях ковариантных тензоров из Ттк.
Утверждение 1. Пусть О - открытая область в Rm, \м- отображение множества О е Rn и ю
- некоторая точка из О. Если существует производная 1/1/(со)№ порядка к, то ее дифференциал к-го прядка в точке сое Я™ имеет аналитическое представление (при veRm) вида
1/1/(ю)№(|/,..., 1/):=со1 (/?’т(У,№т{у, ■■■,'/)),
гдеЪктеТтк, /=1,...,л.
В следующем утверждении установим важное аналитическое свойство, которым должна обладать вектор-функция и/, с целью прояснения: когда отображение и/ удовлетворяет, по крайней мере, при некоторых разумных дополнительных предположениях о нем - одному из тех специальных конкретных законов, от которых произошло понятие тензорной регрессии (1), как естественного продукта непрерывного процесса консолидации, абстрагирования и обобщения.
Утверждение 2. Пусть О - открытая область в Rm, \м- отображение множества О. в Rn и со
- некоторая точка из П. Если существует производная |/у(со)М которая суть равномерно непрерывная функция отав О., то векторное отображение иг. Q^■Rn удовлетворяет системе (1) с некоторыми тензорами "{^йп, 1 <]<к, вектором с=и/(со) и (пхт)-матрицей /4=и/(со)(1).
3. Параметрическая идентификация билинейно-тензорной структуры нелинейной векторной регрессии. Начнем с уточнения конструкции уравнения (1). Это уточнение имеет довольно специальный (частный) характер, но его использование в потенциале позволяет не привлекать сложных вычислительных алгоритмов в оценке оптимального вектора функциональных параметров ФТП.
Рассмотрим случай k=2. В такой постановке уравнение (1) примет вид:
w(<x>+v)=c+Av+co\(vJBlV,...,vJBnv)+s((й,v), (5)
где б;^4,т(Я), /=1,...,л при этом считаем, что каждая б, - суть верхняя треугольная матрица [7, 38]; в силу утверждения 2, полагаем, что с=и/(со), /4=и/(со)(1).
Параметрическую идентификацию в многокритериальной векторно-матрично-тензорной постановке (2) для многосвязной стационарной статической нелинейной модели типа «черный ящик» в классе регрессий (5) свяжем с понятием нормального псевдорешения (канонического решения по методу наименьших квадратов) для конечномерной системы линейных алгебраических уравнений.
Определение 2 [7, 507]. Нормальным псевдорешением системы линейных алгебраических уравнений
вида
йх=с1, ОеМ,,р(Я), с/е#?ч
называется вектор х&р, имеющий наименьшую евклидову норму ||х||/?р среди всех векторов, приносящих минимум величине нормы ЦОх-с/Ця^.
Далее обозначим через £, единичную дхд-матрицу и пусть ОеМ,,р(Я). Через 0+ обозначим обобщенную обратную (псевдообратную) матрицу Мура-Пенроуза [7, 500] для матрицы О; известно, что асимптотическая конструкция псевдообратной матрицы имеет следующий аналитический вид: 0+=Ут{0т(00т+т£д)-1: т-> -»0}, где символ «т» - операция транспонирования; условимся, что везде далее знак«+» означает операцию псевдообращения соответствующей матрицы.
Лемма 1 [8, 35]. Вектор x=D+d - суть нормальное псевдорешение линейной системы: Dx=d, DeMq>p(R), deRv.
Для взаимноувязывания параметров системы (5) и данных генеральной выборки обозначим через Й(/)£#?1+т(т+3)/2 вектор, имеющий (с учетом верхней треугольной структуры матриц б, /=1,...,л) следующее координатное представление:
й(/>:=со1(1, i/i(/>, ..., i/m®, i/i(/)i/i(/>, ..., i/^)i/S(/), ..., i/m(/)i/m(/))rf?1+m<m+3)/2, (6)
1 <r<s<m, col(i/i(/), ..., i/m(,)):=i/wrf?m,
1</<q.
Назовем L/:=[U(i>, ..., U(q)]TdWq,i+m(m+3)/2(R) полной матрицей экспериментальных данных входных воздействий, соответственно р,:=со1(и/,(1), ..., - полным вектором экспериментальных данных для вы-
ходного сигнала w, (/=1,..л). Далее, стремясь к линейно-параметрическому описанию коэффициентов нелинейной модели «вход-выход» для выходного ФТП-сигнала w, выпишем (согласно системы (5)) линейноквадратичную форму правой части уравнения его регрессии
C/'+Xl...........g..р.mfoigpVgVp (/'—1,...,/?). (7)
Теперь введем в рассмотрение (1+т(т+3)/2)-вектор z, параметров модели ФТП
Ci, ал, ..., aim, bill,..., bigp, ..., b imm
для модели регрессии (7). Ясно, что, в силу уравнений (7), любой фиксированный набор из n таких векторов полностью определяет (задает) аналитическое представление модели относительно некоторой системы «вход-выход» типа (5):
Z/.—СО|(С/, 9/1, ..., dim, Ь/11, ■■■, bigp, ..., bjmm) £^+m(m+3X2,
1 <g<p<m.
Утверждение 3. Параметрическая идентификация (2) в терминах регрессионной модели (5) имеет алгебраическое решение
z;=U+Р/, /=1,...д (8)
где U - полная матрица экспериментальных данных входных воздействий (6); р, - полный вектор экспериментальных данных выходного сигнала w, (/= 1,.. ,,л), индуцированного воздействиями (6).
Следствие 1 [9, 263]. Пусть z*=l/+p, (/= 1,..., л). Тогда каждый вектор z параметров регрессионной модели (5), характеризующей поведение ФТП, такой, что имеет место z^z*, удовлетворяет одному из следующих двух условий:
аЛ|Р;-№|И>||Р;-№/*|И,
или, в противном случае:
б) UPrL/zll^ = \\fij-Uzj\\pPи ||z||R1+m(m+3)/2 > ||z,*||R1+m(m+3)/2.
Замечание 2. Качественные оценки а), б) следствия 1 в основном зависят от «объема» апостериорной информации (количества экспериментов д), а именно, если g>1+m(m+3)/2, то, как правило, реализуется пункт а), если g<1+m(m+3)/2, то весьма вероятно, что имеет место методологическая позиция б).
4. Оптимизация управления ФТП на базе билинейно-тензорной интерполяции его функциональной модели. Параметрическая идентификация функциональной модели ФТП класса (5), исследовавшаяся в предыдущем разделе, является необходимым требованием при выборе «управления» v. Однако вариантов подобного управления очевидно много и необходимо выбрать среди них тот, который оптимален с точки зрения некоторого формального критерия, характеризующего определенное «физико-техническое» качество данного управления. В этом разделе рассмотрим критерий оптимальности (3) (с приоритетным выбором коэффициентов п, 1</<л согласно, например, [10]) и обсудим для него алгоритмическую технику получения оптимального управления v*.
Утверждение 4. Пусть 0,:=(б,+б,т), где матрица б, идентифицирована согласно билинейнотензорной регрессионной модели (5). Тогда при варьировании координат вектора veRm показатель функционального качества ФТП вида Ji(v)^.=Wi(v), (/=1,...,л) может, в силу идентифицированных уравнений (5), иметь внутренний экстремум только в точке 1/*е Я™:
v*=-Df]ATei, (9)
где {в1,...,е„} - стандартный базис в №.
Если vTDiV - суть отрицательно определенная квадратичная форма, то функционал качества Ji(v) имеет в точке V* максимум, если vTDiV - положительно определенная квадратичная форма, то Ji(v) претерпевает в V* минимум; в обоих случаях V* - стационарная точка эллиптического типа.
Наконец, если vTDiV может принимать как положительные, так и отрицательные значения (с vTDiV^t0 при у^О), то экстремум отсутствует, а V* - точка гиперболического типа (седловая точка).
Следствие 2. Если матрица О, является положительно определенной (аналогично отрицательно определенной), то минимальное (соответственно максимальное) значение Ji(v*) равно с,-е,т/АОг 1/4те,/2, где с, - /-я координата вектора се Я" системы (5).
Каждый функционал Ji(v), /= 1, п при соответствующем истолковании может быть обобщен на случай целевого функционала (3), который рассмотрим ниже. Таким образом, утверждение 4 и формула (9) позволяют за конечную последовательность действий вычислять геометрические координаты стационарной точки задачи оптимизации (3); данные координаты управления V определяют в терминах идентифицированных коэффициентов системы (5) технологические параметры режима функционирования ФТП.
Утверждение 5. Пусть 0,:=(б,+б,т), /= 1, ..., п, сйад [...] - диагональная пхп-матрица. Тогда стационарная точка v*ё?m задачи оптимизации (3) (для минимизации «взвешенно-осредненной» оценки качества ФТП) имеет вид
^=-(п01+.. .+гпОп)-1((е1+... +е„)тсйад[/'1,... /П]А)Т, (10)
при этом достаточным условием, что решение V* обеспечивает качество
ггпп{Р(|/): 1/е Я™}
является требование: стационарная точка V* имеет эллиптический тип, т.е.
Се1 Щр>0, р=1,...,т , (11)
где [с/(/]реЦ,р(Я) - главные подматрицы [7, 30] матрицы
0:=(г101+.+г„0„),
что эквивалентно: собственные числа X, матрицы О отвечают неравенствам
Х/>0, /=1,...,т. (12)
Изложенный подход методологически расширяет стандартную процедуру планирования эксперимента [1]. При этом, если расчетные (прогнозируемые) координаты стационарной точки (10) по каким-либо физикотехническим параметрам выходят за область адекватности идентифицированной модели (5), то необходимо провести дополнительный натурный эксперимент, т.е. осуществить замер (с вектором V, максимально близким к точке (10)) параметров ФТП с внесением полученного результата в расширенную матрицу экспериментальных данных и. После чего необходимо сделать пересчет [3] всех вышеизложенных этапов процесса оптимизации координат ФТП; при необходимости подобный эксперимент, параметрическую идентификацию (5) и оптимизацию (3) необходимо повторить.
Заключение. Основной задачей работы являлось точное и удобное определение нелинейной векторной регрессии на языке тензорной алгебры, то есть дать такой язык, на котором можно было бы перевести регрессионные математические утверждения, записи на котором были бы компактны и удобны в обращении. При этом проведено построение стационарно-нелинейной математической модели типа «вход-выход» для
процесса определения геометрических координат оптимального ФТП в распределенной среде индуцированных им технологических параметров и используемой для расчета эффективного режима функционирования ФТП. Данная билинейно-тензорная регрессионная модель использует идентифицированные на базе полученных экспериментальных данных многомерные квадратичные уравнения, что позволяет адекватно описать функционирование ФТП в широком диапазоне вариаций его технологических параметров.
Изложенные в статье идеи можно развить в нескольких направлениях теоретико-прикладных изысканий по совершенствованию предложенных выше алгоритмов расчета оптимальной [11-12] технологии построения ФТП, а также расширению рамок адекватности регрессионных уравнений ФТП за счет дополнительного исследования факторов ее нелинейности: на разработку процедуры выбора весовых коэффициентов п, '\<i<n критерия (3), обеспечивающего минимизацию ФТП, исходя из алгебраических условий (11)—(12), обеспечивающих эллиптический характер стационарной точки (10) целевого функционала F{v)\ на расширение линейно-квадратичной формы уравнений регрессии (5) «тейлоровским разложением», согласно утверждения 2 вектор-функции w(v) более высокого порядка; на статистическое описание технологопараметрических координат ФТП.
Литература
1. Адлер, Ю.П. Планирование эксперимента при поиске оптимальных условий I Ю.П. Адлер, Е.В. Маркова, Ю.В. Гоановский. - М.: Наука, 1976. - 255 с.
2. Бернштейн, А.В. Об одной методологии построения аппроксимаций многомерных зависимостей / А.В. Бернштейн, А.П. Кулешов, Е.В. Бурнаев II Параллельные вычисления и задачи управления: докл. междунар. конф. - М., 2008. - С. 56-62.
3. Андриевский, Б.Р. Элементы математического моделирования в программных средах MATLAB и SCILAB I Б.Р. Андриевский, А.Л. Фрадков. - СПб.: Наука, 2001. - 288 с.
4. Варден, Б.П. Алгебра I Б.Л. Варден. - М.: Наука, 1979. - 624 с.
5. Колмогоров, А.Н. Элементы теории функций и функционального анализа I А.Н. Колмогоров, С.В. Фомин. - М.: Наука, 1976. - 544 с.
6. Месарович, М. Общая теория систем: математические основы I М. Месарович, Я. Такахара. - М.: Мир, 1978.-312 с.
7. Хорн, Р. Матричный анализ I Р. Хорн, Ч. Джонсон. - М.: Мир, 1989. - 656 с.
8. Гантмахер, Ф.Р. Теория матриц I Ф.Р. Гантмахер. - М.: Наука, 1988. - 552 с.
9. Ланкастер, П. Теория матриц I П. Ланкастер. - М.: Наука, 1982. - 268 с.
10. Теория выбора и принятия решений I И.М. Макаров, Т.М. Виноградская, А.А. Рубчинский [и др.]. - М.: Наука, 1982. -328 с.
11. Rosenberg, А.Е. On the scientific method and the foundation of system identification. - In: Modelling, Identification and Robust Control (Byrnes С.I., Lindquist A., eds.)/A£. Rosenberg, D.W.C. Shen. - North Holland, Amsterdam, 1986. - P. 563-580.
12. Ljung, L. Theory and Practice of Recursive Identification I L. Ljung, T. Soderstrom. - MIT Press, Cambridge, Massachusetts, 1983.