УДК528.837: 629.78 : 621.003
МЕТОДИКА ПОСТРОЕНИЯ РЕГРЕССИОННЫХ МОДЕЛЕЙ ДЛЯ ОЦЕНКИ МАСС ЭЛЕМЕНТОВ КОСМИЧЕСКИХ АППАРАТОВ С ИСПОЛЬЗОВАНИЕМ КЛАСТЕРНОГО АНАЛИЗА
© 2018 В. И. Куренков, А. С. Кучеров, А. А. Якищик
Самарский национальный исследовательский университет имени академика С.П. Королёва
Статья поступила в редакцию 17.01.2018
Рассматривается задача построения статистических моделей, описывающих зависимость масс бортовых систем космических аппаратов от их целевых параметров Такие модели целесообразно использовать на ранних этапах разработки космических аппаратов. Для построения моделей используются статистические данные по типовым образцам бортовых систем. Поскольку не однородность имеющихся статистических данных может привести к низкому качеству моделей, предлагается, в целях получения более достоверных моделей, разбивать имеющиеся данные на относительно однородные группы (кластеры) с последующим построением регрессионных моделей для каждой группы по отдельности. Сущность методики рассмотрена на примере построения регрессионных моделей для оценки массы оптико-электронных телескопических комплексов космических аппаратов дистанционного зондирования Земли. Кластерный анализ был выполнен с использованием статистического пакета STADIA отечественной разработки. Показано, что увеличение числа задаваемых кластеров приводит к получению более однородных групп исход ных данных и, как следствие, получению регрессионных моделей более высокого качества. С другой стороны, увеличение числа кластеров сопровождается уменьшением числа содержащихся в них данных, которое может оказаться недостаточным для построения адекватных регрессионных моделей. В рассмотренном примере путём варьирования задаваемого числа кластеров было получено устойчивое разделение статистических данных на три кластера. Два из них содержали достаточно большое число данных для построения на их основе регрессионных моделей, которое осуществлялось с помощью математического пакета Mathcad. Было выполнено построение моделей первого и второго порядка, произведена проверка их адекватности и сравнение качества по значению коэффициента детерминации. Полученные регрессионные модели могут быть рекомендованы для прогнозирования массы целевой аппаратуры разрабатываемых космических аппаратов дистанционного зондирования Земли с заданными целевыми параметрами. Ключевые слова: космический аппарат, оптико-электронный телескопический комплекс, целевые параметры, кластерный анализ, регрессионная модель.
ВВЕДЕНИЕ
Существует несколько подходов к выбору основных проектных характеристик и формированию проектного облика космических аппаратов (КА) дистанционного зондирования Земли (ДЗЗ) - на основе: эвристического подхода; установки целевой аппаратуры и элементов обеспечивающих бортовых систем в корпусе заданных габаритов; совершенствования прототипов; совершенствования состава целевой аппаратуры в отсеке полезной нагрузки при неизменных характеристиках отсека служебных систем; компоновки КА «вокруг» оптико-элек-
Куренков Владимир Иванович, доктор технических наук, профессор, профессор кафедры космического машиностроения. E-mail: [email protected]
Кучеров Александр Степанович, кандидат технических наук, доцент, доцент кафедры космического машиностроения. E-mail: [email protected]
Якищик Артём Андреевич, младший научный сотрудник кафедры космического машиностроения. E-mail: yakischik@mail.Ш
тронного телескопического комплекса (ОЭТК); установки ОЭТК, высокоточных оптических приборов и чувствительных датчиков на термо-стабилизированной платформе; установки в состав КА нескольких типов целевой аппаратуры (ЦА) с ограничением общей массы и комплек-сированием работы этой аппаратуры; выбора основных проектных характеристик и начального облика по заданным целевым показателям эффективности.
При реализации упомянутых подходов к проектированию КА ДЗЗ необходимо безусловно выполнить целевые показатели, основными из которых являются периодичность наблюдения, линейное разрешение на местности (детальность), ширина полосы обзора, ширина полосы захвата, производительность съёмки, оперативность доставки видеоинформации на землю, срок активного существования.
Особого обсуждения заслуживает методический подход к проектированию КА ДЗЗ по заданным целевым показателям космической системы наблюдения. Ключом к реализации
данного подхода является разработка математических моделей, связывающих целевые и проектные параметры КА, в частности, моделей для оценки массогабаритных, энергетических характеристик массозатратных элементов целевой аппаратуры и бортовых обеспечивающих систем (БС) КА ДЗЗ. Такие модели строятся на основе физических принципов работы тех или иных устройств, протекающих процессов или на основе обработки статистических данных по изделиям-аналогам с учётом передовых технологий или новых разработок.
Полученные значения массогабаритных, инерционных, энергетических и других проектных параметров КА обеспечивают реализацию устройств, с помощью которых осуществляется получение заданных целевых характеристик (без избытка или недостатка). Практически это означает, что осуществляется оптимизация основных проектных характеристик КА в неявной форме. Теоретически это означает, что производится оптимизация проектных характеристик без формализации задач математического программирования.
На ранних стадиях создания космических аппаратов (КА) весьма важна оценка их массо-габаритных характеристик в зависимости от характеристик эффективности применения по целевому назначению. При этом в первую очередь необходимо построить модели для относительно больших по массе и габаритам систем и элементов КА. Для космических аппаратов высокодетального дистанционного зондирования земли (ДЗЗ) к числу таких систем, прежде всего, относится оптико-электронный телескопический комплекс (ОЭТК), масса которого может превышать 20% от массы КА (КА «Котр5а1>2», «1копо5-2», «КН-11», «СеоЕуе-1 »,<ЮгЬ \Ziew-5 »).
Методика построения регрессионных моделей с использованием кластерного анализа включает следующие этапы:
- сбор и анализ статистических данных по изделиям- аналогам;
- разбиение статистических данных на кластеры (достаточно однородные группы);
- построение регрессионных моделей (различного порядка для каждого кластера данных);
- анализ полученных результатов.
Рассмотрим эти этапы подробнее на примере построения регрессионной модели для оценки массы аппаратуры оптического наблюдения космических аппаратов дистанционного зондирования Земли.
СБОР И АНАЛИЗ СТАТИСТИЧЕСКИХ ДАННЫХ ПО ИЗДЕЛИЯМ-АНАЛОГАМ
Анализ характеристик ОЭТК показывает [1], что его длина в первом приближении пропор-
циональна отношению Н/ , а диаметр - от-
И / /АЛ
ношению удд , где, Н - высота орбиты, Аь
- линейное разрешение на местности, В - ширина полосы захвата.
Поэтому масса ОЭТК шдажявляется функцией
указанных отношений: тОЭТК = /(^дд'^дд) >
где / (•) - неизвестна функция, подлежащая определению.
Статистические данные по КА ДЗЗ высокого и сверхвысокого разрешения и их оптико-элек-тронной аппаратуре [2] приведены в табл. 1.
Анализ приведённых статистические данных показывает, что они являются весьма разнородными. Это объясняется тем, что в различной аппаратуре наблюдения могут использоваться разные целевые и конструкционные характеристики: диаметр апертуры, угловое разрешение, количество спектров наблюдения, высота полёта КА, оптические схемы, количество используемых зеркал, силовые схемы аппаратуры, конструкционные материалы и др. Существенное влияние на массогабаритные характеристики аппаратуры наблюдения оказывают такие факторы, как различные производители (технологическая культура производства), а также год выпуска аппаратуры.
Попытка построить регрессионную модель по всей их совокупности приведёт, очевидно, к низкому качеству такой модели. Поэтому необходимо предварительно разбить данные на более или менее однородные группы. Эта задача может быть решена с помощью метода кластерного анализа [3].
РАЗБИЕНИЕ СТАТИСТИЧЕСКИХ ДАННЫХ НА КЛАСТЕРЫ
С помощью метода кластерного анализа можно произвести классификацию объектов, на которые влияет множество факторов, разбив эти объекты на заданное число компактных групп (кластеров). Мерой качества полученного разбиения является так называемое среднее внутрикластерное расстояние, которое показывает степень близости характеристик в рассматриваемой группе. Чем ближе рассматриваемые характеристики в группе (чем компактнее полученные кластеры), тем среднее внутрикластерное расстояние меньше,
Для каждого кластера определяется его центр - тот из объектов, сумма расстояний до которого от всех прочих объектов (внутрикластерное расстояние) является наименьшей.
Для получения адекватных результатов кластерного анализа исходные данные должны быть нормированы (например, относительно максимального или среднего значения). В противном случае параметры, значения которых
Таблица 1. Статистические данные по ОЭТК КА ДЗЗ
№ п/п. КА ОЭТК H, KM AL, M в, KM Щэтк ,кг
1 GeoEye-1 GIS 770 0,460 16,4 452,0
2 КА-П Лаз^фит 730 0,300 17,1 1541
3 WorldView-1 WV-6G 496 0,460 17,6 380,0
4 Pleiades-1A HiRI 705 0,700 20,0 195,0
5 Pleiades-1B HiRI 694 0,700 20,0 195,0
6 Ikonos OSA 686 0,820 11,3 171,0
7 CartoSat-2A PAN 635 0,800 9,60 120.0
8 CartoSat-3 PAN (CartoSat-3) 630 0,300 6,00 120,0
9 Kompsat-1 EOS 685 6,60 17,0 35,00
10 Kompsat-2 MSC 685 1,00 15,0 150,0
11 Kompsat-3 AEISS 675 0,700 15,0 80,00
12 Kompsat-ЗА AEISS-A 528 0,550 12,0 80,00
13 ASNARO OPS 504 0,500 10,0 97,00
14 ALOS AVNIR-2 692 10,0 70,0 198,0
15 ALOS PRISM 692 2,50 70,0 528,0
16 FORMOSAT-2 RSI 891 2,00 24,0 114,0
17 Spot-5 HRG 832 2,50 60,0 356,0
18 GökTürk-2 EOS-C 684 2,50 20,0 41,00
19 CBERS-4 PANMUX 778 5,00 60,0 263,0
20 NigeriaSat-2 VHRI 718 2,50 20,0 41,00
21 VENLIS VSSC 720 5,30 28,0 43,50
22 IRS-1C PAN (IRS) 817 5,80 70,0 120,0
23 Аврора Аврора 510 1,54 41,3 53,00
24 OuickBird BGIS-2000 450 0,65 16,8 380,0
25 Deimos-2 HIRAIS 720 1,00 12,0 50,00
26 Ресурс-ДК GEOTON-1 570 1,00 28,3 310,0
существенно различаются, могут внести различный вклад в анализируемые данные и существенно повлиять на результаты анализа.
Измерение расстояний с/ между /и-мерны-
ми объектами X, X, предполагает введение метрики, т.е. способа измерения этого расстояния.
К числу наиболее часто используемых метрик относятся следующие: - Евклидова:
-Манхеттеновская:
т
d, -IN - 4
1=1
-Брея-Картиса:
II
/=i
х.
Канберра:
¡ i i \х -X,
ä.-Ъ
1= 1
X'+X'j
Для получения более достоверных результатов анализа целесообразно использовать разные метрики и сравнить получаемые результаты.
В настоящем исследовании будем считать, что функция отклика (масса ОТК) тоэш в наибольшей степени зависит от двух переменных
(факторов) х = "/у и у у =■ ; у .
Нормирование переменных, включаемых в регрессионную модель ОЭТК, можно выполнить с помощью следующих выражений: — х — у — тг
х =
}' = ■
т =
'ОЭТК
Уп
т
тах ' '»О П К .
ОЭТК„
- соответственно мак-
i=i
ГДе Хтах> У,
симальные по рассматриваемой совокупности данных значения факторов х, у и массы ОЭТК.
Нормированные значения переменных приведены в последних трёх столбцах табл. 2.
Таблица 2. Нормализованные статистические данные по ОЭТК КА ДЗЗ
№ п/п КА II \t II m03TK > КГ X У m
1 GeoEye-1 35,65 1674 452,0 0,625 0,688 0,293
2 Лазурит 57,00 2433 1541 1,000 1,000 1,000
3 WorldView-1 38,26 1078 380,0 0,671 0,443 0,247
4 Pleiades-1А 28,57 1007 195,0 0,501 0,414 0,127
5 Pleiades-IB 28,57 991,4 195,0 0,501 0,407 0,127
6 Ikonos 13,78 836,6 171,0 0,242 0,344 0,111
7 CartoSat-2A 12,00 793,8 120,0 0,211 0,326 0,078
8 CartoSat-3 20,00 2100 120,0 0,351 0,863 0,078
9 Kompsat-1 2,576 103,8 35,00 0,045 0,043 0,023
10 Kompsat-2 15,00 685,0 150,0 0,263 0,282 0,097
11 Kompsat-3 21,43 964,2 80.00 0,376 0,396 0,052
12 Kompsat-ЗА 21,82 960,0 80,00 0,383 0,395 0,052
13 ASNARO 20,00 1008 97,00 0,351 0,414 0,063
14 ALOS 7,000 69,20 198,0 0,123 0,028 0,128
15 ALOS 28,00 276,8 528,0 0,491 0,114 0,343
16 FORMOSAT-2 12,00 445,5 114,0 0,211 0,183 0,074
17 Spot-5 24,00 332,8 356,0 0,421 0,137 0,231
18 GokTurk-2 8,000 273,6 41,00 0,140 0,112 0,027
19 CBERS-4 12,00 155,6 263,0 0,211 0,064 0,171
20 NigeriaSat-2 8,00 287,2 41,00 0,140 0,118 0,027
21 VENjiS 5,283 135,8 43,50 0,093 0,056 0,028
22 IRS-1С 12,07 140,9 120,0 0,212 0,058 0,078
23 Аврора 26,82 331,2 52,64 0,470 0,136 0,034
24 OuickBird 25,85 692,3 380,0 0,453 0,285 0,247
25 Deimos-2 12,00 720 50,00 0,211 0,296 0,032
26 Ресурс-ДК 28,30 570 310,0 0,496 0,234 0,201
Для выполнения кластерного анализа данных был использован статистический пакет STADIA отечественной разработки [4].
Измерение расстояний между объектами выполнялось с использованием 4 различных метрик: Эвклида, Манхеттеновской, Брея-Кар-тиса и Канберра [4]. Чишо кластеров варьировалось в пределах от 2 до 6. Зависимость среднего внутрикластерного расстояния, рассчитанного в статистическом пакете STADIA, от фактического числа кластеров для различных использованных метрик показана на рис. 1.
Анализируя данные этого рисунка, можно видеть, что значение среднего внутрикластерного расстояния для трёх из четырёх использованных метрик практически перестает изменяться при достижении числом кластеров значения 5. Дальнейшее увеличение числа кластеров нецелесообразно, так как, с одной стороны, это практически не влияет на точность разбиения статистических данных, с другой стороны, увеличение числа кластеров сопровождается уменьшением числа содержащихся в них объектов, которое может оказаться недо-
статочным для построения соответствующих регрессионных моделей. Так, например, двух-факторная модель второго порядка требует для своего построения не менее 6 наборов данных (значений факторов и отклика).
В целом, кластерный анализ позволяет лишь подготовить предварительные данные, а окончательное решение о разбиении статистических данных на кластеры принимает пользователь исходя из содержательных представлений о целях исследования.
В данной работе, исходя из полученных результатов, было принято решение о разбиении статистических данных на 5 кластеров. Однако фактическое число полученных кластеров при использовании метрики Эвклида ограничилось значением 3, а при использовании метрик ма-хеттеновской и Брея-Картиса - значением 4. Это объясняется тем, что при попытке дальнейшего увеличения числа кластеров изменение внутрикластерного расстояния оказывалось меньше погрешности расчета, установленной в пакете STADIA.
Ниже приведены соответствующие про-
2 В 3
а о ез
D О В
Г\
К
О ?3
г
8
ва
<и 1> В ft V
0.8
0.6
0.4
0.2
0
2 3 4 5 6
^ Число кластеров
-Эвклид — • -Манхеттен
---Брей-Картис--Канберра
Рис. 1. Зависимость среднего внутрикластерного расстояния от числа кластеров
токолы расчёта в программе STADIA . Номера кластеров представлены в строках и обозначены цифрами 1, 2, 3 и т.д. После номера кластера в скобках представлены номера входящих в него объектов в соответствии с табл. 2, звёздочками помечены объекты, являющиеся центрами кластеров.
Метрика «Эвклид» Кластеры: Среднее внутрикластерное расстояние =0.1869
1= (1*,2,3,8)
2= (4,5,11,12,13,15,17,23,24,26*) 3= (6,7,9,10,14,16,18,19,20*,21,22,25)
Метрика «Манхеттен» Кластеры: Среднее внутрикластерное расстояние =0.07294 1= (1*,2,3)
2= (4,5,6,7,8,10,11,12,13*)
3= (15,17*23,24,26)
4= (9,14,16,18*, 19,20,21,22,25)
Метрика «Брей-Картис» Кластеры: Среднее внутрикластерное расстояние =0.1691
1= (1*,2,3,8)
2= (4,5,6,11*, 12,13)
3= (15,17,23,24,26*)
4= (7,9,10,14,16*,18,19,20,21,22,25)
Метрика «Канберра» Кластеры:
Среднее внутрикластерное расстояние =0.7459
1=(1,2*,8)
2= (3,6,7,10,15,17,23,24*,25,26)
3=(4*,5)
4= (11*, 12,13)
5= (9,14,16,18,19*20,21,22)
Можно видеть, что большинство используемых метрик позволяет выделить два устойчивых кластера: кластер, объединяющий объекты из табл. 2 с номерами 4, 5, 6, 11, 12, 13 (ОЭТК сверхвысокого разрешения) и кластер 2, объединяющий объекты с номерами 9, 14, 16, 18, 19, 20, 21, 22 (ОЭТК высокого разрешения с широкой полосой захвата). Эти кластеры включают число объектов, достаточное для последующего регрессионного анализа.
ПОСТРОЕНИЕ РЕГРЕССИОННЫХ МОДЕЛЕЙ
Построение регрессионных моделей, связывающих массу ОЭТК с целевыми характеристиками, было выполнено с помощью математического пакета Ма11иас1.
Ниже приводятся протоколы расчётов с соответствующими пояснениями.
Исходные данные для анализа представлены в табл. 3.
Таблица 3. Исходные данные для регрессионного анализа
Номер Номер Космический В H тоэтк '
кластера объекта аппарат AL У ~ Л Т AL кг
4 Pleiades-1А 28,57 1007 195,0
5 Pleiades- 1В 28,57 991,4 195,0
1 6 Ikonos 13,78 836,6 171,0
11 Kompsat-3 21,42 964,3 80,0
12 Kompsat-3A 21,81 960.0 80.0
13 ASNARO 20,00 1008 97,0
9 Kompsat-1 2,57 103,8 35,0
14 ALOS 7,00 69,20 198,0
16 FORMOSAT-2 12,00 445,5 114,0
2 18 GökTiirk-2 8,00 273,6 41,0
19 CBERS-4 12,00 155.6 263.0
20 NigeriaSat-2 8,00 287,2 41,0
21 VEN,uS 5,28 135,9 43,5
22 1RS-1С 12,06 140,9 120,0
Кластер данных для ОЭТК сверхвысокого разрешения
Задаётся, для удобства последующих вычислений, нумерация элементов матриц, начиная с единицы, для чего стандартной функции ORIGIN присваивается значение 1. Компонентам матрицы Мх присваиваются значения факторов X, у, компонентам вектора vy -значения отклика т0ЭА :
ORIGIN := 1
28.57 1007.14^ ( 195 ^
28.57 991.43 195
21.43 964.29 80
vy:=
21.82 960 80
20 1008 97
13.78 836.59 J ,171,
Мх:=
Задаётся порядок регрессии П : вначале принимается П = 1 (линейная регрессия), коэффициенты регрессии вычисляются с использованием стандартной функции regress и записываются в вектор z:
n := 1 z := regress(Mx, vy,n) .
Рассчитанные с помощью полученной модели значения отклика присваиваются компонентам вектора tvy:
fit(x) := interp(z,Mx,vy,x);
i := 1.. length(vy)
tvy. := fit
Wfl.
kd := corr(vy,tvy)~ kd = 0.576 .
Как известно, регрессионная модель тем лучше соответствует статистическим данным, чем значение коэффициента детерминации ближе к единице; можно видеть, что качество данной регрессии невысоко. Действительно, сравнение фактических и предсказанных значений массы аппаратуры показывает их заметное различие, в особенности в области небольших масс:
vy =
'195^ 195 80 80 97 171
tvy =
f 170.087^ 184.849 121.931 130.792 63.15 147Л9
V
Для проверки адекватности полученной регрессионной модели вычисляется статистика Фишера Fis, как отношение дисперсии, обусловленной регрессией MSSR, к остаточной дисперсии MSSE ; для вычисления последних вначале рассчитываются соответствующие суммы квадратов разностей SSR и SSE и используются степени свободы dfi" и dfe :
residual := vy - tvy SSE := у residual"
SSR := Yctvy - mean(vy))*
SSR = 9.205 X 10
SSE = 6.775 X 10"" dfi* := 2 dfe := length(vy) - 1 - dir dfe = 3
Для оценки качества полученной регрессии вычисляется коэффициент детерминации Ы -квадрат коэффициента корреляции между фактическими и вычисленными (предсказанными) значениями отклика:
MS SE :=
SSE
Fis :=
dfe MSSR MSSE
SSR
MSSR :=-
dfr
Fis = 2.038
С помощью стандартной функции <// (•) вычисляется критическое значение статистики /с для уровня значимости р=0,05и соответствующих значений степеней свободы dfr и dfe:
р := 0.05 fc := qF( 1 - р,dfr,dfe) fc = 9.552.
То обстоятельство, что рассчитанное значение статистики Фишера меньше её критического значения (Fis < fc), заставляет признать построенную модель неадекватной имеющимся статистическим данным. Заметим, что модель регрессии может быть признанной адекватной лишь на уровне значимости 0,28, при котором соответствующее критическое значение статистики Фишера (2,005) становится меньше рассчитанного.
Для улучшения качества регрессионной модели повысим её порядок: п := 2 z := regress(Mx,vy,n) fit(x) := interp(z,Mx,vy,x) i := 1.. length(vy)
\t T^l tvy. := fit) ÍMx j
kd := corr(vy,tvy)"
kd = 1
г 195 ^ '195"1
195 195
80 80
tvy =
80 80
97 97
,171, ,171,
-
3 3 2 -0.042 1.868 x 10
-3
Таким образом, получена следующая регрессионная зависимость массы ОЭТК от целевых параметров:
m,
1,196х2 +1,868-10"3 / -0,042xv
ОЭТК
-53,009х - 2,537 V +1782.
(1)
Коэффициент детерминации возрос до максимально возможного значения - единицы. Действительно, сравнение фактических и предсказанных значений массы аппаратуры показывает их полное совпадение:
vy =
Значения коэффициентов регрессии содержатся в векторе
-2.537 1.782 x 10 -53.009 2.196/
Первые две компоненты этого вектора представляют собой значения служебных переменных пакета МаЙжш!, третья - порядок регрессии, остальные - это коэффициенты при слагаемых в уравнении регрессии, соответствие с которыми указано в табл. 4.
Проверка модели по критерию Фишера, ввиду полного совпадения фактических и предсказанных значений массы аппаратуры, не требуется.
Кластер данных для ОЭТК высокого разрешения
Построим вначале линейную модель:
ORIGIN := 1
Мх :=
12 445.5 Л Г 114 ^
2.58 103.79 35
7 69.2 198
8 273.6 41
vy :=
12 155.6 263
8 287.2 41
5.28 135.85 43.5
12.07 140.86 у ,120,
n := 1 z := regress(Mx,vy,n) fit(x) := inteip(z,Mx,vy,x)
i := 1.. length(vy)
2
kd := corr(vy,tvy) residual := vy — tvy
tvy. := fit J\ 1
M
<i>-
kd = 0.625
SSE := ^ residual"
dfr := 2 dfe := length(vy) - 1 - dfr dfe = 5
MS SE :=
S SE
Fis :=
dfe
MS SR. MS SE
SSR
MSSR := -
dfr
Fis = 4.165
Модель адекватна на уровне значимости 0,09 (ему соответствует критическое значение статистики Фишера fc, меньшее рассчитанного для полученной регрессии значения Fis):
р := 0.09 fc := qF( 1 - р, dfr,dfe) fc = 4.05
Таблица 4. Значения коэффициентов регрессии
Компонента вектора z -4 Z5 -6 Z1
Значение - 0,042 1,868 10 3 - 2,537 1,782 10s - 53,01 2,196
Член регрессии ху у2 У свободный член X х2
После извлечения коэффициентов регрессии из вектора 2 уравнение модели можно записать в следующем виде:
m
WW
= 20,673х-0,423>< +19,095. (2)
Полученная модель может быть использована для практических расчётов; однако можно попытаться получить более точную модель, повысив её порядок:
о := 2 г := ге^езз(Мх,\'у,п)
Ш(х) := ш1егр(г,Мх,уу,х)
i := Í.. length(vy)
2
kd :- corr(vy,tvy)~ residual := vy - tvy
tvy. ;= fit[(MxT)(l>]
kd = 0.779
SSE := residual"
dfr := 2 dfe := length(vy) - 1 - dfr dfe = 5
SSE SSR MSSE :=- MS SR :=
dfe
dfr
MSSR
Fis := - Fis = 8.795
MSSE
p := 0.05 fc := qF( 1 - p, dfe, dfr) fc = 19.296
Поскольку выполняется соотношение Fis>fc, полученная модель адекватна на уровне значимости 0,05.
Извлекая из вектора
2Т = (з 3 2 0.469 -6.032 X Ю-3
-2.292 137.275 35.491 -5.09)
коэффициенты уравнения регрессии, можно записать его в следующем виде:
Щ®т■ = "5>09x2 - 6,032 ■ 10"3 V2 + 0,469XV +35,491.Y - 2,292у + 137,275.
(3)
АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ
Кластерный анализ статистических данных позволил выделить два устойчивых кластера, достаточно обширных для построения на их основе регрессионных моделей.
В первый из них вошли шесть КА с аппаратурой сверхвысокого разрешения. Поскольку построенная для данного кластера регрессионная модель первого порядка показала низкое качество (коэффициент детерминации 0,576 и адекватность с уровнем значимости 0,29), было выполнено построение модели второго порядка (1), для которой коэффициент детерминации составил 1.
Для второго кластера, включающего восемь КА высокого разрешения с широкой полосой захвата, приемлемым качеством обладают как модель первого порядка (2) с коэффициентом
детерминации 0,625 и адекватностью с уровнем значимости 0,09, так и модель второго порядка (3) с коэффициентом детерминации 0,779 и адекватностью с уровнем значимости 0,05.
Для прогнозирования массы ОЭТК с использованием регрессионной модели необходимо предварительно определить, какую из полученных моделей следует использовать. Это может быть сделано с помощью метода дискрими-нантного анализа [4].
Рассмотренная методика может использоваться для оценки масс различных бортовых систем космических аппаратов на ранних стадиях их создания, а также в общем для регрессионного анализа разнородных статистических данных.
ЗАКЛЮЧЕНИЕ
1. Предложена методика построения регрессионных моделей на основе многомерных статистических данных. Показана возможность получения адекватных моделей в результате предварительного разделения разнородных данных на устойчивые группы методом кластерного анализа с последующим построением регрессионных моделей для каждой отдельной группы. Выполнено сравнение качества моделей различного порядка применительно к опти-ко-электронным телескопическим комплексам КАДЗЗ.
2. Регрессионные модели, получаемые с использованием предложенной методики, могут применяться на начальных этапах проектирования для прогнозирования массы бортовой аппаратуры космических аппаратов дистанционного зондирования Земли с заданными целевыми параметрами.
СПИСОК ЛИТЕРАТУРЫ
1. Куренков В.И., Салмин В.В., Прохоров А.Г. Методика выбора основных проектных характеристик и конструктивного облика космических аппаратов наблюдения: Учеб. пособие. Самара: Изд во Са-мар. гос. аэрокосм, ун-та, 2007. 296 с.
2. Sharing Earth Observation Resources [Электронный ресурс]. URL: https://directory.eoportal.org/web/ eoportal/satenite-missions,/k/kompsat-3 (дата обращения 15.01.2018).
3. Буреева H.H. Многомерный статистический анализ с использованием ППП "STATISTICA" [Электронный ресурс]. URL: http://www.unn.ru/ pages/issues/aids/2007/57.pdf (дата обращения 15.01.2018).
4. Кулаичев А.П. Методы и средства анализа данных в среде Windows. STADIA. 4-е изд. М.: Информатика и компьютеры, 2002. 341 с.
DEVELOPING STATISTICAL MODELS OF SATELLITES ONBOARD SYSTEMS MASSES BASED ON CLUSTER ANALYSIS
© 2018 V.I. Kurenkov, A.S. Kucherov, A.A. Yakischik
Samara National Research University named after Academician S.P. Korolyov
The article deals with the problem of satellites onboard systems modeling with the aim of forecasting their masses dependent upon the main target parameters on the early stages of satellites development. The models are developed with the use of cluster and regression analyses of statistical data on typical land- remote sensing satellites.
Keywords: land-remote sensing satellite, optoelectronic system, target parameters, cluster analysis, regression model.
Vladimir Kurenkov, Doctor of Technical Science, Professor, Professor at the Space Engineering Department. E-mail: [email protected]
Alexander Kucherov, Candidate of Technical Science, Associate Professor, Associate Professor at the Space Engineering Department. E-mail: [email protected] Aityom Yakischik, Junior Research Fellow at the Space Engineering Department. E-mail: yakischik@mail. m