Научная статья на тему 'Методика построения регрессионных моделей для оценки масс элементов космических аппаратов с использованием кластерного анализа'

Методика построения регрессионных моделей для оценки масс элементов космических аппаратов с использованием кластерного анализа Текст научной статьи по специальности «Математика»

CC BY
308
50
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОСМИЧЕСКИЙ АППАРАТ / ОПТИКО-ЭЛЕКТРОННЫЙ ТЕЛЕСКОПИЧЕСКИЙ КОМПЛЕКС / ЦЕЛЕВЫЕ ПАРАМЕТРЫ / КЛАСТЕРНЫЙ АНАЛИЗ / РЕГРЕССИОННАЯ МОДЕЛЬ / LAND-REMOTE SENSING SATELLITE / OPTOELECTRONIC SYSTEM / TARGET PARAMETERS / CLUSTER ANALYSIS / REGRESSION MODEL

Аннотация научной статьи по математике, автор научной работы — Куренков Владимир Иванович, Кучеров Александр Степанович, Якищик Артём Андреевич

Рассматривается задача построения статистических моделей, описывающих зависимость масс бортовых систем космических аппаратов от их целевых параметров Такие модели целесообразно использовать на ранних этапах разработки космических аппаратов. Для построения моделей используются статистические данные по типовым образцам бортовых систем. Поскольку неоднородность имеющихся статистических данных может привести к низкому качеству моделей, предлагается, в целях получения более достоверных моделей, разбивать имеющиеся данные на относительно однородные группы (кластеры) с последующим построением регрессионных моделей для каждой группы по отдельности. Сущность методики рассмотрена на примере построения регрессионных моделей для оценки массы оптико-электронных телескопических комплексов космических аппаратов дистанционного зондирования Земли. Кластерный анализ был выполнен с использованием статистического пакета STADIA отечественной разработки. Показано, что увеличение числа задаваемых кластеров приводит к получению более однородных групп исходных данных и, как следствие, получению регрессионных моделей более высокого качества. С другой стороны, увеличение числа кластеров сопровождается уменьшением числа содержащихся в них данных, которое может оказаться недостаточным для построения адекватных регрессионных моделей. В рассмотренном примере путём варьирования задаваемого числа кластеров было получено устойчивое разделение статистических данных на три кластера. Два из них содержали достаточно большое число данных для построения на их основе регрессионных моделей, которое осуществлялось с помощью математического пакета Mathcad. Было выполнено построение моделей первого и второго порядка, произведена проверка их адекватности и сравнение качества по значению коэффициента детерминации. Полученные регрессионные модели могут быть рекомендованы для прогнозирования массы целевой аппаратуры разрабатываемых космических аппаратов дистанционного зондирования Земли с заданными целевыми параметрами.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Куренков Владимир Иванович, Кучеров Александр Степанович, Якищик Артём Андреевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPING STATISTICAL MODELS OF SATELLITES ONBOARD SYSTEMS MASSES BASED ON CLUSTER ANALYSIS

The article deals with the problem of satellites onboard systems modeling with the aim of forecasting their masses dependent upon the main target parameters on the early stages of satellites development. The models are developed with the use of cluster and regression analyses of statistical data on typical land-remote sensing satellites.

Текст научной работы на тему «Методика построения регрессионных моделей для оценки масс элементов космических аппаратов с использованием кластерного анализа»

УДК528.837: 629.78 : 621.003

МЕТОДИКА ПОСТРОЕНИЯ РЕГРЕССИОННЫХ МОДЕЛЕЙ ДЛЯ ОЦЕНКИ МАСС ЭЛЕМЕНТОВ КОСМИЧЕСКИХ АППАРАТОВ С ИСПОЛЬЗОВАНИЕМ КЛАСТЕРНОГО АНАЛИЗА

© 2018 В. И. Куренков, А. С. Кучеров, А. А. Якищик

Самарский национальный исследовательский университет имени академика С.П. Королёва

Статья поступила в редакцию 17.01.2018

Рассматривается задача построения статистических моделей, описывающих зависимость масс бортовых систем космических аппаратов от их целевых параметров Такие модели целесообразно использовать на ранних этапах разработки космических аппаратов. Для построения моделей используются статистические данные по типовым образцам бортовых систем. Поскольку не однородность имеющихся статистических данных может привести к низкому качеству моделей, предлагается, в целях получения более достоверных моделей, разбивать имеющиеся данные на относительно однородные группы (кластеры) с последующим построением регрессионных моделей для каждой группы по отдельности. Сущность методики рассмотрена на примере построения регрессионных моделей для оценки массы оптико-электронных телескопических комплексов космических аппаратов дистанционного зондирования Земли. Кластерный анализ был выполнен с использованием статистического пакета STADIA отечественной разработки. Показано, что увеличение числа задаваемых кластеров приводит к получению более однородных групп исход ных данных и, как следствие, получению регрессионных моделей более высокого качества. С другой стороны, увеличение числа кластеров сопровождается уменьшением числа содержащихся в них данных, которое может оказаться недостаточным для построения адекватных регрессионных моделей. В рассмотренном примере путём варьирования задаваемого числа кластеров было получено устойчивое разделение статистических данных на три кластера. Два из них содержали достаточно большое число данных для построения на их основе регрессионных моделей, которое осуществлялось с помощью математического пакета Mathcad. Было выполнено построение моделей первого и второго порядка, произведена проверка их адекватности и сравнение качества по значению коэффициента детерминации. Полученные регрессионные модели могут быть рекомендованы для прогнозирования массы целевой аппаратуры разрабатываемых космических аппаратов дистанционного зондирования Земли с заданными целевыми параметрами. Ключевые слова: космический аппарат, оптико-электронный телескопический комплекс, целевые параметры, кластерный анализ, регрессионная модель.

ВВЕДЕНИЕ

Существует несколько подходов к выбору основных проектных характеристик и формированию проектного облика космических аппаратов (КА) дистанционного зондирования Земли (ДЗЗ) - на основе: эвристического подхода; установки целевой аппаратуры и элементов обеспечивающих бортовых систем в корпусе заданных габаритов; совершенствования прототипов; совершенствования состава целевой аппаратуры в отсеке полезной нагрузки при неизменных характеристиках отсека служебных систем; компоновки КА «вокруг» оптико-элек-

Куренков Владимир Иванович, доктор технических наук, профессор, профессор кафедры космического машиностроения. E-mail: [email protected]

Кучеров Александр Степанович, кандидат технических наук, доцент, доцент кафедры космического машиностроения. E-mail: [email protected]

Якищик Артём Андреевич, младший научный сотрудник кафедры космического машиностроения. E-mail: yakischik@mail.Ш

тронного телескопического комплекса (ОЭТК); установки ОЭТК, высокоточных оптических приборов и чувствительных датчиков на термо-стабилизированной платформе; установки в состав КА нескольких типов целевой аппаратуры (ЦА) с ограничением общей массы и комплек-сированием работы этой аппаратуры; выбора основных проектных характеристик и начального облика по заданным целевым показателям эффективности.

При реализации упомянутых подходов к проектированию КА ДЗЗ необходимо безусловно выполнить целевые показатели, основными из которых являются периодичность наблюдения, линейное разрешение на местности (детальность), ширина полосы обзора, ширина полосы захвата, производительность съёмки, оперативность доставки видеоинформации на землю, срок активного существования.

Особого обсуждения заслуживает методический подход к проектированию КА ДЗЗ по заданным целевым показателям космической системы наблюдения. Ключом к реализации

данного подхода является разработка математических моделей, связывающих целевые и проектные параметры КА, в частности, моделей для оценки массогабаритных, энергетических характеристик массозатратных элементов целевой аппаратуры и бортовых обеспечивающих систем (БС) КА ДЗЗ. Такие модели строятся на основе физических принципов работы тех или иных устройств, протекающих процессов или на основе обработки статистических данных по изделиям-аналогам с учётом передовых технологий или новых разработок.

Полученные значения массогабаритных, инерционных, энергетических и других проектных параметров КА обеспечивают реализацию устройств, с помощью которых осуществляется получение заданных целевых характеристик (без избытка или недостатка). Практически это означает, что осуществляется оптимизация основных проектных характеристик КА в неявной форме. Теоретически это означает, что производится оптимизация проектных характеристик без формализации задач математического программирования.

На ранних стадиях создания космических аппаратов (КА) весьма важна оценка их массо-габаритных характеристик в зависимости от характеристик эффективности применения по целевому назначению. При этом в первую очередь необходимо построить модели для относительно больших по массе и габаритам систем и элементов КА. Для космических аппаратов высокодетального дистанционного зондирования земли (ДЗЗ) к числу таких систем, прежде всего, относится оптико-электронный телескопический комплекс (ОЭТК), масса которого может превышать 20% от массы КА (КА «Котр5а1>2», «1копо5-2», «КН-11», «СеоЕуе-1 »,<ЮгЬ \Ziew-5 »).

Методика построения регрессионных моделей с использованием кластерного анализа включает следующие этапы:

- сбор и анализ статистических данных по изделиям- аналогам;

- разбиение статистических данных на кластеры (достаточно однородные группы);

- построение регрессионных моделей (различного порядка для каждого кластера данных);

- анализ полученных результатов.

Рассмотрим эти этапы подробнее на примере построения регрессионной модели для оценки массы аппаратуры оптического наблюдения космических аппаратов дистанционного зондирования Земли.

СБОР И АНАЛИЗ СТАТИСТИЧЕСКИХ ДАННЫХ ПО ИЗДЕЛИЯМ-АНАЛОГАМ

Анализ характеристик ОЭТК показывает [1], что его длина в первом приближении пропор-

циональна отношению Н/ , а диаметр - от-

И / /АЛ

ношению удд , где, Н - высота орбиты, Аь

- линейное разрешение на местности, В - ширина полосы захвата.

Поэтому масса ОЭТК шдажявляется функцией

указанных отношений: тОЭТК = /(^дд'^дд) >

где / (•) - неизвестна функция, подлежащая определению.

Статистические данные по КА ДЗЗ высокого и сверхвысокого разрешения и их оптико-элек-тронной аппаратуре [2] приведены в табл. 1.

Анализ приведённых статистические данных показывает, что они являются весьма разнородными. Это объясняется тем, что в различной аппаратуре наблюдения могут использоваться разные целевые и конструкционные характеристики: диаметр апертуры, угловое разрешение, количество спектров наблюдения, высота полёта КА, оптические схемы, количество используемых зеркал, силовые схемы аппаратуры, конструкционные материалы и др. Существенное влияние на массогабаритные характеристики аппаратуры наблюдения оказывают такие факторы, как различные производители (технологическая культура производства), а также год выпуска аппаратуры.

Попытка построить регрессионную модель по всей их совокупности приведёт, очевидно, к низкому качеству такой модели. Поэтому необходимо предварительно разбить данные на более или менее однородные группы. Эта задача может быть решена с помощью метода кластерного анализа [3].

РАЗБИЕНИЕ СТАТИСТИЧЕСКИХ ДАННЫХ НА КЛАСТЕРЫ

С помощью метода кластерного анализа можно произвести классификацию объектов, на которые влияет множество факторов, разбив эти объекты на заданное число компактных групп (кластеров). Мерой качества полученного разбиения является так называемое среднее внутрикластерное расстояние, которое показывает степень близости характеристик в рассматриваемой группе. Чем ближе рассматриваемые характеристики в группе (чем компактнее полученные кластеры), тем среднее внутрикластерное расстояние меньше,

Для каждого кластера определяется его центр - тот из объектов, сумма расстояний до которого от всех прочих объектов (внутрикластерное расстояние) является наименьшей.

Для получения адекватных результатов кластерного анализа исходные данные должны быть нормированы (например, относительно максимального или среднего значения). В противном случае параметры, значения которых

Таблица 1. Статистические данные по ОЭТК КА ДЗЗ

№ п/п. КА ОЭТК H, KM AL, M в, KM Щэтк ,кг

1 GeoEye-1 GIS 770 0,460 16,4 452,0

2 КА-П Лаз^фит 730 0,300 17,1 1541

3 WorldView-1 WV-6G 496 0,460 17,6 380,0

4 Pleiades-1A HiRI 705 0,700 20,0 195,0

5 Pleiades-1B HiRI 694 0,700 20,0 195,0

6 Ikonos OSA 686 0,820 11,3 171,0

7 CartoSat-2A PAN 635 0,800 9,60 120.0

8 CartoSat-3 PAN (CartoSat-3) 630 0,300 6,00 120,0

9 Kompsat-1 EOS 685 6,60 17,0 35,00

10 Kompsat-2 MSC 685 1,00 15,0 150,0

11 Kompsat-3 AEISS 675 0,700 15,0 80,00

12 Kompsat-ЗА AEISS-A 528 0,550 12,0 80,00

13 ASNARO OPS 504 0,500 10,0 97,00

14 ALOS AVNIR-2 692 10,0 70,0 198,0

15 ALOS PRISM 692 2,50 70,0 528,0

16 FORMOSAT-2 RSI 891 2,00 24,0 114,0

17 Spot-5 HRG 832 2,50 60,0 356,0

18 GökTürk-2 EOS-C 684 2,50 20,0 41,00

19 CBERS-4 PANMUX 778 5,00 60,0 263,0

20 NigeriaSat-2 VHRI 718 2,50 20,0 41,00

21 VENLIS VSSC 720 5,30 28,0 43,50

22 IRS-1C PAN (IRS) 817 5,80 70,0 120,0

23 Аврора Аврора 510 1,54 41,3 53,00

24 OuickBird BGIS-2000 450 0,65 16,8 380,0

25 Deimos-2 HIRAIS 720 1,00 12,0 50,00

26 Ресурс-ДК GEOTON-1 570 1,00 28,3 310,0

существенно различаются, могут внести различный вклад в анализируемые данные и существенно повлиять на результаты анализа.

Измерение расстояний с/ между /и-мерны-

ми объектами X, X, предполагает введение метрики, т.е. способа измерения этого расстояния.

К числу наиболее часто используемых метрик относятся следующие: - Евклидова:

-Манхеттеновская:

т

d, -IN - 4

1=1

-Брея-Картиса:

II

/=i

х.

Канберра:

¡ i i \х -X,

ä.-Ъ

1= 1

X'+X'j

Для получения более достоверных результатов анализа целесообразно использовать разные метрики и сравнить получаемые результаты.

В настоящем исследовании будем считать, что функция отклика (масса ОТК) тоэш в наибольшей степени зависит от двух переменных

(факторов) х = "/у и у у =■ ; у .

Нормирование переменных, включаемых в регрессионную модель ОЭТК, можно выполнить с помощью следующих выражений: — х — у — тг

х =

}' = ■

т =

'ОЭТК

Уп

т

тах ' '»О П К .

ОЭТК„

- соответственно мак-

i=i

ГДе Хтах> У,

симальные по рассматриваемой совокупности данных значения факторов х, у и массы ОЭТК.

Нормированные значения переменных приведены в последних трёх столбцах табл. 2.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таблица 2. Нормализованные статистические данные по ОЭТК КА ДЗЗ

№ п/п КА II \t II m03TK > КГ X У m

1 GeoEye-1 35,65 1674 452,0 0,625 0,688 0,293

2 Лазурит 57,00 2433 1541 1,000 1,000 1,000

3 WorldView-1 38,26 1078 380,0 0,671 0,443 0,247

4 Pleiades-1А 28,57 1007 195,0 0,501 0,414 0,127

5 Pleiades-IB 28,57 991,4 195,0 0,501 0,407 0,127

6 Ikonos 13,78 836,6 171,0 0,242 0,344 0,111

7 CartoSat-2A 12,00 793,8 120,0 0,211 0,326 0,078

8 CartoSat-3 20,00 2100 120,0 0,351 0,863 0,078

9 Kompsat-1 2,576 103,8 35,00 0,045 0,043 0,023

10 Kompsat-2 15,00 685,0 150,0 0,263 0,282 0,097

11 Kompsat-3 21,43 964,2 80.00 0,376 0,396 0,052

12 Kompsat-ЗА 21,82 960,0 80,00 0,383 0,395 0,052

13 ASNARO 20,00 1008 97,00 0,351 0,414 0,063

14 ALOS 7,000 69,20 198,0 0,123 0,028 0,128

15 ALOS 28,00 276,8 528,0 0,491 0,114 0,343

16 FORMOSAT-2 12,00 445,5 114,0 0,211 0,183 0,074

17 Spot-5 24,00 332,8 356,0 0,421 0,137 0,231

18 GokTurk-2 8,000 273,6 41,00 0,140 0,112 0,027

19 CBERS-4 12,00 155,6 263,0 0,211 0,064 0,171

20 NigeriaSat-2 8,00 287,2 41,00 0,140 0,118 0,027

21 VENjiS 5,283 135,8 43,50 0,093 0,056 0,028

22 IRS-1С 12,07 140,9 120,0 0,212 0,058 0,078

23 Аврора 26,82 331,2 52,64 0,470 0,136 0,034

24 OuickBird 25,85 692,3 380,0 0,453 0,285 0,247

25 Deimos-2 12,00 720 50,00 0,211 0,296 0,032

26 Ресурс-ДК 28,30 570 310,0 0,496 0,234 0,201

Для выполнения кластерного анализа данных был использован статистический пакет STADIA отечественной разработки [4].

Измерение расстояний между объектами выполнялось с использованием 4 различных метрик: Эвклида, Манхеттеновской, Брея-Кар-тиса и Канберра [4]. Чишо кластеров варьировалось в пределах от 2 до 6. Зависимость среднего внутрикластерного расстояния, рассчитанного в статистическом пакете STADIA, от фактического числа кластеров для различных использованных метрик показана на рис. 1.

Анализируя данные этого рисунка, можно видеть, что значение среднего внутрикластерного расстояния для трёх из четырёх использованных метрик практически перестает изменяться при достижении числом кластеров значения 5. Дальнейшее увеличение числа кластеров нецелесообразно, так как, с одной стороны, это практически не влияет на точность разбиения статистических данных, с другой стороны, увеличение числа кластеров сопровождается уменьшением числа содержащихся в них объектов, которое может оказаться недо-

статочным для построения соответствующих регрессионных моделей. Так, например, двух-факторная модель второго порядка требует для своего построения не менее 6 наборов данных (значений факторов и отклика).

В целом, кластерный анализ позволяет лишь подготовить предварительные данные, а окончательное решение о разбиении статистических данных на кластеры принимает пользователь исходя из содержательных представлений о целях исследования.

В данной работе, исходя из полученных результатов, было принято решение о разбиении статистических данных на 5 кластеров. Однако фактическое число полученных кластеров при использовании метрики Эвклида ограничилось значением 3, а при использовании метрик ма-хеттеновской и Брея-Картиса - значением 4. Это объясняется тем, что при попытке дальнейшего увеличения числа кластеров изменение внутрикластерного расстояния оказывалось меньше погрешности расчета, установленной в пакете STADIA.

Ниже приведены соответствующие про-

2 В 3

а о ез

D О В

Г\

К

О ?3

г

8

ва

<и 1> В ft V

0.8

0.6

0.4

0.2

0

2 3 4 5 6

^ Число кластеров

-Эвклид — • -Манхеттен

---Брей-Картис--Канберра

Рис. 1. Зависимость среднего внутрикластерного расстояния от числа кластеров

токолы расчёта в программе STADIA . Номера кластеров представлены в строках и обозначены цифрами 1, 2, 3 и т.д. После номера кластера в скобках представлены номера входящих в него объектов в соответствии с табл. 2, звёздочками помечены объекты, являющиеся центрами кластеров.

Метрика «Эвклид» Кластеры: Среднее внутрикластерное расстояние =0.1869

1= (1*,2,3,8)

2= (4,5,11,12,13,15,17,23,24,26*) 3= (6,7,9,10,14,16,18,19,20*,21,22,25)

Метрика «Манхеттен» Кластеры: Среднее внутрикластерное расстояние =0.07294 1= (1*,2,3)

2= (4,5,6,7,8,10,11,12,13*)

3= (15,17*23,24,26)

4= (9,14,16,18*, 19,20,21,22,25)

Метрика «Брей-Картис» Кластеры: Среднее внутрикластерное расстояние =0.1691

1= (1*,2,3,8)

2= (4,5,6,11*, 12,13)

3= (15,17,23,24,26*)

4= (7,9,10,14,16*,18,19,20,21,22,25)

Метрика «Канберра» Кластеры:

Среднее внутрикластерное расстояние =0.7459

1=(1,2*,8)

2= (3,6,7,10,15,17,23,24*,25,26)

3=(4*,5)

4= (11*, 12,13)

5= (9,14,16,18,19*20,21,22)

Можно видеть, что большинство используемых метрик позволяет выделить два устойчивых кластера: кластер, объединяющий объекты из табл. 2 с номерами 4, 5, 6, 11, 12, 13 (ОЭТК сверхвысокого разрешения) и кластер 2, объединяющий объекты с номерами 9, 14, 16, 18, 19, 20, 21, 22 (ОЭТК высокого разрешения с широкой полосой захвата). Эти кластеры включают число объектов, достаточное для последующего регрессионного анализа.

ПОСТРОЕНИЕ РЕГРЕССИОННЫХ МОДЕЛЕЙ

Построение регрессионных моделей, связывающих массу ОЭТК с целевыми характеристиками, было выполнено с помощью математического пакета Ма11иас1.

Ниже приводятся протоколы расчётов с соответствующими пояснениями.

Исходные данные для анализа представлены в табл. 3.

Таблица 3. Исходные данные для регрессионного анализа

Номер Номер Космический В H тоэтк '

кластера объекта аппарат AL У ~ Л Т AL кг

4 Pleiades-1А 28,57 1007 195,0

5 Pleiades- 1В 28,57 991,4 195,0

1 6 Ikonos 13,78 836,6 171,0

11 Kompsat-3 21,42 964,3 80,0

12 Kompsat-3A 21,81 960.0 80.0

13 ASNARO 20,00 1008 97,0

9 Kompsat-1 2,57 103,8 35,0

14 ALOS 7,00 69,20 198,0

16 FORMOSAT-2 12,00 445,5 114,0

2 18 GökTiirk-2 8,00 273,6 41,0

19 CBERS-4 12,00 155.6 263.0

20 NigeriaSat-2 8,00 287,2 41,0

21 VEN,uS 5,28 135,9 43,5

22 1RS-1С 12,06 140,9 120,0

Кластер данных для ОЭТК сверхвысокого разрешения

Задаётся, для удобства последующих вычислений, нумерация элементов матриц, начиная с единицы, для чего стандартной функции ORIGIN присваивается значение 1. Компонентам матрицы Мх присваиваются значения факторов X, у, компонентам вектора vy -значения отклика т0ЭА :

ORIGIN := 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

28.57 1007.14^ ( 195 ^

28.57 991.43 195

21.43 964.29 80

vy:=

21.82 960 80

20 1008 97

13.78 836.59 J ,171,

Мх:=

Задаётся порядок регрессии П : вначале принимается П = 1 (линейная регрессия), коэффициенты регрессии вычисляются с использованием стандартной функции regress и записываются в вектор z:

n := 1 z := regress(Mx, vy,n) .

Рассчитанные с помощью полученной модели значения отклика присваиваются компонентам вектора tvy:

fit(x) := interp(z,Mx,vy,x);

i := 1.. length(vy)

tvy. := fit

Wfl.

kd := corr(vy,tvy)~ kd = 0.576 .

Как известно, регрессионная модель тем лучше соответствует статистическим данным, чем значение коэффициента детерминации ближе к единице; можно видеть, что качество данной регрессии невысоко. Действительно, сравнение фактических и предсказанных значений массы аппаратуры показывает их заметное различие, в особенности в области небольших масс:

vy =

'195^ 195 80 80 97 171

tvy =

f 170.087^ 184.849 121.931 130.792 63.15 147Л9

V

Для проверки адекватности полученной регрессионной модели вычисляется статистика Фишера Fis, как отношение дисперсии, обусловленной регрессией MSSR, к остаточной дисперсии MSSE ; для вычисления последних вначале рассчитываются соответствующие суммы квадратов разностей SSR и SSE и используются степени свободы dfi" и dfe :

residual := vy - tvy SSE := у residual"

SSR := Yctvy - mean(vy))*

SSR = 9.205 X 10

SSE = 6.775 X 10"" dfi* := 2 dfe := length(vy) - 1 - dir dfe = 3

Для оценки качества полученной регрессии вычисляется коэффициент детерминации Ы -квадрат коэффициента корреляции между фактическими и вычисленными (предсказанными) значениями отклика:

MS SE :=

SSE

Fis :=

dfe MSSR MSSE

SSR

MSSR :=-

dfr

Fis = 2.038

С помощью стандартной функции <// (•) вычисляется критическое значение статистики /с для уровня значимости р=0,05и соответствующих значений степеней свободы dfr и dfe:

р := 0.05 fc := qF( 1 - р,dfr,dfe) fc = 9.552.

То обстоятельство, что рассчитанное значение статистики Фишера меньше её критического значения (Fis < fc), заставляет признать построенную модель неадекватной имеющимся статистическим данным. Заметим, что модель регрессии может быть признанной адекватной лишь на уровне значимости 0,28, при котором соответствующее критическое значение статистики Фишера (2,005) становится меньше рассчитанного.

Для улучшения качества регрессионной модели повысим её порядок: п := 2 z := regress(Mx,vy,n) fit(x) := interp(z,Mx,vy,x) i := 1.. length(vy)

\t T^l tvy. := fit) ÍMx j

kd := corr(vy,tvy)"

kd = 1

г 195 ^ '195"1

195 195

80 80

tvy =

80 80

97 97

,171, ,171,

-

3 3 2 -0.042 1.868 x 10

-3

Таким образом, получена следующая регрессионная зависимость массы ОЭТК от целевых параметров:

m,

1,196х2 +1,868-10"3 / -0,042xv

ОЭТК

-53,009х - 2,537 V +1782.

(1)

Коэффициент детерминации возрос до максимально возможного значения - единицы. Действительно, сравнение фактических и предсказанных значений массы аппаратуры показывает их полное совпадение:

vy =

Значения коэффициентов регрессии содержатся в векторе

-2.537 1.782 x 10 -53.009 2.196/

Первые две компоненты этого вектора представляют собой значения служебных переменных пакета МаЙжш!, третья - порядок регрессии, остальные - это коэффициенты при слагаемых в уравнении регрессии, соответствие с которыми указано в табл. 4.

Проверка модели по критерию Фишера, ввиду полного совпадения фактических и предсказанных значений массы аппаратуры, не требуется.

Кластер данных для ОЭТК высокого разрешения

Построим вначале линейную модель:

ORIGIN := 1

Мх :=

12 445.5 Л Г 114 ^

2.58 103.79 35

7 69.2 198

8 273.6 41

vy :=

12 155.6 263

8 287.2 41

5.28 135.85 43.5

12.07 140.86 у ,120,

n := 1 z := regress(Mx,vy,n) fit(x) := inteip(z,Mx,vy,x)

i := 1.. length(vy)

2

kd := corr(vy,tvy) residual := vy — tvy

tvy. := fit J\ 1

M

<i>-

kd = 0.625

SSE := ^ residual"

dfr := 2 dfe := length(vy) - 1 - dfr dfe = 5

MS SE :=

S SE

Fis :=

dfe

MS SR. MS SE

SSR

MSSR := -

dfr

Fis = 4.165

Модель адекватна на уровне значимости 0,09 (ему соответствует критическое значение статистики Фишера fc, меньшее рассчитанного для полученной регрессии значения Fis):

р := 0.09 fc := qF( 1 - р, dfr,dfe) fc = 4.05

Таблица 4. Значения коэффициентов регрессии

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Компонента вектора z -4 Z5 -6 Z1

Значение - 0,042 1,868 10 3 - 2,537 1,782 10s - 53,01 2,196

Член регрессии ху у2 У свободный член X х2

После извлечения коэффициентов регрессии из вектора 2 уравнение модели можно записать в следующем виде:

m

WW

= 20,673х-0,423>< +19,095. (2)

Полученная модель может быть использована для практических расчётов; однако можно попытаться получить более точную модель, повысив её порядок:

о := 2 г := ге^езз(Мх,\'у,п)

Ш(х) := ш1егр(г,Мх,уу,х)

i := Í.. length(vy)

2

kd :- corr(vy,tvy)~ residual := vy - tvy

tvy. ;= fit[(MxT)(l>]

kd = 0.779

SSE := residual"

dfr := 2 dfe := length(vy) - 1 - dfr dfe = 5

SSE SSR MSSE :=- MS SR :=

dfe

dfr

MSSR

Fis := - Fis = 8.795

MSSE

p := 0.05 fc := qF( 1 - p, dfe, dfr) fc = 19.296

Поскольку выполняется соотношение Fis>fc, полученная модель адекватна на уровне значимости 0,05.

Извлекая из вектора

2Т = (з 3 2 0.469 -6.032 X Ю-3

-2.292 137.275 35.491 -5.09)

коэффициенты уравнения регрессии, можно записать его в следующем виде:

Щ®т■ = "5>09x2 - 6,032 ■ 10"3 V2 + 0,469XV +35,491.Y - 2,292у + 137,275.

(3)

АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ

Кластерный анализ статистических данных позволил выделить два устойчивых кластера, достаточно обширных для построения на их основе регрессионных моделей.

В первый из них вошли шесть КА с аппаратурой сверхвысокого разрешения. Поскольку построенная для данного кластера регрессионная модель первого порядка показала низкое качество (коэффициент детерминации 0,576 и адекватность с уровнем значимости 0,29), было выполнено построение модели второго порядка (1), для которой коэффициент детерминации составил 1.

Для второго кластера, включающего восемь КА высокого разрешения с широкой полосой захвата, приемлемым качеством обладают как модель первого порядка (2) с коэффициентом

детерминации 0,625 и адекватностью с уровнем значимости 0,09, так и модель второго порядка (3) с коэффициентом детерминации 0,779 и адекватностью с уровнем значимости 0,05.

Для прогнозирования массы ОЭТК с использованием регрессионной модели необходимо предварительно определить, какую из полученных моделей следует использовать. Это может быть сделано с помощью метода дискрими-нантного анализа [4].

Рассмотренная методика может использоваться для оценки масс различных бортовых систем космических аппаратов на ранних стадиях их создания, а также в общем для регрессионного анализа разнородных статистических данных.

ЗАКЛЮЧЕНИЕ

1. Предложена методика построения регрессионных моделей на основе многомерных статистических данных. Показана возможность получения адекватных моделей в результате предварительного разделения разнородных данных на устойчивые группы методом кластерного анализа с последующим построением регрессионных моделей для каждой отдельной группы. Выполнено сравнение качества моделей различного порядка применительно к опти-ко-электронным телескопическим комплексам КАДЗЗ.

2. Регрессионные модели, получаемые с использованием предложенной методики, могут применяться на начальных этапах проектирования для прогнозирования массы бортовой аппаратуры космических аппаратов дистанционного зондирования Земли с заданными целевыми параметрами.

СПИСОК ЛИТЕРАТУРЫ

1. Куренков В.И., Салмин В.В., Прохоров А.Г. Методика выбора основных проектных характеристик и конструктивного облика космических аппаратов наблюдения: Учеб. пособие. Самара: Изд во Са-мар. гос. аэрокосм, ун-та, 2007. 296 с.

2. Sharing Earth Observation Resources [Электронный ресурс]. URL: https://directory.eoportal.org/web/ eoportal/satenite-missions,/k/kompsat-3 (дата обращения 15.01.2018).

3. Буреева H.H. Многомерный статистический анализ с использованием ППП "STATISTICA" [Электронный ресурс]. URL: http://www.unn.ru/ pages/issues/aids/2007/57.pdf (дата обращения 15.01.2018).

4. Кулаичев А.П. Методы и средства анализа данных в среде Windows. STADIA. 4-е изд. М.: Информатика и компьютеры, 2002. 341 с.

DEVELOPING STATISTICAL MODELS OF SATELLITES ONBOARD SYSTEMS MASSES BASED ON CLUSTER ANALYSIS

© 2018 V.I. Kurenkov, A.S. Kucherov, A.A. Yakischik

Samara National Research University named after Academician S.P. Korolyov

The article deals with the problem of satellites onboard systems modeling with the aim of forecasting their masses dependent upon the main target parameters on the early stages of satellites development. The models are developed with the use of cluster and regression analyses of statistical data on typical land- remote sensing satellites.

Keywords: land-remote sensing satellite, optoelectronic system, target parameters, cluster analysis, regression model.

Vladimir Kurenkov, Doctor of Technical Science, Professor, Professor at the Space Engineering Department. E-mail: [email protected]

Alexander Kucherov, Candidate of Technical Science, Associate Professor, Associate Professor at the Space Engineering Department. E-mail: [email protected] Aityom Yakischik, Junior Research Fellow at the Space Engineering Department. E-mail: yakischik@mail. m

i Надоели баннеры? Вы всегда можете отключить рекламу.