МЕДИЦИНСКАЯ ФИЗИКА
Вестник Омского университета, 2005. № 3. С. 21-23. © В.В. Гольтяпин, 2005
СПЕЦИФИЧЕСКАЯ ФАКТОРНАЯ МОДЕЛЬ СОСТОЯНИЯ «ФИЗИОЛОГИЧЕСКАЯ НОРМА»
В.В. Гольтяпин
Омский государственный университет им. Ф.М. Достоевского, кафедра микроэлектроники и медицинской физики 644077, Омск, пр. Мира, 55а
Получена 8 апреля 2005 г.
The factorial model of a functional state of «physiological norm» has been constructed on the basis of the centroid method. The structure of the factorial diagram in this model is defined by genotype and phenotype variability.
Факторный анализ в последние годы успешно применяется в кардиологии при разработке информационно-вычислительных экспертных систем для многопараметрического мониторинга. На начальном этапе анализа путем компьютерного моделирования формируются базисные классы «физиологическая норма» условно здоровых индивидуумов. Эти классы являются далее системой координат для выявления кардиопатоло-гий. В биологическую норму индивидуума включены генотип - видовая характеристика, феноти-пическая изменчивость и возрастные изменения - онтогенез. Такая система понятий позволяет задать пространство изменения признака, границы его нормального варьирования, ввести количественную меру признака и таким образом перевести клинические исследования на язык современных информационных технологий.
В работе по результатам многолетних исследований Института патологии кровообращения СО РАН [1] и кардиодиспансеров г. Омска сформирован базисный класс данных - «физиологическая норма» условно здорового человека. Характерным признаком кардиопатологических состояний является дисбаланс между потребностями миокарда в кислороде и его поступлением в ткань. Поэтому в качестве исходных данных для факторного анализа использованы параметры, описывающие внешнее дыхание, газовый состав гемоглобина крови и кислотно-основное состояние. Сформированы группы условно здоровых индивидуумов: русских, живущих на уровне моря и на высокогорье, киргизов и таджиков. Для количественного анализа и формализации представления обобщенных данных создан пакет программ, реализующий метод центроидов.
Основная задача факторного анализа - фор-
мирование модели, которая позволяет определить минимальное число обобщенных факторов, отражающих наиболее значимые характеристики изучаемого объекта, процесса. В матричной форме факторная модель [2] представляется следующим образом:
2 = АР, (1)
где 2 - матрица стандартизованных исходных данных размерности т х п, т - количество параметров, п - количество индивидуумов, А -матрица факторного отображения размерности т х г, Р - матрица факторных значений индивидуумов размерности г х п, г — количество выделяемых факторов. Элементы матрицы факторного отображения а и являются факторными нагрузками. Каждый фактор характеризуется столбцом, каждая переменная - строкой матрицы А. Корреляционная матрица К размерности т х т рассчитывается по формуле
я=—^—-гг'. (2)
п — 1
Из (1) и (2) получаем формулу:
К = АСА', (3)
где С = £ ^ РР' - матрица корреляции между факторами. Формула (3) является базовой в построении факторных моделей и носит название теоремы Терстоуна [2].
Программное обеспечение сформировано на базе трех программных комплексов. В первом рассчитывается матрица стандартизованных данных 2 и корреляционная матрица К, производится начальная оценка общностей методом коэффициентов множественной корреляции (КМК)
22
В.В. Гольтяпин
Рис. 1. Определение положения первой координатной оси с помощью центроидного метода
[2], вычисляется редуцированная матрица и факторные нагрузки методом центроидов [3] (рис. 1). Строится факторная модель базисного класса «физиологическая норма». Во втором комплексе производится расчет факторных моделей для отдельных индивидуумов в соответствии с соотношением:
р = А~1г.
(4)
Входными данными являются параметры индивидуумов с различным генотипом, либо претерпевшие фенотипическую изменчивость, либо с определенной патологией сердечно-сосудистой системы. Третий программный комплекс служит для получения матрицы корреляции факторов и проверки расчетов. При этом равенство:
Д = АСА'
(5)
должно выполняться для всей процедуры факторного решения. Матрица весовых нагрузок находится согласно теории метода центроидов.
На рис. 1А схематично изображены несколько точек-переменных в двух ортогональных двумерных системах. Кроме того, указана нулевая точка, в которой начинаются все векторы. Это соответствует типичной ситуации перед началом выделения факторов. Переменные представлены то точками в г-мерном пространстве, положение нулевой точки известно. Точки можно изобразить в очень многих ортогональных системах, из которых на рис. 1А представлены две и ¥[¥!}, причем ни одна из них не является решением. На рис. 1 под 5 понимается центр тяжести.
В центроидном методе требуется, чтобы первая факторная ось Е\ проходила через центр тяжести при этом сумма остаточных проекций на ось 1*2 равна нулю. Проекции точек на оси координат на рис. 1Б определяют факторные нагрузки аи , которые рассчитываются по корреляционной матрице. Координаты центра тяжести можно вычислить по координатам отдельных точек.
Если в общем случае рассматривать п-мерную систему координат, то координатами центра тяжести являются выражения:
^ т ^ т ^ т
— У^ац, — У^Яг 2, •••, — V"
то то то
(6)
¿=1
¿=1
¿=1
т. е. средние значения координат отдельных точек дают координаты центра тяжести. На рис. 1А координаты центра тяжести отмечены пунктиром. Если теперь система координат выбрана так, что первая ось проходит через центр тяжести, то сумма проекций точек на все остальные ортогональные к ней оси равны нулю (это следует из определения центра тяжести), и тогда координаты центра тяжести 5 становятся равными:
I т
-$>¿1,0,0, ..., 0, то ^
(7)
1=1
i=l
¿=1
¿=1
Сумма проекций на ось П равна нулю, так как положительные и отрицательные значения проекций взаимно компенсируются. Исходя из равенства = АА' можем написать для каждого элемента к-го столбца матрицы Я соответствующие выражения:
Пк = ацак1 + Г2к = а21ак1 +
Гщк = +
а\гакг а2гакг
0,тг0,к1
(9)
= ак1^2ац + ... + акг^2сцг. (10)
'1=1 ¿=1 г=1
Выражение (10) имеет место для каждого к -го столбца корреляционной матрицы. Если теперь просуммировать все суммы столбцов, т. е. просуммировать обе части равенства (10) по всем к, то получим общую сумму элементов корреляционной матрицы Т:
Т = ^ак1 У^ац + ... + ^акг (11)
к,= 1 г=1
к,= 1 %=\
В связи с тем, что ^ ац = ^ ак\ (перемена ¿=1 к=1 индекса не изменяет смысла суммирования), получаем
/ /II
т= Т>1
V 7 = 1
1 III
\ 7 = 1
(1:
(12)
Специфическая факторная модель состояния «физиологическая норма»
23
получим
Рис. 2. Факторная диаграмма нормы здоровых индивидуумов
Рис. 3. Факторная диаграмма таджиков на фоне нормы
т. е. сумма всех элементов корреляционной матрицы равна сумме квадратов сумм столбцов матрицы факторного отображения. Это равенство имеет место только для ортогонального факторного отображения. Подставив в (12) условия (7), получим:
т= ПГ>1 ] +о + о + ...
или
у/Т =
г = 1
(13)
(14)
С учетом условия (7) равенство (9) примет
вид:
^Пк = ам
(15)
2 = 1
2 = 1
Из (14) и (15), с учетом неотрицательности Т,
2=1
Введя обозначение I = , выразим:
гп
а>к1 = (к = 1,...,га) 2 = 1
или, опять изменив индекс, получим
а>п
= (г = 1,...,ш).
(16)
(17)
(18)
к=1
Оба сомножителя правой стороны этого равенства легко определяются из Я. Таким образом, по (18) вычисляются нагрузки первого цен-троидного фактора. Равенство (16) служит для контроля правильности вычислений. После вычисления нагрузок первого фактора по (18) определяют остаточные корреляции: — аха^ = , где а\ является вектор-столбцом факторных нагрузок. Матрица содержит так называемые воспроизведенные корреляции. дает остаточные корреляции, которые остаются после выделения первого фактора - остаточная матрица).
Если принимают решение выделить второй фактор, то повторяется та же самая вычислительная процедура по матрице остатков и т. д. После получения требуемого количества вектор-столбцов факторных нагрузок получаем новую матрицу А. При получении действительных общностей она является оптимальной. После того, как получена оптимальная матрица А, вычисляется обратная к ней и по формуле (4) расчитываются факторы индивидуумов.
На рис. 2-4 представлены факторные диаграммы здоровых индивидуумов: а) русских, б) таджиков, в) киргизов. Анализ факторных диаграмм показал, что факторные модели класса условно здоровых индивидуумов определяются не только физическим состоянием, но и национальностью, что зависит, по-видимому, от условий проживания, в частности от высоты над уровнем моря.
[1] Власов Ю.А., Окунева Г.И. Кровообращение и газообмен человека. Новосибирск, 1992.
[2] Иберла И. Факторный анализ. М.: Статистика, 1980. С. 399.
[3] Харман Г. Современный факторный анализ. М.: Статистика, 1972. С. 486.
Рис. 4. Факторная диаграмма киргизов на фоне нормы