Научная статья на тему 'Анализ возрастной динамики индекса массы тела у детей с применением квантильно-регрессионных моделей'

Анализ возрастной динамики индекса массы тела у детей с применением квантильно-регрессионных моделей Текст научной статьи по специальности «Медицинские технологии»

CC BY
590
152
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КВАНТИЛЬНО-РЕГРЕССИОННАЯ МОДЕЛЬ / ДИАГРАММЫ ДИАГНОСТИКИ ФИЗИЧЕСКОГО РАЗВИТИЯ / ИНДЕКС МАССЫ ТЕЛА / BODY MASS INDEX / QUANTILE REGRESSION MODEL / REFERENCE GROWTH CHARTS

Аннотация научной статьи по медицинским технологиям, автор научной работы — Львович И. Я., Минакова О. В., Ситникова В. П.

В статье представлено исследование зависимости индекса массы тела от возраста и пола детей Воронежского региона. По результатам анализа эмпирических распределений индекса массы тела у детей выбран и обоснован метод построения квантильно-регрессионных моделей. Представлены разработанные справочные процентильные диаграммы индекса массы тела для детей различного возраста и пола

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по медицинским технологиям , автор научной работы — Львович И. Я., Минакова О. В., Ситникова В. П.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Using quntile regression MOdels FOR reference growth CHARTS OF BODY MASS INDEX of Children

The article presents the method for estimating conditional quantile function for screening children's physical development. It gives the algorithm of calculation the model of body mass index for boys and girls at every age. It's shown that attaining models allows to construct diagnostic screening and research physical development of children of different age and sex

Текст научной работы на тему «Анализ возрастной динамики индекса массы тела у детей с применением квантильно-регрессионных моделей»

УДК 616-053+616-053)-007

АНАЛИЗ ВОЗРАСТНОЙ ДИНАМИКИ ИНДЕКСА МАССЫ ТЕЛА У ДЕТЕЙ С ПРИМЕНЕНИЕМ КВАНТИЛЬНО-РЕГРЕССИОННЫХ МОДЕЛЕЙ

И. Я. Львович, О. В. Минакова, В. П. Ситникова

В статье представлено исследование зависимости индекса массы тела от возраста и пола детей Воронежского региона. По результатам анализа эмпирических распределений индекса массы тела у детей выбран и обоснован метод построения квантильно-регрессионных моделей. Представлены разработанные справочные процентильные диаграммы индекса массы тела для детей различного возраста и пола.

Ключевые слова: квантильно-регрессионная модель, диаграммы диагностики физического развития, индекс массы тела.

В настоящее время индекс массы тела (ИМТ) является ведущим комплексным показателем, отражающим два взаимосвязанных показателя - длину и массу тела. ИМТ, известный еще как индекс Кетле: TJ1 масса кг

ИМ! =-----------2 = —т , был впервые предложен

(длина) м

Adolphе Quetelet в 19 веке, как индекс веса отнесенного к росту. Ancel Keys (1950) впервые подробно исследовал этот показатель и назвал его индексом массы тела (body mass index). Основной особенностью этого индекса по сравнению с другими соотношениями - отсутствие корреляционной связи с массой тела. Поэтому с 1985 года значения ИМТ использовались в качестве критериев для оценки степени ожирения у взрослых [1].

У детей в связи с наличием возрастной корреляцией ИМТ использовался редко. Cole (1979) показал, что ИМТ у детей указывает вес для данного роста и возраста, поэтому может использоваться вместо весо-ростовых таблиц, устанавливающих вес для данного роста. С 1997 года ВОЗ рекомендовало использование ИМТ во всех возрастных группах. Несмотря на это, возрастные особенности ИМТ у детей до сих пор мало изучены, а ввиду отсутствия разработанных стандартов редко используются на практике. Существующая на сегодняшний день тенденция к возрастанию ожирения у детей и связанное с этим прогрессирование различных патологий требуют диагностики ИМТ [2].

Оценка физического развития основывается на сравнении с так называемыми эталонными (справочными) показателями ребенка того же возраста и пола. Для построения справочных диаграмм и таблиц наиболее эффективно использование квантиль-но-регрессионных моделей, представляющих семейство условных квантильных функций различного порядка, т.е возрастных зависимостей процентиль-ных значений.

Львович Игорь Яковлевич - ВГТУ, д-р техн. наук, профессор, (4732)39-84-22

Минакова Ольга Владимировна - ВИВТ, канд. техн. наук, workingmin@,pochta. ги,

Ситникова Валентина Пантелеевна - ВГМА им.

Н. Н. Бурденко, д-р мед. наук, профессор, (473)37-27-46

В отличие от линейной и нелинейной регрессии, являющейся зависимостью среднего значения от объясняющих независимых переменных, кван-тильная регрессия определяет функциональную зависимость заданной квантили порядка т Qy (г) = inf {у е F(у) > т\ и, являясь обратной к

функции распределения, полностью описывает распределение случайной зависимой величины Y [3].

Семейство условных квантилей позволяет отслеживать изменения формы распределения исследуемого показателя в зависимости от объясняющих параметров. Построение квантильно-регрессионной модели возрастной динамики ИМТ обеспечит практического специалиста полной диагностической информацией.

Цель данной работы состояла в получение региональных возрастных стандартных показателей ИМТ детей Воронежского региона. Для достижения ее была проанализированы форма распределения ИМТ, выбран метод анализа, позволяющий построить квантильную регрессию с наименьшими вычислительными затратами и обеспечивающий извлечение максимума информации из выборочных данных, осуществлена разработка и верификация модели.

Для проведения исследования в качестве базисной группы были использованы данные перекрестного обследования 8422 детей в возрасте от 2 до 14 лет из 11 районов Воронежской области и г.Воронежа. Все измерения были проведены в условиях поликлиники или стационара и выполнены в соответствии со стандартной методикой специально подготовленным медицинским персоналом [4, 5]. Были исключены дети, имеющие выраженную эндокринную и другую патологию развития, а также родившие недоношенными. Каждое измерение состояло из четырех параметров: значение массы и длины тела, пол и хронологический возраст ребенка, ИМТ был вычислен с точностью до трех значащих цифр после запятой.

Проверка согласия наблюдаемого распределения с нормальным осуществлялась по критерию Колмогорова-Смирнова и критерию Д’Агюстино. Расчет моделей и реализация описанных методов выполнена по специально разработанным программам в среде MathCad 13.

Корреляционный анализ выявил наличие слабой корреляционной связи ИМТ с возрастом, коэффициент корреляции Спирмана г=0,30 у девочек и г=0,31 у мальчиков. Наши исследования подтвердили, что из всех известных совместных оценок ИМТ у детей имеет наименьшую корреляционную связь с возрастом. Значение коэффициент корреляции Спирмана с возрастом для отношения массы к длине составило г=0,87 у девочек и г=0,88 у мальчиков, для индекса Khosla-Lowe (масса / длина3) г=-0,62 у девочек и г=-0,64 у мальчиков [6].

Нами проведен сравнительный анализ формы распределения ИМТ экспериментальных данных. На рис. 1 приведена гистограмма и аппроксимация эмпирического распределения значений ИМТ девочек и мальчиков в возрасте от 2 до 14 лет. Также представлена теоретическая кривая нормального распределения, параметры которого оценены по базисной выборке. Среднее значение и среднеквадратическое отклонение ИМТ мальчиков 17,0+2,5 кг/м2; среднее значение ИМТ девочек 16,5+2,5 кг/м2.

ИМТ, кг/м2

а) девочек

ИМТ, кг/м2

л гистограмма

---- нормальное распредление

----аппроксимация эмпирического распределения

б)мальчиков

Рис. 1. Распределение ИМТ девочек и мальчиков в возрасте от 2 до 14 лет

Медиана значений ИМТ девочек совпала со средним значением, а у мальчиков составила 16,6 кг/м2. Оба распределения унимодальные с модой 16,2 кг/м2 у девочек и 16,3 кг/м2 у мальчиков.

Рассматриваемые распределения асимметричны, имеют крутой склон в сторону уменьшения и пологий в сторону увеличения значений ИМТ. Вершина распределений мальчиков и девочек более острая, чем у кривой нормального распределения. Коэффициент асимметрии в выборке девочек составил 0,85+0,04 и 0,97+0,04 у мальчиков. Коэффициент эксцесса тоже положителен и равен 1,87+0,08 у девочек и 2,48+0,08 у мальчиков. Проверка по критерию Колмогорова-Смирнова не выявила согласия с нормальным распределением.

Проведенный анализ возрастной динамики значений ИМТ показал, что средние значения каждого года жизни имеют статистически значимые различия. Наблюдалось убывание значений в возрасте от 2 до 5 лет, имел место выраженный минимум на интервале от 5 до 7 лет, и отмечались максимальные значения к 14 годам.

Значения медианы численно отличаются от средних значений в пределах 0,6 кг/м2, и смещены в область меньших значений относительно среднего как у девочек, так и у мальчиков. На рис. 2 представлены медиана и интерквантильный размах совместно со средним значением мальчиков и девочек различного возраста, интервал возрастного группирования был выбран +0,5 года от целого значения.

Характер возрастных изменений медиан аналогичен динамике средних, наиболее значительные расхождения наблюдаются в возрасте до 7 лет. Формы возрастной зависимости медианы и среднего у девочек и мальчиков совпадают. Интересен факт, что у мальчиков и девочек минимальное значение зафиксировано в 6 лет.

Коэффициент асимметрии во всех половозрастных выборках был положителен и значимо больше нуля. В младшем возрасте (2-4 года) значения максимальны - 1,37 у девочек и 1,78 у мальчиков, в дальнейшем с увеличением возраста наблюдалась тенденция к убыванию асимметрии, отчетливо выраженная с 7 до 14 лет у мальчиков. Минимальное значение составляло 0,22 в 10 лет у девочек и 0,46 в 14 лет у мальчиков.

Коэффициент эксцесса был положителен и изменялся в широких пределах от 0,2 до 7,5. У девочек 10-летнего возраста его значение составляло

0,21, что статистически значимо не отличалось от нулевого значения. Во всех остальных половозрастных группах значение эксцесса было очень большое.

Таким образом, половозрастные распределений ИМТ детей до 10 лет имеют сложный характер, а именно, статистически значимое отличие от нормального распределения, наличие длинного правого хвоста и выраженную островершинность, а также наличие многомодальности - у мальчиков в большинстве выборок полного года жизни (9 из 13) и у девочек в 2 и 12 лет.

Возраст, лет

а) девочек

Возраст, лет

I 25 - 75 процентиль среднее значение

■ ■■ медиана

б) мальчиков

Рис. 2. Среднее значение, медиана и межквартильный размах ИМТ в выборках детей различного возраста

Была осуществлена разработка квантиль-регрессионных моделей ИМТ с применением модифицированного LMS-метода, в соответствии с разработанными нами алгоритмами, которые были апробированы для длины и массы тела [7]. В результате проведенного моделирования не удалось достигнуть согласия трансформированных значений по критерию Колмогорова-Смирнова с нормальным, ввиду высокого эксцесса. Так коэффициент эксцесса трансформированных с использованием преобразования Бокса-Кокса значений ИМТ был выше единицы, при асимметрии меньше 0,0001. Это потребовало поиска нового подхода к анализу данных.

В работе [8] показано, что степенноэкспоненциальное распределение с 4 параметрами, включающее нормальное, Лапласа и равномерное, как частные случаи, может быть использовано при наличии эксцесса трансформированных преобразованием Бокса-Кокса значений исходных данных.

Так показатель ИМТ можно представить, как случайную величину Y, имеющую степенноэкспоненциальное распределение Бокса-Кокса, обозначенное как ВСРЕ (ц, ст, X, V) с параметрами: ц -медиана, ст - среднеквадратическое отклонение, X-степень трансформации Бокса-Кокса, устраняющая асимметричность распределения, V - степень аргумента экспоненты, соответствующая эксцессу. Действительная положительная случайная величина Y , определяется через трансформированную случайную величину Ъ , полученную преобразованием вида [9]:

г =

1

и • X

I1-1

И

X = 0

(1)

где ц, ст и V - непрерывные положительные параметры.

Для рассматриваемого распределения ВСРЕ (ц, ст, X, V) Ъ - стандартная степенноэкспоненциальная переменная с нулевым средним и единичным среднеквадратическим отклонением, имеющая плотность распределения [8]:

f (г) = -

-ехр(-0.5 г/с ), (2)

с • 2(1+1/ю Г(1/г) где с - параметр, определяемый с использованием преобразования Нельсона:

с2 = 2-2/тГ(1/т)[Г(3/т)]-1, (3)

для всех т>0.

На рис. 3 представлена функция плотности распределения ВСРЕ (ц, ст, X, V) при различных значениях параметра V. При v=1 имеет место распределение Лапласа, при v=2 - нормальное и при v^■да -равномерное распределение.

Рис. 3. Плотность распределения ВСРЕ (ц, ст, X, V) с параметрами ц=50, ст=1, X=1 при изменении значения V

Из (1) функция плотности распределения случайной величины Y равна:

V

/т (У) = /г (г)

У

И а

/г(г).

(4)

(5)

Тогда квантильно-регрессионная модель может быть представлена параметрами ц, ст, X, V, определенными гладкими нелинейными функциями некоторой независимой переменной X, в частности, возраста - для показателей физического развития у детей, и записана в виде:

ЯЛИ) = М х)

Я2(а) = й2( х)

Я3(Х) = ^( х)

Я 4 (у) = ЬА( х)

где як (м>) - заданные монотонные функции для к=1, 2, 3, 4 параметров w, соответствующих ц, ст, X,

V;

Ик (х) - выбранная сглаживающая нелинейная функция независимого переменного X.

Параметры функций як (м>) могут быть найдены оценкой максимального правдоподобия. Логарифм правдоподобия наблюдения у., имеющего

плотность распределения (4) и параметры, определенные по (5) определяется [10]:

I 1 = (X -1) 1п(у,) - X • 1п(и) - 1п(а)

+ 1п(/2 (г,-) - 1п

Fv

1

аЩ

(6)

где г 1 - трансформированное по формуле (1) измерение у,,

/г () - значение плотности распределения стандартизованной величины г 1,

^ (м>) - значение функции распределения стандартизованной величины, имеющей ВСРЕ-распределение с нулевым средним, единичной среднеквадратической ошибкой и параметром v>0.

В качестве общего критерия для выбора модели был взят обобщенный информационный критерий Акайке, полученный через добавление к девиации подогнанной модели фиксированного штрафа р для каждой эффективной степени свободы, используемой в модели:

GALC(р) = -2 • I + р • df .

(7)

где I - оценка функции правдоподобия (6), полученная подстановкой значений у полученных по модели для каждого фиксированного значения х , ё/ = ё/и + ё/а + ё^ + ё/у - сумма всех степеней свободы модели, соответствующих функциям кк (х) для к=1, 2, 3, 4.

Функции Ик (х) для к=1, 2, 3 могут быть интерпретированы как М(х), S(x) и L(x) в терминах LMS-модели. Модель (5) обобщает LMS-метод трансформации от нормальности к общему случаю -ВСРЕ-распределению, включающему устранение не только асимметричности, но и эксцесса. Добавляе-

мая в LMS-модель новая функция, заданная как к4 (х) может быть обозначена Р(х) и соответственно описанная квантильно-регрессионная модель может быть представлена как LMSP с 4 аргументами, равными степеням свободы соответствующих функций М(х), S(x) и L(x), Р(х).

На основе LMSP-модели любая процентиль 100х или квантиль порядка т может быть вычислена, как:

О (х) 4М(х)(1 + Дх)5(х)г(*))и 1(х),Ь(х) Ф 0, (8)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

' | М (х)ехр( 5 (х) г(т)), Ь( х) = 0

где г(т) - квантиль порядка т степенно-

экспоненциального распределения ВСРЕ(0, 1, X, V) с параметрами X и V равными фиксированным значениям L(x) и Р(х) для текущего значения х.

Таким образом, LMSP-модель имеет большую гибкость, так как может отражать изменения вида формы распределения в динамике, но подгонка ее требует неоднократного вычисления гамма-функции.

Одним из главных достоинств LMS-модели являлась возможность получения z-оценок, стандартизованных величин с распределением N (0, 1), которые значительно упрощают процесс статистической обработки неоднородных, зависимых наблюдений. На основе полученной LMSP-модели также возможна трансформация к нормальности по формуле:

г _ г = 0^ (у], (9)

где Ф-1 - обратная функция к стандартному нормальному распределению,

^ (у) - значение функции распределения ВСРЕ (М(х), S(x), L(x), Y(x)) с рассчитанными на основе разработанной модели фиксированными параметрами для соответствующей пары значений независимого переменного x и зависимого у.

Для построения модели была использована трехступенчатая процедура [11]. На этапе инициализации были выбраны полиномиальные функции

для определения Ик (х) для всех к: Ик (х) = ^а3х3-1 .

3=1

Простой штраф р = 5 был установлен для всех степеней свободы.

На этапе выбора модели при фиксированных значениях ё/а = ё/у = ё/т = 1 было определено значение ё/и=3 минимизирующее GALC(5) до 15420 для значений ИМТ мальчиков и ё/и =4 - для девочек при GALC(5)=16020. Из модели ВСРЕ(3, 1, 1, 1) пошаговым увеличением числа степеней свободы связывающей функции к2 (х) при ё/а =2 был достигнут минимум GALC(5), равный 15319 для значений ИМТ мальчиков и из модели ВСРЕ(4, 1, 1, 1) минимум GALC(5)=15690. Затем был осуществлен поиск степеней (ё/у, ё/т) при фиксированных ё/и и ё/а, минимизирующих GALC(5). Увеличение степеней свободы ё/и и ё/а не привело к уменьше-

нию значения GALC(5) по сравнению с достигнутым как для значений ИМТ девочек, так и мальчиков. При проведении расчетов была использована специальная функция минимизации среды MathCad.

На этапе настройки модели в пределах +1 были изменены значения dfи и dfa, а также ^у, dfт) для получения оптимальных статистических характеристик z-оценок.

Таким образом, в результате моделирования была получена модель ИМТ мальчиков LMSP(1,3,2,1):

М (х) = 17,987 - 0,674х + 0,054х 2 £ (х) = 0,155 -1,674 -10-3 х L( х) = -0,578 Р(х) = 1,696 .

На рис. 4-5 представлены возрастные зависимости процентильных значений индекса массы тела девочек и мальчиков, построенные на основе разработанных моделей.

Возраст, лет

Рис. 4. Диаграммы возрастной динамики процентильных значений ИМТ мальчиков

Полученная модель ИМТ девочек LMSP(1,4,2,2) имеет вид:

М(х) = 19,53 -1,448- х+0,154- х2 - 3,8 -10-3х3 5 (х) = 0,172 - 2,7 •10-3 х Ц( х) = 0,103 - 0,062х Р(х) = 1,799 .

Используя разработанные модели, нами были рассчитаны z-оценки по (9). Средние значения полученных z-оценок были равны нулю, среднеквадратическое отклонение составило 0,9, коэффициент асимметрии в выборке девочек составил 0,05 и мальчиков 0,013, значение эксцесса 0,7.

Ввиду значительного преобладания эксцесса над асимметрией в большинстве половозрастных выборок значений ИМТ для построения модели возрастной динамики был использован подход с использованием трансформации Бокса-Кокса к четырехпараметрическому экспоненциально-степенному распределению ВСРЕ(ц, ст, X, т). Использование LMSP-модели позволило учесть возрастные изменения не только параметров, но и вида распределения. Так как для значений ИМТ детей различного возраста характерна значительная вариация обоих параметров формы - асимметрии и эксцесса.

Возраст, лет

Рис. 5. Диаграммы возрастной динамики процентильных значений ИМТ девочек

Предложенный алгоритм построения LMSP-модели требует значительных вычислительных затрат и может быть использован только в случаях когда LMS-модель не обеспечивает требуемого качества представления данных.

Разработанные возрастные диаграммы ИМТ детей в возрасте от 2 до 14 лет могут быть использованы в качестве региональных нормативных показателей для оценки массы тела по длине тела для детей данного пола и возраста, вместо весоростовых таблиц, представленных лишь для небольшого диапазона длины, а, следовательно, и возраста.

Применение ИМТ в педиатрической практике позволит повысить эффективность диагностики ожирения. Представленные результаты исследования ИМТ внедрены в работу эндокринологического отделения Воронежской областной детской клинической больницы №1.

Литература

1. Flegal KM Changes in the distribution of body mass index of adults and children in the US population / K. M Flegal, R P Troiano // Int. J. Obes. Relat. Metab. Disorders. - 2000 - Vol.7. - P. 807-825.

2. Cole TJ Establishing a standard definition for child overweight and obesity worldwide: international survey./ TJ Cole, MC Bellizzi, Km Flegal, WH Dietz.//British Medical Journal. -2000. - Vol. 3. - P.1240-1243.

3. Koenker R. Quantile Regression/ R Koenker, K. F. Hallock // Journal of Economic Perspectives. - 2001. -Vol. 4. - P.143-156.

4. Показатели физического развития детского населения Воронежской области на рубеже второго и третьего

тысячелетий/ А.И. Иванников, В.Н. Пенкин, Ситникова В.П., Пашков А.Н., Швырев А.П. - Москва.- Воронеж, 2005. - 121 с.

5. Индекс массы тела в оценке состояния здоровья детей Воронежской области / В.Н.Пенкин и др. - Воронеж. - 2003. - 22 с.

6. Львович И.Я. Значимость оценки индекса массы тела при принятии диагностических и прогностических решений в педиатрической практике/ И.Я. Львович, О.В. Минакова, В.П. Ситникова //Интеллектуализация управления в социальных и экономических системах: труды всерос. конф.. - Воронеж. 2007. - С.186-188

7. Львович И.Я. Определение справочных показателей физического развития детей с применением LMS-метода/ И.Я. Львович, О.В. Минакова, В.П. Ситникова// Вестник ВГТУ. - 2007. - № 10. - С. 96-101.

8. Rigby RA. Smooth centile curves for skew and kur-totic data modelled using the Box-Cox power exponential distribution./ RA Rigby, DM Stasinopoulos// Statistics in Medicine. - 2004. - V. 23. - P.3053-3076.

9. Cole TJ, Green PJ. Smoothing reference centile curves: the LMS method and penalized likelihood// Statistics in Medicine. - 1992. - V.11. - P.1305-1319.

10. Rigby RA, Stasinopoulos DM (2005). Generalized additive models for location, scale and shape. ./ RA Rigby, DM Stasinopoulos//Journal of the Royal Statistical Society -Series C - Applied Statistics. - 2005. - Vol.54. - P.507-544.

11. Львович И.Я. Формирование алгоритма построения моделей на основе трансформации первичных измерений к нормальности / И.Я. Львович, О.В. Минако-ва// Информационные технологии в науке, технике и образовании: материалы региональной научно-практической конференции. Воронеж: АНОО ВИВТ, РосНОУ (ВФ), 2008. - С.28-33.

Воронежский государственный технический университет Воронежский институт высоких технологий

Воронежская государственная медицинская академия им. Н. Н. Бурденко

USING QUNTILE REGRESSION MODELS FOR REFERENCE GROWTH CHARTS OF BODY MASS INDEX OF

CHILDREN

I. J. Lvovich, O.V. Minakova, V.P. Sitnikova

The article presents the method for estimating conditional quantile function for screening children’s physical development. It gives the algorithm of calculation the model of body mass index for boys and girls at every age. It’s shown that attaining models allows to construct diagnostic screening and research physical development of children of different age and sex.

Key words: body mass index, quantile regression model, reference growth charts.

i Надоели баннеры? Вы всегда можете отключить рекламу.