УДК 614.2 + 303.4
ПОПЕРЕЧНЫЕ (ОДНОМОМЕНТНЫЕ) ИССЛЕДОВАНИЯ В ЗДРАВООХРАНЕНИИ
А. М. Гржибовский1-3, С. В. Иванов4
1 Национальный Институт Общественного Здравоохранения, г. Осло, Норвегия;
2 Международная школа общественного здоровья, Северный Государственный Медицинский Университет, г. Архангельск, Россия;
3 Международный Казахско-Турецкий Университет им. Х.А. Ясави, г. Туркестан, Казахстан;
4 Северо-Западный Государственный Медицинский Университет им.И.И. Мечникова, г. Санкт-Петербург, Россия.
В настоящей работе представлены основные принципы планирования, проведения и статистической обработки данных поперечных (одномоментных) исследований в здравоохранении. Приведены практические примеры расчета размера выборки и оценки связи между факторами риска с помощью онлайн-калькуляторов и пакета для обработки эпидемиологических данных Epi Info. Авторы представляют практические примеры использования поперечных исследований в литературе, а также достоинства и недостатки данного типа исследований. Настоящая статья призвана дать общие сведения о поперечных исследованиях, и не заменяет прочтения специализированной литературы по клинической эпидемиологии.
Ключевые слова: принципы планирования исследований, поперечные (одномоментные) исследования, статистическая обработка, эпидемиология, дизайн исследования.
CROSS-SECTIONAL STUDIES IN HEALTH SCIENCES
A. M. Grjibovski1-3, S. V. Ivanov4
1 Norwegian Institute of Public Health, Oslo, Norway;
2 International School of Public Health, Northern State Medical University, Arkhangelsk, Russia;
3 International Kazakh - Turkish University, Turkestan, Kazakhstan;
4 North-Western State Medical University named after I.I. Mechnikov, St. Petersburg, Russia.
In this paper we present basic principles of planning and carrying out cross-sectional studies in health sciences as well as analyzing the data collected in these studies. We present practical examples of sample size and effect measures calculation for cross-sectional studies using online calculators and Epi Info software. Examples of studies using cross-sectional design from international peer-reviewed literature are also presented. This article provides general introduction to cross-sectional studies and does not substitute specialized literature in clinical epidemiology.
Keywords: principles of research planning, cross-sectional studies, statistical analysis, epidemiology, study design.
ДЕНСАУЛЫК САКТАУДАГЫ К0ЛДЕНЕН (Б1РСЭТТ1К) ЗЕРТТЕУЛЕР
А. М. Гржибовский1-3, С. В. Иванов4
1 Когамдык Денсаулык сактау ¥лттык Институты, Осло к., Норвегия;
2 Когамдык денсаулык Халыкаралык мектебу СолтYCтiк Мемлекетт Медициналык Университету Архангельск к., Ресей;
3 Х.А. Ясави ат. Халыкаралык Казак - ТYрiк Университету Туркестан, Казакстан;
4 И. И. Мечников атынд. СолтYCтiк - Батыс мемлекетт медициналык университету Санкт-Петербург к., Ресей.
Осы жумыста денсаулы; са^таудагы келденец ^рсэтш) мэлiметтердi жоспарлау, етюзу жэне статистикалы; ецдеудН Heri3ri принциптер1 керсетiлген. Epi Info эпидемиологиялы; мэлiметтердi ецдеу Yшiн онлайн-калькуляторлар мен пакет кемепмен ;аут факторлары арасындагы байланысты тацдау жэне багалау мелшерi есебУц практикалы; мысалдары келтiрiлген. Авторлар эдебиеттеп келденец зерттеулердi пайдаланудыц практикалы; мысалдарын, сол сиякты осы зерттеу тYрлерi касиеттерi мен жетiспеушiлiктерiн келтiредi. Осы макала келденец зерттеулер туралы жалпы мэлiметтер беруге бейiмделген, жэне клиникалы; эпидемиология бойынша мамандандырылган эдебиеттi о;уды ауыстырмайды.
Heri3ri сездер: зерттеулердi жоспарлау принциптер^ (бiрсэттiк) мэлiметтердi, статистикалы; ецдеу, эпидемиология, зерттеу дизайны.
Библиографическая ссылка:
Гржибовский А. М., Иванов С. В. Поперечные (одномоментные) исследования в здравоохранении / / Наука и Здравоохранение. 2015. № 2. С. 5-18.
Grjibovski A. M., Ivanov S. V. Cross-sectional studies in health sciences. Nauka i Zdravoohranenie [Science & Healthcare]. 2015, 2, pp. 5-18.
Гржибовский А. М., Иванов С. В. Денсаулы; са;таудагы келденец (61рсэтт1к) зерттеулер / / Гылым жэне Денсаулы; са;тау. 2015. № 2. Б. 5-18.
Целью настоящей статьи является формирование у начинающего исследователя ключевых представлений о поперечных (одномоментных) исследованиях, области их применения в медицине, методологии проведения и корректном анализе собранных данных.
Поперечные исследования в научной и врачебной практике
Поперечные (одномоментные) исследования (сгоББ-зесИопа^и^ез) относятся к обсервационному типу, то есть являются исследованиями, в которых интересующие ученого данные собираются путем наблюдения событий в их естественном течении, без активного вмешательства в этот процесс [16, 10]. Особенность поперечных исследований заключается в том, что в ходе проведения исследования каждого пациента обследуют только один раз, и в дальнейшем его не наблюдают, причем одновременно часто собираются данные, как о факторах риска, так и об изучаемом заболевании. Поперечные исследования являются одним из наиболее простых видов исследований в эпидемиологии и очень популярны в странах СНГ [10, 3]. Можно провести аналогию между поперечным исследованием и фотографией, сделанной в определенный момент времени.
На рисунке 1 приведен схематичный пример поперечного исследования во временном аспекте.
На рисунке 1 представлена ось времени и интересующие исследователя события, например, наличие у пациента заболевания: периоды, когда у пациента имеется заболевание, представлены сплошными горизонтальными линиями, а момент проведения поперечного исследования -вертикальной пунктирной линией. На рисунке видно, что из 10-ти наблюдаемых лиц на момент проведения поперечного исследования заболевание было зафиксировано у пациентов №1, №4, №7, №8 и №9, в то время как у пациентов №2, №6 и №10 к моменту сбора данных заболевание прекратилось, а у пациентов №3 и №5 - еще не началось.
Таким образом, продемонстрирована важная особенность поперечных исследований, которую можно отнести к недостаткам - избыточное представительство случаев с большой продолжительностью заболевания и недостаточное - скоротечных случаев. Действительно, чем дольше существует заболевание, тем больше вероятность того, что оно попадет под поперечный срез наблюдения. Этот недостаток устранен в продольных (лонгитудинальных) исследованиях, в которых пациентов наблюдают в течение определенного периода времени, и о которых мы поговорим в последующих выпусках журнала.
0
m
q
0
-0 1
0
0
Ось
I------1-----1
i Момент наблюдения I
Рис. 1. Схема поперечного исследования во временном аспекте.
Основной сферой применения поперечных исследований является оценка
распространенности (превалентности,
prevalence) каких-либо заболеваний или других явлений или признаков в генеральной совокупности (популяции) [10, 13, 9, 14, 11].
Математически распространенность является дробью, в числителе которой находится число случаев изучаемого явления в определенной популяции, а в знаменателе - количество обследованных лиц на определенный момент времени:
Распространенность (превалентность)
Количество выявленных случаев изучаемого явления в
_определенной популяции_
Количество обследованных лиц на определенный момент
времени
Результат рассчета можно умножить на 100% и получить его в процентном выражении.
В качестве примера такого исследования можно привести профилактический осмотр авиадиспетчеров, который позволит определить распространенность, например, гипертонической болезни у данной категории работников аэропорта. Перепись населения
региона, учитывающая гендерные, социальные, образовательные и прочие параметры, также является поперечным исследованием.
Помимо точечной превалентности (point prevalence) также можно оценивать распространенность за период времени (period prevalence):
Распространенность за период
Количество выявленных случаев изучаемого явления в определенной популяции в течение промежутка времени Численность популяции в течение промежутка времени
В практическом аспекте поперечные исследования, проводимые через определенные промежутки времени, дают ценную статистическую информацию для органов здравоохранения о динамике заболеваемости и позволяют описать и сравнить структуру заболеваемости населения в различных регионах страны, что бывает необходимо для проведения своевременных
профилактических мер и адекватного распределения медицинских ресурсов. [10, 14, 2]. Поперечные исследования также являются целесообразным первым шагом при анализе причин неинфекционных и даже инфекционных заболеваний [11].
Поперечные исследования могут помочь изучить связь между заболеванием и воздействием факторов, которые могут влиять
на его развитие [16, 10, 15]. Однако, следует учесть, что в ходе поперечного исследования мы одновременно собираем информацию и о заболевании, и о факторах, которые могли бы повлиять на его появление, и в этом проявляется другой важный недостаток поперечных исследований - невозможность сделать однозначный вывод о причинно-следственной связи между явлениями. Например, поперечное исследование, направленное на поиск связи между депрессией и чрезмерным употреблением алкоголя ни в коей мере не позволит выяснить, предшествует ли действие фактора (алкоголь) появлению данного заболевания или следует после него? Может быть, депрессия развилась вследствие чрезмерного и длительного употребления алкоголя, а может быть и наоборот, алкоголь используется для компенсации депрессии. Результаты поперечных исследований зачастую не могут ответить на этот вопрос, и требуется проведение эпидемиологических испытаний других типов для проверки возникающих исследовательских гипотез.
Таким образом, поперечные исследования в научном процессе используются, прежде всего, для оценки распространенности признака или явления, а также генерирования и первичной проверки гипотез о причинах возникновения заболеваний, которые в дальнейшем подвергаются проверке с помощью других видов эпидемиологических исследований. Поперечные исследования могут быть весьма полезны для изучения влияния на развитие заболеваний неизменных в течение длительного времени факторов, таких как этническая принадлежность, пол, генетические особенности, группа крови и др.
В историческом аспекте можно упомянуть элегантное исследование Дж. Сноу, который в 1860 году путем оценки распространенности холеры среди жителей Лондона, получающих водоснабжение от разных компаний, смог выявить и ликвидировать источник инфицирования городских жителей. Правда, помимо поперечного дизайна, Сноу использовал и другие методы, которые сегодня составляют основу клинической эпидемиологии [10].
Методология поперечного исследования
Любое научное исследование следует начинать с постановки цели, то есть определить, зачем вообще нужно проводить
это исследование и на какие научные и практические вопросы оно должно помочь дать ответ [12].
Поперечное исследование следует начинать с выработки рабочей гипотезы, которую в дальнейшем исследователь пытается проверить в ходе исследования [1, 4, 8, 18]. Часто бывает так, что гипотезу формируют на основании результатов подобных работ других ученых в изучаемой области.
Следующим важным шагом является корректное планирование исследования. Следует помнить, что упущения на этапе планирования исследования особенно трудноисправимы и зачастую могут свести к нулю всю проделанную работу, так как результаты исследования могут оказаться недостоверными и интерпретировать их будет крайне затруднительно [12]. При планировании научной работы следует учитывать, что поперечное исследование, как правило, не охватывает всю популяцию, которая может насчитывать миллионы лиц, а является выборочным, то есть проводимым с отбором подлежащих обследованию единиц из генеральной совокупности. Генеральная совокупность - это именно та популяция, на которую мы планируем экстраполировать результаты проведенного исследования. Схематичное представление о соотношении выборки и генеральной совокупности представлено на рисунке 2. Важно, чтобы выборка была репрезентативной, то есть, чтобы характеристики выборки
соответствовали характеристикам изучаемой популяции. Именно репрезентативность выборки позволит исследователю обобщать результаты исследования в отношении всей генеральной совокупности, и поэтому подбор репрезентативной выборки - одно из основных условий корректности и достоверности результатов поперечного исследования [1, 4, 8, 18].
Таким образом, важным аспектом разработки дизайна исследования является выбор способа отбора пациентов из генеральной совокупности, направленный на обеспечение репрезентативности. Для этого используют различные методологии отбора, в том числе простой случайный отбор, механический отбор, стратифицированная выборка и проч., о которых можно узнать из соответствующей литературы [16, 10, 15].
а
Генеральная совокупность (популяция)
Репрезентативная выборка
Выявленные случаи
Рис.2. Схематичное изображение генеральной и выборочной совокупностей.
После обследования лиц из репрезентативной выборки и получения необходимой информации, исследователь приступает к обработке данных исследования и формулировке результатов.
Следующим целесообразным шагом является оценка степени возможного влияния изучаемого фактора на исход, или, другими словами, оценка меры эффекта фактора
(например, примером действующего фактора может являться наличие животных в доме, а примером связанного с действием фактора исхода - бронхиальная астма).
В случае поперечных исследований мерой эффекта служит отношение
распространенностей (prevalence ratio), которое рассчитывается по следующей формуле:
Отношение распространенностей
Распространенность выявленных случаев изучаемого явления
_среди лиц, имеющих фактор риска_
Распространенность выявленных случаев изучаемого явления среди лиц, не имеющих фактора раска
Таким образом, в широком понимании, отношение распространенностей показывает силу связи между воздействием и исходом через отношение распространенности исхода в группе лиц, подверженных воздействию и лиц, не подверженных воздействию.
В отличие от поперечного, в других видах исследований в качестве меры эффекта используют относительный риск (relative risk -RR в когортных исследованиях), и отношение шансов (odds ratio - OR в исследованиях «случай-контроль»). Чтобы продемонстрировать, чем отличаются шансы от вероятности (например, вероятности развития заболевания - риска), приведем пример: если в лотерее выигрывает один номер из четырех, то шансы выиграть составляют 1:3, а вероятность выигрыша - 25%.
Относительный риск равен отношению вероятности появления события в группе лиц, подверженных воздействию фактора (так называемая «экспонированная» группа), к вероятности появления события в группе лиц, не подвергавшихся воздействию фактора. Относительный риск отражает, во сколько раз риск исхода при наличии фактора выше риска исхода при отсутствии фактора, и используется как мера эффекта в когортных исследованиях. Например, значение относительного риска, равное 2,5, говорит о том, что наличие фактора риска увеличивает вероятность возникновения исхода (заболевания), в 2,5 раза.
Для того, чтобы рассчитать отношение шансов, сначала требуется рассчитать шансы наступления исхода в «экспонированной»
группе путем разделения количества случаев наступления исхода на количество случаев, когда исхода не наблюдалось, затем повторить ту же процедуру для «неэкспонированной» группы, а потом разделить шансы наступления исхода в «экспонированной группе» на шансы наступления исхода в «неэкспонированной группе». Отношение шансов отражает, во сколько раз шансы наступления исхода при наличии изучаемого фактора выше шансов исхода при отсутствии данного фактора. Отношение шансов используется как мера эффекта в исследованиях типа «случай-контроль». Использование отношения шансов как показателя связи между фактором и исходом в поперечных исследованиях уместно только в том случае, если в ходе исследования собираются данные о настоящем заболевании и об имевших место воздействиях в прошлом, поскольку в этом случае поперечное исследование по методологии проведения становится похожим на исследование «случай-контроль».
Казалось бы, отношение распространен-ностей рассчитывается также, как и относительный риск, но по результатам поперечных исследований мы не можем оценивать относительный риск, чтобы не вводить в заблуждение тех, кто будет знакомиться с результатами исследования. Сам дизайн поперечного исследования, и принципиальные ограничения данного типа исследований позволяют нам говорить только об отношении распространенностей.
Следует отметить, что в случае применения отношение шансов к результатам проспективныхкогортных исследований, оно может достаточно точно отражать относительный риск при редких исходах (до 10%), в остальных случаях значение отношения шансов будет существенно превышать значение относительного риска, что может привести к неправильному толкованию результатов исследования. Например, если вероятность исхода у имеющих фактор риска лиц равно 10%, у не имеющих фактора риска - 5%, то относительный риск будет равен 2,0, а отношение шансов составит 2,1. Если же вероятность исхода в «экспонированной» группе составляет 90%, а в «неэкспонированной» - 45%, то относительный риск также составит 2,0, а отношение шансов увеличится до 11,0.
Вопросы использования относительного риска и отношения шансов подробно рассматриваются в литературе по эпидемиологии и биомедицинской статистике [1, 2, 15].
Для статистической обработки результатов поперечных исследования применяются методы проверки статистической значимости различий между группами по разным показателям (например, критерий х2 Пирсона для качественных переменных), методы оценки связи между признаками анализируемой группы (коэффициенты корреляции) и методы моделирования влияния изменения одной или множества независимых переменных на значение определенной зависимой переменной (регрессионный анализ и др.) [1, 4, 8, 18].
На конечном этапе исследования, в ходе обсуждения результатов работы, исследователь должен видеть те границы, в рамках которых результаты исследования можно обобщать в масштабах генеральной совокупности. Интерпретация результатов поперечных исследований требует четкого понимания основных преимуществ и недостатков поперечных исследований, что позволит избежать недостаточно обоснованных заключений.
Преимуществами поперечныхисследо-ваний являются:
1. Быстрота выполнения (не требуют сопровождения по времени).
2. Относительно низкие затраты по сравнению с другими видами исследований.
3. Хорошо подходят для оценки влияния на исход стабильных факторов риска (например, пол, генотип, группа крови и др.).
4. Оптимальный способ оценки распространенности.
5. Возможность мониторироватьпоказате-ли распространенности заболеваний при организации лечебных и профилактических мероприятий (серия поперечных исследований)
6. Возможность одновременногоисследо-вания многих видов воздействий и многих исходов.
Недостатками поперечных исследований являются:
1. Требуют относительно большого размера выборки для исследования редких воздействий и заболеваний, а также заболеваний с короткой продолжительностью.
2. Невозможно определить инцидентность заболевания (частоту появления новых
случаев). Так как данные исследования основаны на данных распространенности (существующие случаи), а не на сведениях о новых случаях заболеваний, они имеют ограниченные возможности для изучения этиологических связей.
3. Невозможность определить последовательность наблюдаемых явлений: по результатам исследования неочевидно, что же появилось сначала - действие фактора риска или наблюдаемое явление, то есть невозможно четко установить причинно-следственную связь между наблюдаемыми явлениями.
4. Избыточное представительство в выборке случаев с большой продолжительностью изучаемого заболевания.
5. Недостаточное представительство в выборке случаев скороткой продолжительностью заболевания, то есть случаев заболеваний, которые быстро прекратились либо по причине быстрого выздоровления, либо в связи со смертью.
6. Данные поперечных исследований не всегда корректно отражают явления, происходящие в популяции с течением времени.
Алгоритм проведения и анализа результатов поперечного исследования
Для создания у начинающего исследователя представлений о непосредственном проведении данного вида исследований, мы рассмотрим гипотетическое поперечное исследование, посвященное оценке распространенности диспепсических жалоб у студентов вуза и связи данных жалоб с курением и нерегулярным питанием.
Как было сказано выше, поперечное исследование, как и любое другое научное исследование, следует начинать с выработки рабочей гипотезы. Предположим, что не менее трети студентов имеют диспепсические жалобы, и данные гастроэнтерологические расстройства связаны с нерегулярным питанием и курением.
После выработки гипотезы следует разработать рабочий инструмент исследователя - стандартизированный вопросник. Пусть в нашем исследовании этот вопросник будет максимально простым, состоящим всего из 3-х вопросов:
1. Беспокоили ли Вас в течение последнего месяца изжога, отрыжка, тошнота,
рвота, чувство тяжести в подложечной области, снижение аппетита? Ответ: ДА/НЕТ.
2. Вы курите? Ответ: ДА/НЕТ.
3. Удовлетворяет ли Ваше питание в течение последнего месяца следующим условиям: прием пищи 3-4 раза в день, питание горячее, перекусы с помощью «фаст-фуда» только изредка? Ответ: ДА/НЕТ.
Из приведенного примера видно, как важно корректно сформулировать вопросы анкеты таким образом, чтобы ответ был однозначным, либо имел четкие градации. Например, для проведения более серьезного исследования, в вопросах анкеты нужно учесть и частоту появления жалоб, и детализировать эти жалобы, и более подробно выяснить стаж курения, какое питание исследователь представляет как «правильное» и «неправильное», и много других вопросов. Следует учесть, что очень важно в самом начале исследования правильно составить этот рабочий инструмент, не жалея на этот процесс времени и усилий. Опыт показывает, что лучше потратить несколько недель на проработку анкеты, чем в дальнейшем получить данные, на основании которых невозможно получить адекватные результаты. Ведь изначально некорректно собранные данные не «выправить» никакими статистическими методами [12].
После разработки анкеты возникает вопрос, сколько же человек нужно опросить, чтобы получить результаты, которые можно применить ко всем студентам вуза? Предположим, исследователю известно, что в вузе обучаются 5 000 студентов. Казалось бы, надо опросить всех, но на это нет ни ресурсов, не времени (а что говорить об исследованиях, проводимых в масштабах городов и стран?). Чтобы понять, сколько участников включить в исследование, используем статистические методы, которые позволяют рассчитать объем выборки.
Воспользуемся для этой цели бесплатной программой «Epi Info™» (официальный сайт: http://www.cdc.gov/epiinfo/). Установив
программу, необходимо последовательно войти в разделы «Stat Calc» - «Sample Size and Power» - «Populationsurvey».
Для расчета необходимого размера выборки необходимо знать размер генеральной совокупности - популяции, на которую мы будем экстраполировать
результаты исследования (5 000 студентов вуза), и ожидаемую распространенность изучаемого явления. В научной литературе указано, что диспепсические явления, связанные с хроническим гастродуоденитом, встречаются у 30-50% молодежи.
Соответственно, впрограмме «Epi Info™» заполняемокна «Population size», «Expected
frequency». Уровень точности оценки («Confidence limits») установим 5% (в социологических исследованиях часто используется уровень статистической погрешности 3%). В оставшиеся две формы устанавливаем значение «1».
Результаты расчета размера выборки представлены на рисунке 3.
Рис. 3. Расчет размера выборки в программе «Epi Info™»
Мы видим, что для того, чтобы с 95% доверительной вероятностью получить результаты, которые можно применить ко всем студентам вуза, нам нужно опросить 343 человека. Для доверительной вероятности 99% это число составит уже 565 человек. Следует помнить, что чем выше точность определения доли, тем более крупная нам потребуется выборка.
Цифра количества респондентов получена, но исследователь должен предвидеть, что в ходе работы лучше включить несколько больше людей, так как часть участников может отказаться от исследования, часть внесет сведения в вопросник не полностью, и его невозможно будет обработать, и прочие непредвиденные рабочие моменты. Таким образом, в данном случае целесообразно пригласить в исследование минимум на 25% больше участников, то есть 430 человек. Как было сказано выше, важным аспектом проведения подобного опроса является обеспечение репрезентативности выборки. Исследователь сам выбирает стратегию отбора участников, исходя из целей и задач исследования. Например, можно с каждого из пяти курсов пригласить по 86 человек, причем внутри курса отбор должен будет осуществляться случайным образом.
После опроса участников результаты исследований должны быть представлены в виде таблиц, удобных для обработки.
Последующая обработка полученных научных данных может быть проведена в 2 этапа.
Этап 1. Оценка распространенности наблюдаемого явления.
В результате проведенного гипотетического исследования выяснено, что из 430 приглашенных данные, пригодные для обработки, были получены для 350 респондентов. Из них диспепсические жалобы имели 124 человека. Таким образом, распространенность (превалентность) диспепсических жалоб среди студентов вуза составила 35,4%. Но, разумеется, мы не можем ручаться, что именно у 35,4% из 5 000 - у 1 770 студентов вуза будут встречаться изучаемые жалобы. Но мы можем рассчитать интервал, в котором будет с 95% вероятностью находиться истинное значение при соблюдении условия репрезентативности выборки, то есть рассчитать 95% доверительный интервал для доли (confidence interval - CI). Не углубляясь в тонкости математического расчета доверительных интервалов, мы приведем алгоритм расчета с помощью онлайн-калькулятора, размещенного на ресурсе http://vassarstats.net/prop1.html, с
использованием метода Уилсона. Более Онлайн-калькулятор для расчета
подробно различные способы расчета доверительных интервалов представлен на
доверительных интервалов для частот и рисунке4. долей представлены в [7].
к = 124
Proportion = 0.3543
п = 350
Reset
Calculate
95% confidence interval: по continuity correction
Lower limit = 0.306 Upper limit = 0.4057
Рис. 4. Онлайн-калькулятор для расчета доверительных интервалов (http://vassarstats.net/prop1.html).
Чтобы рассчитать доверительные интервалы в нашем исследовании, в окошко «к» вводим количество выявленных случаев, в окошко «п» - количество респондентов. Калькулятор сам рассчитывает частоту («Proportion»), нижнюю границу («Lower limit») и верхнюю границы («Upper limit») 95% доверительного интервала - 30,6% и 40,6% соответственно. Следует заметить, что ширина доверительного интервала зависит от размера выборки, на основании которой были получены данные о распространенности - чем она больше, тем более узким будет доверительный интервал, что, безусловно,
предпочтительнее большого разброса значений ожидаемой распространенности изучаемого явления.
Итак, на первом этапе анализа данных был получен следующий результат:
распространенность диспепсических жалоб у студентов вуза составила 35,4% (95% С1: 30,6 - 40,6%).
Этап 2. Оценка возможной связи между факторами риска и исходом.
Для выявления связи диспепсических жалоб с неправильным питанием и курением можно представить полученные данные в виде четырехпольных таблиц (таблицы 1 и 2):
Диспепсические жалобы и неправильное питание.
Таблица 1.
Наличиед испепсических жало б(исход)
Да Нет Всего
Неправильное питание (фактор) Да 96 76 172
Нет 28 150 178
Всего 124 226 350
Таблица 2.
Диспепсические жалобы и курение._
Наличие д испепсических жало э (исход)
Да Нет Всего
Курение (фактор) Да 86 161 247
Нет 38 65 103
Всего 124 226 350
Сначала проведем анализ результатов, представленных в таблице 1. В данной таблице в строках представлен действующий
фактор (неправильное питание), а в столбцах - исход действия фактора (наличие диспепсических жалоб).
Для анализа данной таблицы используем критерий х2 Пирсона. Смысл статистического анализа данной таблицы сводится к следующему: если неправильное питание не влияет на развитие диспепсических жалоб, то количество наблюдений по данной таблице распределится примерно равным образом, если же влияет, то возникнет «перекос» с большим количество наблюдений в определенных ячейках. Критерий х2 позволяет ответить на вопрос, можно ли считать имеющееся распределение наблюдений по ячейкам случайным, или мы сможем с 95%
вероятностью утверждать, что такое распределение по ячейкам не может быть случайным, а является следствием систематического действия определенного фактора. Подробную информацию о данном критерии и его использовании можно прочитать в [5, 6].
Для анализа данных, представленных в таблице 1, снова воспользуемся программой «Epi Info™». Необходимо последовательно войти в разделы «Stat Calc» - «Tables (2 х 2 х n)». Как представлено на рисунке 3, заполняем формы согласно таблице 1.
Outcome
Yes No Total
Yes 96 76 172
Row % 55.81% 44.19% 100,00%
Col X 77.42% 33.63% 49.14%
No 28 150 178
Row % 15,73% 84.27% 100,00%
Coi X 22.58% 66.37% 50,86%
Total 124 226 350
Row X 35.43% 64.57% 100,00%
Col X 100.00% 100.00% 100,00%
Odds-based Parameters
Statistical Tests
Estímale Lower Upper
Odds Rabo 6.7669 4.0906 11.1943
MLE Odds Rabo (MriP) 6.7260 4.0945 11.2632
Fisher-Exact 3.9861 11.6196
Risk-based Parameters
Estimate Lower Upper
Risk Rato 3.5482 2.4629 5.1117
Risk Difference 40.0836 30.9353 49.2319
XJ 2 Tailed P
Uncorrected 61.4356 0.0000000000
Mantel Haenszel 61.2601 0.0000000000
Corrected 59.6959 0.0000000000
1 Tailed P 2 Taied P
МкЕР Exact 0.0000000000
Eisher Exact 0.0000000000 0.0000000000
Рис. 4. Расчет критерия х2 и отношения шансов в программе «Epi Info™».
Программа рассчитывает значение критерия х2, который в данном случае равен 61,44, и указывает, что уровень статистической значимости для двухсторонней гипотезы стремится к нулю («2 Tailed P»). Таким образом, мы можем указать, что уровень статистической значимости составляет
р<0,001. Это означает, что мы можем не только с 95%, но и с 99,9% вероятностью утверждать, что распределение значений по таблице не случайно, а связано с определенным фактором, в данном случае -неправильным питанием (при отсутствии конфаундеров).
Из результатов вычислений мы можем взять отношение распространенностей диспепсических жалоб у респондентов с неправильным питанием и у правильно питающихся респондентов, и его доверительный интервал. Так как отношение распространенностей рассчитывается в
числовом отношении также, как относительный риск, результаты расчета отношения распространенностей и его доверительный интервал возьмем из таблицы «Risk-based Parameters» - строка «Risk ratio».
Отношение распространенностей можно рассчитать и вручную:
Отношение распространенностей = (96/(96+76)) / (28/(28+150)) = 0,56/0,16 = 3,5.
Вместе с доверительными интервалами результат следует записать следующим образом: распространенность диспепсических жалоб у респондентов с неправильным питанием в 3,5 раза выше (95% CI: 2,5-5,1) по сравнению с правильно питающимися студентами. Следует отметить, что с 95% надежностью генеральное значение отношения распространенностей будет находиться в достаточно большом интервале - от 2,5 раз до 5,1 раза. Существует один путь уменьшения размеров доверительных интервалов -увеличение размера выборки - чем больше выборка, тем меньше доверительный интервал и точнее результаты исследования.
Анализ таблицы 2 с помощью программы «Epi Info™» читатель может произвести самостоятельно. В этом случае значение критерия х2 будет равно 0,14, p=0,711. Таким образом, в результате проведенного гипотетического исследования была определена распространенность диспепсических жалоб среди студентов вуза, равная 35,4% (95% CI: 30,6 - 40,6%), и обнаружена возможная связь данных жалоб с неправильным питанием: отношение распространенность диспепсических жалоб при неправильном питании в 3,5 больше (95% CI: 2,5-5,1), чем у студентов, питающихся правильно.
Последним шагом анализа результатов поперечного исследования является формулировка заключения и выводов, что, повторимся, следует делать с осторожностью, через призму ограничений для данного вида исследований.
Примеры поперечных исследований в литературе
Авторами статьи был проведен поиск примеров поперечных исследований в
системе Web of Science (Core Collection) по запросу «Cross-sectional» за период 2008-2014 гг. Символично, что подобный поиск также может, в какой-то мере, служить примером поперечного исследования, ведь исследование проводилось на момент 22:00 1 ноября 2014 г. Всего было найдено 102 850 публикаций, у которых в названии и/или тексте резюме упоминался термин «cross-sectional», из 12 509 130 индексируемых публикаций ресурса, что составляет 0,82%.
В качестве примера поперечного исследования рассмотрим научную работу, посвященную самооценке состояния здоровья лицами старше 45 лет, проведенное в г.Алматы и опубликованную в 2013 году в журнале «BMC Public Health» [17]. Целью данного исследования была оценка социально-демографических различий в самооценке состояния здоровья указанной категории населения. Подобные исследования направлены на оценку показателей состояния общественного здоровья, их сравнение с показателями других стран и регионов, а также используются для мониторинга состояния здоровья населения. Выявленная распространенность
(превалентность) слабого, удовлетворительного, хорошего и отличного здоровья среди наблюдаемой выборки составила 11,8%, 53,7%, 31,0% и 3,2% соответственно, и различия между группами населения, указавшими различные градации здоровья, были статистически значимы в отношении большинства рассматриваемых социально-демографических характеристик.
Рассмотрим фрагмент данного исследования в виде модифицированной таблицы (таблица 3).
Таблица 3.
Результаты самооценки зд оровья с учетом семейного положения.
Действующий фактор (семейное положение) Исход (состояние а здоровья по результатам самооценки), Зсолютное значение (%)
Наличие исхода (плохое здоровье) Отсутствие исхода (удовлетворительное, хорошее и отличное здоровье) Всего
Состоят в браке (наличие фактора) 69 (8,4) 754 (91,6) 823
Не состоят в браке (отсутствие фактора) 69 (19,7) 282 (80,3) 351
Всего 138 1036 1174
Для проведения расчетов снова воспользуемся программой «Epi InfoTM». Значение критерия х2 составляет 30,15, p<0,001. Если считать действующим фактором то, что респондент состоит в браке, как это представлено в таблице, то отношение распространенностей составит 0,4 (95% CI: 0,31-0,58), и данная цифра неудобна для представления и понимания результатов. Примем тогда за действующий фактор то, что респондент не состоит в браке - тогда в таблице поменяются местами строки №3 и №4. Результаты расчета критерия х2 не изменятся, а отношение распространенностей составит 2,3 (95% CI: 1,7-3,2). Таким образом, распространенность плохого здоровья по результатам самооценки у не состоящих в браке лиц в 2,3 раза (95% CI: 1,7-3,2) выше, чем у состоящих в браке.
Помимо оценки распространенности, в данном исследовании были использованы многомерные статистические методы для оценки влияния различных социально-демографических факторов на состояние здоровья населения. С многомерными методами мы познакомим читателей журнала в последующих выпусках.
Другим примером типичного поперечного исследования является оценка
распространенности низкорослости,
недостаточной массы тела, избыточной массы тела и ожирения у подростков в одном из районов Архангельской области с преобладанием сельского населения [20]. Целью исследования было определение распространенности указанных состояний путем использования российских и международных критериев оценки состояния физического развития подростков. По результатам одного из фрагментов
исследования, распространенность ожирения по результатам использования критериев оценки WHO-2007, CDC-2000, IOTF и российских критериев составила 4,7%, 2,6%, 2,3%, 2,0% соответственно. Превалентность недостаточной массы тела по результатам использования критериев оценки WHO-2007, CDC-2000, IOTF и российских критериев составила 3,6%, 3,1%, 1,8%, 2,3% соответственно Данный пример демонстрирует, насколько различные результаты распространенности заболеваний и других интересующих исследователя состояний могут быть получены при использовании разных методик их выявления. Вопрос выбора методики обнаружения заболевания в выборке наблюдений является одним из ключевых, и целесообразно решать его в пользу максимальной унификации со стандартными общепринятыми международными методиками, чтобы обеспечить возможность сопоставления результатов исследования с работами других исследователей.
В качестве следующего типичного примера поперечного исследования читатель может самостоятельно рассмотреть опубликованные в 2014 году в журнале «BMC Public Health» результаты исследования, посвященного оценке распространенности и структуры потребления алкоголя среди взрослого населения Шри-Ланки [19].
В крупных научных проектах, как правило, поперечное исследование проводят на первом этапе для получения данных о распространенности изучаемой проблемы и генерирования научных гипотез, которые в дальнейшем прорабатываются с использованием других, более сложных методов научного поиска и статистической обработки.
Литература:
1. Банержи А. Медицинская статистика понятным языком: вводный курс. М. : Практическая медицина, 2007. 287 с.
2. Власов В. В. Эпидемиология: учебное пособие для вузов. М. : ГЭОТАР-Медиа, 2004. 448 с.
3. Воробьев К. П. Формат современной журнальной публикации по результатам клинического исследования. Часть 3 // Укр. мед.часопис. 2008. №2. С. 150-160.
4. Гланц С. Медико-биологическая статистика. М. : Практика, 1998. 459 с.
5. Гржибовский А. М. Анализ номинальных данных (независимые наблюдения) // Экология человека. 2008. №6. С. 58-68.
6. Гржибовский А. М. Выбор статистического критерия для проверки гипотез // Экология человека. 2008. №11. С. 48-57.
7. Гржибовский А. М. Доверительные интервалы для частот и долей // Экология человека. 2008. №5. С. 57-60.
8. Доннели-мл. Р. А. Статистика. М. : Астрель : АСТ, 2007. 367 с.
9. Зайцев В. М., Аликбаева Л. А. Медицинская статистика в амбулаторно-поликлини-ческих учреждениях промышленных предприятий: учеб.пособие. СПб. : Изд-во СПбГМА им. И.И. Мечникова, 2009. 416 с.
10. Зуева Л. П., Яфаев Р. Х. Эпидемиология : учебник. СПб : ООО «Издательство Фолиант», 2008. 752 с.
11. Инфекционные болезни и эпидемиология: Учебник / В.И. Покровский [и др.]. Изд. 2-е. М.: ГЭОТАР-Медиа, 2007. 816 с.
12. Марьянович А. Т., Князькин И. В. Диссертация: инструкция по подготовке и защите. СПб. : Астрель-СПб. 2009. 403 с.
13. Основы медицинской статистики: учебно-методическое пособие / Под ред. В.С. Лучкевича. СПб. : Изд-во СЗГМУ им. И.И. Мечникова, 2014. 32 с.
14. Применение методов статистического анализа для изучения общественного здоровья и здравоохранения: учеб.пособие для практических занятий / Под ред. В.З. Кучеренко. 4-е изд., перераб. и доп. М. : ГЭОТАР-Медиа, 2011. 256 с.
15. Филиппенко Н. Г. Методические основы проведения клинических исследований и статистической обработки полученных данных: методические рекомендации для аспирантов и соискателей медицинских вузов /
Н. Г. Филиппенко, С. В. Поветкин. Курск. : Издательство КГМУ, 2010. 26 с.
16. Флетчер Р. Клиническая эпидемиология. Основы доказательной медицины: пер. с англ. / Р. Флетчер, С. Флетчер, Э. Вагнер. М. : Медиа Сфера, 1998. 352 с.
17. Abikulova A. K., Tulebaev K. A., Akanov A. A., Turdalieva B. S., Kalmahanov S. B., Kumar A. B., Izekenova A. K., Mussaeva B. A., Grjibovski A. M. Inequalities in self-rated health among 45+ year-olds in Almaty, Kazakhstan: a cross-sectional study // BMC Public Health. 2013. Vol. 13, 654.
18. Cleopas T. J. et al. Statistics Applied to Clinical Trials. 4th ed. Springer, 2009.
19. Katulanda P., Ranasinghe C., Rathnapala A. Karunaratne N., Sheriff R. Prevalence, patterns and correlates of alcohol consumption and its' association with tobacco smoking among Sri Lankan adults: a cross-sectional study // BMC Public Health. 2014. Vol. 14, 612.
20. Khasnutdinova S. L., Grjibovski A. M. Prevalence of stunting, underweight, overweight and obesity in adolescents in Velsk district, northwest Russia: A cross-sectional study using both international and Russian growth references // Public Health. 2010. Vol. 124. PP. 392-397.
References:
1. Banerzhi A. Meditsinskaya statistika ponyatnyim yazyikom: vvodnyiy kurs. [Introduction to medical statistics]. M. : Prakticheskaya meditsina, 2007. P. 287. [in Russian]
2. Vlasov V. V. Epidemiologiya: uchebnoe posobie dlya vuzov. [Epidemiology: the textbook] M. : GEOTAR-Media, 2004. P. 448. [in Russian]
3. Vorob'ev K. P. Format sovremennoy zhurnalnoy publikatsii po rezultatam klinicheskogo issledovaniya. Chast 3. [Format of the modern journal publication of the results of a clinical study. Part 3] // Ukr. med. Chasopis [Ukrainian medical journal]. 2008. No. 2. PP. 150160. [in Russian]
4. Glants S. Mediko-biologicheskaya statistika [The biomedical statistics]. M. :Praktika, 1998. PP. 459. [in Russian]
5. Grjibovski A. M. Analiz nominal'nykh dannykh (nezavisimye nablyudeniya) [Analysis of nominal data] // Ekologiya cheloveka [Human Ecology]. 2008. No. 6. PP. 58-68. [in Russian]
6. Grjibovski A. M. Vybor statisticheskogo kriteriya dlya proverki gipotez [Choosing a statistical test for hypothesis testing) // Ekologiya
cheloveka [Human Ecology]. 2008. No.11. PP. 48-57. [in Russian]
7. Grjibovski A. M. Doveritel'nye interval dlya chastoti dolei [Confidence intervals for proportions] // Ekologiya cheloveka [Human Ecology]. 2008. No.5. PP. 57-60. [in Russian]
8. Donneli-ml. R.A. Statistika.M. :Astrel : AST, 2007. P.367. [in Russian]
9. Zaitsev V. M., Alikbaeva L. A. Meditsins-kaya statistika v ambulatorno-poliklinicheskikh uchrezhdeniyakh promyshlennykh predpriyatii [Medical statistics in the outpatient clinics of industrial enterprises: textbook]. SPb. : Izd-vo SPb GMA im. I.I. Mechnikova, 2009. P. 416. [in Russian]
10. Zueva L.P, Yafaev R.H. Epidemiologiya: uchebnik [Epidemiology: the textbook]. SPb : OOO «IzdatelstvoFoliant», 2008. P. 752. [in Russian]
11. Infektsionnye bolezni i epidemiologiya: Uchebnik [Infections Diseases and Epidemiology: the textbook] V.I. Pokrovskii [i dr.]. Izd. 2-e. M.: GEOTAR-Media, 2007. 816 p. [in Russian]
12. Mar'yanovich A.T., Knyaz'kin I.V. Dissertatsiya: instruktsiya po podgotovke i zashchite. [Disertation: instructions for preparing and protecting] SPb. :Astrel'-SPb. 2009. p. 403. [in Russian]
13. Osnovy meditsinskoi statistiki: uchebno-metodicheskoe posobie [Basics of medical statistics: textbook] / Ed.. V.S. Luchkevich. SPb : Izd-vo SZGMU im. I.I. Mechnikova, 2014. p. 32. [in Russian]
14. Primenenie metodov statisticheskogo analiza dlya izucheniya obshchestvennogo zdorov'ya i zdravookhraneniya: ucheb. Posobie dlya prakticheskikh zanyatii [Application of methods of statistical analysis for the study of
public health and health care: textbook] / Ed. V.Z. Kucherenko. 4th ed. M. : GEOTAR-Media, 2011. p. 256. [in Russian]
15. Filippenko N. G. Metodicheskie osnovy provedeniya klinicheskikh issledovanii i statisticheskoi obrabotki poluchennykh dannykh: metodicheskie rekomendatsii dlya aspirantov i soiskateley meditsinskikh vuzov [Basics of clinical trials and statistic analysis] / N.G. Filippenko, S.V. Povetkin. Kursk. : Izdatelstvo KGMU, 2010. P. 26. [in Russian]
16. Fletcher R. et al. Klinicheskaya ehpidemiologiya. Osnovy dokazatel'noi meditsiny [Clinical epidemiology. Basics of the evidence-based medicine] / R. Fletchtr, C. Fletcher, E. Vagner. M. : Media Sphere, 1998. 352 p. [in Russian]
17. Abikulova A. K., Tulebaev K. A., Akanov A. A., Turdalieva B. S., Kalmahanov S. B., Kumar A. B., Izekenova A. K., Mussaeva B. A., Grjibovski A. M. Inequalities in self-rated health among 45+ year-olds in Almaty, Kazakhstan: a cross-sectional study // BMC Public Health. 2013. Vol. 13, 654.
18. Cleopas T. J. et al. Statistics Applied to Clinical Trials. 4th ed. Springer, 2009.
19. Katulanda P., Ranasinghe C., Rathnapala A. Karunaratne N., Sheriff R. Prevalence, patterns and correlates of alcohol consumption and its' association with tobacco smoking among Sri Lankan adults: a cross-sectional study // BMC Public Health. 2014. Vol. 14, 612.
20. Khasnutdinova S. L., Grjibovski A. M. Prevalence of stunting, underweight, overweight and obesity in adolescents in Velsk district, northwest Russia: A cross-sectional study using both international and Russian growth references // Public Health. 2010. Vol. 124. PP. 392-397.
Контактнаяинформация:
Гржибовский Андрей Мечиславович - доктор медицины, магистр международного общественного здравоохранения, Старший советник Национального Института Общественного Здравоохранения, г. Осло, Норвегия; Директор Архангельской международной школы общественного здоровья, г. Архангельск, Россия; Профессор Международного Казахско-Турецкого Университета им. Х.А. Ясави, г, Туркестан, Казахстан.
Почтовыйадрес:№РА, Nasjonaltfolkehelseinstitutt, Postboks 4404 Nydalen, 0403 Oslo, Norway.
Email:[email protected]
Телефон: +4745268913 (Норвегия), +79214717053 (Россия), +77471262965 (Казахстан)