Основные вопросы статистического анализа в медицинских исследованиях

Павлова В.Ю.

ТОМ 2

НОМЕР 4

ОКТЯБРЬ - ДЕКАБРЬ 2009

КЛИНИЧЕСКАЯ

ОНКОгематология

ВОПРОСЫ МЕДИЦИНСКОЙ СТАТИСТИКИ

The basic questions of the statistical analysis in medical researches

V. Yu. Pavlova SUMMARY

In clause are taken up the basic questions of carrying out of the statistical analysis of clinical researches. Statistical processing represents complex multistage process, quality of accumulated statistical data, results of their processing and judgment depends on a level of which scientific organization in the solving image.

Keywords:

statistical treatment, clinical research.

State Educational Institution for Higher Professional Education (SEIHPE) «Kemerovo State Medical Academy of Roszdrav»

Основные вопросы статистического анализа в медицинских исследованиях

В.Ю. Павлова

РЕФЕРАТ

В статье освещены основные вопросы проведения статистического анализа клинических исследований. Статистическая обработка представляет собой сложный многоступенчатый процесс, от уровня научной организации которого решающим образом зависит качество накапливаемых статистических данных, результаты их обработки и осмысления.

Ключевые слова

статистическая обработка, клинические исследования.

Контакты: [email protected] Принято в печать: 25 ноября 2009 г.

ВВЕДЕНИЕ

Современную медицину невозможно представить себе без использования точных и надежных методов анализа и прогнозирования. Известно, что теория вероятностей и математическая статистика возникли в середине XVII в. в результате развития общества и товарно-денежных отношений.

Статистика, как любая другая наука, возникла из практических потребностей людей. Еще в древнем мире необходимость сбора налогов, несения военной службы и другая общественная деятельность обусловили потребность учета населения, его размещения, рода занятий.

Как любая наука, статистика имеет свой предмет исследования и свои специфические методы. Предметом статистики служит количественная сторона массовых явлений любой области в неразрывной связи с их качественным содержанием. При этом количественное выражение закономерностей развития этих явлений осуществляется с учетом конкретных условий места и времени.1,2

Специфические приемы, с помощью которых статистика изучает массовые явления, образуют статистическую методологию (или метод статистики).

Во всяком статистическом исследовании можно выделить три последовательные стадии:

1. Статистическое наблюдение, т.е. сбор первичного статистического материала.

2. Группировка и сводка результатов наблюдения.

3. Вычисление специфических характеристик изучаемого явления и анализ полученных сводных и расчетных материалов, формулировка выводов и предложений.1,2

На этих стадиях статистического исследования применяются специфические методы, образующие в совокупности содержание методологии статистической науки.

Общей чертой сведений, составляющих статистику, служит то, что они всегда относятся не к одному единичному (индивидуальному) явлению, а охватывают связанными характеристиками целую группу таких явлений (элементов).

Статистическая обработка представляет собой сложный многоступенчатый процесс, от уровня научной организации которого решающим образом зависят качество накапливаемых статистических данных, результаты их обработки и осмысления.

В настоящее время в различных направлениях медицинской деятельности проводится большое количество научных исследований, но статистическая обработка не всегда соответствует со-

Государственное образовательное учреждение высшего профессионального образования «Кемеровская государственная медицинская академия»

374

Медицинская статистика

временным требованиям, что вызывает большие сомнения в предоставляемых результатах. Данная ситуация вызывает определенное недоумение, т.к. имеет место достаточное количество литературы по особенностям статистической обработки именно медицинских данных,3-6 а также широкий спектр программного обеспечения (пакет прикладных статистических программ Biostat, Statistica 6.0 фирмы InstallShield Software Corporation (США); пакет программ SPSS (PASW Statistics) for Windows и т.д.).

Применение статистических методов не является формальной процедурой, это — творческая деятельность. И, как любая творческая деятельность, планирование исследований и интерпретация полученных результатов требуют глубоких знаний в области математики.2 Велика и ответственность — часто именно статистическая оценка результатов клинических исследований определяет решение в пользу данного метода лечения. На практике статистический анализ или формально выполняют сами медики, или уже после сбора данных их анализ поручается математикам, не имеющим отношения к медицинским приложениям. Кроме того, нередко недостаточное внимание уделяется планированию исследований. В результате уже после окончания этапа сбора информации, при попытке применить статистические тесты может оказаться, что собранных данных не хватает для формирования статистически значимого вывода о преимуществах одного сравниваемого метода лечения перед другим. И тут даже самые сложные математические методы анализа полученных результатов не спасут ситуацию, если они были получены в ходе неграмотно спланированного исследования.2

ОБЗОР ОСНОВНЫХ ЭТАПОВ СТАТИСТИЧЕСКОГО АНАЛИЗА

На первом этапе проводится стратификация полученных данных на две основные группы: количественные (допускающие непосредственное измерение величины эффекта) и качественные (не поддающиеся непосредственному измерению характеристики пациента, например: диагноз, пол, врожденные аномалии и т.п.). Все изучаемые показатели эффекта варьируют, но не все они поддаются непосредственному измерению.2,3

Следующим важным этапом анализа является определение типа распределения полученных данных (выборки). Важным способом «описания» переменной является тип распределения, который показывает, с какой частотой значения переменной попадают в определенные интервалы. Эти интервалы, называемые интервалами группировки, выбираются исследователем. Тип распределения возможно оценить при расчете асимметрии, эксцесса, а также получить с помощью критериев нормальности (например, критерия Колмогорова—Смирнова или W-критерия Шапиро—Уилка). Однако ни один из этих критериев не может заменить визуальную проверку с помощью гистограммы — графика, показывающего частоту попаданий значений переменной в отдельные интервалы. Гистограмма позволяет визуально оценить нормальность эмпирического распределения. На гистограмму также накладывается кривая нормального распределения.3,4 Точная форма нормального распределения (характерная колоколообразная кривая) представлена на рис. 1.

Тип распределения — принципиальный и ведущий критерий на первых этапах статистического анализа, т.к. он определяет выбор параметров описательной статистики и методов (критериев) дальнейшего анализа.

В большинстве случаев выборки в клинических исследованиях не соответствуют нормальному (гауссовскому) типу. Чем меньше выборка, тем больше вероятность несоответствия. В зависимости от типа распределения вычисление

5 6 7 8 9 10 11 12 13 14

Рис. 1. Гистограмма висячих столбцов с наложением наиболее подходящей нормальной кривой ожидаемых нормальных частот

средних значений представляется в виде среднего значения и стандартного отклонения (М ± б) в случае нормального распределения и медианы и квартильного диапазона (Ме ± Q) в случае распределения, отличного от нормального. Широко распространен ошибочный подход, при котором для описания дисперсии непрерывных количественных данных используют стандартную ошибку среднего, обычно обозначаемую как m. Стандартная ошибка среднего (в отличие от стандартного отклонения) является не характеристикой, описывающей распределение наблюдений исследуемой выборки по области значений, а лишь мерой точности оценки и чаще всего используется в физике для того, чтобы указать, насколько данный показатель стремится к нулю. Однако часто именно стандартную ошибку среднего m ошибочно приводят в качестве параметра описательной статистики, пытаясь продемонстрировать тем самым малую вариабельность своих данных.3,4 Например, была изучена группа из 13 пациентов в возрасте 18, 19, 26, 29, 31, 36, 38, 41, 52, 52, 55, 65 и 73 лет. В данном случае имеет место отличный от нормального тип распределения. Применение обычно использующихся среднего значения и стандартного отклонения дает результат 41,2 ± 17,2 года, в то время как медиана и квартальный диапазон (соответственно данному типу распределения) составляют 38,0 ± 11,5 года. На данном примере представлена значительная разница при использовании неадекватных и адекватных методов описательной статистики.

Другим частым поводом для использования m вместо д является то, что исследователи сталкиваются с ситуацией, когда о (д) превышает среднее значение М и, соответственно, запись «М ± д» в большинстве случаев (когда переменная принимает только положительные значения) оказывается бессмысленной. К сожалению, стандартное отклонение плохо приспособлено для описания распределений, отличных от нормального, в особенности асимметричных распределений. Например, в процессе анализа может сложиться ситуация, когда средний возраст может составить 5 ± 15 лет, в то время как очевидно, что отрицательных возрастов не существует.5,6

Не зная, как описывать распределения, отличные от нормального, авторы приводят запись «M ± m», т.к. всегда m < д, и это позволяет избежать заведомо некорректной ситуации.1,5,6

Если авторам все же необходимо привести именно точность оценки среднего, то рекомендуется приводить ее в виде 95%-го доверительного интервала (ДИ). В случае нормального распределения границами такого ДИ являются (M — 1,96 m; M + 1,96 m).4

Однако в большинстве случаев по мере увеличения размера выборки, используемой для получения распределения выборочного среднего, это распределение приближается к нормальному.1,4,5

Если число наблюдений в исследовании не превышает 20, то такую совокупность наблюдений условно принято считать

www.medprint.ru

375

В.Ю. Павлова

малой выборкой. Для описания наблюдений малой выборки не следует пользоваться методами описательной статистики, т.к. этот аппарат может неадекватно отражать распределения в малых выборках. Например, может не хватать данных, чтобы установить соответствие распределения нормальному, хотя среднее значение может быть рассчитано даже из двух наблюдений. В случае малых выборок результаты наблюдения рекомендуется приводить в виде таблицы первичных данных. Проценты при описании малых выборок также не должны использоваться.5,6

Широкое применение параметрических методов является распространенной ошибкой, встречающейся в существенной части медицинских публикаций. В большинстве случаев разумно полностью отказаться от параметрических методов и пользоваться непараметрическими (ранговыми) методами статистического анализа, применимыми для любых распреде-

лений.6

Независимо от конкретных клинических особенностей для ответа на вопросы, поставленные перед клиническим исследованием, с помощью различных критериев приходится проверять нулевую гипотезу об отсутствии эффекта или различиях в эффекте, сравнивая при этом выборочные средние, доли, кривые выживаемости и т.п.

Чтобы правильно выбрать статистический метод, необходимо учитывать прежде всего характер интересующего нас признака (количественный, порядковый или качественный) и тип распределения (нормальное или какое-либо другое).1,5,6 При выборе неадекватных методов статистического анализа будут получены недостоверные (ложноположительные или ложноотрицательные) результаты. Методы и критерии статистического анализа должны соответствовать его задачам (табл. 1).

По данным табл. 1, такой критерий, как /-критерий Стью-дента, применяется только при нормальном типе распределения и имеет различные методики в зависимых и независимых группах; данный критерий не используется в случае ненормального типа распределения. Но в большинстве опубликованных данных клинических исследований в различных периодических изданиях используется именно этот критерий, независимо ни от типа распределения, ни от характеристик групп (зависимые или независимые).

Следующим необходимым этапом статистического анализа является определение характера изучаемого явления в зависимости от вида выборки (зависимая или независимая). Как показано в табл. 1, методы статистического анализа различны для зависимых и независимых выборок.

Независимыми переменными называются переменные, которыми манипулирует исследователь, тогда как зависимые переменные — это переменные, которые измеряются или регистрируются.1,3,6 Термины «зависимая» и «независимая» переменная применяются в основном в экспериментальном исследовании, в котором экспериментатор манипулирует не-

которыми переменными, и в этом смысле они не зависят от реакций, свойств, намерений и т.д., присущих объектам исследования. Некоторые другие переменные, как предполагается, должны зависеть от действий экспериментатора или от экспериментальных условий. Зависимость проявляется в ответной реакции исследуемого объекта на оказанное на него воздействие. Отчасти в противоречии с данным разграничением понятий находится применение их в исследованиях, где вы не варьируете независимые переменные, а только приписываете объекты к экспериментальным группам, основываясь на некоторых их априорных свойствах.1,4,6 Например, если в эксперименте мужчины сравниваются с женщинами относительно числа лейкоцитов, содержащихся в крови, то пол можно назвать независимой переменной, а число лейкоцитов — зависимой переменной.

Одним из следующих этапов статистического анализа является сравнение групп по качественному и количественному (чаще — бинарному) признаку, анализ связи (корреляции, ассоциации) двух признаков (парный признак) и многофакторный анализ.

Данные методики подробно описаны в перечисленных выше изданиях. Необходимо обратить внимание на следующие аспекты: использование различных критериев и методик при сравнении двух или трех групп (как в случае зависимых, так и независимых выборок); использование различных методов анализа зависимостей признаков (метод Пирсона в случае нормального распределения и методы Спирмена, Кендалла, коэффициент гамма при распределении, отличного от нормального); использование различных методик в случае наличия всех данных и объектов исследования с пропущенными значениями.1,3,4

Заключительным этапом любого анализа является выявление зависимости между изучаемыми явлениями. Почему зависимости между переменными важны? Вообще говоря, конечная цель всякого исследования или научного анализа состоит в нахождении связей (зависимостей) между переменными. Философия науки учит, что не существует иного способа представления знания, кроме как в терминах зависимостей между количествами или качествами, выраженными какими-либо переменными.4,7 Таким образом, развитие науки всегда заключается в нахождении новых связей между переменными. Исследование корреляций по сути состоит в измерении таких зависимостей непосредственным образом. Тем не менее экспериментальное исследование не является в этом смысле чем-то отличным. Например, указанное выше экспериментальное сравнение числа лейкоцитов у мужчин и женщин может быть описано как поиск связи между переменными: пол и число лейкоцитов. Назначение статистики состоит в том, чтобы помочь объективно оценить зависимости между переменными. Статистическая значимость результата представляет собой оцененную меру уверенности в его истинности (репрезентативность выборки).3,5,6 В частности, p-уровень (этот тер-

Таблица 1. Задачи, методы и критерии статистического анализа

Методы

Задача Параметрические (для количественных нормально распределенных признаков) Непараметрические (для количественных признаков независимо от вида распределения, а также для качественных признаков)

Описательная статистика Вычисление средних значений, стандартных отклонений и т.д. Вычисление медиан, значений, интерквартильных интервалов и т.д.

Сравнение двух независимых групп по одному признаку f-критерий Стьюдента для независимых выборок Критерий Манна—Уитни, критерий Фишера и т.д.

Сравнение двух зависимых групп по одному признаку f-критерий Стьюдента для зависимых выборок Критерий Уилкоксона, критерий Мак-Немара

Анализ взаимосвязи двух признаков Корреляционный анализ по Пирсону Корреляционный анализ по Спирмену, Кендаллу и т.д.

Аналогичная ситуация по всем методам статистического анализа

376

Клиническая онкогематология

Медицинская статистика

мин был впервые использован в работе Brownlee, 1960) — это показатель, находящийся в убывающей зависимости от надежности результата. Именно p-уровень представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю популяцию. Во многих исследованиях p = 0,05 рассматривается как приемлемая граница уровня ошибки.3,6

Не существует никакого способа избежать произвола при принятии решения о том, какой уровень значимости следует действительно считать значимым. Выбор определенного уровня значимости, выше которого результаты отвергаются как ложные, достаточно произвольный. На практике окончательное решение обычно зависит от того, был ли результат предсказан априори (т.е. до проведения опыта) или обнаружен апостериорно — в результате многих анализов и сравнений, выполненных с множеством данных, а также на традиции, имеющейся в данной области исследований. Обычно во многих областях величинаp < 0,05 является приемлемой границей статистической значимости, однако следует помнить, что этот уровень все еще включает довольно большую вероятность ошибки (5%). Результаты приp < 0,01 обычно рассматриваются как статистически значимые, а результаты с уровнем p < 0,005 илиp < 0,001 — как высокозначимые. Однако следует понимать, что данная классификация уровней значимости достаточно произвольна и является всего лишь неформальным соглашением, принятым на основе практического опыта в той или иной области исследования гипотезы.2,3 При публикации полезно указывать реальное значение p (например, p = 0,0007), а не указывать p < 0,05, поскольку точное значение p позволяет оценить степень отклонения результатов от нулевой гипотезы и степень их достоверности.6

Понятно, что чем большее число анализов вы проведете с совокупностью собранных данных, тем большее число значимых (на выбранном уровне) результатов будет обнаружено чисто случайно.

ЗАКЛЮЧЕНИЕ

Таким образом, обработка и предоставление данных, полученных в ходе клинических исследований, включают несколько основных этапов: определение характера анализируемого признака (количественный, качественный); зависимые или независимые группы; определение типа распределения (нормальное или отличное от нормального), включая графическую оценку; в соответствии с типом распределения определение показателей описательной статистики и критериев множественного анализа. Адекватность выбора статистических методов анализа является определяющей в правильной интерпретации полученных данных.

ЛИТЕРАТУРА

1. Статистический портал StatSoft. http://www.statsoft.ru/home/portal/de-fault.asp

2. Реброва О.Ю. Описание процедуры и результатов статистического анализа медицинских данных в научных публикациях. http://www.media-sphera.ru/mjmp/2000/4/r4-00-21.htm

3. Гланц С. Медико-биологическая статистика. М., 1999: 596 с.

4. Ефимова М. P., Петрова Е. В., Румянцева В. Н. Общая теория статистики. М., 2005: 413 с.

5. Ребров О. Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. М., 2005: 305 с.

6. Платонов А.Е. Статистический анализ в медицине и биологии: задачи, терминология, логика, компьютерные методы. М., 2000: 51 с.

7. Lang T.A., Secic M. How to report statistics in medicine: annotated guidelines for authors, editors, and reviewers. ACP, 1997: 367 p.

www.medprint.ru

377

Основные вопросы статистического анализа в медицинских исследованиях Текст научной статьи по специальности «Экономика и бизнес»

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Павлова В. Ю.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Павлова В. Ю.

The basic questions of the statistical analysis in medical researches

Текст научной работы на тему «Основные вопросы статистического анализа в медицинских исследованиях»