Научная статья на тему 'Доверительные бутстреп-интервалы для инкрементного показателя клинико-экономической эффективности медицинских технологий'

Доверительные бутстреп-интервалы для инкрементного показателя клинико-экономической эффективности медицинских технологий Текст научной статьи по специальности «Математика»

CC BY
186
69
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БУТСТРЕП / ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ / ИНКРЕМЕНТНЫЙ ПОКАЗАТЕЛЬ / КЛИНИКО-ЭКОНОМИЧЕСКИЙ АНАЛИЗ / МЕТОД FIELLER / МЕТОД TAYLOR (ДЕЛЬТА-МЕТОД) / BOOTSTRAP / CONFIDENCE INTERVAL / INCREMENTALCOST-EFFECTIVENESS RATIO / CLINICAL AND ECONOMIC ANALYSIS / FIELLER / TAYLOR / DELTA METHOD

Аннотация научной статьи по математике, автор научной работы — Симонов Анатолий Никифорович, Реброва Ольга Юрьевна

При анализе эффективности затрат, позволяющем сравнивать клинико-экономическую эффективность двух методов лечения, обычно необходимо рассчитывать инкрементный показатель клинико-экономической эффективности (ІCER).Для корректных статистических выводов недостаточно получить точечную оценку данного показателя, необходимо также строить доверительные интервалы. В статье описываются три метода построения доверительных интервалов для ICER: методы Fieller, Taylor (дельта) и бутстреп. Приведены численные примеры. Сделан вывод о том, что метод бутстреп является наиболее универсальным.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Симонов Анатолий Никифорович, Реброва Ольга Юрьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Confidence Bootstrap Intervals for Clinical Economical Estimates

Incremental cost-effectiveness ratio (ICER) is often calculated in cost-effectiveness analysis of two methods of treatment. To make correct inferenceit is not enough to get the point estimate of the ratio, confidence intervals should also be constructed. Three methods for constructing confidence intervals for the ICER are described in the article methods by Fieller, by Taylor (delta) and the bootstrap. Numerical examples are given. It is concluded that the bootstrap method is the most versatile.

Текст научной работы на тему «Доверительные бутстреп-интервалы для инкрементного показателя клинико-экономической эффективности медицинских технологий»

< Методология о

н о. ш с

о *

о

О S

ц <

X

<

к

<

со о d

ш ^

о о

36

Доверительные бутстреп-интервалы для инкрементного показателя клинико-экономической эффективности медицинских технологий

А.Н. Симонов1, О.Ю. Реброва2

1 Научный центр психического здоровья Российской академии медицинских наук, Москва, Россия

2 Российский национальный исследовательский медицинский университет им. Н.И. Пирогова Минздрава РФ, Москва, Россия

При анализе эффективности затрат, позволяющем сравнивать клинико-экономическую эффективность двух методов лечения, обычно необходимо рассчитывать инкрементный показатель клинико-экономической эффективности (ЮЕЯ).Для корректных статистических выводов недостаточно получить точечную оценку данного показателя, необходимо также строить доверительные интервалы. В статье описываются три метода построения доверительных интервалов для ICER: методы Fieller, Taylor (дельта) и бутстреп. Приведены численные примеры. Сделан вывод о том, что метод бутстреп является наиболее универсальным.

КЛЮЧЕВЫЕ СЛОВА: бутстреп, доверительный интервал, инкрементный показатель, клинико-экономический анализ, метод Fieller, метод Taylor (дельта-метод).

о см

CL

О

L0 -О Ш

X

Ш

О ^

О X

X

ш

о

X

ВВЕДЕНИЕ

В последние годы во всем мире наблюдается возрастающий интерес к проблемам экономической оценки эффективности лечения (cost-effectiveness analysis, CEA) [1-5], что объясняется как повышением стоимости медицинской помощи в целом, так и появлением альтернативных методов лечения одного и того же заболевания, имеющих не только разную клиническую эффективность, но и разную стоимость. При проведении анализа эффективности затрат, позволяющего сравнивать клинико-экономическую эффективность двух методов лечения, часто необходимо рассчитать инкрементный показатель (отношение) клинико-экономической эффективности (incremental cost-effectiveness ratio, ICER), который определяется следующим образом:

(1)

где ^ - истинное среднее значение цены (С) и эффективности (Е) методов лечения 1 (исследуемого) и 0 (контрольного, референтного), соответственно. Для удобства изложения введем обозначение ICER = R.

Поскольку истинные значения этих средних, принадлежащих генеральной совокупности, неизвестны, то R оценивают на основе выборочных данных, соответствующих группам вмешательства:

(2),

где

- 1

т

т

- выборочные средние значения цены и эффективности соответствующих групп вмешательства объемом п и т. соответственно.

Формула (2) дает точечную оценку 1СЕЯ = Я истинного значения величины ICER = R на основе выборочных данных. Для корректных статистических выводов недостаточно получить точечные оценки исследуемых выборочных параметров, необходимо также изучить распределение полученных оценок, оценить статистическую точность этих оценок, построить доверительные интервалы или протестировать статистические гипотезы, и только на этом основании делать выводы.

В то же время очевидно, что распределение отношения

существенно зависит от вида распределении, которым подчиняются случайные величины С о. 1и, и Е\ от области их определения, а также от значений параметров этих распределений. Например, известно,

что функция распределения f(R) в случае, когда Со. Ci, Ео и Еi распределены нормально, представляет собой смесь нестандартного бимодального распределения с распределением Коши и в общем случае не имеет моментов [6, 7]. Как следствие, при использовании классических подходов получить какие-либо оценки интересующих статистик и сделать корректные статистические выводы, т.е. построить доверительные интервалы или проверить статистические гипотезы, представляется довольно сложной задачей. Существует несколько альтернативных подходов к решению этих проблем [8], среди которых наиболее значимые - метод Филлера (Fieller) [9-11], дельта-метод, известный также как метод Тейлора (Taylor) [12], и бутстреп-метод [13, 14]. Рассмотрим их.

МЕТОД ФИЛЛЕРА (FM)

Границы доверительного интервала (ДИ) для ICER по методу Филлера вычисляют на основе следующей формулы:

(ЛА);

(аса Е-Гп ,vArAF) ± {(ДСД£ - t2nn ,v

\ а/2,п+т-\ АСАЕ I \ а/2,п+т-1 ,

2 -(аЕ-е

а/2,п+т-1^АЕАЕ I ^ 'a/2,n+m-lVACAC

(3)

АЕ -г., ,УДЕ.ДГ

а/2,п+т-\ АЕАЕ

где

- дисперсия выборочного среднего А Е,

- дисперсия выборочного среднего АС;

1 1

V - - = —

лсдя ДГ jY .

~1[Си-фи-Е^^1(С01-С0) -ковариация

АС и АЕ:

/ (100 * а / 2) %-й квантиль ^распределения с п + т -1 степенями свободы;

а/2,п+т-\

ЯЬ, ЯП - нижняя и верхняя границы интервала, в который с заданной вероятностью 100 * (1 - а / 2) % попадает истинное значение коэффициента Я, соответственно.

Для существования замкнутого доверительного интервала (ЯЬ, ЯП) необходимо, чтобы знаменатель в (3) отличался от нуля при уровне значимости а, т.е. чтобы выполнялось условие

Кроме того, подкоренное выражение не должно быть отрицательным. Указанные условия являются ограничениями данного метода.

ДЕЛЬТА-МЕТОД (йМ, МЕТОД ТЕЙЛОРА)

Приближенные доверительные интервалы для 1СЕЯ в дельта-методе строятся на основе формулы:

(4),

где все обозначения прежние.

37

Данный метод является параметрическим, т.е. числитель и знаменатель отношения, для которого строят ДИ, должны быть распределены по нормальному закону. Кроме того, дисперсия отношения вычисляется в результате разложения в ряд и имеет приближенное значение.

<

о s н о. ш с

о *

о

О S

ц <

X

<

к

<

со о d

ш ^

о о

38

о см

БУТСТРЕП-МЕТОД (BOOTSTRAP, BM)

Суть бутстреп-метода состоит в том, что, располагая лишь одной экспериментальной выборкой, мы можем на ее основании генерировать необходимое число других выборок, адекватных тем, которые в реальных условиях можно было бы получить случайным обра-зом1. Доказано, что распределение таких выборок является наилучшей оценкой реального распределения для большинства статистик [14].

Алгоритм бутстрепа состоит из следующих шагов:

1-й шаг - из исходной выборки извлекается большое число (обычно несколько тысяч выборок, обозначим их количество буквой В) случайных выборок того же объема, что и исходная; в результате получаем массив бутстреп-выборок объемом B.

2-й шаг - для каждой из таких бутстреп-выборок вычисляется интересующая исследователя бутстреп-статистика: в нашем случае это величина ICER*, или R* (звездочкой будем отмечать любые величины, полученные при помощи бутстрепа).

3-й шаг - на основе полученного массива R* объемом B строятся гистограммы, вычисляется дисперсия, строятся доверительные интервалы и делаются статистические выводы.

Полученные таким образом бутстреп-гистограм-мы можно использовать для оценки функции распределения /(/?). В этом случае для проверки нулевой гипотезы о том, что бутстреп-распределение R* принадлежат совокупности с нормальным распределением, можно использовать критерии Колмогорова-Смирнова и X2 при а = 0,05 [15].

Если гистограммы распределения полученных бутстреп-коэффициентов R* статистически не отличаются от нормального распределения, то в этом случае для любой статистики можно строить бутстрепов-ские доверительные интервалы по формуле:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(RR) = [R-zal2<y\R + zal2a}

(5),

CL

О

LQ _D

m

х

ш

где К - среднее, :а/2 - 100 * а / 2 %-я точка нормального распределения, (7 - стандартное отклонение, полученное из бут-стреп-распределения.

Кроме того, для бутстреп-выборок R* можно строить непараметрические процентильные доверительные интервалы, не требующие расчета стандартных отклонений:

о ^

о

X

X

ш

о х

А)

, *

R-q* ,R-q

i ^ a' 1 a

~~2 7

(6)

где * а ■ 100 * а/ 2% бутсреповский процентиль.

2

1 В процедуре бутстрепа для генерации бутсреп-выборок

используется метод Монте-Карло как один из приемов в многошаговой процедуре бутстрепа. Бутстреп может выполняться и без метода Монте-Карло, если исходная выборка небольшая.

Ниже приведен реализованный нами численный пример построения доверительных интервалов для R с помощью всех перечисленных методов. Расчеты проводились с использованием MS Excel.

ЧИСЛЕННЫЕ ПРИМЕРЫ ПОСТРОЕНИЯ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ

Рассмотрим приведенные в табл. 1 данные, полученные в некотором эксперименте для двух групп: опытной объемом 6 и контрольной объемом 4. Выборочное значение величины R, вычисленное по данным табл. 1, равно 0,855. Как было отмечено выше, это выборочное значение R является лишь точечной оценкой его истинного значения, которое неизвестно, но находится с заданной вероятностью (обычно 95 %) в доверительном интервале, построенном на основе выборочных данных.

Таблица 1. Выборочные данные эффекта и стоимости лечения для двух групп сравнения

Исходная выборка AC AE R

Опытная группа (1) Контрольная груп-

па (0)

а т ш" О а т ш° с/

Ф Ё н с Ф Ё ть с

Ф о Ф о

о -Н- S о - S

01 Z -в- СО о т 01 Z - со о т

и и

1 220 9000 1 120 7400 83,3 97,5 0,855

2 240 6500 2 130 8000

3 200 8500 3 140 7500

4 250 9500 4 160 8300

5 340 6800

6 160 7000

Сред- 235 7883,3 Сред- 137,5 7800

нее нее

БУТСТРЕПОВСКИЕ ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ДЛЯ ВЕЛИЧИНЫ ICER

Реализация метода бутстрепа на основе данной выборки состоит в том, что из опытной и контрольной групп независимо извлекаются простые случайные выборки с возвращением, и на основе этих выборок рассчитывается величина R*. Общее число таких бустреповских статистик определяется по формуле:

в = С2П-ХС2т-\ _ С\\С1 СПС7= 462.35 = 16П0 п т 6 4 6 4

где п - объем опытной группы, m - объем контрольной группы, С - комбинаторное число сочетаний.

Ясно, что количество уникальных бутстрепов-ских статистик быстро возрастает с ростом объемов исходных выборок, поэтому обычно ограничиваются несколькими тысячами бутстреповских выборок и соответствующих им бутстреповских статистик.

Таблица 2. Пример реализации трех первых и В-й бутстреповских выборок и вычисление по I бутстреповских статистик Д^, ДE* и R*

Bootstrap 1 AC* AE* R*

5 340 6800 1 120 7400 325,0 113,3 2,9

4 250 9500 2 130 8000

4 250 9500 2 130 8000

1 220 9000 3 140 7500

6 160 7000

2 240 6500

Bootstrap 2

2 240 6500 2 130 8000 -358,3 122,5 -2,9

3 200 8500 3 140 7500

5 340 6800 3 140 7500

5 340 6800 3 140 7500

3 200 8500

2 240 6500

Bootstrap 3

6 160 7000 3 140 7500 75,0 90,0 0,8

2 240 6500 3 140 7500

5 340 6800 1 120 7400

6 160 7000 3 140 7500

3 200 8500

4 250 9500

Bootstrap B

6 160 7000 3 140 7500 -1 008,3 73,3 -13,8

6 160 7000 3 140 7500

2 240 6500 1 120 7400

2 240 6500 4 160 8300

2 240 6500

2 240 6500

<

О

39

Табл. 2 демонстрирует практическую реализацию алгоритма бутстреп. Как видно из этой таблицы, в бутстреповских выборках содержатся те же данные, что и в исходной выборке, но в разных сочетаниях.

Гистограмма распределения Я*,, полученных с помощью этого алгоритма и приведенная на рис. 1,

имеет симметричную форму, похожую на нормальное распределение. Действительно, критерии Колмогорова-Смирнова и X2 при а = 0,05 показали, что распределение величин Я*, статистически не отличается от нормального распределения.

Рис. 1. Гистограмма распределения бутстреповских статистик R*i

<

о s н а. ш с

о *

о

о S

ц <

X

<

к

<

а о d

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ш ^

о о

Рис. 2. Диаграмма рассеяния бутстреповских значений ДС*, AE*. Границы 95 %-х бутстреповских доверительных интервалов для Я лежат на прямых на равном удалении от точки их пересечения.

Таблица 3. 95 %-е доверительные интервалы, построенные разными методами

Метод Нижняя граница ДИ Верхняя граница ДИ Длина ДИ

Fieller -12,62 16,93 29,55

Taylor -14,66 16,37 31,03

Бутстреп параметрический -10,37 12,60 22,98

Бутстреп непараметрический (персентильный) -10,51 12,68 23,19

40

о см

CL

О

L0 -О Ш

X

Ш

О ^

О X

X

ш

о

X

На рис. 2 приведена диаграмма рассеяния бутстреповских значений AC*, AE* и 95 %-е бутстреповские доверительные интервалы для R.

Доверительные интервалы по методу Филлера и дельта-методу рассчитывали на основе формул (3) и (4), используя исходные данные из табл. 1. В табл. 3 приведены значения всех 95 %-х доверительных интервалов для истинного значения R, полученного на основе исходной выборки. Как видно из этой таблицы, несмотря на принципиально разные методы вычисления доверительных интервалов, их величины достаточно близки друг к другу.

Метод бутстреп - непараметрическая альтернатива классическим параметрическим и непараметрическим методам. Он предназначен для построения распределений любых статистик (коэффициента корреляции, коэффициентов регрессии и т.д.) и конструирования для этих статистик доверительных интервалов.

ЗАКЛЮЧЕНИЕ

На основе исходной выборки, пусть даже малой по объему, можно построить различными независимыми методами близкие по величине доверительные интервалы для какой-либо статистики (в данном случае ICER). В то же время необходимо иметь в виду, что на практике могут встречаться выборки, по которым невозможно построить достаточно узкие или вообще замкнутые доверительные интервалы. Наиболее универсальным из рассмотренных методов (Fieller, дельта, бутстреп) является последний, поскольку он имеет минимум ограничений.

ЛИТЕРАТУРА

1. van Hout B.A., Al M.J., Gordon G.S., et al. Costs, effects and C/E ratios alongside a clinical trial. Health Economics, 1994; 3: 309-319.

2. O'Brien B.J., Drummond M.F., Llabelle B.J., et al. In search of power and significance: issues in the design and analysis of stochastic cost-effectiveness studies in health care. Medical Care, 1994; 32: 150-163.

3. Briggs A.H., Wonderling D.E., Mooney C.Z. Pulling cost-effectiveness analysis up by its bootstrap: a non-parametric approach to confidence interval estimation. Health Economics, 1997; 6: 327-340.

4. Briggs A.H., Fenn P. Confidence intervals or surfaces? Uncertainty on the cost-effectiveness plane. Health Economics, 1998; 7: 723-740.

5. Briggs A.H., Mooney C.Z., Wonderling D.E. Constructing confidence intervals for cost-effectiveness ratios: an evaluation of parametric and nonparametric techniques using Monte-Carlo simulation. Statistics in Medicine, 1999; 18: 3245-3262.

6. Marsaglia G. Ratios of normal variables and ratios of sums of uniform variables. Journal of the American Statistical Association, 1965; 60: 193-204.

7. Marsaglia G.Ratios of normal variables. Journal of Statistical Software, 2006; 16 (4): 1-10.

8. Franz V. H. Ratios: A short guide to confidence limits and proper use. arXiv:0710.2024v1 of Statistics, 2007; 7: 1-26.

9. Fieller E.C. The biological standardisation of insulin. Journal of the Royal Statistical Society (Supplement). 1940; 1: 1-54.

10. Fieller E.C. Some problems in interval estimation. Journal of the Royal Statistical Society, 1954; B16 (2): 175-185.

11. Fieller E.C. The distribution of the index in a bivariate normal distribution. Biometrika, 1932; 24 (3-4): 428-440.

12. HersonJ. Fieller's Theorem vs. the Delta for significance intervals for ratios. J. Statist. Comput. Simul., 1975; 3: 255-274.

13. Efron B. Bootstrap methods: Another look at the jackknife. Annal-sofStatistics, 1979; 7: 1-26.

14. Диаконис П., Эфрон Б. Статистические методы с интенсивным использованием ЭВМ. URL: http://www.boot-strap.spb.ru/ page.php?id=20

15. Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ. - М.: Мир, 1982. - С. 77-80.

Сведения об авторах:

Симонов Анатолий Никифорович

руководитель Лаборатории доказательной медицины и биостатистики научного центра психического здоровья РАМН, канд. биол. наук

Адрес для переписки:

115522, Москва, Каширское шоссе, д. 34

Телефон: +7 (909) 699-5692

E-mail: [email protected]

Реброва Ольга Юрьевна

профессор кафедры медицинской кибернетики и информатики РНИМУ им. Н.И. Пирогова, д-р мед. наук

Адрес для переписки:

117335, Москва, а/я 88 Телефон: +7 (495) 545-0927 E-mail: [email protected]

RESEARCH. ANALYSIS. EXPERTISE

Methodology

Confidence Bootstrap Intervals for Clinical Economical Estimates

A.N. Simonov1, O.Yu. Rebrova2

Incremental cost-effectiveness ratio (ICER) is often calculated in cost-effectiveness analysis of two methods of treatment. To make correct inferenceit is not enough to get the point estimate of the ratio, confidence intervals should also be constructed. Three methods for constructing confidence intervals for the ICER are described in the article - methods by Fieller, by Taylor (delta) and the bootstrap. Numerical examples are given. It is concluded that the bootstrap method is the most versatile.

KEYWORDS: bootstrap, confidence interval, incrementalcost-effectiveness ratio, clinical and economic analysis, Fieller, Taylor, delta method.

<

n s

I-

o.

Ш

с

о *

о

о

s ц

<

X

<

I

к

<

со о d

ш ^

о о

41

i Надоели баннеры? Вы всегда можете отключить рекламу.