Научная статья на тему 'Расчёт величины эффекта при применении непараметрических критериев сравнения выборок в психологических исследованиях с использованием программы r'

Расчёт величины эффекта при применении непараметрических критериев сравнения выборок в психологических исследованиях с использованием программы r Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
829
113
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
EFFECT SIZE / NONPARAMETRIC STATISTICS / RANK TESTS / MANN-WHITNEY TEST / WILCOXON SIGNED-RANK TEST / KRUSKAL-WALLIS TEST / FRIEDMAN TEST / MATH STATISTICS / R STATISTICAL SOFTWARE / ВЕЛИЧИНА ЭФФЕКТА / НЕПАРАМЕТРИЧЕСКАЯ СТАТИСТИКА / РАНГОВЫЕ КРИТЕРИИ / КРИТЕРИЙ МАННА-УИТНИ / КРИТЕРИЙ УИЛКОКСОНА / КРИТЕРИЙ КРАСКАЛА-УОЛЛИСА / КРИТЕРИЙ ФРИДМАНА / МАТЕМАТИЧЕСКАЯ СТАТИСТИКА / СИСТЕМА СТАТИСТИЧЕСКОГО АНАЛИЗА R

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Куприянов И. В.

Рассматривается актуальность применения методов расчёта величины эффекта при проведении статистического анализа результатов психологических исследований и ограниченность применимости уровня статистической значимости; приводятся методики расчёта величины эффекта при использовании распространённых непараметрических критериев сравнения выборок и реализация этих методик с помощью функций для системы статистического анализа R. Отмечаются преимущества системы R по сравнению с другими пакетами для статистической обработки и возможность использования её в образовательном процессе.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Куприянов И. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Calculation of the effect size when using nonparametric tests for comparing samples in psychological research using the R software

The limitations of statistical significance in psychological research become more and more obvious. On the contrary the effect size reporting in scientific papers is now a common practice as it shows the practical significance of the research. Various methods of computing the effect size exist, but many of them are not represented in popular statistical software. The using of the R statistical software for educational and scientific purposes is suggested, as it is free and open-source, and user functions for different purposes can easily be written. Four R functions for computing the effect size for rank comparison tests of samples are proposed.

Текст научной работы на тему «Расчёт величины эффекта при применении непараметрических критериев сравнения выборок в психологических исследованиях с использованием программы r»

Расчёт величины эффекта при применении непараметрических критериев сравнения выборок в психологических исследованиях с

использованием программы R

И.В. Куприянов Южный федеральный университет, Ростов-на-Дону

Аннотация: Рассматривается актуальность применения методов расчёта величины эффекта при проведении статистического анализа результатов психологических исследований и ограниченность применимости уровня статистической значимости; приводятся методики расчёта величины эффекта при использовании распространённых непараметрических критериев сравнения выборок и реализация этих методик с помощью функций для системы статистического анализа R. Отмечаются преимущества системы R по сравнению с другими пакетами для статистической обработки и возможность использования её в образовательном процессе.

Ключевые слова: величина эффекта, непараметрическая статистика, ранговые критерии, критерий Манна-Уитни, критерий Уилкоксона, критерий Краскала-Уоллиса, критерий Фридмана, математическая статистика, система статистического анализа R.

Уровень статистической значимости p, представляющий собой вероятность получить имеющийся или более сильно выраженный результат эмпирического исследования в случае, если верна нулевая гипотеза H0, давно и широко используется для подтверждения достоверности проведённого психологического исследования. Однако в то же время всё более очевидной становится ограниченность этого показателя и невозможность использовать одну лишь статистическую значимость для выводов о таких характеристиках, как воспроизводимость результатов исследования или степень выраженности изучаемого явления. Уделение излишнего внимания статистической значимости и некорректное использование этого показателя в научных, в том числе психологических исследованиях, рассматривалось во многих работах, среди которых можно выделить часто цитируемую статью Дж. Коэна "The Earth Is Round (p<.05)", отмечавшего, в частности, что метод проверки значимости нулевой гипотезы не только не способствовал развитию психологии как науки, но и серьёзно тормозил его[1].

В противовес этому всё большее внимание уделяется практической или научной значимости, которая может быть измерена таким показателем, как величина эффекта, т.е. количественная характеристика степени выраженности наблюдаемого в эксперименте эффекта или силы взаимосвязи изучаемых явлений. С другой стороны, величина эффекта может рассматриваться как характеристика соответствия теоретической модели изучаемого явления данным эксперимента или наблюдения (например, при проведении дисперсионного или регрессионного анализа)[2].

Существуют разные подходы к расчёту величины эффекта в зависимости от выбранной методики статистической обработки результатов исследований. Так, ещё в 1924 году Р. Фишером было предложено использование показателя величины эффекта п (эта-квадрат, отношение объяснённой межгрупповыми различиями дисперсии к общей дисперсии выборки) при дисперсионном анализе[2].

Всё больше научных журналов, в т.ч. и психологических, требуют указания величины эффекта в публикуемых статьях. Методика расчёта величины эффекта является, таким образом, актуальным вопросом психологических исследований.[2,3]. При этом в таких популярных статистических программах, как SPSS и STATISTICA, расчёт величины эффекта для многих методик не предусмотрен.

Для проведения расчёта величины эффекта в связи с этим предлагается использовать свободно распространяемую среду статистической обработки R, имеющую ряд преимуществ по сравнению с другими статистическими программами [4]. К числу таких преимуществ можно отнести лицензию программы, допускающую её свободное и бесплатное распространение, наличие многочисленной литературы, в том числе на русском языке [5, 6]. Ещё одним преимуществом является лёгкость создания и применения пользовательских функций. Всё это делает

возможным выбор компьютерного пакета R в качестве средства для обучения будущих психологов методам статистической обработки данных, что позволит развить их компьютерные навыки и обучить применению на практике современных методов статистического анализа научных данных, в то же время избавив от необходимости ручных математических вычислений, повысить профессиональную компетентность выпускников психологических факультетов [7].

Одной из наиболее обычных задач в психологии является задача сравнения двух или нескольких выборок, для чего широко используются непараметрические или ранговые критерии, не накладывающие ограничений на характер распределения данных [8]. В связи с этим для расчёта величины эффекта при применении этих критериев сравнения выборок нами были созданы следующие пользовательские функции для среды R:

Две независимые выборки. При сравнении двух независимых выборок и использовании критерия Манна-Уитни (известного также как критерий Уилкоксона-Манна-Уитни, критерий суммы рангов Уилкоксона) величина эффекта может быть рассчитана по методу Х. Вендта как показатель рангово-бисериальной корреляции [9]. Для реализации этого метода используется функция:

u.mann.whitney.effect.size <- function (x, y) {

test <- wilcox.test (x, y, paired=FALSE)

attributes (test$statistic) <- NULL

n1 <- length (x); n2 <- length (y)

w2 <- n1*n2-test$statistic

u <- min (test$statistic, w2)

effect <- 1-2*u/(n1*n2)

c (U=u, "Rank-biserial r"=effect) }

Аргументами этой функции являются два числовых вектора (выборки), а результатом вычисления -- значение критерия Манна-Уитни U и величина эффекта r, принимающая значения от 0 (полное отсутствие эффекта) до 1 (максимальная выраженность эффекта).

Две зависимые выборки. Для сравнения двух зависимых выборок используется T-критерий Уилкоксона, а величина эффекта может быть рассчитана по формуле Д. Керби [10]. Реализующая эти вычисления функция:

t.wilcox.effect.size <- function (x, y) {

test <- wilcox.test (x, y, paired=TRUE); diff <- c(x-y)

attributes (test$statistic) <- NULL

diff <- diff [diff!=0]

n <- length (diff)

ranksum <- n*(n+1)/2

statistic2 <- ranksum - test$statistic

W <- test$statistic - statistic2

effect <- test$statistic/ranksum - statistic2/ranksum

c (T=min (test$statistic, statistic2), W=W, "r rank correlation"=effect) }

Аргументы: два числовых вектора (выборки) одинакового размера. Результатом являются значения критерия T и W и величина эффекта r.

Более двух независимых выборок. Используемый в этой ситуации непараметрический критерий Краскала-Уоллиса может быть рассмотрен как непараметрический аналог дисперсионного анализа (ANOVA), и для расчёта

величины эффекта могут быть использованы аналогичные используемым в

22

дисперсионном анализе коэффициенты п и е (эта-квадрат и эпсилон-квадрат)[3]. Функция R:

kruskal.test.effect.size <- function (x, g) {

data.list <- split (x, g) test <- kruskal.test (data.list) k <- length (data.list) n <- length (x)

attributes (test$statistic) <- NULL eta.squared <- (test$statistic-k+1)/(n-k) epsilon.squared <- test$statistic/((nA2-1)/(n+1))

c (H=test$statistic, "Eta squared"=eta.squared, "Epsilon

squared"=epsilon.squared) }

Аргументы: числовой вектор (переменная) x, содержащий данные всех исследуемых выборок; равный ему по длине фактор (группирующая переменная) g, содержащий названия выборок, к которым относятся соответствующие наблюдения. Результаты: значение критерия Краскала-Уоллиса H, значение коэффициентов ц2 и s2.

Более двух зависимых выборок. В качестве критерия сравнения выборок в такой ситуации обычно используется критерий х Фридмана, а в качестве показателя величины эффекта можно использовать коэффициент конкордации W Кендалла [3], что реализовано в функции: friedman.test.w.kendall <- function (x,...) { if (is.matrix(x)) { test.data <- x } else { test.data <- cbind (x,...)} test <- friedman.test (test.data) attributes (test$statistic) <- NULL n <- nrow (test.data); k <- ncol (test.data) w <- test$statistic / (n*(k-1)) c ("Chi squared"=test$statistic, "Kendall's W"=w)

}

Аргументы: матрица, содержащая выборки с данными, либо отдельные числовые векторы (выборки) с данными одинаковой длины. Результат: значение критерия Фридмана и значение коэффициента W Кендалла.

Приведённый код функций может быть непосредственно выполнен в среде R путём простого копирования текста, после чего функции могут быть использованы так же, как и стандартные функции языка R, и применяться как в научной деятельности, так и при обучении студентов.

Литература

1. Cohen, J., 1994. The Earth Is Round (p<.05). American Psychologist, 49(12): pp. 997-1003.

2. Thompson, B., 2013. Overview of Traditional/Classical Statistical Approaches. The Oxford Handbook of Quantitative Methods. Volume 2: Statistical Analysis, New York: Oxford University Press, pp: 7-25.

3. Tomczak, M. and E. Tomczak, 2014. The Need to Report Effect Size Estimates Revisited. An Overview of Some Recommended Measures of Effect Size. Trends in Sport Sciences, 21(1): pp.19-25.

4. Куприянов И.В. Использование свободно распространяемого программного обеспечения при обучении студентов-психологов методам статистической обработки данных // Современные информационные технологии: тенденции и перспективы развития. Материалы конференции. Ростов-на-Дону: 2014. С. 245-247.

5. Мастицкий С.Э., Шитиков В.К. Статистический анализ и визуализация данных с помощью R. - Электронная книга // R: Анализ и визуализация данных URL: r-analytics.blogspot.ru/2014/12/r.html

6. Наглядная статистика. Используем R! / Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г., М.: ДМК Пресс, 2014. 298 с.

7. Нестерова А.В. Применение компьютерных технологий при обучении студентов математике // Инженерный вестник Дона, 2013, №2 URL: ivdon.ru/ru/magazine/archive/n3y2013/1956

8. Власов М.А. Статистический анализ выборок курсов валют с помощью ранговых критериев // Инженерный вестник Дона, 2013, №2 URL: ivdon.ru/ru/magazine/archive/n2y2013/1658

9. Wendt, H.W., 1972. Dealing with a common problem in Social science: A simplified rank-biserial coefficient of correlation based on the U statistic. European Journal of Social Psychology, 2(4): pp. 463-465.

10.Kerby, D.S., 2014. The simple difference formula: An approach to teaching nonparametric correlation. Innovative Teaching, 3(1). Date Views 17.05.2016 URL: amsciepub.com/doi/pdf/10.2466/11.IT.3.1.

References

1. Cohen, J., 1994. The Earth Is Round (p<.05). American Psychologist, 49(12): pp. 997-1003.

2. Thompson, B., 2013. Overview of Traditional.Classical Statistical Approaches. The Oxford Handbook of Quantitative Methods. Volume 2: Statistical Analysis, New York: Oxford University Press, pp: 7-25.

3. Tomczak, M. and E. Tomczak, 2014. The Need to Report Effect Size Estimates Revisited. An Overview of Some Recommended Measures of Effect Size. Trends in Sport Sciences, 21(1): pp. 19-25.

4. Kupriyanov I.V. Sovremennye informatsionnye tekhnologii: tendentsii i perspektivy razvitiya. Materialy konferentsii. Rostov-na-Donu 2014. pp. 245-247.

5. Mastitskiy S.E., Shitikov V.K. Statisticheskiy analiz i vizualizatsiya dannykh s pomoshch'yu R. Elektronnaya kniga. [Statistical analysis and visualization of data with R. - E-book.] R: Analiz i vizualizatsiya dannykh URL: r-analytics.blogspot.ru/2014/12/r.html

6. Naglyadnaya statistika. Ispol'zuem R! [Explicit statistics. Using R!]. Shipunov A.B., Baldin E.M., Volkova P.A., Korobeynikov A.I., Nazarova S.A., Petrov S.V., Sufiyanov V.G., M. DMK Press, 2014. 298 p.

7. Nesterova A.V. Inzenernyj vestnik Dona (Rus), 2013, №2 URL: ivdon.ru/ru/magazine/archive/n3y2013/1956

8. Vlasov M.A. Inzenernyj vestnik Dona (Rus), 2013, №2 URL: ivdon.ru/ru/magazine/archive/n2y2013/1658

9. Wendt, H.W., 1972. Dealing with a common problem in Social science: A simplified rank-biserial coefficient of correlation based on the U statistic. European Journal of Social Psychology, 2(4): pp. 463-465.

10.Kerby, D.S., 2014. The simple difference formula: An approach to teaching nonparametric correlation. Innovative Teaching, 3(1). Date Views 17.05.2016 URL: amsciepub.com/doi/pdf/10.2466/11.IT.3.1.

i Надоели баннеры? Вы всегда можете отключить рекламу.