УДК 159.9.075 А. Д. Наследов
Вестник СПбГУ. Сер. 12. 2011. Вып. 1
СТРУКТУРНОЕ МОДЕЛИРОВАНИЕ КАУЗАЛЬНЫХ ГИПОТЕЗ:
ИССЛЕДОВАНИЕ ПЕДАГОГИЧЕСКИХ СТЕРЕОТИПОВ ОЦЕНИВАНИЯ МЛАДШИХ ШКОЛЬНИКОВ1
Структурное моделирование (СМ), точнее, моделирование структурными уравнениями (SEM, Structural Equation Modeling) — дедуктивный метод проверки априорных гипотез на их соответствие эмпирическим данным. Гипотезы формулируются в терминах направленных связей между переменными: явными (измеренными) и латентными (гипотетическими конструктами). Переменные и связи между ними графически и наглядно изображаются в виде блок-схемы, которая при помощи компьютерной программы СМ (AMOS [1], EQS [2] и пр.) трансформируется в систему линейных регрессионных уравнений (допустима и обратная трансформация). Программное обеспечение СМ позволяет оценить степень соответствия модели исходным данным и параметры модели, такие, например, как регрессионные и корреляционные коэффициенты. Модель признается состоятельной (подтверждающей исходные гипотезы), если она по принятым критериям соответствует исходным данным, а параметры модели являются статистически достоверными.
СМ находит все более широкое применение в зарубежной психологии: к 2003 г. количество ссылок на его применение в APA PsycInfo сравнялось с частотой упоминания наиболее популярного до той поры статистического метода ANOVA [6]. Только в период с 1997 до 2004 гг. число публикаций с использованием этого метода возросло почти в 2 раза [10]. СМ — результат развития и интеграции нескольких предшествующих методов: регрессионного, факторного и дисперсионного анализа. В настоящее время СМ в зарубежной литературе является общим понятием для тех более частных моделей, которые включают в себя направленные связи между переменными, непосредственно не измеримые конструкты (как латентные переменные) и потенциальные ошибки измерения [4; 5]. Активно обсуждаются возможности применения СМ для проверки каузальных гипотез [3; 6]. В отечественной психологии СМ применяется крайне редко. Важные методологические проблемы применения СМ освещены Е. Григоренко [7; 8] и О. Митиной [10; 11], но лаконично, в рамках статей. Остаются открытыми ключевые вопросы: может ли СМ действительно являться инструментом для определения не только связи между изучаемыми конструктами, но и ее направления; при каких условиях это возможно?
Возможности применения СМ для проверки каузальных гипотез иллюстрируются далее на эмпирическом материале исследования стереотипов психолого-педагогиче-ского оценивания младших школьников. В предшествующем исследовании на выборке, состоявшей из 44 учителей и 353 их учеников, проверялись гипотезы о том, что на педагогическую оценку учебной успешности (отметку) и личности младших школьников оказывают влияние такие внеучебные факторы, как пол ученика, стаж, возраст и некоторые особенности личности учителя. Были выявлены корреляции между этими
1 Исследование выполнено при поддержке гранта РФФИ № 07-06-00047 (руководитель А. Д. Наследов).
© А. Д. Наследов, 2011
переменными [12]. Однако оставались открытыми вопросы о направлении связей. Для ответа на них предполагалось увеличить выборку и с применением СМ проверить две альтернативные модели, учитывая направления связей: а) отметка детерминирует оценку личности ученика; б) оценка личности ученика влияет на отметку.
Организация и методы исследования
В ходе исследования были опрошены 90 учителей 2-4-х классов средних школ Санкт-Петербурга. Каждый учитель отвечал на вопросы анкеты для самооценки (29 показателей) и по 5 методикам оценивал от 5 до 10 своих учеников (суммарно по 134 показателям каждого). Кроме того, фиксировалась успеваемость учеников за последнюю четверть. В итоге была составлена база исходных данных, содержащая результаты опроса 90 учителей (женщин) в отношении себя и 468 учеников. Список методик приведен ниже.
1. Методики педагогической оценки личности ученика (их описание — в [9; 12]):
— «Невербальная коммуникация»;
— «Коммуникативный образ ученика»;
— «Личностное поведение»;
— «Реактивности»;
— «Коммуникативная адаптация в школе».
2. Отметка для ученика за последнюю четверть.
3. Анкета для педагога, включающая 22 вопроса методики диагностики синдрома «выгорания» [13, с. 276-282], к которым были добавлены 3 вопроса для диагностики «ло-куса субъективного контроля», вопросы о возрасте, стаже, классе, предмете.
Предварительный анализ и преобразование данных
Был проведен факторный анализ 25 показателей самооценки 90 учителей, с интерпретацией факторов и последующим вычислением факторных оценок. Выделены 4 фактора, первые 3 из которых совпадают по содержанию со шкалами исходного опросника [13, с. 276-282]: «эмоциональное истощение»; «личная эффективность», «деперсонализация», «локус контроля». Для проверки факторной валидности опросника был проведен конфирматорный факторный анализ, подтвердивший хорошее соответствие 4-факторной структуры исходным данным: %2 = 200,888; df = 183; p = 0,173; RMSEA = 0,033.
С целью снижения размерности данных педагогической оценки личности учеников был проведен факторный анализ каждой из четырех методик, с интерпретацией факторов и последующим вычислением факторных оценок (методика «Реактивность» одношкальная, поэтому не факторизовалась). В результате 134 переменных 5 методик педагогической оценки учащихся для дальнейшего анализа были заменены 14 переменными.
Далее следовало исключить часть дисперсии педагогических оценок, обусловленной индивидуальными различиями между учениками. Для этого данные агрегировались по учителям: оценки учеников усреднялись для каждого учителя с учетом пола ученика. В итоге каждому учителю соответствовали два ряда усредненных оценок — для мальчиков и для девочек (если он оценивал учеников одного пола, то один ряд).
В итоге преобразования исходные данные содержали N = 118 строк и Р = 22 столбцов-переменных: для учителей — возраст, стаж, 4 фактора самооценки; для учеников — пол, отметка, 14 показателей педагогической оценки личности.
Моделирование структурными уравнениями
Структурное моделирование — это формирование модели с последующей ее проверкой на соответствие исходным данным при помощи компьютерной программы (в нашем случае — AMOS 18). По результатам проверки в модель вносятся изменения, и процесс продолжается до получения наилучшего соответствия.
Модель представляет собой блок-схему, которая преобразуется компьютерной программой в систему линейных уравнений (возможен и обратный путь). Основные элементы модели (см. рис. 1-3) — переменные (явные, латентные, ошибки измерения) и связи между ними (направленные и ненаправленные). Явные переменные представлены в исходных данных и изображаются в прямоугольных контурах. Латентные переменные — гипотетические конструкты — изображаются в округлых контурах, обозначаются буквой F, и не представлены в исходных данных. Они аналогичны факторам в факторном анализе. Предполагается, что они влияют на явные переменные. Если явная или латентная переменная является зависимой (на нее влияют другие переменные), то в модель включается ошибка ее оценки, которая изображается в округлых контурах и обозначается буквой е. Связи между переменными могут быть направленными (причинно-следственными) или ненаправленными (корреляционными, ковариационными), они изображаются, соответственно, одно- или двунаправленными стрелками.
Структурная модель (СМ) — общее понятие, включающее в себя модели измерения и модели путей [4; 5]. Измерительная СМ, или конфирматорный факторный анализ, может использоваться самостоятельно, например, для проверки результатов исследовательского (традиционного) факторного анализа (см. рис. 1). Такая СМ связывает латентные переменные и их индикаторы (явные переменные). СМ путей служит для проверки последовательности направленных связей между переменными (явными). Часто эти две разновидности представляют собой составные части одной сложной СМ, как в нашем случае (см. рис. 2-3). Если это так, то моделирование целесообразно начинать с проверки состоятельности измерительной СМ, к которой в дальнейшем надстраивается СМ путей.
В процессе проверки соответствия СМ исходным данным производится оценка основных параметров модели (регрессионных коэффициентов, корреляций, ковариаций) и вычисление модельной корреляционной (ковариационной) матрицы, которая сравнивается с эмпирической матрицей. Это итерационная процедура (метод наименьших квадратов или максимального правдоподобия), которая заканчивается при достижении минимально возможного расхождения теоретической (модельной) и эмпирической матриц. Для оценки величины этого расхождения вычисляется большое количество показателей соответствия, среди которых наиболее часто используются следующие (в скобках указаны значения, подтверждающие состоятельность модели [1; 2; 4; 5; 10]):
— критерий х2 для оценки статистической значимости расхождения теоретической и эмпирической матриц корреляции или ковариации (p > 0,05);
— соотношение x2/df (не более 2);
— GFI — индекс согласия (GFI > 0,95):
— CFI (Comparative Fit Index) — индекс сравнительного соответствия (CFI > 0,95);
— RMSEA (root mean-square error of approximation) — среднеквадратическая ошибка аппроксимации (RMSEA < 0,05, для больших выборок < 0,08).
Исходная модель редко соответствует эмпирическим данным и неоднократно модифицируется путем добавления/исключения переменных и связей. Для этого могут
использоваться индексы модификации (M. I., Modification Index) которые вычисляются программой AMOS для связей, добавление которых улучшит соответствие модели данным [1; 5]. Если эти индексы не вычислены программой (ниже установленного порога), то единственный способ улучшить модель при данном наборе переменных — исключить статистически недостоверные связи. В том случае, когда показатели соответствия демонстрируют состоятельность модели, она может интерпретироваться с учетом оцененных статистически достоверных регрессионных коэффициентов и корреляций.
Результаты
Предварительный факторный анализ 14 показателей педагогической оценки личности учащегося выявил 3 фактора. Поэтому на первом этапе структурного моделирования строилась измерительная модель оценки личности ученика — проводился конфир-маторный (подтверждающий) факторный анализ [4]. Этот анализ позволяет уточнить результаты исследовательского (традиционного) факторного анализа, исключив неопределенность в отношении количества факторов, их коррелированности и входящих в них переменных. В итоге была построена измерительная модель, представленная на рисунке 1. Все показатели соответствия свидетельствуют об адекватности модели исходным данным. Модель так же хорошо согласована отдельно для выборок оценок мальчиков (без изменений) и девочек (при добавлении корреляции ошибок е2 и е23). Все оценки
X2 = 12,68; df = 9; p = 0,180; X2/df = 1,404; GFI = 0,97; CFI = 0,99; RMSEA = 0,050
Рис. 1. Измерительная модель педагогической оценки личности учащегося
регрессионных коэффициентов, корреляций и ковариаций статистически достоверны (p < 0,01).
Фактор F1 («реактивность») включает такие оценки ученика (с отрицательным знаком), как его организованность, любознательность, стремление к успеху, эмоциональная устойчивость, высокий самоконтроль, уверенность в себе и т. д. Положительный полюс фактора характеризуется низкими оценками этих показателей.
Фактор F2 («нормативность») на положительном полюсе имеет высокие оценки ученика по показателям: аттракция (честность, скромность, аккуратность, вежливость), нормативность, отрицательное доминирование над сверстниками (с обратным знаком).
Отметим, что эти факторы, вследствие агрегирования данных по учителям, характеризуют не различия между детьми, а индивидуальное своеобразие отношений учителей к детям. Учителя различаются между собой по этим двум общим отрицательно коррелирующим направлениям педагогического оценивания. Если учитель склонен завышать реактивность учеников, то он занижает и их нормативность (или наоборот).
Далее в модель включались отметка (усредненная по учителям) и переменные, в соответствии с исходными гипотезами влияющие на педагогическое оценивание: пол ученика, возраст и стаж учителя, факторы его самооценки. При включении в модель каждой переменной учитывались ее корреляции с остальными переменными, в том числе с факторами измерительной модели (их оценки вычислялись программой AMOS, процедура Imputatin). Переменные, для которых корреляции с другими переменными статистически недостоверны, не включались в модель. Корреляции переменных приведены в таблице 1.
Таблица 1. Корреляции основных переменных модели (N = 118)
??? F1 F2 ж) § ^ Отметка Эмоц. истощ. (учитель) Деперсо- нализация (учитель)
F1 r 1 -0,383** 0,245** -0,762** 0,299** 0,147
Р 0,000 0,007 0,000 0,001 0,113
F2 r -0,383* 1 -0,234* 0,326** -0,249** -0,191*
p 0,000 0,011 0,000 0,007 0,038
Пол (1-м, 2-ж) r 0,245* -0,234* 1 -0,208* -0,020 -0,069
p 0,007 0,011 0,024 0,832 0,456
Отметка r -0,762** ,326** -0,208* 1 -0,322** -0,095
p 0,000 0,000 0,024 0,000 0,308
Эмоц. истощ. (учитель) r 0,299* -0,249** -0,020 -0,322* 1 -0,118
p 0,001 0,007 0,832 0,000 0,203
Примечание: 1.** — Корреляция значима на уровне 0,01 (2-сторон.).
2. * — Корреляция значима на уровне 0,05 (2-сторон.).
Корреляция как мера взаимосвязи между двумя переменными не является адекватной мерой направленной связи между ними, если учитывается их связь с другими переменными. Для оценки направленной связи в этом случае используют регрессионные коэффициенты в рамках традиционного множественного регрессионного анализа. Однако он бесполезен, если в модели предполагается более одной зависимой переменной, здесь незаменим метод моделирования структурными уравнениями.
Основная проблема при включении переменных в СМ — определение направления связи между ними. И если правдоподобие направления связи между некоторыми переменными не вызывают сомнения (например, пол ученика ^ отметка), то направление других связей не столь очевидно. Поэтому параллельно строились две альтернативные модели, отличающиеся направлением связи между переменными отметка и П: основная (рис. 1) и альтернативная (рис. 2). Исходно две модели отличались только направле-
Цифры: у стрелок — регрессионные веса, у переменных — R2 для зависимых переменных. X2 = 45,87; df = 37; р = 0,150; = 1,24; GFI = 0,936; CFI = 0,982; RMSEA = 0,045.
Рис. 2. Основная структурная модель стереотипов педагогического оценивания младших школьников
нием этой связи, и каждая включала одинаковые правдоподобные направленные связи между переменными. При построении моделей поэтапно удалялись статистически недостоверные связи и добавлялись связи, улучшающие соответствие модели исходным данным по M.I. (индексам модификации). В итоге для каждой из двух моделей, идентичных по составу переменных, достигались следующие условия: 1) все связи статистически достоверны; 2) нет ни одной связи, добавление которой улучшило бы модель (по M.I.).
Альтернативная модель в меньшей степени соответствует исходным данным: р > 0,05, RMSEA > 0,05. Ее можно рассматривать как «вложенную» по отношению в ос-
Цифры: у стрелок — регрессионные веса, у переменных — R2 для зависимых переменных. X2 = 51,91; df = 38; р = 0,066; = 1,366; GFI = 0,929; CFI = 0,972; RMSEA = 0,056.
Рис. 3. Альтернативная структурная модель стереотипов педагогического оценивания младших школьников
новной модели: число степеней свободы для нее на 1 больше, чем основной, так как в ней отсутствует связь между F1 и F2. Следовательно, можно оценить статистическую достоверность ухудшения альтернативной модели по сравнению с основной [5]: Дх2 = 51,91 — 45,87 = 6,04; Дdf = 38-37 = 1; р < 0,05. Таким образом, альтернативная модель статистически значимо хуже соответствует исходным данным, чем основная.
Обсуждение результатов
Моделирование структурными уравнениями позволило на основании данных корреляционного исследования построить модель стереотипов педагогического оценивания младших школьников с учетом направления причинно-следственных связей (рис. 2). В соответствии с этой моделью, более вероятно, что на оценку учебной успешности существенно влияет педагогическая оценка реактивности учеников: чем выше оценивается реактивность, тем ниже учебная успешность. Величина эффекта составляет 0,66, то есть дисперсия различий между учителями в выставляемых отметках на 66% объясняется влиянием того, как они оценивают реактивность своих учеников. В свою очередь,
оценка реактивности находится под существенным влиянием оцениваемой нормативности учеников — связь отрицательная.
Педагогические стереотипы проявляются во влиянии пола учеников и самооценки учителя на оценивание прежде всего коммуникативно-поведенческих особенностей учеников, а через это — на оценивание учебной успешности. Мальчики оцениваются как менее нормативные и более реактивные, следовательно, и учебная успешность их оценивается ниже. Более высокая самооценка эмоционального истощения и деперсонализации учителя влечет за собой завышение оценки реактивности и занижение оценки нормативности учеников и, как следствие — занижение оценки их учебной успешности. Можно утверждать, что эти феномены оценивания являются именно педагогическими стереотипами, а не отражением индивидуальных коммуникативно-поведенческих и учебных особенностей учеников, так как последние были в процессе анализа нивелированы путем агрегирования (усреднения) оценок учащихся для каждого учителя.
Выводы
Применение моделирования структурными уравнениями в данном исследовании, корреляционном по организации, позволило выявить наиболее правдоподобное направление причинно-следственных связей. Отметим, что построение одной-единствен-ной структурной модели связей, даже безупречно соответствующей исходным данным, вряд ли может служить весомым аргументом для обоснования направления каузальных связей, так как всегда возможно построение альтернативной модели с иным направлением связи. Однако убедительные выводы о направлении связей на материале корреляционного исследования все же возможны, но только на основе сравнения альтернативных моделей, с последующей фальсификацией всех правдоподобных альтернатив, кроме одной.
Литература
1. Arbuckle J. L. Amos 7.0 user’s guide. Chicago, 2006. 583 p.
2. Bentler P. M. EQS 6 Structural Equations Program Manual. Encino, 2006. 418 p.
3. Bentler P. M. Can Scientifically Useful Hypotheses Be Tested With Correlations? // American Psychologist. 2007. Vol. 62, № 8. Р. 769-782.
4. Harrington D. Confirmatory factor analysis. New York, 2009. 122 p.
5. Kline R.B. Principles and practice of structural equation modeling (2nd ed.). New York, 2005. 432 p.
6. Nachtigall C., Kroehne U, Funke F., Steyer R. (Why) Should We Use SEM? Pros and Cons of Structural Equation Modeling // Methods of Psychological Research Online. 2003. Vol. 8, № 2. Р. 1-22.
7. Григоренко Е.Л. Применение статистического метода моделирования с помощью линейных структурных уравнений в психологии: за и против // Вопросы психологии. 1994. № 4. C. 108-126.
8. Григоренко Е. Л., Лабуда М. С. Моделирование с помощью LISEREL: генетическая и средовая компоненты межиндивидуальной вариативности по признаку зависимости — независимости от поля // Вопросы психологии. 1996. № 2. С. 55-71.
9. Защиринская О. В., Наследов А. Д. Психология общения младших школьников: психодиагностика: учеб. пособие. СПб., 2006. 240 с.
10. Митина О. В. Основные идеи и принципы структурного моделирования // Ученые записки кафедры общей психологии МГУ. 2006. Вып. 2. С. 272-296.
11. Митина О. В. Моделирование латентных изменений с помощью структурных уравнений // Экспериментальная психология. 2008. № 1. С. 131-148.
12. Наследов А. Д., Защиринская О. В. Феномен педагогической перцепции в контексте коммуникативного развития ученика // Вестн. С.-Петерб. ун-та. Сер. 12. Вып. 3. СПб, 2008. С. 252-261.
13. Практикум по психологии менеджмента и профессиональной деятельности / под ред. Г. С. Никифорова, М. А. Дмитриевой, В. М. Снеткова. СПб., 2001. 448 с.
Статья поступила в редакцию 20 сентября 2010 г.