Психология. Журнал Высшей школы экономики, 2005, Т. 2, № 1, с. 86-92.
БЛЕСК И НИЩЕТА ТЕОРЕТИЧЕСКОЙ ПСИХОЛОГИИ (О ПРОБЛЕМЕ ЭМПИРИЧЕСКОЙ ДОСТОВЕРНОСТИ НАУЧНОГО ФАКТА)
А.Д. НАСЛЕДОВ
Наследов Андрей Дмитриевич — доцент факультета психологии СПбГУ, кандидат психологических наук.
Область научных и педагогических интересов: организация и методы психологического исследования, современные методы анализа данных, история и методология психологии. Автор книг «Математические методы психологического исследования. Анализ и интерпретация данных» (2004), «SPSS: Компьютерный анализ данных в психологии и социальных науках» (2004). Контакты: [email protected]
Резюме
Автор акцентирует внимание на том, что актуальная методологическая проблема отечественной психологии вовсе не в способах эмпирической аргументации теоретических построений, и даже не в соотношении эмпирического факта и теории. Прежде чем приступать к обсуждению подобных проблем, следует установить критерии достоверности эмпирических фактов. Но поскольку фактом в психологии является результат эмпирического и статистического обобщения, то вполне уместен вопрос о корректности такого обобщения. И главная проблема, с точки зрения автора, заключается в том, что в силу сложившихся традиций отечественная психология нечувствительна к некорректным способам эмпирического обобщения. В результате становится бессмысленной любая теоретическая дискуссия, так как эмпирические факты перестают быть аргументами.
С самого начала признаю, что текст В.М. Аллахвердова «Блеск и нищета эмпирической психологии...» воспринят мною с большим интересом и, не скрою, с воодушевлением. И главное его достоинство видится мне не столько в попытке решения заявленной проблемы, сколько в самой ее постановке (впрочем, это типично для теоретиков). Да, методо-
логическая культура нашей науки оставляет желать лучшего. Действительно, если развитие науки — это борьба конкурентных теорий (К. Поп-пер, Т. Кун) или научных программ (И. Лакатос), то сама возможность конкуренции предполагает наличие единого и неопровержимого методологического основания. Это основание, находясь в развитии, должно
быть более долговременным и устойчивым, чем конкурирующие теории. Без надежного методологического основания психология обречена оставаться экстенсивно возрастающей грудой несопоставимых теорий, ценность которых не поддается проверке. (Есть плюс в таком положении дел: любое объяснение сойдет за теорию на страницах книги или диссертации.)
С точки зрения психолога-теоретика самое интересное и важное — это объяснение фактов, их соотнесение с теорией, а получение этих фактов — дело техники. Такая позиция теоретика — дань средневековой традиции, прочно укоренившейся в обыденном и научном сознании: вверху — разумное, вечное, внизу — бесформенное, тленное. Соответственно высший уровень психологии — теоретический, низший — методический. Этот низший уровень якобы уже и не психология вовсе, а техника, логика и математика. Но простите, господа теоретики, вы сами себе противоречите: ведь этот «низший» уровень и есть та самая основа, на которой разворачивается конкуренция теорий (программ), то «более устойчивое и неопровержимое основание», на котором и благодаря которому эти теории умирают и появляются. Прежде чем рядиться в латы «неопровержимых» аргументов, теоретик должен избавиться от сомнений в истинности фактов, составляющих основу его аргументов. Иначе «король»-теоретик так и останется голым.
И вот с точки зрения такой методологической основательности некоторые положения текста В.М. Аллах-вердова требуют уточнения. На мой взгляд, встречающиеся в тексте не-
точности имеют один источник, заключенный в двусмысленности заголовка «О правилах описания непосредственно наблюдаемых эмпирических явлений» (что еще мы можем непосредственно наблюдать, может быть, внеэмпирические явления?). Далее, правда, выясняется, что имеются в виду непосредственно наблюдаемые исследователем факты, что еще более запутывает дело, так как последние запросто отождествляются автором с научными фактами. Приняв это просто за терминологическую ошибку, я поставил бы здесь точку, привычно избегая метафизических рассуждений. Однако за этим последовали уже неточности, касающиеся организации эмпирического исследования, в том числе применения статистических методов. А это уже вызов, на который не ответить я не могу.
Наука имеет дело не с «непосредственно наблюдаемыми явлениями», а с научными фактами, что не одно и то же. Время реакции испытуемого N. на стимул 8 можно рассматривать как факт и даже как непосредственно наблюдаемое явление (с некоторой натяжкой, правда: ведь для этого обычно используются приборы). Но является ли этот факт научным, представляет ли он какой-либо интерес для науки? И даже тот факт, что время реакции испытуемого N. на стимул 81 меньше, чем на стимул 8, не является научным. Это фрагмент исходных данных, единичный случай, который наряду с другими случаями может служить материалом для получения научного факта. Такого, например: время лексического решения короче, если слово-стимул идентично по контексту предшествующему
стимулу. Или более «жизненный» пример — факт убийства с целью ограбления. Является ли он научным? Нет. Он может стать единицей исходных данных для проверки гипотезы о том, что на вероятность убийства влияет социальная (или генетическая) дистанция между убийцей и его жертвой. Если гипотеза подтвердится, результат обретет статус научного факта. Отдельный случай, особенно второй, тоже может стать основой психологического труда, правда, в форме литературного произведения (может быть, даже конкурирующего с «Преступлением и наказанием» Ф.М. Достоевского).
Сознательно оставляю в стороне интригующие теоретиков проблемы причинно-следственного и прочего соотношения факта и теории, в частности необходимость разделения факта (научного) и его интерпретации, но обращаю внимание на очевидное несовпадение «непосредственно наблюдаемого явления» и научного факта, даже когда за научный факт принимается отдельный случай. Правда, согласитесь, описание отдельного случая в психологии чаще используется в дидактических и иллюстративных целях, нежели для аргументации (в качестве научного факта). Отчасти в силу неизбежной предвзятости восприятия «непосредственно наблюдаемого явления», но главное, из-за изменчивости этого явления от случая к случаю для аргументации в науке используются результаты количественных обобщений. Главная проблема научного факта в психологии как раз и заключается в том, что он (факт) обычно является результатом эмпирического и статистического обоб-
щения некоторого множества отдельных случаев. (Одна из проблем — расхожее заблуждение: любой результат эмпирического и статистического обобщения есть научный факт.)
Проблема научного факта как результата хоть и эмпирического, но обобщения — справедливое сомнение в корректности этого обобщения. Я бы выделил три источника такого сомнения: 1) некорректная организация и (или) идентификация процедуры исследования (сбора данных), неполное или искаженное ее описание; 2) неправильное применение статистических методов и (или) некорректная констатация получаемых результатов; 3) подмена содержательного (эмпирического) и операционального описания факта его интерпретацией в терминах теории и содержательной гипотезы. Подчеркну, что эти источники сомнения являются независимыми и достоверность факта должна подтверждаться в каждом из трех аспектов. Рассмотрим с изложенных позиций некоторые положения, высказанные В.М. Аллах-вердовым.
«Проблема непосредственности» является скорее не методологической, а дидактической. Аргументами (научными фактами) являются в психологии, как правило, эмпирические обобщения. Правда, сам факт эмпирической обоснованности утверждения не гарантирует его достоверности (см. три источника сомнения в истинности факта), а ссылки на «очевидно наблюдаемые явления» должны использоваться в качестве иллюстраций, а не аргументов, и иллюстративный характер этих ссылок необходимо выделять.
«Проблема выбора» вряд ли достойна отдельного упоминания. Ничего страшного, если автор не может внятно выразить свою мысль, правильно подобрав аргументы: этим он вредит только себе. Гораздо опаснее умышленно или нет выдать за достоверный научный факт результат исследования, страдающий хотя бы одним из трех указанных выше недостатков.
«Проблема вычленения» должна решаться с учетом изменчивости изучаемых явлений. Обычно до начала исследования неизвестны ни причины, ни диапазон этой изменчивости. Поэтому исходно исследователь должен планировать исследование так, чтобы учесть (путем измерения, контроля и рандомизации) максимально возможное число причин изменчивости и произвести измерения с максимально доступной точностью. Далее в ходе статистического анализа данных он получит возможность отсечь несущественные причины. Те же эффекты (причины изменчивости), которые оказались значимыми, если их надежность не вызывает сомнения, следует обязательно отразить в отчете (как факты, в терминах измерений). Конечно, для интерпретации исследователь среди этих результатов должен выбирать только те, которые соответствуют теме исследования, позволяя себе отмечать остальные результаты как побочные. Таким образом, каждый этап исследования будет «страдать» избыточностью, убывающей от начала к концу. Эта избыточность может дать ценный материал для последующих исследований.
«Проблема перевода факта на язык описания» относится к третьему
из указанных источников сомнения в факте. Решается эта проблема вовсе не путем «специальной проверки» автором своего текста на предмет «заметных искажений в сторону удовлетворяющей его интерпретации» (последние неизбежны). Автор должен очень четко отдельно дать операциональное определение факта (на языке измерений и статистического анализа) и только затем — его интерпретацию. Обычно этого не умеют или не хотят делать, интерпретируя статистические показатели сразу в терминах содержательной гипотезы. В результате практически невозможно отделить объективную и субъективную составляющие научного факта.
«Классификация явлений» — первый шаг в любой умственной деятельности, в том числе исследовательской. Само измерение в психологии чаще основано на классификации явлений (например, людей по полу), но то, что большинство психологических исследований ограничивается классификацией признаков и явлений на основе их связей,— один из недостатков существующей методологии. Ведь основное назначение любой науки — установление причинно-следственных отношений между явлениями, а наличие статистической связи между ними — хоть и необходимое условие наличия таковых, но вовсе не достаточное. Для того чтобы утверждать, что А является причиной Б, необходимо обосновать: 1) временную последовательность событий (А раньше Б); 2) статистическую связь А и Б; 3) отсутствие правдоподобной альтернативной интерпретации появления Б помимо А (Кэмпбелл, 1980). Третье условие — самое сложное, так как
статистическая связь (совместная изменчивость) А и Б может быть следствием влияния третьей переменной В (корреляция длины стопы и интеллекта может быть следствием разного возраста испытуемых). Именно поэтому в силу обилия возможных альтернативных объяснений результаты корреляционного исследования всегда ущербны. Для установления причинно-следственных связей применяется эксперимент, который и отличается от корреляционного исследования контролем внешних и прочих переменных — возможных источников тех самых альтернативных интерпретаций, и один из недостатков существующей методологии заключается в том, что сплошь и рядом экспериментальные исследования подменяются корреляционными или результаты последних выдаются за экспериментальные в том смысле, что на их основе смело делаются причинно-следственные выводы, выдаваемые за научные факты («невинная», казалось бы, замена термина «вероятностная связь, корреляция» на интуитивно более понятное словосочетание «зависимость от...»). Налицо явное наличие первого из перечисленных мной источников недостоверности факта.
Но это еще полбеды. Каждое корреляционное исследование в силу своей простоты включают в себя установление множества связей, что неизбежно ставит проблему многократной статистической проверки гипотезы. Об этой проблеме пишет В.М. Аллахвердов: из 100 корреляций 5 будут «статистически досто-
верными» (на уровне р < 0.05), даже если связей на самом деле нет. Это особая проблема статистики, которая обязательно должна решаться в рамках каждого такого исследования, что мы, разумеется, встречаем редко. Кстати, корреляционное исследование не обязательно сводится к подсчету корреляций. Часто берутся две (три, четыре) группы испытуемых, и различие между ними определяется по множеству измеренных показателей, скажем, по ^критерию Стьюдента. Многократное применение последнего в конце концов гарантированно позволяет получить «статистически достоверные» различия, столь же ненадежные и недостоверные, как и при корреляционном анализе (по тем же причинам)1. (Далее дело техники: подогнать исходные гипотезы под «статистически достоверные» результаты, добавить немного фантазии при обсуждении результатов, и — ура! — диссертация готова.)
Указанные недостатки существующей методологии могут навести на мысль: само по себе применение сложных организационных (экспериментальных) и статистических процедур для эмпирического обобщения данных является источником недостоверности получаемых фактов. А посему, мол, психология должна ограничиться строгими лабораторными экспериментами, позволяющими полностью контролировать все источники изменчивости и, следовательно, полностью исключающими «статистический произвол». Близок к такому выводу и В.М. Аллахвердов,
1Способы решения проблем многократной проверки гипотез, как и проблем выбора статистического метода, предложены в книге: Наследов, 2004.
судя по содержанию раздела его статьи «Эмпирическое обобщение данных с помощью методов математической статистики». (Я не рассматриваю другой распространенный, но еще менее приемлемый вывод: «долой количественные методы, да здравствует здравый смысл отдельного случая».) Еще раз повторю: источником недостоверности эмпирических обобщений являются не сами применяемые организационные и статистические методы исследования, а некорректность: а) их применения; б) их интерпретации. А ведь даже для среднего значения существуют ограничения на применение и интерпретацию2, с которыми, кстати, часто не считаются, приводя примеры бессмысленного усреднения. Конечно, чем сложнее статистическая процедура, тем выше вероятность ее некорректного применения и интерпретации. Между тем сложные статистические процедуры, такие, как дисперсионный анализ, позволяют вычленять сразу множество источников изменчивости данных, что позволяет выйти за рамки простейшего лабораторного эксперимента, сделать эксперимент более «экологически валидным», проводить многофакторные исследования, в том числе «квазиэкспериментальные» и «в естественных условиях». Поэтому вряд ли оправданно утверждение В.М. Аллахвердова: «При эмпирическом обобщении данных из всех способов статистической обработки лучше начинать с самого простого». Скорее, следует планировать
исследование с учетом, с одной стороны, возможных источников изменчивости данных, с другой — понимания и доступности статистических процедур последующего их анализа, а сами эти статистические процедуры и последовательность их применения определять, исходя из структуры и особенностей получаемых данных. Бездумное же применение типичных планов эмпирического исследования, основанных на привычных схемах обработки любых данных (корреляционный анализ, сравнение средних по ^критерию и пр.), как раз и приводит к тому, что, как пишет В.М. Аллахвердов, «эмпирическое обобщение, полученное в результате статистической обработки данных, является внеэмпирической интерпретацией». Конечно, подобного рода «интерпретация», именно в силу того, что она уже внеэмпириче-ская, спекулятивная, вряд ли достойна того, чтобы «независимо проверяться».
В заключение отмечу, что текст «методологического манифеста» свидетельствует об осознании его автором глубины существующей методологической пропасти. Соглашаясь в целом с духом «манифеста» и с большей частью его содержания, я сделал попытку продемонстрировать сложность и глубину некоторых из обозначенных В.М. Аллахвердовым проблем. Я обратил внимание на то, что актуальная методологическая проблема нашей психологии вовсе не сводится к извечному с точки зрения теоретиков и теорий сомнительному
2Среднее как мера центральной тенденции для изучаемого явления имеет смысл в той мере, в какой усредняемые данные позволяют судить об изменчивости этого явления (дисперсии и формы распределения).
статусу любого научного факта (Д. Юм, К. Поппер, Т. Кун, Д. Кэмп-белл). Гораздо важнее на сегодняшний день отчетливое определение критериев эмпирической достоверности самого факта как результата эмпирического обобщения. Без этого любое обсуждение статуса факта «пред лицом» теории, любая «конкуренция теорий» становятся бессмысленными. Говоря словами Д. Кэмп-белла, «наши нынешние стандарты экспериментальных планов представляют собой научное достижение, эмпирический продукт, а не дарованную логикой милость. доступные коррекции "истины", а не истины логические или аналитические» (Кэмпбелл, 1980, с. 200). Главные методологические проблемы, таким образом, сосредоточены именно в сложившихся стандартах, техниках эм-
пирических исследований, прежде всего — в средствах эмпирического обобщения. Понятно, что одним только текстом «манифеста» (даже снабженного моими замечаниями!) эти проблемы не решить. Тем более учитывая, что речь идет о методологической культуре, носителем которой является большинство нашего научного сообщества. Эта культура основана на традициях, сложившихся еще в те времена, когда эмпирический подход благодаря Б.Г. Ананьеву и его единомышленникам делал первые шаги в психологии. Не хотелось бы, чтобы неизменность этих традиций, лежащих в основе нынешней методологии, служила подтверждением тезиса: величие ученого определяется тем, насколько долго его авторитет препятствует дальнейшему развитию науки.
Литература
Наследов А.Д. Математические методы психологического исследования. Анализ и интерпретация данных. СПб., 2004.
Кэмпбелл Д. Модели экспериментов в социальной психологии и прикладных исследованиях. М., 1980.