ВЕСТН. МОСК. УН-ТА. СЕР. 7. ФИЛОСОФИЯ. 2008. № 3
НЛО. Трушкина
ГЕШТАЛЬТПСИХОЛОГИЯ И МОДЕЛИРОВАНИЕ
ИНТЕЛЛЕКТА
Вопрос о возможности моделирования интеллекта, механизмах и принципах такого процесса напрямую зависит от представления о моделируемом объекте, т.е. об интеллекте. Такие дисциплины, как психология, логика, лингвистика и философия, представляют множество отличных друг от друга моделей интеллекта. Однако не все предлагаемые модели можно даже частично смоделировать на машине. Так, к примеру, существующие философские модели познавательной деятельности в полном объеме в настоящее время почти не реализованы на практике. Психология же, напротив, достаточно часто становилась источником подобных заимствований. Модели интеллекта, которые предлагали и использовали различные психологические школы, становились образцом либо были частично заимствованы учеными, целью которых стало создание искусственного аналога человеческого интеллекта. Одним из вариантов определенного представления об интеллекте в рамках психологической науки является модель, возникшая в гештальтпсихологии. Эта модель оказала определенное влияние на ряд проектов, реализация которых направлена на решение задач построения искусственного интеллекта.
Рассмотрим выделенные гештальтпсихологами структуры интеллекта и их последующее преобразование в компьютерных науках. Для этого оказывается необходимым реконструировать представления об интеллекте, сложившиеся у представителей этого направления психологии. В данном исследовании особый интерес представляют те достижения этой школы, которые впоследствии были востребованы в рамках работ по созданию искусственного интеллекта, в первую очередь достижения в области психологии восприятия и научения.
1. Реконструкция представления об интеллекте в гештальтпсихологии
Традиционно отправной точкой развития школы гештальтпсихологии называют публикацию в 1910 г. статьи Макса Вертгейме-ра «Экспериментальные исследования видимого движения», в которой были изложены результаты исследования восприятия человеком кажущегося движения предметов1. На основании экспери-
ментальных данных, которые невозможно было объяснить с точки зрения классического вундтовского подхода, была сформулирована фундаментальная теоретическая установка гештальтпси-хологии о целостности опыта. Первичными данными психологии новое направление признавало целостные структуры (гештальты), структуры, не выводимые из образующих их компонентов, что иначе можно определить как холизм.
Применение понятия гештальта, по мысли одного из лидеров этой школы В. Келера, не ограничивается визуальным полем и распространяется на объяснение процессов памяти и научения.
Принципы организации восприятия в рамках школы гештальт-психологии. Проведенный М. Вертгеймером эксперимент имеет отношение к механизмам восприятия, которые являются базовыми для познавательной деятельности человека и включены в ряд интеллектуальных способностей субъекта. Опыты в области восприятия в рамках гештальтпсихологии проводились по следующим направлениям: восприятие кажущегося движения, исследование константности восприятия. На основании данных исследований были сформулированы основные принципы восприятия, в соответствии с которыми конечным результатом восприятия являются целостный образ, структура ситуации, определенный гештальт.
Базовым законом организации восприятия является принцип «фигура-фон». В гештальтпсихологии предполагается наличие перцептивного поля, состоящего из множества элементов, которые благодаря субъекту объединяются между собой, становятся связными, создавая тем самым некоторую структуру, которая выделяется на общем фоне. В гештальтпсихологии феномен возникающей структуры принято называть фигурой, а второй феномен — фоном. При этом фигура как таковая вообще невозможна без фона. Впервые этот феномен, имеющий отношение к восприятию, описал один из учеников Г.Э. Мюллера, сотрудник Центра экспериментальной психологии при Геттингенском университете Е. Рубин. Он также сформулировал ряд характеристик этих двух феноменов и проиллюстрировал проявление данного эффекта.
Из этого принципа следует то, что первоочередным действием субъекта в процессе восприятия является выделение фигуры на фоне в рамках перцептивного поля.
Классический пример, иллюстрирующий подобное первичное разделение, приводит один из лидеров гештальтпсихологии — К. Коффка в своей работе «Восприятие: введение в геш-а а б б в в г г тальттеорию». Промежутки аб, бв, вг v 1 (рис. 1) отличаются от промежутков
аа, бб, вв, гг. Это отличие заключа- ОО ОО ОО ОО ется в том, что белые промежутки Рис 2
аб, бе, ег образуют часть общего белого поля, тогда как остальные белые промежутки ограничиваются областями, заключенными между соответствующими черными линиями и не выходят за пределы этих областей, не образуют части окружающего белого поля. Таким образом, изначально однородная белая поверхность рисунка включена в два различных феномена: она выступает в виде ограниченных «полос», т.е. в составе фигуры, и распространяется на все остальное поле, образуя фон.
В рамках гештальтпсихологии сформулировано более 110 законов, в соответствии с которыми формируется гештальт. Ряд специалистов по истории психологической науки выделяют в качестве базовых следующие: близость, сходство, фигуру-фон2.
В гештальтпсихологии принцип «фигура-фон» традиционно рассматривался как однопорядковый с остальными законами. Однако с точки зрения настоящей реконструкции закон «фигура-фон» работает, скорее, на некотором базовом метауровне, ведь образование фигуры происходит в результате выбора, осмысленно организующего получаемую конструкцию в целом. Перенос внимания на иное соотношение «фигура-фон» приводит к «дезинтеграции» форм, образовывавших прежнюю фигуру. Следует признать, что формы, представляющие «бывшую» фигуру, просто перестают существовать и их замещает абсолютно отличный от них фон. Таким образом, фон можно охарактеризовать как нечто менее оформленное, менее структурированное, не обладающее отчетливой формой, нежели фигура. Фигура конституируется вследствие акта субъекта, организующего все перцептивное поле, а не потому, что субъект руководствуется некими правилами в ходе работы над его организацией и не вследствие учета характеристик объединяемых элементов.
Проиллюстрируем два других принципа.
Принцип близости можно сформулировать так: элементы, которые близки друг к другу в пространстве или во времени, кажутся нам объединенными в группы. Так, окружности, находящиеся на неравных регулярных расстояниях друг от друга (рис. 2), в восприятии объединяются в группы, каждая из которых состоит из ближайших друг к другу окружностей. Подобная характеристика в процессе образования гештальта необходимо должна быть распознана. Однако она является внешним признаком по отношению к познающему субъекту. Ее учет предполагает способность к определению расстояния между элементами зрительного поля. И все же расстояние между объектами — это некоторое свойство, при-
сущее данным элементам в текущем перцептивном поле, их положению относительно друг друга.
Принцип сходства, или подобия, гласит, что подобные элементы воспринимаются совместно и также объединяются в группу. Реализация этой процедуры предполагает наличие критериев такого отбора. Для иллюстрации данного принципа в гештальт-психологии достаточно часто приводят примеры изображения совершенно идентичных геометрических фигур. В случае с объективно идентичными геометрическими фигурами (ряд линий или ряд окружностей) принцип сходства можно интерпретировать так же, как и принцип близости в пространстве, т.е. как некую внешнюю для субъекта, целиком и полностью вытекающую из свойств объединяемых элементов характеристику. Однако следует отметить, что в реальном перцептивном поле, с которым каждый день имеет дело индивид, речь может идти только о частичном подобии, и признаки, по которым элементы могут быть признаны подобными и объединены в «сеть подобия», в единый геш-тальт, неограниченно многообразны. Заметим, что история попыток машинного распознавания образов в XX в. показывает, что сложность этого моделирования кроется именно в выходе многообразия реальных ситуаций за пределы любой предзаданной классификации. Возвращаясь к гештальтструктурам, следует сказать, что, как и в случае с процедурой выделения фона и фигуры, акт усмотрения сходства элементов и последующее их объединение в единый гештальт представлен в гештальтпсихологии как мгновенный, неразложимый на элементарные операции целостный процесс.
Следующая существенная характеристика перцептивного поля — его многоуровневая организация. В статье «Некоторые задачи гештальтпсихологии» В. Келер, описывая принципы объединения в группы близких друг другу элементов «одного качества», т.е. по сути как раз упомянутые выше принципы близости и подобия, иллюстрирует образование этих групп на примере ряда из удаленных друг от друга линий (рис. 1). Идентичные друг другу линии объединяются попарно. Однако далее В. Келер указывает на, казалось бы, очевидный феномен, а именно на то, что в группы при этом объединяются не просто элементы перцептивного поля, а предметы, которые являются, как и возникающие из них впоследствии группы, фигурами на фоне. Сами члены подобного ряда воспринимаются именно как целые единицы. «Мы здесь имеем дело с образованиями разного порядка и ранга, — пишет В. Келер, — например прямыми линиями (1-й порядок) и их группами (2-й порядок). Если единица существует, она может быть частью большей единицы или группы более высокого порядка»3. Таким образом, то перцептивное поле, которое является ре-
зультатом восприятия, представляет собой единицы различных порядков.
В рамках восприятия происходит не только постоянное разрушение старых и формирование новых систем из новых элементов на фоне, но и процесс, который можно назвать реинтеграцией единиц в новую систему.
Процедура уточнения, или «переструктурирования» гештальта, на наш взгляд, должна быть отдельно выделена в ряду способностей, обеспечивающих познавательную деятельность индивида. Эта процедура, очевидно, должна занять место в процессе восприятия вслед за процедурой выделения фигуры и фона. Ее возможность как раз и обеспечивает многоуровневую организацию перцептивного поля. Однако акт уточнения гештальта переносит нас уже в такую область действий субъекта, как решение задач. Уточнение гештальта присутствует и в процессах восприятия (более выпукло мы покажем это на примере решения определенной задачи в следующем подразделе статьи).
Подытожим наше исследование представлений о характере процесса восприятия, сформировавшихся в рамках гештальтпсихо-логии. Предыдущее рассмотрение показало, что гештальтисты (1) признавали существование процессов, составляющих восприятие (выделение фигуры и фона, переструктурирование гештальта и т.п.); (2) систематизировали характеристики гештальта как наличного данного сознания, являющегося результатом акта восприятия (свойства фигуры и фона, их функциональные особенности, характеристики перцептивного поля); (3) подобные процедуры в гештальттеории описываются как «мгновенные», «неожиданные», как некий «инсайт», т.е. озарение.
Таким образом, внутренняя организация процедуры возникновения нового гештальта не подлежит рассмотрению в рамках этой психологической школы. В первую очередь такая характеристика связана со стремлением подчеркнуть мгновенный, а не протяженный во времени характер мышления. Подобная установка закрывает путь процедурного описания процесса восприятия в рамках гештальтпсихологии.
Принципы организации процесса постановки и решения задач. Расширением поля приложения идей гештальтпсихологии является решение интеллектуальных задач, отличное от задачи простого восприятия окружающего мира. Возможность перенесения идей и принципов гештальттеории, сформулированных для процесса перцепции, на процессы решения задач можно проиллюстрировать, в частности примером переструктурирования гештальта при решении некоторой задачи.
Рассмотрим известный эксперимент В. Келера. Детям предлагалось достать машинку, помещенную высоко на шкафу. Для этого можно было использовать разные предметы — лестницу, ящик или стул. В ходе эксперимента оказалось, что решение задачи не составляло труда, если в комнате находилась лестница. В случае, когда в комнате присутствовал ящик, время, затраченное на поиск верного решения, увеличивалось. И наибольшие затруднения ребенок испытывал в случае, если в комнате не было других предметов, кроме стула, который было необходимо отодвинуть от стола. В. Келер считает, что изначально лестница функционально понимается как предмет, помогающий достать что-либо высокорасположенное. Такая единица без особых затруднений включается в единый гештальт вместе со шкафом. А включение в такой гештальт ящика уже предполагает некоторые изменения гешталь-та, так как ящик может восприниматься как предмет, имеющий несколько функций. Стул же в данном примере первоначально включен в единый гештальт со столом и поэтому для объединения в систему «стул—шкаф» он для начала должен быть исключен ребенком из системы «стул—стол». Объединение стула со шкафом в единый образ ведет за собой осознание его новой функциональной роли. Таким образом, решение задачи, поставленной перед ребенком, было найдено путем переструктурирования сразу двух гештальтов. Система «стул—стол» перестала существовать, будучи раздроблена на две единицы, а затем возникла новая система — «стул—шкаф». Заметим, что переструктурирование гештальта является не «чистым» процессом восприятия, а восприятием, подчиненным решению задачи. Под разумным поведением В. Келер понимает такое решение задачи, при котором происходит «возникновение всего решения в целом в соответствии со структурой поля»4. Основой любого разумного поведения в гештальтпсихоло-гии является зрительное восприятие ситуации, создание целостного визуального образа, гештальта. Резюмируя свои многочисленные опыты с приматами, В. Келер указывает на то, что «интеллектуально поведение шимпанзе преимущественно ориентируется на оптическую структуру ситуации, иногда решение задачи слишком односторонне направляется оптическими моментами»5. Ученый многократно подчеркивает визуальный характер получающейся структуры, и качественное отличие интеллекта человека от интеллекта шимпанзе состоит, по его мнению, в степени сложности этой структуры. Заметим, что разумное поведение при опытах, в ходе которых контролируются зрительные параметры ситуации, естественным (инструментальным) образом оказывается зависящим от «оптической структуры ситуации».
Итогом восприятия является инсайт как целостная интеллектуальная реакция понимания сути ситуации.
Р. Арнхейм ввел в гештальтпсихологию термин визуальное мышление. Однако это понятие фактически было разработано М. Вертгеймером в работе «Продуктивное мышление», представляющей попытку экстраполяции принципов и законов гештальта на процессы творческого мышления человека. На наш взгляд, идеи М. Вертгеймера представляют собой выход за рамки классической гештальттеории, поскольку в ней сделана попытка представить процесс мышления в динамике, раскрыть механизмы продуктивного мышления, где такие феномены, как инсайт и интуиция, предстают лишь частными моментами интеллектуального процесса. В качестве существенных черт динамики процесса творческого мышления М. Вертгеймер выделяет столкновение с проблемой; нахождение векторов, которые связаны со структурными особенностями ситуации и определяются ими; неясность, незавершенность ситуации; тенденцию к конкретизации областей нарушения и тенденцию к осуществлению операций по изменению6. В теории же В. Келера генезис процесса решения задачи, видения хорошего гештальта, не подлежит рассмотрению.
Можно сделать вывод о том, что принципы постановки и решения интеллектуальных задач, сформулированные гештальтпсихоло-гией, идентичны принципам восприятия. Для гештальтистов формирование целостного образа является первичным и необходимым моментом как простой перцепции, так и базирующейся на ней процедуры решения интеллектуальных задач. Необходимо особо подчеркнуть многоуровневый характер продуктивного образа (обозначим это положение как Тезис 1), дающий возможность посмотреть на ситуацию с различных точек зрения и позволяющий создавать различные гештальты из элементов, входящих в ситуацию. Как при перцептивном восприятии, так и при решении задачи работают формирование образа-гештальта (Тезис 2) и его переструктурирование (Тезис 3), причем всегда в соответствии с условиями наличной ситуации. Заметим, что В. Келер не придавал особого значения предшествующему опыту и соответственно памяти, а один из представителей русской школы гештальтпсихо-логии — A.B. Запорожец, напротив, считал необходимым сохранение субъектом определенных образов, сенсорных эталонов, которые могут лежать в основе восприятия и узнавания предметов.
Таким образом, специфическую структуру представления интеллектуальных способностей в рамках гештальттеории составляют следующие элементы: перцептивное поле, выделение фигуры на фоне, переструктурирование, принцип близости, принцип подобия. Процедура восприятия, при которой формируется целостный
образ наличной ситуации, представляя самостоятельную интеллектуальную способность, является также базовой процедурой при решении любой мыслительной и поведенческой задачи.
2. Использование идей гепггальтпсихологии в теории фреймов
Примером модели некоторых интеллектуальных способностей может служить довольно распространенная в исследованиях по искусственному интеллекту (ИИ) теория фреймов М. Мински. Автор позиционирует предлагаемую теорию как в качестве рабочей гипотезы для специалистов в области ИИ, так и в качестве модели реального мышления человека. В работе «Фреймы для представления знаний» М. Мински вводит понятие фрейма как «некоторой структуры данных (образа)»7. При этом предполагается наличие памяти, в которой хранятся подобные структуры. В случае возникновения некой новой ситуации человек пытается познать ее на основе уже известных структур. Но имеющиеся структуры используются не в неизменном виде, напротив, составляющие их элементы меняются. М. Мински полагает, что при изменении в этой структуре отдельных деталей, она может стать пригодной для понимания максимально широкого круга явлений и процессов.
Указанное определение фрейма структурно сходно с моделью интеллектуальных способностей в гештальтпсихологии.
Существенными представляются процедуры первичного выделения структуры в виде перцептивного образа и дальнейшего ее переструктурирования в соответствии с наличной ситуацией, т.е. процедуры, заявленные в предыдущем рассмотрении как Тезис 2 и Тезис 3. Если в гештальттеории выделение фигуры всегда происходит в рамках перцептивного поля, то в теории фреймов его функцию выполняет глобальный пространственный фрейм (СБР), который представляет собой «постоянный набор "типичных позиций" в абстрактном трехмерном пространстве»8, при этом предполагается, что человек всегда осознает, что он находится в универсальной воображаемой комнате, в которой происходят реальные события.
М. Мински отмечает как сложное устройство самого фрейма, так и многоуровневый характер систем фреймов (что совпадает с Тезисом 1 предыдущего рассмотрения). Во фреймах можно выделить несколько уровней вершин, или узлов, иерархически связанных между собой. Для узлов верхних уровней описанием служит, например, наименование элементов стереотипной ситуации, являющихся общими для некоторого множества конкретных ситуаций, описания вершин нижнего уровня (терминалов), состоящих
из названия данного терминала, заполнителя и описания данного заполнителя. Эти вершины должны соответствовать элементам некоторой конкретной наличной ситуации, и, изначально являясь пустыми, они заполняются при распознавании конкретной ситуации. Так, например, в случае зрительного образа различные фреймовые системы описывают картину с различных точек зрения. В качестве примера такой процедуры можно привести работу по представлению перспективных видов куба, в которой участвует система визуальных фреймов. Каждая грань куба в такой системе представляет отдельный фрейм, и в зависимости от перемещения наблюдателя относительно куба одни грани становятся видимыми, другие выпадают из поля зрения. Как и в случае с геш-тальтом, невидимая грань «исчезает», представляющий ее фрейм теряет активность. В результате перемещения мы фактически получаем новую сцену, что означает, что необходимо провести новый анализ, заново описав новую видимую грань и также те грани, которые остались после перемещения в поле зрения, однако стали частью новой структуры. В теории фреймов предлагается в целях экономии памяти и увеличения скорости реакции на происходящие изменения сохранять информацию об оставшейся в поле зрения грани, связывая ее с терминалом «новой» грани. В результате такой перестановки получается новая система из частично сохраняемых в памяти элементов. Таким образом, в теории фреймов остается неизменным соответствие получаемой целостной структуры наличной ситуации, что является одной из важнейших характеристик гештальта в психологической теории, т.е. по-своему сохраняется гештальтидея целостности восприятия.
Фрейм выступает как в роли «микроединицы»9, включенной в систему или сеть фреймов, так и «макроединицы», поскольку сам является сетью, которая включает в качестве единиц наименования вершин. Это подтверждает его структурное сходство с многоуровневым по своей природе гештальтом. Таким образом, в теории фреймов воспроизводится гештальтпсихологическая идея многоуровневой организации восприятия наличной ситуации.
Еще один аспект моделирования интеллектуальных способностей, основу которых составляет восприятие, заключается в особом внимании к принципам хранения готовых образов типичных ситуаций в памяти, что также предполагалось рядом психологов-гештальтистов.
Таким образом, можно сделать вывод, что фреймовая модель искусственного интеллекта предполагает наличие описанных в гештальтпсихологии структур организации психических актов.
4 ВМУ, философия, № 3
49
ПРИМЕЧАНИЯ
1 Этот эксперимент показал возможность восприятия мнимого движения. Свет проходил через две находящиеся рядом щели с интервалом во времени. Когда интервал времени составлял более 200 миллисекунд, наблюдатели сообщали, что видели последовательное появление света сначала в одной, а затем в другой прорези. Когда временной интервал сокращали, наблюдателям казалось, что обе прорези освещены постоянно. А при временном разрыве порядка 60 миллисекунд создавалось «впечатление движения», или, что свет непрерывно перемещается от одной прорези к другой и обратно.
2 См.: ШульцД., Шульц Э. История современной психологии. СПб., 2002. С.
300.
3 Келер В. Некоторые задачи гештальтпсихологии // История психологии (10^30-егг. Период открытого кризиса): Тексты. М., 1992. С. 165.
4 К&гер В. Исследование интеллекта человекоподобных обезьян // Основные направления психологии в классических трудах. Гештальтпсихология. М., 1998. С. 266.
э Там же. С. 268.
6 См.: Вертгеймер М. Продуктивное мышление. М., 1987. С. 82.
7 Мински М. Фреймы для представления знаний. М., 1979. С. 3.
8 Там же. С. 44.
9 Марчук Ю.Н. Компьютерная лингвистика: Учеб. пособие. М., 2007. С. 218.