Использование аппарата искусственных нейронных сетей для решения задач практической психологии
Арзамасцев А.А. ([email protected]) (1), Зенкова Н.А. (1), Безрученко И.Е. (2)
(1) Тамбовский государственный университет, Тамбов, ул. Интернациональная 33
(2) Тамбовский базовый медицинский колледж, Тамбов, ул. Московская 23
В настоящее время психологическая наука испытывает определенный подъем, связанный с широким внедрением новых информационных технологий и использованием их для решения задач практической психологии.
Психология, по своей сути, является не столько гуманитарной наукой, сколько естественной, изучающей структуру психики человека через различные познавательные процессы (такие как память, мышление, восприятие, речь), психические свойства и состояния личности (склонности и способности, мотивы, цели, интересы и др.), а также их зависимости между собой и зависимость от них человеческого поведения.
В связи с этим переход к методам математического моделирования для изучения психологических объектов является желательным и востребованным. Эти методы позволяют получать воспроизводимые результаты и обнаруживать различные закономерности. Корректно и адекватно построенные модели одновременно решают вопросы о представительности выборок и достоверности данных.
Одна из проблем психологии заключается в том, что для большинства психологических объектов невозможно построить модели, имеющие некий физический смысл, поэтому психологи часто используют эмпирические подходы к построению математических моделей, такие как факторный анализ, метод наименьших квадратов, планированный эксперимент и др., применение которых является в значительной степени ограниченным.
Вместе с тем в настоящее время разработано большое количество новых методов и технологий моделирования. В частности, по нашему мнению, большой интерес в психологической науке представляет использование аппарата искусственных нейронных сетей (ИНС). Большим преимуществом аппарата ИНС по сравнению с эмпирическими подходами построения математических моделей является то, что эта технология соответствует тому образу их построения, который используют многие биологические объекты.
На основании вышеизложенного мы считаем, что необходимо знакомить студентов-психологов с искусственным интеллектом, в частности, с аппаратом ИНС, обладающим способностью к распознаванию образов, который позволит решить проблемы идентификации систем типа «черного ящика», имеющие место среди объектов изучения психологической науки.
На кафедре компьютерного и математического моделирования Тамбовского государственного университета имени Г.Р. Державина разрабатывается технология для определения структуры и содержания уровня готовности индивидов (УГИ) к познавательной деятельности [1, 2], использующая компьютерные системы психологического тестирования нового поколения на основе технологии искусственных нейронных сетей [3]. Эта задача является важной составляющей более общей проблемы: построения компьютерно-ориентированной технологии управления учебным процессом в вузе, позволяющей корректировать учебный план при ежегодных изменениях в уровне подготовки абитуриентов (студентов) и базирующейся на применении методов психолого-педагогического тестирования обучаемых, имитационного моделирования и
статистической обработке экспериментальных данных по овладению учебным материалом [4].
Технология определения структуры и содержания уровня готовности индивидов к познавательной деятельности представлена на рис. 1-3.
Она включает в себя следующие этапы: построение первичной модели профессиональных качеств индивида на основе аппарата искусственных нейронных сетей и какой-либо известной системы психологического тестирования (блоки 1-10) (рис. 1); коррекцию первичной модели за счет введения дополнительных заданий и модификации структуры ИНС (блоки 11-19) (рис. 2); определение структуры и содержания УГИ на основе модифицированной модели (20-25) (рис. 3).
В блоке 1 производится формирование первичного пакета заданий для тестируемых. Как правило, такой пакет заданий может быть получен из известной батареи психолого-педагогического тестирования, близкой по существу решаемой задачи к определению УГИ. Поскольку первичный пакет заданий будет существенно изменен в дальнейшем по мере реализации данной технологии, способ его формирования не является определяющим. При определении структуры и содержания уровня готовности студентов к познавательной деятельности в качестве первичного пакета заданий нами рассмотрены вопросы известной методики Йовайши Л. А. по выявлению склонностей к различным сферам деятельности.
В блоке 2 осуществляется многократный прогон теста, выбранного в блоке 1 в режиме тестируемого. При этом фиксируются ответы на задания теста и числовые значения профессиональных качеств, полученные в ходе тестирования. В результате выполнения блока 2 формируется матрица, строками которой являются ответы (номера ответов) на вопросы теста, а последним столбцом матрицы являются числовые значения профессиональных качеств студента.
Данная матрица используется в последующих операциях в качестве обучающей выборки для ИНС.
В блоке 3 осуществляется формирование структуры искусственной нейронной сети. Для этой цели использовалась одна из программ-оболочек, предназначенных для создания и работы с ИНС. На этом этапе выбираются: количество входных нейронов (как правило, это число должно быть равно числу заданий используемого теста); количество выходных нейронов (это число должно быть равно числу тестируемых профессиональных качеств индивида); количество слоев и количество нейронов в слое (выбираются в соответствии с решаемой задачей); система связей между нейронами (выбирается в соответствии с решаемой задачей, первоначальная конструкция может быть разработана по принципу «каждый с каждым»); активационные функции нейронов (выбираются из известного набора - линейная, параболическая, сигмоид, ступенчатая функция). Реализация этого этапа является одним из самых тонких мест в указанной технологии. От того, насколько удачно выбрана структура ИНС, в значительной степени зависит ее способность к обучению, адекватность модели и количество итераций проверки этих свойств, которое предстоит выполнить на пути реализации технологии (см. рис. 1). Необходимо отметить, что последующие блоки (блоки 5 и 8) гарантируют адекватность модели на ИНС даже в том случае, если первоначальная структура была выбрана неверно.
В блоке 4 осуществляется обучение созданной в блоке 3 ИНС на основе обучающей выборки, полученной в блоке 2. При этом используются стандартные процедуры, реализующие методы нелинейного программирования (методы Монте-Карло, покоординатного спуска, градиентные и их комбинации).
В блоке 5 осуществляется проверка обучаемости ИНС. Ее возможность обучения может быть легко оценена по степени близости выходных значений векторов (профессиональные качества индивида) для ИНС и исходного теста. Если сеть не обучается или обучается медленно, то это указывает на неправильный выбор ее структуры в блоке 3. Поэтому в соответствии со схемой рис. 1 необходимо осуществить коррекцию
структуры. Если сеть обучается - это указывает на то, что структура в блоке 3 выбрана верно и можно переходить к выполнению следующих операций.
В блоке 6 осуществляется коррекция представлений о структуре ИНС. На этом этапе полезно связать число слоев ИНС, систему связей и функции нейронов с реально существующими свойствами системы тестирования.
В блоке 7 осуществляется совместная проверка модели, полученной в результате обучения ИНС в блоке 4, и теста. При этом на входы ИНС и в качестве ответов на задания теста выбираются одинаковые комбинации, не включенные в обучающую выборку в блоке 2. По результатам этой проверки делается заключение об адекватности модели.
В блоке 8 осуществляется проверка адекватности модели, разработанной в предыдущих блоках. Адекватность оценивается на основе близости значений профессиональных качеств индивида, полученных на основе теста и ИНС. В большинстве случаев адекватность модели достигается, так как в блоке 5 уже проверялась возможность обучения ИНС с данной структурой связей.
В блоке 9 производится увеличение объема обучающей выборки. Ее полный набор должен состоять из Кш независимых комбинаций в тесте, где требуется выбрать один из предложенных вариантов ответов. Здесь N - количество вариантов ответов на каждое задание, ш - количество заданий. Однако для обучения нейронной сети изначально бывает достаточно намного меньшего количества комбинаций.
В блоке 10 осуществляется удаление несущественных связей ИНС и окончательная настройка модели. Несущественными считаются связи, весовые коэффициенты которых ниже заданного, определяемого пользователем, уровня. Такие связи практически не оказывают никакого воздействия на качество работы всей модели в целом. Тем не менее, после их удаления для окончательной настройки модели необходимо еще раз провести обучение сети.
Результатом выполнения операций в блоках 1-10 является формирование первичной модели профессиональных качеств студента на основе аппарата искусственных нейронных сетей. Первичная модель представляет собой, по сути, обобщенную модель профессиональных качеств индивида без конкретизации области его деятельности. Такую модель можно использовать для выявления склонностей к различным сферам деятельности, но она еще не пригодна для определения уровня готовности студентов к познавательной деятельности в определенной сфере. Для определения УГИ ядро должно быть дополнено оценками некоторых других качеств личности студента. Указанные операции выполняют на этапе коррекции модели (блоки 11-19), в результате чего формируется модифицированная модель на ИНС (рис. 2).
В блоке 11 осуществляется формирование вторичного пакета заданий, направленных на тестирование УГИ. В формировании принимают участие эксперты в заданной предметной области. В нашем случае в качестве экспертов выступали ведущие преподаватели Тамбовского государственного университета им. Г. Р. Державина: профессора и доценты, ведущие лекционные курсы, практические и лабораторные занятия, хорошо знающие студентов, их личностные характеристики, а также сотрудники деканатов, в значительной степени осведомленные о профессиональных качествах обучаемых. В качестве заданий (системы заданий) предлагаются вопросы, характеризующие способность студентов к моделированию предметной области, мотивацию, знание предметной области, умения и навыки работы в ней. Отметим, что указанные задания выбираются с таким расчетом, что они могут дополнить первичный пакет, сформированный в блоке 1.
В блоке 12 осуществляется модификация структуры ИНС в соответствии с вторичным пакетом заданий. Структура ИНС дополняется входными, выходными и функциональными нейронами, системой связей между ними. При этом ядро модели, сформированное ранее в блоках 1-10, остается на этом этапе неизменным, а новые структуры лишь дополняют его. В результате выполнения операций в блоках 11-12 имеем
модель УГИ к познавательной деятельности, которая, однако, еще не подверглась идентификации параметров и проверке адекватности.
Проверка адекватности модели и коррекция ее параметров осуществляются в сравнении с реальными эмпирическими данными, представляющими собой оценки УГИ конкретных индивидов в заданной предметной области. Указанные действия выполняются в блоках 13-16.
В блоке 13 осуществляется опрос респондентов. Опрос проводится на первом курсе среди студентов, которые только что поступили в университет. При этом используется вторичный пакет заданий, сформированный в блоке 11. По результатам опроса формируется матрица ответов респондентов. Для упрощения работы с респондентами и придания опросу безличностного характера используется специально разработанная тестирующая программа. Данные опроса хранятся в течение периода первичного обучения специальности, по истечению которого возможно делать выводы о развитии профессиональных качеств обучаемого. Обучение студентов в этот период проводится по обычной программе профессионального образования и в соответствии с государственным стандартом профессионального образования по указанной специальности (блок 14). По истечению указанного периода экспертами осуществляется ранжирование респондентов по уровню профессиональной пригодности.
После того, как для каждого респондента произведен подсчет оценок, матрица ответов, полученная при опросе респондентов в блоке 13, дополняется оценками профессиональных качеств, после чего эту матрицу можно использовать для обучения модифицированной модели на ИНС.
В блоке 16 производится обучение структуры ИНС, созданной ранее в блоке 12 на основе обучающей выборки, полученной в блоке 15. При этом используются стандартные процедуры, реализующие методы нелинейного программирования.
В блоке 17 (как это ранее было в блоке 5) осуществляется проверка обучаемости ИНС. Ее возможность обучения может быть легко оценена по степени близости выходных значений векторов (профессиональные качества индивида) для ИНС и матрицы ответов респондентов. Если сеть не обучается или обучается медленно - это указывает на неверное формирование вторичного пакета заданий (блок 11) и неправильный выбор ее структуры (блок 12) . Поэтому, в соответствии с общей схемой, необходимо осуществить коррекцию этих компонентов модели. Если сеть обучается - это указывает на то, что можно переходить к выполнению следующих операций.
В блоках 18, 19 проводится проверка обученной ИНС для тестирования независимой группы респондентов. При этом оценивается, насколько хорошо ИНС-модель, сформированная на основе ядра, включающего какую-либо систему психологического тестирования и дополнений, а также заданий для конкретного контингента и профессиональной области, позволяет оценивать профессиональные качества респондентов из контрольной группы. В случае если оценки, получаемые по модели, не противоречат мнению экспертов, то модель считается адекватной и будет использована в дальнейшем для оценки структуры и содержания УГИ к познавательной деятельности. В случае если сразу не удается получить адекватную модель, необходимо снова перейти к блоку 11 - формирования вторичного пакета заданий.
Результатом выполнения операций в блоках 11 - 19 является формирование вторичной модели профессиональных качеств индивида на основе аппарата искусственных нейронных сетей. Такая модель представляет собой обобщенную модель профессиональных качеств студента с конкретизацией области его деятельности, общего уровня контингента обучаемых и т.д. Эту модель можно использовать для определения уровня готовности студентов к познавательной деятельности в определенной сфере на том основании, что, во-первых, она включает в себя известные данные об их профессиональной пригодности, дополнения, позволяющие оперировать в заданной профессиональной области с учетом заданного контингента обучаемых, а, во-вторых, вся
модель обучена на выборке из эмпирических данных, соответствующих заданной профессиональной области.
Процесс определения структуры и содержания УГИ с помощью модели начинается с анализа и удаления несущественных связей (блок 20). Как и в блоке 10, несущественными считаются связи, весовые коэффициенты которых ниже заданного, определяемого пользователем уровня. Такие связи практически не оказывают никакого воздействия на качество работы всей модели в целом.
В этой модели интегрирована информация об уровне готовности индивидов к обучению в заданной профессиональной области, важности отдельных показателей и групп показателей при оценке УГИ, взаимовлиянии различных показателей и т. д. Можно считать, что обученная ИНС является моделью определенных качеств студента в рамках заданной предметной области, поскольку программа работы с ИНС устроена таким образом, что из нее легко может быть извлечена информация о структурных элементах, их взаимосвязи, значимости коэффициентов передачи.
В блоке 21 из всей совокупности заданий вторичного пакета выделяются задания, которые по мнению экспертов тестируют одинаковые качества студента. Для успешной реализации этой задачи экспертами может быть предложен или ими может быть разработан заранее перечень тестируемых свойств индивида в рамках заданной предметной области. Результатом операций блока 21 является таблица соответствий заданий и соответствующих им тестируемых качеств индивида.
В блоке 22 осуществляется определение значимости заданий внутри каждой группы. Эта задача решается на основе анализа коэффициентов передачи соответствующих связей нейронной сети. Чем выше абсолютное значение коэффициента передачи, тем большая важность может быть приписана анализируемому свойству индивида. При этом выделяются задания, ответы на которые оказывают наиболее существенное влияние на значения тестируемых качеств, задания, оказывающие значительное влияние и задания, ответы на которые оказывают очень малое влияние на тестируемые качества. Таким образом, при реализации процедур, предусмотренных блоком 22, практикующие психологи и педагогические работники получат ценную информацию о том, какие вопросы пригодны для оценки определенных качеств студента, а какие не вполне подходят для этого.
В блоке 23 осуществляется определение значимости групп факторов в оценке УГИ. В зависимости от структуры полученной нейронной сети могут быть использованы аддитивные и мультипликативные функциональные зависимости для определения на основе имеющихся коэффициентов передачи каналов типа «ответы на задание -тестируемое качество индивида», обобщенных коэффициентов для групп. В зависимости от обстоятельств могут быть использованы и комбинированные аддитивно-мультипликативные зависимости.
Поскольку ответы на многие задания могут быть использованы для тестирования различных групп свойств индивидов, в блоке 24 осуществляется оценка таких взаимовлияний и формулируются выводы о структуре перекрестных связей между факторами различных групп.
Так как в блоках 21-24 ранее выявлены задания, относящиеся к различным группам тестируемых свойств, значимость групп в определении комплексного показателя и оценки взаимовлияния отдельных факторов, мы считаем, что задача определения структуры и содержания показателя УГИ решена (блок 25).
Рис.1. Технология определения структуры и содержания уровня готовности индивидов к познавательной деятельности (формирование первичной модели).
Рис.2. Технология определения структуры и содержания уровня готовности индивидов к познавательной деятельности (коррекция модели).
Рис.3. Технология определения структуры и содержания уровня готовности индивидов к познавательной деятельности (определение структуры и содержание УГИ к познавательной деятельности).
Для ознакомления с этой технологией студентам предлагается построить ИНС-модель теста Йовайши Л. А. по выявлению склонностей к различным сферам деятельности (компьютерный вариант разработан в Севастопольском городском центре занятости).
В качестве искусственной нейронной сети выбрана программа типа freeware -Neural Network Constructor (NNC), version 3.01, разработка ВЦ РАН (адрес http://vkrepets.chat.ru/NNC.exe). Данная программа позволяет использовать до 60 входных нейронов, варьировать функцией нейрона, количеством слоев и связей сети. Она содержит в себе готовые алгоритмы обучения по следующим методам: покоординатный спуск, случайный поиск, метод Ньютона, статистический градиентный метод, комбинации этих методов.
В качестве выборки для обучения нейронной сети была сгенерирована по методу Монте-Карло последовательность ответов на тест Йовайши Л. А. (120 строк). В результате многократного прогона теста из него были получены значения тестируемых свойств (склонность к работе с людьми; к умственным видам работ; к работе на производстве; к эстетике и искусству; подвижным видам деятельности; к планово-экономическим видам работ или степень материальной заинтересованности).
При моделировании теста по качеству «склонность к умственным видам работ» структура нейронной сети включала тридцать входных (input) нейронов (по числу заданий теста), соединенных с нейроном с линейной функцией и один выходной (output) нейрон (рис. 4). После обучения нейронная сеть позволяла моделировать тест с погрешностью, не превышающей 0,2%.
Рис.4. Структура первичной ИНС - модели: однослойный перцептрон.
; NNC V.3.Ü1 - C:\A_Matashina_Dissertacia\Glava_3\123\Pervichn
I Start I Windows Commande
Документ! - Micros,.
1 Glava 3 - Microsoft,
Рис. 5. Коэффициенты передачи каналов ИНС, показанной на рис. 4., полученные при ее обучении по тесту Йовайши Л. А.
В заключении формирования ИНС-модели в соответствии с технологией (рис. 1 - 3) осуществлялось удаление несущественных связей ИНС и окончательная настройка модели. Установив по таблице коэффициентов передачи каналов ИНС (рис. 5) пороговый уровень 10-5, были обнаружены несущественные связи между ответами респондентов на некоторые вопросы при тестировании свойства «склонность к умственным видам работ».
Измененная структура нейронной сети показана на рис. 6. Отсутствие линий между входными нейронами и выходом сети означает, что несущественные связи были исключены.
Адекватность такой ИНС-модели практически не ухудшилась по сравнению со
структурой, показанной на рис. 4.
. NNC v.3.01 - C:\A_Natashina_Dissertacia\.Glava_3\lZ3\Pervichn
File Edit View Run Help
63, 28
£ Start | У Windows Commander 5,.., | § Glava_3 - Microsoft Word 11 NNC v.3.01 11:24
Рис. 6. Структура ИНС-модели после удаления несущественных связей.
В отличие от самого теста Йовайши Л. А., имеющего жесткую структуру связей, его модель, использующая аппарат ИНС, допускает дополнительное обучение на основе вновь поступивших данных, в том числе и в ходе тестирования респондентов, что позволяет адаптировать ее к реальной ситуации (временной нестационарности или свойствам личности).
Таким образом, ИНС-модель теста Л.А. Йовайши позволяет студентам глубже изучить внутреннюю структуру психологического теста, понять его устройство и принципы разработки. А поскольку система тестирования представляет собой модель личности, то, по аналогичной технологии, в принципе, возможно создание нового теста, позволяющего многое узнать и о свойствах самой личности.
Используя данную технологию, студенты-психологи смогут: 1) изучать внутреннюю структуру тестов; 2) понять, как строятся системы психологического тестирования; 3) дообучать модели на результатах собственного анкетирования, проведенного в группе, факультете и т.д.
На учебных занятиях для студентов психологического факультета ТГУ им. Г.Р. Державина по предметам «Математическое моделирование в психологии» и «Современные информационные технологии» нами читается авторский курс по теории и практике использования ИНС. Ниже приведены темы лекций и лабораторных работ. Темы лекций
1. Искусственный интеллект. Основные определения. Области использования искусственного интеллекта.
2. Задачи распознавания образов в психологии. Возможности использования аппарата искусственных нейронных сетей.
3. Мозг человека - прототип ИНС.
4. Формальный аппарат ИНС.
5. Алгоритмы обучения ИНС.
6. Разработка систем психологического тестирования на основе аппарата ИНС. Тематика лабораторных работ
1. Изучение основных приемов работы с программой NNC.
2. Исследование свойств ИНС по восстановлению структуры объекта, описываемого аддитивной функцией.
3. Исследование свойств ИНС по восстановлению структуры объекта, описываемого мультипликативной функцией.
4. Использование ИНС для решения задач распознавания образов.
5. Использование аппарата ИНС для моделирования и восстановления внутренней структуры психологического теста (на примере теста Л. А. Йовайши).
6. Использование аппарата ИНС для прогнозирования временных рядов.
Курс апробирован на студентах 2 курса в количестве 42 человек специальности «информатика в гуманитарной сфере» и студентах 4 курса в количестве 75 человек специальности «психология».
Исследования по использованию аппарата искусственных нейронных сетей для разработки систем психологического тестирования поддержаны Институтом «Открытое общество» (Фонд Сороса); Мегапроект «Развитие образования в России» (Высшее образование); Грант № ОАА108, 2002-2003. Материалы расположены на сайте http://www.cmsd.narod.ru (раздел «Projects»).
Литература
1. Арзамасцев А.А., Зенкова Н.А. Моделирование в психологии на основе искусственных нейронных сетей. Тамбов. ИМФИ ТГУ им. Г.Р. Державина. 2003. 106 с.
2. Зенкова Н.А. Психологическая модель готовности студентов первого курса к обучению в вузе. Дис. ... канд. психол. наук. Тамбов, 2003.
3. Арзамасцев А.А., Зенкова Н.А. Компьютерные системы психологического тестирования нового поколения - на основе технологии искусственных нейронных сетей // Вестн. ТГУ. Тамбов. 2003. Т.8. Вып. 1. Материалы научной конференции преподавателей и аспирантов. VII Державинские чтения. С. 190-192.
4. Арзамасцев А.А., Китаевская Т.Ю., Иванов М.А., Зенкова Н.А., Хворов А.П. Компьютерная технология оптимального проектирования учебного процесса // Информатика и образование. 2001. №4. С. 79-82.