УДК 519.95+62-506
МОДЕЛИРОВАНИЕ В ПСИХОЛОГИЧЕСКИХ, СОЦИАЛЬНЫХ И МЕДИЦИНСКИХ СИСТЕМАХ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
© А.А. Арзамасцев, Н.А. Зенкова, А.В. Неудахин
Ключевые слова: моделирование; искусственные нейронные сети; искусственный интеллект.
В работе рассматривается подход к моделированию различных объектов из социальной сферы: психологических, педагогических, медицинских - с помощью аппарата искусственных нейронных сетей. Обсуждаются сильные и слабые стороны такого подхода. Предложена технология построения экспертных систем с интеллектуальным ядром на основе искусственных нейронных сетей, которая может быть использована в различных предметных областях.
В настоящее время с появлением искусственных нейронных сетей (ИНС) исследователи получили в распоряжение инструмент, способный к самообучению на основе поступающих данных, позволяющий осуществлять моделирование в условиях неполной, зашумленной информации, прогнозировать и производить расчеты.
Искусственная нейронная сеть представляет собой сеть, состоящую из элементов, называемых искусственными нейронами и связанных между собой синаптическими соединениями. Задача сети состоит в преобразовании входных сигналов, в результате чего меняется внутреннее состояние сети и формируются выходные сигналы.
В настоящее время ведется поиск приложения аппарата ИНС в самых различных дисциплинах, в т. ч. в социологии, психологии и медицине.
Нами также были проведены исследования и получены примеры успешного использования аппарата ИНС в психологических и социальных исследованиях.
Системы психологической диагностики в настоящее время находят широкое применение при определении профессиональных предпочтений и способностей в медицинских исследованиях, образовании и других сферах.
Наиболее распространенными диагностическими методами являются тесты или системы (батареи) тестов. Несмотря на их широкую применимость, технология разработки новых тестирующих систем имеет некоторые существенные недостатки: значительная трудоемкость исполнения практически всех этапов, вызванная большими объемами выборок; требуемая исходная выборка вопросов и заданий существенно превышает размер выборки, которая в дальнейшем используется для тестирования (остается в тесте); необходимость числовых оценок как самих значимых факторов, так и параметров, за которыми ведется наблюдение; некоторые чисто математические трудности
(например, трудно выбрать значения весовых коэффициентов).
Указанные выше трудности разработки имеют чисто технологический характер. Однако практически всем системам психологического тестирования присущи и некоторые принципиальные недостатки.
1. В условиях динамично меняющегося общества имеет место нестационарность социума, обусловленная значительными изменениями традиционной системы связей, ценностей и взаимоотношений субъектов. По этой причине существующие технологии психологического тестирования, опирающиеся на статистические стационарные связи (корреляционные зависимости), имеют ограниченное время жизни. Для преодоления этого недостатка тестирующая система должна иметь возможность адаптации к изменившимся условиям в процессе ее эксплуатации.
2. Системы тестирования, разработанные на основе корреляционных и регрессионных зависимостей, дают тем лучшие результаты тестирования респондентов, чем ближе личностные качества тестируемого приближаются к средним значениям; чем дальше отстоит тестируемый от средних показателей, тем худшие результаты дает психологический тест; такие результаты являются следствием использования различных аппрок-симационных процедур.
Выходом из создавшейся ситуации может являться разработка адаптивной системы, способной самостоятельно настраиваться на данный контингент респондентов в процессе их тестирования.
Мы считаем, что удобной компьютерной технологией для решения этой задачи является аппарат искусственных нейронных сетей, успешно применяющийся в настоящее время в системах распознавания образов и искусственного интеллекта.
Мы предлагаем использовать аппарат искусственных нейронных сетей для разработки адаптивных систем психологического тестирования, определения внутренней структуры известных психологических тестов и, возможно, некоторых свойств личности.
§1. Модель теста Л.А. Йовайши по выявлению склонностей индивида к различным сферам деятельности и идентификация его внутренней структуры
Для проверки возможности использования аппарата искусственных нейронных сетей в решении задач иден-
тификации внутренней структуры психолого-педагоги-ческих объектов предпринята попытка моделирования теста по выявлению склонностей индивидов к различным сферам деятельности. Тест представляет собой компьютерный вариант методики Л.А. Йовайши. Он разработан в Севастопольском городском центре занятости и получен как freeware с сайта www.psycho-logy.net.ru.
Таблица 1
Вопросы теста Л.А. Йовайши
Номер вопроса Содержание вопроса
1 Правы те люди, которые считают, что важнее: А. Много знать. Б. Создавать материальные блага
2 Что Вас больше всего привлекает при чтении книг: А. Прекрасный литературный стиль. Б. Яркое изображение смелости и храбрости героев
3 Какое награждение Вас больше всего бы обрадовало: А. За научное изобретение Б. За общественную деятельность на общее благо
4 Если бы представилась возможность, какой пост Вы бы выбрали: А. Директора универмага. Б. Главного инженера завода
5 Что следует больше ценить у участников самодеятельности: А. То, что они несут людям искусство и красоту. Б. То, что выполняют общественно-полезную работу
6 Какая область деятельности человека в будущем будет иметь доминирующее значение: А. Физика. Б. Физическая культура
7 Если бы Вам предоставили пост директора школы, на что бы Вы обратили больше внимания: А. На создание необходимых удобств (удобная столовая и т. д.). Б. На сплочение дружеского и трудолюбивого коллектива
8 Вы на выставке. Что Вас больше всего привлекает: А. Цвет и совершенство формы экспонатов. Б. Их внутреннее устройство (как и из чего они сделаны)
9 Какие черты характера в человеке Вам больше нравятся: А. Мужество, смелость, выносливость. Б. Дружелюбие, чуткость, отсутствие корысти
10 Представьте себе, что Вы профессор университета. Какому предмету Вы отдали бы предпочтение в свободное время: А. Занятиям по литературе. Б. Опытам по физике, химии
11 Вам предоставляется возможность посетить разные страны. В качестве кого Вы бы охотно поехали: А. Как известный спортсмен на международные соревнования. Б. Как известный менеджер для покупки товаров
12 Какая из статей в газете вызвала бы у Вас больший интерес: А. Статья о машине нового типа. Б. Статья о новой научной теории
13 Вы смотрите парад. Что больше привлекает Ваше внимание: А. Слаженность ходьбы, бодрость, грациозность участников. Б. Внешнее оформление колонн (знамена, одежда и т. д.)
14 Представьте, что у Вас много свободного времени. Чем бы Вы охотнее занялись: А. Чем-либо практическим (ручным трудом). Б. Общественной работой (на добровольных началах)
15 Какую выставку Вы посмотрели бы с большим удовольствием: А. Выставку новых продовольственных товаров. Б. Выставку новинок научной аппаратуры (физики, биологии)
16 Если бы в школе были только два кружка, какой бы Вы выбрали: А. Технический. Б. Музыкальный
17 Как Вам кажется, на что следовало бы обратить больше внимания в школе: А. На успеваемость учащихся - это необходимо для их будущего. Б. На спорт - это необходимо для укрепления их здоровья
18 Какие журналы Вы читали бы с большим удовольствием: А. Научно-популярные. Б. Литературно-художественные
19 Какая из двух работ на свежем воздухе Вас больше бы привлекла: А. Работа с машинами и механизмами. Б. Ходячая работа (агроном, лесничий, дорожный мастер)
20 На Ваш взгляд, для школы важнее подготовить учащихся: А. К практической деятельности (создавать материальные блага). Б. К работе с людьми, чтобы они могли помогать другим в этом
21 Трудами каких выдающихся ученых Вы больше интересуетесь: А. Попова, Циолковского, Б. Менделеева, Павлова
22 Что важнее для человека: А. Создать себе благополучный, удобный быт. Б. Иметь возможность пользоваться духовными ценностями
23 Что важнее для благополучного будущего цивилизации: А. Правосудие. Б. Техника
24 Какую из двух книг Вы с большим удовольствием читали бы: А. О достижениях спортсменов. Б. О развитии промышленности
25 Что принесет обществу больше пользы: А. Забота о благосостоянии граждан. Б. Изучение поведения людей
26 Что, на Ваш взгляд, более целесообразно: А. Больше развивать службу быта. Б. Создать технику, которой можно было бы пользоваться самим
27 Какие лекции Вы слушали бы с большим удовольствием: А. О выдающихся ученых. Б. О выдающихся художниках
28 Какого характера научную работу Вы бы выбрали: А. Работу с книгами в библиотеке. Б. Работу на свежем воздухе в экспедиции
29 Что бы Вас больше заинтересовало в печати: А. Сообщение о выигрыше денежно-вещевой лотереи. Б. Сообщение о состоявшейся художественной выставке
30 Какой профессии Вы отдали бы предпочтение: А. Физкультуре или работе, связанной с движением. Б. Работе малоподвижной, но по созданию новой техники
Психологический тест был выбран в качестве объекта моделирования по следующим причинам. Во-первых, тест представляет собой модель определенных свойств (качеств) некоторой абстрактной усредненной личности. Поэтому, если с помощью аппарата ИНС удастся построить адекватную модель такого объекта, то это фактически означает, что данный математический аппарат, в принципе, можно использовать для моделирования, прогнозирования, идентификации внутренней структуры и получения оценок свойств самой личности. Во-вторых, такой модельный объект, как тест в значительной степени более удобен в исследованиях, чем человек. При работе с ним снимаются проблемы достоверности ответов, а полученные оценки являются осредненными для значительных групп, что снимает проблему их представительности. В-третьих, при работе с человеком для получения значительной по объему матрицы наблюдений необходимы существенные временные затраты, а тест без особых трудностей можно прогонять многократно и создавать обучающую выборку большого размера для ИНС.
Предварительно тест Л. А. Йовайши был исследован на стационарность и валидность получаемых оценок. Для этой цели тестировали десятерых сотрудников института математики, физики и информатики ТГУ имени Г. Р. Державина, для которых по опыту их работы были предварительно получены объективные оценки их личностных качеств. После тестирования коэффициент корреляции объективных и тестированных значений склонностей к различным сферам деятельности превысил 0,7, что было сочтено нами как удовлетворительный результат.
В качестве искусственной нейронной сети была выбрана программа freeware - Neural Network Constructor (NNC), version 3.01, 2001, разработанная на ВЦ РАН (рабочая версия доступна в сети Internet по адресу http://vkrepets.chat.ru/NNC.exe, автор программы -В. В. Крепец). Данная программа позволяет использовать до 60 входных нейронов, варьировать функцией нейрона, количеством слоев и связей сети. Она содержит в себе готовые алгоритмы обучения по методам покоординатного спуска, случайного поиска, Ньютона, статистического градиента и их комбинациям.
Всю последовательность работ по формированию первичной ИНС-модели проводили в соответствии с технологией, разработанной в [1, 2].
Полный перечень вопросов теста Л.А. Йовайши приведен в табл. 1. Тестируемый должен выбрать один из четырех вариантов ответа: < Конечно А >, < Конечно Б >, < &орее А, чем Б >, < Скорее Б, чем А >. После того, как ответы на все тридцать вопросов получены, программа осуществляет вывод оценок склонностей (количество баллов) к различным сферам деятельности.
Выборку для обучения искусственной нейронной сети формировали следующим образом. Сначала были сгенерированы по методу Монте-Карло 120 различных возможных последовательностей ответов. Возможные варианты ответов на вопросы обозначали цифрами: < Конечно А > - 1, < Конечно Б > - 2, < ^орее А, чем Б > - З, < Скорее Б, чем А > - 4. В результате многократного прогона теста из него были получены значения тестируемых свойств (склонность к работе с людьми; к умственным видам работ; к работе на производстве; к эстетике и искусству; подвижным видам дея-
тельности; к планово-экономическим видам работ или степень материальной заинтересованности). Численные значения указанных свойств приведены в приложениях к работе [1].
В качестве начального варианта структуры искусственной нейронной сети была выбрана конструкция, называемая перцептроном: тридцать входных (input) нейронов (но числу вопросов теста), соединенных с нейроном линейной функцией, и один выходной (output) нейрон. Такая простая конфигурация ИНС была выбрана в качестве начального варианта, однако, его дальнейшее тестирование показало, что для данной задачи указанная структура является вполне приемлемой.
Первые же попытки обучения ИНС показали, что функция невязки между расчетным и экспериментальным значениями векторов выходных координат быстро уменьшается. Однако окончательное значение невязки составляет 7,4З, что далеко он нулевого уровня. Попытки варьирования активационной функцией нейрона показали, что значительно уменьшить значение невязки (до значения 6,45) позволяет лишь активационная функция, представляющая собой параболическую зависимость третьей степени. Было сделано заключение о том, что, возможно, имеет место неверный выбор последовательности аргументов (см. рис. 1). В связи с этим была предпринята попытка поменять местами номера ответов на каждое задание следующим образом: 1 ^ 1, 2 ^ 4, З ^ 2, 4 ^ З. Если в исходном случае четыре возможных варианта ответов на каждое задание были выстроены в последовательности: < Конечно А >, < Конечно Б >, < ^орее А, чем Б >, < Скорее Б, чем А >, то после замены эта последовательность ответов была проранжирована по принципу от меньшего к большему, т. е.: < Конечно А > - 1, < ^орее А, чем Б > - 2, < Скорее Б, чем А > - З, < Конечно Б > - 4 (табл. 2).
После такой коррекции нейронная сеть хорошо и быстро обучалась. При использовании в качестве активационной функции линейной зависимости значение невязки составило порядка 10-9, что соответствовало максимальной относительной погрешности модели по сравнению с обучающей выборкой всего в 0,2 %. На рис. 2-7 показаны коэффициенты передачи нейронов, полученные при моделировании различных свойств (личностных качеств), краткое обозначение которых приведено в табл. З. Схемы, показанные на рис. 2-7, названы нами первичной ИНС-моделью теста Л.А. Йовайши.
Рис. 1. Линейная зависимость между факторами х и у - а). Неверный выбор последовательности факторов хі, х2, х3 и х4 превращает линейную зависимость в параболическую - Ь)
Таблица 2
Соответствие вариантов ответов на вопросы теста Л.А. Йовайши и номеров ответов в ИНС-модели
Варианты ответа Номера ответов
Конечно А 1
Скорее А, чем Б 2
Скорее Б, чем А 3
Конечно Б 4
Анализ первичной ИНС модели теста (рис. 2-7) на основе абсолютных величин коэффициентов передачи каналов позволяет сделать следующие выводы.
Уровни абсолютных величин коэффициентов передачи каналов отличаются более чем на шесть порядков. При этом они кластеризуются около значений порядка 10-6 и 0,1-0,4. Каналы нейронной сети, имеющие коэффициенты передачи порядка 10-6, не оказывают су-
щественного влияния на выходную величину, в связи с чем они могут быть истолкованы как незначимые.
Таблица 3
Обозначения качеств личности теста Л.А. Йовайши
Качества личности Обозначение
Склонность к работе с людьми Качество А
Склонность к умственным видам работ Качество Б
Склонность к работе на производстве Качество В
Склонность к эстетике и искусству Качество Г
Склонность к подвижным видам деятельности Качество Д
Склонность к планово-экономическим видам работ или степень материальной заинтересованности Качество Е
X <
/"рч -0,3988 /'-'ч 7.08Е-6
(з) '
^-0,36885 0 1 29Е-6 ®-2 35Е~6 0-1,О4Е-5 ^ 0.38084
(Т^1'79Е-5
Качество Б
Рис. 2. Первичная ИНС модель качества А (склон- Рис. 3. Первичная ИНС модель качества Б (склонность к работе с людьми). Средняя квадратичная ность к умственным видам работ). Средняя квадра-
ошибка модели в сравнении с тестом - 9,69-10-9 тичная ошибка модели в сравнении с тестом - 9,6-10-9
Каждый из имеющихся вопросов является значимым для оценки какого-либо личностного качества, т. е. в отношении всего теста. Только по десять вопросов из тридцати являются значимыми для определения каждого качества личности в отдельности. Это хорошо видно по абсолютным величинам коэффициентов передачи каналов (рис. 2-7). Ответ респондента на каждый из тридцати вопросов используется в тесте дважды, т. е. для идентификации двух различных качеств личности, причем если в одном случае ответ имеет положительный, то в другом случае отрицательный весовые коэффициенты. Это означает, что при выборе ответа на вопрос мы увеличиваем результат тестирования одного качества и при этом обязательно уменьшаем результат тестирования другого качества. Например, ответ на десятый вопрос (представьте себе, что Вы профессор университета; какому предмету Вы отдали
Рис. 4. Первичная ИНС модель качества В (склонность к работе на производстве). Средняя квадратичная ошибка модели в сравнении с тестом -9,71 -10-9
бы предпочтение в свободное время: А. занятиям по литературе; Б. опытам по физике, химии; см. табл. 1) имеет положительный коэффициент передачи 0,38 при оценке качества Б (склонность к умственным видам работ, см. рис. 3) и отрицательный коэффициент передачи -0,36 при оценке качества Г (склонность к эстетике и искусству, см. рис. 5). Во всех остальных случаях (рис. 2, 4, 6, 7) ответ на десятый вопрос является незначимым. Это означает, что, если респондент ответит на десятый вопрос < Конечно А >, что соответствует номеру 1 (см. табл. 2), то это приведет к увеличению оценки качества Б, но одновременно уменьшит оценку качества Г. Если же респондент ответит на десятый вопрос < Конечно Б >, что соответствует номеру 4 (см. табл. 2), то это приведет к увеличению оценки качества Г, но одновременно уменьшит оценку качества Б.
Рис. 5. Первичная ИНС модель качества Г (склонность к эстетике и искусству). Средняя квадратичная ошибка модели в сравнении с тестом - 9,36-10-9
В табл. 4 указаны значимые вопросы в определении качеств А - Е. Ее использование совместно с рис. 9 позволяет проводить эксперименты с тестом таким образом, чтобы максимизировать или минимизировать оценку какого-либо качества. Например, при оценке качества Б значимыми являются только ответы на вопросы 1, 3, 6, 10, 12, 15, 18, 21, 25 и 28 теста. Причем для максимизации оценки качества Б при ответе на вопросы теста, на вопросы, имеющие отрицательные коэффициенты передачи (1, 3, 6, 18 и 28), необходимо отвечать < Конечно А >, а на вопросы, имеющие положительные коэффициенты передачи (10, 12, 15, 21 и 25), необходимо отвечать < Конечно Б >. При этом оценка качества Б будет равняться 30 баллам. Ответы на другие вопросы теста не оказывают влияния на оценку качества Б. Для минимизации оценок качества Б необходимо поступать наоборот, т. е. отвечать < Ко-
нечно Б > на вопросы (1, 3, 6, 18 и 28) и < Конечно А > на вопросы (10, 12, 15, 21 и 25). При этом оценка качества Б будет равняться нулю баллов.
Модели качеств А - Е (рис. 8) теперь можно объединить в общую ИНС-модель теста Л.А. Йовайши. Эта модель показана на рис. 9.
Проверку адекватности модели проводили с использованием новой случайной выборки ответов на вопросы теста (такая последовательность ответов не использовалась в обучающей выборке). В табл. 5 показаны рассчитанные по ИНС модели оценки качеств А - Е в сравнении со значениями, полученными из теста. Средняя относительная погрешность модели составила около 2,7 %, что может быть интерпретировано как удовлетворительный результат. ИНС модель, показанная на рис. 9, может быть признана адекватной.
Рис. 6. Первичная ИНС модель качества Д (склон- Рис. 7. Первичная ИНС модель качества Е (склонность к подвижным видам деятельности). Средняя ность к планово-экономическим видам работ или
квадратичная ошибка модели в сравнении с тестом - степень материальной заинтересованности). Средняя
9,59-10-9 квадратичная ошибка модели в сравнении с тестом -
8,56-10-9
Таблица 4
Значимость вопросов при тестировании качеств личности по методике Л.А. Йовайши
Тестируемое качество личности Значимые вопросы
Качество А (склонность к работе с людьми) 3, 5, 7, 9, 14, 17, 20, 23, 25, 27 (всего 10 значимых вопросов)
Качество Б (склонность к умственным видам работ) 1, 3, 6, 10, 12, 15, 18, 21, 25, 28 (всего 10 значимых вопросов)
Качество В (склонность к работе на производстве) 4, 8, 12, 14, 16, 19, 21, 23, 26, 30 (всего 10 значимых вопросов)
Качество Г (склонность к эстетике и искусству) 2, 5, 8, 10, 13, 16, 18, 22, 27, 29 (всего 10 значимых вопросов)
Качество Д (склонность к подвижным видам деятельности) 2, 6, 9, 11, 13, 17, 19, 24, 28, 30 (всего 10 значимых вопросов)
Качество Е (склонность к планово-экономическим видам работ или степень материальной заинтересованности) 1, 4, 7, 11, 15, 20, 22, 24, 26, 29 (всего 10 значимых вопросов)
Рис. 8. Фрагменты ИНС модели с удаленными несущественными связями. Средняя квадратичная ошибка фрагментов в сравне-ачества А - 4,68-10-6; для ка1 качества Д - 3,61 -10-6; для качества Е - 3,86-Ю-6
нии с тестом: для качества А - 4,68-Ю-6; для качества Б - 2,85-10 6; для качества В - 6,41-10 6; для качества Г - 5,55-Ю-6; для
X
(7)----1 0,41468
-0,12553
(2 )---1 0,43561
0,31043
(3 )---1 -0,37091
0,34844
(Т)----1 -0,38271
0,32051
(5 )---1 -0,08139
-0,37379
(6 )---1 0,42754
0,28101
(7 )---1 -0,34073
0,35584
(в)----1-0,12151
0,30424
(V)----1-0,41574
0,38742
ПШ-----1-0,11559
-0 дата
©—ЕЙ
0,402
@------1 -0,37284
0,12508
(Тз)---1 -0,45777
0,33311 И4)—| -0,36739 0,36767
Мб)----[^0,37998
-0,.
-0,3102 (г?)—| 0,42018 -0,36801 @—| 0,13135 -0,35581
@------1 0,43387
0,30649
(20 )----1-0,36982
0,35506
(21 )--1 -0,32559
0,11951
(22)—| -0,43005 -0,32202
(23)—| 0,35163 -0,43756
(24 )--1 0,38663
-0,32118
38282
[а
О.звииа
(26)—1-0,4198 -0,31631
(27 )-- 0.12339
-0,38935
(28 )-- 0,45057
0,08501
(29 )----0,41003
0,39854
(30)—ЕЙ
Рис. 9. Полная ИНС модель теста Л. А. Йовайши
Таблица 5
Проверка адекватности ИНС модели теста Л. А. Йовайши
Показатель Качество А Качество Б Качество В Качество Г Качество Д Качество Е
Тест 14 15 14 17 16 14
Расчет 13,5 14,7 13,5 15,7 15,8 13,4
Отн. погр., % 3,5 2,1 3,8 7,4 1,3 4,1
Тест 12 11 13 14 18 22
Расчет 11,3 10,1 12,3 14,5 18,2 22,7
Отн. погр., % 5,7 8,5 5,4 3,9 1,2 3,1
Тест 16 12 15 16 10 21
Расчет 15,8 11,2 14,6 15,3 8,7 21,5
Отн. погр., % 1,2 6,6 2,8 4,3 12,6 2,3
Интересно отметить следующий факт. Полное число комбинаций ответов по тесту Л.А. Йовайши есть: 430 = = 1152921504606846976. Здесь 4 - число вариантов ответа на один вопрос; 30 - общее число вопросов. Поскольку матрица обучающей выборки включала всего 109 строк, то аппарат ИНС позволил получить адекватную модель по 109/1152921504606846976 = = 9,454-10-17 части генеральной совокупности данных. Такую способность ИНС к построению адекватной модели в условиях недостатка исходных данных можно считать просто потрясающей!
Таким образом, эксперименты с построением ИНС модели психологического теста показали принципиальную возможность использования аппарата искусственных нейронных сетей в решении задач идентификации внутренней структуры психолого-педагогических объектов.
В этом примере мы показали, что: 1) аппарат ИНС может быть использован для моделирования в психологических системах; 2) поскольку тест представляет собой в некотором смысле модель личности, то, по всей видимости, по аналогичной технологии возможно многое узнать и о системе связей самой личности; 3) с помощью аппарата ИНС можно получить внутреннюю структуру психологического теста даже в том случае, если иметь только его исполняемый модуль; это может быть полезно при разработке новых тестов (использование готовых связей без проведения исследования, изучение устройства тестирующей программы в образовательных целях).
§2. Разработка технологии построения адаптивных систем психологического тестирования на базе ИНС на примере идентификации структуры и содержания понятия «уровень готовности индивида (УГИ) к познавательной деятельности в вузе»
Уровень готовности индивида к познавательной деятельности нами понимается как комплексный показатель, характеризующий предрасположенность этого индивида к получению определенной профессиональной квалификации и включающий в себя такие компоненты, как уровень интеллекта, наличие определенных знаний и умений, мотивацию к обучению, творческие и иные способности, которые могут быть использованы им в рамках выбранной специальности. Структура УГИ - это наличие тех или иных компонентов, степень их важности при расчете УГИ, система возможных взаимосвязей между отдельными компонентами и самим показателем. Под содержанием УГИ мы понимаем наполненность каждого из компонентов конкретными сведениями об индивиде, которые могут быть объективно получены путем его изучения с помощью различных экспериментальных методик, системы тестов, а также наблюдения за ним [1].
Существующие диагностические процедуры психологического исследования личности позволяют оценивать различные ее качества, такие как уровень интеллекта, знания и умения в рамках определенных предметов, профессиональную ориентацию, мотивацию к познавательной деятельности, свойства памяти и т. д.,
однако, они не позволяют ответить на вопрос о том, какому из этих важных компонентов отдать предпочтение или как использовать их комплексно.
Также разрабатываемые системы для психологического тестирования должны обладать следующими возможностями: не использовать трудоемкую традиционную процедуру по выявлению корреляции и значимости факторов; использовать результаты тестирования каждого следующего респондента для совершенствования своей структуры и учета данного контингента обучаемых; адаптироваться к определению УГИ различных групп и изменившимся условиям в процессе эксплуатации.
Разработанная нами технология построения адаптивных систем психологического тестирования на базе ИНС позволяет учитывать указанные недостатки, а также с ее помощью возможно выявить структуру и содержание рассматриваемого показателя.
Технология включает в себя следующие этапы:
1 этап. Построение первичной модели профессиональных качеств индивида на основе аппарата искусственных нейронных сетей и какой-либо известной системы психологического тестирования. После реализации первого этапа мы имеем ядро модели, не адаптированное к заданной предметной области. Для определения УГИ к познавательной деятельности ядро должно быть дополнено возможностью оценки некоторых дополнительных качеств индивида.
В блоке 1 производится формирование первичного пакета заданий для тестируемых. Как правило, такой пакет заданий может быть получен из известной батареи психолого-педагогического тестирования, близкой по существу решаемой задачи к определению УГИ. Поскольку первичный пакет заданий будет существенно изменен в дальнейшем по мере реализации данной технологии, способ его формирования не является определяющим. При определении структуры и содержания уровня готовности студентов к познавательной деятельности в качестве первичного пакета заданий рассмотрены вопросы известной методики Л.А. Йо-вайши по выявлению склонностей к различным сферам деятельности (см. пример 1).
В блоке 2 осуществляется многократный прогон теста, выбранного в блоке 1 в режиме тестируемого. При этом фиксируются ответы на задания теста и числовые значения профессиональных качеств, полученные в ходе тестирования. В результате выполнения блока 2 формируется матрица, строками которой являются ответы (номера ответов) на вопросы теста, а последним столбцом матрицы являются числовые значения профессиональных качеств студента. Данная матрица используется в последующих операциях в качестве обучающей выборки для ИНС.
В блоке 3 осуществляется формирование структуры искусственной нейронной сети. Для этой цели использовалась одна из программ-оболочек, предназначенных для создания и работы с ИНС. На этом этапе выбираются: количество входных нейронов (как правило, это число должно быть равно числу заданий используемого теста); количество выходных нейронов (это число должно быть равно числу тестируемых профессиональных качеств индивида); количество слоев и количество нейронов в слое (выбираются в соответствии с решаемой задачей); система связей между нейронами
(выбирается в соответствии с решаемой задачей, первоначальная конструкция может быть разработана по принципу «каждый с каждым»); активационные функции нейронов (выбираются из известного набора -линейная, параболическая, сигмоид, ступенчатая функция). Реализация этого этапа является одним из самых тонких мест в указанной технологии. От того, насколько удачно выбрана структура ИНС, в значительной степени зависит ее способность к обучению, адекватность модели и количество итераций проверки этих свойств, которое предстоит выполнить на пути реализации технологии (см. рис. 10). Необходимо отметить, что последующие блоки (блоки 5 и 8) гарантируют адекватность модели на ИНС даже в том случае, если первоначальная структура была выбрана неверно.
В блоке 4 осуществляется обучение созданной в блоке 3 ИНС на основе обучающей выборки, получен-
ной в блоке 2. При этом используются стандартные процедуры, реализующие методы нелинейного программирования (методы Монте-Карло, покоординатного спуска, градиентные и их комбинации).
В блоке 5 осуществляется проверка обучаемости ИНС. Ее возможность обучения может быть легко оценена по степени близости выходных значений векторов (профессиональные качества индивида) для ИНС и исходного теста. Если сеть не обучается или обучается медленно, то это указывает на неправильный выбор ее структуры в блоке 3. Поэтому в соответствии со схемой (рис. 10) необходимо осуществить коррекцию структуры. Если сеть обучается - это указывает на то, что структура в блоке 3 выбрана верно и можно переходить к выполнению следующих операций.
ФОРМИРОВАНИЕ ПЕРВИЧНОЙ МОДЕЛИ УГИ
_1__________________________
Формирование первичного пакета заданий на базе известной системы тестирования
^2 I
Многократный прогон теста и формирование обучающей выборки для ИНС
^3.
Увеличение объема обучающей выборки
=6---------
Коррекция представлений о структуре ИНС
Формирование структуры ИНС
Совместная проверка модели ИНС и теста
_10
Удаление несущественных связей ИНС и окончательная настройка модели
Выбирается какой-либо из известных пс ихол о го-педагогических тестов для оценки профессиональных качеств
Формируется рандомизированная матрица возможных ответов; фиксируются числовые значения оценок профессиональных качеств
Формируется структура ИНС: кол-во входных и выходных нейронов, число слоев, система связей между нейронами, активационные функции нейронов
минимизируется невязка расчетного и выборочного значений выходных векторов за счет выбора весовых коэффиентов
Определяется по степени близости к нулю минимального значения функции невязки
Сравниваются результаты, полученные на основе используемого теста и ИНС при одинаковых значениях входных параметров
Определяется по степени близости выходных результатов теста и И НС
Удаляются связи, значения весовых коэффициентов которых меньше заданного порогового уровня
Рис. 10. Технология определения структуры и содержания уровня готовности индивидов к познавательной деятельности (формирование первичной модели)
В блоке 6 осуществляется коррекция представлений
о структуре ИНС. На этом этапе полезно связать число слоев ИНС, систему связей и функции нейронов с реально существующими свойствами системы тестирования.
В блоке 7 осуществляется совместная проверка модели, полученной в результате обучения ИНС в блоке 4 и теста. При этом на входы ИНС и в качестве ответов на задания теста выбираются одинаковые комбинации, не включенные в обучающую выборку в блоке 2. По
результатам этой проверки делается заключение об адекватности модели.
В блоке 8 осуществляется проверка адекватности модели, разработанной в предыдущих блоках. Адекватность оценивается на основе близости значений профессиональных качеств индивида, полученных на основе теста и ИНС. В большинстве случаев адекватность модели достигается, т. к. в блоке 5 уже проверялась возможность обучения ИНС с данной структурой связей.
КОРРЕКЦИЯ МОДЕЛИ УГИ
Формирование вторичного пакета заданий
„12,
1£
Модификация структуры ИНС в соответствии с новым пакетом заданий
Ж
„14,
Опрос респондентов
Обучение респондентов предметной области
г-15 ^-------=
Ранжирование респондентов > по уровню профессиональной пригодности
.-16
Обучение модифицированной ИНС
Проверка обученной ИНС для тестирования независимой группы респондентов
Предлагаются задания (системы зада-" ний), характеризующие интеллект, мотивационные особенности, способность к моделированию предметной области . и др. особенности индивида _
'Структура, установленная в пункте 10 " дополняется входными, выходными и функциональными нейронами и системой связей в соответствии с .вторичным пакетом заданий
Формируется матрица ответов респондентов на задания из вторичного пакета; используется специальная тестирующая программа
Производится обучение респондентов или групп респондентов в соответствии с существующим стандартом профессионального образования
'Производится ранжирование респон- _ дентов экспертами на основании результатов конкретной профессиональной деятельности; осуществляется .оценка респондентов _
Минимизируется невязка расчетного и выборочного значений выходных векторов за счет выбора весовых коэффиентов
Определяется по степени близости к нулю минимального значения функции невязки
Сравниваются результаты, полученные по модели ИНС и реальные профессиональные качества независимой группы респондентов
Определяется по степени близости выходных результатов теста и ИНС
Рис. 11. Технология определения структуры и содержания уровня готовности индивидов к познавательной деятельности (коррекция модели)
Рис. 12. Технология определения структуры и содержания уровня готовности индивидов к познавательной деятельности (определение структуры и содержания УГИ)
В блоке 9 производится увеличение объема обучающей выборки. Ее полный набор должен состоять из N независимых комбинаций в тесте, где требуется выбрать один из предложенных вариантов ответов. Здесь N - количество вариантов ответов на каждое задание, т - количество заданий. Однако для обучения нейронной сети изначально бывает достаточно намного меньшего количества комбинаций.
В блоке 10 осуществляется удаление несущественных связей ИНС и окончательная настройка модели. Несущественными считаются связи, весовые коэффициенты которых ниже заданного, определяемого пользователем уровня. Такие связи практически не оказывают никакого воздействия на качество работы всей модели в целом. Тем не менее, после их удаления для окончательной настройки модели необходимо еще раз провести обучение сети.
Результатом выполнения операций в блоках 1-10 является формирование первичной модели профессиональных качеств студента на основе аппарата искусственных нейронных сетей. Первичная модель представляет собой, по сути, обобщенную модель профессиональных качеств индивида без конкретизации области его деятельности. Такую модель можно использовать для выявления склонностей к различным сферам деятельности, но она еще не пригодна для определения уровня готовности студентов к познавательной деятельности в определенной сфере. Для определения УГИ ядро должно быть дополнено возможностью
оценки некоторых других качеств личности студента. Указанные операции выполняют на этапе коррекции модели (блоки 11-19), в результате чего формируется модифицированная модель на ИНС (рис. 11).
2 этап. Коррекция первичной модели за счет введения дополнительных заданий и модификации структуры ИНС. После реализации второго этапа мы имеем ИНС-модель профессиональных качеств индивида. Эту модель можно использовать для определения УГИ к познавательной деятельности в определенной сфере на том основании, что, во-первых, она включает в себя известные данные о профессиональной пригодности индивида (ядро модели), дополнения, позволяющие оперировать в заданной профессиональной области и с учетом заданного контингента обучаемых, а во-вторых, вся модель обучена на выборке из опытных данных (матрице ответов респондентов).
В блоке 11 осуществляется формирование вторичного пакета заданий, направленных на тестирование УГИ. В формировании принимают участие эксперты в заданной предметной области. В нашем случае в качестве экспертов выступали ведущие преподаватели Тамбовского государственного университета им. Г.Р. Державина: профессора и доценты, ведущие лекционные курсы, практические и лабораторные занятия, хорошо знающие студентов, их личностные характеристики, а также сотрудники деканатов, в значительной степени осведомленные о профессиональных качествах обучаемых. В качестве заданий (системы заданий) предла-
гаются вопросы, характеризующие способность студентов к моделированию предметной области, мотивацию, знание предметной области, умения и навыки работы в ней. Указанные задания выбираются с таким расчетом, что они могут дополнить первичный пакет, сформированный в блоке 1.
В блоке 12 осуществляется модификация структуры ИНС в соответствии с вторичным пакетом заданий. Структура ИНС дополняется входными, выходными и функциональными нейронами, системой связей между ними. При этом ядро модели, сформированное ранее в блоках 1-10, остается на этом этапе неизменным, а новые структуры лишь дополняют его. В результате выполнения операций в блоках 11-12 имеем модель УГИ к познавательной деятельности, которая, однако, еще не подверглась идентификации параметров и проверке адекватности.
Проверка адекватности модели и коррекция ее параметров осуществляются в сравнении с реальными эмпирическими данными, представляющими собой оценки УГИ конкретных индивидов в заданной предметной области. Указанные действия выполняются в блоках 13-16.
В блоке 13 осуществляется опрос респондентов. Опрос проводится на первом курсе среди студентов, которые только что поступили в университет. При этом используется вторичный пакет заданий, сформированный в блоке 11. По результатам опроса формируется матрица ответов респондентов. Для упрощения работы с респондентами и придания опросу безличностного характера используется специально разработанная тестирующая программа. Данные опроса хранятся в течение периода первичного обучения специальности, по истечении которого возможно делать выводы о развитии профессиональных качеств обучаемого. Обучение студентов в этот период проводится по обычной программе профессионального образования и в соответствии с государственным стандартом профессионального образования по указанной специальности (блок 14). По истечению указанного периода экспертами осуществляется ранжирование респондентов по уровню профессиональной пригодности.
После того, как для каждого респондента произведен подсчет оценок, матрица ответов, полученная при опросе респондентов в блоке 13, дополняется оценками профессиональных качеств, после чего эту матрицу можно использовать для обучения модифицированной модели на ИНС.
В блоке 16 производится обучение структуры ИНС, созданной ранее в блоке 12 на основе обучающей выборки, полученной в блоке 15. При этом используются стандартные процедуры, реализующие методы нелинейного программирования.
В блоке 17 (как это было ранее в блоке 5) осуществляется проверка обучаемости ИНС. Ее возможность обучения может быть легко оценена по степени близости выходных значений векторов (профессиональные качества индивида) для ИНС и матрицы ответов респондентов. Если сеть не обучается или обучается медленно - это указывает на неверное формирование вторичного пакета заданий (блок 11) и неправильный выбор ее структуры (блок 12) . Поэтому в соответствии с общей схемой необходимо осуществить коррекцию этих компонентов модели. Если сеть обучается - это
указывает на то, что можно переходить к выполнению следующих операций.
В блоках 18, 19 проводится проверка обученной ИНС для тестирования независимой группы респондентов. При этом оценивается, насколько хорошо ИНС-модель, сформированная на основе ядра, включающего какую-либо систему психологического тестирования и дополнений, а также заданий для конкретного контингента и профессиональной области, позволяет оценивать профессиональные качества респондентов из контрольной группы. В случае, если оценки, получаемые по модели, не противоречат мнению экспертов, то модель считается адекватной и будет использована в дальнейшем для оценки структуры и содержания УГИ к познавательной деятельности. В случае, если сразу не удается получить адекватную модель, необходимо снова перейти к блоку 11 - формирования вторичного пакета заданий.
Результатом выполнения операций в блоках 11-19 является формирование вторичной модели профессиональных качеств индивида на основе аппарата искусственных нейронных сетей. Такая модель представляет собой обобщенную модель профессиональных качеств студента с конкретизацией области его деятельности, общего уровня контингента обучаемых и т. д. Эту модель можно использовать для определения уровня готовности студентов к познавательной деятельности в определенной сфере на том основании, что, во-первых, она включает в себя известные данные об их профессиональной пригодности, дополнения, позволяющие оперировать в заданной профессиональной области и с учетом заданного контингента обучаемых, а во-вторых, вся модель обучена на выборке из эмпирических данных, соответствующих заданной профессиональной области.
3 этап. Анализ модели и определение структуры и содержания трудноформализуемого понятия (например, УГИ) на основе модифицированной модели (рис. 12).
Процесс определения структуры и содержания УГИ с помощью модели начинается с анализа и удаления несущественных связей (блок 20). Как и в блоке 10, несущественными считаются связи, весовые коэффициенты которых ниже заданного, определяемого пользователем уровня. Такие связи практически не оказывают никакого воздействия на качество работы всей модели в целом.
В этой модели интегрирована информация об уровне готовности индивидов к обучению в заданной профессиональной области, важности отдельных показателей и групп показателей при оценке УГИ, взаимовлиянии различных показателей и т. д. Можно считать, что обученная ИНС является моделью определенных качеств студента в рамках заданной предметной области, поскольку программа работы с ИНС устроена таким образом, что из нее легко может быть извлечена информация о структурных элементах, их взаимосвязи, значимости коэффициентов передачи.
В блоке 21 из всей совокупности заданий вторичного пакета выделяются задания, которые, по мнению экспертов, тестируют одинаковые качества студента. Для успешной реализации этой задачи экспертами может быть предложен или ими может быть разработан заранее перечень тестируемых свойств индивида в
рамках заданной предметной области. Результатом операций блока 21 является таблица соответствий заданий и соответствующих им тестируемых качеств индивида.
В блоке 22 осуществляется определение значимости заданий внутри каждой группы. Эта задача решается на основе анализа коэффициентов передачи соответствующих связей нейронной сети. Чем выше абсолютное значение коэффициента передачи, тем большая важность может быть приписана анализируемому свойству индивида. При этом выделяются задания, ответы на которые оказывают наиболее существенное влияние на значения тестируемых качеств, задания, оказывающие
1
Рис. 13. Структура готовности студентов первого курса к познавательной деятельности в процентах к целому. Цифрами обозначены: 1 - уровень мотивации к обучению; 2 - склонность к умственным видам деятельности; 3 - умение моделировать и принимать решения в данной предметной области; 4 - исходный уровень образования; 5 - способность к запоминанию; 6 - логическое мышление. Неравенство суммы компонентов структуры 100 % объясняется их взаимным пересечением
значительное влияние, и задания, ответы на которые оказывают очень малое влияние на тестируемые качества. Таким образом, при реализации процедур, предусмотренных блоком 22, практикующие психологи и педагогические работники получат ценную информацию о том, какие вопросы пригодны для оценки определенных качеств студента, а какие не вполне подходят для этого.
В блоке 23 осуществляется определение значимости групп факторов в оценке УГИ. В зависимости от структуры полученной нейронной сети могут быть использованы аддитивные и мультипликативные функциональные зависимости для определения на основе имеющихся коэффициентов передачи каналов типа «ответы на задание - тестируемое качество индивида», обобщенных коэффициентов для групп. В зависимости от обстоятельств могут быть использованы и комбинированные аддитивно-мультипликативные зависимости.
Поскольку ответы на многие задания могут быть использованы для тестирования различных групп свойств индивидов, в блоке 24 осуществляется оценка таких взаимовлияний и формулируются выводы о структуре перекрестных связей между факторами различных групп.
Так как в блоках 21-24 ранее выявлены: задания, относящиеся к различным группам тестируемых свойств, значимость групп в определении комплексного показателя и оценки взаимовлияния отдельных факторов, будем считать, что задача определения структуры и содержания понятия УГИ решена (блок 25).
В качестве примера реализации данной технологии получены структура и содержание УГИ к познавательной деятельности для студентов первого курса, приведенные на рис. 13-14.
Таким образом, данная технология может быть использована для построения адаптивных систем психологического тестирования на базе ИНС, а также для идентификации внутренней структуры и содержания понятий, используемых в психологических и социологических исследованиях.
(0,47)
- знания и умения, получен-
Исходный ные в школе и в самосто-
уровень ятельных занятиях;
образования: - способность Применить их
в решении задач.
(0,78)
- логически связанного
Способность материала;
к запоминанию: (0,22)
- логически несвязанного
материала.
Уровень мотивации связанный с желанием: - получить престижную профессию, (0,73) - добиться высоких личных результатов: (0,27)
1 -
Способность к ситуационному моделированию предметной области: -предвидеть развитие событий (0,42) - принимать быстрые и ,п ™ правильные решенияг-0^ -находить правильные (0,26) технологические решения.
1
Склонность к умственным видам деятельности: -уровень развития мыслительных операций (анализ, синтез,сравнение и др.Х(0,36) -способность принятия решений в нестандартных ситуациях,(0,64) .
- способность к оперированию
понятиями'(0,24)
Логическое - способность к формированию
мышление: суждений, (0,64)
- способность к формированию
умозаключений. (0,12)
Рис. 14. Содержание готовности студентов первого курса к познавательной деятельности. Цифры в скобках показывают относительный вес различных качеств первокурсников
§3. Разработка нейросетевой модели профессиональных предпочтений старшеклассников на основе аппарата ИНС
В настоящее время Министерством образования и науки РФ разработаны новые стандарты среднего образования, которые предполагают приобретение учащимися, начиная с 10-го класса, профессиональных навыков определенного профиля (профильное обучение). Однако не все учащиеся 9-х классов способны самостоятельно оценить свои возможности и выбрать соответствующий им в наилучшей степени профиль обучения.
Для проведения объективной работы по профессиональной ориентации школьников с учетом социального заказа необходимо своевременно выявлять их профессиональный потенциал. Поэтому было бы желательно разработать компьютерный тест или программу, которая помогает учащимся осуществлять такое профилирование на основе оценки их личностных качеств.
Ранее нами было показано [1-5], что такая модель может быть реализована на основе аппарата искусственных нейронных сетей, который обладает свойством обучаемости по эмпирическим данным. При этом в нашем случае в качестве эмпирических данных можно использовать выборку, которая была получена в результате анкетирования старшеклассников г. Тамбова, в котором приняли участие 1052 школьника г. Тамбова. Специально разработанная анкета имела следующую структуру: статистическая информация, успеваемость, профессиональный выбор, общественная активность, творчество, досуг, здоровье, семья [6].
Разработка компьютерной нейросетевой модели осуществлялась в соответствие со следующими этапами.
Этап 1. Из всей совокупности факторов, значения которых получены в ходе анкетирования [6], выделяются те факторы, которые оказывают существенное влияние на профессиональные предпочтения школьников. Главным критерием значимости фактора, на наш взгляд, является консолидированное мнение группы при ответе на какой-либо вопрос анкеты.
Для решения этой проблемы разработана специальная программа, позволяющая для лиц, профессиональные предпочтения которых указывают по данным анкетирования на определенный профиль, подсчитать суммы ответов по каждому вопросу анкеты и вывести те из них, где сумма групповых предпочтений больше, чем некоторые фиксированные уровни 50, 60, 65 и 70 %.
Этап 2. Проводится ранжирование профилей профессий таким образом, чтобы каждому из них можно было поставить в соответствие определенное число (номер) (рис. 15).
Этап 3. Из всего массива данных выделяется выборка для обучения ИНС, такая, чтобы в качестве вектора независимых координат в нее входили значимые факторы, а в качестве моделируемого фактора - тот или иной профессиональный профиль, представленный числом (этап 2).
Этап 4. Формирование ИНС-модели. На этом этапе выбирается структура ИНС, производится ее обучение и, при необходимости, осуществляется коррекция структуры сети в соответствии с ранее разработанной технологией [1-4]. Учитывая предыдущий опыт [1, 2, 4], в качестве такой оболочки выбрана программа КМС. Для случая 60 % групповой активности наилучшие результаты (наименьшую погрешность) дала ИНС-модель, показанная на рис. 16.
Этап 5. Производится проверка адекватности полученной ИНС-модели профессиональной предрасположенности по имеющимся эмпирическим данным и валидности тестирующей компьютерной технологии при определении профессиональных профилей школьников старших классов.
В результате обучения искусственной нейронной сети построена ИНС-модель профессиональных предпочтений учащихся 9-10 классов, которая может быть использована для их профилизации.
Адекватность модели проверили путем сравнения расчетных значений с результатами анкетирования профессиональных предпочтений школьников. В 72 % случаев ИНС-модель показала верные профессиональные профили; в оставшихся 28 % случаев был показан близкий профиль. Полученные результаты, на наш взгляд, следует считать приемлемыми для использования модели в профессиональной ориентации школьников.
Погрешность при обучении составила 0,83 при длине шкалы профилей, равной 8 единицам. Это означает, что при тестировании школьника с помощью ИНС-модели может быть получен как искомый профиль, так и два самых близких к нему.
1 Ь Культура и искусство
3 - Экономика и юриспруденция
4 - Педагогика и спорт
5 - Медицинский
6 - Естественно-научный
8 - Физико-математический
Рис. 15. Ранжирование профилей по близости выбранных специальностей. Номера профилей соответствуют принципу: по мере возрастания номеров снижается роль интуиции, которая в максимальной степени проявляется в искусстве (профиль «культура и искусство») и повышается роль точного знания, которое в максимальной степени проявляется в физико-математических науках (профиль «физико-математический»)
Рис. 16. Совместное использование в модели при 60-процентном уровне групповой активности линейной, параболической (2-й и 3-й степеней) и сигмоидальной активационных функций нейронов
§4. Технология построения экспертных информационных систем с интеллектуальным ядром на основе искусственных нейронных сетей
В различных сферах человеческой деятельности существуют объекты, решение задач управления которыми связано с анализом многофакторных зависимостей, с трудом поддающихся формализации ввиду недостаточности информации и ее значительной зашумленности. В некоторых случаях специалист в данной предметной области (эксперт) может решать такие задачи, пользуясь значительным опытом, интуицией, прогностической способностью в данной сфере. Однако такие решения являются в значительной степени субъективными. Например, при смене эксперта реализуются уже другие управленческие решения, которые, однако, могут быть не хуже предыдущих.
Таким образом, эксперт заключает в себе некоторую «модель» данной предметной области, реальная формализация которой часто бывает невозможна или сильно затруднена. Отчасти данная проблема, связанная с накоплением знаний об объекте, их обобщением и интерпретацией может быть решена на основе разработки компьютерных экспертных систем (ЭС). Экспертные системы - специальные программы для ЭВМ, основанные на алгоритмах искусственного интеллекта и предполагающие использование соответствующей информации, полученной ранее от экспертов в заданной предметной области.
Основные идеи предлагаемой технологии. В данной статье рассмотрена технология, позволяющая разрабатывать ЭС с использованием в качестве интеллектуального ядра ИНС-моделей, т. е. моделей, построен-
ных на основе искусственных нейронных сетей (ИНС). Сделанный выбор обусловлен способностью ИНС к обучению и генерализации (обобщению) накопленных знаний [7].
Предлагаемая в данной статье технология предполагает построение экспертных систем, определяющих решение задач, возникающих в различных предметных областях, на основе накопленной базы знаний о рассматриваемой задаче. Формирование базы знаний происходит при совместной работе пользователей и эксперта в исследуемой предметной области задачи. При последовательном вводе информации пользователями (входные данные задачи) происходит ее оценка экспертом, при этом определяются соответствующие выходные состояния задачи. Таким образом, происходит накопление базы знаний о рассматриваемой задаче до необходимого объема. Затем происходит построение интеллектуальной модели задачи. Моделирование осуществляется с помощью построения и обучения искусственной нейронной сети на основе накопленных данных. Данный метод моделирования ранее был рассмотрен в работе [8]. По мере поступления новой информации в базу знаний, полученная интеллектуальная модель задачи совершенствуется. При накоплении некоторого критического объема базы знаний модель способна самостоятельно определять решение задачи. Таким образом, роль эксперта уменьшается по мере формирования интеллектуального ядра системы. В результате функционирования предложенной технологии происходит построение экспертных систем, позволяющих решать конкретную задачу в заданной предметной области.
Способ реализации технологии. Предлагаемая технология реализуется путем разработки целостной интерактивной системы, состоящей из взаимосвязанных компонентов, позволяющих осуществлять построение нейросетевых экспертных систем. Для каждого компонента системы определен круг решаемых им задач. Система включает три основных компонента: информационная часть, компонент импортирования данных (интегратор), модуль работы с ИНС [9].
Все компоненты являются взаимосвязанными частями единой целостной системы, функционирующей поэтапно, согласно схеме, представленной на рис. 17. Каждому этапу соответствует реализация определенных задач.
Первый этап - накопление информации. На первом этапе происходит формирование и накопление базы знаний объекта. Назначения связей, представленных на рис. 1, на первом этапе функционирования:
1.1 - ввод пользователем параметрических характеристик объекта;
1.2 - вывод информации пользователю;
2.1 - запрос к базе данных (сохранение данных или запрос на данные);
2.2 - результаты запроса;
3.1 - запрос экспертом информации об объекте или ввод результатов анализа объекта;
3.2 - вывод информации эксперту.
Второй этап - построение модели. При получении определенного объема базы знаний объекта данные из базы импортируются в модуль работы с ИНС. На данном этапе происходит построение интеллектуальной модели объекта. Назначения связей, представленных на рис. 1, на втором этапе функционирования:
4.1 - осуществляется запрос на данные, хранящиеся в базе;
4.2 - в результате запроса данные поступают в интегратор;
5 - подготовленная обучающая выборка поступает в модуль работы с ИНС;
6 - результатом работы модуля является интеллектуальная модель объекта. Также на данном этапе происходит совершенствование модели объекта на основе вновь поступающих данных.
Третий этап - классификация. На данном этапе построенная интеллектуальная модель способна самостоятельно классифицировать поступающую в базу данных информацию. Назначения связей, представленных на рис. 1, на третьем этапе функционирования:
1.1 - ввод параметрических данных объекта;
2.1 - сохранение вновь поступившей информации в базе данных;
4.1 - запрос на вновь поступившую информацию;
Рис. 17. Общая схема функционирования компонентов системы
4.2 - результаты запроса передаются в интегратор на обработку;
5 - обработанная информация передается в модуль работы с ИНС;
6 - подача данных на вход ИНС;
7 - рассчитанный моделью результат поступает в интегратор;
4.1 - сохранение результатов, рассчитанных моделью в базе данных;
2.2 - передача из базы данных результатов;
1.2 - представление результатов, рассчитанных моделью пользователю.
Построение медицинской экспертной системы с интеллектуальным ядром с помощью предлагаемой технологии. В качестве примера реализации данной технологии при построении экспертной системы с интеллектуальным ядром на основе ИНС был выбран медицинский объект (начальная диагностика здоровья пациентов на основе результатов общего анализа крови).
Программная реализация модуля основана на алгоритме обучения ИНС, предложенном А.А. Арзамасцевым и др. в работе [10].
Общеклиническое исследование крови является одним из важнейших диагностических методов, которое тонко отражает реакцию кроветворных органов на воздействие на организм различных физиологических и патологических факторов. Во многих случаях оно играет большую роль в постановке диагноза.
В понятие «общеклиническое исследование крови» входят определение концентрации гемоглобина, подсчет количества эритроцитов, цветового показателя, лейкоцитов, скорости оседания эритроцитов и лейкоцитарной формулы.
Выборка для обучения ИНС представляла собой результаты общего анализа крови четырехсот пациентов. Входами обучающей выборки явились десять показателей общего анализа крови, включающие: НЬ - гемоглобин (г/л) - Хь скорость оседания эритроцитов (мм/ч) - Х2; лейкоциты (109/л) - Х3; эритроциты (1012/л) - Х4; цветовой показатель - Х5; лейкоцитарная формула (базофилы - Х6, нейтрофилы палочкоядерные -Х7, нейтрофилы сегментоядерные - Х8, лимфоциты -Х9, моноциты - Х10).
В качестве выходов ИНС были приняты различные состояния здоровья пациента, данные экспертом и соответствующие результатам анализа крови - У: 1 -здоров; 2 - необходимо амбулаторное лечение; 3 -необходимо стационарное лечение; 4 - экстренная госпитализация.
Программа, реализующая модуль работы с ИНС, позволяет выбрать два типа настройки сети - ручной, когда пользователь сам настраивает сеть для обучения, или автоматический - сеть настраивается самостоятельно. В качестве метода минимизации ошибки используются следующие методы - полного сканирования, метод Монте-Карло, градиентный метод.
Предварительно обучающая выборка тестировалась на предмет выявления и устранения в ней различных противоречивых данных.
В результате обучения ИНС была подобрана структура искусственной нейронной сети, которая схематически представлена на рис. 18.
Рис. 18. Схематическое изображение структуры искусственной нейронной сети, подобранной в результате работы программы
Данная сеть состоит из одного входного, одного выходного и одного скрытого слоя нейронов. Входной слой состоит из 10 нейронов, выходной - из 1 нейрона. Скрытый слой содержит 9 нейронов с линейной активационной функцией.
При оценке эффективности работы разработанной медицинской экспертной системы было выявлено, что ЭС дает правильные рекомендации в 69 % случаев, близкие рекомендации - в 29 %, неверные рекомендации - в 2 % случаев.
Таким образом, с помощью предложенной автоматизированной технологии построения экспертных систем была разработана экспертная система на основе искусственных нейронных сетей для медицинского объекта (диагностика здоровья пациентов на основе результатов общего анализа крови).
Достоинствами такой системы является способность к обучению на основе вновь поступивших данных. Навыки данной экспертной системы возрастают после каждого сеанса экспертизы.
Разработанная экспертная система может найти своё применение в различных медицинских учреждениях, где ведется общеклиническое исследование крови. Она может быть полезна лаборантам и стажерам, а также врачам для более эффективной организации своей работы.
Таким образом, в представленных примерах по использованию аппарата ИНС в психологической, социальной и медицинской сферах мы показали, что:
- аппарат ИНС является удобным математическим аппаратом для разработки адаптивных систем психологического тестирования;
- с его помощью можно осуществлять идентификацию структуры и содержания трудноформализуемых понятий, используемых в психологических исследованиях;
- аппарат ИНС позволяет строить адекватные модели психологических систем, что подтверждено конкретными примерами;
- на основе аппарата ИНС возможно осуществлять проектирование экспертных систем, использующих в качестве интеллектуального ядра ИНС-модели.
ЛИТЕРАТУРА
1. Зенкова Н.А. Психологическая модель готовности студентов первого курса к обучению в вузе: дис. ... канд. психол. наук. Тамбов, 2003.
2. Арзамасцев А.А., Зенкова Н.А. Моделирование в психологии на основе искусственных нейронных сетей. Тамбов: Изд-во ТГУ им. Г.Р. Державина, 2003. 106 с.
3. Арзамасцев А.А., Зенкова Н.А. Изучение основ искусственного интеллекта студентами психологических специальностей // Информатика и образование. 2004. № 7. С. 83-86.
4. Арзамасцев А.А., Зенкова Н.А. Система психологического тестирования на основе аппарата искусственных нейронных сетей // Искусственный интеллект. 2004. № 2. С. 237-242.
5. Зенкова Н.А. Применение методов искусственного интеллекта в компьютерной психодиагностике // Психология образования: проблемы и перспективы: материалы Первой Междунар. науч.-практ. конф. М., 2004. С. 233.
6. Арзамасцев А.А., Гостилович Т.А., Безрученко И.Е., Зенкова Н.А. Личностные качества, профессиональная предрасположенность и социальная активность школьников старших классов. Тамбов: ТГУ им. Г.Р. Державина, 2004. 103 с.
7. Осовский С. Нейронные сети для обработки информации / пер. с польск. И. Д. Рудинского. М.: Финансы и статистика, 2004. 344 с.
8. Арзамасцев А.А., Зенкова Н.А. Использование аппарата искусственных нейронных сетей для идентификации свойств личности в учебном процессе // Открытое образование. 2004. № 4. С. 61-64.
9. Арзамасцев А.А., Зенкова Н.А., Неудахин А.В. Автоматизированная технология построения экспертных систем с интеллектуальным ядром на основе ИНС-моделей // Открытое образование. 2008. № 3 (68). С. 35-39.
10. Арзамасцев А.А., Крючин О.В., Азарова П.А., Зенкова Н.А. Универсальный программный комплекс для компьютерного моделирования на основе искусственной нейронной сети с самоорганизацией структуры // Вестн. Тамб. ун-та. Сер. Естеств. и техн. науки. Тамбов, 2006. Т. 11. Вып. 4. С. 564-570.
Поступила в редакцию 7 июля 2009 г.
Arzamastsev A.A., Zenkova N.A., Neudahin A.V. Modeling in psychological, social and medical systems with the use of methods of an artificial intellect. In the work the approach to modeling of various objects from social sphere is considered: psychological, pedagogical, medical by means of the device of artificial neural networks. Strength and weaknesses of such approach is discussed. The technology of construction of expert systems with an intellectual core on the basis of artificial neural networks which can be used in various subject domains is offered.
Key words: modeling; artificial neural networks; an artificial intellect.