УДК 004.8:159.922.77
Е.В. СЛАВУТСКАЯ, В.С. АБРУКОВ, Л.А. СЛАВУТСКИЙ
ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ ПСИХОДИАГНОСТИКИ ШКОЛЬНИКОВ ПРЕДПОДРOСТКОВОГО ВОЗРАСТА
Ключевые слова: искусственные нейронные сети, психодиагностика, нелинейные модели, личностные качества, школьники 10-11 лет.
Для анализа данных психодиагностики используется аппарат искусственных нейронных сетей (ИНС). Анализируются взаимосвязи между личностными психологическими качествами школьников в возрасте 10-11 лет и их коэффициентом интеллекта (IQ). Показано, что вычислительные модели, построенные при помощи ИНС, позволяют оценить нелинейные зависимости между значениями психологических показателей, которые не удается получить традиционными статистическими методами обработки данных психологического тестирования.
E.V. SLAVUTSKAYA, V.S. ABRUKOV, L.A. SLAVUTSKIY DATA MINING OF THE YOUNGER ADOLESCENTS PSYCHODIAGNOSTIC RESULTS Key words: artificial neural networks, psycho diagnostic, nonlinear models, personality traits, schoolchildren of 10-11 years.
To analyze the psychodiagnostic data the artificial neural networks (ANN) are used. The relationship between individual psychological qualities of schoolchildren 10-11 years and their IQ was examined. It is shown that computational models created with the help of ANN can estimate the nonlinear relationship between the values of the psychological parameters, which can not obtain conventional statistical methods of data processing ofpsychological testing.
Для обработки данных психодиагностики повсеместно используются традиционные статистические методы анализа данных, такие как статистическая теория оценивания, корреляционный, факторный анализ и т.д. [4]. При проведении экспериментальных исследований возникают ситуации, когда интерпретировать результаты приходится при большом числе исходных психологических признаков (большая размерность данных) и недостаточном для полноценного статистического анализа числе респондентов. В таких условиях анализ взаимосвязей между психологическими признаками является трудной задачей.
Перечисленные проблемы могут быть минимизированы, если для анализа психодиагностических данных использовать аппарат искусственных нейронных сетей (ИНС) [10], позволяющий работать с неполной, с точки зрения статистического анализа, выборкой данных. При этом размерность данных не имеет решающего значения [2].
ИНС в последнее десятилетие находит все более широкое применение в задачах классификации, кластеризации, аппроксимации данных и прогнозирования [2, 10]. Аппарат ИНС основан на принципах когнитивной науки [3, 7, 11, 15] и может использоваться в практической психологии [1, 13, 14], но до сих пор широкого распространения в задачах обработки психодиагностических данных ИНС не получили.
Постановка задачи. В настоящей работе впервые приводятся результаты анализа психодиагностических данных школьников 10-11 лет с помощью ИНС. Исследовались взаимосвязи психологических характеристик личности школьников с их интеллектуальным показателем.
Изучаемый возрастной период является одним из самых сложных и интересных с психологической точки зрения. Он соответствует переходу учащихся из начальной школы в среднее ее звено, является преддверием пубертатного кризиса и началом коренных психофизиологических изменений [6,8].
Для анализа использовались результаты диагностики развития интеллектуальной сферы (коэффициент IQ) детей с помощью культурно свободного интеллектуального теста Р.Б. Кеттелла [9, 12]. Динамика развития эмоционально-волевых и коммуникативных свойств личности учащихся исследовалась с помощью 12-факторного опросника Р.Б. Кеттелла и Р.В. Коана CPQ (Childrens Personality Questionnaire) для детей в возрасте 8-12 лет. Опросник предназначен для определения личностных особенностей школьников и содержит 12 шкал для измерения степени выраженности черт личности, которые
Р.Б. Кеттелл называет конституциональными [12]. В табл. 1 приводится пример результатов психодиагностики, полученных по выборке 96 учащихся четвертых классов.
Таблица 1
№ Пол Личностные качества
A B C D E F G H I O 93 94
1 м 119 6 4 2 1 3 5 4 5 5 4 2 1
п ж 112 6 3 2 5 3 4 2 4 4 3 3 2
Примечание. Интерпретация личностных качеств в 12-факторном опроснике Р.Б. Кет-телла и Р.В. Коана (CPQ): А - общительность-замкнутость; В - абстрактное-конкретное мышление; С - эмоциональная стабильность-неустойчивость; Б - возбудимость-уравновешенность; Е - независимость-покорность; ^ - беспечность-озабоченность; О - высокая-низкая дисциплинированность; Н - смелость-робость; I - мягкость-твердость; О - тревожность-спокойствие; 23 - высокий-низкий самоконтроль; Q4 - напряженность-расслабленность.
Обработка результатов проводилась отдельно для мальчиков и девочек в качестве оценки гендерных особенностей школьников. В табл. 2 приведены результаты стандартного корреляционного анализа данных. Как видно из табл. 2, степень корреляции личностных качеств и ^ невысокая. Это говорит о том, что связь между личностными качествами и ^ существенно нелинейная.
Таблица 2
Пол Коэффициенты корреляции качеств личности с ВД
А В С D Е F G Н I О 93 94
м -0,065 0,234 -0,307 0,079 0,405 0,255 -0,137 0,055 0,424 0,261 0,060 0,311
ж 0,282 -0,264 0,255 -0,253 0,207 -0,290 0,278 -0,305 -0,317 -0,225 -0,306 -0,327
Примечание. Критическое значение коэффициента корреляции Пирсона при уровне значимости 0,05 и при выборке в 45 человек составляет для двухстороннего критерия 0,243.
Именно нелинейность обусловила выбор ИНС для анализа данных. Искусственные нейронные сети - термин, который обозначает вычислительные математические модели (и их программные или аппаратные реализации), построенные по принципу организации и функционирования биологических нейронных сетей - сетей нервных клеток (нейронов) в биологических организмах. Это понятие возникло при математическом моделировании процессов, протекающих в мозге человека.
В основе ИНС, как вычислительной структуры, лежит понятие единичного искусственного нейрона, моделирующего процессы, происходящие в естественном биологическом нейроне.
Единичный искусственный нейрон (рис. 1, а) состоит из входов, синапсов, сумматора, аксона и нелинейного преобразователя (функции активации).
В синапсах входные сигналы умножаются на число, характеризующее силу (вес) синапса. Сумматор выполняет сложение сигналов, поступающих по синапсам. Нелинейный преобразователь реализует нелинейную функцию одного аргумента - выходного сигнала сумматора. Эта функция называется функцией активации или передаточной функцией нейрона [5].
Нейрон в целом реализует скалярную функцию векторного аргумента и является единичным процессором. Математическая модель нейрона:
я=ЕВД + ь
1=1
где Ж, - вес 1-го синапса, , = 1...п; Ь - значение смещения (специально вводимая константа, облегчающая обучение ИНС - см. далее); Я - результат суммирования; X, -1-й компонент входного вектора (входной сигнал); У - выходной сигнал нейрона; п -число входов нейрона; ^ - функция активации сигнала сумматора.
а б
Рис. 1. Схема искусственного нейрона (а) и схема ИНС прямого распространения (б):
Xt - i-й компонент входного вектора (входные данные); Wi - вес i-го синапса (i = 1.. .и);
S - результат суммирования; Y - передаточный сигнал нейрона;
F - нелинейный преобразователь (функция активации)
ИНС - это сеть единичных нейронов, соединенных между собой. Число нейронов и схема соединения их друг с другом могут быть различными. Рассмотрим наиболее распространенный тип ИНС - ИНС прямого распространения (feed forward), в котором нейроны объединены в слои - рис. 1, б.
Приведенная схема ИНС состоит из одного входного слоя, одного «скрытого» слоя и одного выходного слоя. Нейроны в слое не связаны друг с другом, но они связаны с нейронами предыдущего и следующего слоя по принципу «каждый с каждым».
Вычисления производятся следующим образом. Перед поступлением на скрытые нейроны входные данные умножаются на веса вычислительных путей (стрелки, соединяющие левый слой с центральным, на рис. 1, б) нейронов «скрытого слоя». После прохождении «скрытого» слоя данные умножаются на веса вычислительных путей (стрелки, соединяющие центральный слой с правым, на рис. 1, б) нейронов выходного слоя. Нейроны выходного слоя с помощью функции активации вычисляют выходной сигнал (выходные данные).
Принципиальным отличием ИНС от обычных алгоритмических программ является то, что «работать» эта вычислительная структура может только после «обучения» на примерах (базе данных примеров). ИНС не программируется, а обучается, как, например, обучаются дети.
С математической точки зрения, обучение ИНС - это многопараметрическая задача нелинейной оптимизации.
С технической точки зрения, обучение заключается в нахождении совокупности (матрицы) весов вычислительных путей между нейронами, которая обеспечивает возможность «правильного» отображения входного вектора данных в выходные данные при любом наборе входных величин, т.е. возможность «правильного» отображения входной информация в выходную.
Во время обучения различные наборы входных данных (из базы данных примеров) подаются на входной слой ИНС, а полученные выходные сигналы ИНС сравниваются с известными целевыми значениями (из той же базы данных примеров), подсчитываются ошибки, модифицируются «веса синапсов», которые дают наибольший вклад в ошибку (с помощью алгоритма «обратного распространения ошибки» [5]), и этот цикл повторяется много раз, пока не достигается приемлемая точность отображения входной информации в выходную. Число циклов может достигать 10 000.
Выбор данных для обучения сети и их предобработка являются самыми важными этапами решения задачи. Набор данных для обучения должен быть очищен, т.е. должны быть исключены противоречия, дубликаты, аномальные значения.
Существуют также другие теоретически и эмпирически установленные правила использования ИНС при анализе данных [5]. Например, число вычислительных путей
ИНС (число связей между нейронами) должно быть в 2-5 раз меньше, чем число примеров (различных наборов данных). Использование более сложной ИНС (использование большего числа вычислительных путей) приводит к так называемому «переобучению» ИНС. В этом случае ИНС хорошо запоминает примеры, но теряет способность к обобщению. То есть она хорошо запоминает и восстанавливает примеры из базы данных, но плохо «вычисляет» другие наборы данных, отличающиеся от тех, которые были в базе данных примеров. Для того, чтобы контролировать, что делает ИНС (просто запоминает примеры или обобщает существующие в примерах данных зависимости) поступают следующим образом. При обучении базу данных примеров делят на две части. Большую (обучающую) используют для обучения, а меньшую (тестовую) - для проверки обученной ИНС на точность восстановления примеров.
Эмпирически установлено, что лучше использовать три отдельные ИНС для каждого из трех «выходов», чем одну ИНС для всех трех «выходов» (как на рис. 1, б).
Существует еще несколько правил, которые описаны в специальной литературе [5].
Окончательный подбор оптимальной для конкретного исследуемого явления структуры ИНС осуществляется эмпирически, с помощью использования нескольких близких по структуре ИНС с разным числом нейронов (вычислительных путей).
Методика обработки данных. Для анализа результатов диагностики развития интеллектуальной сферы (коэффициент ір) детей мы использовали ИНС, включенные в аналитическую платформу Бе^йог (разработчик - ООО «Аналитические технологии» - Ваєевгоир ЬаЪ, г. Рязань, www.basegroup.ru). Помимо ИНС, эта аналитическая платформа содержит и другие методы интеллектуального анализа данных, например, самоорганизующиеся карты Кохонена, «деревья решений», ассоциативные правила, а также методы подготовки данных к анализу, их очистки и визуализации результатов анализа. В дальнейшем мы планируем использовать для анализа данных и другие методы интеллектуального анализа данных (самоорганизующиеся карты Кохонена, «деревья решений»).
В созданных к настоящему времени ИНС моделях личностные качества детей были входными переменными, а ір - выходной переменной (целевой функцией). На рис. 2 приведена структура использованной нами ИНС (при анализе данных девочек - 2, для мальчиков - 3 нейрона в скрытом слое).
При помощи данной ИНС были получены многофакторные вычислительные модели ір(Х), где X - наборы личностных качеств по Р.Б. Кеттеллу.
При обучении использовался алгоритм «обратного распространения ошибки», критерием остановки обучения было выбрано число циклов - 10 000. Ошибка обучения на обучающей выборке была меньше 5%. Ошибка при проверке ЛБСБЕРвНІ О 03 04 обученной ИНС на тестовой выборке доходила до 20%. Данные результаты на первом этапе работы можно считать удовлетворительными. Но работу в направлении увеличения способности ИНС к обобщению психодиагностических исследований необходимо продолжить.
Эта работа требует, в первую очередь, увеличения числа диагностируемых детей.
Важно отметить, что ИНС после обучения представляет собой своеобразный калькулятор,
Рис. 2. Структура использованной ИНС
позволяющий вычислять 1р при любом наборе личностных качеств. Используемая нами аналитическая платформа БеёиСог одновременно позволяет визуализировать зависимость 1р от выбранного исследователем какого-либо фактора при фиксированных значениях всех остальных факторов.
Анализ результатов. Ниже, на рис. 3 и рис. 4 приведены наиболее характерные связи 1р (отдельно для девочек, отдельно для мальчиков) с личностными качествами школьников. Графики включают только те зависимости, которые соответствуют наибольшему диапазону значений 1р. Для остальных признаков (по Кеттеллу) диапазон значений 1р на превышает нескольких единиц во всем интервале изменения отдельных личностных показателей. Таким образом, полученные результаты сразу позволяют выделить личностные качества, сильно влияющие на коэффициент интеллекта.
-----А
----Е
----р
-----н
А,Е,Р,Н
123456789 10
Рис. 3. Вычислительные модели для девочек
Если оценивать значимость личностных качеств по их влиянию на коэффициент интеллекта, то, как видно из рис. 3 и рис. 4, достаточно большой диапазон изменения 1р наблюдается не для всех личностных качеств (признаков).
-----н
1.Н.Р
Рис. 4. Вычислительные модели для мальчиков
Для девочек (рис. 3) значимыми признаками являются А, Е, Е и Н. При этом зависимости 1р от этих признаков имеют нелинейный спадающий характер. Полученные зависимости позволяют определять, например, диапазон значений этих признаков, в котором они слабо влияют на (в данном случае, в левой части графиков -
о
замкнутость, независимость, беспечность, робость). В соответствии с поведением кривых рис. 3 эти качества можно интерпретировать как соответствующие девочкам с наиболее высокими интеллектуальными показателями. Все четыре перечисленных признака входят в коммуникативный блок качеств, что соответствует полученным ранее результатам для учащихся в возрасте 10-11 лет: коммуникативный фактор является одним из ведущих в структуре их личности [8, 9].
Для мальчиков значимыми являются другие качества личности - D, H, I (см. рис. 4). Для признаков D и H зависимости являются сложными - с переменным наклоном (связь IQ с этими признаками может быть как прямой, так и обратной). Кроме того, зависимости располагаются в области IQ > 110. Следовательно, соответствующие показатели (возбудимость-уравновешенность и смелость-робость) являются значимыми для мальчиков с высокими интеллектуальными показателями. Что касается признака I, для которого зависимость захватывает весь диапазон изменения IQ, то мягкость, изнеженность воспитания являются характерными чертами, влияющими на развитие и адаптацию к школе мальчиков этого возраста [8, 9].
Таким образом, полученные при помощи аппарата ИНС данные согласуются с результатами психологических исследований, проведенными ранее с использованием корреляционного и факторного анализа [8, 9]. Но применение ИНС позволяет выявлять и непосредственно вычислять нелинейные связи психологических признаков, которые не удается обнаружить традиционными статистическими методами обработки данных психодиагностики.
Литература
1. Арзамасцев А.А., Зенкова Н.А. Моделирование в психологии на основе искусственных нейронных сетей. Тамбов: ИМФИ ТГУ им. Г.Р. Державина, 2003.
2. Боровиков В.П. Нейронные сети. Методология и технологии современного анализа данных / под. ред. В.П. Боровикова. М.: Горячая линия-Телеком, 2008.
3. Величковский Б.М. Когнитивная наука: Основы психологии познания: в 2 т. М.: Академия, 2006.
4. Воробьев А.В. Обзор применения математических методов при проведении психологических исследований [Электронный ресурс] // Психологические исследования: электрон. науч. журн. 2010. № 2(10). URL: http://www.psystudy.ru/index.php/num/2010n2-10/311-vorobiev10.html.
5. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия - Телеком, 2001.
6. Поливанова К.Н. Психология возрастных кризисов: учеб. пособие для студ. высш. пед. учеб. заведений. М.: Академия, 2000.
7. Розенблатт Ф. Принципы нейродинамики. М.: Мир, 1965.
8. Славутская Е.В. Гендерные различия в личностных качествах, определяющих дезадаптацию младших подростков [Электронный ресурс] // Психологическая наука и образование: электрон. журн. 2011. № 3. URL: http://psyedu.ru/joumal/2011/3/2460.phtmL
9. Славутская Е.В. Исследование интеллектуальных показателей младших подростков при развивающем воздействии на их эмоционально-волевую сферу // Известия Саратовского университета. Сер. Философия. Психология. Педагогика. 2011. Т. 11, № 2. С. 76-81.
10. Хайкин С. (Haykin S). Нейронные сети: полный курс: 2-е изд.: пер. с англ. М.: ИД «Вильямс», 2006.
11. Baxt W.G. Complexity, chaos and human physiology: the justification for non-linear neural computational analysis // Cancer Lett. 1994. Vol. 77, № 2-3. P. 85-93.
12. Cattell R.B. Advanced in Cattelian Personality Theory. Handbook of Personality. Theory and Research. N.Y.: The Guilford Press, 1990.
13. Dorrer M.G., Gorban A.N., Kopytov A.G., Zenkin V.I. Psychological intuition of neural networks // Proceedings of the World Congress on Neural Networks’95. Washington DC. 1995. Juli. P. 193-196.
14. Grossberg S. Classical and instrumental learning by neural networks: Progress in theoretical biology. N.Y.: Academic Press, 1974. Vol. 3. P. 51-141.
15. HebbD. Organization of behavior. N.Y.: Science Edition, 1961.
СЛАВУТСКАЯ ЕЛЕНА ВЛАДИМИРОВНА - кандидат психологических наук, доцент кафедры психологии и социальной педагогики, Чувашский государственный педагогический университет, Россия, Чебоксары ([email protected]).
SLAVUTSKAYA ELENA VLADIMIROVNA - candidate of psychological sciences, associate professor of Psychology and Social Pedagogic Chair, Chuvash State Pedagogical University, Russia, Cheboksary.
АБРУКОВ ВИКТОР СЕРГЕЕВИЧ - доктор физико-математических наук, профессор кафедры теплофизики, Чувашский государственный университет, Россия, Чебоксары ([email protected]).
ABRUKOV VICTOR SEGEYEVICH - doctor of physics and mathematical sciences, professor of Thermo Physics Chair, Chuvash State University, Russia, Cheboksary.
СЛАВУТСКИИ ЛЕОНИД АНАТОЛЬЕВИЧ - доктор физико-математических наук, профессор кафедры управления и информатики, Чувашский государственный университет, Россия, Чебоксары ([email protected]).
SLAVUTSKIY LEONID ANATOLYEVICH - doctor of physics and mathematical sciences, professor of Management and Informatics Chair, Chuvash State University, Russia, Cheboksary.
УДК 004.9:378]-021.412 ББК Ч481.253
О.В. ФЕДОРОВ, Л.Г. ЕФРЕМОВ, Н.В. ГОЛУБЦОВ, И.И. ГРЕБЕНЮК
АСПЕКТЫ ИНФОРМАЦИОННОГО ОБЕСПЕЧЕНИЯ ОБУЧАЮЩИХСЯ В ВЫСШИХ УЧЕБНЫХ ЗАВЕДЕНИЯХ
Ключевые слова: вуз, обучающиеся, ФГОС ВПО, информационное обеспечение, библиотечный фонд, печатные и электронные издания, электронно-библиотечная система, доступ, информационная компетенция.
Рассмотрены вопросы информационного обеспечения вузов в условиях современных тенденций инновационного развития общества и действующих нормативных требований к образовательному процессу. Показана объективная необходимость внедрения в вузы электронно-библиотечных систем с позиций наиболее полного и эффективного информационного обеспечения обучающихся и формирования у них информационных компетенций.
O.V. FEDOROV, L.G. EFREMOV, N.V. GOLUBTSOV, I I. GREBENYUK ASPECTS OF INFORMATION SUPPORT OF STUDENTS IN HIGHER SCHOOLS
Key words: high school, students, educational standard of higher education, information, library fund, printed and electronic publications, electronic library system, access, information competence.
The problems of information support of high schools in of modern tendencies of social development and innovation of new normative requirements to the educational process. Shown is an objective need to connect to the high schools library's electronic systems from positions the most complete and effective information management students and shaping their information competencies.
Реформирование высшего образования в условиях присоединения России к Болонской декларации при стремительном развитии информационных технологий предусматривает в качестве приоритетной, требующей безотлагательного решения, задачу информационного обеспечения деятельности вузов. Развитие научно-технического прогресса повышает востребованность учебной, научной и методической литературы, обостряет проблему оперативности отражения в ней как новых научных концепций, так и конкретных методических рекомендаций и практических решений профессиональных проблем, характеризующих профессиональную деятельность выпускников вузов. Традиционно считается, что библиотеки должны обеспечить обучающихся в необходимом количестве «бумажными» учебниками, учебными пособиями и учебно-методической литературой.