УДК 004.421.2
МАТЕМАТИЧЕСКИЕ МОДЕЛИ ОНТОЛОГИИ БАЗЫ ЗНАНИЙ ИНФОРМАЦИОННОЙ ОБУЧАЮЩЕЙ СИСТЕМЫ
И.Ю. Денисова, П.П. Макарычев
Пензенский государственный университет [email protected]
Аннотация
Исследована система знаний эксперта и построена онтология базы знаний информационной обучающей системы. Обосновано применение методологии нечеткого моделирования при формальном описании выделенных классов онтологии. Построены математические модели представления знаний эксперта в реляционной базе данных информационной обучающей системы. Программная реализация описанных в статье математических моделей позволит определить представление учебной дисциплины в наглядном и обозримом виде с учетом качественных характеристик учебного материала, отразить в обучающей системе личный профессиональный опыт преподавателя и, тем самым, повысить качество автоматизированного обучения.
Ключевые слова: информационная обучающая система, онтология, база знаний, нечеткая логика.
Введение
Информационная обучающая система (ИОС) представляет собой программу, на основе знаний эксперта реализующую педагогическую цель в некоторой предметной области. В то же время существующие средства представления знаний эксперта в ИОС не удовлетворяют в полной мере современным требованиям индивидуализированного подхода к обучению, поэтому задача их совершенствования является достаточно актуальной.
1 Онтологическое исследование базы знаний обучающей системы
Задача представления знаний эксперта о процессе обучения в ИОС базируется на онтологическом анализе и классификации знаний. Процесс обучения представляет «педагогически обоснованную, последовательную, непрерывную смена актов обучения, в ходе которой решаются задачи развития и воспитания личности» [1]. В процессе компьютерного обучения
участвуют во взаимосвязанной деятельности его субъекты, которыми, как известно, являются ИОС, выполняющая функции педагога, и обучаемый. Исходя из этого, база знаний ИОС должна содержать знания эксперта о предметной области (педагогические знания) и знания об обучаемом (персональные знания). На рисунке 1 представлена композиционная схема базы знаний информационной обучающей системы, разработанная на основе методологии фиксации онтологии ГОЕБ5 в сфере компьютерного обучения.
Наиболее значимой составляющей модели обучаемого Рисунок 1 - Композиционная схема являются его знания в некоторой предметной области.
базы знаний информационной перСОналъными знаниями будем понимать знания
обучающей системы
эксперта о качестве сформированной системы знаний, умений и навыков обучаемого в рамках изучаемой дисциплины или всего курса. Состав и структура персональных знаний динамична, изменяется в процессе прохождения курса при работе с обучающей системой и предназначена для адаптации обучающей системы к конкретному учащемуся.
Педагогические знания отражают закономерности обучения конкретному учебному предмету и включают знания эксперта о предмете обучения (предметные знания) и методике обучения (методические знания).
Под предметными знаниями подразумеваются знания эксперта о составе и структуре учебного материала, представленного в ИОС с целью получения обучаемым целостного образа знаний, относящегося к данной предметной области. Состав и структура предметных знаний разрабатывается экспертом на основе государственных стандартов и имеющегося практического опыта преподавания.
«Для реализации адаптивного обучения и контроля знаний необходимо планирование учебного процесса и корректировка получаемых планов в зависимости от успешности усвоения учащимся учебного материала» [2]. Следовательно, необходимость индивидуализированного подхода к обучению требует планирования учебных воздействий, как на основании предметных знаний, так и на основании персональных знаний. Под методическими знаниями будем понимать знания эксперта о способе адаптации предметных знаний.
2 Математическая модель предметных знаний
При исследовании и построении математической модели предметных знаний согласно современной концепции обучения будем опираться на систему дидактических показателей В.П. Беспалько.
Учебный материал в ИОС представляет собой набор предметных элементов (ПЭ) - логически завершенных блоков, отражающих содержание учебной дисциплины. Отношения между ПЭ отражают структуру учебного материала. В таком контексте предметные знания представляют собой систему знаний, состоящую из ПЭ и отношений между ними, отражающих знания о составе и структурных свойствах учебного материала.
Обозначим множество предметных элементов (ПЭ) через Е. Структурные связи ПЭ определяет бинарное отношение, которое обозначим через £ с Е х Е и будем называть структурным отношением.
Исследуем введенные понятия. Множество предметных элементов Е и структурное отношение £ формируются экспертом - разработчиком электронного учебного курса (ЭУК). Базовыми ПЭ, с которых начинается формирование множества Е, являются темы. Обозначим Т - множество тем, представленных в ИОС. Очевидно, что Т - конечное, дискретное и строго упорядоченное множество. Базовую структуру предметных знаний определяет бинарное отношение £ с Тх Т - «подтема темы», такое, что (¿¿, и) е / е [1, п], у е [1, п], / Ф у, если содержание темы и раскрывает содержание темы у
Среди всех тем курса можно выделить подмножество опорных тем То с Т, степень освоения которых учащимся определяет успешность процесса обучения. При эталонном уровне знания опорных тем обучаемый получит набор умений, навыков, соответствующий специалисту в данной области. Множество То назовем «целью обучения». При формализации процесса обучения, как правило, выделяются необходимая, а также достаточная цели обучения. Под «необходимой целью обучения» будем понимать совокупность тем, диагностика эталонного знания которых при прохождении курса необходима для допуска к продолжению изучения курса. Под «достаточной целью обучения» будем понимать совокупность тем, в случае не достижения по которым эталонного уровня знаний данные темы рекомендуются
для повторного изучения, при этом обучаемый имеет допуск к любой теме учебного курса. Наличие цели обучения в ИОС определяет успешность учебного процесса. Выделение нескольких целей одновременно предоставляет эксперту более обширные возможности при конструировании электронного учебного курса. Таким образом, при разработке ЭУК целесообразно сформировать как множество необходимой, так и множество достаточной цели обучения.
Одним из способов задания множества является установление его функции принадлежности. Однако следует учесть, что не для всех тем, представленных в ИОС, можно дать однозначный ответ «да-нет» относительно принадлежности той или иной цели обучения. Таким образом, возникает необходимость использования методологии нечеткого моделирования.
Пусть М - некоторое вполне упорядоченное множество - множество принадлежностей. Сейчас и в дальнейшем будем полагать М = [0, 1]. Функцию принадлежности элемента х соответствующему множеству X будем обозначать через цх.
Введем обозначения:
• N = {)} - нечеткое множество «необходимая цель обучения»,
• Б = {)} - нечеткое множество «достаточная цель обучения».
Функции принадлежности (^) и ]и~ (^) есть отображения : Т ^ М и Т ^ М
соответственно, устанавливаются экспертом при формировании ЭУК и характеризуют степень принадлежности темы необходимой (достаточной) цели обучения. Носитель данных нечетких множеств конечен, дискретен и относительно небольшой мощности, поэтому нечеткие множества N с Т и Б с Т задаются путем явного перечисления тем из множества Т и соответствующих им значений функций принадлежности.
Согласно современным требованиям, предъявляемым к обучающим системам, содержание ЭУК должно адаптироваться под обучаемого. Следовательно, необходимо дополнить содержание тем адаптивной частью - блоками учебного материала, которые назовем изложениями. Альтернативные изложения темы различаются по степени подробности и глубине, что позволяет адаптировать содержание учебного курса к различной подготовке учащихся с целью лучшего усвоения ими материала темы. При этом во всех альтернативных изложениях представлено базовое содержание темы, необходимое для изучения всем классам учащихся независимо от их подготовки.
Обозначим С - множество изложений всех тем курса. Множество С дискретное, конечное, строго упорядоченное. Эксперт, формируя учебный курс, устанавливает отношение с С х Т - «изложение темы», такое, что (с, ¿) е Бс, если содержание изложения С согласовано с содержанием темы
Согласно системе дидактических показателей Беспалько, альтернативные изложения темы могут быть представлены на различных уровнях, соответствующих подготовке обучаемых, которые назовем уровнями трудности. Экспертная оценка степени трудности каждого варианта изложения субъективная и лингвистически неопределенная, что затрудняет применение точных количественных методов при ее формальном описании. Адекватным модельным представлением экспертной оценки является методология нечеткого моделирования.
Обозначим 8С с 8С, 8С = {(с,^(с,^)} - нечеткое отношение «трудное изложение темы». Функция принадлежности (с, I) есть отображение ¡и~ : 8С ^ М, характеризующее
степень трудности каждого вопроса темы. Нечеткое отношение £с может быть задано экспертом путем явного перечисления всех кортежей и соответствующих им значений функции
принадлежности, поскольку носитель данного нечеткого отношения конечен, дискретен и с небольшим числом элементов.
Помимо теоретического материала, электронный учебный курс должен включать и диагностический материал, предназначенный для контроля знаний. Как правило, в ИОС оперативный контроль знаний осуществляется с помощью тестов, состоящих из определенного набора тестовых заданий. Тестовое задание (ТЗ) - это ясное и четкое задание по конкретной предметной области, требующее однозначно определяемого ответа или выполнения определенного алгоритма действий. Выделена структура универсальных типов ТЗ, наиболее часто используемых в тестах любой предметной области:
• Выбор ответа. ТЗ данного типа представлено вопросом и конечным дискретным множеством ответов на него.
• Соответствие (упорядочивание). ТЗ представляет собой вопрос и дискретное конечное множество подвопросов к нему. Множество ответов дискретное и конечное. К данному типу ТЗ также относятся вопросы на упорядочивание списка. В этом случае необходимость расположения каждого элемента списка в нужном месте рассматривается как под-вопрос. Множество ответов рассматривается как множество возможных мест в списке.
• Ввод чисел. ТЗ состоит из вопроса и множества вариантов ответа. Эксперт в качестве ответа на ТЗ данного типа может указать либо число (несколько чисел), либо числовой интервал. Числовой интервал задается экспертом путем указания его границ. Аналогично обучаемый при ответе на подобное ТЗ указывает число или несколько чисел (границ интервала). Следовательно, множество указанных ответов конечно и дискретно.
• Ввод текста. ТЗ данного типа представляет собой вопрос и дискретное конечное множество указанных ответов на него.
Таким образом, в общем случае ТЗ в ИОС представлено вопросами и ответами и предназначено для диагностики степени знания обучаемым материала какой-либо темы. Предусмотрим также вероятность того, что при ответе на вопрос ТЗ учащемуся будет предоставлена возможность воспользоваться дополнительным информационным материалом - подсказками.
Обозначим Q - множество вопросов, представленных в ИОС; А - множество ответов, представленных в ИОС; Р - множество представленных в ИОС подсказок. Множества Q, А, Р конечные, дискретные, строго упорядоченные. Анализ ТЗ выявляет наличие таких отношений между ПЭ, как «вопрос темы», «подвопрос вопроса», «ответ на вопрос» и «подсказка к вопросу». Дадим их формальное определение:
• с Q х Т - отношение «вопрос темы», такое, что (д, ¿) е Бд, если вопрос q е Q диагностирует знание темы I е Т;
• Б* с QхQ - отношение «подвопрос вопроса», такое, что (дг, ) е Б*, г е [1, /], у е [1, /],
г Ф у, если вопрос дг входит в состав вопроса ду-;
• Ба с А х Q - отношение «ответ на вопрос», такое, что (а, д) е Ба, если ПЭ а е А указан в качестве ответа на вопрос д е Q;
• Бр с Р х Q - отношение «подсказка к вопросу», такое, что (р, д) е Бр, если ПЭ р е Р содержит дополнительную информацию по вопросу д е Q.
Согласно системе дидактических показателей Беспалько [2], вопросы по каждой теме должны различную трудность с целью более точной диагностики подготовки обучаемого. Обозначим с , = {(д,(д,^)} - нечеткое отношение «трудный вопрос темы».
д
Функция принадлежности ¡и~ (д, t) есть отображение ¡и~ : Од ^ М, характеризующее сте-
Од Од Ч
пень сложности вопроса к теме курса.
В большинстве тестов ответы на вопрос оцениваются как правильные либо неправильные. Однако преподаватель, контролирующий знания учащегося «вживую», учитывает также частично правильные ответы, определяя по ним пробелы в знаниях обучаемого. Следовательно, необходимо, чтобы ответы на вопрос имели различную степень правильности. Обозначим с Оа, Оа = {(а, д),Ц~ (а,д)} - нечеткое отношение «правильный ответ на вопрос».
Функция принадлежности (а, д) есть отображение : Оа ^ М, характеризующее степень правильности ответа на вопрос.
Подсказки могут с различной степенью подробности раскрывать содержание вопроса. Обозначим Бр с Бр, Бр = {(р, д),Ц~~ (р, д)} - нечеткое отношение «полная подсказка к вопросу». Функция принадлежности (р, д) есть отображение : Ор ^ М, характери-
о р о р У
зующее степень полноты подсказки к вопросу.
Нечеткие отношения Од , Оа , Ор задаются экспертом при формировании ЭУК. Поскольку носители данных нечетких отношений конечны, дискретны и с относительно небольшим числом элементов, то нечеткие отношения устанавливаются экспертом путем явного перечисления всех кортежей и соответствующих им значений функции принадлежности.
Таким образом, множество предметных элементов Е = Т и С и ( и А и Р конечно и дискретно. Совокупность выделенных по функциональному признаку подмножеств Г = {Т, С, (, А, Р} является покрытием множества Е, причем подмножества покрытия множества Е не пересекаются. Действительно, подмножествами покрытия множества предметных элементов являются множество тем, множество изложений, множество вопросов, множество ответов и множество подсказок. Предположим, что подмножества покрытия пересекаются. Тогда существует предметный элемент, функциональные свойства которого удовлетворяют нескольким подмножествам покрытия одновременно. Это невозможно, поскольку функциональные свойства ПЭ различных подмножеств покрытия взаимоисключающие. Поскольку подмножества покрытия множества предметных элементов Е не пересекаются, совокупность Г является разбиением множества Е, которое задает на множестве Е отношение эквивалентности по функциональному признаку; обозначим его как ¥Е и будем называть в дальнейшем функциональным отношением эквивалентности.
Из проведенного исследования следует, что структуру предметных знаний характеризует бинарное отношение О с Е х Е, которое исходя из анализа выявленных отношений антиреф-лексивно, ассиметрично и транзитивно. Совокупность выделенных по смысловой нагрузке структурной связи подотношений Ж = {St,Ос,Од,О*,Оа,Ор} не пересекается (обосновывается
аналогично с приведенным выше утверждением). Следовательно, совокупность Ж является разбиением отношения О, которое задает на О отношение эквивалентности по функциональной нагрузке структурной связи; обозначим его как Ж и будем называть структурным отношением эквивалентности.
Представления эксперта об учебном предмете на качественном уровне формально описывают нечеткие множества N с Т, Б с Т, характеризирующие цели обучения, и нечеткие отношения Ос с Ос, Од с Од, Оа с Оа, Ор с Ор, выделенные с учетом системы дидактических показателей Беспалько.
Состав и структуру предметных знаний отражает нечеткий ориентированный граф G = (Е, £,щ(е),^~($)), изображенный на рисунке 2.
2 ) 2)
(с1
I 1
[ро м ■■■
© * б Т
© с е С -
изложение
* £ ^ -вопрос (р р € Р-подсказка а е .4 -ответ
• Б* С Т X Т - подтема темы
Бг с С х Т - изложение темы ■ Б* С Q X Т - вопрос темы
Б* С ^ X Q - подвопрос вопроса
- Б а С А X Q - ответ на вопрос
- Бр С Р X Q - подсказка к вопросу
Рисунок 2 - Модель предметных знаний
Нечеткий ориентированный граф G отражает представление предметных знаний в реляционной базе данных ИОС. Множество вершин графа отображает совокупность ПЭ предметной области, множество дуг - выделенные выше структурные отношения. Вершины и дуги маркированы значениями функций принадлежности установленных нечетких множество и отношений. Фактор-множество вершин графа Е / ¥Е = {Т, С, Q, А, Р} по отношению эквивалентности ¥Е, порожденному разбиением ¥ по функциональному признаку, определяет необходимые таблицы реляционной базы данных ИОС, в которых хранятся функции принадлежности выделенных выше нечетких множеств и отношений. Фактор-множество связей
графа Б/ЖБ = {Б*,Бс,Б*,Б*,Ба,Бр} по отношению эквивалентности ЖБ, порожденному разбиением W, устанавливает связи данных таблиц.
Предложенный способ формализованного описания предметных знаний позволяет четко определить представление предметных знаний в реляционной базе данных ИОС с учетом качественных характеристик учебного материала. Кроме того, возможно привлечь экспертов для обсуждения полноты содержания и целевых показателей уже на начальной стадии проектирования, определить варианты траекторий освоения учебного материала в информационной обучающей системе, сформулировать требования к типу, количеству и последовательности упражнений для осмысления и закрепления теоретического материала.
3 Математическая модель персональных знаний
Персональные знания отражают сведения об успеваемости учащегося в рамках изучаемого курса. Объективная оценка степени усвоения учащимся материала учебного курса имеет принципиальное значение для успеха всего компьютерного обучения, поскольку эффек-
тивное управлении процессом обучения невозможно без обратной связи, реализуемой в персональных знаниях.
Широко известны две задачи, решение которых необходимо при диагностике степени компетентности обучаемого в какой-либо предметной области. Основной задачей экзаменатора является «извлечь» максимум знаний, известных учащемуся. Основной задачей испытуемого является показать максимум своих знаний. Очевидно, цели экзаменатора и испытуемого достаточно близки. Тем не менее, в результате автоматизированного тестирования достичь этих целей удается не всегда, что является причиной заниженных и завышенных оценок. Таким образом, задача состоит в разработке способа формирования персональных знаний, который позволит объективно отразить степень подготовки учащегося.
Имеем множество ответов А, множество вопросов взаимосвязь которых определяет нечеткое отношение 8а с 8а - «правильный ответ на вопрос». Обучаемый, отвечая на вопрос ТЗ, формирует подмножество А 'с А указанных ответов. Тогда подмножество А ' и нечеткое отношение 8а индуцируют в 0 условное нечеткое подмножество с 0, отражающее правильность ответа обучаемого. Необходимо определить функцию принадлежности нечеткого множества , которая будет наилучшим образом соответствовать реальной оценке правильности указанного ответа. Очевидно, что наиболее часто используемое тах-тт-представление условного нечеткого множества не подходит, т.к. для в данном случае одинаково важны оценки всех указанных обучаемым ответов. Следовательно, в этом случае имеет смысл применить ауега§е-представление условного нечеткого подмножества с 0:
М~А я=КА1Я)' ^ {ца' (а)' ^ (а *)),
где КА(д) - average-кoэффициeнт оценок ответов, указанных обучаемым на вопрос *.
При определении коэффициента КА(д) необходимо учесть строение ТЗ, в которых предусматривается наличие т абсолютно правильных ответов из общего числа п ответов. Обучаемый, формируя ответ на вопрос ТЗ подобного типа, может указать в качестве ответа только один вариант, который окажется одним из правильных, при этом ответ обучаемого не может считаться полностью правильным. Также возможен случай выбора учащимся в качестве ответа т + 1 варианта, что тоже нельзя оценить как полностью правильный ответ. Адекватно оценить степень правильности ответа позволяет введение коэффициента осреднения, учитывающего как количество вариантов ответа, указанных обучаемым, так и количество абсолютно правильных вариантов ответа, введенных преподавателем. Таким образом, ауега§е-коэффициент КА(я) целесообразно определить следующим образом:
к а (я) = тах] (а> я)' ^Емсоге~а(а я )г,
[аеА' аеА' }
где Цсоге ~а (а, я) - функция принадлежности ядра нечеткого множества 8а .
Условное нечеткое подмножество с 0 отражает правильность ответа учащегося на вопросы ТЗ типа «Выбор ответа», «Ввод чисел», «Ввод текста» и дополнительные вопросы ТЗ типа «Соответствие». Строение ТЗ типа «Соответствие» обусловливает необходимость определения способа оценки ответа обучаемого на надвопросы.
Дано множество на котором задано нечеткое подмножество с 0 и отношение
с 0х0 - «подвопрос вопроса». Тогда нечеткое множество и отношение индуцируют в 0 условное нечеткое подмножество 0*А с 0, отражающее степень правильности от-
вета обучаемого на надвопрос ТЗ типа «Соответствие». Функцию принадлежности нечеткого подмножества < целесообразно определить с учетом обычной практики оценивания на основе ауега§е-представления:
М~* (Я) = ■ Е ^ (Я* ■ (Я*, Я),
где К*(я) - average-кoэффициeнт оценок ответов обучаемого на подвопросы вопроса я.
Очевидно, что оценку ответа на надвопрос в равной степени определяют оценки, полученные обучаемым за подвопросы. С учетом этого, ауега§е-коэффициент К<*(я) имеет смысл определить следующим образом:
К<2(Я) = Я).
Я*
Таким образом, на множестве < формируются нечеткие подмножества < с < и < с <, отражающие правильность ответа учащегося на вопросы различных типов. Тогда оценить правильность ответа обучаемого на вопрос любого типа позволяет объединение данных нечетких множеств в нечеткое множество А - «правильный ответ обучаемого»: А = <А и <А, А с < . Функция принадлежности нечеткого множества А имеет вид:
РА(Я) = тах{^А, (я) -^а*(я)}.
Проведем дальнейшее исследование процесса тестирования. Дано множество подсказок Р и множество вопросов < взаимосвязь которых определяет нечеткое отношение «полная
подсказка к вопросу»: Бр = {(р,я),М~р(Р,Я)}, Бр сБр . Обучаемый, используя подсказки,
формирует подмножество Р 'с Р использованных подсказок. Тогда подмножество Р ' и нечеткое отношение Бр индуцируют в < условное нечеткое подмножество Р с < , характеризующее степень полноты всех использованных обучаемым при ответе подсказок. При выборе способа представления условного нечеткого подмножества Р необходимо учитывать, что каждая последующая использованная подсказка увеличивает полноту полученной дополнительной информации по вопросу. Следовательно, функцию принадлежности нечеткого множества Р можно определить с использованием операции граничного объединения:
Мр(Я) = тш|]ГМр'(р)■ М~р(р»Я)» ^.
Близость решения учащимся ТЗ к эталонному решению характеризуют указанные варианты ответа и использованные подсказки. Каждый вариант ответа характеризуется определенной степенью правильности, каждая использованная подсказка понижает характеристику
правильности. Имеем множество < вопросов. На < заданы нечеткие множества А с < и Р с < , отражающие правильность ответа обучаемого и полноту использованных им подсказок. Очевидно, что оценка решения обучаемым ТЗ определяется разностью между оценкой правильности выбранных вариантов ответа и оценкой полноты использованных подсказок. Тогда успешность прохождения учащимся теста характеризует нечеткое множество «эталонное решение ТЗ»: < = А \Р (< с < ), функция принадлежности которого имеет вид:
М<~(Я) = тах[^~{(Я) ~М}~(Я)» о| .
После окончания тестирования следует определить интегральную оценку подготовки обучаемого - оценить степень освоения им материала каждой из тем, по которой проводился контроль.
Имеем множество вопросов в и множество тем Т, взаимосвязь которых характеризует отношение с в х Т - «вопрос темы». Тогда нечеткое множество в с в - «эталонное решение ТЗ» и отношение индуцируют условное нечеткое подмножество Тд с Т, отражающее степень усвоения материала темы обучаемым. Условное нечеткое множество Тд определим с учетом традиционной практики оценивания на основе ауега§е-представления:
^ (') = ■ IМё(Я)(Я,'),
где Кд(*) - average-кoэффициeнт оценок, полученных обучаемым при решении ТЗ по теме '.
Очевидно, что степень усвоения учащимся тем учебного курса будут определять только выданные при контроле вопросы. Обозначим через в' множество вопросов, выданных при тестировании (в ' с в), тогда ауега§е-коэффициент можно определить формулой:
К в (') = !АЯ (Я, ').
Я£в'
Следует отметить, что условное нечеткое подмножество Тв с Т не позволяет отразить степень усвоения обучаемым материала надтем.
Имеем множество Т тем и нечеткое подмножество Тв с Т. Отношение с Т х Т формализует отношение «подтема темы». Нечеткое множество Тв и отношение индуцируют в Т условное нечеткое подмножество ТТ с Т, отражающее степень усвоения обучаемым материала надтем. Функция принадлежности нечеткого подмножества ТТ определяется с помощью ауега§е-представления:
мт (')=к^ • £ \^ А
где Кт(') - average-кoэффициeнт оценок, полученных обучаемым за подтемы темы '.
Обозначим через Т'множество тем, по которым был проведено тестирование (Т'с Т). В этом случае ауега§е-коэффициент КТ(*) можно определить в следующем виде:
Кт (') = ^ ^ ('*, ').
'*еТ' '
Таким образом, на множестве тем Т определены нечеткое подмножество Тв с Т, отражающее степень освоения учащимся материала подтем, и нечеткое подмножество ТТ с Т, характеризующее степень освоения надтем. Оценить владение учащимся материалом произвольной темы курса позволяет объединение выделенных нечетких множеств в нечеткое
множество «эталонное освоение темы»: Т = Тв иТТ , Т с Т. Функция принадлежности нечеткого множества Т имеет вид:
М~(') = тах-^ ('(')|.
Согласно принципу обобщения, состав и структура персональных знаний формируется в результате построения нечетких подмножеств множества Е, последовательно обусловливающих друг друга:
А ~ Р'
Ба ° Бд
А;
0"
->Р;
б = А \ Р ;
->Т.
где
-> - обозначение операции индуцирования в ауега§е-форме;
gг
-> - обозначе-
ние операции индуцирования в форме граничного объединения.
Состав и структуру персональных знаний отражает нечеткий ориентированный граф О' = (Е', Б, (е'),^ (5')), изображенный на рисунке 3.
^(д)
и~р (Pg д)
© У
<"~а (а™' дщ У \ (ак>д>+1)
ау
ау
Рисунок 3 - Модель персональных знаний
Нечеткий ориентированный граф О ' отражает представление персональных знаний в реляционной базе данных НОС. Вершины графа О' отражают состав диагностированных предметных знаний - подмножество Е 'с Е; дуги графа О ' отображают структуру диагностированных предметных знаний - подотношение Б 'с Б. Вершины и дуги маркированы значениями функций принадлежности выделенных выше нечетких множеств и отношений. Фактор-множество вершин графа Е' / ¥Е, порожденное функциональным отношением эквивалентности, определяет таблицы базы нечетких данных, в которых хранятся функции принадлежности выделенных нечетких множеств и отношений. Фактор-множество связей графа Б' / порожденное структурным отношением эквивалентности, отражает связи данных таблиц.
Целью построения персональных знаний является установление степени достижения учащимся целей обучения и нахождение в соответствии с установленной степенью достижения целей подмножество рекомендуемым к изучению тем. Обозначим Т"с Т - множество тем, выносимых на изучение. Задача состоит в определении состава множества Т"
Степень владения обучаемым материалом учебного курса отражает нечеткое множество Т с Т- «эталонное освоение темы». На множестве Ттакже заданы нечеткие множества N и
В, характеризующие соответственно необходимую и достаточную цели обучения. Тогда нечеткое множество N \ Т, заданное на множестве тем Т, отражает степень достижения обучаемым необходимой цели обучения. Функция принадлежности нечеткого множества N \ Т имеет вид:
^ЖТ(*) = тах1м^) ~М*)'
В этом случае, носитель данного нечеткого множества - подмножество N с Т\ N = { | ) > °}, является множеством незачтенных тем. При наличии незачтенных тем
обучаемый не допускается к дальнейшему изучению курса, т.е. в данном случае Т"= N.
Степень достижения обучаемым достаточной цели обучения отражает нечеткое множество В \ Т, заданное на множестве протестированных тем Т\ функция принадлежности которого
РВ\т(*) = тах{^В(Г) -¡л~(1), °}.
При этом носитель нечеткого множества В \ Т является множеством зачтенных тем В = { | ) > 0} (В с Т% выносимых на повторное изучение. В случае установления тем,
по которым не достигнута достаточная цель обучения, данные темы вместе с еще не изученными составляют множество тем, которые следует изучить обучаемому. Тогда Т"= В и Т', где Т' = Т \ Т' - множество не изученных тем.
Следовательно, в общем случае множество тем, которые необходимо изучить обучаемому для получения целостного образа знаний по предметной области, есть подмножество Т"с Т, такое, что
Т„= Ш, _ N Ф0 [В и ТN = 0 .
Применение теории нечеткого моделирования при формировании персональных знаний позволяет значительно повысить степень полноты и достоверности оценки подготовки обучаемого благодаря учету различных факторов, влияющих на ответ учащегося, и, что самое важное, степени их влияния.
4 Математическая модель методических знаний
Методические знания отражают представления эксперта о правилах адаптации предметных знаний к персональным. Задача адаптации состоит в установлении рейтинга (численной характеристики) персональных знаний на активной выборке из предметных знаний и модификации предъявляемого обучаемому подмножества предметных знаний согласно установленному рейтингу. Необходимость адаптации заключается в требовании индивидуализации процесса обучения с целью повышения уровня усвоения обучаемыми учебного материала. Возможность адаптации предметных знаний к персональным определяется наличием в ИОС вопросов и альтернативных изложений тем различной трудности, которые в дальнейшем будем называть адаптируемыми предметными элементами. Адаптация предметных знаний происходит в ходе диагностики успеваемости обучаемого и при изучении им материала учебного курса.
Введем обозначения: V = {у} - активная выборка из предметных знаний; Ру = {} -подмножество персональных знаний на активной выборке V; К - рейтинг персональных знаний PV на активной выборке V (в дальнейшем просто рейтинг). Выделены возможные типы активных выборок и соответствующие подмножества персональных знаний на них:
1) V = (', где ( 'с ( - подмножество вопросов, выданных при тестировании. Тогда
Ру = 2, где ( с - нечеткое множество «эталонное решение ТЗ».
2) V = Ж, где N с Г'- подмножество тем, по которым не достигнута необходимая цель обучения. В этом случае Ру = ТЖ, где ТЖ - обозначение нечеткого подмножества «эталонное
освоение темы» Т , универсум которого ограничен множеством N.
3) V = Б, где Б с Г'- подмножество тем, по которым не достигнута достаточная цель обучения. В этом случае Ру = ТБ, где ТБ - обозначение нечеткого подмножества «эталонное
освоение темы» Г , универсум которого ограничен множеством Б.
4) V = Т/\(Ж и Б). Тогда Ру = ТГ^иБ), где ТГ^иБ) - обозначение нечеткого подмножества
«эталонное освоение темы» Т , универсум которого ограничен множеством ТЛ(Ж и Б).
Рейтинг персональных знаний Pу на активной выборке V, являясь обобщенной характеристикой степени усвоения учащимся материала пройденной части курса, в равной степени зависит от всех полученных обучаемым на текущий момент оценок. Следовательно, при его определении имеет смысл использовать операцию осреднения, что согласуется и с традиционной практикой оценивания. Тогда:
Я = ^'^ЕМр (Р*).
V
Рейтинг измеряется в баллах на множестве М = [0, 1].
Уточним понятие методических знаний ввиду проведенного исследования. Под методическими знаниями будем понимать устанавливаемые экспертом правила соответствия трудности адаптируемым ПЭ тому или иному уровню рейтинга.
Наиболее удобным с точки зрения формирования, отладки и корректировки методом представления методических знаний являются продукционные системы. Продукционный подход к представлению методических знаний обеспечивает простоту их модификации и пополнения, следовательно - адаптивность системы к пожеланиям разработчика и более тонкую «ситуационную» настройку системы обучения в целом. Адекватно представить методические знания, которые, как правило, лингвистически неопределенны, позволяют правила нечетких продукций. При разработке схемы нечеткого вывода на основе продукционных правил, отражающих методические знания, будем использовать алгоритм Мамдани, который в настоящее время получил наибольшее практическое применение. При этом предполагается, что в системе нечеткого вывода информация из базы данных извлекается посредством нечеткого запроса, позволяющего учесть качественные критерии.
Исходя из проведенного анализа, установим множество входных и выходных лингвистических переменных, используемых в нечетких высказываниях правил нечетких продукций. Очевидно, что в качестве входной лингвистической переменной следует использовать различные уровни рейтинга персональных знаний на активной выборке из предметных знаний
или формально Я - «рейтинг». В качестве выходной переменной будем использовать уровни трудности предметных элементов, подвергающихся адаптации, или формально и -«трудность ПЭ». В этом случае база правил методических знаний (сценарий обучения) будет содержать правила нечетких продукций, которые имеют вид:
ПРАВИЛО (л : ЕСЛИ « Я есть К », ТО « и есть и »,
(0 ^ ' 1 '
где г е [1, п] - номер правила в базе правил; Яг, и1 - соответствующие значения лингвистических переменных Я и и в /-м правиле базы правил.
Эксперт формирует условия и заключения базы правил нечетких продукций, определяя базовые терм-множества лингвистических переменных. Обозначим множество различных
уровней рейтинга, определенных экспертом, через Т~ = | / = 1,п}. Множество Т~ является терм-множеством входной лингвистической переменной Я. Пусть Я) - область определения лингвистической переменной Я . Согласно определению рейтинга, В(Я) = [0,1].
Выберем способ представления функций принадлежности термов входной лингвистической переменной. Рейтинг измеряется в баллах на отрезке [0, 1], при построении функций принадлежности значений лингвистической переменной Я целесообразно использовать прямой метод построения функций принадлежности. При прямом построении функций принадлежности следует учесть то обстоятельство, что теория нечетких множеств не требует абсолютно точного задания функций принадлежности. Поэтому достаточно определить лишь наиболее характерные значения функции принадлежности (в условиях данной задачи это модальные значения либо точки перехода лингвистической переменной), а также тип функции принадлежности.
Поскольку термы входной лингвистической переменной являются, исходя из контекста сценария обучения, определяемыми экспертом нечеткими интервалами, то для их представления целесообразно использовать трапециевидную или П-образную функцию принадлежности. Однако при использовании трапециевидного представления функций принадлежности значений лингвистических переменных в любой форме от эксперта будет требоваться ввод как нижнего, так и верхнего модальных значений каждого из термов. Также не вполне удобна сама форма трапециевидного представления в виде выражения «условие, накладываемое на переменную - значение функции». Рассмотрим класс функций, относящихся к П-образным функциям. Проведя анализ наиболее часто используемых П-образных функций, следует отметить колоколообразную функцию. В отличие от других типов П-образных функций, представление функций принадлежности в форме колоколообразной функции требует от эксперта лишь введения точек перехода лингвистических переменных, при этом обеспечивается нормальность термов. Следует также отметить удобство записи колоколообразной функции, определяемой аналитическим выражением, не содержащим условий, накладываемых на переменную. Следовательно, имеет смысл определить функции принадлежности значений лингвистических переменных в форме колоколообразной функции.
Таким образом, нечеткие множества Яг значений входной лингвистической переменной
Я - «рейтинг» строятся экспертом путем указания точек перехода функций принадлежности терм-множеств, заданных колоколообразной функцией принадлежности
(Я) — 1
1 +
2 R - (hR + hR-1)
hR - hR~1
где г е [1, п]; Я - численное значение входной переменной Я (значение рейтинга, определенное для соответствующей активной выборки); , г е [1, п - 1] - точки перехода входной
переменной Я, указанные разработчиком сценария обучения; И<~ = —И~ , ИИ- = 2 - - числовые параметры колоколообразной функции принадлежности.
Исследуем выходную лингвистическую переменную. Множество возможных уровней трудности адаптируемых предметных элементов, устанавливаемых экспертом, обозначим
через = 1г = [1, п|}. Множество является терм-множеством выходной лингвистической переменной и - «трудность ПЭ». Обозначим 0(и) - областью определения нечетких значений О,, 0(0) = [0,1].
Термы лингвистической переменной и являются, исходя из их контекста, определяемыми экспертом нечеткими интервалами. Поэтому, согласно проведенному анализу, для представления функций принадлежности нечетких множеств имеет смысл использовать ко-
локолообразную функцию. Таким образом, выходную лингвистическую переменную и эксперт определяет путем указания точек перехода функций принадлежности ее терм-множеств, заданных колоколообразными функциями
Ми. (и) - 1
1 +
■ 1 з
I-1
2и - (Щ + Ьи-1)
Н'и - К
г-1
где г е [1, п]; и - численное значение выходной лингвистической переменной и (наиболее подходящая для обучаемого трудность ПЭ); Щ, г е [1, п - 1] - точки перехода выходной
лингвистической переменной и, указанные экспертом; = , И~ = 2 - - числовые параметры колоколообразной функции принадлежности.
Численным значением входной лингвистической переменной Я является значение рейтинга Я, установленное для соответствующей активной выборки. Обозначим Я' - известное количественное значение входной лингвистической переменой, Ък - результат фаззификации подусловия к-го правила базе правил методических знаний. Тогда результат фаззификации подусловия
Ък =Мпк (Я'),
где ¡и~ (Я) - значение функции принадлежности терма соответствующей входной лингвис-
Як
тической переменной в к-м правиле.
Т.к. условия в базе правил методических знаний заданы в форме элементарных нечетких лингвистических высказываний, этап их агрегирования тривиален и оставляет степени истинности условий без изменения:
Хк = Ък,
где хк - количественное значение истинности условия к-го правила базы правил. Те правила, степень истинности которых отлична от нуля, считаем активными и используем для дальнейших расчетов.
В рассматриваемой базе нечетких правил весовые коэффициенты правил по умолчанию равны 1, заключения заданы в форме элементарных нечетких лингвистических высказываний, поэтому степень истинности заключения ук каждого из активных правил базы будет совпадать со степенью истинности соответствующего условия хк:
Ук = Хк.
Таким образом, найдем все значения ук степеней истинности заключений для каждого из активных правил. После нахождения множества У = {у} степеней истинности каждого заключения базы правил определим функции принадлежности каждого из заключений для вы-
ходной лингвистической переменной. Для этой цели в данном случае целесообразно использовать метод шт-активизации:
<%к (и) = т»п{Ук (и)} ,
где ¡и~ (и) - функция принадлежности терма выходной лингвистической переменной в к-м
правиле базы правил; д~ (и) - функция принадлежности активизированного терма выходи к
ной лингвистической переменной в к-м правиле базы нечетких продукций. Таким образом, для выходной лингвистической переменной определены функции принадлежности нечетких множеств ее значений в каждом из активных правил.
Результат аккумуляции для выходной лингвистической переменной определим как объединение нечетких множеств по формуле:
М~(и) = тах{^~; (и)} ,
к к
где Ц~(и) - результат аккумуляции выходной лингвистической переменной базы правил
(итоговая функция принадлежности).
Результатом деффазификации выходной лингвистической переменной базы правил методических знаний является количественное значение данной лингвистической переменной
и', получаемое на основе метода центра тяжести:
1
| и ./£(и) dU и ' = ^-,
I Мо(и) dU о
где и - переменная, соответствующая выходной лингвистической переменной базы правил методических знаний.
Таким образом, в результате применения схемы нечеткого вывода к базе правил методических знаний устанавливается наиболее подходящий обучаемому уровень трудности изложения или вопроса и (в зависимости от контекста задачи). Полученное значение и' используется для определения конкретного адаптируемого ПЭ.
Дано множество изложений С и множество тем Т, взаимосвязь которых отражает отношение 8С с С х Т - «изложение темы» и нечеткое отношение 8С с 8С - «сложное изложение темы». Пусть для некоторой активной выборки V с установленным на ней рейтингом персональных знаний Я' определена в результате схемы нечеткого вывода наиболее подходящая трудность изложения тем учебного курса и'. Требуется построить четкое отношение с 8С, определяющее изложения тем требуемого уровня трудности. Для этого построим
нечеткое отношение 8'с с 8С - «изложения темы наиболее подходящей трудности», функции принадлежности которого имеет вид:
(с, г) = 1- (с, г) - и' |.
В адаптированном учебном курсе каждой теме сопоставляется не более одного изложения с трудностью связи ¡и~ (с,г), наиболее близкой к и'. С этой целью выделим наиболее
^ С
сильные связи между ПЭ адаптируемого учебного курса. Выделение наиболее сильных связей осуществляется путем приведения нечеткого отношения 8'с к четкости следующим образом:
S'c = {(c,t) | , (c,t) = max /u~, (c, t)} .
Sc c Sc
Отношение S'c отражает наиболее сильные связи в теоретическом материале адаптированного учебного курса, но не является инъективным, и, следовательно, не решает проблемы однозначности связи. Следовательно, необходимо построить инъективное подотношение Sc с S'c, содержащее изложения тем уровня трудности, наиболее близкой к U'. При этом возможны следующие подходы:
• в случае наличия пар (ci, t) и (cy-, t), i Ф j, исключить пару с наименьшим значением функции принадлежности ¡и~ :
S" = {(c,t)| ¡u~ (c,t) = max^~ (c,t)}, V(c, t)e S'c;
Sc c Sc
• в случае наличия пар (ci, t) и (j t), i Ф j, исключить пару с наибольшим значением функции принадлежности ¡и~ :
Sc
S"c= {(c,t)| /u~ (c,t) = min^~ (c,t)}, V(c, t) e S'c.
Sc c Sc
Инъективное четкое отношение S" ^ C x T определяет адаптированное содержание теоретической части учебного курса. Адаптация диагностической части учебного курса осуществляется аналогично.
Заключение
Построенная онтология базы знаний информационной обучающей системы отражает общие закономерности компьютерного обучения. Онтологическое исследование знаний о процессе автоматизированного обучения позволяет естественным образом учесть существенные свойства и отношения объектов проблемной области. Достоинством нечеткого модельного представления выделенных классов онтологии в реляционной базе данных ИОС является учет лингвистической неопределенности знаний эксперта. Программная реализация предложенного подхода позволит дифференцированно, и, следовательно, эффективно, организовать процесс автоматизированного обучения.
Список источников
[1] Бим-Бад Б.М. Педагогический энциклопедический словарь. - М: Большая Российская Энциклопедия, 2003.
[2] Макарычев П.П., Денисова И.Ю. Информационные обучающие системы. - Пенза: Изд-во Пензенского государственного ун-та, 2008.
Сведения об авторах
Макарычев Петр Петрович, 1942 г. рождения. Окончил Пензенский государственный университет в 1970 г., д.т.н. (1996). Заведующий кафедрой «Математическое обеспечение и применение ЭВМ» ФГБОУ ВПО «Пензенский государственный университет». В списке научных трудов более 50 работ, посвященных проектированию и разработке информационных систем, в том числе 2 монографии.
Makarychev Peter Petrovich, 1942 birth. He graduated from Penza state University in 1970., doctor of technical science. (1996). Head of the Department of «Mathematical software and computer application» Penza
state university. In the list of scientific works of more than 50 works, devoted to the design and development of information systems, including 2 monographs.
£
Денисова Ирина Юрьевна, 1980 г. рождения. Окончила Пензенский государственный университет в 1997 г., к.т.н. (2005). Доцент кафедры «Математическое обеспечение и применение ЭВМ» ФГБОУ ВПО «Пензенский государственный университет». В списке научных трудов 30 работ посвящены проблеме автоматизированного обучения, в том числе одна монография.
Denisova Irina Yurevna, 1980 of the birth. Graduated from the Penza state University in 1997, PhD in Technical sciences (2005). Associate professor «Software and use of the computer» Penza state university. In the list of scientific works of 30 works it is devoted to a problem of the automated training, including one monograph.