СИСТЕМНЫЙ АНАЛИЗ И ОБУЧАЮШИЕ СИСТЕМЫ
УДК 681.518
Ю. О. Герман
Белорусский государственный технологический университет ФОРМАЛИЗОВАННАЯ МОДЕЛЬ «ВИРТУАЛЬНОГО» УЧИТЕЛЯ
Приведено описание формализованной модели поведенческой базы знаний «виртуального» учителя в системе электронного обучения. Модель состоит из логических формул, включающих состояния «учителя» и сигналы, поступающие от «ученика». Задача вывода, решаемая на поведенческой базе знаний, требует найти новое состояние «учителя» в зависимости от предполагаемого текущего состояния «ученика» и самого «учителя». Рассмотрен вариант с противоречивой базой или нечеткой поведенческой базой знаний. Показано, как сформулировать общую математическую задачу, что позволяет с единых позиций строить поведение «виртуального» учителя в электронной обучающей системе. Задача вывода решения в противоречивой базе знаний решается с позиций отыскания максимального непротиворечивого ее подмножества, из которого выводима доказываемая формула.
Ключевые слова: база знаний, обучающая система, «виртуальный» учитель, вывод.
Yu. O. German
Belarusian State Technological University
A FORMAL MODEL OF "VIRTUAL" TUTOR
А formalized description of the behavioral knowledge base model of the virtual tutor in electronic learning system is given. The model consists of a number of logical formulas including the tutor's states and the signals coming from the disciple. An inference problem solved on the basis of the behavioral knowledge base requires to find a new state of the tutor in dependence of his current state and the state of the disciple. The paper deals with the contradictory and fuzzy knowledge bases and suggests a new general problem formulation enabling one to build a tutor behavior in electronic learning system. The inference problem in contradictory system is solved on the basis of finding a maximum non-contradictory subset of the knowledge model providing sound proving for the theorem.
Key words: knowledge base, learning system, "virtual" tutor, inference.
Введение. Современное программное обеспечение для е-обучения представлено как простыми HTML-страницами, так и сложными системами управления обучением и учебным контентом (Learning Content Management Systems), использующимися в корпоративных компьютерных сетях. Сложные современные системы е-обучения включают (в том или ином виде и объеме) мультимедийный контент, поддержку интерактивного общения на естественном языке, развитую систему поиска информации, оценки знаний, средства обучения решению задач, техническую поддержку общения на разных уровнях и т. д.
В организации электронного обучения в настоящее время стандартом является SCORM (Shareable Content Object Reference Model) -международный стандарт для обмена учебными материалами на базе адаптированных спе-
цификаций. Цель SCORM можно определить как независимость содержания электронного учебника от программы управления, что обеспечивает многократность использования учебных модулей, их переносимость и модификацию. В настоящее время рынок обучающих электронных систем представлен разными по сложности и возможностям адаптации к «личности» обучаемого программными системами. Современные тенденции развития рынка обучающих е-систем направлены в сторону универсализации и увеличения функциональности систем. Использование коммерческих систем управления электронным обучением не доступно большинству отечественных вузов по причине их высокой стоимости и необходимости продления лицензии на каждый учебный год. Системы с открытым исходным кодом позволяют реализовать тот же набор
возможностей, что и коммерческие с существенно меньшими затратами и большей эффективностью. В конце прошлого века в связи с бурным развитием теоретико-прикладных аспектов искусственного интеллекта Брауном и Венгером было введено понятие «интеллектуальные обучающие системы» (ITS - Intelligent Tutoring System) [1, 2]. Ранее системы такого рода существовали под названием CAES (Сomputer-Aided Educational Systems), что не передавало роль искусственного интеллекта в той мере, в какой эта роль, несомненно, вышла на передний план в последнее время. Архитектура ITS состоит из трех модулей: модуля знаний (по предметной области), модуля «учителя» и модуля «ученика». Последние два задают поведение участников процесса обучения. Для описания поведения используются модели (знаний) на основе правил (rule-based models), а также модели на основе ограничений (constraint-based models).
Развитая система электронного on-line обучения строится как приложение, интегрирующее процессы «учителя» и «ученика», поведение которых организуется в соответствии с поведенческой базой знаний [3]. Основная задача, которая стоит перед разработчиками таких систем и рассматривается в настоящей работе, заключается в создании и развитии формальных средств для синтеза поведения «виртуального» учителя в различных контекстах процесса обучения. Для формального представления поведенческой базы знаний необходимо ввести множество сигналов, поступающих от «ученика», и множество состояний «учителя». Отслеживание процесса обучения сводится к определению следующих признаков (состояний «ученика» - Ai) [4]:
1) учащийся бессистемно просматривает материал (A1);
2) учащийся возвращается к ранее пройденным фрагментам учебника (A2);
3) учащийся остановился на некотором вопросе на долгое время (A3);
4) процесс изучения завершен (инициируется учеником) (A 4);
5) ученик плохо отвечает на вопросы (A5);
6) ученик не отвечает на сообщение (сообщение может быть нейтральным) (A6);
7) ученик отказался от прохождения теста (A7);
8) ученик прошел тест успешно (плохо) (A8);
9) ученик слишком быстро просматривает страницы (A9);
10) часто используется хэлпер (помощник) (A10);
11) выполнен переход на другую (не связанную) тему (An);
12) ученик не пользуется хэлпером (Ai2);
13) ученик часто переходит к одной и той же странице (A13);
14) ученик проскакивает через страницы (A14);
15) ученик задерживается мало времени на более сложных страницах (A15);
16) ученик игнорирует инструкции «учителя» (Ai6);
17) ученик игнорирует предложение помощи или запрос (A17);
18) выбрана новая тема для изучения (A18);
19) истекло контрольное время (A19).
Автомат «учитель» может находиться в
следующих обобщенных состояниях [4]:
Wobs - наблюдение;
Wcontr - контроль знаний;
Wdistr - вмешательство;
Wpian - оценка состояния и планирование стратегии поведения.
В состоянии «Наблюдение» автомат «учитель» не вмешивается в процесс обучения, но отслеживает поведение ученика, а именно: что просматривает ученик, сколько времени, просматривает ли он материал в некоторой допустимой последовательности или хаотически и т. д. В состоянии «Контроль знаний» выполняется проверка усвоения материала в форме тестов или вопросов. Состояние «Вмешательство» предполагает, что учитель обнаружил отклонение от процесса обучения и требует от ученика выполнить определенные действия, например, вернуться к конкретному материалу, ответить на вопросы (пройти тест), сделать напоминание о том, что поведение ученика контролируется и оценивается и т. п. В состоянии «Оценка состояния и планирование стратегии поведения» выполняется коррекция состояния «учителя».
Перейдем к описанию поведенческой базы знаний системы с помощью формул логики.
Основная часть. Формулы поведенческой базы знаний могут быть представлены следующим (упрощенным) образом:
Wobs(t) V Wdlstr(t) V Wcontr(t) V Wpian(t),
— Wobs(t) V — Wdistr(t), -Wobs(t) V —WContr(t),
— Wobs(t) V —Wpian(t), —Wdistr(t) V —Wcontr(t),
— Wdistr(t) V —Wpian(t), —Wcontr(t) V -Wpian(t),
Wobs(t + 1) V Wdlstr(t + 1) V Wcontr(t + 1) V V Wpian(t + 1) V Stop,
-Wobs(t + 1) V -Wd,str(t + 1), -Wobs(t + 1) V
V - Wcontr(t), -Wobs(t + 1) V - Wpian(t + 1), -Wdstr(t + 1) V -Wcontr(t + 1), -Wdlstr(t + 1) V - Wpian(t + 1), -Wcontr(t + 1) V -WpUt + 1), nii ^ -Ai & -A2 & -A3 &.. .& -A19,
nii V A1 V A2 V A3 v. V A19, (1)
Stop ^ -Wob(t + 1) & - Wdlstr(t + 1) & & -WContr(t + 1) & -Wplan(t + 1), A4 ^ Stop, A18 ^ Wcontr(t + 1),
Wobs(t) & A 10 ^ Wdistr(t + 1) V Wcontr(t + 1), Wobs(t) & (A1 V A2 V A3 V A11 V A13) ^ Wdlstr(t + 1), Wobs(t) & (A6 V A7) ^ Wobs(t + 1), Wobs(t) & A10 ^ Wobs(t + 1), Wobs(t) & A12 ^ Wobs(t + 1), Wobs(t) & (A9 V A 14 V A15) ^ Wdlstr(t + 1) V V Wcontr(t + 1), W^obs(t) & nil ^ Wobs(t + 1), Wfetr(t) & nil ^ Wobs(t + 1), W^t) & nil ^ Wobs(t + 1), W^plan(t) & nil ^ Wobs(t + 1), Wfi^t) & A5 ^ Wobs(t + 1) V Wcontr(t + 1),
Wfatr(t) & (A6 V A17) ^ Wobs(t + 1), Wdistr(t) & A19 ^ Wobs(t + 1) V W^plan(t + 1), Wot^t) & A3 ^ Wplan(t + 1), W^t) & (A4 V Ag) ^ Wobs(t + 1),
W^t) & A19 ^ Stop, Wplan(t) & (A3 V A19) ^ Wobs(t + 1).
В системе (1) nil соответствует отсутствию сигнала или нераспознанному сигналу. Итак, система «учитель — ученик» описывается как система взаимодействующих автоматов, причем поведение автомата «учитель» основано на поведенческой базе знаний, а поведение автомата «ученик» реализуется «учителем» гипотетически (модельно) на основании распознавания состояния «ученика» по сигналам (признакам). «Учитель» работает за «ученика» в том смысле, что принимает решения о его поведении по поступающим сигналам. Рассмотрим, как получить вывод решения в системе. В общем случае эта система может быть противоречивой или нечеткой. Пусть для каждого дизъюнкта Dk известна нечеткая мера pk принадлежности его к множеству истинных формул (т. е. мера истинности). Пусть далее требуется найти корни x1, x2, ..., xn и проверить статистическую адекватность ему решения. Для каждого дизъюнкта Dk вводим булеву переменную qk е 0,1 и две импликации:
qk ^ Dk, Dk ^ qk.
Потребуем
^k (qk -Pkf /Pk ^ min.
(2)
(3)
Функционал (3) соответствует формуле для критерия %2. Он преобразуется к линейной целевой функции после возведения в квадрат выражения под знаком суммы:
X (qk - Pkf / Pk = Xk (1 - 2pk)qk / Pk ^ min. (4)
Таким образом, получаем линейную систему неравенств с целевой линейной функцией и
0,1-переменными (дизъюнкту v xa' соответст-
i
вует алгебраическое неравенство X x™' > 1).
Эту задачу можно решить методом, изложенным в [5]. Статистическую адекватность решения следует проверить с помощью статистического критерия (в качестве иллюстрации похожей задачи с применением критерия %2 и подхода к ее решению см. [6]). Таким образом, задача построения выводов в нечеткой системе сводится к следующему:
1) построить целевую функцию (4);
2) заменить дизъюнкты алгебраическими неравенствами;
3) добавить в систему отрицание —ф доказываемой формулы ф с мерой истинности р—ф = = 1 — рф. Найти корни.
Если решения нет, то формула доказана. Если решение есть, то проверить его статистическую адекватность (например, как показано в [4]). Если решение не «проходит» тест на адекватность, то считать ф доказанной. Если решение удовлетворяет статистическому критерию, то вывести ф нельзя. В случае противоречивой или четкой непротиворечивой системы функционал (4) преобразуется к виду
^k (qk - Pk)2 ^ min,
(5)
и решение можно искать через определение максимального непротиворечивого подмножества дизъюнктов, из которого выводима доказываемая формула [6].
Обратимся к иллюстрации. Требуется вывести формулу ф = —х2 в системе с четкими формулами (Ук рк = 1.0):
q1 ^ x1 V —x2 v x3, q2 ^ — Xi v — X2, q3 ^ x1 v —x3, q4 ^ —x1 v —x3, q5 ^ x2 v x3, x2.
(6)
Целевая функция:
-qi - q2 - q3 - q4 - qs ^ min. (7)
Эту систему можно решить, например, в Excel, заменив символы логических операций соответствующими символами алгебраических операций и использовав следующие эквивалентности:
A ^ B = -A v B, -A = 1 - A.
Получаем:
-q1 + Х1 - Х2 + Х3 > -1,
-Х1 + q1 > 0, Х2 + q1 > 1, -Х3 + q1 > 0, -q2 - Х1 - Х2 > -2,
Х1 + q2 > 1, Х2 + q2 > 1,
-q3 + Х1 - Х3 > -1, -Х1 + q3 > 0, Х3 + q3 > 1, -q4 - Х1 - Х3 > -2, Х1 + q4 > 1, Х3 + q4 > 1, -q5 + Х2 + Х3 > 0, -Х2 + q5 > 0, -Х3 + q5 > 0,
-q1 - q2 - q3 - q4 - q5 ^ min.
Решение в Excel дает: Х1 = 0, х2 = 1, х3 = 0, q1 = 0, q2 = q3 = q4 = q5 = 1. Можно сделать вывод о том, что максимальное по включению непротиворечивое множество содержит дизъюнкты q2, q3, q4, q5. В этом множестве выполняется формула x2. Теперь следует присоединить к системе дизъюнкцию тех qi, которые получили нулевое значение в найденном решении. В примере нужно присоединить к системе q1 и выполнить повторный поиск решения. Новое решение будет таким: Х1 = 0, Х2 = 1, Х3 = 1, q1 = 1, q2 = 1, q3 = 0, q4 = q5 = 1. Присоединим к системе формулу q3. К этому моменту система примет следующий вид:
-q1 + Х1 - Х2 + Х3 > -1, -Х1 + q1 > 0, Х2 + q1 > 1, -Х3 + q1 > 0, -q2 - Х1 - Х2 > -2, Х1 + q2 > 1, Х2 + q2 > 1,
-q3 + Х1 - Х3 > -1, -Х1 + q3 > 0, Х3 + q3 > 1, -q4 - Х1 - Х3 > -2, Х1 + q4 > 1, Х3 + q4 > 1, -q5 + Х2 + Х3 > 0, -Х2 + q5 > 0, -Х3 + q5 > 0, q1 = 1,
q3 = 1,
-q1 - q2 - q3 - q4 - q5 ^ min.
Решение: Х1 = 1, Х2 = 1, Х3 = 1, q1 = 1, q2 = 0, q3 = 1, q4 = 0, q5 = 1. Присоединим дизъюнкт q2 V q4. Система становится противоречивой. Процесс завершается. В ходе итераций добавлены следующие новые формулы:
42v * 41,
4з.
Теорема. Пусть SYS' непротиворечива, SYS' & & D' — —ф, причем не имеет места ни SYS' —
— —ф, ни SYS' — —D'. Тогда {SYS', D'} непротиворечива.
Доказательство. Перепишем SYS' & D' — —^ —|ф как —I SYS v —D v —ф. Допустим, что SYS' — D'. Но тогда сразу получим, что SYS' —
— —ф, что противоречит условиям теоремы. Следовательно, неверно, что SYS' — D'. Если допустить, что {SYS ', D'} противоречива, то ввиду непротиворечивости SYS' заключаем, что SYS' —
— —D', но это исключено условиями теоремы.
Данная терема позволяет выяснить заключительный момент, состоящий в том, что полученная противоречивая система действительно содержит непротиворечивую часть, из которой выводима доказываемая формула. Согласно теореме выше, нужно показать непротиворечивость {SYS ', D'}. Применительно к разобранному примеру следует найти хотя бы одну выполняющую интерпретацию для заключительной системы без доказываемой формулы (удалив х2). Таким решением, например, является следующее: qx = 42 = 4з = 1, 44 = 45 = 0, Х1 = 1, Х2 = 0, хз = 1.
Итак, получен ответ на исходную задачу -интересующее нас максимальное по включению непротиворечивое подмножество дизъюнктов системы (6), из которого выводима формула —х2, есть
х1 v —х2 v х3, — х1 v — х2, Xi v —х3 .
Заключение. Достоинство представленного в статье подхода состоит в том, что он «сохраняет» стандартную резолюционную схему вывода и, таким образом, позволяет избежать известных аномалий нечеткого резолюциониро-вания. В сравнении с методами нечеткого вывода типа Мамдани, Цукамото или Сугено данный подход не ограничивает степень общности представления формул. Это же касается неоднозначности представления нечеткой логической импликации (формулы «если — то»). Указанное свойство дает ключ к построению машины логического вывода в нечеткой (противоречивой) логике посредством аппроксимации нечетких значений значениями многозначной логики, достаточными для практических приложений.
В [6] представлен подход для сведения системы нечетких логических формул к задаче целочисленной оптимизации с 0,1-переменными. Ограничение этого подхода состоит в значи-
тельной вычислительной сложности процедуры целочисленной булевой оптимизации.
Таким образом, разработанный в данной статье подход обладает научной и практиче-
ской новизной, имеет положительные особенности и может быть адаптирован для задач построения выводов в различных системах знаний электронных обучающих систем.
Литература
1. Wenger E. Artificial intelligence and tutoring systems: computational and cognitive approaches to the communication of knowledge. California: Morgan Kaufmann Publishers, 1987. 486 p.
2. Brown J. S., Burton R. R., Kleer de J. Pedagogical, natural language and knowledge engineering techniques in Sophie I, II, and III // Intelligent tutoring systems. New York: Academic Press, 1982. P.227-282.
3. Гурин Н. И., Герман О. В., Герман Ю. О. Разработка активной обучающей среды для электронного учебника // Информатизация образования - 2012: педагогические основы разработки и использования электронных образовательных ресурсов: материалы Междунар. науч. конф., Минск, 24-27 окт. 2012 г. / Белорус. гос. ун-т; редкол.: В. В. Казаченок (отв. ред.) [и др.]. Минск, 2012. С. 95-99.
4. Гурин Н. И., Герман О. В., Герман Ю. О. Технология разработки компьютерных обучающих систем с функциями виртуального преподавателя // Труды БГТУ. 2011. № 6: Физ.-мат. науки и информатика. С. 146-149.
5. Герман Ю. О., Самко А. Р., Герман О. В. Эффективный в среднем алгоритм для задачи о покрытии с приложением к нечеткой классификации и нечеткому выводу // Доклады БГУИР. 2009. № 7. С. 93-100.
6. Герман О. В., Самко А. Р., Герман Ю. О. Система вывода для нечеткой логики на основе многозначных исчислений Я. Лукасевича // Труды БГТУ. 2010. № 6: Физ.-мат. науки и информатика. С. 190-192.
References
1. Wenger E. Artificial intelligence and tutoring systems: computational and cognitive approaches to the communication of knowledge. California, Morgan Kaufmann Publishers, 1987. 486 p.
2. Brown J. S., Burton R. R., Kleer de J. Pedagogical, natural language and knowledge engineering techniques in Sophie I, II, and III. Intelligent tutoring systems. New York, Academic Press, 1982. P. 227-282.
3. Gurin N. I., German O. V., German Yu. O. [Development of the active learning environment for electronic tutorial]. Materialy Mezhdunarodnoy nauchnoy konferentsii (Informatizatsiya obrazovaniya - 2012: pedagogicheskiye osnovy razrabotki i ispol'zovaniya elektronnykh obrazovatel'nykh resursov [Informatization of education - 2012: the pedagogical fundamentals for the development and application of digital educational resources]. Minsk, 2012, pp. 95-99 (In Russian).
4. Gurin N. I., German O. V., German Yu. O. Technology of creating the computer-based educational systems with a virtual teacher functions. Trudy BGTU [Proceedings of BSTU], 2011, no. 6: Physical-mathematical sciences and informatics, pp. 146-149 (In Russian).
5. German Yu. О., Samko A. R., German O. V. An efficient in average algorithm for the covering problems with application to a fuzzy classification and fuzzy inference. Doklady BGUIR [Reports of BSUIR], 2009, no. 7, pp. 93-100 (In Russian).
6. German О. V., Samko A. R., German Yu. O. A fuzzy logic inference system on the basis of multivalued Lukasiewicz' logics. Trudy BGTU [Proceedings of BSTU], 2010, no. 6: Physical-mathematical sciences and informatics, pp. 190-192 (In Russian).
Информация об авторе
Герман Юлия Олеговна - старший преподаватель кафедры информационных систем и технологий. Белорусский государственный технологический университет (220006, г. Минск, ул. Свердлова, 13а, Республика Беларусь). E-mail: [email protected]
Information about the author
German Yuliya Olegovna - Senior Lecturer, the Department of Information Systems and Technologies. Belarusian State Technological University (13a, Sverdlova str., 220006, Minsk, Republic of Belarus). E-mail: [email protected]
Поступила 12.12.2016