Алгебраическая модель вопросно-ответного диалога для построения индивидуальной траектории обучения

Зуенко Александр Анатольевич

УДК 004.89

А.А. Зуенко

Институт информатики и математического моделирования технологических процессов Кольского НЦ РАН

Кольский филиал Петрозаводского государственного университета

АЛГЕБРАИЧЕСКАЯ МОДЕЛЬ ВОПРОСНО-ОТВЕТНОГО ДИАЛОГА ДЛЯ ПОСТРОЕНИЯ ИНДИВИДУАЛЬНОЙ ТРАЕКТОРИИ ОБУЧЕНИЯ*

Аннотация

В статье описывается подход к разработке вопросно-ответных обучающих систем на основе контролируемых языков, а также алгебраических моделей представления и обработки вопросно-ответных текстов. Модифицируемые рассуждения, моделирующие стратегию опроса учителя, формализуются с использованием математического аппарата QC-структур и опираются на отношение частичного порядка “вопрос-подвопрос”.

Ключевые слова:

интеллектуальная обучающая система, вопросно-ответный текст, QC-структуры, алгебра кортежей.

A.A. Zuenko

ALGEBRAIC MODEL OF QUESTION-AND-ANSWER DIALOGUE FOR BUILDING PERSONAL TEACHING TRAJECTORY

Abstract

The paper introduces an approach to development of question-and-answer teaching systems using controlled natural languages and algebraic models to represent and process question-and-answer texts. We propose to build a personal teaching trajectory by means of a partial order relation "question-subquestion". A mathematical apparatus called QC-structures allows to formalize defeasible reasoning that models examination strategy of a teacher.

Keywords:

intelligent teaching system, question-and-answer text, QC-structures, n-tuple algebra. Введение

В интеллектуальных обучающих системах (ИОС) можно выделить четыре части: учебный материал, обучающий модуль, модуль контроля и модуль проверки [1]. Рассмотрим лишь две последние составляющие. Модуль контроля знаний проверяет усвоение учеником материала; модуль проверки тестирует знания и умения ученика и выставляет оценку. Отделение модуля контроля знаний от модуля проверки позволяет определить, каких именно знаний не хватает ученику. Однако часто модуль контроля рассматривают не отдельно, а относят либо к модулю обучения, либо к модулю проверки.

В работах, где встречается термин «обучающие системы», в основном, можно найти идеи по построению проверяющих систем, которые в результате анализа решений определяют умения ученика [2]. Основной целью работы таких систем остается выставление оценки.

*

Работа выполнена при финансовой поддержке РФФИ (проекты №№ 12-07-00689-а, 14-07-00256-а,).

150

В отличие от подобных систем, преподаватель, получив неправильный ответ на задачу, пытается выявить “пробелы” в знаниях ученика, задавая наводящие вопросы и ставя дополнительные задачи. В результате, он либо “наводит” ученика на правильный ответ, либо определяет, какое именно понятие, правило или теорему ученик не знает или не умеет применять.

По мнению автора, назначение интеллектуальной системы контроля знаний, в отличие от системы проверки, заключается в том, чтобы, аналогично реальному преподавателю, не просто оценить уровень знаний ученика, а выявить плохо усвоенные знания и выработать рекомендации по дальнейшему закреплению и изучению материала.

Выявление “пробелов” в знаниях ученика осуществляется в процессе вопросно-ответного диалога, управляемого ИОС. Важную роль в таком диалоге играет блок, имитирующий стратегии опроса, применяемые преподавателем, и позволяющий пересматривать накопленные знания об уровне подготовки обучаемого.

Ситуация усложняется, когда вопросно-ответный диалог предполагает общение на естественном языке с возможностью задания ответа в “произвольной” форме. Следует уточнить, что термин “произвольная форма ответа” не вполне корректен, поскольку предполагается, что опрашиваемый знаком с учебным материалом, т.е. погружен в контекст и, в связи с этим, дает осмысленные ответы в терминологии, близкой к терминологии учебного материала.

В настоящее время наиболее перспективным при разработке диалоговых систем, допускающих свободную форму ответов пользователя, считается подход на основе концепции CNL (Controlled Natural Language). Контролируемый язык (упрощенный задачно-методологическим контекстом естественный язык) - это версия естественного языка, созданная для выполнения определенных задач [3]. Оригинальный вариант контролируемого языка вопросно-ответного диалога на основе концептуальных грамматик предложен в [4]. Там же рассмотрена семантическая классификация вопросно-ответных текстов.

В статье предлагается подход к построению интеллектуальных обучающих систем на основе алгебраической интерпретации упомянутой модели вопросно-ответного диалога. В качестве математического аппарата для представления и анализа вопросно-ответных текстов выбраны алгебра кортежей (АК) [5, 6], а также развитие аппарата частично упорядоченных множеств - QC-структуры [7].

Сначала рассмотрим более подробно принципы построения ИОС в рамках концепции контролируемых языков.

Концепция контролируемых языков

В условиях вопросно-ответного диалога, когда активной стороной является интеллектуальная обучающая система (ИОС), контекст достаточно четко определяет круг ожидаемых возможных ответов. Смысловая типизация вопросов и семантическая классификация ответных текстов дают возможность сопоставить каждому типу вопроса ограниченный набор допустимых, т.е. логически правильных, смысловых конструкций (ответных формул). Соответственно, содержание ответа, его лексикон, форма и отчасти объем

151

предопределены, и пользователь с необходимостью отвечает на вопрос в определенных рамках [4]. Действительно, если вопросы формируются на основе лекционных материалов, с которыми знаком обучаемый, то становится возможным задавать даже наборы ожидаемых лексических единиц при ответе на конкретный заданный вопрос. Этот подход делает возможным построение эффективной системы проверки правильности ответа на вопрос.

Система интерпретации ЕЯ-текстов в контексте, управляемом системой [4], включает базу знаний, базу специфических грамматических конструкций, лексический процессор и семантический интерпретатор. Распознавание текста ответа включает перевод текста в каноническое представление, выбор семантической схемы эталонного ответа, сопоставление ответа и соответствующей семантической схемы.

Результат формируется в виде некоторого вектора ситуации, представляющего собой набор показателей качества ответа, который используется для управления дальнейшим диалогом.

База знаний представляет собой совокупность моделей обучающего текста, множеств тестирующих вопросов и эталонных ответов. Модель вопросов и ответов строится в автоматизированном режиме специалистом по предметной области. Предложенная в работе [8] классификация вопросов используется для построения шаблонов ответов.

Вопросы, относящиеся к первому типу, требуют явного задания в ответе ключевых параметров без учета отношений. Вопросы второго типа требуют раскрытия в ответе одного отношения, связанного с одним главным понятием. В вопросах третьего типа необходимо указать в ответе композицию фиксированного набора базовых отношений, связанных с главным понятием. Четвертый тип вопросов требует ответа в виде произвольной композиции отношений, связанных с одним понятием. В ответах на вопросы пятого типа допускается указывать несколько понятий, связанных произвольным набором отношений.

Разбиение текстов на семантические классы осуществляется на основе выявления главного (главных) понятия и отношений, связанных с этим главным понятием. Множество конкретных понятий и отношений по определенным признакам можно разбить на конечное число типов понятий и типов отношений. Согласно терминологии работы [8], такие типы называются семантическими единицами или концептулами. Каждое осмысленное предложение предметной области можно перевести в текст, составленный из типов понятий и типов отношений, т.е. семантических единиц, без детального учета грамматических признаков лексем, соотнося каждое понятие или отношение с определенным типом. Представленным выше семантическим классам ответов соответствуют присущие им схемы сочетания концептул, передающие характерный (обобщенный) смысл ответов данного класса (значений вопросов). Схемы сочетания концептул, соответствующие правильной передаче ожидаемого смысла, названы индивидуальными концептуальными грамматиками (ИКГ).

В данной работе нас интересует, как осуществляется построение модели (шаблона) ответа.

Модель ответа строится на основе задаваемого вопроса и представляет собой пару <F, G>. G обозначает ИКГ класса ответов, соответствующего

152

заданному вопросу. F = <L, K> представляет собой информационную структуру, содержащую лексемы L, отражающие понятия и отношения, а также их предполагаемые роли K в ответе.

В качестве учебного примера рассмотрим следующий обучающий текст (текст лекций):

"Компилятор - это программа, которая переводит исходный текст на ЯВУ в объектный текст на ЯМК и находится в оперативной памяти. Этап компиляции включает синтаксический, лексический анализы, оптимизацию и генерацию кодов и выполняется раньше этапа загрузки, которая из объектного модуля делает загрузочный и располагает в памяти. Редактор связей записывает загрузочный модуль на диск'".

Пусть задан вопрос третьего типа: “Какую функцию выполняет компилятор?” Перечислим некоторые из возможных ответов на данный вопрос [4]:

1) переводит исходный текст на языке высокого уровня в объектный текст в машинных кодах;

2) получает ЯМК из ЯВУ;

3) компилятор переводит ЯВУ в ЯМК.

Представленные ответы относятся к классу ФУНКЦИЯ. При описании грамматик ответов класса ФУНКЦИЯ используются следующие концептулы:

SS - концептула, отражающая главное понятие;

SA - концептула, отражающая понятие-аргумент;

SP - концептула, отражающая понятие-результат;

GPa - предлог перед SA;

GPP - предлог перед SP;

Ra - концептула, отражающая отношение SS к SA;

Rp - концептула, отражающая отношение SS к SP.

Формализованное представление перечисленных ответов, соответственно, имеет вид:

1) Ra ^ SA ^ GPP ^ SP;

2) Rp ^ SP ^ GPa ^ SA;

3) SS ^ Ra^ SA ^ GPP^ SP

Здесь отношение “переводит” есть Ra, отношение “получает” - Rp, понятия “текст на языке высокого уровня”, “ЯВУ” - SA, “текст в машинных кодах”, “ЯМК” - SP, предлог “из” - GPA; предлог “в” - GPP, понятие “компилятор” - SS. Стрелки отображают цепочку следования концептул в предложении.

Множество подобных формул, описывающих порядок следования и роли лексем, образуют ИКГ. Информационная структура F представляется в следующем виде:

ОТВЕТ: КЛАСС = ФУНКЦИЯ

F: SS = компилятор, транслятор; Ra = переводит, преобразует;

Rp - получает; SA = текст на языке высокого уровня, ЯВУ; SP = текст в машинных кодах, программа на ЯМК, ЯМК.

Здесь перечислены лексемы (L), например “компилятор”, и их семантические роли в предложении (K), например, концептула “SS”.

153

Далее для удобства представления подобные структуры будем записывать в виде таблиц (табл. 1).

Класс ответа “Функция”

Таблица 1

ОТВЕТ: КЛАСС = ФУНКЦИЯ{

SS Ra Rp SA SP

{компилятор, транслятор} {переводит, преобразует} {получает} {текст на языке высокого уровня, ЯВУ} { текст в машинных кодах, программа на ЯМК, ЯМК}

}// КОНЕЦ ОТВЕТ КЛАСС = ФУНКЦИЯ

В данном случае информационная структура F представлена в виде декартова произведения множеств значений концептул. В более общем случае, когда требуется учесть еще и сочетаемость лексем, выступающих в качестве значений концептул, информационная структура F может быть записана в виде системы многоместных отношений.

Для моделирования и обработки типовых структур знаний, используемых в вопросно-ответных компонентах ИОС, предлагается применить алгебру кортежей [5, 9]. В частности, шаблоны ответов компактно записываются в виде С-систем.

Далее приводится решение задачи автоматизации контроля знаний обучаемого.

Модель вопросно-ответного диалога на основе структур алгебры кортежей

Система, осуществляющая контроль знаний, относится к открытым системам, способным пополнять свои знания и изменять построенные ранее выводы при изменении ситуации, реально отражая картину обучения. Для формализации рассуждений в системах такого типа применяют аргументацию.

Учитель, опрашивая ученика, обычно имеет некоторую последовательность вопросов, в случае неправильного ответа на один из них задаются подвопросы, помогающие выявить пробелы в знаниях обучаемого. Опрос длится до тех пор, пока учитель не получит достаточно аргументов для обоснования своего решения об уровне знаний обучаемого и/или выработки рекомендаций по дополнительному изучению материала.

Введем на множестве вопросов отношение подчинения S, смысл которого заключается в следующем: x подчинен у, если для правильного ответа на вопрос у требуется знание верного ответа на вопрос х. Допустим, имеются вопросы с введенным на них отношением подчинения:

R1. Что Вы знаете о компиляторе и процессе компиляции? (Вопрос 5 типа).

R2. Дайте определение компилятора? (Вопрос 4 типа).

R3. Где находится компилятор? (Вопрос 2 типа).

R4. Какую функцию выполняет компилятор? (Вопрос 3 типа).

R5. Для чего служит оперативная память ПК?. (Вопрос 3 типа).

154

Рис. 1. Графическое представление множества вопросов

Из рис. 1 видно, что вопросы, чей тип сложнее, доминируют над вопросами более простых типов. Например, вопрос R2 четвертого типа доминирует над вопросом R4 третьего типа.

Согласно [8], каждому вопросу сопоставляется модель ответа, из которой нас далее будет интересовать информационная структура F. Модели ответов для подвопросов содержат лишь часть отношений, предусмотренных самими вопросами. Это можно увидеть, сравнивая модели ответов на вопросы R2 и R4.

Модель ответа для вопроса R4 мы уже рассмотрели в предыдущем разделе. Вопросу R2 на основе приведенного выше текста лекций может быть сопоставлена такая модель ответа (табл. 2).

Класс ответа “Определение”

Таблица 2

ОТВЕТ КЛАСС = ОПРЕДЕЛЕНИЕ{

SS (главное понятие) Son (более общее понятие, чем главное)

{компилятор, транслятор} {программа}

КЛАСС = ФУНКЦИЯ

Ra Rp SA SP

{переводит, преобразует} {получает} { текст на языке высокого уровня, ЯВУ} {текст в машинных кодах, программа на ЯМК, ЯМК}

КЛАСС = ПРО

SO Rso Ros

{оперативная память} {находится, содержится} {содержит}

}// КОНЕЦ ОТВЕТ КЛАСС = ОПРЕДЕЛЕНИЕ.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

155

Соединение всех трех отношений, записанных в виде таблиц, и формирует АК-объект, задающий модель ответа на вопрос R2.

Основными процедурами аргументации являются процедуры определения истинностных оценок утверждений по соответствующим им множествам аргументов. Множество высказываний и соответствующих аргументов задается как контекст K=(V, A, I), где V - множество высказываний, A - множество аргументов, I - отношение на множестве V х A, такое чтор1аа , где p е V, aaeA, ае {+, -}, тогда и только тогда, когда ааесть аргумент высказыванияр [1].

В качестве элементарных высказываний при построении логики аргументации рассматриваются утверждения вида: “учащийся знает ответ на данный вопрос”. Если правильные ответы трактовать как аргументы “за” подобные утверждения, а неправильные как аргументы против , то отношение S на множестве вопросов позволяет строить логику аргументации с упорядоченным множеством аргументов.

Пусть с вопросом Ri связано высказывание pt (“учащийся знает ответ на i-ый вопрос”), а Qj вопросу сопоставлено высказывание qj (“учащийся знает ответ на j-ый вопрос”). Тогда при выполнении соотношения Ai cG Aj (согласно принятой сегментации вопросно-ответного текста, данное соотношение всегда выполняется, если для вопросов Ri и Qj верно, что Ri доминирует Qj) можно утверждать, что V[{pi^-qj)]=1 (V - функция оценивания).

Если модель ответа заключает не только образцы правильных ответов, но запрещает некоторые ответы или отдельные лексемы, то каждому утверждению pi, помимо АК-объекта Ai, может быть сопоставлен АК-объект Bi, описывающий запрещенные ответы. В терминологии работы [10] АК-объект Ai для высказывания pi задает область значений функции g , а АК-объект Bi - область значений функции g-.

Анализ множеств аргументов позволяет выявлять причинно-следственные связи предметной области. Эта возможность обусловлена определением импликации в логике аргументации. Достаточным условием истинности импликаций является выполнение следующих условий [10]:

Если

g+(p) С g+(q) и g“(q) с g (p), то V[(p^qj] = 1;

g+(p) С g (q) и g+(q) с g (p), то V[(p^qj] = 1.

На основе анализа множества аргументов можно получать два вида утверждений p^-q и p^—q. Выявление и устранение коллизий (понятие коллизия здесь используется как обобщение понятий атака аргумента, подрыв аргумента и т.п.) в системах рассуждений такого типа предлагается выполнять на основе аппарата QC-структур [7].

Рассмотрим один из возможных сценариев реализации процесса контроля с использованием упомянутых средств логического анализа, когда проверка начинается с самого сложного вопроса (рис. 1). Предположим, ученик неправильно ответил на вопрос Ri. В этом случае система задает ему вопрос R2. Если на него обучающийся ответил неправильно, то система задает вопрос R3. Если на вопрос R4 получен правильный ответ, то ученику повторно задается вопрос R3. Если на вопрос R3 получен правильный ответ, то предлагается снова ответить на вопрос R2, а также предлагается вопрос R5. В случае правильных ответов на данные вопросы предлагается снова ответить на вопрос R1.

156

Заключение

Автором предложены алгебраические модели представления и обработки вопросно-ответных текстов, предназначенные для решения задачи контроля знаний обучаемого. Разработанные модели открыты для пополнения знаний. Они позволяют осуществлять контроль и формировать индивидуальную траекторию обучения с помощью процедур аргументации.

Литература

1. Таран, Т.А. Аргументационная система контроля знаний / Т.А. Таран, А.И. Ривкинд // Новости искусственного интеллекта. -2001. -№ 5-6. -С.12-18.

2. Денисова, И.Ю. Математические модели онтологии базы данных информационной обучающей системы / И.Ю. Денисова, П.П. Макарычев // Онтология проектирования. - 2012. -№ 3. - С.62-78.

3. Jonathan Pool. Can controlled languages scale to the Web? // In Proceedings of the 5th International Workshop on Controlled Language Applications (CLAW 2006), 2006.

4. Сулейманов, Д.Ш. Двухуровневый лингвистический процессор ответных текстов на естественном языке / Д.Ш. Сулейманов // Открытые семанти -ческие технологии проектирования интеллектуальных систем. Open Semantic Technologies for Intelligent Systems (OSTIS-2011): материалы Международной научн.-техн. конф. г. Минск, 10-12 февраля 2011 г.

- Минск: БГУИР, 2011. - С.311-322.

5. Кулик, Б.А. Алгебраический подход к интеллектуальной обработке данных и знаний / Б.А. Кулик, А.А. Зуенко, А.Я. Фридман. - СПб.: Изд-во Политехнического ун-та, 2010. - 235 с.

6. Зуенко, А.А. Унификация обработки данных и знаний на основе общей

теории многоместных отношений / А.А. Зуенко, Б.А. Кулик, А.Я. Фридман // Искусственный интеллект и принятие решений, 2010. -№3.

- С.52-62.

7. Кулик, Б.А. Логика естественных рассуждений / Б.А. Кулик. - СПб.: Невский Диалект. -2001. - 128 с.

8. Сулейманов Д.Ш. Системы и информационные технологии обработки естественно-языковых текстов на основе прагматически-ориентированных лингвистических моделей: дис. д-ра техн. наук: 05.13.14 / Cулейманов Джавдет Шевкетович. - Казань, 2000. - 336 с.

9. Boris Kulik, Alexander Fridman, Alexander Zuenko. Logical Inference and Defeasible Reasoning in N-tuple Algebra. In: “Diagnostic Test Approaches to Machine Learning and Commonsense Reasoning Systems”, IGI Global. -Р.102-128.

10. Финн, В.К. Об одном варианте логики аргументации // В.К. Финн. -НТИ: сер.2. -1996. -№ 5-6. - С.3-19.

Сведения об авторе

Зуенко Александр Анатольевич - к.т.н, научный сотрудник, е-mail: [email protected]

Alexander A. Zouenko - Ph.D. (Tech. Sci.), researcher

157

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зуенко Александр Анатольевич

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Зуенко Александр Анатольевич

ALGEBRAIC MODEL OF QUESTION-AND-ANSWER DIALOGUE FOR BUILDING PERSONAL TEACHING TRAJECTORY

Текст научной работы на тему «Алгебраическая модель вопросно-ответного диалога для построения индивидуальной траектории обучения»