Структурно-функциональная модель сетевого динамического тестирования на основе автомата
Кузьмин Дмитрий Николаевич к.п.н., доцент кафедры информационных технологий, Сибирский государственный технологический университет, ул. Мира, 82, г. Красноярск, 660049, (391)2653001 kuzmin [email protected]
Гриценко Екатерина Михайловна доцент, к.т.н., доцент кафедры информационных технологий, Сибирский государственный технологический университет, ул. Мира, 82, г. Красноярск, 660049, (391)2653001 [email protected]
Аннотация
В статье рассматриваются вопросы управления учебно-познавательной деятельностью учащихся при традиционных и коллективных способах обучения, показаны психологические и кибернетические основы, а также выявлена роль компьютерных тестов в управлении учебно-познавательной деятельностью учащихся. На основе автоматной модели предложена структурно-функциональная модель сетевого динамического тестирования.
In article questions of management are considered by learn-cognitive activity of pupils at traditional and collective ways of training, psychological and cybernetic bases are shown, and also the role of computer tests in management of learn -cognitive activity of pupils is revealed. On the basis of automatic model the structurally functional model of network dynamic testing is offered.
Ключевые слова
автомат, динамическое тестирование, компьютерные тесты, контроль знаний, коллективное обучение.
The automatic device, dynamic testing, computer tests, the control of knowledge, collective training.
Введение
На сегодняшний момент вопросы управления учебно-познавательной деятельностью учащихся по-прежнему актуальны. Это связано, во-первых, с созданием гибких педагогических технологий, способных не только адаптироваться к индивидуальным особенностям каждого учащегося, но и позволяющих активизировать адаптационные механизмы у ученика; во-вторых, с все более широким применением дистанционных и коллективных форм обучения. Причем отмечается, что при управлении учебно-познавательной деятельностью учащихся целесообразно использовать информационные технологии.
Все больше исследователей приходят к выводу, что учебно-познавательная деятельность учащихся по достижению образовательных целей, поставленных
программой изучения конкретного предмета, должна проводиться с обязательным контролем не только обученности, но и обучаемости учащихся.
Следует отметить, что существующие методы контроля деятельности ученика в процессе выполнения учебных заданий, такие как устный опрос, письменные работы, классические тесты, практические и лабораторные задания, страдают тем, что дают недостаточную информацию о самом процессе деятельности. На наш взгляд, это связано с отсутствием непосредственного контакта ученика с учителем и слабым контролем непосредственно процесса учебно-познавательной деятельности, что приводит к недостаточной объективности данных методов контроля.
Традиционные формы проведения учебных занятий не позволяют в полной мере реализовать такой способ обучения, при котором взаимодействие учителя и ученика обеспечивалось бы на максимальном уровне. Следовательно, для эффективного управления учебно-познавательной деятельностью учащихся необходимо использовать такие формы проведения занятий, в основе которых лежали бы общение между обучаемым и обучающим и их взаимодействие.
Совместная деятельность и общение являются решающими факторами развития самосознания учащихся благодаря тому, что учащиеся становятся субъектами взаимного межличностного отражения, отношений и взаимодействий. Одним из условий успешного управления учебно-познавательной деятельностью учащихся при использовании коллективных учебных занятий является качественный дидактический материал.
Следовательно, нужен инструмент, который позволял бы ученикам работать в паре без вмешательства учителя, а с другой стороны, позволял бы учителю отслеживать все действия, производимые учащимися, и выставлять оценку, соответствующую этим действиям.
Теоретические основы сетевого динамического тестирования
В качестве основы построения информационной модели процесса обучения возьмем кибернетическую модель дискретного автомата [1]. Это связано с тем, что модель автомата в достаточно абстрактном виде отражает систему, взаимодействующую со средой и перемещающуюся с течением времени по дискретному набору состояний. В некотором смысле эти состояния можно интерпретировать как состояния обученности.
Модель дискретного автомата обладает следующими особенностями [1]: на входы модели в каждый из дискретных моментов времени поступают т входных величин XI, х2, ...,хт , каждая из которых может принимать конечное число фиксированных значений из входного алфавита X;
на выходах модели можно наблюдать п выходных величин уь у2, ..., уп, каждая из которых может принимать конечное число фиксированных значений из выходного алфавита Y;
в каждый момент времени модель может находиться в одном из п состояний
^, ^, ., 7п;
состояние модели в каждый момент времени определяется входной величиной X в этот момент времени и состоянием в предыдущий момент времени;
модель осуществляет преобразование ситуации на входе в ситуацию на выходе в зависимости от ее состояния в предыдущий момент времени.
Если эту модель дискретного автомата взять в качестве основы модели ученика, то состояния 7Ь 72, ..., гп, в которых может находиться модель или ученик, в каждый момент времени характеризуются значениями функции ценности состояний. Входные величины XI, х2, ..., хт, по сути, описывают ту проблемную
ситуацию или задачу, которую ученик-автомат должен решить. Выходные величины Ух, у2, ..., уп соответствуют результатам решения проблемы.
Приведенная модель дискретного автомата удобна для описания многих кибернетических систем [1] (рис. 1), в том числе и для описания модели ученика как живой кибернетической системы.
XI
Х2
Ученик
*1А,— ,7^
Уі
X»
Рис. 1. Схема модели «Ученик-автомат»
Ученик моделируется дискретным автоматом с конечной памятью. У таких автоматов выходная величина у зависит не только от значения входной величины х в данный момент времени, но и от состояния модели z, определяемого значениями х в предыдущие моменты времени. Другими словами, решение очередной проблемы у зависит от достигнутого значения функции ценности состояния ученика. Функция ценности состояния ученика z в решении проблем или задач х определяет уровни достижений ученика.
Рассмотрим простейшую автоматную модель ученика, решающего задачу поиска предмета. Ученик, решая такую задачу, выполняет некоторые действия или операции. Среда, в состав которой мы включили, не только задачи, но и учителя, передает сигналы ученику, являющиеся оценками действий, совершенных учеником-автоматом. Эти оценки будут рассматриваться как двоичные: правильное действие -1; неправильное действие - 0. Для решения задачи ученик может выбирать действия из некоторого заданного конечного набора.
Деятельность ученика носит целенаправленный характер. Его цель - получить решение задачи. Правильно выполненное действие приближает ученика к цели, неправильно выполненное действие - удаляет. Если в процессе решения задачи ученик-автомат будет своевременно получать сигналы с оценкой деятельности, то ученик, безусловно, достигнет цели, т.е. решит задачу. Таким образом, согласно [2], можно говорить о том, что в основе предлагаемой компьютерной модели лежит принцип системной динамики.
Описанная модель реализуется в игре «горячо-холодно», в которой один из игроков должен решить задачу поиска предмета с завязанными глазами. Среда, которую представляют другие игроки, передает ему сигналы с оценкой его действий. При этом, слово «горячо» означает, что действие правильное (приближает к цели), «холодно» - означает неправильное действие (удаляет от цели). Решение задачи поиска предмета в данной игре осуществляется методом проб и ошибок и достигается благодаря механизму оперативной обратной связи, который позволяет игроку немедленно корректировать свои действия.
Таким образом, сценарий обучающей программы с простейшим механизмом обратной связи и моделью ученика в виде конечного автомата представляет собой: генератор задач (например, задание по конструированию объекта);
компьютерную систему управления конструированием искомого объекта, представляющую собой систему кнопок, посредством которых ученик преобразует объект, совершая те или иные действия;
программу, осуществляющую оперативный контроль за действиями, иначе говоря, программу, решающую задачу слежения за деятельностью ученика;
систему вывода информации о правильности или неправильности действий ученика, подводящую итог его деятельности.
Надо отметить, что при решении проблем бывают ситуации, когда возникает необходимость временно увеличить проигрыш, чтобы затем получить возможность достичь цели. Такие ситуации возникают, когда на пути к цели стоит препятствие, которое надо, например, обойти. При этом на какое-то время возникает необходимость удалиться от главной цели, временно сменить цель для того, чтобы затем достичь главную цель.
Информацию о размере текущего суммарного выигрыша среда передает ученику-автомату. Среды отличаются одна от другой тем, как вырабатывают оценки. Рассмотрим случай, когда среда, или обучающая и диагностирующая компьютерная система, оценивает действия ученика следующим образом. Если ученик делает в некоторый момент действие d1, то с вероятностью Рх среда выдает оценку «наказание» (штраф) и с вероятностью 1 -Рх - оценку «поощрение» (не-штраф). Если с течением времени значения Рх остаются неизменными, то такая среда называется стационарной.
В нашем случае компьютерная учебная среда имеет несколько иные свойства. Так, если ученик делает в некоторый момент времени действие d1, то среда определяет правильное или неправильное действие. Критерием проверки служит расстояние до цели. Если действие правильное, то ученик получает «выигрыш» (не-штраф), если неправильное, - то «проигрыш» (штраф). Каков механизм выбора действия и как среда формирует оценки? В теории конечных автоматов, описанной в работе [3], нет механизма, который бы позволял определять правильность или неправильность действия. Просто автомат совершал действие d1, и после этого среда вероятностным образом оценивала это действие «штрафом» или «не-штрафом». Понятно, что штраф соответствовал неправильному действию, не-штраф -правильному, только определяла это среда.
Таким образом, компьютерная система, или среда, имеет возможность точно определить, какое действие совершил ученик. Ученик же, совершая действие, в общем случае только с определенной вероятностью знает, правильное или неправильное действие он совершил. Еще до совершения действия ученик делает выбор, относительно того, что он будет делать. Именно на стадии, когда идет процесс выбора действия, существует вероятность того, что он получит поощрение или наказание.
Представляет интерес сконструировать автомат в виде компьютерной программы, которая решает задачу, выбирая действия на основе механизма равновероятного выбора[6]. В качестве примера можно взять задачу конструирования графика линейной функции у=кх+Ь. Эта задача решается путем преобразования графика функции у=х. Количество действий, преобразующих график, равно пяти. Это перемещение графика вдоль оси OY (вверх, вниз), повороты графика (по и против часовой стрелки) и операция инверсии.
Среда моделируется программой, которая: а) генерирует задачи; б)
оценивает правильность и неправильность действий автомата. Правильные действия поощряются, неправильные - штрафуются. Поскольку компьютерная среда может точно оценить правильность или неправильность действия, то вероятность наказания (штрафа) равна Р^1. Для такого автомата, решающего алгебраическую задачу, методом проб и ошибок можно экспериментально определить математическое ожидание штрафа и информационную энтропию деятельности автомата.
Теоретическое значение математического ожидания штрафа равно М=1, соответственно значение информационной энтропии H=log25.
Описываемая среда имеет детерминированный характер, поскольку может точно определять правильность или неправильность действий и соответственно этому поощрять или наказывать действия автомата. Случайность состоит в поведении автомата, который может ошибаться. Она выражается в неопределенности выбора автоматом действия. Мерой информационной неопределенности является энтропия. Она максимальна при равновероятном выборе действия.
Целесообразное поведение ученика-автомата, который обучается решать задачи, состоит в уменьшении информационной энтропии. Как взаимодействие ученика-автомата со средой может помочь уменьшить информационную энтропию? Во-первых, ученику-автомату необходимо передавать информацию о текущем суммарном выигрыше. Эта информация может играть роль подкрепления правильных действий, что может изменить распределение вероятностей выбора действий, так что вероятности совершения правильных действий будут возрастать, а вероятности совершения неправильных действий будут уменьшаться. При этом информационная энтропия Н уменьшается. В идеале она стремится к нулю.
Рассмотрим систему из двух учеников, решающих серию подобных задач. Решение задач проводится на компьютерах, соединенных в локальную сеть. Имеются возможности для взаимодействия. Например, любой из учеников может посмотреть на деятельность другого ученика, понаблюдать, использовать его опыт. Простое наблюдение - это акт слабого информационного взаимодействия. Возможность задать вопрос и получить ответ является более сильным информационным взаимодействием.
В человеческом организме существуют различные формы взаимодействующих параллельных процессов. Отмечается богатое разнообразие методов их взаимодействия. Процессы текут почти автономно, синхронизируясь во времени за счет редких периодических или специфически определяемых ситуацией сигналов. В сетевых технологиях процесс решения задач учеником также может идти автономно. В то же время ученик может подключиться к компьютеру напарника и посмотреть, что тот делает, как у него продвигается решение. При слабом информационном взаимодействии вмешаться в процесс решения напарника он не сможет.
Ученики, которые являются подсистемами, работают практически автономно. При этом управление деятельностью учеников децентрализовано. Децентрализация приводит к увеличению времени адаптации. То, что по единому приказу из центра можно сделать в системе за весьма короткое время, если центральное звено заблаговременно получит информацию об изменениях свойств среды, в децентрализованной системе будет осуществляться весьма медленно. Возможно, поэтому в биологических организмах существуют два уровня: децентрализованный и централизованный по управлению. Так же и в коллективных системах обучения имеются оба уровня. Уровень централизованного управления соответствует деятельности учителя, а уровень децентрализованного управления -информационному взаимодействию учеников.
Целью коллектива учеников может быть не только достижение целесообразного (или оптимального) поведения во внешней среде, но и поиск регулирующих воздействий, позволяющих ученикам (подсистемам) прийти к некоторому согласованному функционированию.
Коллектив учеников можно рассматривать как некоторую совокупность элементов. Она является единой системой, если ученики обладают потенциальным свойством образовывать статические или динамические структуры, необходимые для «выживания» учеников всей совокупности, то есть обладают свойством устанавливать взаимодействие друг с другом для достижения локальных и
глобальных целей. В этом суть всех моделей коллективного поведения и взаимодействия.
При коллективных способах обучения появляется возможность увеличения числа потенциально возможных свойств у учеников, которые могут пригодиться системе при встрече с непривычными для нее ситуациями и средами. Ученики, вступая в объединение, приобретают новые качественные возможности. Понятно, что эти возможности зависят от механизма объединения, а механизмы зависят от возможностей сетевых компьютерных технологий обучения.
Самая простая система обучения образуется в результате сетевого взаимодействия двух учеников. Ученики, вступившие в сетевое взаимодействие, могут объединиться механически. В этом случае число их состояний растет как п2, если каждый из учеников имел п состояний. Такое механическое объединение было сделано в сетевом варианте парного взаимодействия учеников. Каждый из них мог находиться в одном из 10 состояний «самостоятельности». Число состояний у объединенной системы - п2 . В нашем случае число состояний - 100. Когда же ученики объединяются за счет случайного парного взаимодействия, то это дает им возможность функционировать как автоматам, обладающим памятью глубиной 2п [ 3; 4]. В сетевом взаимодействии возможно явление «полимеризации». Ученик при этом приобретает возможность работать с памятью всех участников сетевого взаимодействия и становится богаче по своим возможностям, не меняя своей структуры.
В процессе коллективного обучения развитие обучающейся системы идет не только в направлении усложнения путем объединения участников взаимодействия и образования более сложных структур, но и в направлении дифференциации функций, выполняемых отдельными подсистемами (учениками). Это ведет к изменению структуры всех подсистем для лучшего осуществления своих специфических функций. Универсальность и специфичность, так же, как однородность и разнородность, являются характерными свойствами коллективных взаимодействий учеников.
Рассмотрим пример, когда в сетевом взаимодействии возникают специфические функции у учеников. Пусть, один их двоих учеников берет на себя функции ведущего, или учителя, т. е. он начинает учить другого ученика, оказывая ему помощь. При этом он берет на себя специфические функции лидера, наставника. Его напарник соглашается на подчиненную роль, он ведомый. Его польза для системы состоит в реализации специфических функций ведущего у напарника. Важно, чтобы возникшие специализированные функции не лишили возможности учеников осуществлять процесс решения задач в автономном режиме.
Польза от появления таких подсистем очевидна. Польза разнородности - в коллективе учеников-автоматов. Неоднородный коллектив учащихся более успешно решает стоящие перед ним задачи, чем однородный коллектив. В то же время любой ученик (автомат) такого коллектива мог бы функционировать и в одиночку. Это означает, что специализация не дошла еще до того рубежа, за которым самостоятельное существование отдельной подсистемы становится невозможным.
Каждый раз, когда мы говорим о коллективном поведении, мы имеем в виду коллективное поведение в некой системе. При организации такого поведения нас интересует, безусловно, достижение определенных системных целей, удовлетворение общесистемным критериям качества функционирования. При этом отдельный объект (ученик) может не иметь информации об общих целях системы. Объект знает только свои локальные цели, локальные критерии, локальные функции, предпочтения. Управление системой организуется путем формирования таких локальных условий и, может быть, таких правил локального взаимодействия, при которых удовлетворение локальных интересов отдельных объектов, составляющих систему, приводило бы к удовлетворению общесистемных целей.
Что является тем объектом в системе, локальное поведение которого мы организуем? В качестве объектов, составляющих систему, можно рассматривать учеников как потребителей информационных ресурсов. Возникает проблема организации их совместного поведения, обеспечивающего оптимизацию общесистемного эффекта использования информационного ресурса.
В рассмотренных моделях участник игры воспринимал результат поведения остальных участников только как реакцию на его поведение некоторой более или менее сложно организованной внешней среды.
Когда мы произносим слово «коллектив», мы имеем в виду некоторую структуру отношений, наличие обмена информацией, организацию взаимодействия между членами коллектива. Учет указанных свойств в рассматриваемых нами совокупностях учеников может, с одной стороны, улучшить характеристики поведения, а с другой - оценить возможности и эффективность различных типов организации взаимодействия.
При попытках построить модели поведения со взаимодействием следует помнить, что только достаточно простые модели, зависящие от небольшого числа параметров, позволяют разобраться в эффектах, возникающих в этих моделях и моделируемых ими ситуациях.
К простейшим типам взаимодействия [3; 4] следует отнести случайное парное взаимодействие и однородное взаимодействие с ограниченным числом соседей. Случайное парное взаимодействие состоит в том, что в каждый момент времени (в каждой партии игры) весь коллектив, вся совокупность учеников случайным образом разбиваются на пары. В каждой паре может быть реализован акт обмена информацией, в результате которого происходит изменение действия или внутреннего состояния ученика. На следующем такте разбиение коллектива на пары происходит заново, также случайным и независящим от предыдущего разбиения способом.
В сетевом динамическом научении такое взаимодействие можно организовать следующим образом. При выполнении очередного задания компьютер связывается в пару с другим компьютером. Это означает, что всякий раз, когда ученик решает задачу, его консультирует новый напарник. Причем ученик может не знать, кто помогает ему и кому помогает он. Он помогает кому-то из коллектива, ему помогает кто-то из коллектива, - это все, что ему известно.
При взаимодействии с ограниченным числом соседей для каждого члена коллектива указывается его окрестность - список участников игры, называемых соседями данного автомата по игре, с которыми он может осуществлять взаимодействие. Взаимодействие может быть следующим: автомат воспринимает информацию от своих соседей по игре или его выигрыш зависит от поведения его соседей по игре, но обратное в общем случае может быть неверным. Однородность ограниченного взаимодействия заключается в том, что размеры окрестности для всех учеников-автоматов одинаковы. Таким образом, однородное взаимодействие задается однородным ориентированным графом отношений.
Нами была разработана система, позволяющая реализовывать описанные выше механизмы взаимодействия, получившая название: Сетевой динамический компьютерный тест-тренажер (СДКТТ).
В случае взаимодействия учеников, работающих с СДКТТ, парное взаимодействие состоит в обмене информацией о том, как решать задачу, т.е. в обмене опытом. При любой случайной встрече происходит обмен информацией и ожидается, что достижения участников игры в среднем станут одинаковыми. Приведенное описание можно рассматривать как игру в информационную помощь и в размещение по парам. При этом происходит обмен стратегиями решения задач.
Правила коллективной учебной игры:
Каждый игрок может находиться в двух состояниях: решающего задачу; наблюдающего за решением задачи другим игроком.
Коллектив учеников играющих в игру разбивается на две одинаковые по численности и составу команды.
Затем случайным образом определяется начальное состояние команд и производится разбиение на пары.
В каждой паре один ученик решает задачу, а другой помогает ему, наблюдая за ходом решения задачи. После окончания партии ученики меняют свое состояние.
После окончания партии (решения задачи) в течение некоторого определенного времени t идет поиск другой пары, которая также закончила партию. Если такая пара находится, то производится обмен партнерами, и игра продолжается. Если не находится, то игра продолжается в прежнем составе.
Цель игры состоит в получении максимального выигрыша каждым игроком. Предполагается, что случайная смена партнера позволит сделать процесс обмена информацией по решению задач более эффективным.
Если мы зададим некоторое случайное начальное распределение игроков по стратегиям и организуем случайный парный обмен стратегиями (первый тип взаимодействия), то начальное распределение будет поддерживаться сколь угодно долго, так как при парном обмене, порожденном любым механизмом разбиения на пары, число игроков, покидающих стратегию, будет равно числу игроков, выбирающих ее. С другой стороны, если разбиение на пары случайно и равновероятно, то средний выигрыш у игроков выравнивается.
Способность человека к рефлексии обусловливает психологический механизм рекурсии. Рефлексия - рассуждение, при котором рассуждающий ставит себя на место другого человека и проводит рассуждения с его точки зрения. Рефлексивные рассуждения обладают свойством рекурсивности, то есть они как бы вкладываются друг в друга, как матрешки.
Подобного рода рассуждения мы используем тогда, когда делаем выбор, успех или неуспех которого зависят не только от нас, но и от других людей, связанных с нами какими-то связями. Пример подобной ситуации - коллективный способ обучения (КСО) [5], в котором успех каждого участника коллектива определяется не только его индивидуальными действиями, но и действиями остальных участников коллектива. Поэтому необходимо использование в КСО механизмов, имитирующих рефлексивные рассуждения.
Можно различить [4; 5] следующие ситуации, связанные с рефлексией. Во-первых, рефлексия у участника КСО отсутствует (нулевой уровень рефлексии), если при выборе своего действия индивид или автомат не учитывает наличия других участников коллектива. При этом выбор действия определяется только той информацией, которая поступила на вход принимающего решение от среды. Следующий уровень рефлексии (под номером 1) соответствует ситуации, когда индивид считает, что у остальных участников коллектива рефлексия отсутствует и он сам может выбирать действия за других. Отметим, что наличие первого уровня рефлексии означает наличие информации, по крайней мере, о некоторых участниках коллектива и сигналах от среды, поступивших на их вход. Определение последующих уровней рефлексии происходит аналогичным образом.
Такое определение уровней рефлексии связано лишь с мерой информированности системы, делающей выбор, о сигналах, поступивших на входы других систем. У человека же рефлексивные рассуждения в подавляющем большинстве опираются на некоторые знания, хранящиеся в его модели мира.
С увеличением уровня рефлексии растет количество информации, которой должен обладать ученик, и число членов коллектива, информацию о которых он должен привлекать. Уровни рефлексии вносят неоднородность в коллектив. Это
позволяет решать задачи оптимизации, которые не способен решать однородный коллектив.
С позиции систем обучения сетевой вариант взаимодействия обучающихся индивидов должен обладать неоднородностью с точки зрения уровней рефлексии. Это оптимизирует задачу обучения членов коллектива.
Причиной неоднородности в коллективе учеников (автоматов) может быть различная степень информированности учеников об объекте изучения. Разнородность отражает фундаментальную идею о лучшем функционировании разнородных коллективов, решающих общую задачу в условиях децентрализации, по сравнению с однородными коллективами, решающими ту же задачу.
Управление с учетом взаимодействия объектов (учеников) является качественно новой задачей, так как возникают ситуации, когда объектов управления (учащихся) много и они взаимодействуют друг с другом. При этом появляется новая функция управления - достижение согласованных действий при наличии многих управляющих систем со своими локальными интересами. Согласование должно происходить само собой в процессе автономного и децентрализованного функционирования всех частей системы.
До сих пор мы рассматривали динамические компьютерные обучающие системы, которые осуществляют управление процессом научения, так, чтобы процесс обучения ученика протекал наиболее благоприятным образом при случайно изменяющихся возмущениях. При этом происходит взаимодействие двух управляющих устройств: ученика и компьютера. То есть мы имеем дело с ситуацией, когда факторы, влияющие на процесс обучения ученика, существенно зависят от действий управляющего устройства компьютера. Как правило, интересы обучающей компьютерной системы ^х)и ученика ^2) совпадают.
Однако может оказаться, что интересы S1 и S2 противоположны в том смысле, что всякое улучшение функционирования системы S1 связано с ухудшением функционирования системы S2 и, наоборот. Тогда управляющие устройства, стремясь улучшить функционирование «своей» системы, будут вырабатывать управляющие воздействия, как можно более вредные для «чужой» системы. Такие ситуации называются конфликтными ситуациями.
Конфликтные ситуации возникают в процессе борьбы живых организмов за существование, при экономическом соперничестве, в компьютерных играх и т.д. В таких ситуациях задачи управления нужно решать с учетом целенаправленного противодействия улучшению функционирования управляемой системы со стороны противника. Наличие «разумного противника» меняет характер задачи формирования целесообразного управления, ибо какое бы управление мы не выбрали, противник, учтя наши действия, постарается поставить нас в наихудшие условия.
Задача управления в конфликтной ситуации состоит в том, чтобы вырабатывать такие реакции на ситуации, складывающиеся в процессе борьбы, такую стратегию, при которых управляемая система (ученик) оказывалась бы в возможно более благоприятном положении даже при самых неблагоприятных действиях противника. Разработкой методов решения такого рода задач занимается теория игр. Игра характеризуется совокупностью правил, определяющих допустимые действия сторон, участвующих в игре, и способы определения их выигрыша или проигрыша.
Очень часто в игре участвуют две стороны (два игрока). Такие игры называются парными. Если в парных играх задействованы компьютеры, то возможны две ситуации. Первая - это когда в роли одного из игроков выступает компьютерная программа. Компьютер как игрок должен иметь свое управляющее устройство -специальную программу, которая отслеживает ход игры и в соответствии с правилами игры принимает решение о тех или иных действиях. Человек, или в
нашем случае ученик, поскольку речь идет об обучающих компьютерных играх, также имеет управляющее устройство - голову или мозг. Он анализирует действия компьютера и стремится обыграть его (рисунок 2).
Рис. 2. Перекрестное влияние двух управляющих систем - ученика и компьютера
Второй вариант парной компьютерной игры предусматривает организацию игрового взаимодействия игроков с помощью двух компьютеров, связанных сетью. Компьютерная система, не вмешиваясь в игру людей, предоставляет им все необходимое для игры. Это - предмет и средства игры, правила и т.п. В определенном смысле, компьютерная система играет роль судьи, подсчитывая выигрыши и проигрыши.
Конфликтную ситуацию можно создать при совместном (ученик-ученик) решении учебных задач. В качестве предметной области можно взять школьный курс алгебры, геометрии или русского языка. Пусть компьютерный генератор задач генерирует серию задач. Каждая j задача может быть решена за N действий при условии, что они правильные. Задачу ученики решают по очереди. Каждое правильное действие дает выигрыш в +1, неправильное действие дает проигрыш в -1. Игрок выполняет действия до тех пор, пока не сделает ошибку - неправильное действие. Затем действия по решению задачи начинает выполнять его соперник, роль которого играет компьютер. И так до тех пор, пока не будет решена задача. j-ю партию выигрывает тот, кто больше набирает очков или выполняет правильных действий. Игра состоит из серии задач (партий). Побеждает тот игрок, который займет более высокий уровень сложности, - десятый. Уровень сложности для одного ученика определяется квалификацией другого ученика, то есть сложность игры для ученика будет повышаться из-за роста квалификации соперника. Квалификация соперника определяется вероятностью совершения игроком правильного действия.
Информация о выигрышах и проигрышах каждого из учеников выводится в специальное окно на экране дисплея компьютера, так же как и движение игроков по уровням сложности. Обучающий характер компьютерная игра имеет потому, что каждый из участников отталкивается от достижений другого участника и играет в соответствии с этим. Выбор действия, сделанный каждым из игроков, известен его противнику, что и определяет обучающий характер игры. При достижении десятого уровня, когда вероятность единичного выигрыша близка к 1, выигрывает тот, кто начал первым.
Процесс игры является динамическим процессом. Это выражается в росте мастерства игроков, которые максимизируют свой выигрыш при условии, если начинают первыми. При достижении этого состояния игра теряет смысл.
С точки зрения диагностики обучаемости ученика, безусловно, необходима запись информации обо всех действиях как ученика, так и компьютера в разыгрываемых партиях. Эволюция траекторий выигрышей ученика, отражающая его политику выполнения действий в зависимости от состояния, так же, как и соответствующая функция ценности состояний, даст информацию об обучаемости ученика в условиях игры.
Обучающие игры для двух человек сложны из-за существования «враждебного» и, по-существу, непредсказуемого противника. Такие игры можно организовать с помощью локальной компьютерной сети. При этом компьютерная система управления в игре не участвует. В качестве примера рассмотрим ситуацию, когда компьютерная система генерирует аналогичные задачи для каждого из игроков. Победителем игры становится участник, который быстрее дойдет до цели, при наименьшем суммарном проигрыше. Проигрыш определяется числом неправильных действий. Целью является решение задачи.
Реализация сетевого динамического компьютерного теста-тренажера «Преобразование графиков функций»
Предлагаемый нами способ компьютерного обучения с использованием сетевых динамических компьютерных тестов-тренажеров включает в себя систему управления процессом взаимодействия пары учеников (либо пары «учитель-ученик») с учетом того, что каждый участник тестирования является сложным динамическим объектом с множеством неопределенных параметров. Предварительное изучение свойств объекта управления не решает проблемы снятия неопределенности, так как в процессе изучения параметры или свойства ученика изменяются. В основе предлагаемого способа обучения лежит управление процессом обучения учеников с одновременным изучением как каждого ученика в отдельности, так и взаимодействия учеников в паре. Компьютерная система, предназначенная для решения этой задачи, состоит из двух идентичных программных модулей, связанных между собой в локальную сеть, каждый из которых включает в себя:
Модуль генератора заданий;
Приемо-передающий модуль (производит пересылку заданий ученику, передает и принимает информацию о деятельности всех участников тестирования, позволяет организовать диалог между учителем и учеником);
Интерфейсный модуль (производит отображение на экране монитора ученика сформулированных заданий, предоставляет ему инструменты для манипулирования изучаемым объектом, отображает на экране текущее значение функции ценности состояния и расстояние до цели, позволяет учителю конструировать задания и оказывать на ученика управляющие воздействия);
Модуль слежения за процессом выполнения заданий (полученная информация записывается в специальный файл-протокол);
Вычислительный модуль, производящий анализ информации о процессе выполнения заданий (вычисляется значение целевой функции ученика, определяющей уровень самостоятельности ученика и частоту помощи при обучении без учителя);
Модуль механизма отрицательной обратной связи (включается по усмотрению учителя и оказывает управляющие воздействия на ученика в автоматическом режиме).
На рис. 3 изображена структурная схема обучающей и диагностирующей систем, используемых в сетевых динамических тестах-тренажерах.
Данная компьютерная система позволяет проводить тестирование в нескольких режимах, таких, как:
два ученика решают одну общую задачу, генерируемую компьютером, делая ходы по очереди;
компьютер генерирует задание, один ученик решает задачу, другой, владея всей необходимой информацией, оказывает первому необходимую помощь;
один ученик, используя встроенные средства компьютерной системы, визуально конструирует задание, которое система преобразует в аналитический вид, и предлагает решить его другому ученику. Первый ученик имеет возможность оказывать помощь второму ученику. После решения задачи ученики меняются местами;
учитель конструирует задание, компьютерная система отсылает его ученику, который, решая его, получает от учителя управляющие воздействия.
Рис.3. Структурная схема обучающей и диагностирующей систем: ГЗ -генератор заданий; ПП - приемо-передающий модуль; В - вычислительный модуль; И - интерфейсный модуль; ОС - модуль отрицательной обратной связи; У1 - объект управления (первый ученик); У2 - объект управления (второй ученик); ЗИ -аналитический модуль, записывающий информацию о деятельности ученика; хвх -задающее воздействие (задание); и - управляющее воздействие; х - управляемая величина; R - критерий оптимальности; Fi - функционалы, определяющие текущее состояние решения задачи в ее проблемном пространстве; у - корректирующее воздействие; И - информация для передачи
Пример. Пара учеников обучается решать задачи конструирования графиков функции, которая в общем виде записывается как
у=т¥(к(х+Х())+уо (1)
График функции генерируется компьютером и выдается на экран каждому ученику (рис. 4). Ученики выполняют все действия, связанные с преобразованием графиков, по очереди, причем каждый из них видит действие товарища и может оценить его правильность.
Рис. 4. Задание полученное одним из учеников
Конструирование графика функции (1) каждый ученик производит, преобразуя график функции у=¥(ж) который дан на координатной сетке рабочего поля дисплея. Для этого ученик должен осуществить операции переноса графика функции вдоль осей ОХ и OY, операции сжатия и растяжения графика, операции инверсии графика так, чтобы в результате получился график искомой функции (1). Интерфейс системы имеет соответствующие кнопки управления как положением, так и формой графика функции у=¥(ж). В память машины записываются: действия или операции; время выполнения действий; правильность (+1) или неправильность (-1) выполняемых действий, значение функции ценности состояния и другие продукты деятельности каждого ученика.
Целевая функция каждого ученика ф{() в момент времени ti+1=ti+Ati+1 определяется уравнением:
фр+Ыт) =Ф(ф(^£У+А^+1), (2)
где S(t) - функция вознаграждения ученика(рис 5).
Рис. 5 Функция вознаграждения
Она равна сумме поощрений (+1) и штрафов (0), полученных учеником в процессе выполнения i+1 задания. Выходной сигнал ) формируется функцией F, т.е. есть функция Е[ф^)].
Выходной сигнал определяет вид и частоту помощи (рис 6), которую обучающая система оказывает ученику. Частота помощи или подкрепления деятельности ученика зависит от достигнутого значения функции ценности состояния. С увеличением ф от 0 до 1. Аналогичным образом можно рассчитать данные функции для пары учеников.
Рис 6. Подсказки доступные ученику
Очевидно, что в процессе решения каждый ученик может допускать ошибки, ведущие к увеличению расстояния до цели. Но, поскольку ученики решают одну задачу вместе, другой ученик должен компенсировать это действие, повысив тем самым свою функцию вознаграждения. Однако целевая функция и функция вознаграждения пары останутся на прежнем уровне.
В процессе тестирования все парные действия учеников можно разбить на четыре категории:
Оба ученика выполняют правильные действия. В этом случае целевая функция обоих учеников растет, частота управляющих воздействий снижается, функция вознаграждения стремится к виду 1 - 1.
Первый ученик выполняет правильные действия, а другой нет. Следовательно, целевая функция первого ученика растет, второго уменьшается или остается неизменной, частота функции вознаграждения первому ученику уменьшается, второму растет. Вид функции вознаграждения: 1 - 0.
Первый ученик делает неверные действия, второй их исправляет. Вид функции вознаграждения: 0 - 1.
Оба ученика делают неверные ходы. Целевая функция обоих учеников уменьшается или остается на прежнем уровне, частота управляющих воздействий максимальна, функция вознаграждения стремится к виду 0 - 0.
Анализ и оценка разработки
Формирование методики проведения педагогического эксперимента осуществлялось в соответствии с теоретической концепцией исследования, основой которой является утверждение о том, что разработка и внедрение в учебный процесс сетевых компьютерных динамических тестов-тренажеров в качестве
научнообоснованной методической системы управления учебно-познавательной деятельностью учащихся позволит повысить качество обучения, уменьшить трудозатраты учителей при подготовке к занятиям, реализовать индивидуальную систему коррекции знаний. Это утверждение предопределило многоплановость экспериментальной проверки разработанной технологии управления учебнопознавательной деятельностью.
В ходе выполнения заданий на компьютере перед учащимися была поставлена цель - достичь десятого уровня и выполнить три задания подряд. Каждый из учеников начинал выполнение заданий с первого уровня. Дальнейшее продвижение с уровня на уровень происходило индивидуально, в зависимости от правильности выполнения заданий и количества неправильных шагов (действий).
На рис. 7 приведена целевая функция успешно обучающегося ученика, который в случае успешного выполнения задания переводится на более высокий уровень. Потом он делает ошибки, и его уровень самостоятельности понижается, так как необходима внешняя помощь. Выполнив несколько заданий на этом уровне, учащийся опять переводится на более высокий уровень. На более высоком уровне повышается роль самоконтроля учащегося, а частота «подсказок» со стороны обучающей системы (учителя) уменьшается. На графике видно, что учащийся опять был переведен на более низкие уровни, что говорит о том, что он не смог справиться с заданием на таком уровне самостоятельности и ему еще необходима более частая внешняя помощь. Выполнив несколько заданий на этом уровне, учащийся опять переводится на более высокий уровень. А потом еще выше, достигнув, таким образом, наивысшего десятого уровня. Находясь на высшем уровне, где учащийся полностью осуществляет контроль над выполняемыми действиями и оценивает их правильность без внешней подсказки, он опять допускает ошибки, и уровень его самостоятельности несколько понижается. Выполнив несколько заданий, учащийся вновь возвращается на высший десятый уровень, где выполняет правильно три задания подряд. Таким образом, видим, что данный ученик достиг поставленной цели.
Оросм*
10
9
0
7
6
4
Э
2
1
В г—*"
Рис. 7. Целевая функция успешно обучающегося ученика
Однако далеко не все ученики достигают этого уровня. Некоторые, несмотря на огромный объем тренажных упражнений, достигают невысоких результатов (3-6 уровень самостоятельности). Такие ученики для выполнения заданий постоянно нуждаются во вспомогательной информации. Как правило, они невнимательны, постоянно допускают ошибки. Их деятельность осуществляется в основном методом проб и ошибок. Они постоянно нуждается в дополнительной информации о ходе выполнения задания. На рис. 8 показано, что перевод учащегося на более высокий уровень самостоятельной деятельности осуществляется при частом обращении к подсказке, в отсутствие которых учащийся совершает ошибки и в результате снова переводится на более низкий уровень самостоятельности.
10
9
8
7
6
5
4
3
2
1
Вс«*«*
Рис. 8. Целевая функция ученика постоянно нуждающегося во вспомогательной информации.
При выполнении заданий учитель подстраивается под учащегося, предлагая ему различные управляющие воздействия. Если учащийся затрудняется с выполнением задания на данном уровне, то он переводится на более низкий уровень. Если же задание выполняется успешно, то учащийся переводится на не слишком высокий уровень, т.е. уровень самостоятельности повышается только благодаря управляющим воздействиям. Причем величина повышения или понижения уровня осуществляется в зависимости от личных достижений учащегося.
Заключение
В работе предложены и проанализированы информационные модели процесса обучения на основе конечных автоматов, применяемых в сетевых динамических компьютерных тестах-тренажерах, рассмотрена структурно-функциональная модель сетевого динамического тестирования. На примере сетевых динамических тестов раскрыта возможность организации отрицательной обратной связи и соответствующего компьютерного управления процессом тестирования ученика. Обосновано, что на основе получения оперативной информации в результате сетевого динамического тестирования преподаватель может контролировать и при необходимости корректировать процесс учебной деятельности ученика, то есть управлять УПДУ. Это существенно усиливает роль сетевого динамического компьютерного тестирования в управлении УПДУ.
Литература
1. Лернер А.Я. Начала кибернетики / А.Я. Лернер. - М.: Наука, 1967. - 400 с.
2. Пак, Н.И. Нелинейные технологии обучения в условиях информатизации: монография / Н.И. Пак. - Красноярск, 2004. - 220 с.
3. Поспелов Д.А. Моделирование рассуждений. Опыт анализа мыслительных аспектов / Д.А. Поспелов. - М., 1989
4. Варшавский В.И. Оркестр играет без дирижера: размышления об эволюции некоторых технических систем и управлении ими / В.И. Варшавский, Д.А. Поспелов. - М.: Наука, 1984. - 208 с.
5. Дьяченко В.К. Новая дидактика / В.К. Дьяченко. - М., 2001 - 496 с.
6. Дьячук П.П. Сетевые технологии и КСО / П.П. Дьячук, Д.Н. Кузьмин, Е.Н. Васильева. - Красноярск. КГПУ, 2004.