УПРАВЛЕНИЕ ОБРАЗОВАНИЕМ: ТЕОРИЯ И ПРАКТИКА" 2015 №1 (17) 139
УДК 348.147
РАЗВИТИЕ ТЕХНОЛОГИЙ ТЕСТИРОВАНИЯ В ОБРАЗОВАНИИ
Сафиулин Р.З., магистрант, МГТУ МИРЭА, E-mail: [email protected] Москва, Россия
Аннотация. Статья анализирует технологии и методы тестирования. Статья содержит классификацию педагогических тестов. Показано значение стандартизации при составлении тестов. Статья описывает формы тестовых заданий. Статья содержит фрагменты теории программированного обучения и тестирования. Статья описывает линейное обучение и тестирование. Статья описывает разветвленное обучение и тестирование. Статья описывает адаптивное обучение и тестирование.
Ключевые слова: Образование, информационные образовательные технологии, тестирование, методы тестирования.
TECHNOLOGY DEVELOPMENT OF TESTING IN EDUCATION
Safiullin R.Z., postgrad., MSTUMIREA, E-mail: [email protected] Moskow, Russia
Annotation. The article analyzes the technology and testing methods. This article contains a classification of educational tests. It shows the importance of standardization in the preparation of the tests. This article describes the shape of the test tasks. This article contains fragments of the theory of programmed instruction and testing. This article describes a linear training and testing. This article describes branched training and testing. This article describes the adaptive learning and testing
Keywords: education, information technology education, testing, testing methods
Введение. Тестирование — это научный метод, который позволяет выявить уровень знаний, умений и навыков, способностей и других качеств личности, а также их соответствие определенным нормам путем анализа способов выполнения испытуемым ряда специальных заданий [1]. Такие задания принято называть тестами. Тест — это стандартизированное задание или особым образом связанные между собой задания, которые позволяют исследователю диагностировать меру выраженности исследуемого свойства у испытуемого, его психологические характеристики, а также отношение к тем или иным объектам. В результате тестирования обычно получают некоторую количественную характеристику, показывающую меру выраженности исследуемой особенности у личности [2]. Она должна быть соотносима с установленными для данной категории испытуемых нормами. Значит, с помощью тестирования можно определить имеющийся уровень развития некоторого свойства в объекте исследования и сравнить его с эталоном или с развитием этого качества у испытуемого в более ранний период. Тесты обычно содержат вопросы и задания,
УПРАВЛЕНИЕ ОБРАЗОВАНИЕМ: ТЕОРИЯ И ПРАКТИКА" 2015 №1 (17) 140
требующие очень краткого, иногда оппозиционного ответа [3] («да» или «нет», «больше» или «меньше» и т.д.), выбора одного из приводимых ответов или ответов по балльной системе.
Тестовые задания обычно отличаются диагностичностью, их выполнение и обработка не отнимают много времени. В то же время, как показала мировая практика, очень важно видеть, что реально могут выявить тесты, для того чтобы не подменить предмет диагностирования. Так, многие тесты, претендующие на выявление уровня развития, реально выявляют лишь уровень подготовленности, информированности или умелости испытуемых. В рамках информационных технологий тесты - это вид информационных технологий обучения и контроля обучения [4].
Классификация педагогических тестов. Тест (от англ, test — испытание, проверка) — стандартизованные, краткие, ограниченные во времени испытания, предназначенные для установления количественных и качественных индивидуальных различий [5]. По мере использования тестов была сформирована их классификация по цели и содержанию:
• тесты личности — для оценки эмоционально-волевых качеств индивидуума;
• тесты интеллекта — для анализа уровня развития познавательных процессов и функций мышления;
• тесты способностей — для оценки возможности в овладе нии различной деятельностью;
• тесты достижений, с помощью которых оценивают разви тие знаний, умений, навыков после обучения.
Из всего многообразия типов стандартизованных тестов в образовании используют тесты достижений. Они создавались для проверки результатов обучения на разных ступенях получения образования, измерения эффективности программ и процесса обучения. Тесты достижений принято противопоставлять тестам способностей, состоящим из тестов общего интеллекта, комплексных батарей способностей и тестов специальных способностей. Можно сказать, что тесты способностей измеряют эффективность обучения в относительно неконтролируемых и неизвестных условиях, в то время как тесты достижений измеряют эффективность обучения при частично известных и контролируемых условиях.
По процедуре создания могут быть выделены стандартизированные и не стандартизированные тесты. Стандартизация в информационной области [6] — последовательный ряд процедур по планированию, проведению оценивания и выставлению баллов. Ц,ель стандартизации состоит в том, чтобы обеспечить всем
УПРАВЛЕНИЕ ОБРАЗОВАНИЕМ: ТЕОРИЯ И ПРАКТИКА" 2015 №1 (17) 141
учащимся возможность проходить оценивание в равных условиях, чтобы их оценки имели одинаковое значение и не подвергались влиянию различных условий. Это важная процедура, когда оценки планируется использовать для сравнения отдельных людей или групп.
В образовании можно выделить и ряд задач, которые могут быть решены не стандартизированными тестами, — в том числе текущий контроль знаний на этапе обучения [7]. Однако для итоговой аттестации учащихся используются только стандартизованные тесты. По способу предъявления различают тесты [8]:
• бланковые (машиночитаемые бланки, тестовые тетради);
• предметные (манипуляция материальными объектами рассчитана на быстроту реакции и четкость действий);
• аппаратурные (с использованием специальной аппаратуры — датчиков для фиксации сигналов);
• практические (аналоги лабораторных работ, но с тестовыми условиями заданий);
• компьютерные (как частный случай — адаптивные)
• По характеру действий тесты делят на:
• вербальные;
• невербальные.
• По ведущей ориентации выделяют:
• тесты на скорость;
• тесты на результативность (мощность);
• смешанные тесты.
• По степени однородности задач тесты делят на:
• гомогенные, позволяющие измерить одно качество (уровень подготовки по одному предмету) однородными по составу заданиями;
• гетерогенные (многомерные) — для измерения уровня подготовленности учащихся по нескольким учебным предметам и (или) свойствам личности.
Еетерогенные тесты бывают полидисциплинарными и междисциплинарными. Полидисциплинарные тесты состоят из гомогенных субтестов по отдельным дисциплинам. Результаты учеников по субтестам объединяются для подсчета итоговых баллов по всему полидисциплинарному тесту. Для выполнения заданий междисциплинарных тестов требуется применение обобщенных, межпредметных, интегративных знаний и умений. Междисциплинарные тесты всегда многомерны , их
УПРАВЛЕНИЕ ОБРАЗОВАНИЕМ: ТЕОРИЯ И ПРАКТИКА" 2015 №1 (17) 142
разработка требует обращения к факторным методам анализа данных, математикостатистическим методам многомерного шкалирования и т.д.
Для отечественной системы образования наиболее приемлемый и используемый педагогами термин [5, 9] — «тестирование во входном контроле». При входном контроле с помощью педагогических тестов можно ответить на вопрос — насколько обучаемые владеют базовыми знаниями, умениями и навыками, чтобы успешно освоить новый материал, а также определить степень владения новым материалом до начала его изучения.
Учащиеся в классе имеют разную подготовку, различные способности и различаются по мотивирующему фактору. В этой ситуации реализовать в большей мере личностно ориентированное обучение возможно при следующем подходе. Сначала следует провести входное тестирование, которое позволит разделить учащихся на две подгруппы. В первую попадают сильные учащиеся; при анализе выполнения ими входного теста прежде всего важна не степень их готовности к изучению нового материала, а оценка степени владения новым материалом, которая поможет учителю организовать его изучение на приемлемом уровне.
Для второй группы учащихся на начальном этапе важно определить, каких базовых компонентов знаний им не хватает для успешного продолжения учения, и принять меры по устранению выявленных пробелов еще на первоначальном этапе. В этом случае учитель может подобрать такой метод обучения, который был бы наиболее эффективным для всей группы и позволил бы получить высокие результаты по окончании обучения. Сравнение же начального и конечного состояния обучаемых позволяет оценить прирост знаний [10]; тогда во входном тестировании используется тестовый материал, незначительно отличающийся от материала для итогового контроля по изучаемой теме.
При первоначальном изучении материала учителю предстоит большая подготовительная работа по разработке собственного проверочного материала или по адаптации уже существующего; в дальнейшем же используется уже готовый материал и необходимы только незначительные его корректировки. Входное тестирование бесполезно, когда:
— учитель хорошо знает возможности обучаемых, поскольку давно работает с классом;
— специфика содержания нового материала такова, что не позволяет выделить круг базовых знаний, умений и навыков, необходимых к началу обучения;
— область планируемых к усвоению знаний достаточно новая, так что у
УПРАВЛЕНИЕ ОБРАЗОВАНИЕМ: ТЕОРИЯ И ПРАКТИКА" 2015 №1 (17) 143
учащихся не может быть никаких «заделов», либо трудно пока выделить качественный уровень усвоения .
Тесты для входного контроля, обычно называемые претестами (предварительными тестами), делятся на два типа. Претесты первого типа позволяют выявить готовность к усвоению новых знаний в классе. Они разрабатываются в рамках критериально-ориентированного подхода и содержат задания для проверки базовых знаний, умений и навыков, необходимых для усвоения нового материала, В основном эти претесты предназначены для наиболее слабых учеников, находящихся на границе между явно подготовленными и явно не подготовленными к началу усвоения нового материала. По результатам выполнения претеста проводится деление тестируемых на две группы, в одну из которых попадают те, кто может двигаться дальше, а в другую — те, кто нуждается в дополнительной работе и консультациях педагога.
Претесты второго типа разрабатываются в рамках нормативно-ориентированного подхода [11]. Они охватывают планируемые результаты предстоящего обучения и построены полностью на новом материале. По результатам выполнения претеста преподаватель принимает решение, позволяющее внести элементы индивидуализации в массовый учебный процесс. Если ученик показал некоторые предварительные знания по новому материалу, то план его обучения необходимо перестроить и начать с более высокого уровня, чтобы учебный материал имел для него действительный характер новизны. Иногда роль входного претеста выполняет итоговый тест, который предназначен для будущей оценки результатов усвоения нового материала после завершения его изучения.
Формы тестовых заданий. Задания с выбором ответов (закрытые задания). В этих тестах решается задача оптимального выбора или задача предпочтений [12]. Задания на установление информационного соответствия [13]. Задания с выбором нескольких правильных ответов [14]. По существу это вариант многоцелевого управления. Упорядочивание последовательности. Это задача ранжирования по выбранному критерию [15]. Задания с открытым ответом. Это задание использования некой информационной конструкции или сложной информационной модели [16], в которой пропущена одна информационная единица. С помощью логического анализа учащийся должен выявить эту информационную единицу.
Теория программированного обучения и тестирования. В основу этой теории положена концепция бихевиоризма. В бихевиоризме (от лат. behavior - поведение) не рассматриваются внутренние процессы человеческого мышления. Изучается поведение, которое трактуется как сумма реакций на какие-либо ситуации. Один из
УПРАВЛЕНИЕ ОБРАЗОВАНИЕМ: ТЕОРИЯ И ПРАКТИКА" 2015 №1 (17) 144
основоположников бихевиоризма Э. Л. Торндайк (1874-1948) пытался описать обучение человека с помощью простых правил, справедливых одновременно и для животных. Среди этих правил выделим два закона, послуживших платформой для дальнейшего развития теории обучения.
Первый из них, названный законом тренировки, говорит о том, что чем чаще повторяется определенная реакция на ситуацию, тем прочнее связь между ними, а прекращение тренировки (повторения) приводит к ослаблению этой связи.
Второй закон был назван законом эффекта: если связь между ситуацией и реакцией сопровождается состоянием удовлетворенности (удовольствия) индивида, то прочность этой связи возрастает, и наоборот: прочность связи уменьшается, если результат действия приводит к состоянию неудовлетворенности.
В своей книге «Образование», опубликованной в 1912 году, Э.Л. Торндайк писал: «Если бы при помощи хитроумных механических устройств можно было построить книгу так, чтобы вторая ее страница стала видимой лишь тому, кто выполнил предписание ее первой страницы, и т.д., то многое из того, что в настоящее время требует личных указаний преподавателя, могло бы быть переложено на плечи типографии».
В начале 20-х годов прошлого века д-р Сидней Пресси из университета штата Огайо (США) сконструировал механическое устройство для проверки и оценки усвоения материала на уровне простейших тестов. Позднее он обнаружил, что это устройство обладает и определенными обучающими возможностями. Устройство Пресси состояло из заданной последовательности вопросов, которые поочередно появлялись в демонстрационном отверстии. Учащийся выбирал один из готовых ответов, приведенных на карточке или листе бумаги, и нажимал кнопку, соответствующую этому ответу. Таким образом, применялся выборочный метод ответа (схема множественного выбора), причем только при правильном ответе перед учащимся появлялся следующий вопрос.
Линейное программированное обучение. В 50-х годах идеи Торндайка были трансформированы в конкретную теорию обучения. Опираясь на указанные выше два закона, Б.Ф. Скиннер (США) разработал весьма технологичную методику обучения, названную в дальнейшем линейным программированием. В основу своей методики Скиннер положил универсальную формулу
С ->Р ->П,
где С - ситуация; Р - реакция; П - подкрепление.
Учебный материал Скиннер предлагал разбивать на части, каждая из которых
УПРАВЛЕНИЕ ОБРАЗОВАНИЕМ: ТЕОРИЯ И ПРАКТИКА" 2015 №1 (17) 145
должна содержать одну информационную ситуацию (задание) или информационную конструкцию. На начальном этапе информационные ситуации должны быть настолько простыми, чтобы реакции на них практически всегда были правильными [17]. По мнению Скиннера, правильное выполнение учебного задания уже само по себе является положительным подкреплением и приводит учащегося в состояние уд овл етвор енности.
В текстах программированных учебных пособий Скиннера содержались пропуски семантических информационных единиц [18] (СИЕ) - один пропуск на фразу (составную информационную единицу) из 2-3 строк. Пропущенные СИЕ располагали на полях страницы. Учащийся, изучая такое пособие, сначала закрывал поля, читал текст, вставляя пропущенные слова, и сразу же проверял себя, открывая ответы. Тексты учебных пособий были написаны таким образом, чтобы в процессе их чтения обеспечивалось многократное повторение всех существенных элементов учебного материала.
Важной особенностью линейного программирования является то, что учащийся «конструирует» ответ. Скиннер считал, что составленный самим учащимся ответ заставляет его глубоко продумать материал и позволяет добиться лучшего понимания, чем при схеме множественного выбора.
Линейные программы бывают двух видов. Первый из них характеризуется тем, что учащийся изучает последующую часть учебной информации независимо от того, правильно ли выполнено задание по предыдущей части. Другим видом линейной программы предусматривается выдача учащемуся очередной части учебной информации только тогда, когда предыдущее задание будет выполнено правильно.
Применение программированных пособий Скиннера в профессионально-технических училищах США оказалось успешным: существенно сократилось время обучения, повысилась квалификация обучаемых рабочих. При этом обнаружились и недостатки методики линейного программирования:
• монотонность и механистичность программированных текстов;
• отсутствие системности в восприятии учебного материала (большое количество частей не способствует обобщениям);
• правильность выполнения простых заданий является положительным подкреплением лишь на первых порах чтения пособия, в дальнейшем правильное выполнение простых ситуаций уже не приносит чувства удовлетворенности;
• отсутствие гибкой траектории обучения (все ученики выполняют одну и ту же программу, идут по одной линии).
УПРАВЛЕНИЕ ОБРАЗОВАНИЕМ: ТЕОРИЯ И ПРАКТИКА" 2015 №1 (17) 146
Разветвленное программированное тестирование. Значительной части недостатков линейного подхода лишена предложенная Н. А. Краудером схема разветвленного программирования [14], которая носит название схема Краудера.
И2
I
I
I
Рис. 1. Схема Краудера
Работа Краудера базировалась на опыте исследования проблем, связанных с обучением техников по обслуживанию навигационного оборудования самолетов в ВВС США. Краудер считал, что «малые шаги» в линейной программе и малая скорость развертывания материала при его подаче недостаточно эффективны для более способных и развитых учащихся. Он предложил увеличить объем информации (И1 рис.1) с 2-3 строк у Скиннера до примерно половины страницы.
Типовая ситуация схема Краудера состояла из вопроса (В) и трех вариантов ответов: 01 — правильный ответ, 02 — неточный ответ, 03 — неправильный ответ. При неточном ответе учащийся отправлялся к корректирующей информации (К), при неправильном — ему давалось разъяснение, помощь (Р). При правильном ответе учащийся получал положительное подкрепление (П) и переходил к следующей части задания (И2).
Схема разветвленного программирования имеет три траектории: для сильных, средних и слабых учащихся [19]. При этом способный учащийся пройдет материал быстрее, чем учащийся, которому придется обращаться к вспомогательным порциям информации. Разветвленное программирование основывается на схеме множественного выбора ответов. При этом преследуются следующие цели:
• проверить понимание только что изученного материала;
• выбрать путь исправления ошибки при неправильном ответе;
• привести дополнительное упражнение или объяснение по использованию
УПРАВЛЕНИЕ ОБРАЗОВАНИЕМ: ТЕОРИЯ И ПРАКТИКА" 2015 №1 (17) 147
рассмотренного понятия;
• активизировать работу учащегося при изучении учебной информации;
• поощрить учащегося при правильном ответе.
«Дифференциальные психологи» (последователи Краудера) придерживаются взгляда, что обучение совершается путем ознакомления учащихся с новым материалом. Они не требуют сколько-нибудь детального знания истинной природы процесса познания, а утверждают, что обучение человека происходит с использованием множества различных путей в зависимости от способностей и запаса знаний отдельных учащихся, характера и объема изучаемого материала и взаимодействия этих факторов, а также от других, менее очевидных причин.
С разветвленным программированием обычно связывают схему множественного выбора ответов в упражнениях и тестах. Она является наиболее технологичной в плане подготовки и использования электронных средств. Хотя эта схема с когнитивной точки зрения часто подвергается критике, некоторые психологи считают выборочные ответы такими же эффективными, как и конструируемые, особенно если учащийся уже имеет некоторое представление об изучаемом материале.
Адаптивное (ситуационное) тестирование. Одновременно со Скиннером и Краудером английский радиоинженер Еордон Паск проводил в университете штата Иллинойс (США) исследования процессов формирования навыков ручного труда. Он пришел к выводу, что невозможно придумать удовлетворительную программу для обучения навыкам без учета изменения отношения учащихся к предмету изучения, периодов повышенного интереса и усталости, чередующихся в процессе обучения. Его исследования положили начало адаптивному тестированию.
Адаптивное обучение обучение основано на гипотезе, что некоторое количество ошибок (найденных и исправленных) повышает эффективность обучения [20]. При этом количество ошибок используется следующим образом:
• как только процент ошибок падает ниже определенного уровня, автоматически повышается степень трудности программы обучения;
• как только процент ошибок возрастает выше определенного уровня, автоматически понижается степень трудности.
Одновременно учащийся получает «указывающую информацию», которая помогает ему выбрать правильный ответ и предлагает дополнительные упражнения по тем вопросам, усвоение которых дается с наибольшим трудом. В течение периода обучения обучающая программа накапливает сведения о точности ответов и скорости работы учащихся, по которым можно судить о материале, вызывающем наибольшие
УПРАВЛЕНИЕ ОБРАЗОВАНИЕМ: ТЕОРИЯ И ПРАКТИКА" 2015 №1 (17) 148
трудности при изучении.
Заключение. Тестирование является важным этапом итоговой и промежуточной аттестации обучающихся в образовательных учреждениях [21]. Этот метод диагностики один из наиболее достоверных и объективных [22]. Объективность достигается путем стандартизации и проверки показателей качества заданий и тестов целиком. Выполняя свои многогранные функции (контролирующую,
диагностическую, обучающую, прогностическую, развивающую и воспитывающую) тестовый контроль повышает эффективность и продуктивность учебного процесса. Являясь неотъемлемой частью системы контроля, тестирование наряду с традиционными методами контроля используется в целях и внешнего, и внутреннего мониторинга. Разные виды тестирования дополняют друг друга и в целом повышают качество образования.
Список литературы
1. Ожерельева Т.А. Развитие методов тестирования // Перспективы науки и образования- 2013. - №6. - с20-25.
2. Нейман Ю. М., Хлебников В. А. Педагогическое тестирование как измерение -М.: Ц,ентр тестирования МО РФ. - 2002.
3. Ц,ветков В.Я. Использование оппозиционных переменных для анализа качества образовательных услуг // Современные наукоёмкие технологии. - 2008. - №1. - с. 62-64.
4. Кулагин В.П., Найханов В.В., Овезов Б.Б., Роберт И.В., Кольцова Е.В. Юрасов В.Е. Информационные технологии в образовании. - М. "Янус-К, 2004 - 248с.
5. Равен Д. Педагогическое тестирование: проблемы, заблуждения, перспективы. -М. : Когито-Центр, 2001.
6. Ц,ветков В.Я. Стандартизация информационных программных средств и программных продуктов. - М.: МГУЕиК, 2000 - 116с.
7. Ожерельева Т. А. Тестирование в области наук о Земле // Славянский форум. -2013. - 1(3). - с.95-100.
8. Ц,ветков В.Я., Курский Р.А. Подготовка тестовых заданий, составление тестов, проведение тестирования студентов. Учебное пособие для профессорско-преподавательского состава кафедр университета. -М.: МИИТ, 2008 - 24 с.
9. Кулагин В.П., Ц,ветков В.Я. Модели многоуровневого тестирования // Информатизация образования и науки. - 2013,- № 3. - с 95-101.
10. Ц,ветков В.Я. Извлечение знаний для формирования информационных ресурсов. -М.: Еосинформобр. 2006. - 158с.
УПРАВЛЕНИЕ ОБРАЗОВАНИЕМ: ТЕОРИЯ И ПРАКТИКА" 2015 №1 (17) 149
11. Podsiadlo D., Richardson S. The timed" Up & Go": a test of basic functional mobility for frail elderly persons //Journal of the American geriatrics Society. - 1991. - T. 39. - №. 2. -C. 142-148.
12. Цветков В.Я. Основы теории предпочтений,- М.: Макс Пресс, 2004. - 48с
13. Цветков В.Я. Информационное управление. - LAP LAMBERT Academic Publishing GmbH & Co. KG, Saarbriicken, Germany 2012 -201c
14. Holm S. A simple sequentially rejective multiple test procedure //Scandinavian journal of statistics. - 1979. - C. 65-70.
15. Ожерельева T.A. Особенности тестирования специалистов в области наук о Земле // Международный журнал экспериментального образования. - 2013. - № 7. -стр. 135-136.
16. Tsvetkov V. Ya. Information Units as the Elements of Complex Models // Nanotechnology Research and Practice, 2014, Vol.(l), № 1, p57-64.
17. Кожевников Д.О. Актуальные проблемы организации модульного тестирования классов программного кода // Образовательные ресурсы и технологии 2014. № 1. С. 134-142.
18 Tsvetkov V. Ya. Semantic Information Units as L. Florodi’s Ideas Development // European Researcher, 2012, Vol.(25), № 7, p.1036- 1041.
19. Кулагин В. П, Цветков В.Я Особенности многоуровневого тестирования // Дистанционное и виртуальное обучение. - 2013. - №4. -с.5-12
20. Марьянник Е.Б. Компьютеризация процесса отработки материала и оценки знаний студента: проблемы и перспективы // Образовательные ресурсы и технологии. 2014. №3. С. 12-18.
21. Алегцанова И. В., Фролова Н. А. Педагогическое тестирование как средство повышения качества контроля и оценки эффективности учебного процесса в вузе //Современные проблемы науки и образования. - 2007. - №6. - С. 13-17.
22. Cattell R. В. The scree test for the number of factors //Multivariate behavioral research. - 1966. - T. 1. - №. 2. - C. 245-276.