Научная статья на тему 'Модели и процедуры измерения и оценивания результатов критериально-ориентированного тестирования'

Модели и процедуры измерения и оценивания результатов критериально-ориентированного тестирования Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
360
52
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КРИТЕРИАЛЬНО-ОРИЕНТИРОВАННОЕ ТЕСТИРОВАНИЕ / ПЕДАГОГИЧЕСКОЕ ИЗМЕРЕНИЕ / ОЦЕНИВАНИЕ РЕЗУЛЬТАТОВ / НЕЗАВИСИМЫЕ И ВЛОЖЕННЫЕ ТЕСТОВЫЕ ЗАДАНИЯ / THE CRITERION-REFERENCED TESTING / PEDAGOGICAL MEASUREMENT / ESTIMATION OF THE RESULTS INDEPENDENT AND ENCLOSED TEST TASK

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Туровская Алиса Олеговна

В статье рассмотрены недостатки существующих методов оценки результатов критериально-ориентированного педагогического контроля знаний и предложены модели и процедуры, обеспечивающие объективность, дифференцированность и критериальную валидность оценки результатов тестирования знаний.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Model and procedures of measurement and estimation of results of the criterion-referenced testing

In article lacks of existing methods of an estimation of results of the criterion-referenced pedagogical control of knowledge are considered and models and the procedures providing objectivity, distinctiveness and concurrent validity estimations of results of testing of knowledge are offered.

Текст научной работы на тему «Модели и процедуры измерения и оценивания результатов критериально-ориентированного тестирования»

Туровская А.О. Модели и процедуры измерения и оценивания результатов критериально-ориентированного..

Literature

1. Alexandrov, J. I. Learning and memory: system prospect// Simonov second readings / Ed. I.A Shevlev, etc. - Moscow, 2004. - P. 3-51.

2. Anisov, A. M. Properties of time // Logic researches. Fascicle 8. — Moscow, 2001. — P. 5-25.

3. Ashmarin, I. P., Kruglikov, R. I. Peptide, training, memory (polyfunctionality principle) // Neurochemistry, 1983. — book 2. — № 3.

4. Batuev, A. S. Physiology of the high nervous activity and sensing systems : Textbook for high schools. — St.-Petersburg, 2005.

5. Verbitsky, A. A. Active training in the high school: the contextual approach. — Moscow, 1991.

6. Verbitsky, A. A. New educational paradigm and contextual training. — Moscow, 1999.

7. Grechenko, T. N, Sokolov, E. N. Neurophysiology of memory and training // Mechanisms of memory. — Leningrad, 1987. — P. 132-171.

8. Grechenko, T. N. Psychophysiology of memory // Bases of psychophysiology / Under the editorship of J. M. Aleksandrov. — Moscow, 1997.

9. Danilova, N. N. Psychophysiology : Textbook for high schools. / N.N. Danilova — M, 2004.

10. Kiseleva, O. O. Time and pedagogical reality // the Person in pedagogy and psychology. — Petropavlovsk-Kamchatka, 2001.

11. Kozyrev, N. A. About possibility of the experimental research of time properties / Kozirev N.A. The favor works. — Leningrad, 1991.

12. Maklakov, A. G. General Psychology : Textbook for high schools. — St.-Petersburg, 2004.

13. Rean, A. A, Bordovskaja, N. V., Ro%um, S. I. Psychology and pedagogy. — St.-Petersburg, 2008.

14. Smirnov, V. M, Budilina, S. M. Physiology of sensing systems and higher nervous activity : Manual for students of high educational institutions. — Moscow, 2003.

15. Strelnikova, J. J., Solntsev, V. O. Anatomy of central neural systems: Manual. — St.-Petersburg,

2009.

16. Ukhtomsky, A. A. Dominant. — St.-Petersburg, 2002.

17. Grzywacz, N. M., Burgi, P. Y. Toward a biophysically plausible bidirectional Hebbian rule / / Neural Comput. — 1998, Apr.1; 10 (3). — P. 499-520.

18. Mark, R. Sequental biochemical steps in memory formation: evidence from the use of metabolic inhibitors / / Brain mechanisms in memory and learning: from the single neuron to man / Ed. / M.A.B. Brazier. — N.Y., 1979. — P. 197-215.

19. Nader, K Response to Arshavsky: Challenging the old views // TINS. 2003. — V 26. — P. 466-468.

20. Squire, Larry R., Kandel, Eric R. Memory: From Mind to Molecules Publisher: W H. Freeman Company Pub. — January 1998. — P.19

1 Работа выполнена при поддержке Российского гуманитарного научного фонда (РГНФ), грант 08-06-00799а.

2 Синапс (от греч. synapsis — контакт) — это специализированные структурные соединения между клетками (в данном случае — нейронами), обеспечивающие возбуждающие, тормозные и трофические влияния между ними.

3 Медиатор — химическое вещество (ацетилхолин, норадреналин, серотонин, дофамин, g-аминомасляная кислота и др.), образующееся в теле нейрона или в нервном окончании, необходимое для передачи сигнала в синапсах.

4 Нейропептид — химическое вещество белковой природы, синтезируемое в нейроне.

УДК 371.322.8 А.О. Туровская*

Модели и процедуры измерения и оценивания результатов критериально-ориентированного тестирования

В статье рассмотрены недостатки существующих методов оценки результатов критериально-ориентированного педагогического контроля знаний и предложены модели и процедуры, обеспечивающие объективность, дифференцированность и критериальную валидность оценки результатов тестирования знаний.

Ключевые слова: критериально-ориентированное тестирование, педагогическое измерение и оценивание результатов, независимые и вложенные тестовые задания.

* Туровская, Алиса Олеговна, младший научный сотрудник ЗАО "Фирма "Пассат"; г. Санкт-Петербург, ул. Разводная, д. 15, тел. (812) 427-20-21.

* Turovskaya, Alisa, Junior colleague of "Passat Firm" JSC (Scientific and Manufacturing Company «Passat», closed-type JSC), Sankt-Petersburg, Razvodnaya, 15.

Психология

A.O. Turovskaya*. Model and procedures of measurement and estimation of results of the criterion-referenced testing.

In article lacks of existing methods of an estimation of results of the criterion-referenced pedagogical control of knowledge are considered and models and the procedures providing objectivity, distinctiveness and concurrent validity estimations of results of testing of knowledge are offered.

Keywords: the criterion-referenced testing, pedagogical measurement and the estimation of the results independent and enclosed test task.

Педагогическое тестирование определяется как «один из наиболее стандартизованных и объективных методов контроля и оценивания знаний, умений и навыков испытуемого, который лишен таких традиционных недостатков других методов контроля знаний, как неоднородность требований, субъективность экзаменаторов, неопределенность системы оценок и т.п.» [1].

Однако указанное положение об объективности педагогического тестирования не может быть полностью распространено на критериально-ориентированные тесты, позволяющие оценить уровень подготовленности (учебных достижений) испытуемых в конкретной предметной области по не связанному с процедурой тестирования внешнему критерию. Так, из основных форм закрытых тестовых заданий в современных компьютерных системах тестирования (КСТ) объективно оцениваются только задания в форме «одиночный выбор», когда испытуемый должен выбрать один вариант ответа из нескольких предложенных. В остальных формах заданий процедура объективного измерения результатов тестирования заменяется процедурой субъективной идентификации этих результатов по правилам, установленным преподавателем или разработчиком теста. К таким формам закрытых критериально-ориентированных тестовых заданий относятся:

1) форма «множественный выбор», когда испытуемый должен выбрать несколько вариантов ответа из нескольких предложенных;

2) форма «соответствие», когда тестируемому нужно упорядочить два списка таким образом, чтобы они соответствовали друг другу;

3) форма «упорядоченный список», когда тестируемому нужно упорядочить список в определенном порядке.

Для формы «множественный выбор» В.С. Аванесов в [2] рекомендует за полностью правильное решение дать три балла, за каждую ошибку снимать один балл. Если ошибок больше трех, то давать 0 баллов. М.Б. Челышкова [3] рекомендует за полностью выполненное задание с выбором нескольких верных ответов давать 1 балл и 0 баллов за хотя бы один неверный ответ. В.Ю. Переверзев в [4] описывает метод «частичного балла» (partial credit), в котором за каждый правильно выбранный ответ дается 1 балл, за неправильно выбранный ответ — 0 баллов. Штрафные баллы в этом методе не предусмотрены. По мнению В.С. Кима [5], использование заданий с выбором одного верного ответа предпочтительней, и лучше заменять одно задание с выбором нескольких верных ответов на несколько заданий с выбором одного верного ответа. Аналогичные рекомендации имеют место и в отношении тестовых заданий в формах «соответствие» и «упорядоченный список».

Для устранения указанных выше недостатков процедур измерения результатов критериально-ориентированного тестирования в КСТ предлагается использовать данные теории распознавания образов [6]. Приступая к изложению предлагаемых методов измерения и оценивания результатов выполнения критериально-ориентированных тестов в формах «множественный выбор», «соответствие» и «упорядоченный список», необходимо отметить, что как перечисленные формы закрытых тестовых заданий, так и производные от них формы, как показано в [9], могут быть сведены к двум базовым формам: множество (неупорядоченное множество) элементов или список (упорядоченное множество). Поэтому дальнейшее описание предлагаемых процедур измерения и оценивания результатов критериально-ориентированного тестирования приводится в отношении последних двух базовых форм тестовых заданий.

Постановка задачи оценки ответа типа «Множество». Пусть дано множество МО (рис. 1), характеризующие ответ испытуемого, и множество Мэ, характеризующие эталонный ответ.

С д/' ( K=Л/ пМ. V J

Рис. 1. Диаграмма Эйлера-Венна для множеств V, M , МЭ

Туровская А.О. Модели и процедуры измерения и оценивания результатов критериально-ориентированного.

Пусть для Мр М, выполнено условие

_ (М0сК)л(Мэ_ЕК) __(1)

где: V- {й.} (/= 1,у; V < оо), М0 = {а,}(/ = \,п, п < у), Мэ = {<з,}(/ = 1 ,т,т<\).

Требуется оценить ответ испытуемого в традиционной 4-балльной шкале.

Решение задачи. Оценим расстояние г между множествами М0 и Мэ. Для этого введем следующую метрику: 1) г = [0,1]; 2) г = 0, если М0 и Мэ состоят из одних и тех же элементов, т.е. эквивалентны М0 □ Мэ (если М0 = 0 и Мэ = 0,то М0 □ Мэ); 3) г = 1, если МопМэ=0;4)О<г<1, если М0 п Мэ * 0.

Тогда расстояние между М0 и Мэ может быть определено как

1 * , *

г = г =1--= 1--;

МН 1 7 5

/ М + П-Л г ^

г = 0 при т-п~ 0

где: /4 - число элементов в подмножестве АТ = М0 (Л Мэ (число одинаковых элементов в М() и Мд), I — п + т — к — число элементов в подмножестве Ь =М0 иМэ (общее число неповторяющихся элементов подмножеств М0 и М,^.

В теории системно-информационного анализа [7] введено понятие неупорядоченности как меры различия какого-либо выбранного параметра х. в отношении эталона порядка х , которая стремится к нулю при х.—>х . Оценка (2) соответствует этому понятию, что позволяет организовать процедуру оценивания измеренных результатов по схеме, предложенной А.Н. Печниковым в [8]:

1. Абсолютная неупорядоченность ответа испытуемого оценивается как:

Ч = * (3)

2. Рассчитывается оценка испытуемого в традиционной 4-балльной шкале:

5

^ = 1о§2

Че,Р, + ЯР2 + ЧуогРъ '

(4)

где: qв — величина q, соответствующая оценке «отлично»; q — величина q, соответствующая оценке «неудовлетворительно»; S = 25^ = 32^ — коэффициент, адаптирующий количественное выражение балла оценки к традиционной 4-балльной шкале; р1,р2,р) — ОД — логические операторы (Д = 1 при ^ < qв■p2 = 1 при q^! <ц< р} = 1 при q >

В области определения оценки г < г < г формула (4) примет вид:

(5)

Применение формул (2-5) обеспечивает возможность настройки балла оценки на систему предпочтений преподавателя за счет изменения q¡¡ или

Постановка задачи оценки ответа типа «Список». Пусть выборочные ответы Х0 вида «Список» и соо тветствующий им эталон Хэ определены на исходном множестве V следующим образом:

Г = ХэиМ;

(Хэ={а],а2,...,ап...,ак})л

Хэ=рк =

^ 1, 2, ..., /,..., к ^

МФр'

'11

1, 2, ..., и,..., 5 |

(/ = 1, Л);

(и = 1,5)

(6)

Необходимо определить оценку ЛГ(Х0, X^ ответа X испытуемого в традиционной 4-балльной шкале.

Решение задачи. Для решения подобных задач применяется метод Кендалла [6], который обеспечивает получение оценок г — [0,1], соответствующих понятию расстояния (но работоспособен только при одинаковых числе и номенклатуре элементов в списках), и метод Фора (работоспособен при любом наборе элементов, но неоднозначен и исключает нормирование оценок, т.е. их представление в традиционной 4-балльной шкале). Предлагается метод, базирующийся на модели (2) оценки ответа типа «Множество», методе Кендалла и процедуре создания пустых элементов, применяемой в методе Фора.

В соответствии с (6) список Х0 может содержать элементы вида Ьи, на которых не может быть определено отношение порядка. Поэтому в общем случае расчет оценки ЛГ(Х(), Х.^ предлагается производить в четыре этапа.

Этап 1. Оценка неупорядоченности q¡ (X , Х.^) ответа испытуемого (списка Х0) относительно эталона (списка Х^) по номенклатуре элементов. Списки ХГ) и Хэ рассматриваются как неупорядоченные множества, а неупорядоченность их номенклатуры оцешгвается по формулам (2, 3).

Этап 2. Оценка неупорядоченности (Х(), Х^) ответа испытуемого (списка Х(>) относительно эталона (списка Х,^ по упорядоченности элементов.

Психология

В соответствии с (6) списки Х() и X. имеют вид

X0={afbt},- (7)

1, k —

0' = U), (8)

Хэ=Рк =

Kat,a2,...,ar..,akJ

где: i = 0,t(t<k), u = 0,g(g<s).

Произведем в списке Х0 замену всех элементов вида bи на пустой элемент 1 (процедура, применяемая в методе Фора), обладающий свойством

Va( еХ0->а,=А. (9)

В случае к < п — t + ¿дополним список X, элементами ..., д, равными 1, а в случае к> п — t + J — список Х0 элементами д..., ае равными L Списки Х() и Х0 примут вид перестановок, которые имеют одинаковый состав элементов, а значит, могут быть корректно оценены по методу Кендалла:

1. Определяются коэффициенты сравнения:

+1 при хи>х,к

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ЛИ~] при *»<х*, где / < к. (10)

0 при хи=х1к

2. Рассчитывается расстояние (нормированная оценка Кендалла):

Г = --■ (11)

2 п(п-\)ик v 7

Оценка rJX(), Х;)) по формуле (11) формально и по смыслу соответствуют понятию 1геупорядоченности, откуда в соответствии с (3) q2(X0, X^ = г .

Этап 3. Оценка общей неупорядоченности q — f (qp q^ ответа испытуемого (списка X) относительно эталонного ответа (списка Х^.

Общая неупорядоченность ответа вида «Список» определяется как

q = 1 - (1 - qX 1- q). _ ^ (12)

Этап 4. Определение оценки выборочного ответа типа «Список» в традиционной 4-балльной шкале. Оценка рассчитывается путем подстановки в (4, 5) значения q, определенного по (12).

Список литературы

1. ОСТ Т 1.1. Педагогические тесты, термины и определения. Отраслевой стандарт (первая редакция). — М.: Министерство образования РФ, 2001. — 13 с. (с сайта http://bank.orenipk.ru/).

2. Аванесов, B.C. Форма тестовых заданий. — М.: Центр тестирования, 2005. — 156 с.

3. Чеяъшкова, М.Б. Теория и практика конструирования педагогических тестов : учебное пособие. - М.: Логос, 2002. - 432 с.

4. Переверзев, В.Ю. Технология разработки тестовых заданий : справочное руководство. — М.: Е-Медиа, 2005. - 265 с.

5. Ким, В. С. Тестирование учебных достижений: монография. — Уссурийск: 11здательство УГПИ, 2007.-214 с.

6. Фор, Л. Восприятие и распознавание образов / пер. с фр. / под ред. Г.П. Катыса. — М.: Машиностроение, 1989. — 272 с.

7. Горский, Ю.М. Системно-информационный анализ процессов управления. — Новосибирск: Наука. Сиб. отд-ние, 1988. — 268 с.

8. Печников, А.Н. Теоретические основы психолого-педагогического проектирования автоматизированных обучающих систем. — Петродворец: ВВМУРЭ, 1995. — 326 с. (с сайта http:// pedlib.ru/).

9. Карпова, II.П. Исследование и разработка подсистемы контроля знаний в распределенных автоматизированных обучающих системах : дис. ... канд. техн. наук. — М.: МГИЭМ, 2002. — 239 с.

Literature

1. Pedagogic tests, terms and definitions. Branch standard (the first edition)) — Moscow, 2001.

2. Avanesov, V. S. Form of test tasks - Moscow, 2005.

3. Tchelyshkova, M. B. Theory and practice of pedagogical tests constructing. — Moscow, 2002.

4. Perever^ev, V. J. Technology of test tasks constructing. — Moscow, 2005.

5. Kim, V..S. Testing of study achievements. — Ussurijsk, 2007.

6. For, A. Perception and recognition of images. — Moscow, 1989.

7. Gorsky, J.M. System and information analysis of processes of control. — Novosibirsk, 1988.

8. Pechnikov, A.N. Theoretic fundamentals of psychological and pedagogical constructing of automated educational systems. — Petergof, 1995.

9. Karpova, LP. Research and constructing of knowledge control subsystem in allocated automated educational systems. — Moscow, 2002.

i Надоели баннеры? Вы всегда можете отключить рекламу.