Научная статья на тему 'АНАЛіЗ ГЕНЕРАТОРіВ ВИПАДКОВИХ ЧИСЕЛ МОВИ R З ПОЗИЦії МОДЕЛЮВАННЯ ДАНИХ ЗА ЛОГіСТИЧНОЮ МОДЕЛЛЮ РАША'

АНАЛіЗ ГЕНЕРАТОРіВ ВИПАДКОВИХ ЧИСЕЛ МОВИ R З ПОЗИЦії МОДЕЛЮВАННЯ ДАНИХ ЗА ЛОГіСТИЧНОЮ МОДЕЛЛЮ РАША Текст научной статьи по специальности «Экономика и бизнес»

CC BY
110
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГЕНЕРАТОРЫ ПСЕВДОСЛУЧАЙНЫХ ЧИСЕЛ (ГСЧ) / КВАЗИСЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ (КСП) / ЛОГИСТИЧЕСКАЯ МОДЕЛЬ РАША / ЯЗЫК СТАТИСТИЧЕСКОГО ПРОГРАММИРОВАНИЯ R / РSEUDORANDOM NUMBERS GENERATORS (PRNG) / QUASI-RANDOM SEQUENCES (QRS) / RASCH LOGISTIC MODEL / STATISTICAL PROGRAMMING R LANGUAGE

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Диховичний О. О., Круглова Н. В., Алєксєєва І. В.

В работе исследованы и проанализированы генераторы псевдослучайных чисел (ГСЧ) и квазислучайные последовательности (КСП), которые реализованы в среде статистического программирования R, с точки зрения возможности моделирования матриц, которые описываются логистической моделью Раша. Моделирование таких матриц важно для имитационного моделирования результатов педагогических тестов, социологических опросов. Показано, какие именно ГСЧ и КСП являются подходящими для такого моделирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

This article explores and analyzes pseudorandom numbers generators (PRNG) and quasi-random sequences(QRS) which are realized in the statistical programming language R, from the point of view of possible matrix modeling described by logistic Rasch modeling. Modeling of such matrixes is critical for imitational modeling of educational testing results and sociological surveys. It is demonstrated which specific PRNG and (QRS) are suitable for such modeling.

Текст научной работы на тему «АНАЛіЗ ГЕНЕРАТОРіВ ВИПАДКОВИХ ЧИСЕЛ МОВИ R З ПОЗИЦії МОДЕЛЮВАННЯ ДАНИХ ЗА ЛОГіСТИЧНОЮ МОДЕЛЛЮ РАША»

УДК [37.091.26]:004.9

0.0. диховичний*, н.в. круглова*, 1.в. ллексеевл*

АНАЛ1З ГЕНЕРАТОР1В ВИПАДКОВИХ ЧИСЕЛ МОВИ R З ПОЗИЦ11 МОДЕЛЮВАННЯ ДАНИХ ЗА ЛОГ1СТИЧНОЮ МОДЕЛЛЮ РАША

Нацiональний технiчний унiверситет Украши «Кшвський полiтехнiчний iнститут iMeHi 1горя Окорського», м. Ки1в, Украша

Анотаця. У po6omi до^джено i проанал1зовано генератори псевдовипадкових чисел (ГВЧ) та кваз1випадков1 no^idoeHOcmi (КВП), як реалiзовано у середовищi статистичного програмування R, з огляду на можливiсть моделювання матриць, як описуються логiстичною моделлю Раша. Моделювання таких матриць е важливим для iмiтацiйного моделювання результатiв nедагогiчних тестувань, соцiологiчних опитувань. Показано, яю саме ГВЧ та КВП е прийнятними для такого моделювання.

Ключов1 слова: генератор випадкових чисел (ГВЧ), квазiвипадкова по^довтсть (КВП), логiстич-на модель Раша, мова статистичного програмування R.

Аннотация. В работе исследованы и проанализированы генераторы псевдослучайных чисел (ГСЧ) и квазислучайные последовательности (КСП), которые реализованы в среде статистического программирования R, с точки зрения возможности моделирования матриц, которые описываются логистической моделью Раша. Моделирование таких матриц важно для имитационного моделирования результатов педагогических тестов, социологических опросов. Показано, какие именно ГСЧ и КСП являются подходящими для такого моделирования. Ключевые слова: генераторы псевдослучайных чисел (ГСЧ), квазислучайные последовательности (КСП), логистическая модель Раша, язык статистического программирования R.

Abstract. This article explores and analyzes pseudorandom numbers generators (PRNG) and quasi-random sequences(QRS) which are realized in the statistical programming language R, from the point of view of possible matrix modeling described by logistic Rasch modeling. Modeling of such matrixes is critical for imitational modeling of educational testing results and sociological surveys. It is demonstrated which specific PRNG and (QRS) are suitable for such modeling.

Keywords: рseudorandom numbers generators (PRNG), quasi-random sequences (QRS), Rasch logistic model, statistical programming R language.

1. Вступ

Статистичш даш, що описуються лопстичною моделлю Раша [1], знаходять свое застосу-вання у р1зних галузях: психометрп, тестологп, квал1метрп, педагопщ, сощальних досль дженнях, там, де у певному сощум1 задають систему запитань, вщповщь на як1 передбачае два вар1анти: «так» або «ш».

Ид моделюванням таких статистичних даних ми будемо розум1ти створення матриц вщповщей, яка складаеться з нул1в та одиниць, як1 вщповщають двом вар1антам вщ-повщ1. Так1 матриц визначаються двома наборами спещальних параметр1в, яю називають латентними. Один наб1р характеризуе об'екти, що дослщжуються (тестов1 питання, якють програмних продукпв, особист характеристики певних ос1б), а другий наб1р характеризуе тих, хто дае вщповвд (аб1тур1енти, юпитники, кандидати на певну посаду, просто респондента). Таким питанням присвячено, прим1ром, роботи [2, 3].

Не дивлячись на р1зне тлумачення параметр1в модел1, будемо дотримуватись термь нологп, запозичено! з теспв. Математичне тдгрунтя таких моделей створюе Item Response Theory (IRT) [1]. Перший наб1р латентних параметр1в будемо називати складшстю завдан-

ня тесту Д, j = 1, K, другий наб1р - тдготовлешстю юпитника в^, i = 1, N . Зпдно з модел-

© Диховичний О.О., Круглова Н.В., Алексеева 1.В., 2018 ISSN 1028-9763. Математичнi машини i системи, 2018, № 2

лю Г. Раша [1], зв'язок мiж ними встановлюе ймовiрнiсть правильно! вщповвд i -го юпит-ника на j -те дихотомiчне завдання тесту:

Про актуальшсть тако! постановки проблеми у педагопчних дослiдженнях вже вщ-мiчалось у [4]. Додамо, що основним фактором, який спонукае до таких дослщжень, е спроба прогнозування вщповщних статистичних характеристик. Примiром, у сощолопч-них дослiдженнях замiсть складносп тестового завдання може фiгурувати рiвень недовiри виборцiв до певного депутата, а як тдготовлешсть iспитникiв - освiченiсть у намiрах вщ-повщно! особи.

Головнi вимоги, що висуваються до змодельованих даних, це:

1. Адекватшсть заданим параметрам.

2. Точшсть розрахунку латентних параметрiв за змодельованою матрицею.

3. Швидкiсть роботи програм моделювання.

2. Постановка проблеми

Очевидно, що яюсть моделювання залежить вщ базового генератора випадкових чисел, який генеруе рiвномiрно розподiленi на [0,1] псевдовипадковi числа, або вiд квазiвипадко-во! послiдовностi, яка обчислюеться детермшютично, за певним аналiтичним виразом, i використовуеться для iмiтащi випадкових, однаково розподшених чисел. КВП послщовно-ст використовуються в обчисленнях як замша псевдовипадкових чисел.

Нами були сформульоваш таю питання:

1. Якщо мова R пропонуе великий арсенал ГВЧ або КВП, то що саме краще обрати для моделювання таких матриць?

2. За якими критерiями його обирати?

Аналiзу якосп ГВЧ та КВП присвячено велику юльюсть робт Оглядовою роботою з алгоршмв генерацп випадкових чисел, реалiзованих у системi R у пакетах randtoolbox та base, е [5], у якш коротко сформульовано алгоритми, покладеш в основу роботи генераторiв або формування КВП, формати виклику, а також засоби тестування.

У данш статп для дослщження було обрано таю ГВЧ:

• Linear congruential generators.

• WELL generators.

• Mersenne-Twister.

• Wichmann-Hill.

• Marsaglia-Multicarry.

• Super-Duper.

• Knuth-TAOCP-2002.

• Knuth-TAOCP.

• L'Ecuyer-CMRG.

• SFMT.

А також КВП:

• Halton sequences.

• TORUS sequences.

• Sobol sequences.

Хоча ГВЧ та КВП дуже детально i ретельно проаналiзовано у рiзнiй л^ератур^ але питання, який iз методiв е кращим з точки зору генерацп матриць вiдповiдей за моделлю Раша, за нашою шформащею, взагалi не розглядалось.

1

Метою cmammi е дослщження вибору у певному сена ГВЧ або КВП для моделювання матриц вщповщей за моделлю Раша.

3. Методи дослщження

Дослщження проводилось у такому напрямi.

Було проаналiзовано iснуючi ГВЧ та КВП, яю реалiзовано у названих вище пакетах сайту CRAN [6] та iмплементовано !х в оболонку функцп sim.rasch (пакет eRm).

Базовим датчиком випадкових чисел для середовища R е Mersenne-Twister. Замiна датчика вiдбувалася таким чином:

1) для ГВЧ з пакета randtoolbox, яю iнтегрованi пiд штерфейс функцп runif, задава-лася одна з команд:

а) set.generator(name="congruRand", mod=..., mult=..., incr=..., seed=...)#викликае ль ншний конгруентний датчик з вiдповiдними параметрами ;

б) set.generator("MersenneTwister", initialization="...", resolutions.., seed=...)#викликае MersenneTwister;

в) set.generator("WELL", order-'...", version=..., seed=...) #WELL;

2) для ГВЧ з пакета base використовувалася команда RNGkind(). Параметром виступала назва датчика з такого списку: "Wichmann-Hill","Marsaglia-Multicarry",

"Super-Duper", "L'Ecuyer-CMRG ", "Knuth-TAOCP", "Knuth-TAOCP-2002";

3) окремо для ГВЧ, яю не iнтегрованi пiд iнтерфейс runif та КВП, процес моделювання рiвномiрно розподшено! величини вiдбувався безпосередньо одшею з таких функ-цш:

а) SFMT(n, dim = 1, mexp = ...) #для SFMT;

б) halton(n, dim = 1);

в) sobol(n, dim = 1);

г) torus(n, dim = 1).

Ми модифшували функцiю sim.rasch пакета erm, яка забезпечувала генерацiю вщ-повщно! матрицi вiдповiдей, що описуеться логютичною моделлю Раша, додавши мож-ливiсть змiнювати ГВЧ. Для цього було введено додатковi параметри, яю характеризували кожен датчик. Також було змшено формат результата з можливютю збереження змодельо-ваних параметрiв юпитниюв. Нижче наведено приклад функцп, яка забезпечуе моделювання матриць, викликаючи один iз датчиюв зi списку пакета base:

sim2.rasch <-function(persons, items, seed = NULL, cutpoint = "randomized",da)

{

#produces rasch homogeneous data #cutpoint... probability or "randomized"

RNGkind(da) if (length(items) == 1) { if (!is.null(seed)) set.seed(seed)

schwierig <- rnorm(items) #standard normal distributed n.items <- items } else { schwierig <- items n.items <- length(items)

}

if (length(persons) == 1) { if (!is.null(seed)) set.seed(seed) faehig <- rnorm(persons)

n.persons <- persons } else {

faehig <- persons n.persons <- length(persons)

}

fsmat <- outer(faehig, schwierig, "-") psolve <- exp(fsmat)/(1+exp(fsmat)) if (cutpoint == "randomized") { if (!is.null(seed)) set.seed(seed)

R <-(matrix(runif(n.items*n.persons),n.persons,n.items) < psolve)*1 } else {

R <- (cutpoint < psolve)*1

}

R1 < -list(R,faehig)

return(R1)

RNGkind("default")

}

Основним методом, покладеним в основу моделювання результатiв тестування пакетами, написаними мовою R для функцп sim.rasch, е метод обернених функцш розподiлу [7], а саме, наступний алгоритм генераци матрицi первинних балiв:

1) за допомогою датчика випадкових чисел генеруеться випадкова величина U, рь вномiрно розподiлена на вiдрiзку [0, 1];

2) обчислюеться ймовiрнiсть неправильно! вiдповiдi за формулою Р = 1/(1 + exp(3 - ß));

3) якщо U > ptj, то елементом матриц буде 1, в шшому випадку - 0.

Шсля моделювання матрицi первинних балiв за допомогою одного з вищеназваних датчикiв проводився аналiз вiдповiдних матриць. Аналiз передбачав такi процедури:

1. Обчислювалось середньоквадратичне вiдхилення мiж векторами заданих латент-них параметрiв i оцiненими за змодельованими матрицями;

2. Перевiрялась гiпотеза про адекватнiсть згенерованих матриць заданим латентним параметрам тестових завдань i параметрам юпитниюв за критерiем %2 [8, с. 77]. Для цього було проведено таку процедуру.

Позначимо 1Ь - множину номерiв iспитникiв, якi набрали b первинних балiв.

Тодi Пь - кшькють iспитникiв, якi набрали b балiв, b = 0,K, щ. - кiлькiсть юпит-никiв, якi набрали бал b за j -те завдання.

тт • * nbj

Далi позначимо p. ■ = —-,

j nb

k f . \2 _ k

x2(j) ^«jj!, j = 0K, х2 = Z x2(j),

b=0 Pbb j=0

1 ^ 1 „ . „ .

pfe =—> -—---v- - середне значення ймовiрностей правильних вiдпо-

j пЬ]шь 1 + exp [~(в1 -ß )) вiдей на j -те завдання у груш юпитниюв, яю набрали b балiв.

Вщомо [8], що за широких припущень статистика х2 мае розподiл xi-квадрат з V = qK степенями свободи, де q - кшьюсть груп, на якi розбиваються Bei iспитники в за-

лежностi вщ кiлькостi балiв. Отже, порiвнюючи статистику х2 з критичним значенням, перевiряеться гiпотеза про адекватнiсть матрицi вщповщним латентним параметрам. 3. Проводилось порiвняння часу програм моделювання.

4. Результати дослщження

Як вже вiдмiчалось, було модифшовано програму sim.rasch (пакет eRm), що дозволило легко обирати потрiбний ДВЧ або КВП i моделювати вiдповiдну матрицю. Латентнi пара-метри складносп завдань задавались вручну, а параметри пщготовленосп iспитникiв мо-делювались. За змодельованими матрицями за допомогою функцп rasch пакета ltm було розраховано вщповщш латентнi параметри i проведено порiвняльний аналiз. Генерувались матрищ для 15-ти значень параметрiв складносп:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ß = -3,5, ß2 = -3,0, ß3 = -2,5, ß4 = -2,0, ß5 = -1,5, ß6 = -1,0, ß7 = -0,5, ß8 = -0,0, ß9 = 0,5, ßi 0 = 1,0, ßn = 1,5, ßi2 = 2,0, ßi3 = 2,5, ß = 3,0, = 3,5

та параметрами тдготовленосп для кiлькостi iспитникiв N = 100; 1000; 10000; 100000, яю генерувались як нормальш величини iз середшм - 0.0, i дисперсiею - 1.0 по 1000 копш кожно':1 матрищ для вщповщного набору параметрiв. Результати ощнювання параметрiв для цiлиx значень наведено для N = 100; 1000; 10000; 100000 у табл. 1. Очевидно, що при збшьшенш N ощнки параметрiв ßj наближалися до вщповщних заданих параметрiв, що наочно вiдображаеться у табл. 1.

Таблиця 1. Ощнки для щлих значень параметрiв складносп завдань

Назва ГВЧ (КВП) К1льк1сть юпитнишв Вхвдш параметри складност1 завдань, ßj

-3 -2 -1 0 1 2 3

Результат моделювання

Sobol 100 -2,96999 -2,96999 -1,30548 -0,09423 1,012341 1,946462 3,141282

1000 -3,0853 -2,11711 -1,00462 -0,06997 0,935549 1,918174 2,776736

10000 -3,06953 -1,99332 -1,01434 -0,0025 1,022842 2,015064 3,030247

100000 -2,98865 -1,99332 -0,99534 0,008761 1,00165 1,998053 2,995001

SFMT mexp = 11213 100 -4,36109 -1,52113 -0,91729 0,191918 1,082377 2,153333 3,141282

1000 -2,77338 -1,95803 -0,92396 -0,01097 1,038866 1,941284 2,895749

10000 -3,06215 -1,99498 -0,94456 0,024297 1,03989 2,045602 3,000957

100000 -2,99047 -2,01573 -1,00845 -0,00352 0,999796 2,004049 3,007365

SFMT mexp = 86243 100 -2,94858 -1,63068 -1,01152 0,132226 0,674944 2,678241 3,928602

1000 -2,95557 -1,98743 -0,96382 -0,16144 0,973012 1,847553 2,820845

10000 -3,02548 -1,98413 -1,03361 0,00339 0,990855 2,012761 3,020698

100000 -3,02548 -2,00358 -0,99424 9,49E-05 1,001539 1,998518 3,009681

SFMT mexp = 44497 100 -4,36989 -1,72656 -1,44591 0,244854 1,382276 2,142577 2,694612

1000 -3,00643 -1,97633 -0,98671 -0,03939 1,042298 1,915977 2,859279

10000 -3,00643 -2,00618 -0,99593 0,013085 1,012164 1,935807 3,043526

100000 -2,99319 -1,98681 -0,99264 0,009959 1,005746 1,992354 2,998742

Лшшний конгруентний m = 2 , a = 134775813, c=1 100 -2,85694 -2,25636 -0,80841 0,195477 1,266227 2,588461 2,717602

1000 -3,07556 -1,89535 -0,974 -0,01015 0,951296 1,987908 2,819855

10000 -3,07493 -1,99916 -1,03778 -0,00044 0,992812 2,028425 3,028996

100000 -3,00448 -1,9983 -1,03778 0,000229 1,00486 2,000574 3,022391

Лшшний конгруентний т = 231 -1, а = 16807, с=0 100 -3,88249 -2,11511 -1,18461 0,329163 1,17637 1,782411 3,358108

1000 -2,82511 -1,95485 -0,92529 0,101767 0,992446 2,058839 3,138133

10000 -3,04437 -2,01125 -0,99862 -0,01867 0,981427 0,981427 2,993802

100000 -2,99791 -1,97765 -0,99457 0,014591 1,009817 2,002382 3,026031

WELL 521Ь 100 -3,13667 -1,94365 -1,24311 -0,04974 0,685364 2,317231 2,671023

1000 -2,95578 -1,93722 -0,97597 0,118829 0,901238 2,161363 2,808596

10000 -3,01767 -1,99111 -1,03179 0,006955 0,956908 1,937249 3,001551

100000 -3,01247 -2,00314 -1,0155 -0,00151 1,025694 2,013924 2,998673

КииШ-ТАОСР-2002 100 -2,86116 -2,36008 -1,02315 -0,28754 1,206634 1,737735 2,704911

1000 -3,03405 -2,08095 -0,82124 0,061011 1,027696 1,901555 3,109878

10000 -2,98148 -2,01888 -1,05385 0,004423 2,00574 2,00574 2,994536

100000 -3,03302 -1,98572 -1,01092 0,002889 1,005491 1,996983 3,015055

L'Ecuyer-СМЯв 100 -3,58696 -2,30871 -1,35651 -0,18798 0,895005 1,933583 2,65631

1000 -3,15303 -2,04062 -0,97646 0,02366 1,065901 2,014262 2,978221

10000 -3,02105 -1,97866 -1,01648 -0,03069 0,945994 2,024688 2,958073

100000 -2,99104 -1,99093 -0,99611 0,007522 1,001163 1,990357 2,993235

1нформащя про результати тестування занесена у табл. 2. У першому стовпщ - назва датчика та його параметри.

У другому стовпщ - наведено значення усереднено'1 за кшьюстю копш рiзницi ква-

К * 2

дратiв вщхилень заданих параметрiв вiд оцiнених - I (Р;- - Р*) .

]=1

Перевiрка гiпотези про адекватнють згенерованих матриць заданим латентним параметрам тестових завдань i параметрам юпитниюв здiйснювалась таким чином. Для кожного датчика та для кожно'1 серп зi 100 юпитниюв обчислювалась описана вище статистика X2, а потм здшснювалось усереднення за 1000 копiями. Яюсть датчика визначалась величиною статистики %2сер. Чим менше п значення, тим кращим вважаеться датчик. Отже, третш стовпець - це усереднене значення статистики %2:сер.

Квантiль рiвня 0,99 для 240 степешв свободи дорiвнюе 293,8881.

Таблиця 2. Результати тестування ГВЧ та К П

Параметри датчика К I (Р-Р*)2 } =1 X2 /1 сер

Лшшний конгруентний

т = 232, а = 1664525, с=1013904223 12,901902 298,3995

т = 232, а = 22695477, с=1 18,022060 293,0626

т = 231, а =1103515245, с=12345 28,744907 301,6033

т = 232, а = 1103515245, с=12345 23,296027 296,4250

т = 232, а = 134775813, с=1 2,077598 285,5678

т = 232, а = 214013, с=2531011 44,968737 289,8386

т = 231 -1, а = 2147483629, с=2147483587 7,378173 295,1240

т = 231 -1, а = 16807, с=0 2,103487 273,1119

т = 231 -1, а = 48271, с=0 28,711728 300,1276

m = 232, а = 69069, c=1 12,640029 299,5406

m = 248, а = 25214903917, c=11 28,625521 298,3904

m = 231, а = 65539, c=0 12,821003 298,7731

WELL

512a 12,578803 297,8546

521a 7,424895 294,5414

521b 2,078762 288,8736

607a 12,978148 300,2189

607b 17,953156 290,4804

800a 7,458627 297,3685

800b 7,365916 301,7119

1024a 12,609662 300,2870

1024b 7,295478 295,1522

19937a 12,772618 301,1900

19937b 17,933151 296,7388

19937c 18,089460 305,5549

21701a 7,490811 299,7937

23209a 17,927908 295,6304

23209b 7,523001 302,2541

44497a 7,431261 302,6247

44497b 7,360401 305,5190

MT

init2002, resolution=53 18,21784 300,1276

init2002, resolution=32 12,63453 299,5406

array2002, resolution=53 23,42690 298,3904

array2002, resolution=32 12,90417 298,7731

RNGkinc

Wichmann-Hill 12,710243 305,7442

Marsaglia-Multicarry 28,738514 302,7548

Super-Duper 12,883749 292,5950

Knuth-TAOCP-2002 2,181302 290,8098

Knuth-TAOCP 7,440057 292,6237

L'Ecuyer-CMRG 2,093671 283,8268

SFMT

mexp = 607 7,413628 298,2363

mexp = 1279 7,537468 293,7343

mexp = 2281 7,319433 293,1618

mexp = 4253 7,376891 301,4026

mexp =11213 1,977513 286,5932

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

mexp = 19937 23,272064 298,1444

mexp = 44497 2,029757 289,8998

mexp = 86243 1,926719 283,2000

mexp = 132049 13,006511 295,5298

mexp=216091 7,476710 299,6637

Кваз1випадков1 послщовносп

Halton 8,911886 670,7337

Sobol 0,9440769 265,8672

Torus 3539,569 298,7756

5. Висновки

На пiдставi дослщження застосування рiзниx ДВЧ та КВП у моделюванш матриць вщповь дей можна зробити таю висновки:

1. Матрищ, як згенероваш за допомогою рiзниx ДВЧ i КВП, але за одним алгоритмом моделювання, можуть бути як адекватними, так i неадекватними вхщним латентним параметрам моделювання.

2. Основну увагу було придшено можливосп точного розрахунку латентних пара-

K

^ * 2

метрiв за змодельованими матрицями, а саме величинi ^ (ßj - ß* ) . Звернемо увагу на

j=1

те, що моделювання проводилося для кшькосп iспитникiв N = 100; 1000; 10000; 100000.

Оскшьки при збiльшеннi N ощнки параметрiв ßj, j = 1,15 наближалися до вщповщних

заданих параметрiв, що видно з табл. 1, тому для рiзниx датчиюв при N = 10000; 100000

K

^ * 2

величини ^ (ßj - ß* ) вiдрiзнялися не суттево.

j=1

Зовсiм шшу картину ми спостерiгаемо для N = 100. Деяю датчики давали досить значне вщхилення вщ еталонних параметрiв, тому ми ïx вiдкинули, а деякi давали досить точний результат моделювання. Тобто, на невеликих за обсягом вибiркаx спостер^аеться нестiйкiсть оцiнок параметрiв моделi. Зауважимо, що при проведенш реального тестування мають справу з вибiрками саме такого об'ему (кшькють студентiв на потощ певно'1' спеща-льностi, паралель учшв тощо).

3. Головною проблемою, яка виникае у процес моделювання матриць, це проблема тривiальниx стовпщв, тобто стовпцiв, якi складаються тшьки з нулiв або одиничок. Поява таких елемешив матрицi призводить до некоректно'1' роботи алгоритмiв i програм ощнки латентних параметрiв, а саме програми rasch. При робот ще'1' програми використовуються iтерацiйнi алгоритми розв'язування нелшшних систем рiвнянь. Поява тривiальниx стовп-цiв призводить до «явища зсуву параметрiв» або до розбiжностi iтерацiйного процесу, описаних у [9, 10]. Подiбний ефект виникае перш за все при застосуванш КВП TORUS, а

к * 2

також для датчиюв, для яких у табл. 2 величина ^ (ßj - ßj) виходить за 18. Тому вико-

j=1

ристання таких ДВЧ i КВП для моделювання матриць е недоречним.

4. Цiкавим е одержання прийнятного результату для КВП SOBOL. Деякi пояснення щодо його привабливостi наведено у [11].

5. За швидкодiею не було помiчено суттево'1' рiзницi мiж рiзними ДВЧ або КВП.

6. Пщсумовуючи результати дослiдження, на нашу думку, найкращими для моделювання матриць вщповщей, якi описуе модель Раша, е:

1) лшшний конгруентний з параметрами m = 2 , а = 134775813, с=1 або

m = 231 -1, а = 16807, с=0 ;

2) WELL з параметрами 521b;

3) Knuth-TAOCP-2002;

4) L'Ecuyer-CMRG;

5) SFMT з параметрами mexp = 11213, mexp = 44497, mexp = 86243;

6) Sobol.

СПИСОК ДЖЕРЕЛ

1. Linden W. Handbook of modern item response theory / W. Linden, R. Hambleton. - New York:

Springer, 1997. - P. 503.

2. Моисеев С.И. Модель оценки качества программного обеспечения, основанная на методе Раша оценки латентных переменных / С.И. Моисеев, Ю.В. Черная, Е.В. Паршина // Современные технологии разработки программного обеспечения. Вестник ВГУ. - (Серия «Системный анализ и информационные технологии»). - 2016. - № 1. - C. 102 - 109.

3. Маслак А.А. Модель Раша для проверки качества метода измерения толерантности / А.А. Мас-лак, С.А. Поздняков // Социология: методология, методы, математическое моделирование. - 2008.

- № 26. - C. 87 - 104.

4. Диховичний О.О. Застосування мови R у статистичному аналiзi якост теспв з вищо1 математики / О.О. Диховичний, А.Ф. Дудко, Н.В. Прохоренко // Матерiали Вюмнадцято1 мiжнар. наук. конф. iменi академша Михайла Кравчука, (Луцьк - Кшв, 7-10 жовтня 2017 р.). - Кшв: КП1 iм. 1го-ря Окорського, 2017. - Т. 2. - С. 222 - 224.

5. Christophe Dutang A note on random number generation / Christophe Dutang,Diethelm Wuertz [Елек-тронний ресурс]. - 2009. - P. 30. - Режим доступу: https://www.coursehero. com/ file/ 14540994/fullpres/.

6. [Електронний ресурс]. - Режим доступу: https://cran.r-project.org/.

7. Ермаков С.М. Статистическое моделирование / С.М. Ермаков, Г.А. Михайлов. - М.: Наука, 1982.

- 296 с.

8. Нейман Ю.М. Введение в теорию моделирования и параметризации педагогических тестов / Ю.М. Нейман, В.А. Хлебников. - М., 2000. - 168 с.

9. Fischer G.H. Rasch models. foundations, recent developments, and applications / G.H. Fischer, I.W. Molenaar. - Berlin: Springer-Verlag, 1995. - 436 p.

10. Застосування математичних моделей тес^в у комплект дистанцшно1 осв^и «Вища математика» / 1.В. Алексеева, В.О. Гайдей, О.О. Диховичний [та ш.] // Математичш машини i системи. -2010. - № 4. - С. 89 - 97.

11. Радченко С.Г. Применение ЛПТ равномерно распределенных последовательностей для решения прикладных задач моделирования / С.Г. Радченко, О.В. Козырь // Математичш машини i системи. - 2014. - № 1. - С. 151 - 158.

Стаття над1йшла до редакцИ' 11.04.2018

i Надоели баннеры? Вы всегда можете отключить рекламу.