Регрессионная модель успеваемости учебных групп вуза
М.В. Гранков, В.М. Алъ-Габри Донской государственный технический университет, Ростов-на-Дону
Аннотация: В статье рассматриваются подходы к решению задачи повышения успеваемости обучающихся. На базе мультипликативной свертки базовых факторов, влияющие на результаты экзаменов, предложена структура регрессионной модели. Рассмотрены проблемы мультиколлинеарности факторов и «грубых ошибок». Разработана математическая модель и метод построения регрессионных моделей учебных групп. Предложена система классификации групп, в зависимости от классов сопоставляемых им моделей. С помощью предложенного метода была обработана информация из базы данных оценок портала УУ Донского государственного технического университета. Анализ обработанной информации показал, что адекватность порожденных регрессионных моделей выполнялась для 99,7% групп. Показано, что предложенные модель и метод могут быть использованы в системах поддержки образовательного процесса.
Ключевые слова: высшее образование, успеваемость, регрессионный анализ, факторы, выходная переменная, адекватность модели, коэффициент корреляции.
Введение. Одной из проблем постиндустриального общества является очевидная поляризация образовательных организаций на элитные и массовые. Многие исследователи этой проблемы обнаруживают регрессивный тренд у среднего уровня успешности обучающихся по результатам мониторинга различных национальных образовательных систем. Данные исследования опираются на современные методы системного анализа, моделирования, обработки экспериментальных данных и прогнозирования и являются актуальными [1,6,7,8,10]. В настоящей работе рассматривается подход к моделированию и прогнозированию результатов итогового контроля на примере учебных групп студентов.
Цель. Разработка метода прогнозирования результатов сессии, позволяющего для учебной группы определить степень влияния расписания экзаменов на число полученных отрицательных оценок. Обоснование структуры регрессионной модели успеваемости. Рассмотрим учебную группу как объект, который преобразует внешние воздействия экзаменатора, дисциплины и расписания сессии в значение
успеваемости учебной группы, показанную на экзамене. При этом, выходной переменной будет успеваемость группы, которую будем обозначать У *. Ранее, доказано, что основными факторами, влияющими на выходную переменную, могут являться: дисциплина экзамена, экзаменатор и номер экзамена в расписании сессии [1]. В качестве числовых значений первых двух факторов выбрана средняя успеваемость по дисциплине (Х8) и экзаменатора (Х{). Значения Х5 и Х{ будем называть рангами дисциплины (предмета) и преподавателя. Введем следующие обозначения:
N = (1,2,..., 1,...} - множество натуральных чисел (1)
Ы() = {О} и - расширенное множество натуральных чисел (2) I = [0,1] - единичный отрезок действительных чисел (3)
Еп = |г1(/ = 1,2,...и) л (г = ) а К е N0) л (п2.. е Ы) л (п1г < п2г) л (п е N>1 (4)
— множество неотрицательных рациональных чисел, представленных дробями, значение которых не превышает 1.
Я+ = (г |(г е Я) л (г > 0)} (5)
— множество неотрицательных действительных чисел, где Я - множество действительных чисел.
С = {1,2,...ив},п8 еN (6)
— множество учебных групп, где п - число учебных групп.
Т = (1,2,...п},п е N (7)
— множество экзаменаторов (преподавателей), где п{ - число экзаменаторов.
5 = (1,2,..Л},п, е N (8)
— множество дисциплин (предметов), где п - число дисциплин. Очевидно, что Х1 е Еи и Х5 е Еи. В отношении факторов Х5 и Х{ классическая регрессионная модель будет иметь следующий вид:
= а + \ X, + Ь2 X (9)
где Ь и Ь2 - коэффициенты регрессии, а - сдвиг (постоянный член). Для модели (9) возникает проблема интерпретации значения сдвига [4]. Как видно из (9) средневзвешенная композиция значений факторов Х5 и Х{ не
обеспечивает нулевое значение выходной переменной 7 * при нулевом значении только одного из них, что следует из определения значений этих факторов. В этом смысле мультипликативная композиция факторов соответствует требованию определения. В качестве такой композиции выберем среднее пропорциональное значений рангов экзаменатора и экзамена (10). Значение гибридного фактора, полученное по формуле (10), будем называть рангом экзамена, который принимал экзаменатор г по дисциплине ,.
х*=4Х7х (10)
где: Хй - значение ранга экзамена, Хв - значение ранга дисциплины ,, Х{ -значение ранга экзаменатора г.
С пг I пг Л
X = £ £ ПЪ> (11)
V г =1 / г =1 У
пг -число экзаменов, которые принял преподаватель г, г11 -число отрицательных оценок, которые поставил преподаватель г на экзамене г, п2^ - общее число оценок, которые должен был поставить преподаватель г . Аналогично находится ранг дисциплины Х5.
Основываясь на предположении о влиянии расписания экзаменов на их результат [2], представим эту часть регрессионной модели в виде многочлена второго порядка от номера экзамена (Хе) в расписании сессии группы.
уХ) = ьх2+Ь2 Хе + Ь3 (12)
Окончательно получим вид регрессионной модели для выходной переменной с помощью мультипликативной свертки гибридной переменной Хй и квадратного трехчлена (12):
У * = Ха (ЬХ + Ь2Хе + Ь3), (13)
где: У * - оценка успеваемость учебной группы на экзамене, который проводил преподаватель t, по дисциплине ^, Х/5 - ранг экзамена; Хе -номер экзамена в расписании сессии, Ьх,Ь2,Ь3 - коэффициенты регрессии. Уравнение регрессии (12) преобразуем в линейную форму с помощью вспомогательных переменных Х1 = Х/5 • Х2е, Х2 = Х/5 • Хе, Х3 = Хй. В результате выполненных преобразований, уравнение регрессии (13) приобретает следующий вид:
У * = ЬхХх + Ь2Х2 + ЬъХъ (14)
Уравнение в виде (13) будем называть базовым уравнением регрессии, а уравнение в виде (14) - вспомогательным уравнением регрессии. Математическая модель метода прогнозирования результатов сессии. Рассмотрим некоторую абстрактную учебную группу и для нее введем следующие обозначения:
Ех = {ех1, ех2,.. .ехпх} (15)
— множество экзаменов, по которому будет построена регрессионная модель успеваемости группы; пх — число экзаменов.
Экзамен ехг в множестве Ех представляет собой упорядоченное множество:
ех = (, у, isj, х ), 1 = 1,2, ...пх (16)
где: xtsl —ранг экзамена, у1 —результат экзамена, Ц —номер сессии, гх — номер экзамена в сессии.
Введем два подмножества множества натуральных чисел №
Nkx = {к,|(к е N) л (к < кх)} (17)
I]
N — {к,|(к е Ы) л (к < 4)} (18)
Определим отображение Л:
Л: Ех ^ ЕхХ (19)
— где отношение ЕхХ с I х Еп х N х N х х является расширением отношения Ех. Каждому кортежу ех — (х1у,у.,гУ,гх)| ех е Ех соответствует один кортеж ехх = (, у, , 1х1, х1, х2.) | ехх е ЕхХ, у которого первые четыре элемента совпадают с элементами кортежа ех е Ех , а последние два вычисляются по формулам: х1. — xtsj * гхх.
Обозначим транспонированные проекции отношения ЕхХ: X — (л5 (ЕхХ ))г, Х2 — (^ ( ЕхХ))т, Х3 — (^ ( ЕхХ))т, У — (п2 (ЕхХ ))г. В этом случае мы получим вектора Хх, Х2, Х3 ,У, состоящие из значений:
Хг =(хгД5 хг,2' хипх ),г = 1,2,3 » (20)
у — (У1, У2,—упх ) (21)
Обозначим через А матрицу размером 3 х пх, строки которой совпадают с векторами Х1, Х2, Х3 соответственно:
( Л
Х1,2 • • X1,nx
A = Х2,1 Х2,2 • • X2,nx
v Хз,1 X3,2 • • X3,nx у
(22)
Проблема мулътиколлинеарности факторов. Эта проблема может привести к вычислительным или статистическим трудностям построения и проверки адекватности регрессионной модели. Причиной проблемы является линейная зависимость факторов модели. Выделяют явную и скрытую (стохастическую) мультиколлинеарности [4,5]. Признаком отсутствия у факторов явной мультиколлинеарности является условие [5]: rang (A) = 3. Нарушение этого условия вызывается линейной зависимостью между факторами. Чаще мультиколлинеарность проявляется в скрытой форме. Приведем один из
признаков скрытой мультиколлинеарности. Найдем средние значения факторов и оценки их дисперсий по формулам (39,40):
_ 1 пх
Хг = — X х,, г = 1,2,3; (23)
пх
1 пх , _ Ч2
Х =-— Xх-Хг) , г = 1,2,3. (24)
пх 1 j—l
Вычислим парные коэффициенты корреляции между значениями факторов по формуле (25):
, • ( п — 1 ) к=
г =-Хк — Х )(Х >к — Х ); 1 = 1'2'3 (25)
Из вычисленных значений образуем корреляционную матрицу Q:
Г1,1 Г12 Г13
Г21 Г22 Г23
V г31 г32 г33 У
(26)
Матрица е является симметрической. Элементы на главной диагонали равны единице: ^ = 1,г = 1,2,3. Вычислим определитель Де матрицы е. Выдвинем нулевую гипотезу: определитель матрицы е равен нулю: Н 0: Д е = 0
0 е (27)
Н : Де * 0
Вычислим статистику (28), которая имеет распределение % [5]:
7 = пх — 1 —1(2 • (p+1) + 5)1в Де , (28)
6 е
где р — число коэффициентов регрессии. В нашем исследовании:
13
7 = пх — 1 —— • ОД (29)
Для вычисленного по формуле (29) значения, проверим условие:
7>%Р (а, пх • (пх —1)/2), (30)
где: а — уровень значимости, пх • (пх -1) — число степеней свободы, %2кр —
критическое значение распределения . Если условие выполняется, то нулевая гипотеза принимается (Н0: Де = 0) и результаты использования
регрессионного уравнения (14) очень ненадежны. В противном случае нулевая гипотеза отвергается и принимается альтернативная (: Де ф 0).
Вычисление коэффициентов регрессии. Для нахождения коэффициентов регрессии использовался классический метод наименьших квадратов (МНК). Нахождение оценок коэффициентов уравнения регрессии свелось к решению системы линейных уравнений (31):
пх пх пх пх
х2 + Ь •У х, • х,,. + Ь •У х, • х,,. = У у • х
Ь1 • У хи + Ьк • У х1,г • хк,г + Ь3 • У хи • ^ = У У, • х1,/
,= 1 ,= 1 7 = 1 7 = 1
пх пх пх пх
Ь1 • У хи • хк,, + Ьк • У хК, + Ь3 • У хк,, • х3,г = У У, • хк,, ( )
,=1 ,=1 ,=1 7=1
пх пх пх пх
ь1 • У х1,, • х3,, + Ьк •У хк,, • х3,, + Ь3 • У = У У, • х3,,
^ ,=1 ,=1 ,=1 ,=1 Оценка адекватности регрессионной модели и значимости коэффициентов регрессии. По вычисленным коэффициентам регрессионной модели вычислим вектор статистических оценок успеваемостей рассматриваемой группы на экзаменах:
У* =( У*, у*,....у*х ) (32)
В формуле (32) , -я координата вектора У * находится по формуле (33):
У* = Ь1 • х1,, + Ьк • хк,, + Ь3 • х3,, (33)
где: Ь,Ь,Ь являются решениями системы (31), значения х ¡, х2 г, х3г являются
координатами векторов X, X, Х3 (20). По координатам векторов У,У* найдем вектор У :
Уе =( Уе1, Уе2,....Уегя ) (34)
<
Уег — У - У* (35)
Для проверки адекватности модели необходимо найти статистические оценки математических ожиданий и дисперсий случайных величин
X, X, X, У, У *, У, Ь, Ь, Ь, для этого вычислим:
_ 1 пх
У — - £ У г , (36)
Пх г—1
где: уг — координата вектора У.
1 пх _ 2
^—П^-Г ££(У- У), (37)
_ 1 пх
у *—- 2>/ , (38)
пх г—1
* * где: у* — координата вектора У .
1 пх , -\ 2
Ъ £(У* - У•), (39)
V 1 г—1
у'
У пх
1 пх 9
б2—1 £(у. - у*), (40)
к г—1
где: к — число степеней свободы. В нашей задаче к — пх - 4. Оценки дисперсий значений коэффициентов регрессии можно найти по формулам: Б2
БЬ* — —т—е-, г —1,2,3 (41)
г БХ2 • (пх -1) v У
Оценки параметров распределений случайных величин X, Х2, X, входящие
в формулы (41), приведены ранее (24).
й—Б * Б •1( пх -1)£(У*-У>-у) (42)
— значение коэффициента корреляции между успеваемостью и ее оценкой по регрессионной модели. Проверка адекватности регрессионной модели связана с оценками и доверительными интервалами коэффициентов Д, Д, Д,
построенными для генеральной совокупности. Выдвинем нулевую гипотезу о том, что все коэффициенты Д, Д, Д равны нулю:
Но: Д =Дк = Д3 = 0
0 1 к 3 (43)
Н : 3/1(1 </ < 3) Л (Дф 0)
Если гипотеза Н отвергается, то принимается гипотеза Н . Для проверки
Н воспользуемся методом, основанном на F - статистике [4]:
Е = -
Г Я2 ^
V1 - Я 2 У
(44)
т
где: к - число степеней свободы, т - число коэффициентов регрессии. В нашей задаче формула (44) приобретает вид:
Е =
пх - 3
' Я2 ^
V1 - Я 2 У
(45)
Гипотеза Н0 выполняется, если значение Е не превышает критическое значение из таблиц распределения Фишера.
Е < /Кр (а, пх, пх - 3), (46)
где: / (а, пх, пх - 3)- критическое значение из таблиц распределения
Фишера, а - принятый уровень значимости. Если условие (46) не выполняется, то принимается гипотеза Н . Построенная модель считается адекватной и может быть использована в прогнозировании. Доверительные интервалы для коэффициентов Д ,Д ,Д определяются неравенствами (47):
Ъ - ^(а,пх - 4) • < Д < Ъ + КР(а,пх - 4) • ЗД;/ = 1,2,3, (47)
где: Ъ - значение соответствующего коэффициента регрессии, ЗД - его стандартное отклонение (41), ^ (а, пх - 4) критическое значение критерия
Стьюдента, а - принятый уровень значимости. Простой проверкой значимости / - го коэффициента является выполнение для него условия (48): (Ъ, - 1КР (а, пх - 4) • 5Ъг) • (Ъ + ^ (а, пх - 4) • 8Ъ,) > 0 (48)
Классы регрессионной модели. Предположим, что для Ъ3 выполняется: Ь > 0. (49)
Рассмотрим поведение функции у(Хе) = ЪХ2е + Ъ2Хе + Ъ3 (12) в зависимости от знаков ее коэффициентов Ъх, Ъ2 и параметров х0 = -Ъх/ (2 • Ъ2), Б = Ъ2 - 4 • Ъ • Ъ3. По поведению функции у(Хе) на интервале 1 < Хе < 4 можно выделить тринадцать классов регрессионных моделей (табл.1).
Таблица 1.
Классы регрессионных моделей в зависимости от поведения функции у( Хе)
на интервале 1 < Хе < 4, в предположении о положительности Ь3 > 0
№ модели bi b2 х0 D функция y ( Хе )
1 <0 >0 0 < Х0 < 1.5 >0 убывает
2 <0 >0 1.5 < х0 < 3.5 >0 Есть max
3 <0 >0 х0 > 3.5 >0 возрастает
4 <0 <0 *0 < 0 >0 убывает
5 >0 <0 х0 < 1.5 <0 возрастает
6 >0 <0 1.5 < х0 < 3.5 <0 Есть min
7 >0 <0 х0 > 3.5 <0 убывает
8 >0 >0 *0 < 0 <0 возрастает
9 >0 <0 х0 > 0 >0 убывает
10 >0 >0 *0 < 0 >0 возрастает
11 0 >0 - - возрастает
12 0 <0 - - убывает
13 0 0 - - Не зависит от Х e
Как видно из анализа табл.1, классы 11 и 12 соответствуют вырождению квадратичной зависимости у(Хе) в линейную, а класс 13 соответствует моделям, которые описывают группы, результаты экзаменов которых не зависят от номера экзамена в сессии.
Анализ грубых ошибок. Под «грубой ошибкой», или выбросом [3,9], будем понимать такую координату вектора увг е \е (34), которая по абсолютной величине значительно превосходит остальные координаты и существенно
отличается от стандартного. Такая «ошибка» может быть связана с необычной комбинацией условий подготовки и проведения экзамена. Все условия, повлиявшие на результат такого экзамена, должны подвергаться анализу сотрудниками служб, связанных с поддержкой образовательного процесса. В нашем исследовании признаком аномального результата экзамена служит выполнение критерия Романовского [3]:
где: t(а, к) - квантиль двухстороннего распределения Стьюдента, а-принятый уровень значимости, к - число степеней свободы [3].
Алгоритм поиска «грубых ошибок»:
1 ПОСТРОИТЬ первичную регрессионную модель по результатам nx экзаменов, ПРОВЕРИТЬ адекватность модели и значимость ее коэффициентов;
2 ЕСЛИ первичная модель адекватна ТО
3 ПОСТРОИТЬ вектор Y ;
4 В векторе Ye НАИТИ yek | (|yek\ = maxye|), Vi1 i = 1,2,...nx) л (1 < к < nx);
5 БЛОКИРОВАТЬ к - ю координату векторов X, X2, X Y;
6 БЕЗ учета блокированного экзамена, по результатам nx -1 экзаменов,
ПОСТРОИТЬ вторичную регрессионную модель, ПРОВЕРИТЬ адекватность модели и значимость ее коэффициентов;
7 ЕСЛИ вторичная модель адекватна ТО
8 ПО вторичной модели ВЫЧИСЛИТЬ Se и yek;
9 ПРОВЕРИТЬ условие (50) для Se и yek с (nx -1) степенями свободы;
10 ЕСЛИ условие (50) выполняется ТО
11 ПРИНЯТЬ вторичную модель как окончательную;
12 ИНАЧЕ
13 ПРИНЯТЬ первичную модель как окончательную;
\ye\ ^ t(а, к) • Se,
(50)
14 ВСЕ_ЕСЛИ
15 ВСЕ_ЕСЛИ
16 ВСЕ_ЕСЛИ
В случае, если предложенный алгоритм нашел экзамен с «грубой ошибкой», то его можно применить еще раз.
Метод прогнозирования и анализа результатов сессии группы. Для того, чтобы реализовать прогнозирование, необходимо иметь некоторую базовую информацию. Пусть для каждой группы из множества G разработан учебный план, в котором для каждой сессии из базовой информации указаны списки: дисциплин сессии, экзаменаторов, результатов экзаменов. Алгоритм метода прогнозирования и анализа результатов сессии группы:
1 .список_выбросов:=КиЪЬ
2 новые_выбросы:=ТКЦЕ
3 ЦИКЛ_ПОКА новые_выбросы
4 новые_выбросы:=ЕАЬ8Е
5 ПОСТРОИТЬ ПО НЕ БЛОКИРОВАННЫМ ЭКЗАМЕНАМ Х, И Х
6 ЦИКЛ_ПОКА ЕСТЬ ГРУППЫ
7 ПО НОВОЙ ГРУППЕ ПОСТРОИТЬ РЕГРЕССИОННУЮ МОДЕЛЬ
8 ЕСЛИ модель адекватна ТО
9 НАЙТИ выброс
10 ЕСЛИ выброс НАЙДЕН ТО
11 ДОБАВИТЬ выброс в список_выбросов
12 новые_выбросы:=ТЯиЕ
13 ВСЕ_ЕСЛИ
14 ВСЕ_ЕСЛИ
15 ПЕРЕЙТИ К СЛЕДУЮЩЕЙ ГРУППЕ
16 ВСЕ_ЦИКЛ
17 ВСЕ_ЦИКЛ
Результаты экспериментальных исследований. Возможности применения разработанного метода прогнозирования успеваемости проверялись на программном стенде [1]. В экспериментах использовались данные о результатах сессий групп, которые учились в 2012/2013 учебном году, для которых в сессиях имеется полная информация об успеваемости, начиная с первого семестра. Всего таких групп оказалось 334. Из них, после применения алгоритмов рассмотренного метода, только у одной группы (0,3%) построенная регрессионная модель оказалась неадекватной. Еще у пяти групп (1,5%) не подтвердилась гипотеза (49). Распределение оставшихся групп по классам моделей, описанных в табл.1, представлены на рис.1.
о4
С
С
^
а и
н х
о
я о а с
60 50 40 30 20 10 0
5 6 7 8 9
Класс модели
10 11 12
13
1
2
3
4
Рисунок 1 - Распределение групп по классам моделей.
Как видно из рис.1, модели более чем 84% групп, участвующих в эксперименте, отражают, в той, или иной степени, зависимость результатов экзаменов от его номера в сессии. Моделям, вырождающимся в линейные, соответствуют 7,32% групп. Процент групп, для которых их модели отражают только нарастающую усталость в процессе сдачи экзаменов, превышает значение 7%. Группы, которые от экзамена к экзамену монотонно
адаптируются к процессу их сдачи, повышая результаты, при прочих равных условиях, составили более 15%. Наибольшие проценты групп соответствуют моделям второго и шестого классов. В сумме этим двум моделям соответствуют более 62% групп.
1. Использование структуры регрессионной модели, основанной на мультипликативной свертке факторов, позволило разработать метод прогнозирования результатов итогового контроля в образовательных системах. Применение данного метода для более трехсот групп ДГТУ обеспечило адекватность 99,7% полученных моделей. При этом, значимое влияние расписания на результаты итогового контроля обнаруживается в более, чем 82% моделей, что указывает на возможность использование этого метода в системах принятия решений по управлению успеваемостью.
2. Предложенная система классификации групп, базирующаяся на системе классов их моделей, позволяет выделять множества групп, для которых рационально подбирать последовательность сдачи дисциплин, с целью уменьшения суммарного количества отрицательных оценок за период итогового контроля.
1. Гранков М.В., Аль-Габри В.М., Горлова М.Ю., Анализ и кластеризация основных факторов, влияющих на успеваемость учебных групп вуза//
ivdon.ru/ru/magazine/archive/n4y2016/3775.
2. Гранков М.В., Аль-Габри В.М. Постановка задачи автоматизации построения расписания экзаменов студентов вуза. Системный анализ, управление и обработка информации: Труды 5-го Международного
Выводы:
Литература
Инженерный
вестник
Дона, 2016, №4. ШЬ:
семинара (п.Дивноморское 2-6 октября 2014 г.) Под общ. ред. Р.А.Нейдорфа: - Ростов н/Д: - ДГТУ, 2014. — 472с.
3. Румшинский Л.З. Математическая обработка результатов эксперимента. -М.: «Наука», 1971.-192 с.
4. Сигел Э.Ф. Практическая бизнес-статистика. Пер.с англ. - М.: Издательский дом «Вильямс», 2008.- 1056 с.
5. Причины и последствия мультиколлинеарности. URL: metr-ekon.ru/index.php?request=full&id=420
6. Дорохина Е.С., Хорошко А.А., Реализация программы академической и социальной адаптации студентов 1 курса в техническом ВУЗе// Инженерный вестник Дона, 2013, №1. URL: ivdon.ru/ru/magazine/archive/n1y2013/1572.
7. Mehtap Erguven. Comparison of the efficiency of principal component analysis and multiple linear regression to determine students' academic achievement //Application of Information and Communication Technologies (AICT), 2012 6th International Conference, Oct. 2012. pp. 1 - 5.
8. Bekim Fetaji, Xhelal Jashari, Majlinda Fetaji. Devising and evaluating UBT model of student e-Service Information System using regression analyses // Embedded Computing (MECO), 2016 5th Mediterranean Conference. June 2016. pp. 351 - 356.
9. Дрейнер Н., Смит Г. Прикладной регрессионный анализ. Пер.с англ. -2-е изд., перераб. и доп. - М.: Финансы и статистика, 1986.- 366 с.
10. Пучков Е.В., Пономарева Е.И., Разработка информационно-аналитической системы на основе многомерного хранилища данных// Инженерный вестник Дона, 2012, №4. URL: ivdon. ru/ru/magazine/archive/n4p 1y2012/1123
References
1. Grankov M.V., Al'-Gabri V.M., Gorlova M.U., Inzenernyj vestnik Dona (Rus), 2016, № 4. URL: ivdon.ru/ru/magazine/archive/n4y2016/3775.
2. Grankov M.V., Al'-Gabri V.M. Postanovka zadachi avtomatizatsii postroyeniya raspisaniya ekzamenov studentov vuza [Problem statement of automating the scheduling of student exams timetable at the university]. Trudy 5-go Mezhdunarodnogo seminara (p.Divnomorskoye 2-6 oktyabrya 2014 g.) Pod obshch. red. R.A.Neydorfa: Rostov n/D: DGTU, 2014. 472p.
3. Rumshinskiy L.Z. Matematicheskaya obrabotka rezul'tatov eksperimenta [The mathematical processing of the experimental results]. M.: «Nauka», 1971. 192 p.
4. Sigel E.F. Prakticheskaya biznes-statistika [Applied Business Statistics]: Per.s angl. M.: Izdatel'skiy dom «Vil'yams», 2008. 1056 p.
5. Prichiny i posledstviya mul'tikollinearnosti [Causes and consequences of multicollinearity]. URL:metr-ekon.ru/index.php?request=full&id=420
6. Dorokhina Ye.S., Khoroshko A.A., Inzenernyj vestnik Dona (Rus), 2013, № 1. URL: ivdon.ru/ru/magazine/archive/n1y2013/1572/.
7. Mehtap Erguven. Comparison of the efficiency of principal component analysis and multiple linear regression to determine students' academic achievement. Application of Information and Communication Technologies (AICT), 2012 6th International Conference, Oct. 2012. pp. 1-5.
8. Bekim Fetaji, Xhelal Jashari, Majlinda Fetaji. Devising and evaluating UBT model of student e-Service Information System using regression analyses. Embedded Computing (MECO), 2016 5th Mediterranean Conference. June 2016. pp. 351 - 356.
9. Dreyner N., Smit G. Prikladnoy regressionnyy analiz [Applied regression analysis]. Per.s angl. 2-ye izd., 1986. 366 s.
10. Puchkov EV, Ponomareva EI. Inzenernyj vestnik Dona (Rus), 2012, No. 4.
ЦЕЬ: ivdon.ru/en/magazine/archive/n4p 1у2012/1123