библиотеке: Автореф. дис. канд. техн. наук. Новосибирск, 2000.
2. Журавлёва Е.Ю. Современные модели развития гуманитарных наук в цифровой среде // Вопросы философии. 2011.
© Арсланова Дж., Байрамдурдыева Н., 2024
УДК 519.2
Гусев А. Л.
док. тех. наук, профессор ФГБОУ ВО ПГНИУ, г. Пермь, РФ Ерёмин И. В. аспирант ФГБОУ ВО ПГНИУ, г. Пермь, РФ
ВЫБОР МНОГОМЕРНОГО РЕГРЕССИОННОГО УРАВНЕНИЯ
Аннотация
В настоящей статье рассмотрена задача выбора наилучшего в некотором смысле регрессионного уравнения из некоторого множества регрессионных уравнений. Такая задача возникает, когда имеется несколько групп регрессоров и внутри группы регрессоры коррелированы между собой. В работе показано, что выбор уравнения может быть не однозначным. Поэтому для решения разных задач на одном и том же статистическом материале могут быть выбраны разные многомерные регрессионные уравнения как модели управления.
Ключевые слова:
управляющая модель, многомерная регрессия, скорректированный коэффициент детерминации, коэффициенты регрессионного уравнения, адекватность модели управления.
Введение
Многомерные регрессионные уравнения часто используется как модель управления, прогноза или «черного ящика». Такая модель содержит несколько регрессоров и регрессант. Математическая модель устанавливает функциональную зависимость регрессанта у от регрессоров х2, -,хт , если они наблюдались п раз (п - произвольно).
1. Множество регрессионных уравнений в качестве модели.
Многомерное регрессионное уравнение (модель) предполагает отсутствие линейной зависимости между регрессорами. В противном случае построенная модель будет неадекватной в смысле результатов моделирования или результат будет плохо поддаваться содержательной интерпретации. Линейно зависимые регрессоры объединяются в группы и в регрессионное уравнение может входить только один регрессор из группы. Таких групп может быть несколько. Поэтому создаются всевозможные сочетания, включающие максимальное число линейно независимых регрессоров. Линейная зависимость между регрессорами определяется по порогу абсолютного значения коэффициента линейной корреляции
Пирсона между регрессорами. Как правило, берется пороговое значение из интервала (0,5; 1). Если модуль коэффициента корреляции между регрессорами больше выбранного порога, то регрессоры являются зависимыми.
Каждое сочетание независимых регрессоров - это основа для построения отдельного регрессионного уравнения (модели). В результате может получиться N регрессионных уравнений (моделей).
Например, пусть имеются 8 регрессоров и пусть Х1,Х2,Х3 коррелированы между собой (зависимы друг от друга), а также пусть Х4,Х$ - тоже коррелированы между собой. Остальные регрессоры не зависимы. Тогда модели можно построить на следующих N=6 (3х2=6) наборах регрессоров: Х1,Х^,Х6,Х7,Х8; Х1,Х5,Х6,Х7,Х8; Х2,Х^,Х6,Х7,Х8; Х2,Х5,Х6,Х7,Х8; Х3,Х^,Х6,Х7,Х8;
Х7,Х8.
Как правило, если в этой ситуации одно из многомерных регрессионных уравнений оказалось значимым [1] и адекватным [2], то и другие уравнения будут значимыми и адекватными. Встает задача выбора уравнения, которое будет на практике использоваться как модель. Оговоримся сразу, что не бывает лучшего уравнения (модели) вообще, бывает лучшее уравнение в некотором смысле.
2. Выбор лучшего уравнения по скорректированному коэффициенту детерминации.
Как уже оговаривалось, во всех смыслах лучшей модели не бывает. Бывает лучшая модель в конкретном смысле. Чаще всего выбирают модель по скорректированному коэффициенту детерминации [1], что позволяет сравнивать модели с разным количеством регрессоров.
Рассмотрим выбор наилучшей модели из N моделей как наиболее устойчивой модели по отношению к её скорректированному коэффициенту детерминации. Этот метод особенно хорош, когда наблюдения поступают во времени, т.е. наблюдаем временной ряд или случайный процесс.
Все статистические данные делятся на несколько приблизительно равных групп во времени. Например, по г наблюдений I групп. Очевидно, что п=г*1. Для каждой потенциальной модели можно построить последовательность скорректированных коэффициентов детерминации 2 способами.
1 способ. Каждый скорректированный коэффициент детерминации находится для каждой отдельной группы наблюдений из I групп по г наблюдений. Таким образом, будут найдены I скорректированных коэффициентов детерминации для каждой из N моделей.
.. - Л\,Л\, ...,Л\, где / - номер модели
Обозначим коэффициенты детерминации для каждой модели: 1 с 1 г- п
(1 = ^0.
2 способ. Первый скорректированный коэффициент детерминации вычисляется только по наблюдениям первой группы наблюдений. Второй скорректированный коэффициент детерминации вычисляется по наблюдениям первой и второй группы. И так далее. Наконец, по всем наблюдениям вычисляется 1-ый скорректированный коэффициент детерминации.
В независимости от выбранного способа нахождения последовательности скорректированных коэффициентов детерминации, вычислим среднее арифметическое значение, стандартное отклонение и коэффициент вариации для скорректированного коэффициента детерминации для каждой модели.
Модель, у которой скорректированный коэффициент детерминации имеет наименьший коэффициент вариации, является самой устойчивой по отношении к изменчивости коэффициента детерминации во времени.
3. Выбор лучшего уравнения по коэффициентам регрессионного уравнения.
Пусть многомерное регрессионное уравнение состоит из к регрессоров. В независимости от того
какой способ, указанных в предыдущем разделе, будет выбран для построения последовательности регрессионных уравнений, чтобы найти последовательность скорректированных коэффициентов детерминации, каждый раз будем получать не только коэффициент детерминации, но и вектор коэффициентов регрессионного уравнения. Обозначим его
(«o^ «1 j.....«fcjO.
где i -номер модели, j - номер группы при первом способе или количество групп, объединенных вместе, при втором способе. Таким образом, для каждой модели получаем последовательность из l векторов.
Теперь для каждой модели можно сравнить соседние вектора по изменчивости коэффициентов (координат вектора). На сколько процентов изменилась каждая координата можно посчитать по формуле:
|az,o-az,o+l| в 100, п1
где z (номер коэффициента в уравнении) изменяется от 0 до k, o изменяется от 1 до 1-1. При этом средний коэффициент изменения координат вектора может быть посчитан по формуле:
Xx=ol+*100
к+1
Поскольку групп наблюдений, по которым последовательно строились регрессионные уравнения
было I, то получим последовательность процентной изменчивости коэффициентов регрессии для каждой
из / моделей, которую обозначим 11г, 112,..., /[_!.
В независимости от выбранного способа нахождения последовательности векторов коэффициентов
регрессионного уравнения, вычислим среднее арифметическое значение, стандартное отклонение и
последовательности процентной изменчивости коэффициентов регрессии для коэффициент вариации для -r-r-.i-i-.-r
каждой из / моделей.
Модель, у которой процент изменчивости коэффициентов регрессии имеет наименьший коэффициент вариации, является самой устойчивой по отношении к изменчивости коэффициентов регрессионного уравнения во времени.
Заключение
Выбор регрессионного уравнения как управляющей модели может быть наиболее адекватным только при точно сформулированной задаче, которую нужно решить в конечном результате [3]. Многочисленные эксперименты с построением и выбором многомерного регрессионного уравнения как модели управления по скорректированному коэффициенту детерминации и коэффициентам регрессионного уравнения, которые приведены во втором и третьем разделе настоящей статьи, показали следующие результаты. Примерно 80-85% исследованных случаев оба метода выбирают одно и то же регрессионное уравнение. Однако в 15-20% случаев это разные уравнения. При этом оба способа выбора не лишены логики и здравого смысла. И в том случае необходим дополнительный критерий выбора уравнения.
Список использованной литературы:
1. Орлов А.И. Прикладная статистика. Издательство «Экзамен», 2004, 656 с.
2. Гусев А.Л., Еремин И.В. Некоторые аспекты построения и использования многомерной регрессионной модели для управления // Символ науки, 2024, №11-1. С.
3. Гусев А.Л., Еремин И.В. Построение многомерной нелинейной модели при каскадном управлении // Символ науки, 2024, №10-1. С. 10-12.
© Гусев А.Л., Ерёмин И.В., 2024
Z.U