УДК 338.27:519.862.6:332.85
А.В. Чертов, аспирант кафедры прикладной математики и информатики, (920) 747-65-04, а!ехеу [email protected]. (Россия, Тула, ТулГУ)
СРАВНИТЕЛЬНЫЙ АНАЛИЗ ЭФФЕКТИВНОСТИ МЕТОДОВ ПРОГНОЗИРОВАНИЯ НА ПРИМЕРЕ РЫНКА НЕДВИЖИМОСТИ
Проведен аналш динамики роста цен на жилье в различных регионах, выявлены закономерности динамит роста Проанализировано поведение цен на рынке жилья и проведено сравнение прогностической силы прогнозных моделей.
Ключевые слова: временные ряды, точечный прогноз, доверительный интервал прогноза, автокорреляция остатков временного ряда, тест Дарвина-Уотсона, адаптивные модели прогнозирования, структурные изменения тренда, тест Чоу.
Важнейшей задачей исследования экономического временного ряда является выявление основной тенденции изучаемого процесса, выраженной неслучайной составляющей /(() (тренда либо тренда с циклической или (и) сезонной компонентой). Для построения тренда были выбраны следующие виды функций [1]: линейная — /и)=Ь0 + V и экспоненциальная — /(О = б0е¥. При обработке временных рядов, как правило, наиболее ценной является информация последнего периода, поэтому в работе были построены адаптивные модели [2] для рынков недвижимости исследуемых регионов. В частности, в работе использован один из классов адаптивных методов - модель Брауна. Также было проведено исследование изучаемого процесса с предположением о наличие структурных изменений, для этого был использован класс кусочно-линейных моделей. Результаты, полученные в работе, опубликованы в следующих изданиях [4-6].
Для исследования динамики цен на жилье в городе Москве были взяты данные о цене одного квадратного метра в типовой квартире на вторичном рынке жилья за 7 лет (в период с 2002 г. по 2008 г.). На основе полученных коэффициентов автокорреляции уровней ряда (табл. 1) и построенной коррелограммы был сделан вывод об отсутствие сезонной составляющей в изучаемом процессе.
Таблица 1
Коэффициенты автокорреляции ряда, отражающего динамику цены жилья в г. Москве
Лаг Коэффициент автокорреляции Лаг Коэффициент автокорреляции Лаг Коэффициент автокорреляции Лаг Коэффициент автокорреляции
1 0,9010 5 0,4738 9 0,0660 13 -0,2286
2 , 0,7861 6 0,3831 10 -0,0344 14 -0,2722
3 0,6724 7 0,2848 11 -0,1165
4 0,5632 8 0,1743 12 -0,1840
Основная тенденция, выражающая неслучайную составляющую, получена в виде следующих функций: линейной — /¡(0=1665 + 4330* и экспоненциальной — /г(0 = 19120еоота'. Для полученных моделей коэффициенты детерминации соответственно равны я,2 =0,932; 0,979. Причем обе модели значимы, значение критерия Фишера ^ =356>^М;1.26 =4,2 и = 1257 > /^ „5 , 25 = 4,2 .
Для каждой из построенных моделей проведено исследование на наличие автокорреляции в остатках. Фактическое значение критерия Дарби-на-Уотсона для линейной модели — ¿/ = 0,217, для экспоненциальной модели— ¿ = 1,517.
При л = 28 критические значения =1,33, <1„ =1,48. Изобразим результат Дарбина-Уотсона графически для значения л = 28 (рис. 1).
Я0 отвергается (полшекгояьнэя автокорреляция)
3«на иоопре-д«л«нностм
133
1,48
Яд принимается
(отсутствие автокорреляции)
Зт-е неопрв-де/енноста
2,52
й"0 отвергался (отрицатяыпя авто коррекция)
2,67
4 й
Рис. 1. Графическое представление значений для теста Дарбина-Уотсона при и = 28
Исследование автокорреляции остатков временного ряда опровергло гипотезу Н0 об отсутствии автокорреляции в линейной модели, обнаружено наличие положительной автокорреляции. Для экспоненциальной модели гипотеза #0 об отсутствии автокорреляции подтвердилась.
Для дальнейшего исследования использован класс адаптивных методов. Важнейшим достоинством адаптивных методов является построение самокорректирующихся моделей, способных учитывать результат прогноза, сделанного на предыдущем шаге.
Построим адаптивную модель и рассчитаем по ней прогнозные значения стоимости квадратного метра жилья на вторичном рынке города Москвы:
1) по нескольким первым значениям (по первым 10 значениям) находим методом наименьших квадратов уравнение линейной регрессии, получаем у,= 16972+2325/ (для данного уравнения коэффициент детерминации Я2 =0,982, значение ^-критерия: ^ = 442 > 05;1;8 =5,3 — следовательно, уравнение статистически значимо);
2) определяем прогноз на один шаг (* = 1):
у, (1) = 16972 + 2325■1 = 19297;
3) находим ошибку прогнозирования. При ¿ = 1 получаем:
е(1) = 19403-19297 = 106;
4) производим корректировку параметров модели:
а(0 = a(t -1) + b{t -1) + (1 - fi)1 e(i) = \ 6972 + 2325 + (1 - 0,2)г • 106 = 19365, b(t) = b(t -1) + (1 - fi)2 e(t) = 2325 + (1 - 0,2)2 • 106 = 2393 ;
полагая параметр сглаживания a = 0,8, а коэффициент дисконтирования данных /? = 0,2;
5) по скорректированной модели определяем прогноз на следующий промежуток:
у, (1) = 19365 + 2393 • 1 = 21758 и т. д. Результаты дальнейших вычислений приведены в табл. 2.
Таблица 2
Оценка параметров модели
t У, а В Уг 8{t)
0 16 972 2325
1 19 403 19 365 2393 19 297 106
2 22 534 22 255 2890 21 758 776
3 24 029 24 430 2176 25 144 -1115
4 25 168 25 686 1255 26 606 -1438
27 131 058 131 577 9353 132 501 -1443
28 129 993 133 931 2353 140 931 -10 938
29 прогноз на 1 квартал 2009 г. 136 284
30 прогноз на 2 квартал 2009 г. 138 637
Для полученной адаптивной модели коэффициент детерминации равен я2 =0,980. Причем модель статистически значима Р =1247>^0 05 1.м =4,2.
На рис. 2 графически представлена полученная модель и исходные данные.
Тест Дарбина-Уотсона для проверки наличия автокорреляции остатков подтвердил гипотезу Я0 об отсутствии автокорреляции в остатках. Рассчитанное фактическое значение критерия Дарбина-Уотсона для нашей модели <1 = 1,591. Данные показывают (рис. 1), что фактическое значение критерия попадает в интервал, в котором гипотеза #0 об отсутствии автокорреляции принимается.
Рис. 2. Графическое представление адаптивной модели для динамики цены жилья в г. Москве
Анализ графического представления данных, отражающих динамику цены жилья в городе Москве за 2002-2008 гг., позволяет высказать предположение о возможности использования кусочно-линейной модели после момента г* = 16, поскольку начиная с этого момента происходит изменение характера динамики исследуемого показателя.
Для проверки наших предположений воспользуемся статистическим тестом Г. Чоу. Выдвинем гипотезу Я0 о структурной стабильности тенденции изучаемого временного ряда.
Выше при построении единого уравнения тренда для всей совокупности данных были получены следующие параметры:
1) линейная модель — /¡(/)=1665+ 4330/, остаточная сумма квадратов отклонений линейной модели^™" = 2498462349; значение критерия Фишера .р, =356;
2) экспоненциальная модель — /2(/) = 19120е00722', остаточная сумма квадратов отклонений экспоненциальной модели Б^ =1158440078; значение критерия Фишера = 1257.
Проведем расчет аналогичных параметров для кусочно-линейной модели следующего вида:
Г2089/+18088, при 1^16, /з(0 = {б3147/°'279, при 016.
Имеем остаточная сумма квадратов отклонений кусочно-линейной модели: = 16965670 + 262920287 = 279885957 .
Сравним полученные выше модели: линейную и кусочно-линейную, для чего в соответствии с предложенной Г. Чоу методикой определим наблюдаемое значение Г-критерия:
р - ^осш )("~*1 (2498462349 - 279885957)(28-2-2)_?;
" $1ст(.кх+к2-к3) 279885957(2 + 2-2)
Поскольку Fя = 95>^ =3,4, то гипотеза о структурной стабильности тенденции отклоняется, влияние структурных изменений на динамику цены жилья в городе Москве признаем значимым и следует отдать предпочтение кусочно-линейной модели, а не линейной.
Сравним полученные выше модели: экспоненциальную и кусочно-линейную, определим наблюдаемое значение ^-критерия. Поскольку =37 =3,4, то гипотеза о структурной стабильности тенденции отклоняется, а влияние структурных изменений на динамику цены жилья в городе Москве признаем значимым и следует отдать предпочтение кусочно-линейной модели, а не экспоненциальной (рис. 3).
Рис. 3. Графическое представление кусочно-линейной модели для динамики цены жилья в г. Москве
Итак, после проведения статистического теста Г. Чоу для оценки значимости структурных изменений можно сделать вывод, что во временном ряде, отражающим динамику цены жилья в городе Москве, имеются структурные изменения после г* = 16 (1 квартал 2006 г.), поэтому при моделировании процесса следует отдать предпочтение кусочно-линейной модели вида:
|2089г +18088, при I <.16, /з(0 = [б3147Л279, при I > 16.
Проведем статистическую оценку полученной кусочно-линейной модели: коэффициент детерминации равен я2 =0,992. Причем модель статистически значима ^ = 3388 > /\05;иб = 4,2.
Тест Дарбина-Уотсона для проверки наличия автокорреляции остатков подтвердил гипотезу Я0 об отсутствии автокорреляции в остатках.
Рассчитанное фактическое значение критерия Дарбина-Уотсона для нашей модели — ¿/ = 1,491. Фактическое значение критерия попадает в интервал, в котором гипотеза #0 об отсутствии автокорреляции принимается (рис. 1).
Доверительный интервал для модели регрессии, т. е. для условного математического ожидания МХ(У), определяется по формуле:
У - +1 -Я., (1)
(2)
где — стандартная ошибка групповой средней у; — значение /-статистики Стьюдента с к = п-г степенями свободы; « — выборочная остаточная дисперсия; е, =у, -у, — выборочная оценка возмущения или остаток регрессии.
Построенная доверительная область для МХ(У) (1) определяет местоположение модельной линии регрессии (т. е. условного математического ожидания), но не отдельных возможных значений зависимой переменной, которые отклоняются от средней. Поэтому при определении доверительного интервала для индивидуальных значений у0 зависимой переменной необходимо учитывать еще один источник вариации — рассеяние вокруг линии регрессии, т. е. в оценку суммарной дисперсии я1, следует включить
величину .V2. В результате оценка дисперсии индивидуальных значений у„ при х=х„ равна
1 + - + п
(3)
а соответствующий доверительный интервал для прогнозов индивидуальных значений у'0 будет определяться по формуле
Я -4-
^Л +
(4)
Вычислим с надежностью 0,95 интервальную оценки прогноза среднего и индивидуального значений цены 1 кв.м жилья в г. Москве на первые два квартала 2009 г. Рассчитаем прогнозные значения по линейной, экспоненциальной, адаптивной и кусочно-линейной моделям.
Условное математическое ожидание для прогноза по адаптивной модели 7(29) = 136284 И у(30) = 138637.
Оценка дисперсии групповой средней: я. =1807, я- =1902.
Интервальная оценка прогноза среднего значения цены по формуле (1) составляет:
132561 ^ Я29) < 140007 , 134717^Я30)^ 142557.
Дисперсия оценок индивидуальных значений у*(29) и у*(30), равна: ^ =4992, =5027.
Интервальную оценка для индивидуальных значений >>*(29) и у*(30) определяется диапазоном
125999 £ ^»(29)^146569, 128280 (30) <148994.
Аналогичные интервальные оценки получены для прогноза среднего и индивидуального значения стоимости квадратного метра жилья, полученной с использованием линейной, экспоненциальной и кусочно-линейной модели.
Построены аналогичные модели и рассчитаны интервальные прогнозные оценки для стоимости квадратного метра жилья в городе Москве, Тульской области и Центральном федеральном округе на первый и второй кварталы 2009 г. К настоящему времени опубликованы статистические данные [3] о стоимости квадратного метра жилья за первый квартал 2009 г. на вторичных рынках исследованных регионов, поэтому есть возможность провести сравнительный анализ значений стоимости квадратного метра жилья, спрогнозированных с использованием различных моделей, и реальных данных (табл. 3).
Как видно из результатов анализа данных (табл. 3), стоимость жилья в первом квартале 2009 г. в исследуемых регионах оказалась в рамках индивидуального прогнозируемого значения цены для всех моделей. Хотя, очевидно, что линейная модель дает достаточно большой доверительный интервал прогноза, вследствие чего ее нельзя применять на практике. Такой достаточно большой «коридор» доверительного интервала можно объяснить тем, что линейная модель не смогла достаточно четко уловить общую тенденцию динамики цен, вследствие чего и накопилось высокое значение дисперсии остаточной компоненты. Использование экспоненциальной модели дало достаточно приемлемый доверительный интервал индивидуального прогнозируемого значения цены квадратного метра в исследуемых регионах. Но экспоненциальная модель для Тульской области (табл. 3) дала завышенное прогнозируемое значение стоимости жилья. Этот факт можно объяснить тем, что последние два квартала на рынке недвижимости Тульской области имелась тенденция к замедлению роста цен в связи с кризисом; а экспоненциальная модель, уловив общую тенденцию
стремительного роста цен за последние 7 лет, не смогла в достаточной степени адаптироваться к изменениям.
Таблица 3
Средние и индивидуальные значения спрогнозированной цены 1 кв. м жилья на первый квартал 2009 г. в городе Москве, полученные с использованием различных моделей
Город Москва
Среднее значение Индивидуальное значение
Линейная модель от 119 393 до 135 077 руб. от 105 572 до 148 897 руб.
Экспоненциальная модель от 139 302 до 149 422 руб. от 129 711 до 159 017 руб.
Адаптивная модель от 132 561 до 140 007 руб. от 125 999 до 146 569 руб.
Кусочно-линейная модель от 136 684 до 139 644 руб. от 135 340 до 140 988 руб.
Реальная стоимость 139 402 руб.
Тульская область
Среднее значение Индивидуальное значение
Линейная модель от 33 776 до 38 184 руб. от 29 887 до 42 073 руб.
Экспоненциальная модель от 41 900 до 44 062 руб. от 39 995 до 45 968 руб.
Адаптивная модель от 38 273 до 40 383 руб. от 36 414 до 42 242 руб.
Кусочно-линейная модель от 39 067 до 41 025 руб. от 38 178 до 41 914 руб.
Реальная стоимость 38 687 руб.
ЦФО
Среднее значение Индивидуальное значение
Линейная модель от 68 566 до 78 576 руб. от 59 743 до 87 397 руб.
Экспоненциальная модель от 79 101 до 84 497 руб. от 74 347 до 89 251 руб.
Адаптивная модель от 76 088 до 80 020 руб. от 72 624 до 83 484 руб.
Кусочно-линейная модель от 79 620 до 81 084 руб. от 78 955 до 81 749 руб.
Реальная стоимость 79 782 руб.
Основания для применения кусочно-линейных моделей имеются, но есть сложность с определением моментов, когда эти изменения происходят, поэтому здесь приходится полагаться на мнение аналитиков, работающих в сфере недвижимости. Хотя в нашем случае использование кусочно-линейных моделей дало достаточно узкий «коридор» доверительного интервала прогнозируемых значений стоимости квадратного метра жилья в исследуемых регионах. Прогноз, основанный на использовании ку-сочно-линейных моделей, оказался верным. Наибольшую прогностическую силу имеют адаптивные модели. Ошибка, накопленная моделью не-
велика, благодаря тому, что модель учитывает динамичность процесса формирования цен на рынке жилья. Именно поэтому при использовании адаптивных моделей для всех рассмотренных регионов получены индивидуальные прогнозируемые значения, приемлемые для практических исследований. Очевидно, что использование адаптивных и кусочно-линейных моделей дает приемлемый «коридор» доверительного интервала прогнозируемых индивидуальных значений стоимости квадратного метра жилья.
Сравнивая методы, использованные при прогнозировании, можно проранжировать эти методы по мере убывания их прогностической силы в следующем порядке:
- адаптивные модели прогнозирования;
- прогнозирование с использованием кусочно-линейных моделей (с учетом структурных изменений);
- прогнозирование по тренду (с использованием линейных, экспоненциальных и прочих зависимостей).
Библиографический список
1. Кочетыгов А.А., Толоконников Л.А. Основы эконометрики: учеб. пособие. М.: ИКЦ «МарТ», 2007.
2. Кремер Н.Ш., Путко Б.А. Эконометрика: учебник для вузов. М.: ЮНИТИ-ДАНА, 2005.
3. Росстат: официальный Интернет сайт. URL: http ://www. pks.ru.
4. Чертов А.В., Кочетыгов А.А. Сравнительный анализ различных методов прогнозирования временных рядов на примере рынка жилья // Современные проблемы математики, механики, информатики: материалы межд. науч. конф. Тула: «Гриф и К», 2008. С. 381-383.
5. Чертов А.В. Исследование динамики цен на российском рынке жилья // Современные проблемы математики, механики, информатики: материалы Регион, науч. студ. конф. Тула: ТулГУ, 2008. С. 140-141.
6. Чертов А.В. Моделирование и учет структурных изменений временных рядов при исследовании экономических показателей // Современные проблемы математики, механики, информатики: материалы межд. науч. конф. Тула: Изд-во ТулГУ, 2007. С. 241-242.
А. V. Chertov
The comparative analysis of efficiency of methods forecasting by the example of the market of the real estate
The analysis of dynamics of a rise ofprices on habitation in various regions is carried out, laws of dynamics of growth are detected. The behavior of the prices in the market of habitation is analysed and the comparison of predicted forces of forecasting models is carried out.
Keywords: time series, the dot forecast, a confidence interval of the forecast, residual autocorrelation of time series, Darbin-Watson's test, adaptive models of forecasting, structural changes of a trend. Chow test.