Математическое моделирование процесса оценки стоимости аренды недвижимости с использованием искусственных нейронных сетей
В.А. Евсин, Е.А. Продан, В.А. Евсина, С.Н. Широбокова
Южно-Российский государственный политехнический университет (НПИ) имени М.И. Платова, Новочеркасск
Аннотация: В данной статье рассматривается проблема определения стоимости аренды недвижимости. Обосновывается идея о минимизации функции абсолютной ошибки с использованием искусственных нейронных сетей. Особое внимание уделено процессу определения входных данных нейронной сети. В частности, рассмотрена проблематика определения таких параметров, как благоустройство региона и помещения. В статье выяснены особенности определения весовых коэффициентов для определения технического оснащения помещения с использованием генетического алгоритма. Предложена модель архитектуры нейронной сети. Описана модель изменения весовых коэффициентов. По итогу произведена апробация модели на тестовых данных, а также описана модель корректировки данных с учетом динамики цен.
Ключевые слова: нейронная сеть, data mining, анализ данных, аренда недвижимости, регрессия, генетический алгоритм, информатика, машинное обучение, оценка стоимости, моделирование, экстраполяция.
Оценка недвижимости в настоящее время получает все большее значение для поддержания конкурентоспособности на рынке агентств недвижимости. Основной группой методов при проведении оценки являются методы сравнения, в ходе которых производится оценка недвижимости с точки зрения сравнения ее характеристик с существующими оцененными объектами, подробнее о которых в [1]. Для проведения подобной оценки может быть использован аппарат искусственных нейронных сетей [2-4]. Функционал качества прогноза в данном случае может быть основан на минимизации суммы квадратов отклонений и иметь следующую форму:
1 m ~
J(w) = 2 £ [CT - CT ]2 ^ min,
2 j=1
где CT - стоимость объекта фактическая, CT - стоимость объекта прогнозируемая, которая может быть выражена следующей формулой:
CT = IH * Wj + IR* w2 + DC * w3 + M * w4 + TS * w5 + LN* w6 + LT *w7 + e,
где IH - коэффициент благоустройства помещения, IR - коэффициент благоустройства региона, DC - удаленность от центра, M - материал помещения, TS - коэффициент технического оснащения квартиры, LN -долгота, LT - широта, s - случайная ошибка модели. С учетом представленных параметров функционал приобретает следующую форму:
J(w) = 22! [CT - (IH * w1 + IR * w2 + DC * w3 + M * w4 + TS * w5 + LN * w6 + LT * w7)] ^ min, параметры которой идентичны представленным ранее.
Для выявления интегральной оценки влияния t-го типа объектов инфраструктуры региона на стоимость объекта недвижимости необходимо вывести дифференциальное уравнение, описывающее данный процесс. Рассматривая связь между приращением аргумента AK', который представлен объектами t-го типа инфраструктуры региона, и приращением влияния AIR, можно вывести зависимость. Для восстановления данных следует провести процедуру интерполяции данных формулой Ньютона, подробнее о которой в [5,6], при которой зависимость будет иметь следующий вид:
IR(K) = IR0 + 2^(Ko,...,K)*(K -Kо)*...*(K -K— ),
i=1
где ¡Я' (К) - функциональная зависимость влияния от количества объектов данного типа, ¡Я0 - значение зависимости при отсутствии объектов данного типа, ¡Я'(К0,...,Кг) - разделенная разность /-го порядка для характеристики влияния. Для определения коэффициента благоустройства региона от влияния объектов '-го типа используется следующая зависимость:
т
¡Я = 2М( * е % * Ьп(К,),
'=1
где М - коэффициент влияния от объектов '-го типа, а - функция насыщения объектами '-го типа, г - усредненное расстояние до объектов, К - количество значимых объектов региона.
Интегральная оценка благоустроенности помещения складывается из оценки характеристических показателей помещения, а также показателей состояния предметов в помещении с учетом их качества и имеет вид:
IH = £WU *Cu +£^2, *C2, *(1 -^),
s=1 i=1
где IH - коэффициент благоустроенности помещения, W1s - весовой коэффициент s-го характеристического показателя, C1>s - степень качества s-го характеристического показателя, B2i - весовой коэффициент от наличия i-го предмета, C2ii - степень ценности i-го предмета, a2j - коэффициент износа. Коэффициент технического оснащения квартиры включает следующие данные: газовое обеспечение, наличие интернета, холодное водоснабжение, горячее водоснабжение, водоотведение, электричество. Для определения весовых коэффициентов от наличия каждого из компонент необходимо определить следующий функционал качества:
1 m
J(w) = - £ [CT - (k1* x1 + к2 * x2 +... + k7 * x7)]2 ^ min
2 j=1
0 < xi < 1 ,
£ Xi= 1
i
где i = 1, n - компоненты технического обеспечения, xt - весовой коэффициент i-й компоненты, к - коэффициент наличия i-й компоненты, причем:
(1, если помещение обеспечено i - м компонентом
kt Н .
[ 0, иначе
Данный функционал качества исходит из предположения, что наличие каждой компоненты положительно сказывается на стоимости недвижимости. Для решения данного функционала может быть использован аппарат генетических алгоритмов [7].
Хромосома может быть представлена в следующей форме:
Ch = ß;¿2;...;¿48;¿49],!!b ||= {0,1}.
В качестве начальной популяции принимаются наборы бинарных
данных, которые в десятичном представлении формируют допустимое
множество решений. Фитнес-функция модели имеет следующую форму:
т т ^Вес(Б1пАттау,)
ЕЕ = У (С т, - У---' * р,, ),
¿Г ' 100 "
где ЕЕ - фитнес-функция модели, Вес(БтАггауу) - десятичное представление у'-го параметра хромосомы, р, - значение у'-го параметра 1-й строки набора данных. В качестве модели селекции используется модель элитарного отбора по критерию минимальной фитнес-функции хромосом. Для определения генов новых потомков используется модель четырнадцати точечного кроссовера. Кроме того, с вероятностью 0.7 возникает мутация у рассматриваемой хромосомы. Условие выхода из процесса селекции имеет следующую форму:
Ex =
1
1, если — У | FFB. - FFB | < s или c _ ep = m _ ep
nT j
0, иначе
где FFB. - наиболее приспособленная особь j-й эпохи, FFB - усредненный
показатель наиболее приспособленных особей за последние «-эпох, s-максимальная ошибка модели, c ep - номер текущей эпохи, m_ep -максимальное количество эпох.
При построении нейронной сети используется оптимизация методом стохастического градиентного спуска, который имеет следующую форму:
St =V WJ (wt ), mt =Pmt-1 +(1 -Pi)5t
vt =p2vt_x + (1 в2 ) I ^t 12 ,
П вп (1 -в1
wt+1 = wt-~p=— (в1 wt - —в + л в ) Jvt + s 1 -в 1 -в
где 51 - градиент, т1 - момент расчета, п - темп обучения, Д, в2 - параметры обучения.
Сеть имеет входной, выходной слой, а также 10 скрытых слоев с конфигурацией количества нейронов в каждом: 7/7/64/128/64/8/6/5/4/3/2/1.
В качестве функции активации используется модель БЕЬи (масштабная экспоненциальная линейная единица), которая имеет следующую форму:
ЖШ (х) = Л\
х, если х > 0
\ае - а, иначе
В результате обучения модели сформирован график динамики средней абсолютной ошибки обучения, представленный на рис. 1. Результаты проверки модели на тестовых данных представлены на рис. 2.
Рис. 1. - Динамика изменения абсоютной средней ошибки обучения
Рис. 2. - Диаграмма распределения ошибки прогноза После обучения модели необходимо провести корректировку полученных результатов с учетом динамики средних цен на недвижимость по периодам. Для проведения данной корректировки может быть
использована адаптивная модель прогнозирования Брауна второго порядка, подробнее о которой в [8] и которая имеет следующую форму:
М (г + к) = А0 + А1 * к + А2 * к2, где г - текущее время, к - время упреждения. Порядок модели определяется априорно из предварительного анализа временного ряда и законов развития динамики рынка недвижимости, А0,А],А2 - коэффициенты регрессии. Для формирования модели необходимо определить коэффициенты методом парной регрессии, после чего итеративно исчислять ошибку прогнозирования и корректировать значения коэффициентов. Модель корректировки коэффициентов на каждой итерации имеет следующую форму:
У(г +1) = А0 + Ах*(г +1) + А2 *(г +1)2 е(г +1) = аЫ(у (г +1) - У(г +1))
А0 = А0 (г) + А,*(г +1) + А2*(г +1)2 + (1 -в)2* е(г +1), А1 = А1(г +1) + А2 *(г +1)2 + (1 -в)2 *е(г +1) А2 = А2*(г +1)2 + (1 -в)2* е(г +1)
где У(г +1) - прогнозируемое значение в (г+1) периоде, У (г +1) - реальное
значение в (г+1) периоде, е - ошибка модели, в - коэффициент обучения.
Данная модель позволит провести уточнение стоимости недвижимости с
учетом динамики цен.
Проектируемый модуль может быть использован в информационных системах по управлению недвижимостью, в частности, в распределенном реестре, применение искусственных нейронных сетей и математическое моделирование которого представлено в [9,10]. Дальнейшее проектирование модуля будет направлено на совершенствование модели нейронной сети.
Литература
1. Симионова Н. Е., Шеина С.Г. Методы оценки и технической экспертизы недвижимости. М.: ИКЦ "МарТ", 2006. 448 с.
2. Хайкин С. Нейронные сети. Полный курс. 2 изд. М.: Издательский дом "Вильямс", 2006. 1104 с.
3. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия. Телеком, 2002. 382 с.
4. Dean J. Big Data, Data Mining, and Machine Learning. Value Creation for Business Leaders and Practitioners. New Jersey: John Wiley & Sons Limited, 2014. 208 p.
5. Gautschi W. Numerical Analysis. 2 edition. Basel: Birkhäuser, 2012.
615 p.
6. Богуславский И. А. Полиномиальная аппроксимация для нелинейных задач оценивания и управления. 2 изд. М.: Физматлит, 2006. 208 с.
7. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия - Телеком, 2006. 383 с.
8. Munbaev K. Short-Memory Linear Processes and Econometric Applications. New Jersey: John Wiley & Sons Limited, 2011. 451 p.
9. Евсин В. А., Широбокова С.Н., Продан Е.А. Использование технологии распределенных реестров при проектировании информационной системы «Аренда недвижимости» с применением искусственных нейронных сетей // Инженерный вестник Дона, 2018, №1. URL: ivdon.ru/ru/magazine/archive/n1y2018/4655.
10. Евсин В.А., Широбокова С.Н., Евсина В.А., Продан Е.А. Математическое моделирование распределенного реестра в сфере аренды недвижимости как сети массового обслуживания // Инженерный вестник Дона, 2018, №3. URL: ivdon.ru/ru/magazine/archive/n3y2018/5078.
References
1. Simionova N. E., Sheina S.G. Metody otsenki i tekhnicheskoy ekspertizy nedvizhimosti [Methods of evaluation and technical expertise of real estate]. M.: IKTs "MarT", 2006. 448p.
2. Hajkin S. Nejronnye seti. Polnyj kurs. [Neural networks. A Comprehensive Foundation]. 2 izd. M.: Izdatel'skij dom "Vil'jams", 2006. 1104p.
3. Kruglov V.V., Borisov V.V. Iskusstvennye nejronnye seti. Teorija i praktika. [Artificial neural network. Theory and practice.] M.: Gorjachaja linija. Telekom, 2002. 382p.
4. Dean J. Big Data, Data Mining, and Machine Learning. Value Creation for Business Leaders and Practitioners. New Jersey: John Wiley & Sons Limited, 2014. 208p.
5. Gautschi W. Numerical Analysis. 2 edition. Basel: Birkhäuser, 2012.
615p.
6. Boguslavskiy I.A. Polinomial'naya approksimatsiya dlya nelineynykh zadach otsenivaniya i upravleniya [Polynomial approximation for nonlinear estimation and control problems]. 2 izd. M.: Fizmatlit, 2006. 208 p.
7. Rutkovskaja D., Pilin'skij M., Rutkovskij L. Nejronnye seti, geneticheskie algoritmy i nechetkie sistemy. [Neural networks, genetic algorithms and fuzzy systems] M.: Gorjachaja linija. Telekom, 2006. 383 p.
8. Munbaev K. Short-Memory Linear Processes and Econometric Applications. New Jersey: John Wiley & Sons Limited, 2011. 451 p.
9. Evsin V.A., Shirobokova S.N., Prodan Е.А. Inzenernyj vestnik Dona (Rus), 2018, №1. URL: ivdon.ru/ru/magazine/archive/n1y2018/4655.
10. Evsin V.A., Shirobokova S.N., Evsina V.A., Prodan Е.А. Inzenernyj vestnik Dona (Rus), 2018, №3. URL: ivdon.ru/ru/magazine/archive/n3y2018/5078.