УДК 519.863.001.63
АДАПТИВНА ТЕХНОЛОГІЯ НЕЧІТКОГО АНАЛІЗУ ДИНАМІКИ РИНКУ НЕРУХОМОСТІ
ТАЗЕТДІНОВ В.А.
Викладаються аспекти визначення ціни об’єкта нерухомості з урахуванням особливостей міста, регіону та макроекономічної ситуації в країні. Здійснюється формалізована постановка задачі прогнозування оцінки об’єкта, що базується на нелінійному аналізі та використанні лінгвістичних змінних. Пропонується як метод розв’язання задачі використовувати штучні нейронні мережі.
1. Вступ
Останні зміни законодавчої бази, пов’язані із регулюванням ринку нерухомості (PH), ще раз засвідчили високу ймовірність ризику успішного функціонування його суб’єктів. Одночасно зросла роль прогнозування і передбачення можливих сценаріїв розвитку подій. Органи державного управління, будівельні організації, бажаючі продати чи купити житло, зацікавлені в одержанні інформаційно-аналітичних послуг. їх сучасний стан залишає бажати кращого, оскільки процедура надання цих послуг базується виключно на статистичному матеріалі без прив’язки до реальної ситуації та її особливостей. В результаті цього процесу приймаються закони та рішення, які не відповідають інтересам держави і народу, оскільки базуються на неповній, можливо кон’юнктурній інформації. їх можливий позитивний ефект перекривається негативними наслідками застосування. Метою дослідження є розробка технології оцінки об’єктів нерухомості (ОН), що включає в себе ідентифікацію функції залежності ціни від внутрішніх факторів та її адаптацію до зовнішніх умов, які враховують особливості міста, регіону та макроекономічну ситуацію в країні.
2. Постановка задачі
Збільшити ефективність процесів прийняття рішень дозволить встановлення закономірностей та тенденцій PH, складовими чого є:
1. Визначення прозорої методики оцінки житла z залежно від його параметрів (параметричне прогнозування), в тому числі на макрорівні (з врахуванням особливостей міста, економічної ситуації в країні тощо), тобто знаходження значення:
Z = F(xbX2,...,xn,уі,...,уpn), (1)
де x;,i = 1,n — параметри житла; уj,j = 1,pn — невідомі коефіцієнти.
2. Пошук і аналіз специфічних закономірностей руху цін в часі та розробка методів прогнозування тенденцій зміни цін (динамічне прогнозування). Формалізація такої задачі виконана в [1].
Перша складова належить відомому класу задач структурної і параметричної ідентифікації з використанням методів інтегро-диференціального числення та економетрики за умови виконання ряду застережень. Задачі аналізу і прогнозування традиційно розв’язувались в межах класичної парадигми [2] та методами самоорганізації моделей [3]. Встановлення адекватних залежностей у випадку специфіки аналізу PH є неможливим при знаходженні розв’язків указаних задач.
3. Адаптивна технологія нечіткого аналізу
Розроблена американським математиком азербайджанського походження Лотфі Заде в 1965 р. [4] теорія нечітких множин здійснила значний вплив на розвиток техніки та розробку методів суб’єктивного аналізу. Базовим її поняттям є лінгвістична змінна, яка буде використана у подальших дослідженнях.
В процесі розв’язання задачі (1) необхідно дотримуватись таких етапів [5]:
1.1. Аналіз стану PH в місті.
1.2. Визначення стадії його розвитку.
1.3. Знаходження основної тенденції зміни цін.
2.1. Аналіз економічної специфіки міста і регіону.
2.2. Визначення тенденції відхилення місцевих цін від столичних.
3.1. Співставлення результатів виконання етапів 1.1 — 2.2, визначення результуючої тенденції.
4.1. Аналіз та прогнозування макроекономічних показників.
4.2. Коригування оцінки (ціни).
Послідовність етапів вказує на присутність адап-тивності у процесі прийняття рішень з визначення ціни ОН (рисунок), яка реалізується за такою технологією.
Коригування
і
і
і
І
І
Столиця
Регіон
бр
Місто
Район (Тт>
(%?
Особливості
ар
Особливості
Особливості
Порівняння цін
Макроекономічна ситуація
Адаптація оцінки ОН
На першому кроці визначаємо параметри житла xi,X2,...,xm, m < n, які безпосередньо визначають
126
РИ, 2004, № 3
ціну житла Z в певному районі міста. Шляхом експертного опитування або порівняльного аналізу знаходять кількість кластерних ніш ОН k (розв’язуємо першу частину задачі кластеризації [1]).
Для кожного кластеру визначаємо еталони E1,E2,...,Ek і формуємо відповідні їм класи C1,C2,...,Ck так, що Ei є Q,i = 1,k . Здійснивши цю процедуру на апріорному наборі даних, кожен наступний ОН відноситимемо до одного із Ci, i = 1,k , розв’язуючи задачу класифікації. Очевидно, що таким чином будуть знайдені і обмеження, які визначають клас:
gi(X‘)<
ai,bi
(2)
де gi = 1, m — функція обмеження на і-й параметр ОН; і = i,k — номер класу. Знаходження залежності (1) трансформується в таку задачу:
знайти залежності:
Zi = Fi(Xi,X2,...,Xm,У1,у2,...,Уpm), i = 1,k , (3)
якщо виконуються обмеження (2) і X- є [0Д] за умови нормованості і стандартизації параметрів ОН. Якщо існує таке i, що g; є аналітичною залежністю і її значення потрібно розраховувати, то не виключено, що [0,1] с [аі,bl ]. В іншому випадку
[aLbi] с І0,1.
Задача ідентифікації (3) в області (2) може бути розв’язана іншими методами. При цьому необхідно врахувати, що функції F;,i = 1,k є нелінійними, а залежності між параметрами X; та Xj, i,j = 1,m апріорно доцільно припускати довільними.
Задачу (3), (4) вважатимемо розв’язаною, якщо ціна реальна та ціна, розрахована за (3), будуть достатньо близькими і виконуватимуться умови (2), тобто для довільного додаткового значення є :
k tk
ЕЕ
i=1j=1
Zij Zij
< є
(4)
*
де ti — кількість ОН в i -му класі; Zj — розрахована ціна j -го ОН, що належить i -му класу.
Водночас ідентифіковані функції Fi, що задовольняють (5), не гарантуватимуть виконання цієї нерівності для нового ОН, тобто функції F; можуть і не мати властивості узагальнення. Тому для їх ідентифікації необхідно ОН в кожному класі розбивати на дві послідовності: навчальну XН і контрольну X К. На точках XН ідентифікуємо залежності (3) і вимагаємо виконання (4), для контрольної послідовності розв’язуємо задачу:
k h;
^ r = EE i=1j=1
Zij Zij
^ min
(5)
де h; — кількість точок в XК для i - го класу. Перевіривши виконання умови
max {є r, є}<Є1, (6)
де Є1 > 0 — задане число, вважаємо задачу визначення ціни ОН розв’язаною. Ефективним методом реалізації такої процедури є застосування штучних нейронних мереж.
Одержана ціна ОН є “чистою” його оцінкою без врахування особливостей зовнішнього природного, штучного та суспільного середовищ. Виконаємо процедуру адаптації оцінки ОН до цих особливостей. Вважатимемо, що ОН лежить в певному районі, характеристики якого описуються лінгвістичними змінними [4, 5. Наприклад:
— відстань Lp ={віддалений, центральний, близький до центральних районів};
—транспортне забезпечення Ьр2 ={дуже погане, погане, не досить добре, добре, дуже добре};
— екологія Lp3={дуже забруднений, забруднений, в задовільному стані, екологічно чистий};
— інфраструктура Lp4 ={ немає, не дуже розвинена, нормальна, добра };
— інші.
Розв’язуючи задачу ідентифікації (3), яка є задачею нелінійної оптимізації, зробили припущення про рівномірний розподіл ОН по районах міста. Саме тому оцінка (3) є середньостатистичною і є ціною типового ОН, що знаходиться в районі, в загальному випадку, із середніми значеннями Lp j = 1,hp ,
де hp — кількість факторів, які характеризують
район. Тому для кожного конкретного ОН існує необхідність в коригуванні.
Наступною є стадія коригування ціни ОН залежно від міста, в якому він знаходиться. Фактори, які з таких позицій характеризують РН, є такими:
— початковий рівень цін Lf ={низький, середній, високий, дуже високий};
—співвідношення первинного та вторинного ринку Lf ={низьке, рівноважне, високе};
— співвідношення попиту і пропозиції Lf ={ < 1:3; 1:2; 1:1; > 1:2};
— активність РН Lf = {пасивний ринок, помірний, стабільний, активний}.
Кожен із регіонів України має свої особливості РН, які визначаються такими факторами:
— економічна ситуація (структура виробництва) Li ={переважають сировинні галузі, орієнтований на виробництво c/г продукції, має розвинений АПК, промисловий регіон, переважають наукомі-сткі виробництва};
РИ, 2004, № 3
127
—доходи населення lB = (найнижчі, низькі, нижче середніх, середні, вище середніх} ;
—демографічні особливості (щільність населення) LB3 ={низька, середня, висока};
— екологічні особливості L 4 ={забруднений, задовільний, добрий, екологічно чистий}.
Порівняння цін ОН із столичними здійснюємо за допомогою коефіцієнта, який відображає відношення середньостатистичних цін на однакове житло, тобто
Kc = Zp/Zc , (7)
де Zp — місцева ціна; Zc — ціна на таке ж житло в столиці.
Макроекономічні умови в країні теж впливають на ціни на житло і вимагають їх корекції. Відповідні фактори є такими:
— рівень інфляції ц} ={<1%; 2-5%, 5-15%; >15%};
— темп девальвації національної валюти відносно евро La2 ={<1%; 2-5%, 5-15%; >15%};
— темп девальвації національної валюти відносно долара США La3 ={<1%; 2-5%, 5-15%; >15%};
— відсотки надання кредитів для купівлі житла L*4 = {низькі, помірні, середні, високі};
— вплив законодавчої бази на розвиток PH La ^негативний, нейтральний, позитивний}.
Враховуючи наведені вище формалізації, задачу ідентифікації (1) перепишемо як задачу знаходження залежності
Z = F(xbX2,...,xm,Lp,LM,La, Kc,у). (8)
Значення перших m факторів є числовими і знаходяться в певній таблиці (базі даних). Для того щоб мати можливість прогнозувати тенденції зміни ціни ОН у залежність (8), введемо ще час:
Z = F(xbX2,...,Xm,Lp,LM,La, Kc,у,t). (9)
Для того щоб мати можливість числового аналізу, здійснимо відображення лінгвістичних змінних у підмножини цілих чисел ZW = {0,l,2,...,w} , де w —
максимальне значення. Так, для змінної справедливим є таке відображення: “низькі”^0, “помірні”^!, “середні”^2, “високі”^3. Тоді множина Z^ є множиною значень функції:
Y = — є [0,1], і є ZW . (10)
w
Відображення (10) є справедливим для елементів векторів Lp,LM,La . Врахувати значення коефіцієнта Kc доцільно з визначенням його динаміки в часі. Для цього необхідно ідентифікувати залежність
Kс = f(t), (11)
тобто встановити, як змінюється відношення місцевих цін та цін в столиці на ОН з часом.
Здійснити ідентифікацію (11) нескладно, враховуючи відомі апріорні дані.
Якщо припустити, що залежність (9) є лінійною, то вона матиме такий вид:
m
Z =Zy ixi +Y pYp +Y MY M +Y aYa +Y cKc (12) i=1
і може бути параметрично ідентифікованою, наприклад, методом найменших квадратів. Оскільки між факторами, що належать до векторів Lp, LM, La , існує таке явище, як мультиколінеарність, то одержання функції (12) безпосередньо, без попередньої підготовки даних, є неможливим. Сумніви у тому, що залежність повинна бути лінійною, та значна трудомісткість апріорної обробки інформації вказують на малу ймовірність використання (12) у практичних задачах. Оскільки на фактори xi, i = 1, m та змінні Lp,LM ,La і Kc ніяких обмежень апріорі не накладено, то необхідно попередньо зробити такі зауваження:
1. Значеннями факторів xi,i = 1,m є і метри, і метри квадратні, і просто числа, причому множина цих значень хоч і обмежена, але досить велика. Інші функції та коефіцієнт Kc мають множиною значень відрізок [0,1 . За таких умов перші параметри уi, i = 1,m , напевне, будуть досить малими числами, а інші — великими. Здійснити порівняльний аналіз впливу того чи іншого фактора на оцінку О Н (12) буде неможливо. Тому для першихm факторів бажано здійснити нормування. Для розв’язку деяких задач необхідно буде здійснювати ще й таке перетворення:
* /m+4 -------
Yi =Y J EYb i = 1 m + 4 . (13)
/ i—1
2. Величини Lp,LM ,La є функціями складових факторів, наприклад: Lp = gp(Lp,Lp,,Lp3,Lp), в лінійному випадку
lp =Y 0 + E Y plp (14)
i=1
і визначаються методом найменших квадратів або його модифікаціями за наявності мультиколінеар-ності у масиві Lp,Lp,,Lp,,L^ .
Лінійні залежності значною мірою спрощують обчислення, але результат їх використання є не досить точним для практичного застосування. Інший метод є точнішим, оскільки його застосування базується не на використанні абсолютних величин, а на обчислених відхиленнях. Алгоритм його є таким:
Крок 1. Вибрати однотипні ОН, наприклад, однокімнатні квартири і для всіх факторів xi, i = 1,m знайти середні значення xi, i = 1,m.
Крок 2. Здійснити перетворення xi ^8* = xi - xi .
Крок 3. Ідентифікувати залежності типу (14) для Lp,LM ,La та функцію (11) і знайти суму
РИ, 2004, № 3
128
S = Lp + LM + La + Kc .
Крок 4. Здійснити параметричну ідентифікацію залежності
m *
ЕліSi + BoS = Z . (15)
i=1
Крок 5. Використати (15) для визначення ціни нового ОН, попередньо виконавши перетворення кроку 2 та знайшовши суму кроку 3.
Структурна і параметрична ідентифікація (9) може бути здійснена також методами самоорганізації моделей, найбільш відомим з яких є метод групового врахування аргументів. Він дозволяє значно збільшити точність ідентифікації та прогнозування за рахунок введення зовнішніх критеріїв. Однак його використання для розв’язку нашої задачі наштовхується на ряд перепон, до яких належать попередня обробка даних через їх різноплановість та нечіткість; значна потужність інформаційної бази, що веде до різкого збільшення кількості обчислень; необхідність використання свободи вибору, який полягає у селекції моделей, що може призвести до втрати значущих факторів.
Крім вказаних труднощів, зауважимо, що одержану за методом найменших квадратів модель майже неможливо використати для аналізу чутливості ціни ОН до зміни екзогенних факторів.
Враховуючи наведене вище, вважаємо оптимальним для ідентифікації (9) та розв’язку задач прогнозування використати штучні нейронні мережі (ШНМ). В більшості випадків ШНМ є вільними від обмежень застосування (за винятком нормування). Крім того, значна кількість відомих парадигм ШНМ дозволяє вибрати найкращу та провести моделювання. Враховуючи достатньо суб’єктивний характер оцінки ОН і, як наслідок, поліекст-ремальність функції оцінки, використаємо пря-мозв’язну ШНМ із стохастичним алгоритмом навчання (САН), поєднаним з алгоритмом зворотного поширення похибки (АЗПП). АЗПП дозволить знаходити локальні мінімуми функції помилки:
1 p q * 2
E(W,л) = — H(Zij -Z*)2 (16)
pqi=ij=i , ()
де W — масив вагових коефіцієнтів ШНМ; ц —
вектор її параметрів та алгоритму навчання; Zy та
*
Zy — таблична та розрахована ШНМ ціна ОН, відповідно; p — кількість навчальних образів (ОН) для ШНМ, q = 1 — кількість нейронів вихідного шару ШНМ. Оскільки АЗПП не гарантує непопадання в локальний оптимум (16), то необхідно в комплексі використати ще й САН. Якщо АЗПП працює в напрямку зменшення значення функції помилки, то САН допускає і погіршення (16), внаслідок чого відбувається вихід ШНМ із локального мінімуму. Точність методу, що базується на використанні ШНМ, є найбільшою серед розглянутих. Водночас він є найбільш важким для реалізації. Але якість результатів прогнозування значно перекриває ці витрати.
4. Висновки
Сучасний стан ринку нерухомості та майже повна відсутність методів його аналізу та прогнозування (за виключенням статистичних [6]) свідчать про необхідність розвитку інформаційно-аналітичних систем, які функціонуватимуть на єдиній інформаційній базі ОН і є актуальними для використання державними органами управління для прогнозування тенденцій та спрямування розвитку PH, будівельними організаціями для планування структури виробництва, агентствами нерухомості для вивчення перспектив PH, а також продавцями та покупцями PH для повного задоволення інформаційних потреб.
Розроблена технологія впроваджена в інформаційно-аналітичній системі “REMA”. Її порівняння з відомими аналогами, такими як автоматизовані системи аналізу ринку нерухомості “Житло”, “Ріел-тор”, “Аналітик” та “Retek Predictive Enterprise Solution”, засвідчує переваги нашої розробки. На це вказує те, що перші три системи, які функціонують на російському ринку, мають орієнтацію на статистичну обробку інформації без аналітичного блоку. Програмне забезпечення компанії RETEK є найбільш потужним, але має високу вартість та орієнтоване на сталу економіку.
Запропонована технологія аналізу PH дозволяє здійснювати аналіз тенденцій, які складаються на ринку, прогнозувати динаміку зміни ціни ОН. Відштовхуючись від середньостатистичних оцінок ОН, розроблено метод їх адаптації до особливостей міста, регіону, столиці та коригування з врахуванням макроекономічної ситуації, що склалася в країні. Встановлено, що оптимальним для цієї процедури є використання лінгвістичних змінних. Розроблено технологію їх формалізації та здійснено порівняльний аналіз методів ідентифікації, який засвідчив оптимальність використання штучних нейронних мереж із стохастичним алгоритмом навчання.
Література: 1. Тазетдінов В.А. Самоорганізація інформаційної бази ринку нерухомості на основі ней-ромережевих технологій // АСУ и приборы автоматики. 2004. 2. Лук ’яненко I., Краснікова Л. Економетрика. К.: Знання, 1998. 484с. 3. Ивахненко АЛ. Индуктивный метод самоорганизации моделей сложных систем. К.: Наук. думка, 1982. 216с. 4. Беллман Р, Лотфи Заде. Принятие решений в расплывчатых условиях //В сб. “Вопросы анализа и процедуры принятия решений”. М.: Мир, 1976. С. 172-215. 5. Зайченко Ю.П. Многокритериальные задачи принятия решений в нечетких условиях и методы их решения // Системні дослідження та інформаційні технології. 2002. №2. С.53-62. 6. Стерник Г.М. Методические рекомендации по анализу рынка недвижимости. М.: РГР, 1999. 62с.
Надійшла до редколегії 03.03.2004
Рецензент: д-р техн. наук, проф. Златкін А.А.
Тазетдінов Валерій Абударович, старший викладач кафедри комп’ютерних систем Черкаського державного технологічного університету. Наукові інтереси: математичні методи аналізу ринку нерухомості, нейронні мережі. Адреса: Україна, 18006, Черкаси, бул. Шевченка, 460, тел.: (0472) 43-74-28.
РИ, 2004, № 3
129