Обзор методов и средств интеллектуального анализа данных при оценке стоимости жилой недвижимости

Overview of data mining methods and tools when assessing the value of residential property

Рынок недвижимости России продолжает активно развиваться, и, учитывая огромное количество как внутренних, так и внешних факторов, влияющих на стоимость недвижимых объектов, вопрос оценки жилого имущества играет ключевую роль в сделке купли-продажи. Без этой процедуры узнать точную стоимость жилья было бы проблематично.

Актуальность данной работы заключается в помощи оценщикам, владельцам и потенциальным собственникам жилой недвижимости в формировании корректной стоимости жилья.

Целью настоящего исследования является определение наиболее точных и перспективных методов и средств анализа данных для оценки стоимости жилой недвижимости.

Стоимость жилой недвижимости складывается из многих факторов и обычно производится на основе статистических данных. При этом могут использоваться как классические методы математической статистики, так и современные подходы интеллектуального анализа данных.

Среди первых наиболее популярны методы, основанные на анализе статистических характеристик нормального закона распределения, и корреляционно-регрессионный анализ. Несомненным преимуществом указанных методов является их простота, однако они не обладают необходимой гибкостью за пределами ограниченных условий. К ограничениям данных методов относится также и невозможность учета категориальных данных (например, район, этаж, тип домов), существенно влияющих на точность результата оценки.

В этом отношении весьма перспективны методы теории интеллектуального интеллекта и интеллектуального анализа данных, особое место среди которых занимает нечеткая логика и нейронные сети Кратко охарактеризуем данные направления так: нечеткая логика призвана моделировать процессы рассуждений максимально приближено к тому, как это делает человек, а искусственные нейронные сети представляют некий упрощенный аналог устройства и функционирования мозга человека.

Методы интеллектуального анализа данных (ИАД) характеризуются определенными свойствами, которые могут быть определяющими при выборе метода анализа данных. Методы можно сравнивать между собой, оценивая характеристики их свойств.

Основные свойства и характеристики методов ИАД: точность, масштабируемость, интерпретируемость, проверяемость, трудоемкость, гибкость, быстрота и популярность.

В таблице 1 приведена сравнительная характеристика некоторых распространенных методов. Оценка каждой из характеристик проведена следующими категориями, в порядке возрастания: 1 – чрезвычайно низкая, 2 – очень низкая, 3 – низкая/нейтральная, 4 – нейтральная/низкая, 5 – нейтральная, 6 – нейтральная/высокая, 7 – высокая, 8 – очень высокая.

Таблица 1 – Сравнительная характеристика методов ИАД

Методы

Точность

Масштабируемость

Интерпретируемость

Пригодность к использованию

Трудоемкость

Разносторонность

Быстрота

Популярность

Линейная регрессия

5

7

6

7

5

5

7

3

Нейронные сети

7

6

6

6

4

7

7

7

Деревья решений

3

4

4

5

4

6

2

5

Методы визуализации

4

7

3

6

7

5

5

5

k-ближайшего соседа

3

2

7

5

3

3

7

3

Нечёткая логика

5

4

7

7

8

3

1

7

 

Как видно из рассмотренной таблицы, каждый из методов имеет свои сильные и слабые стороны. Но ни один метод, какой бы не была его оценка с точки зрения присущих ему характеристик, не может обеспечить решение всего спектра задач Data Mining. Для определения наиболее подходящего был произведён анализ по методу иерархий (рис. 1).

  • А1 – Линейная регрессия.
  • А2 – Нейронные сети.
  • А3 – Деревья решений.
  • А4 – Нечёткая логика.
  • А5 – k-ближайшего соседа.
  • А6 – Методы визуализации.

 

Рисунок 1 – Выбор методов ИАД по методу иерархий

А1 = 0,17*0,31+0,21*0,12+0,19*0,17+0,16*0,14+0,17*0,07+0,1*0,18 = 0,165.

А2 = 0,24*0,31+0,18*0,12+0,17*0,17+0,13*0,14+0,24*0,07+0,23*0,18 = 0,203.

А3 = 0,1*0,31+0,12*0,12+0,14*0,17+0,13*0,14+0,21*0,07+0,17*0,18 = 0,134.

А4 = 0,17*0,31+0,12*0,12+0,19*0,17+0,26*0,14+0,1*0,07+0,23*0,18 = 0,188.

А5 = 0,1*0,31+0,06*0,12+0,14*0,17+0,1*0,14+0,1*0,07+0,1*0,18 = 0,102.

А6 = 0,14*0,31+0,21*0,12+0,17*0,17+0,23*0,14+0,17*0,07+0,17*0,18 =0,171.

Исходя из полученных данных видно, что наиболее перспективными для решения поставленной задачи являются методы нечёткой логики и нейронные сети.

 

Список литературы:

  1. Курзаева Л.В. Нечеткая логика и нейронные сети: учебное пособие. Изд-во Магнитогорск. гос. техн. ун-та им. Г.И. Носова, 2016. 113 с.