Платформа «Агрориск»Управление рисками в АПК

Статья журнала

АНАЛИЗ РЫНКА НЕДВИЖИМОСТИ Г. УЛАН-УДЭ И ПОСТРОЕНИЕ ПРЕДИКТИВНЫХ МОДЕЛЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ ЦЕНЫ

Цитирование

АЙО , И.У. АНАЛИЗ РЫНКА НЕДВИЖИМОСТИ Г. УЛАН-УДЭ И ПОСТРОЕНИЕ ПРЕДИКТИВНЫХ МОДЕЛЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ ЦЕНЫ / И.У. АЙО // Управление рисками в АПК. – 2024. – № S3 (53). – C. -. – .

Аннотация

В статье разработана модель с использованием передовых методов анализа данных для обеспечения надежных прогнозов и выявления ключевых факторов, влияющих на рынок жилья, тем самым внося вклад в развитие знаний и предоставляя инструменты для принятия обоснованных решений в этом секторе.

Ключевые слова

модели множественной регрессии, предварительный анализ и контроль, модель градиентного бустинга

Введение

Данное исследование направлено на повышение точности прогнозирования цен на жилье путем анализа рынка жилья и построения прогностических моделей [1,2]. Цель исследования - разработать эффективную модель с использованием передовых методов анализа данных для обеспечения надежных прогнозов и выявления ключевых факторов, влияющих на рынок жилья, тем самым внося вклад в развитие знаний и предоставляя инструменты для принятия обоснованных решений в этом секторе. Задачи: Разработка точной прогнозной модели для цен на жилье с использованием передовых методов анализа данных Right-click and choose “Copy” Выявление ключевых факторов на рынке недвижимости и построение прогностической модели для понимания тенденций и составления точных прогнозов поведения в будущем. С помощью методов программирования и статистического анализа будет разработана прогностическая модель, после чего будет проведена строгая проверка модели для обеспечения ее точности и надежности. Анализ рынка недвижимости и построение предиктивных моделей будет проводиться на данных с сайта cian.ru. Для выгрузки будет использоваться библиотека для Python – cianparser. Выгрузим все объявления в г. Улан-Удэ с продажей квартир 1-5 комнат. После выгрузки получили набор данных, состоящий из 1162 строк и 18 столбцов. Распределение значений цены имеет форму нормального распределения. Проведем аналитическую группировку значений цены недвижимости на ценовые интервалы с шагом: (макс цена – мин цена)/кол-во значений. Можем сделать вывод, что большая часть квартир на рынке имеют цену в диапазоне от 4 до 8 млн. руб.

Методология

Рис. 1 - Гистограмма распределения значений цены недвижимости на ценовые интервалы Исследуем набор данных, который лежит внутри моды гистограммы, построенной выше. Построение модели градиентного бустинга (XGBoost) для предсказания уровня цен Из изначального набора данных были отобраны столбцы, которые могут быть регрессорами для значения цены в дальнейшей модели. Также значения района были заменены числовыми значениями, для более корректного построения модели. Значения цены и количества квадратных метров имеют высокую корреляцию. Что может говорить о наибольшей значимости показателя квадратных метров в построении модели. Построим точечный график для визуализации данной зависимости. Помимо сильной связи, можем сделать вывод о линейном виде корреляции. Далее обучим модель XGBoost на сформированном наборе данных. Зависимой переменной является цена недвижимости. Переменные, которые будут ее обьяснять: • Этаж • Количество этажей в доме • Количество комнат • Количество квадратных метров • Район Метрика качества модели RMSLE = 0.18021 Данный результат говорит об относительно высокой точности модели. Проверим точность модели, с помощью точечного графика, который отображает расхождения реальных и прогнозных значениях.

Результаты

Рис. 2 – Сравнение реальных и предсказанных значений цен недвижимости

Результаты

Значения модели со 100% точностью будут лежать ровно на пунктирной линии. Полученные значения находятся довольно близко к пунктирной линии

Обсуждение

Значения модели со 100% точностью будут лежать ровно на пунктирной линии. Полученные значения находятся довольно близко к пунктирной линии, что говорит о точности модели и минимальном отклонении прогнозного значения от реального.

Обсуждение

что говорит о точности модели

Выводы

и минимальном отклонении прогнозного значения от реального.

Источники

  1. Библиографический список:
  2. 1. Цифровые технологии анализа данных в сельском хозяйстве / А. П. Зинченко, А. В. Уколова, В. В. Демичев [и др.]. – Москва : «Научный консультант», 2022. – 260 с. – ISBN 978-5-907477-96-4.
  3. 3. Sustainable development of agricultural enterprises with an active environmental stance: analysis of interorganizational management accounting / L. I. Khoruzhy, Yu. N. Katkov, E. A. Katkova [et al.] // Journal of Law and Sustainable Development. – 2023. – Vol. 11, No. 3. – P. 0386. – DOI 10.55908/sdgs.v11i3.386.