КЛАСТЕРИЗАЦИЯ РЕГИОНОВ РОССИИ ПО УРОВНЮ РАЗВИТИЯ ИПОТЕЧНОГО КРЕДИТОВАНИЯ
Аннотация и ключевые слова
Аннотация (русский):
В данной статье для усовершенствования экономической политики в области ипотечного-жилищного кредитования была проведена и проанализирована кластеризация регионов России наиболее оптимальным методом. Рассмотрены основные ограничения, возникающие при применении наиболее популярного алгоритма k-means для анализа ипотечных кластеров в России и предложены пути их исправления. Произведена группировка регионов при помощи алгоритмов кластеризации, использующих медианы и медоиды, являющихся более устойчивыми к выбросам. Проведено сравнение результатов работы алгоритмов k-means, k-medians и k-medoids, и выявлено оптимальное число групп регионов со схожими показателями в области ипотечного кредитования и их релевантные регионы представители. Применен иерархический алгоритм кластеризации на основе метода Варда, результатом использования которого были пять ипотечных кластеров в России. Исследование особенностей данных групп регионов поможет в создании дифференцированных эконометрических моделей ипотечного кредитования и развитии ипотечной политики, учитывающей особенности регионов России. Все вычисления были произведены на языке программирования R, графики созданы в среде разработки Rstudio.

Ключевые слова:
ипотека, ипотечное жилищное кредитования, кластеризация, k-means, k-medoids, k-medians, иерархическая кластеризация, метод Варда.
Текст

В настоящее время в России необходимость совершенствования механизма ипотечного кредитования в связи с растущими потребностями населения в доступном жилье остается злободневной и актуальной [1].
Важным этапом развития ипотечного кредитования в России является создание дифференцированных для разных ипотечных групп регионов программ развития ипотечного кредитования, учитывающих особенности регионов страны в области ипотеки, жилищного строительства и развития экономики [2, 3]. Следовательно, должны быть выявлены факторы, оказывающие существенное влияние на объемы ипотечного кредитования в регионах и, используя алгоритмы кластеризации, определены группы регионов со схожими показателями, называемые кластерами [4]. Самым популярным и распространенным алгоритмом кластеризации является алгоритм k-means [5–7], который стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров, называемых центроидами. Однако, при использовании данного алгоритма можно столкнуться с рядом ограничений:
•• количество кластеров выбирается априорно;
•• алгоритм гарантирует достижение локального, но не глобального минимума;
•• факторы оказывают одинаковое влияние на кластеризацию;
В зависимости от области применения алгоритма кластеризации, некоторые из данных ограничений могут считаться несущественными. Следовательно, необходимо рассмотреть проблемы применения алгоритма k-means с учетом специфики ипотечного кредитования в России. Во-первых, это необходимость априорного выбора количества кластеров, которая решается путем подсчета общей внутрикластерной суммы квадратов J(Θ) для различного числа групп регионов [4, с. 77]. Подобный подход называется Elbow method. При использовании алгоритма k-means число кластеров увеличивается до тех пор, пока происходит существенное снижение внутрикластерной суммы. Также, в качестве альтернативы алгоритмам с априорным выбором числа кластеров рассматриваются алгоритмы иерархической кластеризации, при использовании которых не требуется выбор априорного количества кластеров.

Список литературы

1. Бессонова О. Жилищный вопрос в России: Какая модель выведет из кризиса [Текст] // Вопросы экономики. - 2015. - № 8. - С. 149-158.

2. Коростелева Т.С. Ипотечные кризисы современной России: региональные особенности и политика преодоления [Текст] // Региональная экономика: теория и практика. - 2016. - №5. - С. 137-150.

3. Кобзев А.Ю. Статистическое моделирование системы ипотечного жилищного кредитования в регионах Российской Федерации на панельных данных [Текст] // Интеллект. Инновации. Инвестиции. - 2016. - №. 11. - С. 23-26.

4. Чуканов А.И. Исследование неравномерности развития ипотечного жилищного кредитования в регионах России [Текст] // Научные записки ОрелГиЭТ. - 2017. - № 3 (21). - С. 71-81.

5. Steinhaus H. Sur la division des corp materiels en parties // Bull. Acad. Polon. Sci. 1956. 804. pp. 801.

6. Lloyd S. Least squares quantization in PCM //IEEE transactions on information theory. 1982. 2. pp. 129-137.

7. MacQueen J. et al. Some methods for classification and analysis of multivariate observations. Proceedings of the fifth Berkeley symposium on mathematical statistics and probability. 1967. Т. 1. №. 14. pp. 281-297.

8. Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекаю знания из данных [Текст]. - М.: ДМК Пресс. - 2015. - 400 с.

9. Jain A.K., Dubes R.C. Algorithms for Clustering Data, Pearson College Div., 1988.

10. Bradley P.S., Mangasarian O.L., Street W.N. Clustering via Concave Minimization. Advances in Neural Information Processing Systems. 1997. 9. pp. 368-374.

11. Показатели рынка жилищного (ипотечного жилищного) кредитования [Электронный ресурс]. - URL: http://www.cbr.ru/statistics/?Prtid=ipoteka (дата обращения 15.11.2018)

12. Информационно-статистическая система данных по рынку жилья и ипотеки в России [Электронный ресурс]. - URL: https://xn--d1aqf.xn--p1ai/about/analytics/statistics/ (дата обращения 15.11.2018)

13. Росстат [Электронный ресурс]. - URL: http://www.gks.ru (дата обращения 15.11.2018)

14. Среднедушевые денежные доходы по субъектам Российской Федерации [Электронный ресурс]. - URL: http:// www.gks.ru/free_doc/new_site/population/urov/urov_11sub.htm (дата обращения 15.11.2018)

15. Отдельные показатели по кредитам в рублях, предоставленным физическим лицам-резидентам [Электронный ресурс]. - URL: http://www.cbr.ru/statistics/UDStat.aspx?Month=01&Year=2017&TblID=4-6 (дата обращения 15.11.2018)

16. Kaufman L., Rousseeuw P.J. Clustering by means of medoids. North-Holland. 1987. pp. 405-416.

17. Kaufman L., Rousseeuw P.J. Finding groups in data: an introduction to cluster analysis. Wiley Series in Probability and Mathematical Statistics. 1990. 34. pp. 111-112.

18. Введение в статистическое обучение с примерами на языке R [Текст] / Г. Джеймс и др. - М.: ДМК Пресс. - 2016. - 450 с.

19. Цыпина Ю.С., Цыпин А.П. Статистические методы в изучении ипотечного жилищного кредитования России [Текст] // Новый университет. - 2012. - № 6. - С. 10-13. - (Экономика и право).

Войти или Создать
* Забыли пароль?