Tula, Tula, Russian Federation
GRNTI 06.73 Финансовая наука. Денежные и налоговые теории. Кредитно-финансовые институты
OKSO 38.04.08 Финансы и кредит
BBK 6505 Управление экономикой. Экономическая статистика. Учет. Экономический анализ
TBK 7781 Финансы. Денежное обращение. Кредит
In this article, in order to optimize the economic policy in the field of mortgagehousing lending, the clustering of Russian regions by the most optimal method was carried out and analyzed. The main limitations arising from the application of the most popular k-means clustering algorithm for analyzing mortgages are considered and ways to correct them are suggested. The regions were grouped using clustering algorithms using medians and medoids that are more resistant to outliers. A comparison was made of the results of the k-means, k-medians and k-medoids algorithms, and the optimal number of groups of regions with similar indicators in the field of mortgage lending and their relevant regions representatives were found. A hierarchical clustering algorithm based on the Ward method was used, the result of which was the use of five mortgage clusters in Russia. The study of the characteristics of these groups of regions will help in creating a mortgage policy that takes into account the peculiarities of the regions of Russia. All calculations were made in the R programming language; graphics were created in the Rstudio development environment.
mortgage, mortgage lending, clustering, k-means, k-medoids, k- medians, hierarchical clustering, Ward’s method.
В настоящее время в России необходимость совершенствования механизма ипотечного кредитования в связи с растущими потребностями населения в доступном жилье остается злободневной и актуальной [1].
Важным этапом развития ипотечного кредитования в России является создание дифференцированных для разных ипотечных групп регионов программ развития ипотечного кредитования, учитывающих особенности регионов страны в области ипотеки, жилищного строительства и развития экономики [2, 3]. Следовательно, должны быть выявлены факторы, оказывающие существенное влияние на объемы ипотечного кредитования в регионах и, используя алгоритмы кластеризации, определены группы регионов со схожими показателями, называемые кластерами [4]. Самым популярным и распространенным алгоритмом кластеризации является алгоритм k-means [5–7], который стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров, называемых центроидами. Однако, при использовании данного алгоритма можно столкнуться с рядом ограничений:
•• количество кластеров выбирается априорно;
•• алгоритм гарантирует достижение локального, но не глобального минимума;
•• факторы оказывают одинаковое влияние на кластеризацию;
В зависимости от области применения алгоритма кластеризации, некоторые из данных ограничений могут считаться несущественными. Следовательно, необходимо рассмотреть проблемы применения алгоритма k-means с учетом специфики ипотечного кредитования в России. Во-первых, это необходимость априорного выбора количества кластеров, которая решается путем подсчета общей внутрикластерной суммы квадратов J(Θ) для различного числа групп регионов [4, с. 77]. Подобный подход называется Elbow method. При использовании алгоритма k-means число кластеров увеличивается до тех пор, пока происходит существенное снижение внутрикластерной суммы. Также, в качестве альтернативы алгоритмам с априорным выбором числа кластеров рассматриваются алгоритмы иерархической кластеризации, при использовании которых не требуется выбор априорного количества кластеров.
1. Bessonova O. Zhilischnyy vopros v Rossii: Kakaya model' vyvedet iz krizisa [Tekst] // Voprosy ekonomiki. - 2015. - № 8. - S. 149-158.
2. Korosteleva T.S. Ipotechnye krizisy sovremennoy Rossii: regional'nye osobennosti i politika preodoleniya [Tekst] // Regional'naya ekonomika: teoriya i praktika. - 2016. - №5. - S. 137-150.
3. Kobzev A.Yu. Statisticheskoe modelirovanie sistemy ipotechnogo zhilischnogo kreditovaniya v regionah Rossiyskoy Federacii na panel'nyh dannyh [Tekst] // Intellekt. Innovacii. Investicii. - 2016. - №. 11. - S. 23-26.
4. Chukanov A.I. Issledovanie neravnomernosti razvitiya ipotechnogo zhilischnogo kreditovaniya v regionah Rossii [Tekst] // Nauchnye zapiski OrelGiET. - 2017. - № 3 (21). - S. 71-81.
5. Steinhaus H. Sur la division des corp materiels en parties // Bull. Acad. Polon. Sci. 1956. 804. pp. 801.
6. Lloyd S. Least squares quantization in PCM //IEEE transactions on information theory. 1982. 2. pp. 129-137.
7. MacQueen J. et al. Some methods for classification and analysis of multivariate observations. Proceedings of the fifth Berkeley symposium on mathematical statistics and probability. 1967. T. 1. №. 14. pp. 281-297.
8. Flah P. Mashinnoe obuchenie. Nauka i iskusstvo postroeniya algoritmov, kotorye izvlekayu znaniya iz dannyh [Tekst]. - M.: DMK Press. - 2015. - 400 s.
9. Jain A.K., Dubes R.C. Algorithms for Clustering Data, Pearson College Div., 1988.
10. Bradley P.S., Mangasarian O.L., Street W.N. Clustering via Concave Minimization. Advances in Neural Information Processing Systems. 1997. 9. pp. 368-374.
11. Pokazateli rynka zhilischnogo (ipotechnogo zhilischnogo) kreditovaniya [Elektronnyy resurs]. - URL: http://www.cbr.ru/statistics/?Prtid=ipoteka (data obrascheniya 15.11.2018)
12. Informacionno-statisticheskaya sistema dannyh po rynku zhil'ya i ipoteki v Rossii [Elektronnyy resurs]. - URL: https://xn--d1aqf.xn--p1ai/about/analytics/statistics/ (data obrascheniya 15.11.2018)
13. Rosstat [Elektronnyy resurs]. - URL: http://www.gks.ru (data obrascheniya 15.11.2018)
14. Srednedushevye denezhnye dohody po sub'ektam Rossiyskoy Federacii [Elektronnyy resurs]. - URL: http:// www.gks.ru/free_doc/new_site/population/urov/urov_11sub.htm (data obrascheniya 15.11.2018)
15. Otdel'nye pokazateli po kreditam v rublyah, predostavlennym fizicheskim licam-rezidentam [Elektronnyy resurs]. - URL: http://www.cbr.ru/statistics/UDStat.aspx?Month=01&Year=2017&TblID=4-6 (data obrascheniya 15.11.2018)
16. Kaufman L., Rousseeuw P.J. Clustering by means of medoids. North-Holland. 1987. pp. 405-416.
17. Kaufman L., Rousseeuw P.J. Finding groups in data: an introduction to cluster analysis. Wiley Series in Probability and Mathematical Statistics. 1990. 34. pp. 111-112.
18. Vvedenie v statisticheskoe obuchenie s primerami na yazyke R [Tekst] / G. Dzheyms i dr. - M.: DMK Press. - 2016. - 450 s.
19. Cypina Yu.S., Cypin A.P. Statisticheskie metody v izuchenii ipotechnogo zhilischnogo kreditovaniya Rossii [Tekst] // Novyy universitet. - 2012. - № 6. - S. 10-13. - (Ekonomika i pravo).