ПРИМЕНЕНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ И МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ДЛЯ АНАЛИЗА БОЛЬШИХ ДАННЫХ
Аннотация и ключевые слова
Аннотация:
В условиях стремительного роста объемов информации проблема анализа больших данных (Big Data) приобретает особую актуальность. В данной статье исследуется симбиоз методов машинного обучения (МО) и фундаментальных математических моделей как основа для эффективного извлечения знаний из больших массивов информации. Цель работы — разработка и сравнительная оценка комплекса методов МО, подкрепленных математическим аппаратом, для задач классификации и кластеризации. На основе эксперимента с использованием набора данных UCI Machine Learning Repository проведен сравнительный анализ алгоритмов, включая логистическую регрессию, метод опорных векторов (SVM), случайный лес и многослойный перцептрон. Результаты показывают, что нейронные сети (Accuracy: 0.92, F1-мера: 0.89) и ансамблевые методы демонстрируют превосходство над классическими алгоритмами при работе с разнородными данными. Подчеркивается, что математические модели из областей оптимизации, линейной алгебры и теории вероятностей являются неотъемлемым фундаментом, обеспечивающим корректность и эффективность алгоритмов МО. Делается вывод о целесообразности комплексного подхода, объединяющего вычислительную мощь МО и строгость математических моделей.

Ключевые слова:
большие данные, машинное обучение, математические модели, классификация, кластеризация, нейронные сети, оптимизация
Список литературы

1. Chen, M., Mao, S., & Liu, Y. Big Data: A Survey. Mobile Networks and Applications. 2019. №19(2). Pp. 171–209. DOI: https://doi.org/10.1007/s11036-013-0489-0

2. Deisenroth, M. P., Faisal, A. A. & Ong, C. S. Mathematics for Machine Learning. Cambridge University Press. 2020. 398 p. DOI: https://doi.org/10.1017/9781108679930

3. Bottou, L., Curtis, F. E., & Nocedal, J. Optimization Methods for Large-Scale Machine Learning. SIAM Review. 2018. № 60(2). Pp. 223–311. DOI: https://doi.org/10.1137/16M1080173

4. Исаков, Р. Ж., Абдыкалыков, А. А. Возможности применения искусственного интеллекта в диагностике заболеваний в Кыргызстане. Вестник Кыргызско-Российского Славянского университета. 2022. № 22(5). С. 124–130.

5. Murphy, K. P. Probabilistic Machine Learning: An Introduction. MIT Press. 2022. 864 p.

6. Prokhorenkova, L., Gusev, G., Vorobev, A., Dorogush, A. V., & Gulin, A. CatBoost: unbiased boosting with categorical features. Advances in Neural Information Processing Systems. 2018. P. 31.

7. Goodfellow I., Bengio, Y. & Courville, A. Deep Learning. MIT Press. 2016. 800 p.

8. Dua, D. and Graff, C. UCI Machine Learning Repository. Irvine, CA: University of California, School of Information and Computer Science. 2019. [Электронный ресурс]. URL: http://archive.ics.uci.edu/ml

Войти или Создать
* Забыли пароль?