г. Ош, Россия
УДК 004 Информационные технологии. Компьютерные технологии. Теория вычислительных машин и систем
УДК 62 Инженерное дело. Техника в целом. Транспорт
ГРНТИ 20.00 ИНФОРМАТИКА
ГРНТИ 20.15 Организация информационной деятельности
ОКСО 02.07.01 Компьютерные и информационные науки
ББК 745 Профессиональное и специальное образование
ТБК 5 ПРИКЛАДНЫЕ НАУКИ. ТЕХНИКА. МЕДИЦИНА
ТБК 51 Информатика. Вычислительная техника
BISAC COM COMPUTERS
В условиях стремительного роста объемов информации проблема анализа больших данных (Big Data) приобретает особую актуальность. В данной статье исследуется симбиоз методов машинного обучения (МО) и фундаментальных математических моделей как основа для эффективного извлечения знаний из больших массивов информации. Цель работы — разработка и сравнительная оценка комплекса методов МО, подкрепленных математическим аппаратом, для задач классификации и кластеризации. На основе эксперимента с использованием набора данных UCI Machine Learning Repository проведен сравнительный анализ алгоритмов, включая логистическую регрессию, метод опорных векторов (SVM), случайный лес и многослойный перцептрон. Результаты показывают, что нейронные сети (Accuracy: 0.92, F1-мера: 0.89) и ансамблевые методы демонстрируют превосходство над классическими алгоритмами при работе с разнородными данными. Подчеркивается, что математические модели из областей оптимизации, линейной алгебры и теории вероятностей являются неотъемлемым фундаментом, обеспечивающим корректность и эффективность алгоритмов МО. Делается вывод о целесообразности комплексного подхода, объединяющего вычислительную мощь МО и строгость математических моделей.
большие данные, машинное обучение, математические модели, классификация, кластеризация, нейронные сети, оптимизация
1. Chen, M., Mao, S., & Liu, Y. Big Data: A Survey. Mobile Networks and Applications. 2019. №19(2). Pp. 171–209. DOI: https://doi.org/10.1007/s11036-013-0489-0
2. Deisenroth, M. P., Faisal, A. A. & Ong, C. S. Mathematics for Machine Learning. Cambridge University Press. 2020. 398 p. DOI: https://doi.org/10.1017/9781108679930
3. Bottou, L., Curtis, F. E., & Nocedal, J. Optimization Methods for Large-Scale Machine Learning. SIAM Review. 2018. № 60(2). Pp. 223–311. DOI: https://doi.org/10.1137/16M1080173
4. Исаков, Р. Ж., Абдыкалыков, А. А. Возможности применения искусственного интеллекта в диагностике заболеваний в Кыргызстане. Вестник Кыргызско-Российского Славянского университета. 2022. № 22(5). С. 124–130.
5. Murphy, K. P. Probabilistic Machine Learning: An Introduction. MIT Press. 2022. 864 p.
6. Prokhorenkova, L., Gusev, G., Vorobev, A., Dorogush, A. V., & Gulin, A. CatBoost: unbiased boosting with categorical features. Advances in Neural Information Processing Systems. 2018. P. 31.
7. Goodfellow I., Bengio, Y. & Courville, A. Deep Learning. MIT Press. 2016. 800 p.
8. Dua, D. and Graff, C. UCI Machine Learning Repository. Irvine, CA: University of California, School of Information and Computer Science. 2019. [Электронный ресурс]. URL: http://archive.ics.uci.edu/ml



