Воронежская область, Россия
УДК 004.421 Алгоритмы составления программ
в данной статье предлагается оригинальный детерминированный подход к анализу текстовых файлов, позволяющий решить проблему резкого замедления суммарной скорости обработки данных при увеличении размера файлов свыше 500 Мб. Рассмотрены два варианта такого подхода: непосредственный анализ файла, отображенного на виртуальное адресное пространство процесса с помощью арифметики указателей (как с обычным содержимым памяти) и подход на основе поочередного копирования блоков файла, отображенного в память, в дополнительный буфер оперативной памяти и дальнейший анализ данных уже в буфере. Каждый из рассмотренных вариантов подхода был программно реализован и получены временные характеристики его выполнения на одном и том же наборе данных. Анализ полученных результатов однозначно свидетельствует о преимуществе подхода с использованием проекции файла в память и дополнительной буферизацией при анализе текстовых файлов размером более 500 Мб.
лог-файл, проецируемые в память файлы, указатель, время выполнения, арифметика указателей, анализ текстовых файлов, буферизация, цикл считывания данных, разработка прототипа, кеширование данных, адресное пространство процесса
1. Гарифуллин М.Ф. Обработка текстовой и графической информации / М.Ф. Гарифуллин. - М.: ТЕХНОСФЕРА, 2019. – 174 с.
2. Иванов, Д. А. Анализ эффективности алгоритмов поиска текстовой информации в неоднородных форматах файлов / Д. А. Иванов, Е. А. Иванишин, Д. А. Шевцов // Научная мысль. – 2025. – Т. 25, № 4-1(56). – С. 54-56. – EDN TDMBOK.
3. Коновалов, Г. Г. Оптимизация процесса анализа данных с использованием регулярных выражений / Г. Г. Коновалов // Тенденции развития науки и образования. – 2023. – № 104-14. – С. 50-53. – DOIhttps://doi.org/10.18411/trnio-12-2023-775. – EDN CVMKWH.
4. Никехин А.А. Основы C++ для моделирования и расчетов: учеб. пособие / А.А. Никехин. - СПб: НИУ ИТМО, 2014. – 106 с.
5. Прата С. Язык программирования C++. Лекции и упражнения / С. Прата. — М.: Вильямс, 2012. — 1248 с.
6. Рихтер Дж. Windows для профессионалов. Создание эффективных Win32-разрядных приложений с учетом специфики 64-разрядной версии Windows / Дж. Рихтер. – СПб.: Питер, 2001. – 752 c.
7. Семенов, М. А. Программный проект по синтаксическому анализу текстовых файлов средствами языка с++ / М. А. Семенов, Р. С. Зарипова // Информационные технологии в строительных, социальных и экономических системах. – 2020. – № 3(21). – С. 52-54. – EDN TTIIMK.
8. Стивенс У. Р. Unix. Профессиональное программирование / У. Р. Стивенс, Ст. Раго. – СПб.: Питер, 2025. – 944 c.
9. Мартин Р. Чистая архитектура. Искусство разработки программного обеспечения / Р. Мартин. – СПб.: Питер, 2021. – 352 c.
10. Гулаков В. К. Структуры и алгоритмы обработки многомерных данных: монография / В. К. Гулаков, А. О. Трубаков, Е. О. Трубаков. – СПб.: Лань, 2021. — 356 с.
11. Крошемор М. Алгоритмы обработки текста: 125 задач с решениями / М. Крошемор, Т. Лекрок, В. Риттер. – М.: ДМК Пресс, 2021. – 312 с.
12. Уоррен Г. Алгоритмические трюки для программистов. – М.: Вильямс, 2004. — 288с.
13. Макконнелл С. Совершенный код / С. Макконнелл. — М. : Русская редакция, 2010. — 896 стр.
14. Хортон А. Visual C++ 2005: базовый курс / А. Хортон. - М.: Вильямс, 2007. – 1152 с.
15. Хогенсон Г. С++/CLI: язык Visual C++ для среды .NET / Г. Хогенсон. – М.: Вильямс, 2007. – 464 с.
16. Шарунов, Р. Д. Анализ документов средствами различных инструментов искусственного интеллекта / Р. Д. Шарунов, О. А. Артеменко // Наукоемкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе : Материалы Всероссийской научно-технической конференции: в 2 т., Калуга, 19–21 ноября 2024 года. – Москва: федеральное государственное бюджетное образовательное учреждение высшего образования "Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)", 2025. – С. 284-288. – EDN QDDHPK.
17. Шахомирова, Н. Е. Предложения по модификации системы просмотра и анализа диагностической информации на основе применения гибридной базы данных / Н. Е. Шахомирова, А. В. Шахомиров // Системный анализ и логистика. – 2024. – № S5(43). – С. 60-66. – DOIhttps://doi.org/10.31799/2077-5687-2024-5-60-66. – EDN AHFCYY.



