<?xml version="1.0"?>
<!DOCTYPE article
PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.4 20190208//EN"
       "JATS-journalpublishing1.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" article-type="research-article" dtd-version="1.4" xml:lang="en">
 <front>
  <journal-meta>
   <journal-id journal-id-type="publisher-id">Modeling of systems and processes</journal-id>
   <journal-title-group>
    <journal-title xml:lang="en">Modeling of systems and processes</journal-title>
    <trans-title-group xml:lang="ru">
     <trans-title>Моделирование систем и процессов</trans-title>
    </trans-title-group>
   </journal-title-group>
   <issn publication-format="print">2219-0767</issn>
  </journal-meta>
  <article-meta>
   <article-id pub-id-type="publisher-id">120316</article-id>
   <article-id pub-id-type="doi">10.12737/2219-0767-2026-19-1-7-13</article-id>
   <article-categories>
    <subj-group subj-group-type="toc-heading" xml:lang="ru">
     <subject>Технические науки</subject>
    </subj-group>
    <subj-group subj-group-type="toc-heading" xml:lang="en">
     <subject></subject>
    </subj-group>
    <subj-group>
     <subject>Технические науки</subject>
    </subj-group>
   </article-categories>
   <title-group>
    <article-title xml:lang="en">Software implementation of a deterministic approach to analyzing large files</article-title>
    <trans-title-group xml:lang="ru">
     <trans-title>Программная реализация детерминированного подхода к анализу файлов большого размера</trans-title>
    </trans-title-group>
   </title-group>
   <contrib-group content-type="authors">
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Акинин</surname>
       <given-names>Артем Анатольевич</given-names>
      </name>
      <name xml:lang="en">
       <surname>Akinin</surname>
       <given-names>Artem Anatolyevich</given-names>
      </name>
     </name-alternatives>
     <xref ref-type="aff" rid="aff-1"/>
    </contrib>
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Акинина</surname>
       <given-names>Юлия Сергеевна</given-names>
      </name>
      <name xml:lang="en">
       <surname>Akinina</surname>
       <given-names>Yuliya Sergeevna</given-names>
      </name>
     </name-alternatives>
     <xref ref-type="aff" rid="aff-2"/>
    </contrib>
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Колосов</surname>
       <given-names>Р. Г.</given-names>
      </name>
      <name xml:lang="en">
       <surname>Kolosov</surname>
       <given-names>R. G.</given-names>
      </name>
     </name-alternatives>
    </contrib>
   </contrib-group>
   <aff-alternatives id="aff-1">
    <aff>
     <institution xml:lang="ru">МИРЭА - Российский технологический университет</institution>
     <country>Россия</country>
    </aff>
    <aff>
     <institution xml:lang="en">МИРЭА - Российский технологический университет</institution>
     <country>Russian Federation</country>
    </aff>
   </aff-alternatives>
   <aff-alternatives id="aff-2">
    <aff>
     <institution xml:lang="ru">Воронежский государственный технический университет</institution>
    </aff>
    <aff>
     <institution xml:lang="en">Voronezh State Technical University</institution>
    </aff>
   </aff-alternatives>
   <pub-date publication-format="print" date-type="pub" iso-8601-date="2026-04-24T23:48:07+03:00">
    <day>24</day>
    <month>04</month>
    <year>2026</year>
   </pub-date>
   <pub-date publication-format="electronic" date-type="pub" iso-8601-date="2026-04-24T23:48:07+03:00">
    <day>24</day>
    <month>04</month>
    <year>2026</year>
   </pub-date>
   <volume>19</volume>
   <issue>1</issue>
   <fpage>7</fpage>
   <lpage>13</lpage>
   <history>
    <date date-type="received" iso-8601-date="2026-04-08T00:00:00+03:00">
     <day>08</day>
     <month>04</month>
     <year>2026</year>
    </date>
   </history>
   <self-uri xlink:href="https://naukaru.ru/en/nauka/article/120316/view">https://naukaru.ru/en/nauka/article/120316/view</self-uri>
   <abstract xml:lang="ru">
    <p>в данной статье предлагается оригинальный детерминированный подход к анализу текстовых файлов, позволяющий решить проблему резкого замедления суммарной скорости обработки данных при увеличении размера файлов свыше 500 Мб. Рассмотрены два варианта такого подхода: непосредственный анализ файла, отображенного на виртуальное адресное пространство процесса с помощью арифметики указателей (как с обычным содержимым памяти) и подход на основе поочередного копирования блоков файла, отображенного в память, в дополнительный буфер оперативной памяти и дальнейший анализ данных уже в буфере. Каждый из рассмотренных вариантов подхода был программно реализован и получены временные характеристики его выполнения на одном и том же наборе данных. Анализ полученных результатов однозначно свидетельствует о преимуществе подхода с использованием проекции файла в память и дополнительной буферизацией при анализе текстовых файлов размером более 500 Мб.</p>
   </abstract>
   <trans-abstract xml:lang="en">
    <p>this article offers an original deterministic approach to analyzing text files, which allows solving the problem of a sharp slowdown in the total data processing speed with an increase in file size over 500 MB. Two variants of this approach are considered: direct analysis of the file mapped to the virtual address space of the process using pointer arithmetic (as with the usual memory contents) and an approach based on alternating copying of blocks of the file mapped to memory into an additional RAM buffer and further analysis of the data already in the buffer. Each of the considered variants of the approach was programmatically implemented and the time characteristics of its execution on the same data set were obtained. The analysis of the results clearly indicates the advantage of using a file projection into memory and additional buffering when analyzing text files larger than 500 MB.</p>
   </trans-abstract>
   <kwd-group xml:lang="ru">
    <kwd>лог-файл</kwd>
    <kwd>проецируемые в память файлы</kwd>
    <kwd>указатель</kwd>
    <kwd>время выполнения</kwd>
    <kwd>арифметика указателей</kwd>
    <kwd>анализ текстовых файлов</kwd>
    <kwd>буферизация</kwd>
    <kwd>цикл считывания данных</kwd>
    <kwd>разработка прототипа</kwd>
    <kwd>кеширование данных</kwd>
    <kwd>адресное пространство процесса</kwd>
   </kwd-group>
   <kwd-group xml:lang="en">
    <kwd>log file</kwd>
    <kwd>files projected into memory</kwd>
    <kwd>pointer</kwd>
    <kwd>execution time</kwd>
    <kwd>pointer arithmetic</kwd>
    <kwd>text file analysis</kwd>
    <kwd>buffering</kwd>
    <kwd>data read cycle</kwd>
    <kwd>prototype development</kwd>
    <kwd>data caching</kwd>
    <kwd>process address space.</kwd>
   </kwd-group>
  </article-meta>
 </front>
 <body>
  <p></p>
 </body>
 <back>
  <ref-list>
   <ref id="B1">
    <label>1.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Гарифуллин М.Ф. Обработка текстовой и графической информации / М.Ф.  Гарифуллин. - М.: ТЕХНОСФЕРА, 2019. – 174 с.</mixed-citation>
     <mixed-citation xml:lang="en">Garifullin M.F. Processing of text and graphic information / M.F. Garifullin, Moscow: TECHNOSPHERE, 2019– 174 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B2">
    <label>2.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Иванов, Д. А. Анализ эффективности алгоритмов поиска текстовой информации в неоднородных форматах файлов / Д. А. Иванов, Е. А. Иванишин, Д. А. Шевцов // Научная мысль. – 2025. – Т. 25, № 4-1(56). – С. 54-56. – EDN TDMBOK.</mixed-citation>
     <mixed-citation xml:lang="en">Ivanov, D. A. Analysis of the effectiveness of algorithms for searching text information in heterogeneous file formats / D. A. Ivanov, E. A. Ivanishin, D. A. Shevtsov // Scientific thought. – 2025. – Vol. 25, No. 4-1(56). – pp. 54-56. – EDN TDMBOK.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B3">
    <label>3.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Коновалов, Г. Г. Оптимизация процесса анализа данных с использованием регулярных выражений / Г. Г. Коновалов // Тенденции развития науки и образования. – 2023. – № 104-14. – С. 50-53. – DOI 10.18411/trnio-12-2023-775. – EDN CVMKWH.</mixed-citation>
     <mixed-citation xml:lang="en">Konovalov, G. G. Optimization of the data analysis process using regular expressions / G. G. Konovalov // Trends in the development of science and education. – 2023. – No. 104-14. – pp. 50-53. – DOI 10.18411/trnio-12-2023-775 . – EDN CVMKWH.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B4">
    <label>4.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Никехин А.А. Основы C++ для моделирования и расчетов: учеб. пособие / А.А. Никехин. - СПб: НИУ ИТМО, 2014. – 106 с.</mixed-citation>
     <mixed-citation xml:lang="en">Nikekhin A.A. Fundamentals of C++ for modeling and calculations: textbook. the manual / A.A. Nikekhin. - St. Petersburg: NRU ITMO, 2014. 106 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B5">
    <label>5.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Прата С. Язык программирования C++. Лекции и упражнения / С. Прата. — М.: Вильямс, 2012. — 1248 с.</mixed-citation>
     <mixed-citation xml:lang="en">Prata S. The C++ programming language. Lectures and exercises / S. Prata. — M. : Williams, 2012. — 1248 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B6">
    <label>6.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Рихтер Дж. Windows для профессионалов. Создание эффективных Win32-разрядных приложений с учетом специфики 64-разрядной версии Windows / Дж. Рихтер. – СПб.: Питер, 2001. – 752 c.</mixed-citation>
     <mixed-citation xml:lang="en">Richter J. Windows for professionals. Creation of effective Win32-bit applications taking into account the specifics of the 64-bit version of Windows / J. Richter. - St. Petersburg: Peter, 2001. – 752 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B7">
    <label>7.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Семенов, М. А. Программный проект по синтаксическому анализу текстовых файлов средствами языка с++ / М. А. Семенов, Р. С. Зарипова // Информационные технологии в строительных, социальных и экономических системах. – 2020. – № 3(21). – С. 52-54. – EDN TTIIMK.</mixed-citation>
     <mixed-citation xml:lang="en">Semenov, M. A. A software project for the syntactic analysis of text files using the c++ language / M. A. Semenov, R. S. Zaripova // Information technologies in construction, social and economic systems. – 2020. – № 3(21). – Pp. 52-54. – EDN TTIIMK.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B8">
    <label>8.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Стивенс У. Р. Unix. Профессиональное программирование / У. Р. Стивенс, Ст. Раго. – СПб.: Питер, 2025. – 944 c.</mixed-citation>
     <mixed-citation xml:lang="en">Stevens, W. R. Unix. Professional programming / W. R. Stevens, St. Rago. – St. Petersburg: Peter, 2025. – 944 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B9">
    <label>9.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Мартин Р. Чистая архитектура. Искусство разработки программного обеспечения / Р. Мартин. – СПб.: Питер, 2021. – 352 c.</mixed-citation>
     <mixed-citation xml:lang="en">Martin R. Pure architecture. The Art of Software Development / R. Martin.  St. Petersburg: Pi-ter, 2021. 352 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B10">
    <label>10.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Гулаков В. К. Структуры и алгоритмы обработки многомерных данных: монография / В. К. Гулаков, А. О. Трубаков, Е. О. Трубаков.  – СПб.: Лань, 2021. — 356 с.</mixed-citation>
     <mixed-citation xml:lang="en">Gulakov V. K. Structures and algorithms of multidimensional data processing: a monograph / V. K. Gulakov, A. O. Trubakov, E. O. Trubakov.   St. Petersburg: Lan Publ., 2021, 356 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B11">
    <label>11.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Крошемор М. Алгоритмы обработки текста: 125 задач с решениями / М. Крошемор, Т. Лекрок, В. Риттер. – М.: ДМК Пресс, 2021. – 312 с.</mixed-citation>
     <mixed-citation xml:lang="en">Kroshemor M. Algorithms of text processing: 125 problems with solutions / M. Kroshemor, T. Lecroc, V. Ritter. – M.: DMK Press, 2021. – 312 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B12">
    <label>12.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Уоррен Г. Алгоритмические трюки для программистов. – М.: Вильямс, 2004. — 288с.</mixed-citation>
     <mixed-citation xml:lang="en">Warren G. Algorithmic tricks for software. Moscow: Williams, 2004. — 288c.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B13">
    <label>13.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Макконнелл С. Совершенный код / С. Макконнелл. — М. : Русская редакция, 2010. — 896 стр.</mixed-citation>
     <mixed-citation xml:lang="en">McConnell S. Perfect code / S. McConnell. — M.: Russian edition, 2010. — 896 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B14">
    <label>14.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Хортон А. Visual C++ 2005: базовый курс / А. Хортон. - М.: Вильямс, 2007. – 1152 с.</mixed-citation>
     <mixed-citation xml:lang="en">Horton A. Visual C++ 2005: a basic course / A. Horton. Moscow: Williams, 2007. – 1152 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B15">
    <label>15.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Хогенсон Г. С++/CLI: язык Visual C++ для среды .NET / Г. Хогенсон. – М.: Вильямс, 2007. – 464 с.</mixed-citation>
     <mixed-citation xml:lang="en">Hogenson G. C++/CLI: Visual C++ language for the environment .NET / G. Hogenson. – M.: Williams, 2007. – 464 p.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B16">
    <label>16.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Шарунов, Р. Д. Анализ документов средствами различных инструментов искусственного интеллекта / Р. Д. Шарунов, О. А. Артеменко // Наукоемкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе : Материалы Всероссийской научно-технической конференции: в 2 т., Калуга, 19–21 ноября 2024 года. – Москва: федеральное государственное бюджетное образовательное учреждение высшего образования &quot;Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)&quot;, 2025. – С. 284-288. – EDN QDDHPK.</mixed-citation>
     <mixed-citation xml:lang="en">Shakhomirova, N. E. Proposals for modification of the system for viewing and analyzing diagnostic information based on the use of a hybrid database / N. E. Shakhomirova, A.V. Shakhomirov // System analysis and Logistics. – 2024. – No. S5(43). – pp. 60-66. – DOI 10.31799/2077-5687-2024-5-60-66. – EDN AHFCYY.</mixed-citation>
    </citation-alternatives>
   </ref>
   <ref id="B17">
    <label>17.</label>
    <citation-alternatives>
     <mixed-citation xml:lang="ru">Шахомирова, Н. Е. Предложения по модификации системы просмотра и анализа диагностической информации на основе применения гибридной базы данных / Н. Е. Шахомирова, А. В. Шахомиров // Системный анализ и логистика. – 2024. – № S5(43). – С. 60-66. – DOI 10.31799/2077-5687-2024-5-60-66. – EDN AHFCYY.</mixed-citation>
     <mixed-citation xml:lang="en">Sharunov, R. D. Analysis of documents by means of various artificial intelligence tools / R. D. Sharunov, O. A. Artemenko // High-tech technologies in instrument and mechanical engineering and the development of innovation in higher education institutions : Proceedings of the All-Russian Scientific and Technical Conference: in 2 volumes, Kaluga, November 19-21, 2024.  Moscow: Federal State Budgetary Educational Institution of Higher Education &quot;Bauman Moscow State Technical University (National Research University)&quot;, 2025. pp. 284-288. – EDN QDDHPK.</mixed-citation>
    </citation-alternatives>
   </ref>
  </ref-list>
 </back>
</article>
