Москва, г. Москва и Московская область, Россия
Москва, г. Москва и Московская область, Россия
Москва, г. Москва и Московская область, Россия
Целью научной работы является создание методики применения автоматизированной автороведческой экспертизы в системах защиты интеллектуальных ресурсов промышленного предприятия. Основу методики составляет принцип комплексного лингвистического анализа текстовой информации, передаваемой работниками между собой, а также клиентам и поставщикам предприятия. Анализ производится на основе сравнения данных о параметрах текста, характеризующих личность автора. Новизной работы является предложенная креативная концепция использования механизма автоматизированной автороведческой экспертизы в качестве вспомогательного инструмента защиты стратегически важных ресурсов. Для опти-мизации обработки информации и минимизации нагрузки на сеть в предложен механизм предварительного анализа текста на клиентской стороне модуля. Результатом исследования являются рекомендации по созданию модуля автороведческой экспертизы, а также встраивания модуля в инфраструктуру автоматизированных систем промышленного предприятия
автоматизация, информационная безопасность, автороведческая экспертиза, проверка подлинности, определение авторства
Введение
Применение автоматизированной автороведческой экспертизы в системах защиты стратегически важных интеллектуальных ресурсов промышленного предприятия позволит своевременно определять подлинность передаваемых сообщений работников предприятия, а также минимизирует количество случаев ренегатства, что повысит уровень информационной безопасности.
Автороведческая экспертиза – это инструмент, позволяющий определить авторство печатных текстов, применяемый для идентификации авторов, а также детектирования плагиата. Однако методы автороведческой экспертизы также могут быть применены и в автоматизированных системах защиты стратегически важных ресурсов предприятия. При этом основными задачами методов автороведческой экспертизы в таких системах являются:
– предотвращение попыток ренегатства (отступничества, отказа от ответственности);
– выявление внутренних нарушителей;
– расследование инцидентов информационной безопасности.
Анализ методов автороведческой экспертизы
Основными методами автороведческой экспертизы являются: пунктуационный; орфографический; синтаксический; лексико-фразеологический; стилистический [1].
При помощи данных методов возможно определение автора текста по критериям: пол; возраст; место учебы и воспитания; родной язык; интеллектуальный уровень; уровень чувства юмора и т.д.
Критерии, в свою очередь, определяются исходя из параметров текста: грамотность; использование оборотов речи, фраз, поговорок, выражений и т.д.; особенности построения предложений (использование инверсий и т.д.); использование форм обращения; частота использования местоимений, междометий и других частей речи; использование языка эмодзи; использование архаизмов и преднамеренных искажений.
На рис. 1 представлена блок-схема автороведческой экспертизы.
Построение модуля автороведческой экспертизы
Входными данными для модуля автороведческой экспертизы (МАЭ) является поток данных в виде текста: файлы (отчеты, технические задания, эксплуатационная документация и т.д.); письма; сообщения в мессенджерах и т.д.
Как правило, на предприятии выделяют два типа информационных потоков:
– внешние – обмен данными с поставщиками и клиентами предприятия;
– внутренние – обмен данными между работниками предприятия.
Модуль автороведческой экспертизы необходимо применять для анализа как внутренних, так и внешних информационных потоков. Модуль автороведческой экспертизы обладает высокой степенью гибкости, в связи с чем руководство предприятия в праве выбирать точки контроля самостоятельно.
Кроме того, для дополнительного повышения гибкости МАЭ может встраиваться как параллельно основному информационному потоку (при котором происходит дублирование информационного потока), так и «вразрез». На рис. 2 представлены виды встраивания МАЭ-клиентов.
Рис. 1. Блок-схема автороведческой экспертизы
Fig. 1. Flowchart of the author's expertise
Рис. 2. Виды встраивания МАЭ-клиентов
Fig. 2. Types of embedding of MAE clients
Важно отметить, что обработка информации начинается уже на клиентской стороне. МАЭ-клиент производит анализ параметров текста, а также определяет значения критериев письма. Аналогом такого принципа обработки является проведение анализа зрительной информации уже в сетчатке глаза прежде трансляции данных в мозг человека [2].
Кроме того, на данном этапе определяется тип текста: деловая формальная переписка; документ; неформальная беседа коллег в чате и т.д.
При этом минимизируется объем передачи данных между клиентской и серверной частями МАЭ: на сервер передаются только значения критериев письма – набор авторский характеристик.
Далее на серверной стороне МАЭ производится сравнение текущего набора авторских характеристик с информацией их базы данных авторов текстов.
Важно отметить, что набор авторских характеристик состоит из десятков позиций, и точное совпадение с кортежами из базы данных авторов текстов маловероятно, в связи с чем в качестве выходных данных МАЭ предоставляет вероятностные характеристики авторства.
На рис. 3 представлена схема взаимодействия компонентов МАЭ.
Рис. 3. Схема взаимодействия компонентов МАЭ
Fig. 3. Scheme of interaction of MAE components
В табл. 1 представлены характеристики полей основной таблицы базы данных авторов текстов. Серым цветом обозначено ключевое поле.
Таблица 1
Характеристики полей основной таблицы базы данных авторов текстов
Table 1
Characteristics of the fields of the main table of the database of authors of texts
|
Название поля |
Тип данных |
1 |
Идентификатор работника |
GUID |
2 |
Пол |
Элемент из списка |
3 |
Возраст |
Целочисленный |
4 |
Место учебы и воспитания |
Элемент комплексного типа из списка |
5 |
Родной язык |
Элемент из списка |
6 |
Интеллектуальный уровень |
Целочисленный |
7 |
Уровень чувства юмора |
Целочисленный |
Список элементов для поля «Пол»: «Мужской», «Женский». Список элементов для поля «Место учебы и воспитания» содержит наименования населенных пунктов, отличающихся диалектами речи.
Список элементов мест учебы и воспитания формируется экспертами-лингвистами. Также для данного списка выделяется таблица базы данных авторов текстов, поля которой также формируются экспертами-лингвистами. Характеристики полей таблицы населенных пунктов приведены в табл. 2. Серым цветом в табл. 2 обозначено ключевое поле.
Таблица 2
Характеристики полей таблицы населенных пунктов
Table 2
Characteristics of the fields of the settlements table
|
Название поля |
Тип данных |
1 |
Идентификатор населенного пункта |
GUID |
2 |
Название населенного пункта |
Элемент из списка |
3 |
Родной язык |
Элемент из списка |
4 |
Доминирующий диалект речи |
Элемент из списка |
Поля «Интеллектуальный уровень» и «Уровень чувства юмора» заполняются при внесении новой записи работника. Однако при дальнейшей работе МАЭ данные поля редактируются динамически исходя из накопленной статистики, так как чувство юмора и интеллектуальный уровень работников могут изменяться. Данные изменения являются плавными (не скачкообразными), их анализ позволит определить такие черты характера человека как: внушаемость, стабильность психики, коммуникабельность.
На рис. 4 представлена схема связи таблиц базы данных авторов текстов.
Рис. 4. Схема связи таблиц базы данных авторов текстов
Fig. 4. The scheme of connection of tables of the database of authors of texts
Особенности применения модулей автороведческой экспертизы
За счет клиент-серверной архитектуры МАЭ обладает следующими свойствами:
– высокий уровень гибкости – установка МАЭ-клиента доступна на любом типе информационного потока, при любом виде встраивания;
– высокий уровень масштабируемости – возможно подключение практически любого количества МАЭ-клиентов для промышленных предприятий масштабов страны;
– простота настройки – конфигурирование системы, в том числе настройка лингвистических параметров производится на стороне сервера, что упрощает работу как системных программистов, так и экспертов-лингвистов;
– существует возможность подключения модуля искусственного интеллекта для повышения эффективности анализа текстовой информации;
– высокий уровень интегрируемости в автоматизированные системы защиты стратегически важных ресурсов промышленных предприятий [3 – 7].
Дополнительные задачи, решаемые модулями автороведческой экспертизы
Модуль автороведческой экспертизы представляет собой систему контроля работников промышленного предприятия, в связи с чем может применяться для решения дополнительных задач автоматизированного управления:
– контроль рабочего времени;
– контроль коммуникаций работников.
Заключение
Применение модуля автороведческой экспертизы позволит выполнять задачи контроля коммуникации работников промышленного предприятия. В связи с высокими уровнями гибкости и масштабируемости конфигурация модуля автороведческой экспертизы может быть максимально близко подобрана к архитектуре основных автоматизированных систем предприятия. Кроме того, клиент-серверная архитектура модуля позволяет удобно проводить настройку модуля как системными программистами, так и экспертами-лингвистами в «одном месте» – на стороне сервера. В связи с тем, что обработка информационных потоков начинается уже на стороне агентов модуля, нагрузка на сеть значительно уменьшается, эффективность работы модуля автороведческой экспертизы как вспомогательной системы возрастает, влияние на функционирование основных автоматизированных систем промышленного предприятия минимизируется.
1. Красса С.И. Методика и инструментарий атрибуции текста в автороведческой экспертизе // Альманах современной науки и образования. - №10 (77). - 2013. - С. 106-108
2. Robert M. Sapolsky Behave. The Biology of Humans at Our Best and Worst Penguin Press, 2017 ISBN 978 0143110910
3. Karlova T.V., Bekmeshov A.Y., Kuznetsova N.M. Protection the Data Banks in State Critical Information Infrastructure Organizations / Proceedings of the 2019 IEEE International Conference «Quality Management, Transport and Information Security, Information Technologies» (IT&QM&IS), Sochi, Russia // Proceedings Edited by S. Shaposhnikov, St. Petersburg, Russia: Saint Petersburg Electrotechnical University «LETI», 2019
4. Кузнецова Н.М., Карлова Т.В., Бекмешов А.Ю. Решение задачи автоматизации процессов защиты стратегически важных ресурсов предприятия от комплексных кибер-атак на основе анализа тактик злоумышленников // Вестник Брянского государственного технического университета. - 2020. - №7 (92). - С. 48-53.
5. Chen P., Desmet L., Huygens C. A Study on Advanced Persistent Threats // Communications and Multimedia Security. - 2014. - P. 63-72.
6. Марков А.С., Фадин А.А. Организационно-технические проблемы защиты от целевых вредоносных программ типа StuxNet // Вопросы кибербезопасности. - 2013. - № 1(1). - С. 28-36.
7. ATT&CK Matrix for Enterprise. - URL: https://attacks.mitre.org (дата обращения: 05.11.2020). Режим доступа: для зарегистрир. пользователей. - Текст.: электронный.