Moscow, Moscow, Russian Federation
Moscow, Moscow, Russian Federation
Moscow, Moscow, Russian Federation
The aim of the study is to create a methodology for using automated authorship expertise in the systems for protecting the intellectual resources of an industrial enterprise. The methodology is based on the principle of complex linguistic analysis of textual information transmitted by employees among themselves, as well as to the enterprise’s customers and suppliers. The analysis is based on a comparison of data on the text parameters that characterize the author’s personality. The novelty of the work is the proposed creative concept of using automated authorship expertise as an auxiliary tool for protecting strategically important resources. To optimise information processing and minimize network load, the article proposes a mechanism for preliminary text analysis on the client side of the module. The study results are recommendations for creating a module of authorship expertise, as well as embedding the module into the infrastructure of the enterprise’s automated systems
automation, information security, authorship expertise, authentication, authorship determination
Введение
Применение автоматизированной автороведческой экспертизы в системах защиты стратегически важных интеллектуальных ресурсов промышленного предприятия позволит своевременно определять подлинность передаваемых сообщений работников предприятия, а также минимизирует количество случаев ренегатства, что повысит уровень информационной безопасности.
Автороведческая экспертиза – это инструмент, позволяющий определить авторство печатных текстов, применяемый для идентификации авторов, а также детектирования плагиата. Однако методы автороведческой экспертизы также могут быть применены и в автоматизированных системах защиты стратегически важных ресурсов предприятия. При этом основными задачами методов автороведческой экспертизы в таких системах являются:
– предотвращение попыток ренегатства (отступничества, отказа от ответственности);
– выявление внутренних нарушителей;
– расследование инцидентов информационной безопасности.
Анализ методов автороведческой экспертизы
Основными методами автороведческой экспертизы являются: пунктуационный; орфографический; синтаксический; лексико-фразеологический; стилистический [1].
При помощи данных методов возможно определение автора текста по критериям: пол; возраст; место учебы и воспитания; родной язык; интеллектуальный уровень; уровень чувства юмора и т.д.
Критерии, в свою очередь, определяются исходя из параметров текста: грамотность; использование оборотов речи, фраз, поговорок, выражений и т.д.; особенности построения предложений (использование инверсий и т.д.); использование форм обращения; частота использования местоимений, междометий и других частей речи; использование языка эмодзи; использование архаизмов и преднамеренных искажений.
На рис. 1 представлена блок-схема автороведческой экспертизы.
Построение модуля автороведческой экспертизы
Входными данными для модуля автороведческой экспертизы (МАЭ) является поток данных в виде текста: файлы (отчеты, технические задания, эксплуатационная документация и т.д.); письма; сообщения в мессенджерах и т.д.
Как правило, на предприятии выделяют два типа информационных потоков:
– внешние – обмен данными с поставщиками и клиентами предприятия;
– внутренние – обмен данными между работниками предприятия.
Модуль автороведческой экспертизы необходимо применять для анализа как внутренних, так и внешних информационных потоков. Модуль автороведческой экспертизы обладает высокой степенью гибкости, в связи с чем руководство предприятия в праве выбирать точки контроля самостоятельно.
Кроме того, для дополнительного повышения гибкости МАЭ может встраиваться как параллельно основному информационному потоку (при котором происходит дублирование информационного потока), так и «вразрез». На рис. 2 представлены виды встраивания МАЭ-клиентов.
Рис. 1. Блок-схема автороведческой экспертизы
Fig. 1. Flowchart of the author's expertise
Рис. 2. Виды встраивания МАЭ-клиентов
Fig. 2. Types of embedding of MAE clients
Важно отметить, что обработка информации начинается уже на клиентской стороне. МАЭ-клиент производит анализ параметров текста, а также определяет значения критериев письма. Аналогом такого принципа обработки является проведение анализа зрительной информации уже в сетчатке глаза прежде трансляции данных в мозг человека [2].
Кроме того, на данном этапе определяется тип текста: деловая формальная переписка; документ; неформальная беседа коллег в чате и т.д.
При этом минимизируется объем передачи данных между клиентской и серверной частями МАЭ: на сервер передаются только значения критериев письма – набор авторский характеристик.
Далее на серверной стороне МАЭ производится сравнение текущего набора авторских характеристик с информацией их базы данных авторов текстов.
Важно отметить, что набор авторских характеристик состоит из десятков позиций, и точное совпадение с кортежами из базы данных авторов текстов маловероятно, в связи с чем в качестве выходных данных МАЭ предоставляет вероятностные характеристики авторства.
На рис. 3 представлена схема взаимодействия компонентов МАЭ.
Рис. 3. Схема взаимодействия компонентов МАЭ
Fig. 3. Scheme of interaction of MAE components
В табл. 1 представлены характеристики полей основной таблицы базы данных авторов текстов. Серым цветом обозначено ключевое поле.
Таблица 1
Характеристики полей основной таблицы базы данных авторов текстов
Table 1
Characteristics of the fields of the main table of the database of authors of texts
|
Название поля |
Тип данных |
1 |
Идентификатор работника |
GUID |
2 |
Пол |
Элемент из списка |
3 |
Возраст |
Целочисленный |
4 |
Место учебы и воспитания |
Элемент комплексного типа из списка |
5 |
Родной язык |
Элемент из списка |
6 |
Интеллектуальный уровень |
Целочисленный |
7 |
Уровень чувства юмора |
Целочисленный |
Список элементов для поля «Пол»: «Мужской», «Женский». Список элементов для поля «Место учебы и воспитания» содержит наименования населенных пунктов, отличающихся диалектами речи.
Список элементов мест учебы и воспитания формируется экспертами-лингвистами. Также для данного списка выделяется таблица базы данных авторов текстов, поля которой также формируются экспертами-лингвистами. Характеристики полей таблицы населенных пунктов приведены в табл. 2. Серым цветом в табл. 2 обозначено ключевое поле.
Таблица 2
Характеристики полей таблицы населенных пунктов
Table 2
Characteristics of the fields of the settlements table
|
Название поля |
Тип данных |
1 |
Идентификатор населенного пункта |
GUID |
2 |
Название населенного пункта |
Элемент из списка |
3 |
Родной язык |
Элемент из списка |
4 |
Доминирующий диалект речи |
Элемент из списка |
Поля «Интеллектуальный уровень» и «Уровень чувства юмора» заполняются при внесении новой записи работника. Однако при дальнейшей работе МАЭ данные поля редактируются динамически исходя из накопленной статистики, так как чувство юмора и интеллектуальный уровень работников могут изменяться. Данные изменения являются плавными (не скачкообразными), их анализ позволит определить такие черты характера человека как: внушаемость, стабильность психики, коммуникабельность.
На рис. 4 представлена схема связи таблиц базы данных авторов текстов.
Рис. 4. Схема связи таблиц базы данных авторов текстов
Fig. 4. The scheme of connection of tables of the database of authors of texts
Особенности применения модулей автороведческой экспертизы
За счет клиент-серверной архитектуры МАЭ обладает следующими свойствами:
– высокий уровень гибкости – установка МАЭ-клиента доступна на любом типе информационного потока, при любом виде встраивания;
– высокий уровень масштабируемости – возможно подключение практически любого количества МАЭ-клиентов для промышленных предприятий масштабов страны;
– простота настройки – конфигурирование системы, в том числе настройка лингвистических параметров производится на стороне сервера, что упрощает работу как системных программистов, так и экспертов-лингвистов;
– существует возможность подключения модуля искусственного интеллекта для повышения эффективности анализа текстовой информации;
– высокий уровень интегрируемости в автоматизированные системы защиты стратегически важных ресурсов промышленных предприятий [3 – 7].
Дополнительные задачи, решаемые модулями автороведческой экспертизы
Модуль автороведческой экспертизы представляет собой систему контроля работников промышленного предприятия, в связи с чем может применяться для решения дополнительных задач автоматизированного управления:
– контроль рабочего времени;
– контроль коммуникаций работников.
Заключение
Применение модуля автороведческой экспертизы позволит выполнять задачи контроля коммуникации работников промышленного предприятия. В связи с высокими уровнями гибкости и масштабируемости конфигурация модуля автороведческой экспертизы может быть максимально близко подобрана к архитектуре основных автоматизированных систем предприятия. Кроме того, клиент-серверная архитектура модуля позволяет удобно проводить настройку модуля как системными программистами, так и экспертами-лингвистами в «одном месте» – на стороне сервера. В связи с тем, что обработка информационных потоков начинается уже на стороне агентов модуля, нагрузка на сеть значительно уменьшается, эффективность работы модуля автороведческой экспертизы как вспомогательной системы возрастает, влияние на функционирование основных автоматизированных систем промышленного предприятия минимизируется.
1. Krassa S.I. Methology and Instruments for Text Attribution in Authorship Expertise. Almanac of Modern Science and Education. 2013;10(77):106-108.
2. Robert M. Sapolsky Behave. The Biology of Humans at Our Best and Worst Penguin Press; 2017.
3. Karlova TV, Bekmeshov AY, Kuznetsova NM. Protection of the Data Banks in State Critical Information Infrastructure Organizations. In: Shaposhnikov S, editor. Proceedings of the 2019 IEEE International Con-ference: Quality Management, Transport and Information Security, Information Technologies (IT&QM&IS); Sochi, Saint Petersburg: Saint Petersburg Electrotechnical University «LETI»: 2019.
4. Kuznetsova N.M., Karlova T.V., Bekmeshov A.Yu. Solution of Protection Automation Problem of Company Strategic Resources Against Complex Cyber-Attacks Based on Criminal Tactics Analysis. [Internet]. Bulletin of Bryansk State Technical University. 2020;7(92):48-53. Available from: https://doi.org/10. 30987/1999-8775- 2020-7-48-53
5. Chen P., Desmet L., Huygens C. A Study on Advanced Persistent Threats. Communications and Multimedia Security. 2014:63-72. doi:https://doi.org/10.1007/978-3-662-44885-4_5
6. Markov A.S., Fadin A.A. Organizational and Technical Problems of Protection Against Targeted Malware Such As StuxNet. Cybersecurity Issues. 2013;1(1):28-36.
7. ATT&CK Matrix for Enterprise [Internet] [cited 2020 Nov 05]. Available from: https://attacks.mitre.org