Bryansk, Russian Federation
The relevance of the study is due to using digitalization and data processing methods in healthcare as a link that in-creases the efficiency of the organizational system, which is a medical institution. The feasibility of using medical data accumulated in the information systems of medical institutions for their processing and development of manage-ment decisions is obvious. The methods of mathematical statistics are considered, the task of which is to compare the average values of quantitative and binary samples to determine the relationship between the indicators of clinical and biochemical blood tests and occupational morbidity. Medical data are depersonalized. The paper tests a technique that makes it possible to bring the samples to homogeneity by age and gender. The performed analysis determines a statistically significant difference in the groups of the surveyed in terms of clinical blood test and biochemistry indi-cators. One expects that the results obtained during the study will provide a more accurate assessment of having the risk of occupational diseases. The recommended method will help improve the data processing methodology, and con-tribute to advancing management decisions in medicine.
organizational system, statistical methods, binary samples, digitalization, medical norm
Введение
В современных условиях лечебные учреждения ставят своей целью повышение конкурентоспособности и качества медицинских услуг. Для достижения данных целей необходимо повысить эффективность управления деятельностью медицинских учреждений, где цифровизации, как фактору повышения качества услуг, выделяется решающая роль [1].
Организационная система, которая в последнее время приобретает все большую популярность, состоит из совокупности элементов, связей и отношений, определяющих цели и функции организации, а также ее структуру и управление. Управление в организационных системах представляет собой процесс, состоящий из множества компонентов, в том числе, реализацию стратегии, развитие бизнес-процессов, управление как персоналом, так и информационными ресурсами, контроль и анализ полученных результатов. Разработка системного подхода дает возможность раскрывать объективные законы и закономерности, а также применять выявленные законы и закономерности для формирования моделей и новых систем, в том числе, для изучения зависимости переменных между собой.
Системное описание дает возможность сравнивать различные существующие системы по аналогичным признакам. Современные организационные системы применяют цифровые технологии и системы как соединяющую основу, повышающую эффективность организационной системы [2, 3].
В рамках современной теории управления востребованность представления медицинской организации как организационной социально-экономической системы обуславливает необходимость систематизации управления с позиций целевого воздействия, которое в дальнейшем приводит к оптимизации лечебных процессов. Управление способствует преобразованию данных посредством сбора и обработки информации и выработке управленческих решений, а также их реализации.
Большой круг задач, которые необходимо решать, изучая данные информационных систем лечебных учреждений, особенности их получения и обработки, показывает целесообразность усовершенствования различных подходов к расширению систем сбора и обработки медицинских данных [4, с.33; 5].
Особого внимания заслуживает внедрение информационных технологий для анализа данных в задачах превентивной и персонализированной медицины в целях сохранения здоровья населения.
Для выявления причинно-следственных связей развития производственных заболеваний необходима разработка новых методов статистического анализа и аналитического инструмента на основе медицинских данных. Это позволит своевременно оценить возможные риски и их негативные последствия, выбрать дальнейшую стратегию работы, а также решать управленческие и организационные вопросы.
Целью работы является использование цифровых технологий и аналитического инструментария, позволяющие определять значимость влияния различных комплексов вредных производственных факторов на заболеваемость и решать управленческие вопросы в здравоохранении.
Материалы и методы исследования
Для анализа в работе были использованы результаты клинических исследований обследованных лиц, на которых в процессе их трудовой деятельности воздействуют неблагоприятные производственные факторы: электромагнитные излучения (далее I группа или ЭМИ, 108 чел.), шум и вибрация (далее II группа или ШиВ, 149 чел.). В качестве контроля использовались лабораторные данные условно-здоровых лиц: служащих офисных организаций, работа которых по результатам спецоценки труда не связана с вредными производственными факторами – III группа или ТАМ, 251 чел. и лиц, принадлежащих к группе IV или АДМ, 147 чел.
Согласно Приказу МЗСР РФ [7] выполненные анализы входят в обязательный перечень исследований при проведении медицинских осмотров у лиц, занятых на работах с вредными и опасными условиями труда и являются основой диагностики большинства из известных заболеваний.
Исследования выполнены согласно федеральному законодательству Российской Федерации и способствуют осуществлению функций в сфере охраны здоровья работающих граждан [6, 7].
Для оценки влияния негативных производственных факторов на показатели клинического и биохимического анализа крови анализируемых выборок мы сравнивали средние значения количественных (включающих числовые значения показателей крови) и бинарных (отражающие ответ: да/нет, 1/0 и т.д.) выборок.
Для получения бинарных выборок сопоставлялись числовые значения с интервалом верхней и нижней границ нормы, принятые в медицинских исследованиях. Предполагалось, что бинарные данные являются более адекватными, чем результаты полученных измерений по методикам, которые используют большее число градаций. Настоящий метод замены количественных данных на бинарные мы описывали в более ранних наших работах [8, с. 24; 9, с. 278-279; 10, с. 80-82; 11, с. 166-169; 12, с. 90-92].
В данной работе мы предложили привести к однородности изначально неоднородные по ряду признаков количественные выборки, расширив анализируемые выборки.
С целью сопоставления бинарных выборок применяли формулу Бернулли и теорему Муавра-Лапласа, которые подробно описаны в [13].
Ниже представлена формула для критерия значимости разницы:
, (1)
гдеи – частоты появления бинарного значения «1» в сравниваемых выборках; n1 и n2 – объемы выборок.
Критерий Крамера-Уэлча (2) использовался нами как критерий значимости разницы средних значений нескольких количественных выборок [13, 14]. В данном исследовании объемы выборок не являются малыми, распределение возраста работников заранее неизвестно, использование критерия Крамера-Уэлча представляется целесообразным.
При имеющих место в наших случаях объемах выборки распределение Стьюдента, используемое в данном критерии, с высокой точностью совпадает со стандартным нормальным распределением [14], и критическое значение критерия Крамера-Уэлча представляет собой просто его соответствующий квантиль. Принимая уровень значимости α = 0,05, получим критическое значение K = 1,96, которое можем использовать далее в расчетах.
Критерий Крамера-Уэлча обладает примерно такой же мощностью, как и другие приближенные критерии, основанные на распределении Стьюдента, и он также при рассматриваемых объемах выборок не очень сильно зависит от нормального распределения.
, (2)
где – средн. арифметич. значение возраста (выборка I); – средн. арифметич. значение возраста (выборка ВО, включающая выборки II, III и IV); – исправленная оценка дисперсии разности выборочных средних рассматриваемых выборок.
Медицинские данные подвергались деперсонализации, что соответствует законодательству РФ. Выборки состояли из данных результатов исследования клинического и биохимического анализа крови, а также бинарных значений пола (мужской/женский) и количественных значений возраста.
С объединенной группой сравнивались лица, входившие в каждую из четырех групп. Группы формировались в следующем виде: все остальные, кроме группы ЭМИ (ВОЭ); все остальные, кроме группы ШиВ (ВОШ); все остальные, кроме группы ТАМ (ВОТ) и все остальные, кроме группы АДМ(ВОА).
Результаты исследований у лиц из сформированных выборок проверялись на однородность по признакам пола посредством сравнения бинарных выборок (1) и возраста с помощью критерия Крамера-Уэлча (2).
На рис. 1 изображена последовательность корректировки выборок. Результаты проведенных расчетов представлены в табл. 1 – 5.
Рис. 1. Схема последовательности корректировки выборок
Fig. 1. Sample adjustment sequence diagram
Результаты исследования и их обсуждение
Проверка однородности групп по половым и возрастным признакам и соответствующие результаты приведены в табл. 1. Там же представлена структура по половому и возрастному составу как в первоначальных выборках, так и после их корректировки.
Также в табл. 1 представлены результаты после сравнения значений возраста (по критерию К) и бинарных выборок по признаку пола (по критерию Q) до корректировки выборок и после нее. В правых столбцах табл. 1 показаны результаты корректировки, проводимой в связи с неоднородностью групп ШиВ, ЭМИ, ТАМ, АДМ с группами ВО.
В табл. 2 – 5 продемонстрированы результаты сравнения бинарных выборок по критерию Q. Также в табл. 2 – 5 показаны окончательные результаты сравнения средних значений клинических исследований по критерию Крамера-Уэлча для исходных и скорректированных выборок. Результатами в данном случае являются расчетные значения критерия.
Таблица 1
Результаты корректировки выборок
Table 1
Results of sample adjustments
Группы |
Объем исх. выборки |
Средн. возраст исх. выборки. |
Структура по половому составу исх. выборки м/ж |
Qисх |
Кисх |
Объем скорректир. выборки. |
Средн. возраст скорректир. выборки. |
Половой состав исходной выборки м/ж |
Qк |
Кк |
|
ЭМИ/ ВОЭ |
ЭМИ |
108 |
43,38 |
10,31 |
11,01 |
1,065 |
106 |
42,38 |
106/0 |
0 |
1,93 |
ВОЭ |
548 |
43,63 |
|
407 |
44,76 |
408/0 |
|||||
ШиВ/ ВОШ |
ШиВ |
149 |
52,05 |
6,73 |
6,72 |
11,120 |
149 |
52,65 |
139/10 |
1,83 |
1,89 |
ВОШ |
506 |
42,06 |
|
137 |
49,43 |
117/18 |
|||||
АДМ/ ВОА |
АДМ |
147 |
41,02 |
-14,94 |
-15,94 |
-2,980 |
147 |
41,04 |
48/100 |
-1,89 |
-1,87 |
ВОА |
508 |
44,44 |
|
73 |
43,44 |
34/40 |
|||||
ТАМ/ ВОТ |
ТАМ |
251 |
40,98 |
5,56 |
-5,55 |
-5,880 |
251 |
41,05 |
223/28 |
-1,93 |
-1,87 |
ВОТ |
405 |
45,27 |
|
277 |
42,74 |
231/47 |
Таблица 2
Полученные значения по критериям Q и Крамера-Уэлча для группы ЭМИ
Table 2
The values obtained based on the Q and Kramer–Welch criteria for the EMI group
Группы |
Показатели клинического анализа крови |
Биохимические показатели |
|||||||||
Уровень гемоглобина |
Количество лейкоцитов |
Количество лимфоцитов |
Количество эритроцитов |
Количество моноцитов |
Количество тромбоцитов |
Количество эозинофилов |
Уровень гематокрита |
Скорость оседания эритроцитов |
Общ. холестерин |
Уровень глюкозы |
|
Результаты расчета по критерию Q |
|||||||||||
ЭМИ-ВО исх |
-2,101 |
-0,345 |
3,361 |
5,137 |
7,054 |
1,820 |
8,799 |
-0,725 |
-0,185 |
-4,722 |
-0,461 |
ЭМИ-ВО кор |
-2,506 |
-0,285 |
3,311 |
4,102 |
6,278 |
1,579 |
8,900 |
-2,105 |
-0,167 |
-4,924 |
-0,599 |
Результаты расчета по критерию Крамера-Уэлча |
|||||||||||
ЭМИ-ВО исх |
3,613 |
0,087 |
2,308 |
0,021 |
-5,809 |
-0,360 |
-7,066 |
-5,030 |
-0,618 |
2,445 |
2,638 |
ЭМИ-ВО кор |
-0,993 |
-0,527 |
1,951 |
-3,634 |
-5,696 |
0,046 |
-8,113 |
-7,845 |
0,953 |
1,572 |
2,074 |
Объединенные результаты для группы ЭМИ |
|||||||||||
ЭМИ-ВО исх |
+ + |
0 0 |
+ - |
0 + |
- + |
0 - |
- + |
- 0 |
0 0 |
+ - |
+ 0 |
ЭМИ-ВО кор |
0 + |
0 0 |
0 + |
- + |
+ + |
0 0 |
- + |
- + |
0 - |
0 - |
+ 0 |
Таблица 3
Полученные значения по критериям Q и Крамера-Уэлча для группы ШиВ
Table 3
The values obtained according to the Q and Kramer–Welch criteria for the SHiV group
Группы |
Показатели клинического анализа крови |
Биохимические показатели |
|||||||||
Уровень гемоглобина |
Количество лейкоцитов |
Количество лимфоцитов |
Количество эритроцитов |
Количество моноцитов |
Количество тромбоцитов |
Количество эозинофилов |
Уровень гематокрита |
Скорость оседания эритроцитов |
Общ. холестерин |
Уровень глюкозы |
|
Результаты расчета по критерию Q |
|||||||||||
ШиВ-ВО исх |
0,425 |
1,479 |
-0,353 |
5,460 |
-3,001 |
1,612 |
-4,002 |
0,678 |
-1,81 |
1,139 |
1,286 |
ШиВ-ВО кор |
0,211 |
1,011 |
-0,570 |
4,625 |
-1,419 |
-0,75 |
-2,772 |
0,433 |
-0,97 |
0,889 |
1,069 |
Результаты расчета по критерию Крамера-Уэлча |
|||||||||||
ШиВ-ВО исх |
3,048 |
3,889 |
-3,015 |
0,642 |
0,652 |
-1,37 |
3,405 |
4,200 |
-3,43 |
0,833 |
0,697 |
ШиВ-ВО кор |
-0,092 |
2,327 |
-2,275 |
-1,152 |
1,724 |
0,87 |
3,330 |
1,797 |
-2,62 |
-0,93 |
-1,630 |
Объединенные результаты для группы ЭМИ |
|||||||||||
ШиВ-ВО исх |
+ 0 |
+ + |
- 0 |
0 + |
0 0 |
0 0 |
+ 0 |
+ 0 |
- 0 |
0 0 |
0 + |
ШиВ-ВО кор |
0 0 |
+ 0 |
- 0 |
0 + |
0 0 |
0 0 |
+ - |
0 0 |
- 0 |
0 0 |
0 0 |
Таблица 4
Полученные значения по критериям Q и Крамера-Уэлча для группы ТАМ
Table 4
The values obtained according to the Q and Kramer–Welch criteria for the TAM group
Группы |
Показатели клинического анализа крови |
Биохимические показатели |
|||||||||
Уровень гемоглобина |
Количество лейкоцитов |
Количество лимфоцитов |
Количество эритроцитов |
Количество моноцитов |
Количество тромбоцитов |
Количество эозинофилов |
Уровень гематокрита |
Скорость оседания эритроцитов |
Общ. холестерин |
Уровень глюкозы |
|
Результаты расчета по критерию Q |
|||||||||||
ТАМ-ВО исх |
6,458 |
-0,889 |
1,413 |
6,738 |
3,823 |
0,410 |
3,001 |
6,030 |
0,439 |
2,013 |
-2,466 |
ТАМ-ВО исх |
2,988 |
-1,678 |
-0,984 |
-14,57 |
-2,707 |
0,201 |
-5,778 |
2,014 |
0,545 |
4,178 |
-1,782 |
Результаты расчета по критерию Крамера-Уэлча |
|||||||||||
ТАМ-ВО кор |
2,467 |
-1,715 |
-2,122 |
-14,11 |
-3,411 |
0,341 |
-5,601 |
0,631 |
0,850 |
4,409 |
-1,541 |
ТАМ-ВО кор |
3,744 |
-1,638 |
1,277 |
4,000 |
3,730 |
0,678 |
2,713 |
4,317 |
1,809 |
1,824 |
-1,903 |
Объединенные результаты для группы ЭМИ |
|||||||||||
ТАМ-ВО исх |
+ + |
0 0 |
0 0 |
+ - |
+ - |
0 0 |
+ - |
+ 0 |
0 0 |
0 + |
- 0 |
ТАМ-ВО кор |
+ + |
0 + |
0 - |
+ + |
+ - |
0 + |
+ + |
+ 0 |
0 + |
0 + |
0 0 |
Таблица 5
Полученные значения по критериям Q и Крамера-Уэлча для группы АДМ
Table 5
The values obtained based on the Q and Kramer–Welch criteria for the ADM group
Группы |
Показатели клинического анализа крови |
Биохимические показатели |
|||||||||
Уровень гемоглобина |
Количество лейкоцитов |
Количество лимфоцитов |
Количество эритроцитов |
Количество моноцитов |
Количество тромбоцитов |
Количество эозинофилов |
Уровень гематокрита |
Скорость оседания эритроцитов |
Общ. холестерин |
Уровень глюкозы |
|
Результаты расчета по критерию Q |
|||||||||||
АДМ-ВО исх |
-2,131 |
-0,426 |
-1,437 |
0,979 |
-4,93 |
-2,229 |
0,780 |
-2,68 |
0,257 |
-2,08 |
-0,53 |
АДМ-ВО кор |
-0,929 |
-0,747 |
-0,615 |
2,639 |
-0,86 |
-1,935 |
2,878 |
-0,04 |
-0,638 |
-2,42 |
0,87 |
Результаты расчета по критерию Крамера-Уэлча |
|||||||||||
АДМ-ВО исх |
-12,55 |
-3,308 |
-1,187 |
-8,333 |
2,084 |
1,227 |
-0,906 |
-5,53 |
2,899 |
-6,65 |
-0,57 |
АДМ-ВО кор |
-3,333 |
-1,504 |
1,802 |
-2,410 |
1,686 |
0,107 |
-0,771 |
-0,76 |
-0,940 |
-2,63 |
0,996 |
Объединенные результаты для группы ЭМИ |
|||||||||||
АДМ-ВО исх |
- - |
- 0 |
0 0 |
- 0 |
+ - |
0 - |
0 0 |
- - |
+ 0 |
- - |
0 0 |
АДМ-ВО кор |
- 0 |
0 0 |
00 |
-+ |
0 0 |
0- |
0+ |
0 0 |
0 0 |
- - |
0 0 |
Отметим, что приведены они с учетом знака: знак «–» означает, что среднее значение для анализируемой выборки меньше, чем для остальной группы. Если знак «–» отсутствует, то соответственно – больше.
Наличие второго знака «+» в табл. 2 – 5 говорит о значимости зависимости показателей клинического анализа крови от условий труда.
Критические значения по критериям Q и Крамера-Уэлча брались равными 1,96 (α = 0,05).
В объединенных таблицах знаки «+» и «–» означают знак разности между средними в случае статистически значимой разницы, о ее незначимости говорит знак «0».
Были рассмотрены 9 возможных различных сочетаний знаков: ++, --, +-, -+, +0,-0, 0+, 0-, 00. Следует отметить, что эти сочетания встречаются в табл. 2 – 5 с разной частотой.
Для наглядности пояснения результатов представлены схематичные рисунки, отражающие сочетания знаков.
На рис. 2 – 4 отражены возможные сочетания знаков.
Рис. 2. Сочетание знаков «--»
Fig. 2. A combination of signs «--»
Рис. 3. Сочетание знаков «+-»
Fig.3. A combination of signs «+-»
Рис. 4. Сочетание знаков «-+»
Fig. 4. A combination of signs «-+»
Заключение
В настоящей статье предлагается новый подход к анализу медицинских данных, накопленных в информационных системах учреждений здравоохранения. Данный метод базируется на установлении статистически значимой разности тех бинарных выборок, которые подлежат сравнению.
Использование методологии сравнение бинарных выборок для изначально количественных данных представляет значительный интерес.
Определены показатели клинического анализа крови, которые чаще всего выходят за пределы нормативных значений. Данные, полученные по параметрическим методам и по методу бинарных выборок, значительно чаще совпадают в случаях статистически незначимой зависимости.
В случае неоднородности анализируемых групп по возрастно-половым признакам следует выполнять корректировку исходных выборок для того, чтобы достичь однородности по обоим признакам. Для этого может быть использована методика, описываемая выше.
Целесообразным представляется проведение дополнительного исследования с целью оптимизации алгоритма предложенной методики по критерию максимума тех записей, которые остаются после корректировки.
Следует проработать возможность дополнительного исследования, направленного на проверку соответствия распределения количественных показателей крови нормальному закону. Также необходимо провести дополнительное аналогичное исследование с применением непараметрических методов, позволяющих сопоставлять количественные выборки.
Технология построения систем обработки медицинских данных и методы их анализа необходимо расширять, включая новые средства моделирования.
Метод сравнения бинарных выборок можно рекомендовать для решения ряда задач анализа данных в здравоохранении.
1. The Digital Economy of the Russian Federation Program, no 7; Jun 6, 2019.
2. Bardyuzha A.V., Voloshina O.V. Modern Management of Organizational Systems. Rostov-on-Don: Phoenix; 2021.
3. Salnikov E.A. Management in Organizational Systems. In: Proceedings of the 16th International Scientific Conference on Managing Large-Scale Systems Development (MLSD'2023); 2023 Sep 26-Sep 28; Moscow: Institute of Control Sciences RAS: 2023. p. 885-892.
4. Karpov O.E., Subbotin S.A., Shishkanov D.V. Medical Data Usage to Create Medical Decision Support Systems. Medical Doctor and IT. 2019;2:11-18.
5. Geger E., Podvesovskii A., Kuzmin S., Tolstenok V. Methods for the Intelligent Analysis of Biomedical Data. In: Proceedings of the 29th International Conference on Computer Graphics and Vision GraphiCon 2019; 2019 Sep 23-Sep 29; Bryansk, vol. 2485. p. 308-311.
6. Federal Law of July 27, 2006 on Personal Data, no. 152-FZ; 2023.
7. Order of the Ministry of Health of the Russian Federation of April 12, 2011 On Approval of lists of harmful and (or) hazardous production factors and work, during the performance of which mandatory preliminary and periodic medical examinations (examinations) are carried out, and the Procedure for conducting mandatory preliminary and periodic medical examinations (examinations), no. 302 n; 2020.
8. Geger E.V., Fedorenko S.I., Evelson L.I. Development of the Non-Numerical Data Statistics Method for Occupational Diseases Risk Assessment. Science Prospects. 2017;11(98):22-25.
9. Geger E.V., Evelson L.I., Fedorenko S.I., Kozlova I.R. Improvement of Data Processing Methods in Information Systems for Support of Administration of Decision-Making Decisions. Modern High Technologies. 2019; 2-12:276-281.
10. Geger E.V., Fedorenko S.I., Evelson L.I., Kozlova I.R. Developing of the Evaluation Method of Occupational Diseases for the Creation of Information System of Occupational Safety. Vestnik NTsBZhD. 2019;1(39):79-87.
11. Geger E.V., Kozlova I.R., Yurkova O.N., Evelson .LI. Methods for Comparing Binary Samples in the Analysis of Medical Data for Making Managerial Decisions. XXI Century: Resumes of the Past and Challenges of the Present Plus. 2020;2(50)-9:164-170.
12. Evelson L.I., Geger E.V., Kozlova I.R. Applying Methods of Twin Comparing Quantitative and Binary Samples in Biomedical Information Systems for Decision Making. Vestnik of Astrakhan State Technical University. Series: Management, Computer Science and Informatics. 2022;2:87-96.
13. Orlov A.I. Applied Statistics. Moscow: Exam; 2006.
14. Kobzar A.I. Applied Mathematical Statistics for Engineers and Researchers. Moscow: Fizmatlit; 2006.