Брянская область, Россия
Актуальность исследования обусловлена использованием цифровизации и методов обработки данных в здравоохранении как связующего звена, повышающего эффективность организационной системы, которой является медицинское учреждение. Очевидна целесообразность использования медицинских данных, накопленных в информационных системах лечебных учреждений, для их обработки и выработки управленческих решений. Рассмотрены методы математической статистики, задача которых – сравнить средние значения количественных и бинарных выборок для того, чтобы определить связь между показателями клинического и биохимического анализа крови и профессиональной заболеваемостью. Медицинские данные были деперсонализированы. Апробирована методика, позволяющая привести выборки к однородности по возрасту и полу. Выполненный анализ определил статистически значимую разницу в группах обследуемых лиц по уровню показателей клинического анализа крови и биохимии. Ожидается, что результаты, полученные в ходе исследования, дадут более точную оценку риска профессиональной заболеваемости. Рекомендованный метод поможет усовершенствовать методику обработки данных, а также будет способствовать совершенствованию управленческих решений в медицине.
организационная система, статистические методы, бинарные выборки, цифровизация, медицинская норма
Введение
В современных условиях лечебные учреждения ставят своей целью повышение конкурентоспособности и качества медицинских услуг. Для достижения данных целей необходимо повысить эффективность управления деятельностью медицинских учреждений, где цифровизации, как фактору повышения качества услуг, выделяется решающая роль [1].
Организационная система, которая в последнее время приобретает все большую популярность, состоит из совокупности элементов, связей и отношений, определяющих цели и функции организации, а также ее структуру и управление. Управление в организационных системах представляет собой процесс, состоящий из множества компонентов, в том числе, реализацию стратегии, развитие бизнес-процессов, управление как персоналом, так и информационными ресурсами, контроль и анализ полученных результатов. Разработка системного подхода дает возможность раскрывать объективные законы и закономерности, а также применять выявленные законы и закономерности для формирования моделей и новых систем, в том числе, для изучения зависимости переменных между собой.
Системное описание дает возможность сравнивать различные существующие системы по аналогичным признакам. Современные организационные системы применяют цифровые технологии и системы как соединяющую основу, повышающую эффективность организационной системы [2, 3].
В рамках современной теории управления востребованность представления медицинской организации как организационной социально-экономической системы обуславливает необходимость систематизации управления с позиций целевого воздействия, которое в дальнейшем приводит к оптимизации лечебных процессов. Управление способствует преобразованию данных посредством сбора и обработки информации и выработке управленческих решений, а также их реализации.
Большой круг задач, которые необходимо решать, изучая данные информационных систем лечебных учреждений, особенности их получения и обработки, показывает целесообразность усовершенствования различных подходов к расширению систем сбора и обработки медицинских данных [4, с.33; 5].
Особого внимания заслуживает внедрение информационных технологий для анализа данных в задачах превентивной и персонализированной медицины в целях сохранения здоровья населения.
Для выявления причинно-следственных связей развития производственных заболеваний необходима разработка новых методов статистического анализа и аналитического инструмента на основе медицинских данных. Это позволит своевременно оценить возможные риски и их негативные последствия, выбрать дальнейшую стратегию работы, а также решать управленческие и организационные вопросы.
Целью работы является использование цифровых технологий и аналитического инструментария, позволяющие определять значимость влияния различных комплексов вредных производственных факторов на заболеваемость и решать управленческие вопросы в здравоохранении.
Материалы и методы исследования
Для анализа в работе были использованы результаты клинических исследований обследованных лиц, на которых в процессе их трудовой деятельности воздействуют неблагоприятные производственные факторы: электромагнитные излучения (далее I группа или ЭМИ, 108 чел.), шум и вибрация (далее II группа или ШиВ, 149 чел.). В качестве контроля использовались лабораторные данные условно-здоровых лиц: служащих офисных организаций, работа которых по результатам спецоценки труда не связана с вредными производственными факторами – III группа или ТАМ, 251 чел. и лиц, принадлежащих к группе IV или АДМ, 147 чел.
Согласно Приказу МЗСР РФ [7] выполненные анализы входят в обязательный перечень исследований при проведении медицинских осмотров у лиц, занятых на работах с вредными и опасными условиями труда и являются основой диагностики большинства из известных заболеваний.
Исследования выполнены согласно федеральному законодательству Российской Федерации и способствуют осуществлению функций в сфере охраны здоровья работающих граждан [6, 7].
Для оценки влияния негативных производственных факторов на показатели клинического и биохимического анализа крови анализируемых выборок мы сравнивали средние значения количественных (включающих числовые значения показателей крови) и бинарных (отражающие ответ: да/нет, 1/0 и т.д.) выборок.
Для получения бинарных выборок сопоставлялись числовые значения с интервалом верхней и нижней границ нормы, принятые в медицинских исследованиях. Предполагалось, что бинарные данные являются более адекватными, чем результаты полученных измерений по методикам, которые используют большее число градаций. Настоящий метод замены количественных данных на бинарные мы описывали в более ранних наших работах [8, с. 24; 9, с. 278-279; 10, с. 80-82; 11, с. 166-169; 12, с. 90-92].
В данной работе мы предложили привести к однородности изначально неоднородные по ряду признаков количественные выборки, расширив анализируемые выборки.
С целью сопоставления бинарных выборок применяли формулу Бернулли и теорему Муавра-Лапласа, которые подробно описаны в [13].
Ниже представлена формула для критерия значимости разницы:
, (1)
гдеи – частоты появления бинарного значения «1» в сравниваемых выборках; n1 и n2 – объемы выборок.
Критерий Крамера-Уэлча (2) использовался нами как критерий значимости разницы средних значений нескольких количественных выборок [13, 14]. В данном исследовании объемы выборок не являются малыми, распределение возраста работников заранее неизвестно, использование критерия Крамера-Уэлча представляется целесообразным.
При имеющих место в наших случаях объемах выборки распределение Стьюдента, используемое в данном критерии, с высокой точностью совпадает со стандартным нормальным распределением [14], и критическое значение критерия Крамера-Уэлча представляет собой просто его соответствующий квантиль. Принимая уровень значимости α = 0,05, получим критическое значение K = 1,96, которое можем использовать далее в расчетах.
Критерий Крамера-Уэлча обладает примерно такой же мощностью, как и другие приближенные критерии, основанные на распределении Стьюдента, и он также при рассматриваемых объемах выборок не очень сильно зависит от нормального распределения.
, (2)
где – средн. арифметич. значение возраста (выборка I); – средн. арифметич. значение возраста (выборка ВО, включающая выборки II, III и IV); – исправленная оценка дисперсии разности выборочных средних рассматриваемых выборок.
Медицинские данные подвергались деперсонализации, что соответствует законодательству РФ. Выборки состояли из данных результатов исследования клинического и биохимического анализа крови, а также бинарных значений пола (мужской/женский) и количественных значений возраста.
С объединенной группой сравнивались лица, входившие в каждую из четырех групп. Группы формировались в следующем виде: все остальные, кроме группы ЭМИ (ВОЭ); все остальные, кроме группы ШиВ (ВОШ); все остальные, кроме группы ТАМ (ВОТ) и все остальные, кроме группы АДМ(ВОА).
Результаты исследований у лиц из сформированных выборок проверялись на однородность по признакам пола посредством сравнения бинарных выборок (1) и возраста с помощью критерия Крамера-Уэлча (2).
На рис. 1 изображена последовательность корректировки выборок. Результаты проведенных расчетов представлены в табл. 1 – 5.
Рис. 1. Схема последовательности корректировки выборок
Fig. 1. Sample adjustment sequence diagram
Результаты исследования и их обсуждение
Проверка однородности групп по половым и возрастным признакам и соответствующие результаты приведены в табл. 1. Там же представлена структура по половому и возрастному составу как в первоначальных выборках, так и после их корректировки.
Также в табл. 1 представлены результаты после сравнения значений возраста (по критерию К) и бинарных выборок по признаку пола (по критерию Q) до корректировки выборок и после нее. В правых столбцах табл. 1 показаны результаты корректировки, проводимой в связи с неоднородностью групп ШиВ, ЭМИ, ТАМ, АДМ с группами ВО.
В табл. 2 – 5 продемонстрированы результаты сравнения бинарных выборок по критерию Q. Также в табл. 2 – 5 показаны окончательные результаты сравнения средних значений клинических исследований по критерию Крамера-Уэлча для исходных и скорректированных выборок. Результатами в данном случае являются расчетные значения критерия.
Таблица 1
Результаты корректировки выборок
Table 1
Results of sample adjustments
Группы |
Объем исх. выборки |
Средн. возраст исх. выборки. |
Структура по половому составу исх. выборки м/ж |
Qисх |
Кисх |
Объем скорректир. выборки. |
Средн. возраст скорректир. выборки. |
Половой состав исходной выборки м/ж |
Qк |
Кк |
|
ЭМИ/ ВОЭ |
ЭМИ |
108 |
43,38 |
10,31 |
11,01 |
1,065 |
106 |
42,38 |
106/0 |
0 |
1,93 |
ВОЭ |
548 |
43,63 |
|
407 |
44,76 |
408/0 |
|||||
ШиВ/ ВОШ |
ШиВ |
149 |
52,05 |
6,73 |
6,72 |
11,120 |
149 |
52,65 |
139/10 |
1,83 |
1,89 |
ВОШ |
506 |
42,06 |
|
137 |
49,43 |
117/18 |
|||||
АДМ/ ВОА |
АДМ |
147 |
41,02 |
-14,94 |
-15,94 |
-2,980 |
147 |
41,04 |
48/100 |
-1,89 |
-1,87 |
ВОА |
508 |
44,44 |
|
73 |
43,44 |
34/40 |
|||||
ТАМ/ ВОТ |
ТАМ |
251 |
40,98 |
5,56 |
-5,55 |
-5,880 |
251 |
41,05 |
223/28 |
-1,93 |
-1,87 |
ВОТ |
405 |
45,27 |
|
277 |
42,74 |
231/47 |
Таблица 2
Полученные значения по критериям Q и Крамера-Уэлча для группы ЭМИ
Table 2
The values obtained based on the Q and Kramer–Welch criteria for the EMI group
Группы |
Показатели клинического анализа крови |
Биохимические показатели |
|||||||||
Уровень гемоглобина |
Количество лейкоцитов |
Количество лимфоцитов |
Количество эритроцитов |
Количество моноцитов |
Количество тромбоцитов |
Количество эозинофилов |
Уровень гематокрита |
Скорость оседания эритроцитов |
Общ. холестерин |
Уровень глюкозы |
|
Результаты расчета по критерию Q |
|||||||||||
ЭМИ-ВО исх |
-2,101 |
-0,345 |
3,361 |
5,137 |
7,054 |
1,820 |
8,799 |
-0,725 |
-0,185 |
-4,722 |
-0,461 |
ЭМИ-ВО кор |
-2,506 |
-0,285 |
3,311 |
4,102 |
6,278 |
1,579 |
8,900 |
-2,105 |
-0,167 |
-4,924 |
-0,599 |
Результаты расчета по критерию Крамера-Уэлча |
|||||||||||
ЭМИ-ВО исх |
3,613 |
0,087 |
2,308 |
0,021 |
-5,809 |
-0,360 |
-7,066 |
-5,030 |
-0,618 |
2,445 |
2,638 |
ЭМИ-ВО кор |
-0,993 |
-0,527 |
1,951 |
-3,634 |
-5,696 |
0,046 |
-8,113 |
-7,845 |
0,953 |
1,572 |
2,074 |
Объединенные результаты для группы ЭМИ |
|||||||||||
ЭМИ-ВО исх |
+ + |
0 0 |
+ - |
0 + |
- + |
0 - |
- + |
- 0 |
0 0 |
+ - |
+ 0 |
ЭМИ-ВО кор |
0 + |
0 0 |
0 + |
- + |
+ + |
0 0 |
- + |
- + |
0 - |
0 - |
+ 0 |
Таблица 3
Полученные значения по критериям Q и Крамера-Уэлча для группы ШиВ
Table 3
The values obtained according to the Q and Kramer–Welch criteria for the SHiV group
Группы |
Показатели клинического анализа крови |
Биохимические показатели |
|||||||||
Уровень гемоглобина |
Количество лейкоцитов |
Количество лимфоцитов |
Количество эритроцитов |
Количество моноцитов |
Количество тромбоцитов |
Количество эозинофилов |
Уровень гематокрита |
Скорость оседания эритроцитов |
Общ. холестерин |
Уровень глюкозы |
|
Результаты расчета по критерию Q |
|||||||||||
ШиВ-ВО исх |
0,425 |
1,479 |
-0,353 |
5,460 |
-3,001 |
1,612 |
-4,002 |
0,678 |
-1,81 |
1,139 |
1,286 |
ШиВ-ВО кор |
0,211 |
1,011 |
-0,570 |
4,625 |
-1,419 |
-0,75 |
-2,772 |
0,433 |
-0,97 |
0,889 |
1,069 |
Результаты расчета по критерию Крамера-Уэлча |
|||||||||||
ШиВ-ВО исх |
3,048 |
3,889 |
-3,015 |
0,642 |
0,652 |
-1,37 |
3,405 |
4,200 |
-3,43 |
0,833 |
0,697 |
ШиВ-ВО кор |
-0,092 |
2,327 |
-2,275 |
-1,152 |
1,724 |
0,87 |
3,330 |
1,797 |
-2,62 |
-0,93 |
-1,630 |
Объединенные результаты для группы ЭМИ |
|||||||||||
ШиВ-ВО исх |
+ 0 |
+ + |
- 0 |
0 + |
0 0 |
0 0 |
+ 0 |
+ 0 |
- 0 |
0 0 |
0 + |
ШиВ-ВО кор |
0 0 |
+ 0 |
- 0 |
0 + |
0 0 |
0 0 |
+ - |
0 0 |
- 0 |
0 0 |
0 0 |
Таблица 4
Полученные значения по критериям Q и Крамера-Уэлча для группы ТАМ
Table 4
The values obtained according to the Q and Kramer–Welch criteria for the TAM group
Группы |
Показатели клинического анализа крови |
Биохимические показатели |
|||||||||
Уровень гемоглобина |
Количество лейкоцитов |
Количество лимфоцитов |
Количество эритроцитов |
Количество моноцитов |
Количество тромбоцитов |
Количество эозинофилов |
Уровень гематокрита |
Скорость оседания эритроцитов |
Общ. холестерин |
Уровень глюкозы |
|
Результаты расчета по критерию Q |
|||||||||||
ТАМ-ВО исх |
6,458 |
-0,889 |
1,413 |
6,738 |
3,823 |
0,410 |
3,001 |
6,030 |
0,439 |
2,013 |
-2,466 |
ТАМ-ВО исх |
2,988 |
-1,678 |
-0,984 |
-14,57 |
-2,707 |
0,201 |
-5,778 |
2,014 |
0,545 |
4,178 |
-1,782 |
Результаты расчета по критерию Крамера-Уэлча |
|||||||||||
ТАМ-ВО кор |
2,467 |
-1,715 |
-2,122 |
-14,11 |
-3,411 |
0,341 |
-5,601 |
0,631 |
0,850 |
4,409 |
-1,541 |
ТАМ-ВО кор |
3,744 |
-1,638 |
1,277 |
4,000 |
3,730 |
0,678 |
2,713 |
4,317 |
1,809 |
1,824 |
-1,903 |
Объединенные результаты для группы ЭМИ |
|||||||||||
ТАМ-ВО исх |
+ + |
0 0 |
0 0 |
+ - |
+ - |
0 0 |
+ - |
+ 0 |
0 0 |
0 + |
- 0 |
ТАМ-ВО кор |
+ + |
0 + |
0 - |
+ + |
+ - |
0 + |
+ + |
+ 0 |
0 + |
0 + |
0 0 |
Таблица 5
Полученные значения по критериям Q и Крамера-Уэлча для группы АДМ
Table 5
The values obtained based on the Q and Kramer–Welch criteria for the ADM group
Группы |
Показатели клинического анализа крови |
Биохимические показатели |
|||||||||
Уровень гемоглобина |
Количество лейкоцитов |
Количество лимфоцитов |
Количество эритроцитов |
Количество моноцитов |
Количество тромбоцитов |
Количество эозинофилов |
Уровень гематокрита |
Скорость оседания эритроцитов |
Общ. холестерин |
Уровень глюкозы |
|
Результаты расчета по критерию Q |
|||||||||||
АДМ-ВО исх |
-2,131 |
-0,426 |
-1,437 |
0,979 |
-4,93 |
-2,229 |
0,780 |
-2,68 |
0,257 |
-2,08 |
-0,53 |
АДМ-ВО кор |
-0,929 |
-0,747 |
-0,615 |
2,639 |
-0,86 |
-1,935 |
2,878 |
-0,04 |
-0,638 |
-2,42 |
0,87 |
Результаты расчета по критерию Крамера-Уэлча |
|||||||||||
АДМ-ВО исх |
-12,55 |
-3,308 |
-1,187 |
-8,333 |
2,084 |
1,227 |
-0,906 |
-5,53 |
2,899 |
-6,65 |
-0,57 |
АДМ-ВО кор |
-3,333 |
-1,504 |
1,802 |
-2,410 |
1,686 |
0,107 |
-0,771 |
-0,76 |
-0,940 |
-2,63 |
0,996 |
Объединенные результаты для группы ЭМИ |
|||||||||||
АДМ-ВО исх |
- - |
- 0 |
0 0 |
- 0 |
+ - |
0 - |
0 0 |
- - |
+ 0 |
- - |
0 0 |
АДМ-ВО кор |
- 0 |
0 0 |
00 |
-+ |
0 0 |
0- |
0+ |
0 0 |
0 0 |
- - |
0 0 |
Отметим, что приведены они с учетом знака: знак «–» означает, что среднее значение для анализируемой выборки меньше, чем для остальной группы. Если знак «–» отсутствует, то соответственно – больше.
Наличие второго знака «+» в табл. 2 – 5 говорит о значимости зависимости показателей клинического анализа крови от условий труда.
Критические значения по критериям Q и Крамера-Уэлча брались равными 1,96 (α = 0,05).
В объединенных таблицах знаки «+» и «–» означают знак разности между средними в случае статистически значимой разницы, о ее незначимости говорит знак «0».
Были рассмотрены 9 возможных различных сочетаний знаков: ++, --, +-, -+, +0,-0, 0+, 0-, 00. Следует отметить, что эти сочетания встречаются в табл. 2 – 5 с разной частотой.
Для наглядности пояснения результатов представлены схематичные рисунки, отражающие сочетания знаков.
На рис. 2 – 4 отражены возможные сочетания знаков.
Рис. 2. Сочетание знаков «--»
Fig. 2. A combination of signs «--»
Рис. 3. Сочетание знаков «+-»
Fig.3. A combination of signs «+-»
Рис. 4. Сочетание знаков «-+»
Fig. 4. A combination of signs «-+»
Заключение
В настоящей статье предлагается новый подход к анализу медицинских данных, накопленных в информационных системах учреждений здравоохранения. Данный метод базируется на установлении статистически значимой разности тех бинарных выборок, которые подлежат сравнению.
Использование методологии сравнение бинарных выборок для изначально количественных данных представляет значительный интерес.
Определены показатели клинического анализа крови, которые чаще всего выходят за пределы нормативных значений. Данные, полученные по параметрическим методам и по методу бинарных выборок, значительно чаще совпадают в случаях статистически незначимой зависимости.
В случае неоднородности анализируемых групп по возрастно-половым признакам следует выполнять корректировку исходных выборок для того, чтобы достичь однородности по обоим признакам. Для этого может быть использована методика, описываемая выше.
Целесообразным представляется проведение дополнительного исследования с целью оптимизации алгоритма предложенной методики по критерию максимума тех записей, которые остаются после корректировки.
Следует проработать возможность дополнительного исследования, направленного на проверку соответствия распределения количественных показателей крови нормальному закону. Также необходимо провести дополнительное аналогичное исследование с применением непараметрических методов, позволяющих сопоставлять количественные выборки.
Технология построения систем обработки медицинских данных и методы их анализа необходимо расширять, включая новые средства моделирования.
Метод сравнения бинарных выборок можно рекомендовать для решения ряда задач анализа данных в здравоохранении.
1. Программа «Цифровая экономика РФ», утв. протоколом заседания президиума Совета при Президенте РФ по стратегич. развитию и нац. проектам от 4.06.2019 г. №7.
2. Бардюжа А.В., Волошина О.В. Современное управление организационными системами: учебное пособие. – Ростов-на-Дону: Феникс, 2021. – 376 с.
3. Сальников Е.А. Управ-е в организационных системах / Фин. ун-т при Правительстве РФ, Москва, Россия.
4. Карпов О.Э., Субботин С.А., Шишка-нов Д.В. Использование медицинских данных для создания систем поддержки принятия решений // Врач и информационные технологии. 2019. – №2. – C. 11-18.
5. Geger E., Podvesovskii A., Kuzmin S., Tol-stenok V. Methods for the Intelligent Analysis of Bio-medical Data. GraphiCon 2019.Computer Graphics and Vision Proceedings of the 29th International Conference on Computer Graphics and Vision (Sep. 2019), Vol. 2485. 308-311.
6. ФЗ от 27.07.2006 № 152-ФЗ (ред. от 06.02.2023) «О персональных данных».
7. Приказ МЗСР РФ от 12.04.2011 № 302 н (ред. от 01.07.2020) «Об утв. перечней вредных и (или) опасных производ. факторов и работ, при выполнении которых проводятся обязательные предварит. и периодич. медосмотры (обследования), и Порядка проведения обязательных предварит. и периодич. медосмотров (обследований)».
8. Гегерь Э.В., Федоренко С.И., Евельсон Л.И. Разработка метода оценки риска профессиональной заболеваемости, основанного на статистике нечисловых данных // Перспективы науки. – 2017. – № 11(98). – С. 22-25.
9. Гегерь Э.В., Евельсон Л.И., Федоренко С.И., Козлова И.Р. Совершенствование методов обработки данных в информационных системах поддержки принятия управленческих решений // Современные наукоемкие технологии. – 2019. – № 12 (ч.2) Б. – С. 276-281.
10. Гегерь Э.В., Федоренко С.И., Евельсон Л.И., Козлова И.Р. Разработка метода оценки профессиональных заболеваний для создания ин-формационной системы производственной безопасности // Вестник НЦ БЖД. – 2019. – №1 (39). – С. 79-87.
11. Гегерь Э.В., Козлова И.Р., Юркова О.Н., Евельсон Л.И. Методика сравнения бинарных выборок при анализе медицинских данных для принятия управленческих решений // XXI век: итоги прошлого и проблемы настоящего плюс. Информатика, вычислительная техника, управление. – 2020. – № 2(50) Т.9. – С. 164-170.
12. Евельсон Л.И., Гегерь Э. В., Козлова И. Р. Применение методов парного сравнения количественных и бинарных выборок в биомедицинских исследованиях с целью принятия управленческих решений // Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. – 2022. – № 2. – С. 87–96.
13. Орлов А.И. Прикладная статистика. – М.: Экзамен, 2006. – 671 с.
14. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. – М.: Физматлит, 2006. – 816 с.