Preview

Тихоокеанский медицинский журнал

Расширенный поиск

Прогностическая модель летальности на основе логистической регрессии лабораторных показателей

https://doi.org/10.34215/1609-1175-2025-2-45-49

Содержание

Перейти к:

Аннотация

Цель: разработка и валидация математической модели для прогнозирования риска летальных исходов на основе лабораторных показателей крови и мочи пациентов. Материалы и методы. В исследовании проанализированы клинические данные пациентов, включая результаты лабораторных исследований крови и мочи. Для создания модели использовались методы математического моделирования и статистического анализа. Результаты. Разработана прогностическая модель, демонстрирующая высокую точность в определении риска неблагоприятного исхода. Модель основана на доступных лабораторных показателях и может быть легко интегрирована в клиническую практику. Заключение. Предложенная математическая модель представляет собой эффективный инструмент для ранней диагностики риска летальных исходов. Практическая значимость исследования определяется возможностью использования разработанной модели в различных областях клинической медицины для оптимизации лечебно-диагностического процесса.

Для цитирования:


Мозоль А.Н. Прогностическая модель летальности на основе логистической регрессии лабораторных показателей. Тихоокеанский медицинский журнал. 2025;(2):45-49. https://doi.org/10.34215/1609-1175-2025-2-45-49

For citation:


Mozol A.N. Predictive model of mortality based on logistic regression of laboratory indicators. Pacific Medical Journal. 2025;(2):45-49. (In Russ.) https://doi.org/10.34215/1609-1175-2025-2-45-49

Прогнозирование исходов заболеваний является критически важной задачей современной медицины. Традиционные подходы к оценке лабораторных показателей часто не позволяют своевременно выявить риск неблагоприятного исхода, особенно у амбулаторных пациентов.

Разработка системы поддержки принятия врачебных решений (СППВР) на основе логистической регрессии открывает новые возможности для прогнозирования летальности или серьезных осложнений, требующих оказания помощи в формате интенсивной терапии или даже реанимации. Предложенный в статье метод позволяет анализировать множество параметров одновременно и количественно оценивать риск развития неблагоприятного исхода.

Цель исследования: создание прогностической модели летальности на основе анализа лабораторных показателей с использованием логистической регрессии для внедрения в систему поддержки принятия врачебных решений.

Материалы и методы

Объектом исследования является процесс принятия врачебных решений при оценке прогноза летальности пациентов на основе лабораторных показателей крови и мочи.

Данный объект исследования включает в себя: сведения о пациентах, которым выполнены анализы (пол, возраст, данные о факте смерти или его отсутствии); показатели последнего анализа у каждого пациента; математические методы анализа данных (логистическая регрессия); систему поддержки принятия решений как конечный продукт.

Такой объект исследования позволяет изучить взаимосвязи между лабораторными показателями и исходом заболевания, разработать математическую модель прогнозирования, создать инструмент поддержки врачебных решений, улучшить качество и эффективность медицинской помощи.

Выборка представляет собой всех пациентов, которым выполнены лабораторные анализы крови и мочи. Критериями исключения являются пациенты, умершие от внешних причин и травм (коды по МКБ-10: S00-T98 и V01-Y98); пациенты, которые не прикреплены по страховому медицинскому полису на момент исследования и не были прикреплены ранее к КГБУЗ «Хасанская ЦРБ»; пациенты, которые не сдавали анализы.

В выборку включены 21 962 пациента, которые сдавали анализы в период с 01.01.2021 по 01.02.2025 г., из которых 942 умерло и 21 020 живы на момент проведения исследования. С целью поиска взаимосвязей были использованы результаты следующих лабораторных анализов.

  1. Общий (клинический) анализ крови, в том числе развернутый. Для дальнейшей компьютерной обработки анализ декомпозирован по показателям:

1.1. Hct.

1.2. Атипичные лимфоциты (ALY%).

1.3. Атипичные лимфоциты абс. (ALY#).

1.4. Базофилы (BASO%).

1.5. Базофилы абс. (BASO#).

1.6. Гемоглобин (HGB).

1.7. Гранулоциты (GR%).

1.8. Гранулоциты абс. (GR#).

1.9. Гранулоциты незрелые (LIC%).

1.10. Гранулоциты незрелые абс. (LIC#).

1.11. Крупные тромбоциты (PLCR).

1.12. Крупные тромбоциты (PLCС).

1.13. Лейкоциты (WBC).

1.14. Лимфоциты (LYMPH%).

1.15. Лимфоциты абс. (LYMPH#).

1.16. Моноциты (MONO%).

1.17. Моноциты абс. (MONO#).

1.18. Нейтрофилы (NEUT%).

1.19. Нейтрофилы абс. (NEUT#).

1.20. Нормоциты абс. (NRBC#).

1.21. Нормоциты отн. (NRBC%).

1.22. Ретикулоциты (RET%).

1.23. Ретикулоциты абс. (RET#).

1.24. Ретикулоциты незрелые (IRF).

1.25. Ретикулоциты с высокой флуоресценцией (HFR).

1.26. Ретикулоциты с низкой флуоресценцией (LFR).

1.27. Ретикулоциты со средней флуоресценцией (MFR).

1.28. Смешанная фракция (MXD%).

1.29. Смешанная фракция абс. (MXD#).

1.30. СОЭ по Панченкову.

1.31. Средняя концентрация гемоглобина в эритроците (MCHC).

1.32. Среднее содержание гемоглобина в эритроците (MCH).

1.33. Среднее содержание гемоглобина в ретикулоците (RHE).

1.34. Средний объем тромбоцитов (MPV).

1.35. Средний объем эритроцитов (MCV).

1.36. Тромбоцитокрит (PCT).

1.37. Тромбоциты (PLT).

1.38. Фракция незрелых тромбоцитов (IPF).

1.39. Ширина распределения эритроцитов по объему (RDWSD).

1.40. Ширина распределения эритроцитов по объему (RDWCV).

1.41. Ширина распределения тромбоцитов (PDW).

1.42. Эозинофилы (EO%).

1.43. Эозинофилы абс. (EO#).

1.44. Эритроциты (RBC).

  1. Общий анализ мочи, анализ осадка мочи и микроальбуминурия. Для дальнейшей компьютерной обработки анализы декомпозированы по показателям:

2.1. Моча: аскорбиновая кислота.

2.2. Моча: билирубин.

2.3. Моча: глюкоза.

2.4. Моча: кетоновые тела.

2.5. Моча: кровь.

2.6. Моча: лейкоциты.

2.7. Моча: нитриты.

2.8. Моча: относительная плотность.

2.9. Моча: уробилиноген.

2.10. Моча: цвет: бледно-желтый, желтый, коричневый, красный, оранжевый, соломенно-желтый, темно-желтый, бесцветный, насыщенный желтый, светло-желтый, прозрачная.

2.11. Моча: pH качественный и абсолютный.

2.12. Моча: бактерии.

2.13. Моча: билирубин.

2.14. Моча: цилиндры: гиалиновые, зерновидные, восковидные.

2.15. Моча: оксалаты.

2.16. Моча: слизь.

2.17. Моча: соли мочевой кислоты.

2.18. Моча: трипельфосфаты.

2.19. Моча: ураты.

2.20. Моча: фосфаты.

2.21. Осадок мочи: бактерии.

2.22. Осадок мочи: дрожжевые клетки.

2.23. Осадок мочи: кристаллы: аморфные фосфаты, оксалата кальция, соли мочевой кислоты, трипельфосфаты.

2.24. Осадок мочи: лейкоциты.

2.25. Осадок мочи: слизь.

2.26. Осадок мочи: цилиндры: восковидные, гиалиновые, зернистые, лейкоцитарные.

2.27. Осадок мочи: эпителий: плоский, почечный.

2.28. Осадок мочи: эритроциты.

  1. Биохимические и другие показатели крови:

3.1. Гликированный гемоглобин (HbA1c).

3.2. Калий (K+).

3.3. Натрий (Na+).

3.4. Аланинаминотрансфераза.

3.5. Аспартатаминотрансфераза.

3.6. Активированное частичное тромбопластиновое время.

3.7. Непрямой билирубин.

3.8. Общий билирубин.

3.9. Прямой билирубин.

3.10. Гамма-глутамилтрансфераза.

3.11. Глюкоза.

3.12. Креатинкиназа.

3.13. Креатинин.

3.14. Лактатдегидрогеназа.

3.15. Липопротеины высокой плотности.

3.16. Липопротеины низкой плотности.

3.17. Международное нормализованное отношение.

3.18. Мочевая кислота.

3.19. Мочевина.

3.20. Общий белок.

3.21. Протромбиновое время.

3.22. Протромбиновый индекс.

3.23. Ревматоидный фактор.

3.24. Скорость оседания эритроцитов по Вестергрену.

3.25. С-реактивный белок.

3.26. Триглицериды.

3.27. Фибриноген.

3.28. Холестерин.

3.29. Щелочная фосфатаза.

Из имеющихся данных сформирована сводная таблица в MS Office Excel. Анализ данных произведен в программе Gretl 2024b (Version 3, 29 June 2007, дата выпуска 2024-05-21). Поскольку мы анализируем факт смерти или ее отсутствия, то оптимальным методом будет использование бинарной логит-регрессии. В качестве зависимой переменной выбран факт смерти пациента (1) или отсутствия смерти (0), в качестве ре-грессоров установлены все вышеперечисленные показатели анализов, а для небинарных показателей дополнительно их натуральные логарифмы (Ln). В процессе анализа пошагово удалены показатели, у которых уровень статистической значимости различий p-значение > 0,05. С учетом того, что часть пациентов не сдавала некоторые из видов анализов, то в конечную выборку включено 18 649 пациентов, из которых 832 умерло и 17 817 живы на момент проведения исследования.

После всех преобразований и вычислений получается результат, отображенный в (табл. 1, 2, 3).

Таблица 1

Статистическая таблица регрессионного анализа

 

Коэффициент

Ст. ошибка*

z

p-value

Перегородка

-67,981

23,531

-2,889

0,0039

Пол (мужской = 1, женский = 0)

0,492

0,098

5,039

4,68E-07

Возраст, лет

0,080

0,003

23,170

8,82e-119

Гемоглобин, г/л

-0,011

0,003

-3,094

0,002

Средний объем эритроцитов, фл

-0,272

0,075

-3,626

0,0003

Средний объем тромбоцитов, фл

1,197

0,375

3,192

0,0014

Тромбоциты, 109

0,006

0,001

4,885

1,03E-06

Ln (лейкоциты, 109/л)

2,602

0,126

20,680

5,43E-95

Ln (эритроциты, 1012/л)

-1,927

0,475

-4,060

4,90E-05

Ln (лимфоциты абс., 109/л)

-1,506

0,104

-14,530

7,29E-48

Ln (средний объем эритроцитов, фл)

25,271

6,629

3,812

0,0001

Ln (средний объем тромбоцитов, фл)

-23,372

3,937

-5,936

2,91E-09

Ln (ширина распределения эритроцитов по объему, %)

2,233

0,305

7,330

2,30E-13

Ln (тромбоциты, 109/л)

-1,564

0,279

-5,597

2,18E-08

Ln (крупные тромбоциты, %)

3,992

0,314

12,710

5,47E-37

* Стандартные ошибки рассчитаны на основе Гессиана.

Таблица 2

Обобщенные характеристики модели бинарной логистической регрессии

Среднее завис. перемен

0,044614

Ст. откл. завис. перем.

0,20646

R-квадрат Макфаддена

0,490775

Исправ. R-квадрат

0,486364

Лог. правдоподобие

-1731,59

Крит. Акаике

3493,178

Крит. Шварца

3610,681

Крит. Хеннана – Куинна

3531,752

Количество корректно предсказанных случаев = 18 036 (96,7٪)

f(beta'x) для среднего значения независимых переменных = 0,004

Критерий отношения правдоподобия: χ(14) = 3337,7 [ 0,0000]

Таблица 3

Матрица ошибок

Предсказанные

Наблюдаемые

0

1

0

17685

132

1

481

351

Результаты исследования

В ходе проведенного исследования была разработана математическая модель для расчета вероятности летального исхода на основе показателей клинического анализа крови. Полученная формула представляет собой логистическую регрессию со следующими характеристиками.

Расчетная формула:

P = 1 / (1 + exp(-(-67,981 + Σ(xi * bi)))),

где: P – вероятность летального исхода; xi – показатели общего клинического анализа крови; bi – соответствующие коэффициенты регрессоров; Σ – сумма произведений показателей и коэффициентов.

Данная модель позволяет количественно оценить риск неблагоприятного исхода на основе объективных лабораторных данных. Формула включает константу (-67,981) и переменную часть, представляющую собой сумму произведений показателей крови на их весовые коэффициенты.

Обсуждение полученных данных

Разработанная прогностическая модель демонстрирует высокую практическую значимость в контексте современной клинической медицины. Подобные математические модели активно применяются в различных областях медицины для оценки рисков и прогнозирования исходов заболеваний [3][6]. В сравнении со схожими современными исследованиями, в которых для составления прогноза требуется несколько десятков предикторов [1], предложенная формула использует доступные лабораторные показатели, что делает ее легкоинтегрируемой в повседневную клиническую практику.

В сравнении с исследованиями, которые дают долгосрочные прогнозы [5], в данной публикации раскрыта возможность раннего выявления пациентов с повышенным риском летального исхода, что позволяет своевременно корректировать лечебную тактику и уделять повышенное внимание мониторингу их состояния.

Еще одним преимуществом данного прогноза является его применимость ко всем нозологиям, что упрощает его использование, в отличие от моделей, которые применяются на конкретных заболеваниях и состояниях [4][7][2].

Практическое внедрение модели через специализированное программное обеспечение является оптимальным решением, обеспечивающим быструю обработку данных и минимизацию ошибок при расчетах.

В заключение следует отметить, что разработанная модель представляет собой ценный инструмент для клиницистов, позволяющий оптимизировать лечебно-профилактический процесс и повысить качество оказываемой медицинской помощи. Дальнейшие исследования могут быть направлены на валидацию модели на более крупных выборках пациентов и изучение ее применимости в различных клинических сценариях.

Заключение

На основании проведенного исследования можно сформулировать следующие выводы.

  1. Разработанная математическая модель демонстрирует высокую прогностическую ценность в оценке риска летальных исходов у пациентов, что подтверждается статистической значимостью полученных результатов.
  2. Предложенный инструмент позволяет осуществлять раннюю диагностику риска неблагоприятного исхода на основании доступных лабораторных показателей крови, что делает его универсальным для применения в различных клинических условиях.
  3. Внедрение разработанной модели в клиническую практику способствует своевременному выявлению пациентов группы риска, оптимизации лечебной тактики, повышению эффективности мониторинга состояния больных, улучшению качества принимаемых клинических решений.
  4. Рекомендуется реализация модели через специализированное программное обеспечение, что обеспечивает автоматизацию расчетов, минимизацию человеческих ошибок, оперативность получения результатов. удобство интеграции в существующую систему медицинской документации.
  5. Практическая значимость исследования определяется возможностью использования разработанной модели в различных областях клинической медицины для прогнозирования исходов заболеваний и принятия обоснованных терапевтических решений.

Таким образом, проведенное исследование демонстрирует значительный потенциал разработанной модели для улучшения качества оказания медицинской помощи и оптимизации клинических решений.

Список литературы

1. Bahadori M, Soltani M, Soleimani M, Bahadori M Statistical modeling in healthcare: shaping the future of medical research and healthcare delivery. ResearchGate. 2023;9(25):431–446. doi: 10.4018/979-8-3693-0876-9.ch025

2. Toma M, Ong C Predictive modeling in medicine. MDPI. 2023;3(2):590–601. doi: 10.3390/encyclopedia3020042

3. Заворотний О.О., Зиновьев Е.В., Костяков Д.В. Возможности прогнозирования летального исхода тяжелообожженных на основе методов регрессионного анализа. Вестник хирургии имени И.И. Грекова. 2020;179(5):21–29.

4. Hooft L, Schuit E, Debray TPA Prediction models for cardiovascular disease risk in the general population: systematic review damen. Center for health sciences and primary care, university medical center. 2016;353:i2416. doi: 10.1136/bmj.i2416

5. Chao HY, Wu CC, Singh A, Shedd A, Wolfshohl J, Chou EH, Huang YC, Chen KF Using machine learning to develop and validate an in-hospital mortality prediction model for patients with suspected sepsis. Biomedicines. 2022;10(4):802. doi: 10.3390/biomedicines10040802

6. Wendland Ph, Schmitt V, Zimmermann J Machine learning models for predicting severe COVID-19 outcomes in hospitals. Informatics in medicine unlocked. 2023;37:101188. doi: 10.1016/j.imu.2023.101188

7. Насар А.Н., Мадай Д.Ю. Объективная оценка тяжести сочетанной черепно-лицевой травмы (обзор). Кубанский научный медицинский вестник. 2020;27(5):144–162.


Об авторе

А. Н. Мозоль
Хасанская центральная районная больница
Россия

Мозоль Андрей Николаевич – заместитель главного врача по медицинской части

692701, Приморский край, Хасанский МО, п.г.т. Славянка, ул. Молодежная, 3



Рецензия

Для цитирования:


Мозоль А.Н. Прогностическая модель летальности на основе логистической регрессии лабораторных показателей. Тихоокеанский медицинский журнал. 2025;(2):45-49. https://doi.org/10.34215/1609-1175-2025-2-45-49

For citation:


Mozol A.N. Predictive model of mortality based on logistic regression of laboratory indicators. Pacific Medical Journal. 2025;(2):45-49. (In Russ.) https://doi.org/10.34215/1609-1175-2025-2-45-49

Просмотров: 4026


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1609-1175 (Print)