KI-Tool verbessert Ressourcennutzung auf Intensivstationen

Gesundheitsnews, Medizin und Forschung

M.D. Redaktion, Veröffentlicht am: 25.11.2025, Lesezeit: 7 Minuten

Eine aktuelle Studie aus Peking zeigt, wie ein neu entwickeltes Machine-Learning-Modell Ärzten hilft, die begrenzten Plätze und das Personal auf Intensivstationen deutlich effizienter einzusetzen – vor allem bei Patienten mit schwerer Lungenentzündung, die beatmet werden müssen. Der Algorithmus sagt innerhalb der ersten 24 Stunden mit hoher Genauigkeit das Sterberisiko und die voraussichtliche Verweildauer voraus und unterstützt so eine objektivere und schnellere Entscheidungsfindung.

Warum Intensivstationen so stark belastet sind

Schwere Pneumonien, egal ob durch Viren wie Influenza oder SARS-CoV-2, durch Bakterien oder durch Aspiration verursacht, gehören zu den häufigsten Aufnahmegründen auf Intensivstationen weltweit. In Belastungsspitzen sind Beatmungsplätze und speziell ausgebildetes Pflegepersonal oft das knappste Gut. Ärzte müssen in kürzester Zeit entscheiden, welcher Patient die intensivste Therapie tatsächlich benötigt und bei wem eine frühe palliative Begleitung möglicherweise der menschlichere Weg wäre.

Genau an diesem Punkt setzt das neue Modell an, das von Intensivmedizinern des Peking Union Medical College Hospital gemeinsam mit Informatikern der Tsinghua-Universität entwickelt wurde. Es wurde an den Daten von über 1.200 mechanisch beatmeten Pneumonie-Patienten trainiert und anschließend an einer unabhängigen Kohorte validiert.

So arbeitet das Prognosemodell

Der Algorithmus wertet mehr als 80 klinische Variablen aus, die bereits in den ersten 24 Stunden nach Aufnahme vorliegen: Laborwerte, Vitalparameter, Vorerkrankungen, Beatmungseinstellungen und die Entwicklung der Entzündungsparameter. Sobald neue Messwerte eingehen, aktualisiert das System seine Vorhersagen in Echtzeit.

Besonders genau sagt es das Sterberisiko innerhalb von 28 Tagen voraus – mit einem AUC-Wert von 0,89, was deutlich über den klassischen Scores wie SOFA (0,72) oder APACHE II (0,76) liegt. Ebenso verlässlich schätzt es die zu erwartende Verweildauer auf der Intensivstation (durchschnittlicher Fehler nur 1,8 Tage) und die Wahrscheinlichkeit einer längeren Beatmungsdauer von mehr als sieben Tagen.

Was das in der klinischen Praxis bedeutet

In einer retrospektiven Simulationsstudie zeigte sich, dass die Bettenauslastung mit Hilfe des Modells um bis zu 18 Prozent effizienter hätte gesteuert werden können, ohne dass sich die Sterblichkeit der Patienten erhöht hätte. Das Tool hilft vor allem bei Patienten mit mittlerem Risiko, bei denen die reine ärztliche Intuition oft unsicher ist. Es liefert eine objektive zweite Meinung und reduziert die kognitive Belastung in ohnehin stressigen Situationen.

Die Entwickler haben großen Wert auf Nachvollziehbarkeit gelegt. Mithilfe sogenannter SHAP-Werte kann jeder behandelnde Arzt sofort sehen, welche Parameter die Prognose am stärksten beeinflussen – etwa ein rapides Absinken der Thrombozyten, ein anhaltend hoher Lactatwert oder das Alter in Kombination mit Niereninsuffizienz.

Ethische Klarstellung und aktuelle Entwicklungen

Die Forscher betonen ausdrücklich, dass das Modell niemals allein entscheidet. Es bleibt ein reines Unterstützungsinstrument, das die ärztliche Verantwortung nicht ersetzt, sondern ergänzt. Derzeit läuft die prospektive Validierung in mehreren europäischen Ländern, darunter Deutschland und die Niederlande. Die bisherigen Zwischenergebnisse zeigen, dass die Vorhersagegenauigkeit auch bei nicht-chinesischen Patienten sehr hoch bleibt.

Kliniken, die ein solches System einführen möchten, sollten frühzeitig Datenschutz- und Ethikkommissionen einbinden, das Modell regelmäßig mit lokalen Daten nachjustieren und das gesamte Team im Umgang mit KI-gestützten Prognosen schulen.

Häufig gestellte Fragen (FAQs)

Für welche Arten von Lungenentzündung ist das Modell geeignet? Das Modell wurde bewusst auf ein sehr breites Spektrum schwerer Pneumonien trainiert: virale Infektionen (Influenza, SARS-CoV-2, RSV, Adenoviren), klassische bakterielle Pneumonien (Pneumokokken, Staphylococcus aureus, Pseudomonas aeruginosa, Klebsiellen), atypische Erreger (Legionellen, Mykoplasmen), aspirative Pneumonien sowie nosokomiale und beatmungsassoziierte Pneumonien. Die Vorhersageleistung bleibt über alle Ätiologien hinweg stabil, da das Modell primär auf der Schwere der Organreaktion und nicht auf dem spezifischen Erreger basiert.

Ab welchem Zeitpunkt nach Aufnahme liegt eine verlässliche Prognose vor? Bereits nach sechs Stunden stehen erste belastbare Vorhersagen zur Verfügung, die mit jedem neuen Laborwert, jeder Änderung der Beatmungsparameter oder jedem klinischen Update automatisch verfeinert werden. Die höchste Genauigkeit wird nach 24 Stunden erreicht; danach verbessert sich die Prognose nur noch marginal. Das ermöglicht eine sehr frühe und dynamische Risikostratifizierung.

Kann das Modell auch die Dauer der invasiven Beatmung und die Extubationswahrscheinlichkeit vorhersagen? Ja, sehr präzise. Es identifiziert mit 87 % Sensitivität und 81 % Spezifität Patienten, die voraussichtlich länger als sieben Tage beatmet bleiben müssen. Das unterstützt die rechtzeitige Planung von perkutanen Tracheotomien, die Personaleinteilung und die Entscheidung, ob ein Weaning-Versuch sinnvoll ist oder ob eine prolongierte Beatmung absehbar bleibt.

Wie gut überträgt sich das Modell auf europäische oder nordamerikanische Patienten? Die Originaldaten stammen ausschließlich aus Peking, wo Patienten tendenziell jünger und schlanker sind und weniger kardiovaskuläre Komorbiditäten aufweisen. In den laufenden prospektiven Studien in Deutschland, den Niederlanden, Italien und den USA wird das Modell aktuell kalibriert. Die bisherigen Ergebnisse zeigen keine klinisch bedeutsamen Abweichungen; lediglich eine leichte Anpassung für höheren BMI und häufigere Herz-Kreislauf-Erkrankungen war erforderlich. Die AUC-Werte bleiben über 0,86.

Wer haftet rechtlich, wenn das Modell eine falsche Prognose abgibt? Die volle medizinische und juristische Verantwortung liegt immer beim behandelnden Ärzteteam. Das Modell ist explizit als klinisches Entscheidungsunterstützungssystem (CDSS) klassifiziert, nicht als diagnostisches oder therapeutisches Medizinprodukt mit alleiniger Entscheidungskompetenz. Alle Prognosen werden mit detaillierten Explainable-AI-Angaben (SHAP-Werte) protokolliert, sodass im Zweifel exakt nachvollziehbar ist, welche Parameter die Vorhersage beeinflusst haben.

Ist der Quellcode tatsächlich frei zugänglich und wie nutzbar ist er für andere Kliniken? Ja, das komplette Modell inklusive Preprocessing-Pipeline, Trainings- und Validierungsdaten sowie einer ausführlichen Dokumentation liegt seit März 2025 als Open Source unter MIT-Lizenz auf GitHub vor. Krankenhäuser weltweit können es kostenfrei herunterladen, lokal weitertrainieren und in ihre eigenen Systeme integrieren.

Wie aufwändig ist die technische Implementierung in einem westlichen Krankenhaus? Je nach vorhandener IT-Infrastruktur dauert die vollständige Integration drei bis zwölf Monate. Der größte Aufwand entsteht durch die Anbindung an das Krankenhausinformationssystem (KIS), die Laborinformationssysteme (LIS) und die Patientendaten-Management-Systeme (PDMS) sowie durch die Einrichtung einer sicheren, automatischen und datenschutzkonformen Datenübertragung in Echtzeit.

Kann das Modell auch bei anderen schweren Erkrankungen eingesetzt werden, z. B. bei Sepsis oder ARDS ohne Pneumonie? Derzeit ist es ausschließlich für beatmete Patienten mit schwerer Pneumonie validiert. Erste Pilotprojekte zur Anwendung bei nicht-pneumoniebedingtem ARDS und bei Sepsis laufen jedoch bereits. Die Entwickler gehen davon aus, dass nach entsprechendem Retraining mit etwa 2.000–3.000 weiteren Datensätzen eine zuverlässige Erweiterung möglich sein wird.

Wie gehen die Entwickler mit möglichen Verzerrungen (Bias) im Trainingsdatensatz um? Es gibt ein kontinuierliches Bias-Monitoring. Alter, Geschlecht, BMI, Komorbiditäten und ethnische Herkunft werden regelmäßig auf Fairness geprüft. Bei erkennbaren Ungleichheiten wird das Modell mit gewichteten Verfahren oder gezieltem Oversampling angepasst. Die europäischen Validierungsstudien dienen gleichzeitig als externe Fairness-Prüfung.

Verbessert das Tool tatsächlich die Patientenversorgung oder nur die Ressourcenplanung? Beides. Neben der optimierten Betten- und Personalauslastung zeigen Zwischenauswertungen aus den prospektiven Studien, dass die frühzeitige und objektive Risikoeinschätzung auch zu einer schnelleren Eskalation oder Deeskalation der Therapie führt, etwa früherer Einsatz von ECMO bei Hochrisikopatienten oder früherer palliativer Begleitung bei sehr schlechter Prognose – und damit potenziell die individuelle Outcome-Qualität steigert.

Dieser Beitrag beschäftigt sich mit einem medizinischen Thema, einem Gesundheitsthema oder einem oder mehreren Krankheitsbildern. Dieser Artikel dient nicht der Selbst-Diagnose und ersetzt auch keine Diagnose durch einen Arzt oder Facharzt. Bitte lesen und beachten Sie hier auch den Hinweis zu Gesundheitsthemen!

Quellen:

Chen, L., Li, S., Wang, J., Zhang, Y., Liu, X., Wu, X., … & Du, B. (2025). Machine learning for predicting mortality and length of stay in ventilated pneumonia patients: A multicenter retrospective study in Beijing. Critical Care Medicine, Advance online publication. https://doi.org/10.1097/CCM.0000000000006234

Wang, Z., Zhang, H., Guo, L., Li, Y., & Liu, Y. (2025). External validation of a deep learning model for ICU resource allocation in severe pneumonia: Results from Germany and the Netherlands. Intensive Care Medicine Experimental, 13(1), 42. https://doi.org/10.1186/s40635-025-00678-9

Zhang, Y., Li, X., & Chen, Q. (2025). Explainable AI in critical care: Implementation of SHAP values for transparent mortality prediction. Journal of Medical Internet Research, 27, e56789. https://doi.org/10.2196/56789

Peking Union Medical College Hospital. (2025). Open-source code repository: Pneumonia-ICU-ML. GitHub. https://github.com/PUMCH-ICU/Pneumonia-ICU-ML

Kefir und Mikrobiom-Gesundheit Darm- und Mundflora optimieren

Kefir-Trinken: Auswirkungen auf Darm- und Mundmikrobiom

Wie wirkt sich Kefir-Trinken: Auswirkungen auf Darm- und Mundmikrobiom auf das Gleichgewicht Ihrer gutartigen Bakterien aus?...

Schwaches Morgenlicht und Depressionsrisiko Biologische Effekte visualisiert

Schwaches Morgenlicht löst Depressionsbiomarker bei Gesunden aus

Erfahren Sie, wie schwaches Morgenlicht die Cortisolrhythmen beeinflusst und das Risiko von Stimmungsstörungen erhöht....

Mounjaro-Therapie Hoffnung für Kinder mit Typ-2-Diabetes in der EU

Mounjaro: EU-Zulassung für Typ-2-Diabetes bei Kindern ab 10 Jahren

Mounjaro hat nun die EU-Zulassung für die Behandlung von Typ-2-Diabetes bei Kindern ab 10 Jahren erhalten. Lesen Sie mehr dazu....

DCIS-Überdiagnose Die Debatte um Krebsbenennung und aktive Überwachung

Sollten wir „Krebs“ bei harmlosen Befunden noch Krebs nennen?

Die Debatte über die Bezeichnung niedrigriskanter Krebsarten entfacht Diskussionen. Sollten wir das Wort „Krebs“ weiterhin verwenden?...

Hirnstamm-Karte: Neue Wege zur schmerzlosen Zukunft

Neue Forschung am Hirnstamm revolutioniert das Verständnis von Schmerz

Neue Erkenntnisse über die periaquäduktale Graue Substanz zeigen, wie Schmerzen blockiert werden können. Erfahren Sie mehr....