Von Prof. Dr. Cord Spreckelsen, Jena
1. Entscheidungsunterstützungssysteme
Klinische Entscheidungsunterstützungssysteme (Clinical Decision Support Systems - CDSS) sind Computeranwendungen, die medizinische Entscheidungen durch gezielt eingebrachtes medizinisches Wissen oder durch die Auswertung und zielgenaue Mitteilung von Patienten- und anderen Gesundheitsinformationen unterstützen, um die Patientenversorgung zu verbessern. Diese offene Definition entspricht der Vielfältigkeit des Bereichs: CDSS reichen von Prognoseanwendungen (z.B.: Berechnung intensivmedizinischer Überlebenswahrscheinlichkeiten oder Komplikationsrisiken), über die Befundung (z.B.: durch Analyse von Bildern und Signalen), Diagnoseunterstützung (z.B.: Vorschlag von Differenzialdiagnosen), Therapievorschläge (z.B.: Konfiguration komplexer chemotherapeutischer Protokolle), Monitoring (z.B.: Monitoring nosokomialer Infektionen auf Stationsebene), Prä- und Rehabilitationsplanung bis zu computerisierten Leitlinien.
2. Wissensbasierte und nicht-wissensbasierte Ansätze
CDSS werden vielfältig nach Art der Unterstützung oder dem technischen Ansatz unterteilt. Angesichts der Aufmerksamkeit, die maschinelle Lernverfahren aktuell auf sich ziehen, ist die Einteilung in wissensbasierte und nicht-wissensbasierte CDSS wichtig (Sutton et al. 2022): Wissensbasierte CDSS modellieren medizinisches Wissen durch formale, symbolische Ausdrücke (z.B. Wenn-Dann-Regeln). Nicht-wissensbasierte CDSS kommen ohne ein solches explizites Wissensmodell aus. CDSS auf Basis maschineller Lernverfahren (insbesondere auf Basis von Deep Learning, also tiefer künstlicher neuronaler Netze) sind überwiegend nicht-wissensbasiert.
Die US-amerikanische Zulassungsbehörde gibt fortlaufend eine Übersicht über zugelassene KI-Anwendungen in der Medizin (U.S. Food & Drug Administration o.J.). Während der Abfassung dieses Beitrags führt diese Übersicht 521 Anwendungen auf. Nicht alle, aber viele davon sind CDSS. Das zeigt die Bedeutung, die nicht-wissensbasierte Verfahren inzwischen auch international haben. Anhand einiger Beispiele kann das Spektrum der technisch inzwischen verfügbaren entscheidungsunterstützenden KI-Anwendungen skizziert werden:
Durch Bildklassifikation lassen sich über 2.000 dermatologische Erkrankungen in Bildern von Hautläsionen auf Expertenniveau diagnostizieren (Esteva et al. 2017). Der Ansatz nutzt ein tiefes neuronales Faltungsnetz (convolutional neural network), das zunächst auf über 1,2 Millionen allgemeinen Bildern vortrainiert und dann mittels 127.463 dermatologischen Aufnahmen abschließend trainiert wurde. Klassifikation von Bildern durch Faltungsnetze erfolgt z.B. auch zum Erkennen von Lungentumoren in Röntgenbildern (Nam et al. 2019) oder zum Grading von Brustkrebs (Elsharawy et al. 2021). Für die Beurteilung histologischer Schnitte, z.B. die Klassifikation von Tumorzellen, existieren inzwischen Verfahren, die ohne vorherige Markierung kritischer Bereiche auskommen (Full Slide Detection) (Syrykh et al. 2020). KI-Ansätze unterstützen auch Entscheidungen zur Gestaltung diagnostischer Verfahren selbst, z.B. die Auswahl geeigneter Biomarker (Wang et al. 2018).
Mit IDx-DR wurde 2018 ein Gerät zur Erkennung diabetischer Retinopathie zugelassen (van der Heijden et al. 2018). Es markiert die Grenze, an welcher Entscheidungsunterstützung in eine autonome Entscheidungsfindung durch das mit KI ausgestattete Gerät übergeht: IDx-DR prüft selbständig den Grad der Retinopathie.
Über die Diagnostik hinaus wenden KI-Verfahren auch zur Vorhersage eingesetzt: Beispiele sind die Vorhersage des Operationserfolgs (Scheer et al. 2018) oder des Auftretens von kritischen Verschlechterungen bei speziellen Herzerkrankungen, ausgehend von Vitalparametern (Rusin et al. 2016). Beide Beispiele belegen den Nutzen selbst einfacher maschineller Lernverfahren: Die erste Anwendung nutzt Entscheidungsbäume, die aus Daten berechnet wurden, im zweiten Fall kann eine einfache logistische Regression schon bei Änderungen (korrekt) warnen, die für Menschen unauffällig sind. Die Praxistauglichkeit von KI insbesondere zur Analyse biomedizinischer Signale zeigt sich an den inzwischen breit verfügbaren Anwendungen zum Erkennen von Herzrhythmusstörungen in Endkundengeräten wie Smart Watches.
3. Computerisierte Leitlinien und Living Guidelines
Ein wichtiger Typ wissensbasierter CDSS sind computerisierte Leitlinien. Sie bringen Leitlinienwissen in ein algorithmisch verarbeitbares Format und steuern damit klinische Empfehlungen oder das Management von Arbeitsabläufen. Mehrere Studien belegen, dass sich die Leitlinienadhärenz, d.h. die tatsächliche Berücksichtigung von Leitlinien, durch computerisierte Leitlinien steigern lässt und den Behandlungserfolg verbessert (Tafelski et al. 2010). Für die Qualität wissensbasierter CDSS ist entscheidend, dass diese Wissen nutzen, welches im Sinne evidenzbasierter Medizin gewonnen wird. Sie stützen sich auf Ergebnisse methodisch hochwertiger Studien und fachliche Stellungnahmen, die durch systematische Konsentierungsverfahren zu Stande kommen. Computerisierte Leitlinien erfüllen diese Forderung, indem sie bei systematisch entwickelten, evidenzbasierten Leitlinien ansetzen (z.B. S3-Leitlinien der Fachgesellschaften). Ein Qualitätskriterium computerisierter Leitlinien ist die Nutzung von Standards zur algorithmischen Umsetzung des Leitlinienwissens (Leitlinienrepräsentationssprachen). Neben spezifisch für die Medizininformatik entwickelten Formaten, z.B. GLIF, werden zunehmend etablierte Standards aus dem Bereich des Workflowmanagements, hier insbesondere Business Process Model and Notation (BPMN), genutzt. Zur Formalisierung von Entscheidungsregeln und -kriterien existieren zwei HL7-Standards: Arden Syntax und Clinical Quality Language (CQL). Ein neuerer aus dem Unternehmenskontext stammender Standard zur Abbildung von Entscheidungsregeln ist Decision Model and Notation - DMN (Sooter et al. 2019). DMN lässt sich vorteilhaft mit BPMN-Modellen kombinieren.
Eine Herausforderung wissensbasierter CDSS und insbesondere computerisierter Leitlinien ist es, die Wissensbasis aktuell zu halten. Living Guidelines dienen dazu, den Entstehungs- und Aktualisierungsprozess evidenzbasierter Leitlinien durch Standards und Anwendungsprogramme zu unterstützen. Z.B. unterstützt die MAGIC-Plattform die Erstellung strukturierter digitaler Leitliniendokumente und erleichtert die Bewertung von Studienevidenz nach den Grading of Recommendations Assessment, Development and Evaluation (GRADE)-Kriterien (Vandvik et al. 2013). Die Verknüpfung von Living Guidelines und computerisierten Leitlinien ist eine hochaktuelle Perspektive für die Zukunft wissensbasierter CDSS.
4. Regulatorische Rahmenbedingungen
Die Medical Device Regulation der EU (MDR) stellt fest, dass "Software, die dazu bestimmt ist, Informationen zu liefern, die zu Entscheidungen für diagnostische oder therapeutische Zwecke herangezogen werden," als Medizinprodukt mindestens der Klasse IIa zu klassifizieren ist (Europäisches Parlament und Europäischer Rat 2017). Darunter fallen CDSS fast durchgängig. Daher ist für diagnostische oder therapeutische CDSS in aller Regel eine Benannte Stelle einzubeziehen und auf Seiten der Hersteller u.a. ein zertifiziertes Qualitätsmanagementsystem zu etablieren. Besonders herausfordernd ist der Fall von CDSS mit Einfluss auf Entscheidungen, welche den Tod oder irreversible Schäden zur Folge haben können. Solche Anwendungen sind in Klasse III einzuordnen. Das führt zur Verpflichtung, eine klinische Prüfung durchzuführen.
Da unter den regulatorischen Rahmenbedingungen der EU Medizinprodukte bei jeder signifikanten Änderung neu gemeldet und geprüft werden müssen, lassen sich KI-basierte Lösungen, in denen maschinelle Lernverfahren während des Betriebs weiterlernen und das Systemverhalten ändern, aktuell in Europa nicht gesetzeskonform einsetzen.
Weitere einschlägige EU-Normen für CDSS sind die europäische Datenschutzgrundverordnung (DS-GVO) und voraussichtlich zukünftig die KI-Verordnung (Artificial Intelligence Act, AIA). Die DS-GVO fordert eine transparente Verarbeitung personenbezogener Daten – eine methodische Herausforderung für die oft intransparenten, nicht-wissensbasierten CDSS.
Der regulative Rahmen erschwert den Einsatz von CDSS in der EU drastisch, daher sind die Entwicklung und der Einsatz solcher CDSS-Anwendungen EU-weit gefährdet.
5. Effekte von CDSS
CDSS haben belegbar das Potential, die Prozess- und Ergebnisqualität der Patientenversorgung zu verbessern. Wie oben bereits beschrieben, steigern computerisierte Leitlinien die Leitlinienadhärenz. Eine Metaanalyse belegte den positiven Effekt des CDSS-Einsatzes auf Behandlungsergebnisse. (Moja et al. 2014)
In einer viel zitierten Publikation stellten Han et al. (2005) aber auch eine Studie vor, in der die Einführung eines CDSS zu einer Erhöhung der Patientensterblichkeit führte. Zu den diskutierten Gründen gehörte die Störung der Zusammenarbeit im verantwortlichen Team. Der Erfolg von CDSS muss daher umfassend bewertet werden - in der langfristigen Wirkung auf Verantwortliche, unter Routinebedingungen und bezüglich ihres Effekts auf die multiprofessionelle Teamarbeit.
6. Fazit
Das Potential von CDSS ist derart groß, dass auch die regulatorischen Rahmenbedingungen nicht verhindern knnen, dass CDSS medizinische Abläufe beeinflussen, ja voraussichtlich sogar drastisch umformen werden. Dabei wird es darauf ankommen, die Zusammenarbeit von Menschen und Computern in multiprofessionellen Teams sinnvoll zu gestalten. Der Aufbau der dazu notwendigen Digitalkompetenzen muss Qualifikationsziel in allen Gesundheitsberufen werden.
Literatur
Centers for Medicare & Medicaid Services (CMS), HHS. (2010). Medicare and Medicaid programs; electronic health record incentive program. Final rule. Federal Register, 75(144), 44313–44588.
Elsharawy, K. A., Gerds, T. A., Rakha, E. A., & Dalton, L. W. (2021). Artificial intelligence grading of breast cancer: A promising method to refine prognostic classification for management precision. Histopathology, 79(2), 187–199. https://doi.org/10.1111/his.14354
Esteva, A., Kuprel, B., Novoa, R. A., Ko, J., Swetter, S. M., Blau, H. M., & Thrun, S. (2017). Dermatologist-level classification of skin cancer with deep neural networks. Nature, 542(7639), Art. 7639.
Europäisches Parlament und Europäischer Rat (2017). Verordnung (EU) 2017/745 des Europäischen Parlaments und des Rates vom 5. April 2017 über Medizinprodukte, zur Änderung der Richtlinie 2001/83/EG, der Verordnung (EG) Nr. 178/2002 und der Verordnung (EG) Nr. 1223/2009 und zur Aufhebung der Richtlinien 90/385/EWG und 93/42/EWG des Rates. Amtsblatt der Europäischen Union 5.5.2017. 6.3. Anhang VIII, Regel 11.
Han, Y. Y., Carcillo, J. A., Venkataraman, S. T., Clark, R. S. B., Watson, R. S., Nguyen, T. C., Bayir, H., & Orr, R. A. (2005). Unexpected increased mortality after implementation of a commercially sold computerized physician order entry system. Pediatrics, 116(6), 1506–1512.
Moja, L., Kwag, K. H., Lytras, T., Bertizzolo, L., Brandt, L., Pecoraro, V., Rigon, G., Vaona, A., Ruggiero, F., Mangia, M., Iorio, A., Kunnamo, I., & Bonovas, S. (2014). Effectiveness of computerized decision support systems linked to electronic health records: A systematic review and meta-analysis. American Journal of Public Health, 104(12), e12-22.
Nam, J. G., Park, S., Hwang, E. J., Lee, J. H., Jin, K.-N., Lim, K. Y., Vu, T. H., Sohn, J. H., Hwang, S., Goo, J. M., & Park, C. M. (2019). Development and Validation of Deep Learning-based Automatic Detection Algorithm for Malignant Pulmonary Nodules on Chest Radiographs. Radiology, 290(1), 218–228.
Rusin, C. G., Acosta, S. I., Shekerdemian, L. S., Vu, E. L., Bavare, A. C., Myers, R. B., Patterson, L. W., Brady, K. M., & Penny, D. J. (2016). Prediction of imminent, severe deterioration of children with parallel circulations using real-time processing of physiologic data. The Journal of Thoracic and Cardiovascular Surgery, 152(1), 171–177.
Scheer, J. K., Oh, T., Smith, J. S., Shaffrey, C. I., Daniels, A. H., Sciubba, D. M., Hamilton, D. K., Protopsaltis, T. S., Passias, P. G., Hart, R. A., Burton, D. C., Bess, S., Lafage, R., Lafage, V., Schwab, F., Klineberg, E. O., Ames, C. P., & International Spine Study Group. (2018). Development of a validated computer-based preoperative predictive model for pseudarthrosis with 91% accuracy in 336 adult spinal deformity patients. Neurosurgical Focus, 45(5), E11.
Sooter, L. J., Hasley, S., Lario, R., Rubin, K. S., & Hasić, F. (2019). Modeling a Clinical Pathway for Contraception. Applied Clinical Informatics, 10(5), 935–943.
Sutton, R. T., Pincock, D., Baumgart, D. C., Sadowski, D. C., Fedorak, R. N., & Kroeker, K. I. (2020). An overview of clinical decision support systems: Benefits, risks, and strategies for success. Npj Digital Medicine, 3(1), Art. 1.
Syrykh, C., Abreu, A., Amara, N., Siegfried, A., Maisongrosse, V., Frenois, F. X., Martin, L., Rossi, C., Laurent, C., & Brousset, P. (2020). Accurate diagnosis of lymphoma on whole-slide histopathology images using deep learning. NPJ Digital Medicine, 3, 63.
Tafelski, S., Nachtigall, I., Deja, M., Tamarkin, A., Trefzer, T., Halle, E., Wernecke, K. D., & Spies, C. (2010). Computer-assisted decision support for changing practice in severe sepsis and septic shock. Journal of International Medical Research, 38(5), 1605–1616.
U.S. Food & Drug Administration (o.J.). Artificial Intelligence and Machine Learning (AI/ML)-Enabled Medical Devices. https://www.fda.gov/medical-devices/so ... l-enabled-medical-devices. Zugegriffen: 3.2.2023.
van der Heijden, A. A., Abramoff, M. D., Verbraak, F., van Hecke, M. V., Liem, A., & Nijpels, G. (2018). Validation of automated screening for referable diabetic retinopathy with the IDx-DR device in the Hoorn Diabetes Care System. Acta Ophthalmologica, 96(1), 63–68.
Vandvik, P. O., Brandt, L., Alonso-Coello, P., Treweek, S., Akl, E. A., Kristiansen, A., Fog-Heen, A., Agoritsas, T., Montori, V. M., & Guyatt, G. (2013). Creating clinical practice guidelines we can trust, use, and share: A new era is imminent. Chest, 144(2), 381–389.
Wang, A., An, N., Chen, G., Liu, L., & Alterovitz, G. (2018). Subtype dependent biomarker identification and tumor classification from gene expression profiles. Knowledge-Based Systems, 146, 104–117.