Automatisierte Datenextraktion für Krebsregister

Das Kantonsspital Baden (KSB) ist gesetzlich verpflichtet, Krebserkrankungen an das Krebsregister Aargau zu melden. Die manuelle Datenübermittlung ist jedoch aufwendig, da die relevanten Informationen unstrukturiert und über diverse Systeme verteilt sind. Um diesen Prozess zu automatisieren, hat das KSB – unterstützt durch das Projekt Datenökosystem – einen Prototyp entwickelt. Dieser strukturiert die Daten automatisch und anonymisiert sie vorab zum Schutz der Patientendaten.

Im Rahmen des Projekts hat das KSB eine technische Lösung zur automatisierten Extraktion und Aufbereitung von Krebsdaten entwickelt. Bisher erwies sich der Datentransfer an die zuständige Stelle, das Krebsregister Aargau, als äusserst komplex und war mit verschiedenen Hürden versehen. So liegen klinische Daten beispielsweise oft in unstrukturierter Form vor, wie etwa in Arztberichten oder als eingescannte PDFs. Dazu besteht die Herausforderung, dass Daten teilweise ungenau oder gar nicht erfasst werden, was die Vollständigkeit und Qualität der Registereinträge beeinträchtigt. Eine weitere Schwierigkeit ist die hohe Variabilität in der medizinischen Fachsprache.

Mit dem Prototyp hat das KSB eine Extraktionspipeline für Krebsdaten implementiert, welches die gesetzlichen Anforderungen des Krebsregistergesetzes erfüllt und gleichzeitig innovative technische Lösungen einsetzt. Dabei werden die Quelldaten aus den Klinikapplikationen ausgewählt und mit verschiedenen Verarbeitungsschritten so vorbereitet, dass die gewünschte Information mit präzisen Prompts extrahiert werden kann. Die besten Ergebnisse wurden mit kleineren Sprachmodellen (z.B. mit 70 Milliarden Parametern) erzielt. Dabei erfolgte die Datenverarbeitung unter Einhaltung gesetzlicher Vorgaben und Datenschutzrichtlinien.

In Bezug auf die Datenextraktion mit KI wurden verschiedene Grenzen festgestellt: Es werden öffentlich zugängliche Sprachmodelle verwendet. Das Training dieser umfasst nur häufige Krebserkrankungen. Dadurch werden nicht alle Krebserkrankungen abgedeckt. Somit ist die Fähigkeit eingeschränkt, seltene Fälle zuverlässig zu verarbeiten.
Andererseits zeigt sich eine weitere Schwierigkeit darin, dass die für die Krebsregister relevanten Daten in den Berichten nicht immer an denselben Stellen zu finden sind, wodurch Inkonsistenzen entstehen. Ebenfalls wird erwähnt, dass durch die Einstellung des nationalen Projekts zur Beschaffung einer landesweiten Lösung zur Erfassung von Krebsfällen die Skalierbarkeit des Prototyps begrenzt wird.

Das KSB kommt zu dem Schluss, dass sich ihr gewählter Ansatz grundsätzlich auf andere Spitäler übertragen lässt. In ihrem Bericht betont das KSB jedoch, dass dieser Transfer nicht ohne individuelle Anpassungen möglich ist. Die Details der technischen Umsetzungen sind als Open-Source-Software veröffentlicht und auf GitHub abrufbar.

Kontakt

Bereich Digitale Transformation und IKT-Lenkung (DTI)

Monbijoustrasse 91
3003 Bern

dataspaces@bk.admin.ch

Kontaktinformationen drucken

https://www.bk.admin.ch/content/bk/de/home/digitale-transformation-ikt-lenkung/datenoekosystem_schweiz/prototypen/krebsdatenksb.html