L’ospedale cantonale di Baden (OCB) è tenuto per legge a notificare i casi di malattie tumorali al Registro dei tumori del Cantone di Argovia. Il trasferimento manuale dei dati è tuttavia oneroso, poiché le informazioni rilevanti non sono strutturate e sono ripartite su diversi sistemi. Per automatizzare questo processo, l’OCB ha sviluppato un prototipo, con il supporto del progetto «Ecosistema dei dati», il quale struttura automaticamente i dati dopo averli anonimizzati allo scopo di proteggere i dati dei pazienti.
Nell’ambito del progetto, l’OCB ha sviluppato una soluzione tecnica per l’estrazione e l’elaborazione automatizzata dei dati concernenti i tumori. Finora il trasferimento di dati al servizio competente, il Registro dei tumori del Cantone di Argovia, si è rivelato estremamente complesso e problematico. I dati clinici pervengono spesso in forma non strutturata, essendo per esempio contenuti in rapporti medici o in PDF scansionati. Vi è inoltre il problema che i dati sono in parte registrati in modo impreciso o non vengono affatto registrati, il che compromette la completezza e la qualità delle registrazioni. Un’ulteriore difficoltà consiste nell’elevata variabilità del linguaggio medico specialistico.
Sviluppando il prototipo, l’OCB ha implementato una pipeline di estrazione dei dati sui tumori che soddisfa i requisiti posti dalla legge federale sulla registrazione delle malattie tumorali e, allo stesso tempo, impiega soluzioni tecniche innovative. I dati sorgente vengono selezionati dalle applicazioni cliniche e preparati in diverse fasi di elaborazione in modo tale che l’informazione ricercata possa essere estratta con prompt precisi. I migliori risultati sono stati ottenuti con modelli linguistici più piccoli (p. es. 70 miliardi di parametri). Il trattamento dei dati è avvenuto nel rispetto delle disposizioni legislative e delle direttive sulla protezione dei dati.
Per quanto riguarda l’estrazione dei dati con l’IA, sono emersi diversi limiti: vengono utilizzati modelli linguistici accessibili al pubblico, i quali contemplano solo i tumori più frequenti. Di conseguenza, non sono trattati tutti i tumori e la capacità di elaborare in modo affidabile i casi rari risulta pertanto limitata. Un’ulteriore difficoltà è costituita dal fatto che i dati rilevanti per i registri dei tumori non si trovano sempre negli stessi punti dei rapporti, creando così incongruenze. La sospensione del progetto della Confederazione volto ad adottare una soluzione nazionale dei casi di tumore limiterebbe inoltre la scalabilità del prototipo.
L’OCB giunge alla conclusione che l’approccio adottato può fondamentalmente essere applicato anche ad altri ospedali. Nel suo rapporto, sottolinea tuttavia che tale trasferimento non è possibile senza adeguamenti nei casi specifici. I dettagli delle implementazioni tecniche sono pubblicati come software open source e disponibili sul sito GitHub.
Contatto
Cancelleria federale
Settore Trasformazione digitale e governance delle TIC (TDT)
Monbijoustrasse 91
3003 Berna