Dott. Corrado Magnino, Medicina Interna A.O. S. Croce e Carle Cuneo Dott. Elvio Russi

In occasione del corso “Fondamenti di Intelligenza Artificiale per Medici e Professionisti Sanitari”, organizzato dalla commissione Algoretica dell’OMCeO Cuneo insieme all’A.O. S. Croce e Carle (20 febbraio), abbiamo chiesto al prof. Luca Piovesan, docente di informatica dell’Università del Piemonte Orientale, di “decodificare” per i medici cuneesi l’architettura delle reti neurali artificiali: come funzionano, quali sono i passaggi matematici essenziali e in che modo si inseriscono nell’ecosistema del deep learning.

Questa alfabetizzazione, pur impegnativa per chi non ha una formazione informatica, può offrire ai clinici strumenti concettuali utili per governare i predittori algoritmici con maggiore consapevolezza, superando un uso passivo della tecnologia (Piovesan, 2026).

“L’ingegneria del software moderno ricalca la neurobiologia umana.”

Dal neurone biologico al perceptron

La base di molte reti neurali è il perceptron, un’unità computazionale che riproduce in forma astratta alcune funzioni del neurone (Fig. 1A). Gli input incorporano variabili quantitative del paziente e operano come dendriti (Fig. 1B). A ciascun input il sistema associa un peso, un coefficiente numerico che quantifica quanto quella variabile contribuisca al calcolo complessivo, in analogia con la forza sinaptica (Fig. 1C). Il nodo di somma (∑) esegue una sommatoria algebrica degli ingressi pesati e applica una funzione di attivazione, producendo un output che prosegue lungo l’“assone” digitale.

Dal neurone biologico al perceptron

La base di molte reti neurali è il perceptron, un’unità computazionale che riproduce in forma astratta alcune funzioni del neurone (Fig. 1A). Gli input incorporano variabili quantitative del paziente e operano come dendriti (Fig. 1B). A ciascun input il sistema associa un peso, un coefficiente numerico che quantifica quanto quella variabile contribuisca al calcolo complessivo, in analogia con la forza sinaptica (Fig. 1C). Il nodo di somma (∑) esegue una sommatoria algebrica degli ingressi pesati e applica una funzione di attivazione, producendo un output che prosegue lungo l’“assone” digitale.

Perché qui la programmazione “classica” non basta

Il passaggio chiave rispetto alla programmazione tradizionale è l’apprendimento per esposizione. Quando la macchina viene addestrata su un database di casi clinici con esito noto, formula una previsione e misura lo scarto rispetto alla diagnosi reale. Con la backpropagation (Fig. 1C) l’errore viene propagato all’indietro e i pesi interni vengono ricalibrati in modo iterativo (Piovesan, 2026). È questo meccanismo—più che una singola regola scritta a mano—che consente al modello di migliorare progressivamente.

Dal singolo neurone alle reti profonde

Un singolo neurone artificiale, però, non è sufficiente quando i quadri fisiopatologici sono non lineari. Da qui nasce lo sviluppo delle reti neurali, che collegano molti perceptron in sequenza. Il deep learning ne rappresenta l’evoluzione: tra l’ingresso dei dati e l’output diagnostico vengono inseriti numerosi strati nascosti, ciascuno dei quali rielabora le informazioni del livello precedente. Il risultato è una trasformazione progressiva dei segnali in rappresentazioni dove la separazione tra classi cliniche risulta più semplice. Questa “profondità” è stata resa praticabile dalla disponibilità di GPU e dall’espansione dei dati sanitari digitali.

Quali architetture hanno dato risultati solidi?

Nel materiale discusso al corso, le Feed Forward Networks vengono presentate soprattutto sul piano teorico. Sono reti pensate per lavorare su informazioni strutturate—come le colonne di un database clinico—con un flusso unidirezionale: i parametri del paziente entrano, attraversano i livelli e producono un risultato, senza cicli di retroazione (Piovesan, 2026). L’assenza di dettagli applicativi nel materiale limita però un approfondimento basato su evidenze specifiche.

Diverso il caso dell’imaging. In radiologia, le reti convoluzionali (CNN) scompongono la tomografia in pattern elementari e li ricompongono in caratteristiche sempre più informative, fino a evidenziare anomalie che possono sfuggire alla valutazione umana. Le valutazioni comparative indicano che la performance dei modelli di visione ha superato alcune soglie legate ai limiti fisiologici dell’osservazione già nel 2015 (He, 2016).

Un esempio clinicamente orientato è lo screening oncologico. Il modello convoluzionale PANDA elabora TC senza mezzo di contrasto per intercettare l’adenocarcinoma duttale pancreatico in fase asintomatica. Nella validazione multicentrica, la rete neurale ha superato l’accuratezza media dei radiologi, con un incremento della sensibilità del 34,1% e un aumento della specificità del 6,3% (Cao, 2023). Da qui si apre naturalmente il tema di un’altra famiglia di modelli: quelli che non analizzano immagini statiche, ma sequenze.

Quando conta la sequenza: le reti ricorrenti

Le reti ricorrenti (RNN) sono impiegate per interpretare flussi temporali—ad esempio elettrocardiogrammi o monitoraggi continui—conservando memoria del dato precedente per leggere l’andamento complessivo. La capacità di trattare stringhe e sequenze biologiche ha avuto ricadute anche sul versante molecolare: Piovesan richiama, tra gli esempi, la sintesi strutturale di proteine complesse e la codifica in silico del Rentosertib, inibitore mirato per la fibrosi polmonare idiopatica, arrivato a trial di fase due.

Generativa e trial clinici: il nodo etico-organizzativo

L’intelligenza artificiale generativa sposta l’attenzione dal riconoscimento di pattern alla produzione di dati. In ambito sperimentale, un’applicazione discussa è l’uso di pazienti sintetici negli studi randomizzati: addestrando modelli su ampi campioni reali, i software generano fenotipi che riproducono curve di sopravvivenza comparabili a quelle osservate. L’obiettivo è ridurre la quota di pazienti assegnati al braccio di controllo, mantenendo la robustezza statistica del disegno sperimentale. L’adozione sul territorio, però, richiede un adeguamento dei comitati etici e delle procedure di valutazione.

Il dominio testuale: LLM, referti e rischio di allucinazioni

Nel testo clinico entrano in gioco i large language models, potenziati dal meccanismo di attenzione, che stima l’interdipendenza tra termini anche distanti nel documento. Interrogato dal medico, il modello può redigere lettere di dimissione o riassumere degenze selezionando i vocaboli in base a probabilità stocastiche di occorrenza (Piovesan, 2026).

Qui emergono ostacoli pratici: l’assemblaggio probabilistico può generare allucinazioni, producendo referti formalmente corretti ma fondati su presupposti anamnestici inesistenti. Esiste inoltre il rischio di attingere a direttive “precaricate” non allineate ai percorsi regionali, oltre al tema medico-legale dell’ininterpretabilità di modelli con miliardi di parametri. Per ridurre questi rischi, le aziende sanitarie stanno convergendo verso il framework Retrieval Augmented Generation (RAG): il modello viene vincolato a recuperare informazioni da archivi locali certificati (linee guida e protocolli della struttura) prima di generare la risposta. In prospettiva, anche un contesto provinciale come Cuneo potrebbe beneficiare di interrogazioni su repository limitati e validati, con un controllo più stretto sull’affidabilità dell’output.

Take Home Message
– Le reti neurali apprendono calibrando i pesi interni tramite retropropagazione dell’errore (backpropagation).
– Il deep learning usa molti strati nascosti e ha migliorato le prestazioni nell’imaging oncologico.-
– I pazienti in silico possono rafforzare la potenza statistica dei trial e ridurre il ricorso al braccio di controllo, ma richiedono governance etica.
– I modelli linguistici generano testo su base probabilistica: servono revisione clinica e vincoli (es. RAG) per limitare allucinazioni e disallineamenti procedurali.

Bibliografia
1. Cao K, Xia Y, Yao J, et al. Large-scale pancreatic cancer detection via non-contrast CT and deep learning. Nature Medicine. 2023;29:3033–3043.
2. He K, Zhang X, Ren S, Sun J. Deep Residual Learning for Image Recognition. 2016: 770–8.
3. Piovesan L. Deep Learning e LLM in Sanità. Corso di formazione A.O. S. Croce e Carle – Cuneo. 2026.