Corrado Magnino
Dirigente Medico di Medicina Interna Ospedale S. Croce e Carle, Cuneo
Introduzione
L’intelligenza artificiale generativa (IAg), attraverso i modelli linguistici di grandi dimensioni (Large Language Models, LLM) – come ChatGPT di OpenAI, Gemini di Google, Claude di Anthropic e Llama di Meta – sta rapidamente entrando nella pratica quotidiana di medici ospedalieri e di medicina generale. Oltre alle banche dati tradizionali e alle linee guida, oggi disponiamo di strumenti capaci di produrre testi, tabelle, sintesi o spiegazioni in pochi secondi.
Se inizialmente la curiosità ha spinto a sperimentazioni estemporanee, oggi si afferma un uso più consapevole: scrivere lettere ai pazienti, generare schede divulgative, preparare tabelle terapeutiche, redigere bozze di relazioni o linee guida interne. Tuttavia, la qualità delle risposte ottenute non dipende tanto dal modello in sé quanto dalla qualità della domanda: il prompt.
Il prompt è la traccia che forniamo al sistema: se vaga, produrrà risposte generiche; se precisa, strutturata e contestualizzata, condurrà a risultati clinicamente utili e verificabili. Scrivere un buon prompt è quindi una competenza da acquisire, al pari del saper formulare un’anamnesi accurata o impostare una diagnosi differenziale.
In questo articolo proponiamo una guida didattica, con schemi pratici, esempi e box esplicativi, per aiutare i medici a orientarsi nella scrittura di prompt efficaci.
Cos’è un prompt e perché è importante
Il prompt non è solo una domanda, ma una vera e propria istruzione che definisce:
- chi deve rispondere (ruolo),
- quali informazioni vengono fornite (dettagli e contesto),
- cosa si desidera ottenere (obiettivo/compito),
- in che forma e per quale destinatario (formato, linguaggio, pubblico).
Un modello linguistico è paragonabile a un attore estremamente versatile: se non gli viene dato un ruolo, improvvisa; se invece gli chiediamo di impersonare un cardiologo, un infettivologo o un docente, userà il linguaggio e le priorità tipiche di quella disciplina.
Diversi studi hanno dimostrato che l’accuratezza delle risposte aumenta significativamente quando il prompt è chiaro, strutturato e dettagliato(1–3).
L’anatomia di un buon prompt: le 4 regole fondamentali
Sono sette i pilastri che rendono un prompt efficace(4,5) (Vedi Box 1):
- Ruolo: specificare l’identità professionale da assumere.
- Dettagli/contesto: Più dettagli diamo, più il LLM si ancora ai dettagli e più riesce a dare delle risposte che effettivamente sono accurate rispetto al quesito che vi state proponendo; non bisogna essere nebulosi o vaghi, bisogna essere precisi come se stessimo parlando di un caso clinico ad un collega: includere dati clinici, anamnesi, referti, valori con unità di misura.
- Obiettivo/compito: chiarire cosa deve fare il modello (es. diagnosi differenziale, riassunto di qualcosa, tabella, spiegazione divulgativa).
- Formato/linguaggio: indicare la forma dell’output e il registro linguistico:
- Pubblico destinatario: a chi è rivolto il testo (collega, paziente, caregiver).
- Modello di ragionamento e fonti: chiedere di ragionare step by step e citare bibliografia verificabile (linee guida, PubMed, revisioni sistematiche).
Occorre soffermarsi un attimo sul concetto di modello “step by step” e spiegarne l’utilità. Chiedere al sistema di “ragionare passo per passo” lo induce a scomporre il problema in fasi ordinate (ipotesi → pro/contro → test discriminanti → decisione provvisoria). Questo approccio rende il processo trasparente, aiuta a ridurre errori e semplificazioni e, soprattutto nei quesiti clinici complessi, aumenta la probabilità di una risposta più accurata e utilizzabile. Non serve per domande banali (es. definizioni o valori di riferimento), ma è prezioso quando l’informazione va integrata e pesata: consente di vedere dove il modello attribuisce valore ai dati (es. un aumento della PCR in un fumatore con calo ponderale) e quali esami propone per discriminare tra le ipotesi. C’è un costo: la risposta può richiedere qualche secondo in più, ma il guadagno in qualità e verificabilità è netto. - Follow-up iterativo nella stessa chat: dopo il primo output, il lavoro non finisce: per aumentare l’accuratezza conviene proseguire nella stessa conversazione con domande di follow-up. Tratta il modello come un collega: chiedi chiarimenti, aggiungi dati mancanti, richiedi priorità tra ipotesi ed esami, fai mettere in evidenza incertezze e red flags. Le versioni recenti dei modelli hanno una finestra di contesto ampia: mantenendo traccia sullo stesso caso, il sistema conserva la memoria dei passaggi precedenti e può raffinare progressivamente la risposta fino a un risultato realmente utilizzabile.
Follow-up utili (esempi rapidi):
- “Quali esami discriminano meglio tra le prime due ipotesi? Ordinali per impatto diagnostico.”
- “Indica pro/contro delle tre diagnosi e la probabilità stimata (bassa/media/alta).”
- “Se arrivasse [nuovo dato], come cambierebbe la priorità? Mostra uno schema se-allora.”
- “Quali red flags imporrebbero invio urgente o ricovero?”
- “Sintetizza in 120 parole per il paziente e aggiungi 2 fonti (stile Vancouver, PubMed/linee guida).”
| Elemento del prompt | Cosa significa | Come esplicitarlo |
| 1. Ruolo | Identità che il modello deve assumere per calibrare linguaggio e priorità. | “Sei un internista esperto di malattie respiratorie.” |
| 2. Dettagli / contesto | Informazioni cliniche complete e pertinenti (anamnesi, esami, terapie, unità di misura). | “Paziente uomo 65 aa, fumatore, tosse 3 sett, febbre 37,8 °C, calo 5 kg. PCR 52 mg/L, AST 95 U/L.” |
| 3. Obiettivo / compito | L’azione che il modello deve compiere: diagnosi differenziale, tabella, sintesi, traduzione. | “Fornisci 3 diagnosi differenziali ordinate per probabilità con breve razionale.” |
| 4. Formato / linguaggio | Struttura dell’output e registro da usare. | “Rispondi in elenco numerato, max 150 parole, linguaggio medico.” |
| 5. Pubblico destinatario | Chi leggerà il testo: collega, paziente, caregiver, istituzione. | “Spiega in linguaggio semplice per un ragazzo di 12 anni.” |
| 6. Step by step | Indurre il modello a scomporre il ragionamento in passaggi successivi. | “Ragiona step by step: elenca ipotesi → pro/contro → esami → decisione temporanea.” |
| 7. Follow-up iterativo | Continuare nella stessa chat con domande aggiuntive per affinare la risposta. | “Approfondisci la seconda ipotesi, indica quali esami discriminano meglio.” · “Se aggiungo [nuovo dato], come cambia la diagnosi?” |
Prompt vaghi vs prompt efficaci
La differenza tra un prompt generico e uno efficace è sostanziale. Si rimanda al Box 2 che ne riassume le caratteristiche.
Box.2– Prompt a confronto
| Elemento del prompt | Cosa significa | Come esplicitarlo | Esempio |
| Prompt generico | Domanda vaga, senza ruolo, dettagli o formato: produce risposte confuse o poco mirate. | “Cosa può avere un paziente con tosse e febbre?” | Output atteso: elenco lungo e dispersivo, poco utile (raffreddore, influenza, polmonite, neoplasia, ecc.). |
| Prompt efficace | Domanda strutturata con ruolo, contesto, obiettivo, formato e fonti: produce risposte più accurate. | “Sei un internista esperto. Uomo 65 aa, fumatore, tosse 3 sett, febbre 37,8 °C, calo 5 kg, PCR 52, AST 95. Fornisci diagnosi differenziale ordinata, con razionale clinico breve, elenco numerato e fonti PubMed.” | Output atteso: elenco ragionato (es. polmonite, TBC, neoplasia polmonare), con motivazioni cliniche e riferimenti bibliografici. |
Applicazioni pratiche in medicina
Gli LLM possono supportare diverse attività, schematizzate nel Box 3. Infine, il Box 4 schematizza i vantaggi e limiti dei principali tipi di prompt più spesso usati in medicina.
Box.3 – Prompt pratici per il medico
| Elemento del prompt | Cosa significa | Come esplicitarlo | Esempio |
| Clinico | Supporto diagnostico o terapeutico (possibile diagnosi differenziale, ipotesi farmacologiche, sintesi anamnestica). | “Sei un ematologo. Elenca le possibili cause di anemia microcitica in uomo 50 aa con Hb 9 g/dL e ferritina 10 µg/L.” | Output: elenco diagnosi differenziali con razionale clinico e riferimenti a linee guida. |
| Organizzativo | Bozze di verbali, lettere, regolamenti o documenti ufficiali. | “Redigi verbale sintetico di una riunione clinica, in 10 righe, con elenco delle decisioni finali.” | Output: testo strutturato e leggibile, facilmente adattabile a uso ufficiale. |
| Didattico | Preparare quiz, schede divulgative o materiali formativi per studenti e pazienti. | “Prepara 5 domande a scelta multipla sulla polmonite pediatrica, con risposte corrette e spiegazione breve.” | Output: batteria di quiz con feedback, utile per attività ECM o didattica. |
Discussione critica
Scrivere un buon prompt non è, dunque, un tecnicismo informatico ma una competenza clinica.
- Clinico: può aiutare il ragionamento diagnostico, ma non sostituisce il giudizio medico.
- Comunicativo: consente di adattare il linguaggio al destinatario, dal collega al paziente.
- Organizzativo: riduce il tempo speso in attività burocratiche.
- Etico-legale: la responsabilità resta del medico, che deve verificare fonti e accuratezza.
- Prospettive: i prompt multimodali (testo + immagini + dati clinici) aprono nuove possibilità, ma richiedono ancora più rigore metodologico.
Il rischio maggiore è attribuire al modello una “sapienza” che non possiede: esso genera testi plausibili, non verità scientifiche. La precisione del prompt è ciò che riduce il divario tra plausibilità e utilità clinica.
Take Home Messages
- Un buon prompt è come una buona anamnesi: dettagliata, ordinata e contestualizzata.
- I sette pilastri (ruolo, dettagli/contesto, obiettivo/compito, formato/linguaggio, pubblico destinatario, modello di ragionamento/fonti, follow up) ne determinano la qualità.
- “Ragiona step by step” (chain of thought) e l’uso iterativo di “follow-up” migliorano l’accuratezza.
- Gli LLM sono strumenti di supporto, non sostituti del giudizio clinico.
- Verificare sempre le fonti: richiedere riferimenti reali (linee guida, PubMed) in formato Vancouver e verificare che siano reali (è sempre possibile che il modello generi allucinazioni).
| Tipologia di prompt | Vantaggi | Limiti | Esempio pratico |
| Prompt clinici (diagnosi differenziali, schemi terapeutici, sintesi anamnestiche) |
– Aiutano a strutturare il ragionamento clinico. – Forniscono sintesi ordinate e leggibili. |
– Rischio di output generici se i dettagli sono scarsi.
– Possibili citazioni inventate (“allucinazioni”). – Non sostituiscono il giudizio medico. |
“Sei un internista. Uomo 70 aa, dispnea da sforzo, Hb 9 g/dL, MCV 70 fL, ferritina 8 µg/L. Fornisci diagnosi differenziale con razionale e fonti PubMed.” |
| Prompt organizzativi (verbali, lettere, regolamenti interni) |
– Risparmio di tempo in attività burocratiche.
– Output già in forma strutturata. – Supporto nella stesura di testi formali. |
– Necessità di revisione finale.
– Rischio di tono poco personalizzato. – Eventuali errori normativi. |
“Redigi verbale sintetico di riunione clinica (max 12 righe), con elenco decisioni e responsabilità assegnate.” |
| Prompt didattici (quiz, schede divulgative, materiale per pazienti/studenti) |
– Creazione rapida di contenuti educativi.
– Adattamento del linguaggio a destinatari diversi. – Utile per ECM e counselling. |
– Rischio di semplificazione eccessiva.
– Necessità di verifica scientifica. – Contenuti variabili tra sessioni. |
“Prepara scheda divulgativa in 150 parole per spiegare a un adolescente cos’è il diabete di tipo 1, con metafora sportiva.” |
| Prompt multimodali (testo + immagini + dati clinici) |
– Consentono di integrare referti, immagini, tracciati ed esami di laboratorio.
– Potenzialmente utili in decisioni complesse. |
– Tecnologia ancora in sviluppo.
– Richiedono piattaforme e hardware avanzati. – Maggiori rischi di privacy e compliance normativa. |
“Analizza RX torace (file allegato) e referto ematochimico. Fornisci diagnosi differenziale step by step.” |
Discussione critica
Scrivere un buon prompt non è, dunque, un tecnicismo informatico ma una competenza clinica.
- Clinico: può aiutare il ragionamento diagnostico, ma non sostituisce il giudizio medico.
- Comunicativo: consente di adattare il linguaggio al destinatario, dal collega al paziente.
- Organizzativo: riduce il tempo speso in attività burocratiche.
- Etico-legale: la responsabilità resta del medico, che deve verificare fonti e accuratezza.
- Prospettive: i prompt multimodali (testo + immagini + dati clinici) aprono nuove possibilità, ma richiedono ancora più rigore metodologico.
Il rischio maggiore è attribuire al modello una “sapienza” che non possiede: esso genera testi plausibili, non verità scientifiche. La precisione del prompt è ciò che riduce il divario tra plausibilità e utilità clinica.
Box.4 – Take Home Messages
- Un buon prompt è come una buona anamnesi: dettagliata, ordinata e contestualizzata.
- I sette pilastri (ruolo, dettagli/contesto, obiettivo/compito, formato/linguaggio, pubblico destinatario, modello di ragionamento/fonti, follow up) ne determinano la qualità.
- “Ragiona step by step” (chain of thought) e l’uso iterativo di “follow-up” migliorano l’accuratezza.
- Gli LLM sono strumenti di supporto, non sostituti del giudizio clinico.
- Verificare sempre le fonti: richiedere riferimenti reali (linee guida, PubMed) in formato Vancouver e verificare che siano reali (è sempre possibile che il modello generi allucinazioni).
Bibliografia
- Fareed M, Fatima M, Uddin J, Ahmed A, Sattar MA. Frontiers | A systematic review of ethical considerations of large language models in healthcare and medicine. [cited 2025 Sept 30]; > link
- Moor M, Banerjee O, Abad ZSH, Krumholz HM, Leskovec J, Topol EJ, et al. Foundation models for generalist medical artificial intelligence. Nature. 2023 Apr;616(7956):259–65
- Thirunavukarasu AJ, Ting DSJ, Elangovan K, Gutierrez L, Tan TF, Ting DSW. Large language models in medicine. Nature Medicine. 2023 Aug;29(8):1930–40
- laitimes. laitimes. 2023 [cited 2025 Sept 30]. Advantages, limitations and risks of GPT-4 as a medical artificial intelligence chatbot. > link
- Patel MR, Balu S, Pencina MJ. Translating AI for the Clinician. JAMA. 2024 Nov 26;332(20):1701–2.