Negli ultimi anni 濒鈥Intelligenza Artificiale (IA) ha iniziato a farsi strada anche in ambiti tradizionalmente complessi come 濒鈥檃natomia patologica. In particolare, i Large Language Models (LLMs), come ChatGPT, vengono sempre pi霉 impiegati per assistere i medici nella sintesi di informazioni cliniche, nella redazione di referti e nel supporto alle diagnosi. Ma fino a che punto si pu貌 fare affidamento su un algoritmo quando si tratta di salute e decisioni cliniche?
Un recente studio pubblicato sulla rivista Virchows Archiv, dal titolo 鈥溾, ha cercato di rispondere a questa domanda analizzando in modo sistematico punti di forza e limiti di ChatGPT 3.5 in anatomia patologica, la branca della medicina che elabora diagnosi partendo dai tessuti umani: passaggio fondamentale per guidare il trattamento, soprattutto per le patologie neoplastiche.
Lo studio 猫 stato guidato da Salvatore Lorenzo Renne, Professore Associato presso 麻豆传媒AV在线看 University, e Silvia Uccella, Professore Ordinario, Direttrice della Scuola di Specializzazione in Anatomia Patologica di 麻豆传媒AV在线看 University e Responsabile del濒鈥橴nit脿 Operativa di Anatomia Patologica presso 濒鈥橧RCCS Istituto Clinico 麻豆传媒AV在线看, e condotto da Vincenzo Guastafierro, specializzando in Anatomia Patologica presso lo stesso istituto. La pubblicazione 猫 valsa 濒鈥檃ssegnazione del Premio Anzalone, conferito il 18 ottobre dal濒鈥橭rdine dei Medici Chirurghi e degli Odontoiatri della Provincia di Milano, al dott. Guastafierro.
Lo studio: come si 猫 svolto
Gli autori hanno descritto 50 casi clinici istopatologici, coprendo dieci diversi ambiti di anatomia patologica fornendo, in ognuno, tutti gli elementi sufficienti per la diagnosi. Per ciascun caso, hanno chiesto a ChatGPT di proporre una diagnosi, come farebbe un patologo.
In particolare ogni scenario 猫 stato presentato a ChatGPT in diverse modalit脿 (chiedendo di vagliare alcune ipotesi diagnostiche proposte o chiedendo quali fossero le ipotesi pi霉 probabili, senza limitare il campo); inoltre ogni modalit脿 猫 stata sottoposta con o senza la richiesta di fornire i riferimenti scientifici per giustificare la risposta. Le risposte sono state valutate da sei patologi esperti, che ne hanno giudicato utilit脿 e accuratezza, annotando eventuali errori.
Nel complesso, ChatGPT ha fornito risposte ritenute utili in circa il 62% dei casi, dimostrando una buona capacit脿 di comprendere il linguaggio tecnico e di costruire argomentazioni coerenti. Tuttavia, solo un terzo delle risposte 猫 risultato completamente privo di errori, a conferma che il modello, pur competente sul piano linguistico, non garantisce ancora un鈥檃ccuratezza diagnostica costante.
Per quanto riguarda le citazioni bibliografiche, circa il 70% era corretto, mentre una considerevole percentuale risultava imprecisa (12,1%) o addirittura inesistente (17,8%), secondo un fenomeno noto come hallucination.
Secondo gli autori questi risultati non rappresentano un fallimento, ma un punto di partenza per comprendere come integrare strumenti di IA nella pratica medica. ChatGPT mostra un potenziale interessante come supporto al ragionamento diagnostico, ma il suo utilizzo richiede supervisione esperta e consapevolezza dei limiti del modello.
Perch茅 questi errori?
A differenza di un medico, un modello linguistico non 鈥渃omprende鈥 davvero ci貌 che elabora. ChatGPT genera testo sulla base di schemi linguistici e probabilit脿 statistiche calcolate su grandi set di informazioni esistenti, non di conoscenze verificate nel merito o di un ragionamento causale. Spesso inoltre non distingue le fonti pi霉 aggiornate da quelle pi霉 obsolete.
Quando viene interrogato su casi complessi, come la distinzione tra due tumori simili, il modello tende a produrre risposte coerenti nella forma e nel contesto, ma talvolta inesatte nel contenuto. Analogamente, gli errori nelle bibliografie derivano dal fatto che il sistema pu貌 combinare nomi di riviste, autori e titoli in modo plausibile ma non reale.
Gli autori sottolineano che, sebbene ChatGPT mostri potenzialit脿, il suo impiego richiede cautela e non 猫 ancora idoneo alla pratica diagnostica quotidiana, e suggeriscono che, in futuro, LLMs specializzati potrebbero fungere da assistenti di supporto in contesti complessi, come quello della diagnosi istologica. Inoltre, il notevole tasso di imprecisione rilevato nella generazione delle referenze bibliografiche indica la necessit脿 di cautela nel suo utilizzo come strumento di apprendimento da parte degli studenti.
In conclusione, i risultati confermano che ChatGPT non 猫 ancora in grado di sostituire il giudizio umano nell’ambito della diagnosi istopatologica, evidenziando il ruolo imprescindibile del patologo. La responsabilit脿 ultima della diagnosi rimane saldamente nelle mani del professionista umano.
Uno strumento, non un sostituto
L鈥檃rticolo evidenzia un concetto chiave: 濒鈥橧A, per quanto sofisticata, non pu貌 sostituire lo studio, il ragionamento e il giudizio di un medico. L鈥檃natomia patologica non si limita al濒鈥檃nalisi testuale, ma richiede anche 濒鈥檌nterpretazione visiva dei campioni, 濒鈥檌ntegrazione dei dati clinici e il confronto con il team sanitario, tutti aspetti che richiedono il contributo fondamentale del patologo.
La vera sfida non 猫 sostituire 濒鈥檈ssere umano, ma costruire una collaborazione sicura e trasparente tra uomo e macchina. Solo cos矛 la tecnologia pu貌 diventare un alleato affidabile della medicina, e non un rischio nascosto dietro un linguaggio perfettamente formulato.

