ChatGPT 5 è uscito venerdì, mettendo finalmente fine a voci e supposizioni. Il lancio è in corso e, come promesso da OpenAI, questa versione è più veloce, più intelligente e più precisa che mai.

Il grande cambiamento? OpenAI ha aggiunto un nuovo algoritmo che seleziona automaticamente il modello migliore per l'attività, garantendo che tutto funzioni in modo fluido ed efficiente.

Ora, ecco dove la cosa si fa interessante: OpenAI sta dedicando particolare attenzione all'assistenza sanitaria. Non avevamo mai visto un'attenzione del genere prima, quindi prima di riferire le solite novità (attenzione, lasciamo passare una settimana in modo che il fermento si calmi e arrivi la vera novità - occhiolino, occhiolino), per ora ci concentriamo su questo.

A quanto pare, la capacità del nuovo modello di scomporre termini medici complessi e spiegare i risultati di laboratorio sta suscitando molta attenzione. E questo è stato effettivamente verificato.

All'inizio eravamo un po' "mmmm", ma poi abbiamo detto: "Che diavolo, vediamo di cosa si tratta".

Cosa dice OpenAI su ChatGPT5

OpenAI ha affermato che ChatGPT 5 è il loro modello più veloce e accurato finora. Offre miglioramenti nel ragionamento, nelle prestazioni e nella capacità di selezionare l'algoritmo migliore per ogni attività, che si tratti di rispondere a domande o di risolvere problemi complessi. ChatGPT 5 è stato progettato per essere uno strumento potente per un'ampia gamma di utilizzi, dalla programmazione all'assistenza sanitaria, fornendo risposte chiare e contestualizzate.

"Abbiamo progettato ChatGPT 5 per essere il nostro modello più potente, accurato e veloce di sempre. È progettato per gestire una varietà di attività e supportare settori come l'assistenza sanitaria, dove la precisione è fondamentale." Sam Altman, CEO di OpenAI

In ambito sanitario, OpenAI sottolinea che ChatGPT 5 può semplificare la terminologia medica, spiegare i risultati di laboratorio e offrire consigli generali sulla salute. Sebbene non sia concepito per sostituire gli operatori sanitari, l'azienda lo considera uno strumento per aiutare gli utenti a comprendere meglio le proprie informazioni sanitarie.

Cosa significa (in parole umane)

ChatGPT 5 è più veloce, più intelligente e più affidabile. Il suo punto di forza? Può comprendere e rispondere a una gamma più ampia di domande con maggiore precisione. Sceglierà persino l'algoritmo migliore per l'attività in base ai tuoi input. Quindi, anche se non sai quale approccio adottare, ChatGPT 5 ti copre le spalle, assicurandoti di ottenere i migliori risultati.

Nel campo dell'assistenza sanitaria, questo significa che puoi utilizzarlo per dare un senso ai termini medici, comprendere i risultati di laboratorio o ottenere consigli di base sulla salute, senza dover aspettare un appuntamento dal medico.

Ma solo un promemoria: ChatGPT 5 è qui per aiutarti a spiegare le cose, non per sostituire il tuo medico . Il suo scopo è rendere le informazioni sanitarie più accessibili, così non ti sentirai perso quando avrai a che fare con un gergo medico confuso. Puoi chiedergli di spiegare termini o sintomi e li spiegherà in modo semplice e comprensibile, aiutandoti a sentirti più informato prima di rivolgerti a un professionista.

È un passo avanti verso la diffusione della conoscenza sanitaria, ma le questioni serie? Quelle sono ancora di competenza dei medici.

Collegare i puntini

Inizialmente eravamo scettici sull'utilizzo di un modello linguistico di grandi dimensioni (LLM) come ChatGPT 5 per le richieste mediche. L'idea di chiedere a un'IA informazioni su problemi di salute ci sembrava un po' azzardata. Ma non potevamo ignorare ciò che abbiamo scoperto.

Parlare di argomenti medici con gli LLM: è una cosa vera?

Sì, lo è. E sta crescendo.

  • Il 32,6% degli adulti statunitensi ha utilizzato modelli linguistici di grandi dimensioni (LLM) come ChatGPT per rispondere a domande relative alla salute.

  • Il 77,6% di questi utenti preferisce ChatGPT rispetto ad altri strumenti LLM per le richieste di assistenza sanitaria.

  • Il 95,6% si rivolge ancora ai motori di ricerca come Google per informazioni sulla salute, ma gli LLM stanno diventando una seconda fonte affidabile.

Questi numeri mostrano un costante aumento nell'adozione degli LLM per l'assistenza medica, a dimostrazione di una crescente fiducia nell'intelligenza artificiale per l'assistenza sanitaria.

Fonti:

Possiamo misurarlo?

Quando si tratta di verificare l'accuratezza delle informazioni fornite da modelli di intelligenza artificiale come ChatGPT, non è sempre così semplice dire se una risposta è "giusta" o "sbagliata". Diversi strumenti e benchmark vengono utilizzati per valutare le prestazioni dei modelli, soprattutto quando rispondono a domande complesse, come quelle relative all'assistenza sanitaria.

Parametri chiave per l'assistenza sanitaria:
  • MedQA: un set di dati specificamente progettato per valutare la capacità dei modelli linguistici di rispondere a domande relative all'assistenza sanitaria. Aiuta a misurare la capacità del modello di comprendere argomenti medici e fornire risposte affidabili.

  • USMLE (United States Medical Licensing Examination): si tratta di un esame standardizzato per i professionisti del settore medico. Quando modelli come ChatGPT vengono testati su domande pratiche USMLE, aiutano a valutare la capacità di gestire conoscenze cliniche complesse.

Tasso di allucinazioni:

Una metrica critica per l'intelligenza artificiale, soprattutto in ambito sanitario, è il tasso di allucinazioni, ovvero la frequenza con cui il modello fornisce informazioni false o inventate. Un tasso di allucinazioni inferiore significa che è più probabile che il modello fornisca informazioni accurate e affidabili. Per ChatGPT, questo tasso viene monitorato attivamente, soprattutto in settori sensibili come quello sanitario, per garantire che il modello non fornisca consigli fuorvianti o errati.

Come si è comportato ChatGPT 5?

Per quanto riguarda le prestazioni di ChatGPT 5 in ambito sanitario, i risultati specifici su benchmark come MedQA e USMLE non sono ancora stati resi pubblici. Sebbene OpenAI abbia condiviso miglioramenti generali, come una maggiore accuratezza e un ragionamento più accurato, i dati dettagliati sulle prestazioni specifici per le attività sanitarie non sono ancora disponibili.

Tuttavia, OpenAI ha rilasciato alcune dichiarazioni generali sulle capacità di ChatGPT 5:

  • Ragionamento migliorato : ChatGPT 5 è progettato per fornire risposte più precise, rendendolo più adatto a comprendere query complesse, comprese quelle in ambito sanitario.

  • Migliore selezione dell'algoritmo : il modello è in grado di selezionare automaticamente l'algoritmo più appropriato per diverse attività, garantendo prestazioni più fluide in diverse applicazioni, comprese le indagini relative alla salute.

  • Tasso di allucinazioni ridotto : i primi rapporti indicano che ChatGPT 5 ha un tasso di allucinazioni ridotto di circa l'1,6%, il che significa che è meno probabile che generi informazioni false o inventate rispetto alle versioni precedenti.

Sebbene questi miglioramenti indichino che ChatGPT 5 avrà probabilmente prestazioni migliori nelle query relative all'assistenza sanitaria rispetto ai suoi predecessori, non disponiamo ancora di numeri specifici sulla precisione.

Confronto: come si è comportato ChatGPT 4 rispetto agli altri LLM leader?

Per quanto riguarda le attività legate all'assistenza sanitaria, come si posiziona ChatGPT 4 rispetto ad altri modelli leader in termini di accuratezza? Ecco un confronto tra ChatGPT 4 e altri modelli di alto livello, in base alle loro prestazioni in benchmark come MedQA e USMLE.

Modello

Precisione MedQA

Precisione USMLE Step 1

Precisione USMLE Step 2

Tasso di allucinazioni

Punti salienti principali

ChatGPT 4

60–70%

55,8%

57,7%

1,8%

Ottime prestazioni nel rispondere a quesiti medici più semplici, ma difficoltà con gli scenari più complessi.

ChatGPT 5

Non divulgato

Non divulgato

Non divulgato

Circa 1,6%

Sono previsti miglioramenti in termini di accuratezza e ragionamento, ma non sono ancora stati pubblicati parametri di riferimento specifici per l'assistenza sanitaria.

Gemelli 2.0

91,1%

Non specificato

Non specificato

<1%

Ottime prestazioni, soprattutto in settori specialistici come l'oftalmologia, con un tasso di allucinazioni molto basso.

Claudio 3

86,15%

Non specificato

Non specificato

<1%

Noto per le sue spiegazioni mediche chiare e concise e per le solide conoscenze mediche generali.

Grok

85,5%

Non specificato

Non specificato

<1%

Offre buone prestazioni nelle query diagnostiche e nel ragionamento clinico.

Punti chiave:

  • ChatGPT 4 mostra prestazioni solide con una precisione del 60-70% sul set di dati MedQA e del 55,8% su USMLE Step 1, ma ha difficoltà con le query mediche più complesse.

  • ChatGPT 5, pur mostrando miglioramenti nel ragionamento, non dispone ancora di dati specifici sulle prestazioni per benchmark sanitari come MedQA e USMLE.

  • Gemini 2.0 è in testa alla classifica con una precisione del 91,1% su MedQA, il che lo rende uno dei migliori strumenti per le attività legate all'assistenza sanitaria.

  • Anche Claude 3 e Grok mostrano ottimi risultati, anche se ChatGPT 5 potrebbe probabilmente migliorare le loro capacità grazie alle sue capacità di ragionamento migliorate.

Fonti:

Med-Gemini??? – Esiste una cosa del genere?

Sì, Google ha sviluppato un modello di intelligenza artificiale specializzato per l'assistenza sanitaria chiamato Med-Gemini. Med-Gemini è una famiglia di grandi modelli multimodali, ottimizzati specificamente per applicazioni mediche, basati sui modelli Gemini di Google. Questi modelli sono progettati per gestire attività mediche complesse che richiedono ragionamento avanzato e la capacità di interpretare dati multimodali, inclusi testo, immagini, video e cartelle cliniche elettroniche (EHR).

Med-Gemini ha dimostrato prestazioni all'avanguardia in diversi benchmark medici. In particolare, ha raggiunto un'accuratezza del 91,1% nel benchmark MedQA (stile USMLE), superando del 4,6% modelli precedenti come Med-PaLM 2. Inoltre, Med-Gemini ha dimostrato ottime prestazioni in attività come la sintesi di testi medici, la generazione di lettere di refertazione e l'interpretazione di immagini mediche complesse come scansioni 3D.

Sebbene Med-Gemini sia un modello specializzato di Google progettato per l'assistenza sanitaria, è ancora in fase di ricerca e non è ancora disponibile per l'uso pubblico o clinico. Sebbene non sia pronto per un'implementazione su larga scala, Med-Gemini ha già mostrato risultati impressionanti nei benchmark relativi all'assistenza sanitaria, superando ChatGPT in alcune aree.

Med-Gemini rappresenta un significativo progresso nel potenziale dell'intelligenza artificiale nel supportare le applicazioni mediche. Google continua a collaborare con la comunità medica per testare e perfezionare questi modelli, garantendone la sicurezza e l'affidabilità prima dell'implementazione nel mondo reale.

fonte: blog di Google

Conclusione

ChatGPT 5 - Punti chiave

  • Disponibilità: disponibile ora

  • Costo: gratuito per tutti gli utenti; versione Pro a $ 200/mese

  • Correlato all'assistenza sanitaria: maggiore accuratezza e riduzione dei tassi di allucinazioni; risultati di riferimento specifici non divulgati

  • Precisione: tasso di allucinazioni ridotto a circa l'1,6%

Sollecitalo

Sapere come chiedere è parte della magia degli LLM. Se desideri consultare il tuo ChatGPT 5 o qualsiasi altro LLM su argomenti relativi all'assistenza sanitaria, abbiamo preparato un prompt per aiutarti a ottenere i migliori risultati.
Copia e incolla questo prompt, compila i dettagli, funzionerà per ChatGPT 5 o qualsiasi LLM di tua scelta:

Richiedi ChatGPT 5 (o qualsiasi LLM):

"Sto cercando informazioni su [condizioni mediche, sintomi o trattamento]. Puoi spiegare di cosa si tratta, quali sono le cause e come viene solitamente diagnosticata? Includi dettagli sulle opzioni di trattamento più comuni, comprese raccomandazioni mediche e sullo stile di vita.

  • Dettagli specifici sulla mia situazione: [ad esempio, età, sesso, condizioni di salute esistenti]

  • Sintomi o preoccupazioni attuali: [ad esempio, dolore al petto, affaticamento, vertigini]

  • Risultati di test recenti (se disponibili): [ad esempio, pressione sanguigna, risultati di laboratorio]

  • Altre informazioni rilevanti: [ad esempio, storia medica familiare, allergie, farmaci]

Si prega di fornire le informazioni in un modo che sia facilmente comprensibile anche per chi non ha competenze mediche.

Spingilo avanti:
Inoltre, includi tutti i link o riferimenti pertinenti a fonti attendibili, così che io possa leggere, comprendere e verificare le informazioni."

Compilando i dettagli sopra indicati, aiuterai l'LLM a fornirti informazioni più chiare e accurate sulla tua situazione medica. Questo prompt richiede anche link pertinenti per aiutarti a verificare le informazioni fornite. Ricorda sempre che, sebbene ChatGPT o qualsiasi LLM possa aiutarti a spiegare le cose, non sostituisce un consulto con un professionista sanitario.

Prospettiva del team di Frozen Light

Noi di Frozen Light crediamo fermamente nel fare ciò che sappiamo fare meglio, ma quando abbiamo esaminato i benchmark di ChatGPT in ambito sanitario, ci siamo resi conto che non sembrava che l'assistenza sanitaria fosse il suo punto forte... almeno fino ad ora.

Allora perché questa improvvisa attenzione all'assistenza sanitaria? Si tratta solo di colmare il divario?

ChatGPT è l'LLM più utilizzato, adottato e accessibile, con un traguardo di 700 milioni di utenti attivi settimanali. Ma quello che ci è sfuggito è che questa spinta non riguarda solo il tentativo di recuperare terreno rispetto ai concorrenti, come Google, ma anche la consapevolezza che gli LLM sono ormai parte integrante delle conversazioni in ambito sanitario. Le persone chiedono attivamente consigli medici agli LLM e questa tendenza è in rapida crescita.

Vogliamo fare i complimenti a OpenAI per aver riconosciuto questa esigenza e per essersi impegnata a soddisfarla. Essendo il modello più utilizzato, sta cercando di fornire ciò di cui i suoi utenti hanno bisogno, anche se i risultati non sono ancora perfetti. ChatGPT ci sta provando, e per questo gliene diamo il merito.

Ma ecco il punto: quando si tratta di benchmark, ChatGPT 4 ha ottenuto il punteggio più basso, e non è solo un'opinione: è nei numeri. OpenAI è l'unica a condividere i risultati di tutti e tre i test, quindi sappiamo che c'è un divario significativo. Med-Gemini e Grok hanno preso il comando in termini di accuratezza medica e, nonostante i miglioramenti di ChatGPT 5, c'è ancora margine di miglioramento.

Promemoria: gli LLM, anche quelli potenti come ChatGPT, non sostituiscono gli operatori sanitari. Se li utilizzate per scopi medici, confrontate le informazioni e non affidatevi esclusivamente a un unico modello. Vogliamo ricordare ai professionisti sanitari di utilizzare più fonti per fornire risposte solide e affidabili.

Nota personale: ci siamo passati tutti: cercare sintomi su Google e impazzire. Immaginate di farlo con un Master in Medicina e Chirurgia! Anche se siamo tutti favorevoli all'esplorazione delle nuove tecnologie, non dimentichiamo che a volte il dramma è reale, e un piccolo controllo medico con un esperto non fa mai male. 🙂

Share Article

Get stories direct to your inbox

We’ll never share your details. View our Privacy Policy for more info.