ChatGPT 5 est sorti vendredi, mettant enfin un terme aux rumeurs et aux spéculations. Le déploiement est en cours et, comme le promet OpenAI, cette version est plus rapide, plus intelligente et plus précise que jamais.
Le grand changement ? OpenAI a ajouté un nouvel algorithme qui sélectionne automatiquement le modèle le plus adapté à la tâche, garantissant ainsi un fonctionnement fluide et efficace.
Et voilà où ça devient intéressant : OpenAI met l'accent sur la santé. Nous n'avions jamais vu une telle attention auparavant, alors avant de vous présenter les nouveautés habituelles (attention, nous laissons passer une semaine pour que l'effervescence se calme et que les choses sérieuses arrivent – clin d'œil), nous nous concentrons sur ce sujet pour l'instant.
Apparemment, la capacité du nouveau modèle à décomposer des termes médicaux complexes et à expliquer les résultats de laboratoire suscite beaucoup d'intérêt. Et cela s'est avéré.
Au début, on était un peu miam, mais ensuite on s'est dit : « Bon sang, voyons de quoi il s'agit. »
Ce que dit OpenAI à propos de ChatGPT5
OpenAI a déclaré que ChatGPT 5 était son modèle le plus rapide et le plus précis à ce jour. Il offre des améliorations en termes de raisonnement et de performances, ainsi que la possibilité de sélectionner le meilleur algorithme pour chaque tâche, qu'il s'agisse de répondre à des questions ou de résoudre des problèmes complexes. ChatGPT 5 a été conçu pour être un outil puissant, adapté à un large éventail d'utilisations, du codage au secteur de la santé, et offrant des réponses claires et contextuelles.
« Nous avons conçu ChatGPT 5 pour qu'il soit notre modèle le plus puissant, le plus précis et le plus rapide à ce jour. Il est conçu pour gérer une variété de tâches et apporter une aide précieuse dans des domaines comme la santé, où la précision est essentielle. » Sam Altman, PDG d'OpenAI
Dans le domaine de la santé, OpenAI souligne que ChatGPT 5 peut simplifier la terminologie médicale, expliquer les résultats de laboratoire et offrir des conseils de santé généraux. Bien qu'il ne soit pas destiné à remplacer les professionnels de santé, l'entreprise le considère comme un outil permettant aux utilisateurs de mieux comprendre leurs informations de santé.
Ce que cela signifie (en termes humains)
ChatGPT 5 est plus rapide, plus intelligent et plus fiable. Son principal atout ? Il peut comprendre et répondre à un plus large éventail de questions avec une précision accrue. Il choisit même l'algorithme le plus adapté à la tâche en fonction de vos données. Ainsi, même si vous hésitez sur l'approche à adopter, ChatGPT 5 vous accompagne et vous garantit les meilleurs résultats.
En matière de soins de santé, cela signifie que vous pouvez l'utiliser pour comprendre les termes médicaux, comprendre les résultats de laboratoire ou obtenir des conseils de santé de base, sans avoir à attendre un rendez-vous chez le médecin.
Petit rappel : ChatGPT 5 est là pour vous aider à comprendre, et non pour remplacer votre médecin . Son objectif est de rendre les informations médicales plus accessibles, afin que vous ne vous sentiez pas perdu face à un jargon médical complexe. Vous pouvez lui demander d'expliquer des termes ou des symptômes, et il les décomposera de manière claire et compréhensible, vous permettant ainsi d'être mieux informé avant de consulter un professionnel.
C'est un pas en avant vers une meilleure accessibilité des connaissances médicales pour tous, mais le plus sérieux ? C'est toujours réservé aux médecins.
Relier les points
Au départ, nous étions sceptiques quant à l'utilisation d'un modèle de langage étendu (LLM) comme ChatGPT 5 pour les demandes médicales. L'idée d'interroger une IA sur des problèmes de santé nous semblait un peu saugrenue. Mais nous ne pouvions pas ignorer nos découvertes.
Parler de questions médicales aux étudiants en LLM : est-ce une réalité ?
Oui, c'est vrai. Et ça continue de grandir.
32,6 % des adultes américains ont utilisé des modèles de langage étendus (LLM) comme ChatGPT pour répondre à des questions liées à la santé.
77,6 % de ces utilisateurs préfèrent ChatGPT aux autres outils LLM pour les demandes de renseignements sur les soins de santé.
95,6 % des étudiants se tournent encore vers les moteurs de recherche comme Google pour obtenir des informations sur la santé, mais les LLM deviennent une deuxième source fiable.
Ces chiffres montrent une augmentation constante de l’adoption des LLM pour l’assistance médicale, indiquant une confiance croissante dans l’IA pour les soins de santé.
Sources :
Pouvons-nous le mesurer ?
Vérifier l'exactitude des informations fournies par des modèles d'IA comme ChatGPT ne se résume pas toujours à dire qu'une réponse est « bonne » ou « mauvaise ». Plusieurs outils et benchmarks sont utilisés pour évaluer les performances des modèles, notamment lorsqu'ils répondent à des questions complexes, comme celles liées aux soins de santé.
Principaux repères pour les soins de santé :MedQA : un ensemble de données spécialement conçu pour évaluer la capacité des modèles linguistiques à répondre aux questions liées à la santé. Il permet de mesurer la capacité du modèle à comprendre les sujets médicaux et à fournir des réponses fiables.
USMLE (United States Medical Licensing Examination) : Il s'agit d'un examen standardisé destiné aux professionnels de la santé. L'utilisation de modèles comme ChatGPT pour tester des questions d'entraînement USMLE permet d'évaluer leur capacité à maîtriser des connaissances cliniques complexes.
Un indicateur essentiel pour l'IA, notamment dans le secteur de la santé, est le taux d'hallucinations, c'est-à-dire la fréquence à laquelle le modèle fournit des informations fausses ou inventées. Un taux d'hallucinations faible signifie que le modèle est plus susceptible de fournir des informations exactes et fiables. Pour ChatGPT, ce taux est suivi activement, notamment dans les domaines sensibles comme la santé, afin de garantir que le modèle ne donne pas de conseils trompeurs ou erronés.
Comment s'est comporté ChatGPT 5 ?
Concernant les performances de ChatGPT 5 dans le domaine de la santé, les résultats spécifiques obtenus sur des benchmarks comme MedQA et USMLE n'ont pas encore été rendus publics. Bien qu'OpenAI ait partagé des améliorations générales, telles qu'une précision et un raisonnement améliorés, les données de performance détaillées spécifiques aux tâches liées à la santé restent inaccessibles.
Cependant, OpenAI a fait quelques déclarations générales sur les capacités de ChatGPT 5 :
Raisonnement amélioré : ChatGPT 5 est conçu pour fournir des réponses plus précises, ce qui le rend mieux équipé pour comprendre les requêtes complexes, y compris celles dans le domaine de la santé.
Meilleure sélection d'algorithmes : le modèle peut sélectionner automatiquement l'algorithme le plus approprié pour différentes tâches, garantissant des performances plus fluides dans diverses applications, y compris les demandes liées à la santé.
Taux d'hallucinations réduit : les premiers rapports indiquent que ChatGPT 5 a un taux d'hallucinations réduit d'environ 1,6 %, ce qui signifie qu'il est moins susceptible de générer des informations fausses ou fabriquées par rapport aux versions précédentes.
Bien que ces améliorations indiquent que ChatGPT 5 sera probablement plus performant dans les requêtes liées aux soins de santé que ses prédécesseurs, nous ne disposons pas encore de chiffres de précision spécifiques.
Comparaison : comment ChatGPT 4 s'est-il comporté par rapport aux autres LLM de premier plan ?
En matière de tâches liées aux soins de santé, comment ChatGPT 4 se compare-t-il aux autres modèles leaders en termes de précision ? Voici une comparaison de ChatGPT 4 avec d'autres modèles très performants, basée sur leurs performances dans des benchmarks comme MedQA et USMLE.
Modèle | Précision du MedQA | Précision de l'USMLE Étape 1 | Précision de l'USMLE Étape 2 | Taux d'hallucinations | Points clés |
ChatGPT 4 | 60–70 % | 55,8% | 57,7% | 1,8% | Excellentes performances pour répondre à des questions médicales plus simples, mais difficultés avec des scénarios plus complexes. |
ChatGPT 5 | Non divulgué | Non divulgué | Non divulgué | Environ 1,6 % | Des améliorations sont attendues en termes de précision et de raisonnement, mais aucun critère de référence spécifique en matière de soins de santé n’a encore été publié. |
Gémeaux 2.0 | 91,1% | Non spécifié | Non spécifié | <1% | Très performant, notamment dans des domaines spécialisés comme l'ophtalmologie, avec un taux d'hallucinations très faible. |
Claude 3 | 86,15% | Non spécifié | Non spécifié | <1% | Connu pour fournir des explications médicales claires et concises et de solides connaissances médicales générales. |
Grok | 85,5% | Non spécifié | Non spécifié | <1% | Réalise de bonnes performances dans les requêtes liées au diagnostic avec une solide performance en raisonnement clinique. |
Points clés à retenir :
ChatGPT 4 affiche de solides performances avec une précision de 60 à 70 % sur l'ensemble de données MedQA et de 55,8 % sur l'USMLE Step 1, mais il a du mal avec les requêtes médicales plus complexes.
ChatGPT 5, tout en montrant des améliorations dans le raisonnement, ne dispose pas encore de données de performance spécifiques pour les repères de santé comme MedQA et USMLE.
Gemini 2.0 est en tête du peloton avec une précision de 91,1 % sur MedQA, ce qui en fait un outil très performant pour les tâches liées aux soins de santé.
Claude 3 et Grok montrent également de bons résultats, bien que ChatGPT 5 pourrait probablement améliorer leurs capacités grâce à ses capacités de raisonnement améliorées.
Sources :
Référence MedQA
Med-Gémeaux ??? – Est-ce que ça existe ?
Oui, Google a développé un modèle d'IA spécialisé dans le domaine de la santé, appelé Med-Gemini. Med-Gemini est une famille de grands modèles multimodaux, optimisés spécifiquement pour les applications médicales, s'appuyant sur les modèles Gemini de Google. Ces modèles sont conçus pour gérer des tâches médicales complexes nécessitant un raisonnement avancé et la capacité d'interpréter des données multimodales, notamment du texte, des images, des vidéos et des dossiers médicaux électroniques (DME).
Med-Gemini a démontré des performances de pointe sur plusieurs tests médicaux. Il a notamment atteint une précision de 91,1 % sur le test MedQA (de type USMLE), surpassant de 4,6 % les modèles précédents comme Med-PaLM 2. De plus, Med-Gemini a affiché d'excellentes performances dans des tâches telles que la synthèse de textes médicaux, la génération de lettres de recommandation et l'interprétation d'images médicales complexes comme les scanners 3D.
Bien que Med-Gemini soit un modèle Google spécialisé dans le secteur de la santé, il est encore en phase de recherche et n'est pas encore disponible pour un usage public ou clinique. Bien qu'il ne soit pas encore prêt pour un déploiement à grande échelle, Med-Gemini a déjà obtenu des résultats impressionnants lors d'évaluations comparatives liées à la santé, surpassant ChatGPT dans certains domaines.
Med-Gemini représente une avancée significative dans le potentiel de l'IA pour les applications médicales. Google continue de collaborer avec la communauté médicale pour tester et affiner ces modèles, garantissant ainsi leur sécurité et leur fiabilité avant leur déploiement en conditions réelles.
source : blog de Google
En résumé
ChatGPT 5 - Points clés à retenir
Disponibilité : En cours de déploiement
Coût : Gratuit pour tous les utilisateurs ; Version Pro à 200 $/mois
Lié aux soins de santé : précision améliorée et taux d’hallucinations réduits ; résultats de référence spécifiques non divulgués
Précision : Taux d'hallucinations réduit à environ 1,6 %
Invitez-le
Savoir poser des questions fait partie intégrante des masters de médecine. Si vous souhaitez consulter votre titulaire de ChatGPT 5 ou tout autre master de médecine sur des sujets liés à la santé, nous avons élaboré une méthode pour vous aider à obtenir les meilleurs résultats.
Copiez et collez cette invite, remplissez les détails, cela fonctionnera pour ChatGPT 5 ou tout LLM de votre choix :
Invite pour ChatGPT 5 (ou tout LLM) :
Je recherche des informations sur [des problèmes de santé, des symptômes ou un traitement]. Pouvez-vous m'expliquer de quoi il s'agit, quelles en sont les causes et comment le diagnostic est généralement posé ? Veuillez fournir des détails sur les options de traitement courantes, y compris des recommandations médicales et hygiéno-diététiques.
Détails spécifiques sur ma situation : [par exemple, âge, sexe, problèmes de santé existants]
Symptômes ou préoccupations actuels : [par exemple, douleur thoracique, fatigue, étourdissements]
Résultats de tests récents (si disponibles) : [par exemple, tension artérielle, résultats de laboratoire]
Autres informations pertinentes : [par exemple, antécédents médicaux familiaux, allergies, médicaments]
Veuillez fournir des informations d’une manière facile à comprendre pour une personne sans formation médicale.
Poussez-le vers l'avant :
« De plus, incluez tous les liens ou références pertinents à des sources crédibles afin que je puisse lire, comprendre et vérifier les informations. »
En remplissant les informations ci-dessus, vous aiderez le LLM à vous fournir des informations plus claires et plus précises sur votre situation médicale. Ce questionnaire vous demandera également des liens pertinents pour vous aider à vérifier les informations fournies. N'oubliez pas que même si ChatGPT ou tout autre LLM peut vous aider à comprendre, il ne remplace pas une consultation avec un professionnel de santé.
Point de vue de l'équipe Frozen Light
Chez Frozen Light, nous avons pour principe de privilégier ce que l'on fait le mieux, mais lorsque nous avons examiné les critères de référence de ChatGPT dans le domaine de la santé, nous avons trouvé cela déroutant. Le secteur de la santé ne semblait pas être son point fort… du moins pas jusqu'à présent.
Alors pourquoi cette soudaine focalisation sur les soins de santé ? S'agit-il simplement de combler un fossé ?
ChatGPT est le LLM le plus utilisé, adopté et accessible, avec un cap des 700 millions d'utilisateurs actifs hebdomadaires. Mais ce que nous avons oublié, c'est que cette initiative ne vise pas seulement à rattraper des concurrents comme Google ; il s'agit de comprendre que les LLM font désormais partie intégrante des discussions sur la santé. Les gens sollicitent activement des conseils médicaux auprès des LLM, et cette tendance se développe rapidement.
Nous tenons à féliciter OpenAI pour avoir reconnu ce besoin et s'être mobilisé pour y répondre. Modèle le plus répandu, OpenAI s'efforce de répondre aux besoins de ses utilisateurs, même si les résultats ne sont pas encore parfaits. ChatGPT s'efforce de le faire, et nous lui en sommes reconnaissants.
Mais voilà : en matière de benchmarks, ChatGPT 4 a obtenu le score le plus bas, et ce n'est pas une simple opinion, c'est une question de chiffres. OpenAI est le seul à partager les résultats des trois tests, nous savons donc qu'il existe un écart important. Med-Gemini et Grok ont pris la tête en matière de précision médicale, et même avec les améliorations de ChatGPT 5, il reste encore de la marge de progression.
Rappel : les masters de maîtrise, même aussi performants que ChatGPT, ne remplacent pas les professionnels de santé. Si vous les utilisez à des fins médicales, comparez les informations et ne vous fiez pas à un seul modèle. Nous rappelons aux professionnels de santé qu'il est important de multiplier les sources pour obtenir des réponses solides et fiables.
Sur une note personnelle : on est tous passés par là : chercher des symptômes sur Google et paniquer. Imaginez faire la même chose avec un master ! Même si nous sommes tous pour l'exploration des nouvelles technologies, n'oublions pas que parfois, les drames sont réels, et un petit bilan médical avec un expert ne fait jamais de mal. 🙂