OpenAI a lancé le 12 mai HealthBench, un référentiel permettant d’évaluer la performance et la sécurité des LLMs (les grands modèles de langage) dans le domaine de la santé. Il regroupe 5000 conversations, qui simulent des interactions entre des modèles d’IA et des utilisateurs ou cliniciens. Chacune est accompagnée d’une grille qui permet d’évaluer les réponses des modèles. OpenAI a construit ce référentiel avec 262 médecins dans 60 pays, qui maîtrisent 49 langues et ont une formation dans...
OpenAI lance une solution d’évaluation des LLMs en santé
Vous avez une information à nous partager ?
Nos autres services
Ce que vous devez absolument lire cette semaine
Les contenus essentiels de la semaine sélectionnés par la rédaction.
Les articles les plus consultés du mois sur mind Health
Ce sur quoi les lecteurs cliquent le plus le mois dernier.
Ce sur quoi les lecteurs cliquent le plus le mois dernier.