OpenAI lance une solution d’évaluation des LLMs en santé

Un article de Romain Bonfillon

Publication

16 mai 2025 à 16h03

Temps de lecture

2 minutes

Publication: 16 mai 2025 à 16h03

Temps de lecture: 2 minutes

Un article de Romain Bonfillon

Publication

16 mai 2025 à 16h03

Temps de lecture

2 minutes

Publication: 16 mai 2025 à 16h03

Temps de lecture: 2 minutes

Cet article vous est offert gratuitement par la rédaction, car vous êtes actuellement en période d'essai.

Vous avez accès à nos contenus pendant 15 jours.

Découvrez l’offre d’abonnement mind Health

OpenAI a lancé le 12 mai HealthBench, un référentiel permettant d’évaluer la performance et la sécurité des LLMs (les grands modèles de langage) dans le domaine de la santé. Il regroupe 5000 conversations, qui simulent des interactions entre des modèles d’IA et des utilisateurs ou cliniciens. Chacune est accompagnée d’une grille qui permet d’évaluer les réponses des modèles. OpenAI a construit ce référentiel avec 262 médecins dans 60 pays, qui maîtrisent 49 langues et ont une formation dans 26

…

Vous avez une information à nous partager ?

Auteur.e.s de l’article

Image à la une de l'article Romain Bonfillon

Romain Bonfillon Rédacteur en chef mind Health

Image à la une de l'article Romain Bonfillon

Rédacteur en chef mind Health
15 ans d'expérience dans le domaine des politiques publiques en santé et dans la tech & santé

Tags

Nos autres services

mind Research

Décider : un service de recherche et de market intelligence sur mesure pour alimenter vos analyses et appuyer vos prises de décisions.

En savoir plus

mind Events

Se rencontrer : des conférences d'une demie journée dédiées aux problématiques du secteur et ouvertes à l'ensemble de l'écosystème.

En savoir plus

mind Ads

Communiquer : des dispositifs sur mesure pour maximiser votre visibilité et engager une communauté de professionnels qualifiés.

En savoir plus

Ce que vous devez absolument lire cette semaine

Les contenus essentiels de la semaine sélectionnés par la rédaction.

Biotech Act : le CEPD et le Contrôleur européen de la protection des données formulent leurs propositions

L’info. Le Comité européen de la protection des données (CEPD) et le Contrôleur européen de la protection des données (EDPS) ont adopté un...

20 mars 2026

AstraZeneca continue de se renforcer en Chine

L’info. AstraZeneca a annoncé dans un communiqué le 19 mars la création d’une base de production et d’approvisionnement en thérapies cellulaires ainsi...

20 mars 2026

Avec Fitbit, Google dévoile de nouvelles ambitions en santé

L’info. Google a annoncé de nouvelles actions en santé, mardi 17 mars, à l’occasion de son événement annuel The Check Up, notamment...

19 mars 2026

Microsoft se lance sur le marché des chatbot IA santé

L’info. Microsoft a annoncé le 12 mars le lancement de Copilot Health. Cet espace “distinct et sécurisé” au sein de son assistant d’IA Copilot fournit...

19 mars 2026

Les articles les plus consultés du mois sur mind Health

Ce sur quoi les lecteurs cliquent le plus le mois dernier.

Dans la catégorie

Ce sur quoi les lecteurs cliquent le plus le mois dernier.

1

Données synthétiques : bref atlas de leur niveau d’adoption

Utilisées dans le cadre des essais cliniques, les données synthétiques (ou virtuelles) permettent de construire des bras de contrôle en se passant des patients. Une véritable révolution qui séduit...

3 mars 2026

2

DTx en santé mentale : entre promesses thérapeutiques et obstacles réglementaires

Face à la hausse des troubles psychiques et aux tensions croissantes sur l’offre de soins, les thérapies numériques (DTx) ambitionnent de compléter la prise en charge en santé mentale. Entre...

17 mars 2026

3

Hélène Viatgé (AppThera) : “Les thérapies numériques doivent s’inscrire dans un parcours de soins”

Hélène Viatjé est cofondatrice et présidente d'AppThera, une plateforme qui permet aux médecins d'identifier et de prescrire des DTx. Elle revient pour mind Health sur le mécanisme d'action de ces...

17 mars 2026

4

InterSystems, partenaire technologique de Resilience Care

L’info : InterSystems et la société de télésurveillance Resilience Care ont annoncé le 3 mars un partenariat technologique destiné à...

4 mars 2026

5

Maladies infectieuses : comment mieux valoriser la donnée ?

Le 29 janvier dernier, une communauté d’acteurs de la donnée de santé officialisait le lancement d’une initiative baptisée SYNERG-ID. Deux ans de travail ont été nécessaires pour fédérer cette...

24 février 2026

6

La HAS et la Cnil lancent une consultation publique sur le guide “IA en contexte de soins”

L’info. La Haute Autorité de santé et la Cnil ont annoncé le 5 mars l’ouverture d’une consultation publique portant sur leur guide “IA en contexte de...

5 mars 2026