Accueil > Parcours de soins > Projet Monarch : comment le traitement automatisé du langage est utilisé en cancérologie Projet Monarch : comment le traitement automatisé du langage est utilisé en cancérologie Le projet de recherche Monarch, mené par Johnson & Johnson Innovative Medicine, en collaboration avec la filière IA & Cancers (FIAC) et la start-up Lifen, expérimente l’usage du traitement automatisé du langage pour caractériser les parcours de patients rares en oncologie. La cohorte LUCC constitue la clé de voûte du projet. Par Clarisse Treilles. Publié le 12 septembre 2025 à 16h16 - Mis à jour le 12 septembre 2025 à 16h16 Ressources Les résultats intermédiaires du projet Monarch ont été mis en lumière, le 4 septembre dernier, à l’occasion de la journée de conférences organisée par la FIAC. Le projet entrepris il y a plus de deux ans avec la filière représente un “pari” pour son promoteur industriel, Johnson & Johnson Innovative Medicine, qui travaille encore à “sa phase de mise en place”, a décrit Yoann Lelarge, responsable de la génération de données chez J&J, chargé du projet. Cette initiative vise à analyser les parcours de soins des patients atteints de cancer du poumon avec mutation EGFR. Dans un secteur qui manque encore de données, l’objectif de ce PoC est “de déterminer les séquences thérapeutiques” a précisé Mathias Bergeron, directeur médical oncologie chez Johnson & Johnson Innovative Medicine. Ce projet de recherche repose sur les données de la cohorte LUCC Poumon mise au point par Lifen et Gustave Roussy (cf. encadré), qui compte près de 10 000 dossiers patients et 80 variables, continuellement mises à jour. Identifier des populations rares Cette cohorte spécialisée a été choisie à dessein pour approfondir une indication rare. “Nous travaillons ici avec des populations relativement rares, représentant environ 4 à 5 % de tous les nouveaux cas de cancer en France. La particularité des maladies rares ou des populations de petite taille réside dans la difficulté à mener des essais cliniques et à en comparer les résultats avec les observations en conditions réelles. L’évaluation de séquences thérapeutiques par le biais d’essais cliniques est un processus extrêmement complexe et risqué pour les industriels, ce qui explique sa rareté”, indique Mathias Bergeron. “Le projet Monarch vise à combler un manque de données dans la littérature française concernant l’évolution concrète de la maladie après la première, la deuxième et la troisième ligne de traitement. Un bénéfice additionnel de ce projet est l’établissement d’une base de données unique sur les patients présentant une anomalie , EGFR, inexistante à ce jour”, explique-t-il. À l’heure actuelle, l’équivalent de 150 patients ont été inclus dans la cohorte LUCC, appariée aux données du SNDS. “Nous avons élargi notre réseau en intégrant des centres au-delà de la cohorte initiale, ce qui nous permet désormais de disposer d’une base de patients plus représentative de la diversité des établissements hospitaliers français (incluant CHU, CLCC, et hôpitaux généraux)”, note Mathias Bergeron. Manier le traitement automatique du langage “Avec des données qui sont aujourd’hui éclatées, les technologies permettent d’automatiser l’inclusion de patients”, a déclaré Géry Pruvost, responsable Partnership and Business Development chez Lifen. Ce travail a nécessité un recours au traitement automatisé du langage. Malgré un démarrage qualifié de “lent” et des “difficultés inhérentes à cette technologie”, souligne Mathias Bergeron, “cette approche a permis d’opérer rapidement tout en visant une qualité optimale”. La structuration des données massives est désormais automatisée. Ce chantier requiert un entraînement des données rigoureux, qui puisse être validé par la communauté et réplicable dans d’autres projets. “Les informations sont initialement recueillies rétrospectivement, puis chaque patient est suivi, et tout nouvel élément ou compte-rendu actualise la base de données. Cette méthode est cruciale pour des initiatives comme Monarch, qui exigent la localisation d’un nombre restreint de patients spécifiques et un accès facilité aux données mobilisables”, décrit Géry Pruvost. Dans une étude finalisée dans le courant de l’été, dont les résultats seront présentés à l’ESMO en octobre prochain, Lifen est parvenu à démontrer que l’IA permettait de réduire de moitié le taux d’erreurs, comparativement à une structuration manuelle, a annoncé ce dernier lors de l’événement de la FIAC. Un investissement prudent Pour un industriel pharmaceutique, Il est aussi “primordial d’établir la confiance des autorités de santé envers les nouvelles données générées. Nous visons le plus haut niveau d’exigence scientifique, comparable à celui d’un essai clinique randomisé en double aveugle. Ce sera notre prochaine étape”, évoque Mathias Bergeron. Ces prérequis conditionnent la validation de la démarche. “Si cet investissement se traduit par des gains de temps, une amélioration de la qualité et une reconnaissance des autorités de santé, alors l’industriel est prêt à le faire. Notre objectif était d’exploiter la sécurité d’investissement offerte par cette filière. Cet investissement nous a permis de prendre des risques en matière de recherche, ce qui aurait été difficilement réalisable dans un cadre de recherche plus conventionnel. C’est tout l’intérêt de cette filière, qui nous permet également de définir les séquences thérapeutiques”, poursuit ce dernier. “Le modèle économique n’est pas encore défini précisément, ajoute Géry Pruvost. L’objectif est de mutualiser les coûts de structuration, ainsi que les investissements techniques et réglementaires initiaux qui sont élevés. Pour y remédier, nous mutualisons les efforts via la cohorte LUCC en oncologie, et nous explorons cette même approche pour d’autres pathologies comme le cancer de la prostate et les cancers pédiatriques”. La cohorte LUCC Le projet LUCC (pour Large and Unified Cancer Cohort) consiste à construire une base de données sur le cancer du poumon en France. Il est issu d’un partenariat entre l’Institut Gustave Roussy et Lifen dans le cadre du plan France 2030, pour accélérer la recherche en oncologie. Cette cohorte s’appuie sur un outil de collecte automatique des données de vie réelle, développé par Lifen. Plusieurs centres ont déjà rejoint le projet (l’hôpital Foch, les Hôpitaux La Rochelle Ré Aunis, les hôpitaux Saint-Joseph & Marie-Lannelongue notamment). LUCC vise le recrutement de 15 000 patients. Le projet Monarch prendra fin le 31 décembre 2026. Clarisse Treilles Données de santéIntelligence ArtificielleLaboratoiresoncologieRecherchestart-up Besoin d’informations complémentaires ? Contactez le service d’études à la demande de mind À lire Entretien François Gaudemet (J&J MedTech France) : “Le robot devient, au-delà de la technologie, un vecteur de changement” Entretien Emmanuel Frenehard (Sanofi) : “Nous utilisons les agents d’IA dans de plus en plus de domaines” analyses Amgen diversifie les cas d’usage des LLMs et des outils d’IA générative