Accueil > Industrie > R&D > Comment Bayer travaille avec Clinityx sur une IA pour mieux comprendre une population d’insuffisants cardiaques Comment Bayer travaille avec Clinityx sur une IA pour mieux comprendre une population d’insuffisants cardiaques La filiale française du groupe pharmaceutique Bayer se tourne vers l’utilisation d’algorithmes pour améliorer ses connaissances sur l’insuffisance cardiaque. Bayer France travaille avec Clinityx pour développer une intelligence artificielle. Avec les deux entreprises, mind Health détaille ce projet présenté lors de la journée de la recherche clinique de l’Afcros en janvier 2020. Par Aurélie Dureuil. Publié le 13 mars 2020 à 18h36 - Mis à jour le 24 mars 2021 à 14h57 Ressources Avec la création du Health data hub fin 2019 et, quelques années plus tôt, du Système national des données de santé (SNDS), la France entend valoriser ses ressources en matière de bases de données de santé. Les laboratoires pharmaceutiques développent de plus en plus de projets pour renforcer leurs connaissances des populations de patients, des parcours de soins, ou en analyse médico-économique… C’est le cas de Bayer France. Présente dans le domaine de la cardiologie, la filiale du groupe allemand cherche à étudier un ensemble de patients souffrant d’insuffisance cardiaque, afin de mieux connaître cette population. Et la branche française de Bayer fait le pari de l’intelligence artificielle (IA). “Chez Bayer, nous avions cette idée depuis longtemps d’utiliser l’IA”, souligne Ingrid Dufour-Bonami, big data expert – RWE LPM coordinator/PMS Group chez Bayer Pharmaceuticals en France, lors de la journée de la recherche clinique de l’Afcros en janvier 2020. L’entreprise a choisi de travailler avec la société Clinityx, spécialisée dans le secteur de la santé et qui propose des solutions de collecte de données et intervient pour le développement d’algorithmes. L’objectif est d’utiliser l’IA “pour caractériser les spécificités d’une population d’intérêt ayant une insuffisance cardiaque”, explique Ingrid Dufour-Bonami. Le projet implique une équipe chez Bayer (market access, experts médicaux, experts vraie vie, chefs de projets), une autre chez Clinityx (chefs de projets, data scientists et une personne sur le médical) et un comité scientifique de la Société française de cardiologie (SFC). Qualifier un registre de la SFC Bayer s’est d’abord intéressée au registre Fresh de la SFC. Il contient des données d’environ 2 720 patients adultes identifiés entre 2014 et 2018 : sexe, date de naissance, dates de consultations et département de résidence, détaille Ingrid Dufour-Bonami. “Le registre aurait pu répondre aux objectifs de l’étude mais il concerne une population plus restreinte. Il existe un biais lié à un registre SFC : les patients sont inclus uniquement par des services de cardiologie, la plupart par l’hôpital public”, liste-t-elle. Le laboratoire s’est donc tourné vers le SNDS, “la base de données connue comme la plus exhaustive”. “En 2017, environ 1,2 million de patients adultes y sont identifiés par une hospitalisation avec un diagnostic (principal ou associé) en insuffisance cardiaque et/ou une prise en charge en affection longue durée pour insuffisance cardiaque”, indique Ingrid Dufour-Bonami. Néanmoins, le SNDS ne permet pas d’identifier la population concernée par l’étude, à savoir celle qui présente “la variable d’intérêt X” (dont Bayer ne précise pas la nature). Cette dernière “est essentielle à la définition de la population d’étude et elle n’est pas disponible dans le SNDS seul”, souligne Ingrid Dufour-Bonami. C’est là qu’intervient la collaboration avec Clinityx. L’objectif est de mettre au point un algorithme permettant d’identifier les patients avec la variable d’intérêt X dans le registre Fresh. Une fois cet algorithme validé, notamment en l’entraînant sur l’appariement d’un premier fichier SNDS avec le registre Fresh, Bayer prévoit de l’appliquer sur un nouveau fichier SNDS fils de patients avec une insuffisance cardiaque. Et ainsi d’obtenir des données pour alimenter ses connaissances. Un projet en trois phases Ce projet se décline en trois phases, détaille Margaux Gouysse, data scientist chez Clinityx : étude préliminaire, développement de l’algorithmes et propagation de l’algorithme sur toute la base pour identifier la population d’intérêt. “Les discussions ont débuté en septembre 2019. Nous avons défini le besoin ensemble avant la réalisation de l’étude de faisabilité mi-novembre”, indique Ingrid Dufour-Bonami. Elle a consisté à “quantifier, analyser et décrire la population d’intérêt dans le registre Fresh, puis à regarder si les données présentes permettent via l’algorithme d’identifier les patients avec la variable d’intérêt X par rapport aux autres”, détaille Margaux Gouysse. Elle se félicite que les premiers résultats atteignent 80 % de réussite de l’algorithme ainsi que du consensus des cardiologues de la SFC sur la méthode, ce qui a permis de valider le passage à la phase 2. Le développement de l’algorithme est aujourd’hui en cours. Cette phase s’appuie sur six étapes. La première vise à “remettre en forme et restructurer le SNDS”, précise Margaux Gouysse. Elle détaille également la 2e étape de “sélection des évènements d’intérêts caractéristiques, pour éviter de créer du bruit dans la base de données et identifier, avec les médecins et le comité scientifique, les variables”. Le stade suivant consiste à séparer les patients en deux groupes : d’apprentissage et de validation. “Le premier permettra à l’algorithme d’apprendre comment identifier la variable d’intérêt et à l’autre groupe de valider que l’identification des patients se fait bien et le pourcentage que l’algorithme arrive à réidentifier”, explique Margaux Gouysse. Le projet prévoit ensuite une étape de benchmark entre les algorithmes supervisés et non supervisés, avant la sélection de l’algorithme avec les experts du comité scientifique. Enfin, une étape de validation de l’algorithme est prévue à partir du groupe de validation du registre Fresh et “une autre base de données d’insuffisance cardiaque que nous cherchons encore”, indique la data scientist. La phase 3 du projet consistera alors à utiliser l’algorithme au sein d’une population élargie d’insuffisants cardiaques, via l’extraction d’un fichier SNDS fils, le pre-processing des données (mise en forme et structuration), l’exécution de l’algorithme, l’identification des patients d’intérêt, l’analyse des données puis la livraison des données pour l’étude de Bayer. “Indirectement, nous avons débuté la phase 3 en parallèle de la phase 2”, souligne Margaux Gouysse. Outre les aspects techniques, prendre en compte la conduite du changement Si Ingrid Dufour-Bonami ne détaille pas le budget, “conséquent par rapport aux méthodes classiques”, elle souligne le gain de temps : “c’est plus rapide qu’une étude clinique”. Elle indique également que la filiale française fait figure de pionnière au sein du groupe dans la mise en place d’une méthode utilisant l’IA. Comme le précise Ingrid Dufour-Bonami, “l’utilisation de l’IA est une prise de risque. Dans le cadre de ce projet et d’une façon générale sur les projets innovants utilisant l’IA, il faut savoir sortir de sa zone de confort et davantage écouter et communiquer avec les équipes car la sémantique des langages n’est pas toujours simple pour tous les corps de métiers”. Si Bayer ne détaille pas l’usage prévu des résultats de ce projet, les études médico-économiques sont régulièrement demandées par les autorités réglementaires pour le dossier de transparence de nouveaux médicaments mais aussi pour les études post-AMM. Le SNDS et l’appariement avec des cohortes spécifiques ouvrent de nouvelles perspectives dans la réponse des laboratoires pharmaceutiques. Aurélie Dureuil base de donnéesDonnées de santéHealth data hubIntelligence ArtificielleLaboratoires Besoin d’informations complémentaires ? Contactez le service d’études à la demande de mind