Accueil > Industrie > Accès au marché > Xosé Fernández (Institut Curie) : “Notre mission vise à développer et mettre en place de nouveaux outils d’analyse et d’exploitation des données” Xosé Fernández (Institut Curie) : “Notre mission vise à développer et mettre en place de nouveaux outils d’analyse et d’exploitation des données” L’Institut Curie, qui allie les activités de recherche et de soins, a créé une direction des données en 2017. Pour mind Health, son directeur Xosé Fernández détaille les objectifs et les projets. Par Aurélie Dureuil. Publié le 30 mai 2018 à 22h59 - Mis à jour le 30 mai 2018 à 22h59 Ressources Pouvez-vous présenter la direction des données de l’Institut Curie ? Je suis arrivé à l’été 2017 pour la création de la direction des données à l’Institut Curie. L’équipe est composée de 11 personnes. Il s’agit de médecins, data scientists, bio-informaticiens et spécialistes des bases de données. L’Institut Curie est composé d’un groupe hospitalier et d’un centre de recherche. La direction des données a la mission de bâtir des ponts entre ces deux entités. Nous travaillons également avec d’autres départements tels que la direction de la valorisation et celle des systèmes d’information. Un de nos premiers projets est la création du Curie Data Resource, un espace d’intégration de données pour le centre de recherche et l’ensemble hospitalier. La deuxième étape vise à développer et mettre en place de nouveaux outils d’analyse et d’exploitation des données. Nous avons déjà quelques initiatives en marche. Quel budget est consacré à cette direction ? Dans le contexte du programme MC21, l’Institut Curie a lancé une campagne de donations avec l’objectif d’obtenir un financement de 21 millions d’euros d’ici à 2021. Sur cette somme, 10 M€ seront consacrés aux données. Déjà pour cette année 2018, le budget alloué à mon département s’élève à 1,5 M€ environ. Une partie de ces fonds sera dédiée à l’actualisation des systèmes d’information de l’hôpital pour mieux extraire les informations vers la base de données. De quels volumes de données disposez-vous ? L’Institut Curie est pionnier dans la numérisation des dossiers médicaux. Nous avons débuté en 2000. Cela représente 479 940 dossiers aujourd’hui, avec environ 10 millions de documents. En effet, l’hôpital accueille 17 000 patients par an, via plus de 142 000 consultations, 100 000 séances de radiothérapies et 40 000 traitements par chimiothérapie. Et nous comptons aussi des bases de données historiques. Par exemple, dans le cancer du sein, les données depuis 1953 ont été numérisées. Et pourtant, les dossiers médicaux ne représentent que 5 % des données de l’Institut. Nous disposons de 62 téraoctets d’images, qui représentent 60 % de nos données. Il s’agit par exemple de 80 millions de scans et 18 millions de mammographies. Les autres données sont pour 20 % génomiques et 15 % de la recherche comme des phénotypes et des essais cliniques. Face à toutes ces données, quelles sont vos ambitions ? Ces volumes de données ouvrent d’énormes possibilités pour l’analyse et ainsi trouver le traitement adéquat pour le patient. Aujourd’hui, le traitement du cancer est déterminé par une classification moléculaire. Grâce à l’historique des données, nous pourrions localiser des cas similaires dans nos bases de données et mieux cibler les traitements. Nos travaux concernent différents domaines, de la recherche clinique à la prescription personnalisée, en passant par les outils pour les patients. Par exemple, le projet Micchado porte sur l’analyse des tumeurs chez 600 enfants afin de mieux déterminer le traitement alors que leur système immunitaire est en pleine évolution. Dans le cadre d’Unicancer, le projet ConSoRe concerne le développement de moteurs de recherche et d’outils pour extraire des informations des dossiers médicaux. Les textes sont très hétérogènes, mais le contexte est important. L’approche NLP (natural langage processing) est très importante pour extraire des informations du texte. En effet, quand un médecin rédige son compte-rendu, il ne s’agit pas forcément de oui/non. Il faut tenir compte des antécédents… Nous avons développé des moteurs de recherche et des outils pour extraire ces informations. Il s’agit d’une approche utile notamment pour identifier une cohorte de patients avec des critères d’inclusion dans le cadre d’un essai clinique, particulièrement pour des nouveaux traitements. Le projet nommé HealthChain, qui devrait être lancé en juin, consiste à appliquer une approche blockchain pour l’exploitation des images médicales Xosé Fernández CDO de l’Institut Curie Vous avez signé en début d’année un partenariat avec la société Owkin. Avez-vous d’autres projets avec cette start-up ? Nous avons commencé à travailler avec Owkin pour le développement d’un logiciel d’analyse de dossiers cliniques basé sur l’intelligence artificielle. Et nous travaillons depuis janvier 2018 sur un projet nommé HealthChain, qui devrait être lancé en juin. Il consiste à appliquer une approche blockchain pour l’exploitation des images médicales. En effet, dans le contexte de l’intelligence artificielle, nous avons besoin d’un volume conséquent d’images pour entraîner le système, c’est ce qu’on appelle l’apprentissage supervisé. Or ces images de pathologies ne peuvent pas quitter l’hôpital. Au lieu de partager les images, nous allons partager un modèle d’images. Ainsi, le système de l’algorithme se connectera à la base de données de l’Institut Curie pour apprendre à partir de nos images, puis il se connectera aux autres centres partenaires du projet. L’approche blockchain permettra de sécuriser l’utilisation des images. Ainsi, on pourra savoir quelles images ont été utilisées pour entraîner le système. Ces images ne pourront donc plus être utilisées pour la vérification du fonctionnement. Ce projet sera porté par Owkin. Il bénéficiera d’un financement de Bpifrance. En termes de valorisation, nous devrions recevoir un pourcentage lors de la commercialisation qui dépendra de la part d’images de l’institut utilisées pour l’apprentissage. Vous avez également annoncé un partenariat avec Intel. Quel est l’objectif ? Au sein de l’institut, une unité Inserm d’une centaine d’informaticiens travaille sur un ordinateur haute performance. Nous avons débuté il y a quelques mois un projet pour améliorer le flux de travail. L’objectif est de réduire le temps d’analyse d’un exome (une partie du génome, ndlr). Pour cela, nous travaillons avec Intel avec leur dernière puce et leurs experts pour exploiter et explorer des nouvelles façons de travailler dans la génomique. Nous sommes le premier partenaire en Europe à signer un contrat de ce type avec eux. Outre les projets autour de l’exploitation des données cliniques, vous avez développé l’application mobile myCurie à destination des patients. Quels sont vos objectifs ? L’application myCurie est proposée comme un carnet du patient. Elle est aujourd’hui utilisée par 2 000 personnes environ. Elles ont accès au planning de leurs rendez-vous, à des informations sur leur traitement… Ainsi, la veille du premier traitement, le patient peut accéder à de petites vidéos de 3 à 4 minutes expliquant comment cela va se dérouler. Une application de télésuivi à domicile des patients sera intégrée à une nouvelle version qui sera lancée dans quelques semaines. Nous allons également permettre une communication avec l’hôpital. Nous proposerons des questionnaires pour notamment identifier les effets secondaires. Par la suite, nous voulons pouvoir injecter ces données dans le dossier médical du patient. Pourriez-vous exploiter les données pour les études de vie réelle ? En effet, les données de vie réelle sont en train de changer le modèle de développement du médicament. Dans le cadre des essais cliniques autour d’un nouveau médicament, il y a de nombreuses informations que l’on ne capture pas. Les données de vie réelle ouvrent de nouvelles perspectives. Actuellement, au sein de l’Institut, nous sommes en train de faire évoluer notre système d’information, ce qui va changer la façon de gérer le dossier médical. Une fois ce chantier achevé, nous pourrons travailler sur la manière d’exploiter les informations venant des patients. Comment intégrez-vous la réglementation, notamment le RGPD ? En France, le contexte médical était déjà bien contrôlé. Ce qui change pour nous est le recueil du consentement. Aujourd’hui, les patients qui arrivent à l’Institut Curie sont informés que les données seront utilisées pour la recherche. Ils peuvent cependant s’y opposer. La sécurité des données est notre priorité. Nous avons un processus d’anonymisation. De plus, dans le cadre de collaborations avec des acteurs privés, les données sont anonymisées et ne quittent pas l’institut. Xosé Fernández Juin 2017 : Chief data officer de l’Institut Curie 2013 : Senior consultant en bioinformatique et génomique de ThermoFisher Scientific – Cambridge, Royaume-Uni 2011 : Éditeur de Nucleic Acid Research online Database Collection, Oxford University Press Janvier 2003 – 2011 : Group leader au European bioinformatics institute (EMBL-EBI) – Cambridge, Royaume-Uni 1997-2001 : Chercheur chez Novartis Pharma – Cambridge, Royaume-Uni L’institut Curie en chiffres (chiffres 2016) 3 400 collaborateurs 86 équipes de recherche 70 contrats de partenariats de R&D avec des entreprises (pour un montant de 4,2 M€) 335 M€ de ressources d’exploitation 51 486 patients Une direction des données avec 11 collaborateurs et un budget d’1,5 M€ en 2018 Aurélie Dureuil Application mobileDonnées de santéHôpitalRechercheStratégie Besoin d’informations complémentaires ? Contactez le service d’études à la demande de mind