Accueil > Parcours de soins > Comment les hôpitaux partagent leurs données de santé ? Comment les hôpitaux partagent leurs données de santé ? Le partage des données de santé entre établissements de santé ou avec des tiers n’est pas un phénomène nouveau. Il prend en revanche un tournant différent avec la constitution des entrepôts de données de santé. Les hôpitaux y trouvent un intérêt même si la démarche requiert des investissements. Par Laure Martin. Publié le 21 septembre 2021 à 15h52 - Mis à jour le 14 décembre 2021 à 15h13 Ressources Avant de comprendre comment les hôpitaux partagent leurs données de santé, il convient de rappeler un point important. “Le partage des données de santé entre les établissements n’est pas nouveau, cela fait très longtemps qu’elles sont utilisées à des fins de recherche”, rappelle Hélène Guimiot-Breaud, cheffe du service de la santé à la Commission nationale de l’informatique et des libertés (Cnil). Pendant longtemps, les établissements disposaient de leur propre base constituée à partir des dossiers médicaux de leurs patients. Mais depuis quelques années, une nouvelle tendance émerge, avec la création de bases centralisées : des entrepôts de données de santé. Hélène Guimiot-Breaud, cheffe du service de la santé à la Commission nationale de l’informatique et des libertés (Cnil) L’émergence des entrepôts de données L’Assistance publique-hôpitaux de Paris (AP-HP) en détient un, tout comme l’Assistance publique-Hôpitaux de Marseille (AP-HM), le Groupement hospitalier de territoire (GHT) Loire, les cinq CHU du Grand Ouest (Nantes, Rennes, Angers, Brest et Tours) ou encore l’hôpital Foch. Garder le contrôle sur sa donnée L’émergence d’entrepôts mutualisés entre plusieurs établissements est en partie révélatrice d’une prise de conscience des enjeux autour du partage et de l’exploitation de la donnée, et des investissements qu’ils nécessitent. “Mais sur le terrain, l’usage de la donnée reste modeste, soutient Amaury Martin, directeur de la valorisation et des partenariats industriels à l’Institut Curie. Le hiatus entre le message envoyé et la réalité du terrain est non négligeable.” Il identifie d’ailleurs des tendances de fonds au premier rang desquelles, la volonté persistante des établissements de garder le contrôle sur leurs données. Un contrôle renforcé par le Règlement général sur la protection des données (RGPD) puisqu’il prévoit que les établissements restent responsables des données produites. La Cnil propose d’ailleurs une auto-évaluation de maturité en gestion de la protection des données. Un enjeu prioritaire de gouvernance “Cette vision patrimoniale de la donnée est un frein à leur partage, analyse Pierre-Antoine Gourraud, à la tête de la clinique des données au CHU de Nantes, qui rassemble 130 millions de données structurées. Il y a donc un enjeu prioritaire de gouvernance. Il faut s’organiser pour recycler les données récoltées dans le cadre des soins et faire accepter à chacun qu’elles puissent être utilisées par d’autres.” D’autant plus que la valeur de la donnée augmente uniquement au fur et à mesure de son utilisation et de son exploitation. “L’adhésion est souvent facile lorsque les enjeux ont été présentés”, assure-t-il. Partager ses données à des fins de recherche Jocelyn Dachary, Senior Vice-Président Data & IT Solutions chez Owkin Le partage des données de santé a lieu à des fins de recherche académique, la finalité principale étant d’améliorer la prise en charge des patients et la qualité des soins. “Ce partage se concrétise par la mise en commun d’une part, de données et de questions scientifiques par des médecins-chercheurs confrontés au quotidien à ces problématiques et d’autre part, de compétences en data science”, explique Jocelyn Dachary, Senior Vice-Président Data & IT Solutions chez Owkin, entreprise qui utilise l’intelligence artificielle pour l’analyse de la donnée de santé. “L’agrégation de différentes sources de données stimule les idées de recherche, de thématiques, pour améliorer un parcours de soins, un traitement, rapporte Amélie Chioccarello, directrice adjointe juridique et partenariats au sein de la Délégation à la recherche clinique et à l’innovation, et Déléguée à la protection des données à l’hôpital Foch. Une grande quantité de données peut inspirer et conduire les médecins à mener des études.” Des partenariats académiques et industriels Si les hôpitaux peuvent nouer des partenariats académiques avec d’autres établissements de santé, des instituts de recherche ou des universitaires, ils peuvent aussi en conclure avec des industriels comme des laboratoires pharmaceutiques ou des entreprises du dispositif médical afin de répondre à leurs besoins notamment dans le cadre des cycles de développement des médicaments et des dispositifs médicaux. Les industriels peuvent avoir besoin de données dès la preuve de concept, pour conforter la problématique médicale à l’origine de l’innovation, dans le cadre d’essais cliniques ou pour évaluer les modifications induites par une innovation dans le parcours de soins des patients. Le partage des données peut aussi concerner des questions de pharmacovigilance, la prescription ou encore le suivi de dispositif médicaux qui requièrent des données en vie réelle. Une plateforme Ouest Data Hub pour mobiliser les données de santé sur 3 régions Frédéric Ossant, chef de projet du Ouest Data Hub Le Groupement de coopération sanitaire (GCS) des Hôpitaux universitaires du Grand Ouest (HUGO) a lancé en décembre 2020 le Ouest Data Hub, une plateforme de données hospitalières composée d’un ensemble de six entrepôts de données de santé (les cinq CHU et l’institut de Cancérologie de l’Ouest). “Cette plateforme permet de mener des projets de recherche en mobilisant des données de santé sur trois régions, projets qui ne seraient par exemple pas pertinents à l’échelle d’un établissement sur des études en épidémiologie ou sur les maladies rares”, rapporte Frédéric Ossant, chef de projet du Ouest Data Hub, précisant que l’entrepôt est sollicité aussi bien par des universitaires que par des industriels. “Lorsqu’un projet se met en place avec un investigateur principal, nous mobilisation l’expertise collective à savoir les centres de données cliniques de chaque établissement du Ouest Data Hub, afin de décider de la faisabilité du projet”, poursuit le Pr Marc Cuggia, PU-PH d’informatique médicale, Responsable du Centre de Données Clinique (CDC) au sein du Département d’information médicale du CHU de Rennes et de l’Equipe-Projet Données massives en santé (LTSI-INSERM). La valorisation de la donnée Les données de santé utilisées sont celles issues du parcours de soins patients ou d’essais cliniques. Elles sont par nature complexes, massives et hétérogènes. Parmi elles, les données cliniques, celles provenant des examens biologiques (prélèvements de tissus, analyses), les données génomiques ou les données d’imageries (médicales ou de microscopie). Pour mener à bien un projet de recherche, la donnée doit être en quantité suffisante pour une bonne représentativité, et de qualité suffisante c’est-à-dire être pertinente, utilisable et avec un bon niveau de précision. La qualité de la donnée, un enjeu primordial Pr Marc Cuggia, Responsable du Centre de Données Clinique du Département d’information médicale du CHU de Rennes “La qualité de la donnée dépend aussi de sa saisie à la source, par les professionnels de santé, rappelle le Pr Cuggia. Grâce à eHOP, l’entrepôt hospitalier que développons, nous montrons à nos collègues les possibilités de réutilisation des données qu’ils saisissent au quotidien dans le dossier médical informatisé de l’établissement. Au CDC, nous contribuons également à la mise en qualité de la donnée. L’enjeu de la chaîne de traitement est réel.” La donnée de qualité peut alors être exploitée, ce qui va lui conférer de la valeur. Des investissements humains et informatiques Ce travail implique un certain investissement car “l’enrichissement et l’analyse de la donnée ont un coût”, indique Pierre-Antoine Gourraud. Cela se traduit par des investissements humains et informatiques, les systèmes d’information devant être suffisamment dimensionnés pour le partage. Ce travail de valorisation de la donnée peut être effectué par les équipes internes à chaque établissement, composées de spécialistes de l’informatique (data scientists, ingénieurs, statisticiens) mais aussi de médecins, bien placés pour connaître la valeur des données. Il est aussi possible d’avoir recours à des entreprises dont la spécialité est justement l’analyse de la donnée. C’est le cas d’Owkin qui intervient sur des projets scientifiques auxquels il apporte une réponse grâce à la mise en place d’une modélisation. “Nous avons besoin de données pour pouvoir en tirer une tendance, un modèle, qui soit la plus juste possible”, fait savoir Jocelyn Dachary. Pour y parvenir, l’entreprise travaille à l’agrégation de données de santé pseudonymisées afin de trouver une liaison commune. Le résultat de ce travail n’est pas toujours exploitable en l’état par le partenaire. “Sa lecture demande une certaine expertise mais surtout un travail collaboratif pour combiner l’expertise médicale et la data science”, ajoute-t-il. Un retour sur investissement Les patients vont être les premiers bénéficiaires de cette recherche sur les données de santé puisqu’elle permet d’améliorer le parcours patient et de fluidifier la prise en charge médicale. “Les médecins en tirent aussi un bénéfice avec des publications, indispensables pour la construction de leur carrière”, souligne Amélie Chioccarello. En parallèle, en développant des partenariats, les établissements cherchent aussi à valoriser l’exploitation de la donnée. “Si le partenariat est collaboratif, il va reposer sur des publications avec un partage de la propriété des résultats issus de la recherche, rapporte Frédéric Ossant. Et pour les projets où nous confortons des dossiers réglementaires de laboratoires, nous sommes davantage sur une valorisation financière représentative des ressources matérielles et des expertises investies.” De même que lorsque les porteurs de projets sont financés dans le cadre d’appels à projet, ils sont incités à dédier une ligne budgétaire à la valorisation du temps investi par les équipes des entrepôts. Une valeur encadrée via la propriété intellectuelle Les établissements peuvent aussi valoriser la recherche en transformant le résultat en une création de valeur via la propriété intellectuelle. “Lors de la contractualisation, nous allons acter la co-titularité de droit pour éventuellement avoir une commercialisation et un retour sur investissement”, indique Amélie Chioccarello. Car si les données ne peuvent en aucun cas être vendues, les résultats des recherches nés de l’exploitation de la donnée peuvent l’être. “Le vrai payeur est souvent l’industrie pharmaceutique, qui ne va pas hésiter à financer la recherche si elle y voit un intérêt”, soutient Amaury Martin. Mais “tout cela reste fragile, regrette le Pr Cuggia. Nous avons besoin de moyens, d’expertise, de postes hospitalo-universitaires, de data scientists, de formation des professionnels de santé sur l’IA en santé. Développer cet écosystème est un enjeu très important car nous sommes en peine. Il est urgent que les centres de données cliniques soient aidés par les pouvoirs publics de manière significative si nous voulons répondre aux ambitions de l’IA en santé et de l’exploitation des données massives en santé.” Un engagement de conformité Si le RGPD interdit l’usage des données sensibles, dont font partie les données de santé, il dresse toutefois une liste d’exceptions notamment l’usage des données à des fins de recherche. Des règles doivent néanmoins être respectées. Pour les projets de recherche, des méthodologies de référence sont élaborées par la Cnil, qui impliquent, pour le responsable, de réaliser une déclaration de conformité. “Les projets de recherche en tous points conformes à ces référentiels peuvent être mis en œuvre sans avoir à obtenir une autorisation préalable de la Cnil”, explique Hélène Guimiot-Breaud. L’usage des données est, dans tous les cas, borné par le principe de minimisation : le responsable de traitement ne peut collecter et traiter que les données nécessaires à la recherche. Pour être utilisées, les données des entrepôts doivent être pseudonymisées, ce qui se distingue de l’anonymisation. Des données anonymisées, qui ne permettent plus de retrouver l’identité des patients, ne sont plus des données à caractère personnel, de ce fait, le RGPD et la loi informatique et libertés ne s’appliquent pas lorsqu’elles sont réutilisées. Cette pseudonymisation des données ne dispense pas de l’information des patients, voire pour certaines recherches, du recueil de leur consentement. En plus de l’élaboration de méthodologies de référence et de la délivrance d’autorisations préalables, la Cnil détient aussi une mission de contrôle a posteriori afin de s’assurer que l’usage fait des données est conforme. Elle dispose également d’un pouvoir de sanction, variable en fonction de la violation et des mauvaises pratiques. Laure Martin Données cliniquesDonnées de santédonnées de vie réelleHôpitalPartenariatPublic/PrivéRecherche Besoin d’informations complémentaires ? Contactez le service d’études à la demande de mind À lire Cyberattaque : l’AP-HP porte plainte après le vol des données de plus d'un million de personnes analyses Entretien Dominique Pon (Ministère): "D'ici 2 ans, la France sera leader de la e-santé en Europe" La CNIL propose une auto-évaluation de maturité en gestion de la protection des données Radiologie : le CERF et Medexprim vont créer une plateforme de recherche clinique Dossier Groupements hospitaliers de territoire : de nouveaux enjeux de cybersécurité Entretien Hubert Béchart (Pierre Fabre) : "Nous alimentons nos décisions par des faits et non plus des intuitions" Entretien Karine Samama (Microsoft France): “D’ici 2025, la recherche aura séquencé 100 millions de génomes humains, soit 20 milliards de gigabytes de données” Droit Devant Du HDH au COVID-19, la Cnil sur tous les fronts en 2020