Accueil > Financement et politiques publiques > Entrepôts de données de santé : 21 CHU sur 32 ont créé le leur Entrepôts de données de santé : 21 CHU sur 32 ont créé le leur Les entrepôts de données de santé sont devenus cruciaux pour l’amélioration des parcours de soin et la recherche. Les pouvoirs publics cherchent d’ailleurs à accroître leur développement sur le territoire hexagonal via des financements dédiés. Après un premier recensement l’an dernier, mind Health a actualisé la liste des entrepôts créés en faisant un focus sur les centres hospitaliers universitaires. Par Coralie Baumard et Aymeric Marolleau. Publié le 26 novembre 2024 à 23h00 - Mis à jour le 07 janvier 2025 à 15h30 Ressources D’ici fin 2025, le Health Data Hub doit mettre à disposition des hôpitaux une palette d’outils permettant de déployer rapidement un entrepôt de données de santé. C’est l’un des objectifs fixés dans la version initiale de la “Stratégie interministérielle pour construire notre patrimoine national des données de santé (2025-2028)” présentée en septembre dernier. Après avoir été soumise à consultation, sa version finale sera dévoilée le 3 décembre prochain. Cette stratégie a pour objectif de développer les bases de données et l’usage secondaire des données de santé à l’échelle nationale. Elle doit également accompagner les acteurs de l’écosystème afin qu’ils se préparent à l’entrée en vigueur du règlement européen sur les données de santé, dont les dispositions sur l’usage secondaire entreront en application en 2028. Les entrepôts de données de santé (EDS) sont un des leviers majeurs de cette stratégie. Le rapport “Fédérer les acteurs de l’écosystème pour libérer l’utilisation secondaire des données de santé”, présenté en janvier dernier et dont certaines propositions sont reprises dans la version initiale de la stratégie nationale, notait que cette “dynamique de structuration des entrepôts de données de santé, particulièrement dans le champ hospitalier, est un atout important pour l’enrichissement du patrimoine de données de santé français.” Signé par Jérôme Marchand-Arvier, Stéphanie Allassonnière, Anne-Sophie Jannot et Aymeril Hoang, il rappelait que les EDS hospitaliers présentent “deux avantages”: ils intègrent de nombreuses données médicales absentes du SNDS (biologie, données textuelles, données sur le cycle du médicament, etc.) et leurs données sont produites en routine, à partir des systèmes d’information hospitaliers et après une étape de pseudonymisation, et recouvrent donc un grand nombre de patients. Les EDS ouvrent donc de nouvelles perspectives pour la recherche clinique, le pilotage d’établissement ou encore la prise en charge des patients. Pour mieux connaître ces EDS et les acteurs qui les ont créés, pour la deuxième fois, mind Health a identifié sur le site Légifrance la liste de ceux qui ont fait l’objet d’une décision ou d’une délibération de la part de la Cnil, ainsi que ceux qui ont été créés dans le cadre du référentiel. Certains ont pu échapper à notre attention, en particulier lorsque leur création est le fruit d’une autorisation tacite de la part de la Cnil, qui ne tient pas de liste exhaustive des EDS actifs (voir méthodologie). La liste des entrepôts de données de santé créés en France Au 22 novembre 2024, nous avons ainsi recensé 131 EDS créés depuis janvier 2017. 78 ont obtenu une autorisation de la Cnil, 47 entrent dans le cadre du référentiel qu’elle a mis en place en 2021 (voir encadré). Quelles démarches pour créer un entrepôt de données de santé ? La Commission nationale de l’informatique et des libertés (Cnil) définit les entrepôts de données de santé comme “des bases de données destinées à être utilisées notamment à des fins de recherche, d’études ou d’évaluation dans le domaine de la santé”. Dans son rapport de novembre 2022 consacré aux entrepôts de données hospitaliers (EDSH), la Haute Autorité de Santé (HAS) fait remonter à 2008 les premiers travaux de mise en place, la dynamique s’accélérant à la fin des années 2010 jusqu’à l’instauration de l’autorisation réglementaire de la Cnil en 2017. La création de ces dispositifs est désormais très encadrée. Les établissements et industriels de santé ont deux principales options : Obtenir une autorisation de la Cnil, après délibération de l’instance. Depuis l’adoption d’un référentiel en 2021, si la constitution de l’entrepôt se fonde sur l’exercice d’une mission d’intérêt public, il est possible de transmettre à la Cnil une simple déclaration de conformité. Mais les acteurs de la santé ne sont pas tenus à ces formalités si le consentement de toutes les personnes concernées a été recueilli ou si l’entrepôt est nécessaire à des fins de médecine préventive, des diagnostics médicaux, de l’administration de soins ou de traitements, ou de la gestion de services de santé, et qu’il est mis en œuvre par un membre d’une profession de santé. Quels acteurs ont obtenu une autorisation ? Les 131 EDS que nous avons recensés ont été créés par 120 responsables de traitement différents, parfois en consortium. Nous les avons classés dans une dizaine de grandes familles. 33 EDS ont ainsi été créés par des industriels de santé (un quart du total), 18 par des associations de professionnels de santé et autant par des instituts de recherche. Mais la catégorie la plus fournie est celle des établissements de santé, à l’origine de 56 EDS (43 %). 44 d’entre eux ont été créés par un hôpital, dont 32 par 21 centres hospitaliers universitaires (CHU). Certains CHU en ont plusieurs : les Hospices civils de Lyon en ont quatre, l’AP-HP trois, l’AP-HM et les CHU de Rouen, Nantes, Bordeaux, Lille, Brest et Angers en ont deux chacun. À notre connaissance, 11 CHU n’ont donc pas encore d’EDS. Il s’agit de ceux de Metz-Thionville, Orléans, Nancy, Amiens-Picardie, Clermont-Ferrand, La Réunion, Limoges, La Martinique, Nîmes, Saint-Etienne et Toulouse. Un appel à projets pour accélérer le déploiement Grâce à l’appel à projet (AAP) “Accompagnement et soutien à la constitution d’entrepôts de données de santé hospitaliers”, certains de ces CHU seront prochainement dotés d’un EDS. Lancé en 2022 par les pouvoirs publics, il vise à multiplier les projets d’EDS pour constituer un réseau national. Ses deux vagues en avril et décembre 2023 ont permis de récompenser 16 consortiums regroupant, notamment, 31 CHU / CHR. Initialement doté de 50 millions d’euros, son enveloppe totale a finalement été portée à 75 millions d’euros en mars 2023. Ce montant est loin des 200 millions d’euros estimés nécessaires par le Groupement de Coopération Sanitaire (GCS) HUGO, qui gère la plateforme Ouest Data Hub regroupant les données des CHU-CHR des régions Bretagne, Pays-de-Loire, Centre-Val de Loire, pour construire un réseau national des EDS en France. Mais Marc Cuggia, un de ses pilotes et professeur d’informatique médicale (PUPH) à l’Université Rennes 1, se réjouit de cette stratégie “pour créer, exploiter et mettre en réseau ces entrepôts” et salue “une véritable avancée sur le développement des EDS alors qu’il y a une dizaine d’années le sujet n’était pas identifié”. Arthur Delapalme, cofondateur et CEO de Codoc, une société qui propose une solution d’entrepôt de données de santé, des applicatifs intelligents et une plateforme de transparence, confirme que l’AAP a “changé la donne et les mentalités.” Il le constate dans ses discussions avec des clients potentiels : “La question n’est plus : “est-il intéressant d’avoir un EDS ?” Mais “le moment est-il venu pour mon établissement de s’équiper ?””. HUGO, HOURAA… Mailler le territoire grâce aux groupements d’établissements La majorité des projets lauréats sont portés par des consortiums et non des établissements seuls. “Il y a une stratégie de maillage territorial consistant à embarquer, au-delà des CHU, des établissements de plus petite taille”, souligne Marc Cuggia. Le GCS HUGO a été un des premiers artisans de cette logique de regroupement d’établissements, puisqu’il réunit les six entrepôts construits par les CHU d’Angers, Brest, Nantes, Rennes, Tours et l’Institut de Cancérologie du Grand Ouest. Depuis décembre 2020, il a lancé la plateforme Ouest Data Hub (ODH) pour regrouper les données anonymisées de ses six établissements membres et démultiplier les possibilités en matière de recherche. Le projet ODH 2.0, lauréat de la première vague de l’AAP, vise à élargir encore ce réseau en constituant des EDS au CHU d’Orléans, au CH Le Mans, au Groupe Hospitalier Bretagne Sud à Lorient et au CHD Vendée. “Grâce au financement de l’appel à projets, nous allons également développer les EDS déjà déployés en les enrichissant de nouveaux flux de données (imagerie, réanimation, etc.) et consolider les équipes. Cela nous permet également de mutualiser les moyens et de déployer de nouveaux EDS dans des établissements qui n’auraient pas la masse critique pour le faire, afin qu’ils puissent également réaliser des études”, explique Marc Cuggia. Le GSC HOURAA, qui réunit les quatre CHU de la région Auvergne Rhône-Alpes (Clermont-Ferrand, Grenoble Alpes, Lyon et Saint-Etienne), mise également sur l’AAP pour créer de nouveaux EDS. Lauréat de la seconde vague, il a obtenu un financement de 10 M€ sur quarante mois, subventionné à 50 % par l’État, pour construire un outil EDS commun dénommé “EDS-D2H”, mis œuvre au sein des quatre CHU. Si celui de Grenoble et les HCL disposaient déjà d’un EDS, Saint-Etienne et Clermont-Ferrand en seront dotés à la fin du projet en 2027. Ce déploiement s’appuiera sur un partenaire industriel, sélectionné à la suite d’un partenariat d’innovation (une procédure de marché public, Ndlr.). La décision sera annoncée début 2025. “La force de notre projet est que dans chacun des CHU est déployé le même dossier patient informatisé. L’EDS sera donc alimenté par différents gisements de données, tout d’abord, celles de patients puis l’imagerie, la biologie, etc. Cela va nous permettre d’avoir un panel assez complet pour différents usages en termes de projets de recherche, de structuration des parcours de soins et de pilotage”, indique Audrey Sokolo, délégué général du GCS HOURAA. Concernant les futurs projets de recherche, le GSC envisage plusieurs pistes, notamment de travailler sur la prédiction des séjours hospitaliers complexes en étudiant les données des urgences et les problématiques liées au vieillissement de la population. “Nous allons être en mesure d’exploiter des cohortes de données massives de quatre établissements qui se situent sur des territoires différents et avec des populations diverses. En termes de recherche, c’est extrêmement intéressant”, souligne Audrey Sokolo. Quels types d’entrepôts ? À l’occasion de la publication de sa cartographie des EDS, en novembre, la Cnil a qualifié leur typologie, en distinguant trois catégories : Les entrepôts d’établissements de santé (ou entrepôts “généralistes”), qui réunissent toutes les données qui viennent d’un même établissement pour regrouper les données de précédentes recherches et celles recueillies dans le cadre de la prise en charge de patients ; Les entrepôts thématiques, qui rassemblent les données sur une population spécifique (patients avec une pathologie particulière, la population d’une région, etc.) ; Les entrepôts regroupant des données issues de logiciels de gestion (cabinets médicaux, officines de pharmacie, etc.) L’analyse de ces données appliquée aux CHU montre que ceux-ci ont d’abord créé des EDS généralistes (cinq en 2019) avant de progressivement tendre vers un équilibre parfait avec les EDS thématiques fin 2023 : 13 pour chaque catégorie. Mais trois entrepôts généralistes ont été créés en 2024, pour aucun spécialisé. En 2020, le CHU de Nantes a par exemple obtenu l’autorisation de créer une base de données de patients suivis en réanimation, intitulée ATLANREA. L’année précédente, celui de Besançon avait créé un registre régional sur l’embolie pulmonaire. Plusieurs refus de la Cnil Plusieurs CHU ont essuyé des refus de la Cnil. Ce fut le cas pour l’AP-HM en 2020, lorsqu’il a souhaité créer un EDS relatif aux hernies diaphragmatiques congénitales chez l’enfant en France pour permettre la réalisation de recherches ultérieures, et pour celui d’Angers en 2021 lorsqu’il a voulu constituer une base de données rassemblant les informations génétiques et cliniques de patients atteints d’une maladie mitochondriale afin d’améliorer l’efficacité des diagnostics de ces patients et de permettre aux laboratoires hospitaliers français de réutiliser ces données dans le cadre de travaux de recherche. Le CHU de Saint-Etienne a reçu deux refus, en 2021 et 2022. Dans les deux cas, il s’agissait de constituer un EDS “à des fins de recherches ultérieures”. Un enjeu majeur pour les CHU Au printemps dernier, la conférence des directeurs généraux de Centres hospitaliers universitaires (CHU) a créé une Commission Data, dirigée par Monique Sorrentino, DG du CHU Grenoble Alpes, afin de porter la voix de ces organismes au niveau national sur la stratégie liée aux données de santé. Une instance associative, la Fédération nationale scientifique des données de santé, a également été constituée pour permettre aux établissements d’aborder les questions scientifiques et technico-scientifiques autour des données de santé. “Nous allons déposer le 4 décembre un appel à projets afin de fédérer l’ensemble des CHU de France pour permettre le partage de données de manière fluide, décentralisée. Nous considérons que cela va nous permettre de réaliser des études de faisabilité à grande échelle pour des industriels ou des projets académiques en identifiant les centres ayant les patients disposant des caractéristiques demandées”, détaille Marc Cuggia, membre de la Commission Data. Il s’agit aussi de partager des données sur des territoires ainsi que de mettre en place une approche d’apprentissage fédéré. Le projet vise à déployer ses services à l’échelle nationale pour être en capacité de conduire des projets partenariaux à grande échelle ou à des échelles plus modestes. La Commission Data a également soumis une dizaine de propositions lors de la phase de consultation publique de la stratégie interministérielle. Deux sujets se détachent, la question du financement des EDS et celle de la formation. “Nous sommes inquiets sur les perspectives économiques et le fait de ne pas avoir un financement récurrent pour maintenir les infrastructures”, alerte Marc Cuggia. En avril 2023, le groupe de travail “Financement des bases de données de santé publiques” du comité stratégique des données de santé considérait qu’une enveloppe globale annuelle de 60 à 90 millions d’euros serait nécessaire pour le développement d’un réseau de 30 EDS de taille critique. Il estimait en moyenne à 2 millions d’euros par an le coût de développement d’un EDS sur 5 ans, puis à 3 millions d’euros par an le maintien de l’entrepôt et la mise à disposition des données à des porteurs de projet.. Si certains dispositifs comme l’AAP DAtAE constituent une piste pour les établissements, le modèle économique reste à trouver. La pérennisation à moyen terme est aujourd’hui dépendante des financements publics. Autre sujet d’importance, le recrutement et la formation des équipes (data scientist, ingénieur réseaux, etc.) au sein des CHU pour gérer ces EDS. “Tous les établissements se lancent sur le sujet des EDS, cela crée un appel d’air pour recruter des ingénieurs formés au domaine. Il s’agit de métiers très techniques, il faut donc créer des filières de formation hospitalo-universitaire. Nous plaidons aussi pour que des postes soient créés pour accompagner cet enjeu de formation initiale et continue, comme le gouvernement allemand l’a fait avec son programme Medical Informatics Initiative. Pour être attractifs, il faut également adapter les grilles salariales des ingénieurs hospitaliers”, indique Marc Cuggia. Reste à savoir si ces propositions seront retenues dans la version finale de la stratégie interministérielle. Quel calendrier pour le nouveau référentiel EDS ? En janvier 2024, le rapport “Fédérer les acteurs de l’écosystème pour libérer l’utilisation secondaire des données de santé” indiquait que le “référentiel sur les entrepôts de données de santé nécessite également des ajustements”. La Cnil annonçait à la même période que son référentiel allait être soumis à concertation. Contactée par mind Health, l’institution a indiqué qu’à la suite de cette concertation, les réponses apportées par les organismes dans le cadre de la consultation sur les référentiels santé de la Cnil ont été analysées en interne. Les axes prioritaires de travail seront présentés le 10 décembre dans le cadre d’un webinaire. Les groupes de travail seront lancés au printemps 2025 en lien avec les différentes parties prenantes. Méthodologie Lorsque la Cnil est saisie d’une demande de création d’un entrepôt de données de santé, sa délibération ou sa décision est publiée sur le site de Légifrance. Les dossiers font l’objet d’une délibération lorsqu’ils nécessitent une vigilance majeure, par exemple en raison du volume de données ou encore de la sensibilité des données versées dans l’entrepôt. Nous avons exploré ces données à l’automne 2023. Malgré nos efforts, certains entrepôts ont pu échapper à notre recherche : lorsque les demandes n’ont pas reçu de réponse de la Cnil au bout de quatre mois, ils bénéficient d’une autorisation tacite ; mais alors leur nom ne figure pas sur le site de Légifrance. Certaines demandes figurent sur une liste tenue à jour par la Cnil, dite “Liste article 36”, que nous avons également consultée. Mais il n’est pas toujours clair si ces demandes ont été autorisées ou non par la Cnil. Nous ne les avons donc pas toujours prises en compte. Certains acteurs s’étant déclaré conforme au référentiel semblent sans rapport avec le domaine de la santé. Par souci d’exhaustivité, en attendant que ces erreurs d’aiguillage soient résolues, nous les avons parfois tout de même conservés dans notre liste. Nous avons également cherché à recouper les informations concernant les entrepôts listés par la HAS dans son rapport de novembre 2022 en contactant directement les établissements cités. Nous avons ajouté ceux nous ayant confirmé la constitution de leur entrepôt. En outre, la Cnil n’a pas connaissance de tous les entrepôts de données de santé créés, puisque ceux pour lesquels le responsable de traitement a obtenu le consentement des personnes concernées et ceux mis en oeuvre uniquement à des fins de médecine préventive, de diagnostics médicaux, d’administration de soins, de traitements ou de gestion de services de santé par des professionnels de santé et les services de soins de santé ne sont pas soumis à autorisation de la Commission, ni au référentiel. La Commission rappelle cependant que dans tous les cas le responsable de traitement est tenu de respecter les exigences de conformité au RGPD (registre, analyse d’impact, etc.). Par ailleurs, la définition des entrepôts de données de santé ne semble pas toujours très claire. Par exemple, dans son étude de novembre 2022, la HAS écrit avoir recensé 22 EDS. Mais le fichier qu’elle propose en annexe en compte 39, dont cinq ont une “date de début” antérieure à 2017 et huit seulement ont une “date début Cnil”. En novembre 2024, le laboratoire d’innovation numérique de la Cnil (Linc) a publié une cartographie des entrepôts de données de santé en France. L’institution partage sur son site les données sur lesquelles s’appuie ce service, arrêtées au 18 octobre 2024. Nous les avons consultées pour compléter la base que nous avons constituée à l’automne 2023. Cela nous a notamment permis d’enrichir la catégorie des entrepôts (généralistes, thématiques, logiciels de gestion). Notre base peut être consultée ici. Vous avez des informations complémentaires sur les EDS de cette liste ? Vous avez connaissance d’un EDS qui n’y figure pas ? Contactez-nous : redaction@mindhealth.fr ou datalab@mind.eu.com Coralie Baumard et Aymeric Marolleau Données de santéEntrepôt de données de santéFinancementsIntelligence Artificielle Besoin d’informations complémentaires ? Contactez le service d’études à la demande de mind