• Contenus gratuits
  • Notre offre
Menu
  • Ressources
    • Toutes les ressources
  • Infos
    • Toutes les infos
  • Essentiels
    • Tous les essentiels
  • Analyses
    • Toutes les analyses
  • Data
    • Data
  • Newsletters
  • Profil
    • Je teste 15 jours
    • Je me connecte
  • Profil
    • Mon profil
    • Je me déconnecte
CLOSE

Accueil > Financement et politiques publiques > Utilisation secondaire des données de santé : le temps de l’accélération

Utilisation secondaire des données de santé : le temps de l’accélération

Le 4 octobre dernier, Ludovic Lamarsalle, cofondateur de la CRO Heva, détaillait à mind Health la société de conseil qu’il venait de fonder. Ce spécialiste de l’analyse de la donnée de santé revient sur les principaux défis posés par l’utilisation secondaire de ces données, alors que se termine la phase de consultation publique sur la “Stratégie interministérielle pour construire notre patrimoine national des données de santé”.

Par Romain Bonfillon. Publié le 05 novembre 2024 à 22h59 - Mis à jour le 05 novembre 2024 à 15h46
  • Ressources

La stratégie nationale sur l’utilisation secondaire des données de santé, la première du genre, est largement inspirée des constats et propositions du rapport de Jérôme Marchand-Arvier, paru en janvier dernier. Son objectif est de co-construire une “trajectoire commune, cohérente et ambitieuse”, dans un domaine encore trop dominé par les initiatives éparses, le manque de coordination et de lisibilité.

Co-construite avec l’ensemble des acteurs publics concernés – la DNS, la Drees, la DGRI, le HDH, la Cnam, la DGOS, la DGE et l’AIS, la stratégie interministérielle proposée couvre la période 2025-2028. Une première version était soumise à consultation publique jusqu’au 5 novembre. Dans la perspective de l’entrée en vigueur du règlement relatif à l’espace européen des données de santé (EEDS), dont les dispositions sur l’usage secondaire entreront en application en 2028, il s’agit de préparer les acteurs à une modification en profondeur de l’écosystème des données de santé. Pour Ludovic Lamarsalle, ancien cofondateur de la CRO Heva, et fondateur de la jeune société de conseil Healstra, il y a urgence.

La gouvernance : à la recherche d’un pilote à la barre 

Epinglé par la rapport Marchand-Arvier pour avoir joué insuffisamment son rôle d’impulsion et de coordination de la politique d’utilisation secondaire des données de santé, le Comité stratégique des données de santé, qui existe depuis 2021, va voir sa composition étendue. La Direction générale des entreprises (DGE) et l’Agence de l’innovation en santé (AIS) rejoindront ce comité, “afin d’incarner davantage l’ensemble de l’écosystème de la santé”. L’une de ses premières missions consistera à “co-construire d’ici fin 2025, un premier plan d’urbanisation national efficace des entrepôts de données de santé anticipant les rôles clés de l’EEDS

Espace européen des données de santé : vers une révolution sectorielle ?

L’épineuse question de la Plateforme de données de santé (PDS)

La Plateforme de données de santé (PDS) ou Health Data Hub (HDH) était à l’origine appelée à héberger et opérer la base principale du SNDS, mission qui est encore aujourd’hui dévolue à la Cnam, en raison du choix de la solution logicielle Azure de Microsoft pour la plateforme technologique du HDH”. Ludovic Lamarsalle comprend “les problèmes que cela pose du point de vue de la sécurité et de la souveraineté des données, même si, d’un point de vue technique, le choix du HDH était bon”.

Le statu quo actuel lui donne raison. L’État n’a en effet pas trouvé d’offre commerciale qualifiée SecNumCloud permettant de répondre pleinement aux besoins d’hébergement de la PDS. Aussi a-t-il mis en place un plan d’action qui vise à désengorger les projets en attente d’accès aux données opérationnelles. Un appel d’offres est actuellement étudié par la DREES, la Cnam et la PDS pour proposer une “solution intercalaire”. Un calendrier précisant la mise en œuvre de cette offre doit être précisé fin 2024.Les feuilles de route technologiques des fournisseurs de cloud lauréats de l’AAP seront quant à elles établies au premier trimestre 2025, dans la perspective d’un futur hébergement du SNDS.

L’hébergement d’EMC2 par Azure : imbroglio juridique et technique

(SEULEMENT SI PLACE)

HDS, SecNumCloud…Qu’est-ce qui est suffisant ? 

Quel niveau de sécurité exiger pour les fournisseurs de cloud, qui travaillent sur la donnée de santé ? C’est une question qui a fait l’objet d’âpres débats, notamment dans le cadre de la loi SREN (Sécuriser et réguler l’espace numérique). En mars dernier, la CMP a tranché : ce sera la norme maximale, le SecNumCloud. “Si je travaille sur des données un peu expurgées, est-ce que le HDS n’est pas suffisant ?, s’interroge Ludovic Lamarsalle. Pour un EDS dans un hôpital, ill faut bien sûr avoir des normes importantes et je milite pour une sécurité forte, mais elle ne doit pas se faire au détriment de l’innovation. Les deux peuvent aller de pair. Si, par exemple, vous ne détenez qu’une partie de la donnée sur une petite étude, peut-être n’avez-vous pas besoin d’être SecNumCloud”.

De meilleurs outils cloud pour l’analyse de données

Au delà de la question de la souveraineté que pose l’hébergement des données de santé, le choix d’Azure par le HDH met en lumière la nécessité d’avoir des outils puissants et agiles pour pouvoir analyser la donnée. “Il ne suffit pas d’avoir des données pour pouvoir bien les traiter, explique Ludovic Lamarsalle. Si vous voulez faire beaucoup de data science, il faut pouvoir utiliser Python, des systèmes de dockerisation comme Kubernetes, et avoir la capacité d’embarquer des modèles LLM comme ceux de Mistral. Des acteurs comme OVH, Scaleway, Numspot sont aujourd’hui en capacité de pouvoir aider à développer notre écosystème. Il faut les soutenir en leur donnant des perspectives de ROI importantes, pour qu’ils puissent proposer des solutions avec des coûts alignés sur ceux pratiqués par les hyperscalers américains.” 

Des bases de données riches, mais insuffisamment cohérentes : la nécessaire coordination des EDS

Selon la stratégie nationale de réutilisation des données de santé, il incombe au Comité stratégique des données de santé de coordonner les travaux de réalisation d’une cartographie des besoins des différents utilisateurs de données de santé, pour que ceux qui détiennent cette donnée puissent mieux identifier les besoins. Cette cartographie doit aussi permettre au Comité d’identifier les bases qui pourraient intégrer le SNDS. Il travaille sur le sujet depuis mai 2022 et un arrêté ministériel d’extension du SNDS est prévu fin 2024. 

Aussi, la multiplication des entrepôts de données de santé a poussé l’État à envisager dans sa stratégie la construction d’un schéma d’articulation de ces EDS. Ces actions nécessiteront d’être coordonnées avec celles entreprises pour favoriser l’émergence d’un cadre national et de modalités de financement de ces bases de données.

Entrepôt de données de santé : quels sont les acteurs à en avoir constitué ?
Ludovic Lamarsalle, ancien cofondateur de la CRO Heva et créateur de la société de conseil Healtstra

Une nécessaire interopérabilité

L’utilisation secondaire des données de santé se heurte aujourd’hui à l’hétérégonéité des données stockées dans les EDS. 

“Les EDS sont une bonne chose, mais le problème reste l’interopérabilité, qui n’est pas développée du tout aujourd’hui. Ces acteurs sont très fragmentés et ont du mal à travailler ensemble. Ce n’est pas leur faute. Ils n’ont pas été formés à cela et il n’existe pas d’écosystème pour cela. Si l’on veut faire une étude globale, avec des données riches et multicentriques, de nombreuses questions se posent. Quel est le type de format utilisé ? Comment peut-on récupérer les données ? Peut-on les récupérer nous-mêmes ? Il reste possible de travailler sur certains sujets en faisant du federated learning mais il est plus facile de mener une étude lorsque vous avez toutes les données à votre disposition”, explique Ludovic Lamarsalle. 

Aujourd’hui, les mêmes données peuvent être récupérées de différentes manières selon chaque site. Les professionnels peuvent par exemple coder différemment un même résultat de biologie. Aussi, l’État préconise d’anticiper la question de la mise à disposition des données dès la conception de la base. D’ici le premier trimestre 2025, un planning d’élaboration des normes d’interopérabilité pour l’utilisation secondaire des données hospitalières doit être établi avec la PDS, en collaboration avec l’ANS et les éditeurs.

Les défis qui attendent les EDS hospitaliers

FReSH : le “où est Charlie ?” de la donnée de santé

Au même titre que les projets de recherche, les EDS et toutes les bases de données de santé devront prochainement faire l’objet d’un enregistrement dans le répertoire public de la PDS dès leur autorisation par la Cnil. Plus précis que l’actuel portail Épidémiologie France, le futur répertoire baptisé FReSH se veut plus riche et plus complet. Un catalogue de métadonnées contenant des informations plus détaillées sera proposé par la PDS pour certaines bases de données et permettra aux porteurs de projet d’évaluer l’intérêt d’une base pour leur question de recherche. Ce catalogue sera  ensuite articulé avec celui du réseau EEDS. Le répertoire national des bases de données françaises (inspiré du répertoire qu’a mis en œuvre le HDH pour les bases du catalogue du SNDS) doit être mis en ligne au premier semestre 2025.

Comment valoriser la donnée de santé ?

Les enjeux

Selon la Loi Informatique et Libertés de 1978,  les données de santé sont exclues du droit de propriété : elles n’appartiennent à personne. Dès lors, leur monétisation pose question. C’est de manière générale, leur anonymisation (condition sine qua non pour une utilisation secondaire, avec le consentement du patient), leur structuration et leur analyse qui peut faire l’objet d’une valorisation par la structure qui les détient. En l’absence d’un cadre, les modalités économiques et financières autour de la donnée sont aujourd’hui floues en France. 

Le constat

“Il y a aujourd’hui en France une problématique sur les partenariats public/privé qui ont du mal à se développer et un problème de visibilité sur le coût. Nous n’avons pas de doctrine aujourd’hui sur le coût d’accès à la donnée pour un acteur privé”, note le CEO d’Healstra. “J’ai rencontré il y a peu de temps des personnes travaillant au CPRD (le service du ministère de la santé britannique qui gère les études rétrospectives et prospectives de santé publique et cliniques, ndlr) et ils disposent de cet écosystème. Vous pouvez savoir précisément à quel type de données vous pouvez avoir accès, combien les licences vous coûtent. Leur offre est très structurée, c’est ce qui manque à l’offre française. Pour le SNDS, vous ne payez pas la donnée, mais vous n’avez pas de service non plus. C’est finalement logique. On ne met pas de valeur à cela.. Il y a un système de financement et de régulation à trouver”, observe Ludovic Lamarsalle.

La solution

La stratégie nationale prévoit d’harmoniser les pratiques d’accès, de contractualisation, de gestion des droits de propriété intellectuelle. Un premier cadre général de modalité économiques et financières doit être proposé au premier semestre 2025.

Le Comité stratégique des données de santé a commencé à travailler sur la question du financement des entrepôts de données de santé hospitaliers et a estimé que leurs besoins financiers se situent entre 60 et 90 millions d’euros par an pour les CHU. Le comité examine désormais les scénarios d’un financement pérenne de ces EDS hospitaliers, avec l’objectif de le rendre “pleinement opérationnel d’ici 2027”. Parallèlement, il étend son analyse à l’ensemble des EDS, notamment ceux de médecine de ville.

À l’échelle européenne, le règlement EEDS prévoit deux formes de redevances : une pour la mise à disposition des données et une pour couvrir des coûts de collecte des détenteurs de données. Des financements spécifiques nationaux et européens seront nécessaires, qui feront l’objet d’une analyse d’impact avant une analyse financière, pour déterminer les besoins de chacun des acteurs.

Faciliter l’accès au données : le défi principal

Comment faire plus simple ?

Pour Ludovic Lamarsalle, le rapport Marchand-Arvier a eu le mérite de souligner le problème d’accès aux données de santé. “Il propose d’alléger la réglementation, c’est-à-dire de ne plus être dans un système d’autorisation mais dans un système où l’on va s’engager à respecter un certain nombre de méthodologies de référence”. La stratégie nationale présentée en septembre dernier réduit en effet le recours aux procédures d’autorisation CNIL / CESREES, qui devront rester l’exception et ne concerner que les cas complexes. À noter que les négociations européennes du règlement EEDS ont permis de maintenir la coexistence de mécanismes d’accès nationaux et par conséquent de conserver la procédure d’accès permanent au SNDS ainsi que les procédures d’accès simplifiées.

Aussi, afin d’explorer la piste de l’utilisation de données synthétiques pour simplifier les procédures, la stratégie nationale propose de créer d’ici la fin de l’année un groupe de travail associant organismes notifiés, juristes et chercheurs pour étudier l’impact du recours à ce nouveau type de données.

Les données synthétiques sont-elles l’avenir des essais cliniques ?

Comment faire plus court ?

Comme l’indiquait la note du groupe de travail “Financement” piloté par le Comité stratégique des données de santé, l’un des freins principaux à l’accès aux données réside aujourd’hui dans la durée de contractualisation de cet accès aux données. 

“Entre les demandes d’autorisation et l’accès aux données, il s’écoule aujourd’hui en moyenne entre un an et 18 mois. La Cnam a une petite équipe (la cellule Demex, composée de moins de 10 personnes, ndlr) qui travaille bien, mais ils ne sont pas magiciens. Le rapport Marchand-Arvier voudrait aller plus vite en donnant la possibilité d’exploiter directement les données en confiant l’extraction à certains acteurs triés sur le volet. On parle notamment du CASD. Je ne sais pas si c’est le bon choix, les enjeux d’aujourd’hui ne sont plus ceux d’hier”, observe Ludovic Lamarsalle. 

Au cours de ses dernières fonctions au sein de la CRO Heva, il a pu constater que la France avait désormais du mal à faire face à une concurrence en matière de recherche clinique. “ La France a la chance d’avoir avec le SNDS la plus belle base de données au monde et je pense qu’elle est en train de passer à côté de l’opportunité de développer un bel écosystème vertueux pour tout le monde. Nous sommes dans un domaine très concurrentiel, qui va très vite. Les industriels de la pharma ne peuvent pas attendre deux ans pour accéder à des données. Logiquement, ils vont se tourner vers les jeux de données les plus disponibles, et c’est déjà le cas. J’observe un ralentissement depuis 2023 sur les demandes de laboratoires internationaux qui veulent travailler avec les données françaises…Si l’on ne trouve des solutions que dans 2 ou 3 ans, je pense qu’il sera trop tard. Il y a urgence. Il faudrait pouvoir avoir des accès de l’ordre de 3 mois, cela serait l’idéal.”

La recherche clinique française est-elle toujours attractive ?

Pour accélérer le processus de contractualisation, la stratégie sur l’utilisation des données secondaires de santé veut proposer à la fin de cette année un contrat-type, une grille de redevance et des principes partagés pour la mise à disposition des données. Aussi, elle précise que “les travaux sur le système d’information visant à faciliter les appariements directs avec ou sans reconstitution du NIR conduits par la PDS (SI “concentrateur”) sont en cours de finalisation et l’outil pourra être en production d’ici fin 2024”.

L’objectif est d’arriver d’ici quatre  ans à atteindre progressivement des délais d’accès compatibles avec les exigences du règlement EEDS (2 mois). En attendant, la stratégie nationale veut construire d’ici la fin du premier semestre 2025 des indicateurs de délais d’accès entre le dépôt de la demande Cnil et la mise à disposition des données pour l’ensemble des projets (pour les accès via la CNAM, puis via la PDS dès qu’un hébergement aura été autorisé).

Romain Bonfillon
  • base de données
  • cloud
  • CNIL
  • Données de santé
  • Entrepôt de données de santé
  • HDS
  • Health data hub
  • Politique de santé
  • Recherche
  • Stratégie

Besoin d’informations complémentaires ?

Contactez Mind Research

le service d’études à la demande de mind

Découvrez nos contenus gratuitement et sans engagement pendant 15 jours J'en profite
  • Le groupe mind
  • Notre histoire
  • Notre équipe
  • Nos clients
  • Nous contacter
  • Nos services
  • mind Media
  • mind Fintech
  • mind Health
  • mind Rh
  • mind Retail
  • mind Research
  • Les clubs
  • mind et vous
  • Présentation
  • Nous contacter
  • Vous abonner
  • A savoir
  • Mentions légales
  • CGU
  • CGV
  • CGV publicité
  • Politique des cookies
Tous droits réservés - Frontline MEDIA 2025
  • Twitter
  • LinkedIn
  • Email