Regards croisés : faut-il rassembler les données de santé ?

04 novembre 2022

En novembre dernier a été créée officiellement la Plateforme des données de santé (PDS). Cette infrastructure, appelée aussi Health Data Hub, a pour vocation de réunir et organiser les données de santé des Français issues de sources publiques variées (notamment celles issues de l'Assurance maladie ou des hôpitaux publics), et de promouvoir leur utilisation en les mettant à la disposition des chercheurs. Mais elle n'est pas sans soulever quelques craintes et oppositions.

Points de vue de deux experts.

Infographie qui représente des données passant dans un entonnoir pour arriver sur un ordinateur.

Pierre Lombrail

Professeur de santé publique à l'université Paris 13, membre du Comité d'éthique de l'Inserm

OUI, MAIS

Il existe aujourd'hui plusieurs raisons de s'inquiéter de cette centralisation des bases de données de santé. Tout d'abord, leur hébergement par une société privée américaine fait craindre que ces données soient un jour transmises par exemple aux autorités outre-Atlantique, ou qu'elles soient l'objet d'enjeux commerciaux contraires à l'éthique scientifique et à l'intérêt collectif. Par ailleurs, un stockage centralisé rend plus vulnérable au risque de piratage massif. On a bien vu récemment que l'entreprise Doctolib et l'Assistance publique- Hôpitaux de Paris, une structure publique, ont fait l'objet de vols de données. Or « plus le pot de miel est gros, plus il attire les ours », comme l'a dit Marcel Goldberg, professeur de santé publique et d'épidémiologie qui a beaucoup travaillé à l'élaboration de bases de données de santé. Au Canada, les bases de données sont réparties dans différents hébergements, cela dilue le risque. D'ailleurs, il serait plus juste que ce soit aux utilisateurs de venir à la rencontre des données dont ils ont besoin, plutôt qu'aux bases à se rassembler entre elles. Enfin, contrairement à ce que laissent entendre les partisans de l'intelligence artificielle, je pense qu'il n'est pas forcément nécessaire de travailler sur des volumes considérables de données de santé pour aboutir à des hypothèses de réponses pertinentes.

Ségolène Aymé

Directrice de recherche émérite à l'Inserm, vice-présidente du Conseil scientifique du Health Data Hub

OUI

Nous avons de plus en plus de bases de données de santé publiques en France, comme celles de l'Assurance maladie ou des hôpitaux publics, mais 80 % des informations collectées ne sont pas exploitées : les équipes qui rassemblent ces données n'ont souvent pas les financements suffisants pour ensuite les exploiter à des fins de recherche. Notre objectif n'est pas de centraliser les données elles-mêmes, mais de créer des copies des bases préexistantes, comme les données d'hospitalisation, de remboursements de l'Assurance maladie ou des causes de décès, et de les stocker en commun pour mieux les interconnecter et les enrichir. Bientôt d'autres types de bases les rejoindront, comme la Banque nationale de données des maladies rares ou la base des patients infectés par une hépatite C ou B. Chaque base est expertisée pour s'assurer de ses qualités (recueil des données par exemple) et que les patients sont « pseudonymisés », c'est-à-dire qu'on ne peut pas les identifier individuellement mais qu'ils peuvent être retrouvés d'une base à l'autre. Car c'est ça qui est intéressant ! En travaillant sur une telle masse critique, on va pouvoir par exemple détecter rapidement des problèmes de pharmacovigilance. Certes, les données sont physiquement stockées chez un prestataire privé à l'étranger, mais comme le Health Data Hub est une structure publique, il est strictement encadré par la loi française. Par ailleurs, chaque promoteur d'une base de données (Assurance maladie, hôpitaux) en conserve la primauté d'exploitation et décide quelles informations peuvent ou non être partagées avec d'autres chercheurs. Et chaque équipe souhaitant travailler sur ces données doit déposer un dossier détaillant son projet qui est ensuite examiné par un comité éthique et scientifique.