Le partage des données de recherche
Marc Couture — 20 janvier 2026
La science ouverte est un mouvement international
qui prône une recherche plus transparente,
collaborative, rigoureuse et accessible. Elle
englobe l’accès ouvert aux
publications, mais aussi le partage des données
de recherche, un aspect en rapide
développement. Plusieurs pays ont
adopté des politiques concrètes pour
soutenir la science ouverte, incluant des
obligations ou incitations au partage des
données de la part des agences de
financement. Le programme Horizon Europe en est un
bon exemple. À l’image de ce mouvement,
certaines revues scientifiques souhaitent aussi se
positionner en faveur de cette pratique, en
instaurant des politiques progressives visant
à rendre les données associées
aux publications aussi ouvertes que possible, en
tenant compte des contraintes méthodologiques
et éthiques.
Les données de recherche peuvent être quantitatives (mesures numériques issues d’expériences, résultats de sondages, etc.) ou qualitatives (provenant de recherches avec des humains : entretiens, observations, productions écrites, photos, vidéos, etc.). Elles peuvent être brutes, traitées ou agrégées, selon les contraintes et le contexte de la recherche. Pour être exploitables, ces données doivent être accompagnées de documents méthodologiques (questionnaires, guides d’entrevue, description des conditions expérimentales, etc.) permettant leur compréhension et réutilisation rigoureuses.
Le partage des données vise plusieurs objectifs :
Pour les chercheuses et chercheurs eux-mêmes, les bénéfices sont également tangibles : les données, lorsque déposées sur des répertoires, peuvent être citées à l’aide de DOI (identifiants numériques) attribués par les dépôts, ce qui augmente la visibilité et l’impact des travaux. La réutilisation des données peut aussi mener à des collaborations ou à des publications conjointes.
Le spectre du partage des données est large. La méthode la plus rudimentaire consiste à déclarer que les données sont disponibles sur demande. Cependant, cette pratique se révèle largement inefficace, les demandes demeurant souvent sans réponse. C’est pourquoi de plus en plus d’organisations et de revues favorisent, voire exigent, le dépôt des données sur des répertoires spécialisés.
Ces dépôts permettent notamment de rendre les données conformes aux principes FAIR, qui visent à maximiser tant leur découvrabilité que leur utilisabilité.
Quelle que soit la méthode de diffusion choisie, les conditions du partage peuvent varier :
Le partage est donc modulable, selon le type de données, les documents complémentaires fournis et les conditions d’accès et de réutilisation. On parle alors de données plus ou moins ouvertes, en fonction de la transparence et des restrictions imposées.
Malgré une attitude généralement favorable au partage, sa mise en œuvre soulève des difficultés pratiques et des préoccupations éthiques, particulièrement dans les recherches qualitatives en sciences humaines.
Préparer des données pour leur diffusion demande du temps, des compétences et des ressources. Attendre la fin du projet pour organiser ce partage est souvent inefficace, voire impossible. Il est préférable d’intégrer dès le départ un plan de gestion des données, incluant les modalités de partage, les formats, la documentation et les procédures d’anonymisation.
Pour les projets financés, les organismes reconnaissent ces exigences et permettent d’inclure les coûts dans les budgets. En revanche, pour les recherches non financées, cela peut représenter un obstacle majeur. Certaines institutions offrent un soutien, notamment pour le dépôt final sur les répertoires spécialisés.
Le principal défi éthique concerne le respect du consentement éclairé et de la confidentialité des personnes participantes, surtout en contexte de données sensibles ou identifiantes.
Le formulaire de consentement doit spécifier clairement si les données seront partagées, dans quelles conditions et avec qui. Il est recommandé de prévoir un consentement distinct pour le partage, qui peut être demandé à la fin de la collecte. Cela permet aux personnes participantes de choisir ce qui doit peut être rendu public. De manière générale, celles-ci sont favorables à ce que leur contribution serve à d’autres recherches, pourvu que leur anonymat soit respecté.
Cependant, si le partage n’a pas été prévu initialement, il devient difficile, voire impossible, de rendre les données accessibles a posteriori, même si les responsables de la recherche le souhaitent.
La confidentialité, garante du respect éthique, devient plus complexe dès lors qu’on envisage un partage des données. Dans ce cas, une anonymisation minimale (remplacement des noms, etc.) ne suffit pas; il faut procéder à une anonymisation approfondie, en masquant aussi les éléments identifiants indirects (lieux, fonctions, événements uniques, etc.).
Il n’existe pas de méthode universelle pour cette tâche. Les responsables de la recherche doivent donc prendre des décisions au cas par cas, en fonction :
Une autre solution consiste à restreindre l’accès aux données (ex. : via des répertoires contrôlés), tout en les anonymisant modérément, en posant comme condition d’accès un engagement formel (signé) en matière de confidentialité. Cela permet de préserver une certaine ouverture, tout en protégeant les personnes concernées. Néanmoins, cela limite la portée des données et peut ne pas satisfaire les exigences des organismes de financement ou des revues scientifiques.
Le partage des données de recherche est une composante essentielle de la science ouverte. Il favorise la transparence, la reproductibilité, la collaboration et l’innovation. Toutefois, sa mise en œuvre requiert une planification rigoureuse, une connaissance des enjeux éthiques et des ressources adéquates.
Dans le cas des données qualitatives sensibles, le partage doit trouver un équilibre entre l’ouverture maximale – souhaitable pour la communauté scientifique – et le respect nécessaire de la confidentialité, condition éthique fondamentale. Cette tension est bien résumée par la formule : « aussi ouvertes que possible, aussi fermées que nécessaire ».
Ce texte est un résumé, produit par ChatGPT et révisé par l'auteur, d'un document plus substantiel, contenant entre autres des références bibliographiques, préparé dans le cadre de l’adoption par la Revue de règles de partage des données de recherche.