Le partage des données de recherche

Marc Couture — 20 janvier 2026


La science ouverte est un mouvement international qui prône une recherche plus transparente, collaborative, rigoureuse et accessible. Elle englobe l’accès ouvert aux publications, mais aussi le partage des données de recherche, un aspect en rapide développement. Plusieurs pays ont adopté des politiques concrètes pour soutenir la science ouverte, incluant des obligations ou incitations au partage des données de la part des agences de financement. Le programme Horizon Europe en est un bon exemple. À l’image de ce mouvement, certaines revues scientifiques souhaitent aussi se positionner en faveur de cette pratique, en instaurant des politiques progressives visant à rendre les données associées aux publications aussi ouvertes que possible, en tenant compte des contraintes méthodologiques et éthiques.

Quelles données peuvent être partagées?

Les données de recherche peuvent être quantitatives (mesures numériques issues d’expériences, résultats de sondages, etc.) ou qualitatives (provenant de recherches avec des humains : entretiens, observations, productions écrites, photos, vidéos, etc.). Elles peuvent être brutes, traitées ou agrégées, selon les contraintes et le contexte de la recherche. Pour être exploitables, ces données doivent être accompagnées de documents méthodologiques (questionnaires, guides d’entrevue, description des conditions expérimentales, etc.) permettant leur compréhension et réutilisation rigoureuses.

Pourquoi partager les données?

Le partage des données vise plusieurs objectifs :

Pour les chercheuses et chercheurs eux-mêmes, les bénéfices sont également tangibles : les données, lorsque déposées sur des répertoires, peuvent être citées à l’aide de DOI (identifiants numériques) attribués par les dépôts, ce qui augmente la visibilité et l’impact des travaux. La réutilisation des données peut aussi mener à des collaborations ou à des publications conjointes.

Modalités de partage

Le spectre du partage des données est large. La méthode la plus rudimentaire consiste à déclarer que les données sont disponibles sur demande. Cependant, cette pratique se révèle largement inefficace, les demandes demeurant souvent sans réponse. C’est pourquoi de plus en plus d’organisations et de revues favorisent, voire exigent, le dépôt des données sur des répertoires spécialisés.

Ces dépôts permettent notamment de rendre les données conformes aux principes FAIR, qui visent à maximiser tant leur découvrabilité que leur utilisabilité.

Quelle que soit la méthode de diffusion choisie, les conditions du partage peuvent varier :

Le partage est donc modulable, selon le type de données, les documents complémentaires fournis et les conditions d’accès et de réutilisation. On parle alors de données plus ou moins ouvertes, en fonction de la transparence et des restrictions imposées.

Enjeux du partage

Malgré une attitude généralement favorable au partage, sa mise en œuvre soulève des difficultés pratiques et des préoccupations éthiques, particulièrement dans les recherches qualitatives en sciences humaines.

1. Enjeux pratiques

Préparer des données pour leur diffusion demande du temps, des compétences et des ressources. Attendre la fin du projet pour organiser ce partage est souvent inefficace, voire impossible. Il est préférable d’intégrer dès le départ un plan de gestion des données, incluant les modalités de partage, les formats, la documentation et les procédures d’anonymisation.

Pour les projets financés, les organismes reconnaissent ces exigences et permettent d’inclure les coûts dans les budgets. En revanche, pour les recherches non financées, cela peut représenter un obstacle majeur. Certaines institutions offrent un soutien, notamment pour le dépôt final sur les répertoires spécialisés.

2. Enjeux éthiques

Le principal défi éthique concerne le respect du consentement éclairé et de la confidentialité des personnes participantes, surtout en contexte de données sensibles ou identifiantes.

Consentement éclairé

Le formulaire de consentement doit spécifier clairement si les données seront partagées, dans quelles conditions et avec qui. Il est recommandé de prévoir un consentement distinct pour le partage, qui peut être demandé à la fin de la collecte. Cela permet aux personnes participantes de choisir ce qui doit peut être rendu public. De manière générale, celles-ci sont favorables à ce que leur contribution serve à d’autres recherches, pourvu que leur anonymat soit respecté.

Cependant, si le partage n’a pas été prévu initialement, il devient difficile, voire impossible, de rendre les données accessibles a posteriori, même si les responsables de la recherche le souhaitent.

Confidentialité et anonymisation

La confidentialité, garante du respect éthique, devient plus complexe dès lors qu’on envisage un partage des données. Dans ce cas, une anonymisation minimale (remplacement des noms, etc.) ne suffit pas; il faut procéder à une anonymisation approfondie, en masquant aussi les éléments identifiants indirects (lieux, fonctions, événements uniques, etc.).

Il n’existe pas de méthode universelle pour cette tâche. Les responsables de la recherche doivent donc prendre des décisions au cas par cas, en fonction :

Une autre solution consiste à restreindre l’accès aux données (ex. : via des répertoires contrôlés), tout en les anonymisant modérément, en posant comme condition d’accès un engagement formel (signé) en matière de confidentialité. Cela permet de préserver une certaine ouverture, tout en protégeant les personnes concernées. Néanmoins, cela limite la portée des données et peut ne pas satisfaire les exigences des organismes de financement ou des revues scientifiques.

Conclusion

Le partage des données de recherche est une composante essentielle de la science ouverte. Il favorise la transparence, la reproductibilité, la collaboration et l’innovation. Toutefois, sa mise en œuvre requiert une planification rigoureuse, une connaissance des enjeux éthiques et des ressources adéquates.

Dans le cas des données qualitatives sensibles, le partage doit trouver un équilibre entre l’ouverture maximale – souhaitable pour la communauté scientifique – et le respect nécessaire de la confidentialité, condition éthique fondamentale. Cette tension est bien résumée par la formule : « aussi ouvertes que possible, aussi fermées que nécessaire ».

Note

Ce texte est un résumé, produit par ChatGPT et révisé par l'auteur, d'un document plus substantiel, contenant entre autres des références bibliographiques, préparé dans le cadre de l’adoption par la Revue de règles de partage des données de recherche.