La gestion des données de recherche (Research Data Management, RDM) est l'ensemble des pratiques, des stratégies et des méthodes utilisées pour documenter, collecter, organiser, nettoyer, protéger, stocker, préserver et partager les données produites et utilisées lors d’un projet de recherche. Elle fait partie du processus de recherche et s’applique tout au long du projet dans le respect des normes de qualité, de sécurité et de confidentialité, tout en favorisant l'accès et le partage avec d'autres chercheur·euse·s et la communauté scientifique.
Avant même de commencer un projet de recherche, il est important de planifier la gestion des données tout au long du processus de recherche. Cette planification peut être réalisée en trois étapes :
1. Maîtriser les quatre notions ci-dessous liées aux données
- La nature des données qui seront collectées pour répondre aux objectifs du projet: i) non-personnelles (confidentielles ou non); ii) personnelles; iii) personnelles et sensibles, selon la loi sur la protection des données en vigueur (cantonale ou fédérale).
- La classification du projet, définie par la nature des données et le but de leur utilisation: i) soumis à la Loi relative à la recherche sur l’être humain (LRH); ii) soumis à la loi sur la protection des données en vigueur (cantonale ou fédérale) uniquement; iii) hors LRH et hors loi sur la protection des données en vigueur (cantonale ou fédérale).
- Le niveau de protection des données qui sera appliqué pour ce projet: i) Identifiées; ii) Codées / Pseudonymisées / Pseudoanonymisées (identité des personnes conservée via une table de correspondance); iii) Désidentifiées (identité des personnes supprimée ou inexistante); iv) Anonymisées / Anonymes (données ne pouvant plus être liées à un être humain).
- Les entités qui seront impliquées tout au long du cycle de vie des données: autres équipes de recherche internes ou externes, entités de soutien à la recherche, mandants, promoteur, etc.
2. Intégrer ces notions dans les documents de recherche
Les documents de recherche dans lesquels intégrer ces notions dépendent de la classification légale du projet : protocole, information et consentent, règlement de registre, etc. Dans tous les cas, un Data Management Plan (DMP) / Plan de gestion des données (PDG) est recommandé pour détailler les aspects de gestion des données. Il est essentiel de garantir la concordance de ces notions dans tous les documents de recherche avant le lancement du projet.
Pour les données personnelles et/ou sensibles une procédure d’information et de récolte de consentement est obligatoire. La forme de l’information et du consentement (écrite ou orale) et la nature du consentement (implicite ou explicite) dépendent de la nature des données, de la classification du projet et du niveau de protection des données.
3. Concevoir le codebook et le ou les moyen(s) de collecte des données (papier ou électronique)
Pour chaque projet de recherche, une liste exhaustive des variables récoltées et calculées doit être établie au travers d’un codebook.
En cas de collecte électronique, le choix du logiciel (devant intégré un système de suivi des modifications assurant une traçabilité des saisies) doit être fait en fonction de la classification légale du projet.
Pour améliorer l’interopérabilité des données, il est conseillé d’utiliser des nomenclatures standardisés (ontologies ou vocabulaires contrôlés), p. ex. : Manuel de codage médical de l'OSF, SNOMED CT, CIM-11, Concepts I14Y.
Pour la création de questionnaires ou d'enquêtes la plateforme en méthodologie quantitative et mixte du Secteur Sciences Sociales d'Unisanté est à disposition des équipes de recherche.
Documents de référence:
- Guide de bonnes pratiques sur la gestion des données de la Recherche, 2023.
- Guide to Social Science Data Preparation and Archiving, Inter-university Consortium for Political and Social Research (ICPSR), 6e edition
- Kleiner, B. & Heers, M. Quantitative data anonymisation: practical guidance for anonymising sensitive social science data. FORS Guide, 23, Version 1.0, 2024, 1-17.
- Stam, A, Diaz, P. Qualitative data anonymisation: theoretical and practical considerations for anonymising interview transcripts. FORS Guide No. 20, Version 1.0, 2023. Lausanne: Swiss Centre of Expertise in the Social Sciences FORS.
- Stam, A., & Kleiner, B. Data anonymization: legal, ethical, and strategic considerations. FORS Guide No. 11, Version 1.1, 2020 (dernière mise à jour janvier 2022) Lausanne: Swiss Centre of Expertise in the Social Sciences FORS.
Liens utiles:
- DMP en ligne de l’UNIL: DMPonline
- Research data management (following the research data lifecycle – UK Data Archive)
- Data Management Plan (DMP) - Directives pour les chercheuses et chercheurs (Fonds National Suisse, FNS)
- Plateforme SeleQt (Selection of Questionnaires and Tools): banque de questionnaires et d’outils pour la recherche francophone
- Palteform ePROVIDE by Mapi Research Trust : catalogue d’instruments de mesure d’outcoms cliniques (Clinical Outcome Assessments, COAs).
- Manuel de codage médical – manuel officiel des règles de codage en Suisse, Office fédéral de la statistique (OFS), Neuchâtel, 2024.
- SNOMED CT (Systematized Nomenclature of Human and Veterinary Medicine - Clinical Terms): codage de contenus médicaux (ehealthsuisse, centre de compétence et de coordination de la Confédération et des cantons)
- Classification internationale des maladies (CIM-11)
- Concepts I14Y Plateforme d’interopérabilité: Variables utilisées dans les jeux de données et des interfaces de la Confédération
Dernière mise à jour le 20.08.2024