Datamanagementplan

Waarom

Bij effectief datamanagement moet je rekening houden met:

  • De aard van de data die je verzamelt
  • Hoe je de data veilig opslaat
  • Hoe je versie beheer gaat aanpakken
  • Wie toegang heeft tot de data en welke data anderen wel/niet mogen aanpassen
  • Hoe je de data kunt documenteren zodat anderen deze kunnen begrijpen en hergebruiken

Datamanagementplanning houdt in dat je nadenkt over het verhaal van je onderzoeksdata, van het creëren ervan tot en met 'ze leefden nog lang en gelukkig'. Bij het opstellen van het onderzoeksontwerp denk je na over de data die je wilt gaan verzamelen, hoe je ze gaat opslaan, en hoe je ze gaat delen met je huidige en toekomstige collega's.  Bekijk hier een inleidende video over het wat, waarom en hoe van datamanagementplanning (in het Engels).

Een manier om systematisch na te denken over het dataverzamelingsproces is het invullen van een datamanagementplan (DMP).  Je legt het verhaal van je onderzoeksdata vast. Zo een plan met bijbehorende activiteiten bevordert de integriteit en verhoogt de impact van je onderzoek(*) en je komt tegemoet aan de eisen van wetgeving en gedragscodes, financiers en uitgevers.

Zo vraagt de Nederlandse gedragscode wetenschappelijke integriteit van jou als onderzoeker dat je transparant bent in welke data je gebruikt en dat je je data zo ordent en beschrijft dat ze controleerbaar zijn en kunnen worden hergebruikt. Verantwoord datamanagement wordt ook steeds vaker als eis opgenomen bij subsidieaanvragen. Subsidieverstrekkers vragen aan jou als onderzoeker om je data zorgvuldig te bewaren en te beheren.

Onderzoek wijst uit dat publicaties waarbij de achterliggende data in welke vorm dan ook (via appendices, URL’s of contactinformatie) beschikbaar zijn gesteld, gemiddeld meer geciteerd worden dan publicaties waarbij de achterliggende data niet beschikbaar zijn gesteld.

Wat

Globaal bestaat een datamanagementplan uit de volgende onderdelen:

  1. Projectgegevens: generieke informatie over je onderzoek zoals het doel en de gegevens van de onderzoekers(s), samenwerkingspartners en subsidieverstrekkers.
  2. Data verzamelen: datakarakteristieken als datatypes, dataformaten en de verwachte grootte van de data en de methoden en technieken die je gaat toepassen bij het verzamelen en organiseren van je data zoals mappenstructuur, naamgeving, standaarden en normen, en versiebeheer.
  3. Documentatie en metadata: welke data over je data en begeleidende documentatie zijn nodig om anderen te helpen om je data te begrijpen en te (her)gebruiken, denk daarbij aan gebruik van een metadatastandaard en een README.txt-bestand.
  4. Ethische en juridische aspecten: je aanpak bij kwesties die om extra zorgvuldigheid vragen waaronder databescherming, privacy, auteursrechten en intellectuele eigendomsrechten.
  5. Opslag en back-up: geef antwoord op vragen rondom het opslaan, delen met andere onderzoekers en back-uppen van je data tijdens het onderzoeksproces, denk daarbij aan de opslagruimte voor zowel het bewaren als het back-uppen van de data, de frequentie van het back-uppen en een (herstel)plan bij dataverlies of een datalek.
  6. Selectie databehoud: beschrijf en verantwoord je beslissing over of je wel of niet je data (of een deel daarvan) zal bewaren voor de lange termijn en of er legale redenen zijn om (een deel van) de data direct na afronden van je onderzoek te vernietigen.
  7. Data delen: beschrijf je beoogde doelpubliek voor de data die je gaat behouden en op welke wijze je de data vindbaar maakt voor je doelpubliek, de datarepository die je daarvoor gaat inzetten, de condities waaronder je doelpubliek de data mag raadplegen en wanneer de data beschikbaar zullen zijn. Neem daarbij minimale eisen in acht die wellicht ook zijn opgelegd door je subsidieverstrekker: gebruik van persistent identifier, openbare beschikbaarheid van informatie, toegangsprotocollen, data-licenties en waarborgen voor duurzame beschikbaarheid.
  8. Verantwoordelijkheden en middelen: geef aan wie verantwoordelijk is voor het datamanagementplan en de activiteiten die je in de vorige onderdelen hebt beschreven en welke financiële en andere middelen zoals specialistische kennis en hardware of software je nodig hebt om deze activiteiten te realiseren.

Een datamanagementplan is een levend document. In het begin van het onderzoeksproces zal je nog niet alles gedetailleerd kunnen invullen. Ook kan gedurende je onderzoek het nodig zijn om zaken anders aan te pakken dan je aanvankelijk van plan was. Maak een nieuwe versie van je datamanagementplan telkens wanneer er belangrijke wijzingen plaatsvinden in je onderzoek die betrekking hebben op je data management. Aan te raden is om in ieder geval één keer per jaar je datamanagementplan up te daten.

Let wel op: oude versies van je datamanagementplan moeten bewaard blijven en je moet duidelijk documenteren vanaf wanneer welk plan geldt.

Hoe

Voor het opstellen van een datamanagementplan zijn verschillende templates beschikbaar. Wellicht hanteert de subsiedieverstrekker van je onderzoek een eigen template.

De template van de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO) kun je onder aan deze pagina downloaden.

Indien je subsidieverstrekker geen eigen template voorschrijft of indien een subsidieverstrekker niet van toepassing is, kun je gebruik maken van de onderstaande algemene templates en tools:

  • DMPonline: online tool voor het schrijven, bewerken, delen en bewaren van een datamanagementplan waarvan het gebruik ook door een aantal financiers wordt voorgeschreven of aangeraden (kies bij het aanmaken van een account voor je subsidieverstrekker als organisatie, indien je voor je onderzoek geen gebruikmaakt van een subsidieverstrekker kies dan voor ‘DMPonline – Tutorials’ als organisatie). 
  • ERC Data Management Plan Template: template van de Europese Onderzoeksraad.
  • 4TU.ResearchData template: template van 4TU.ResearchData, een gezamenlijk databeheerinitiatief van de Nederlandse technische universiteiten.

Kosten

Goed datamanagement brengt kosten met zich mee, in uren en in geld. In dit overzicht zijn de mogelijke kosten per activiteit van het onderzoeksproces zichtbaar gemaakt. Het overzicht is gebaseerd op de UK Data Service Data management costing tool and checklist.

Naast dit overzicht kun je ook gebruikmaken van de interactieve tool ontworpen door de TU Delft om de kosten van datamanagement in te schatten.

FAIR data

Uiteindelijk gaat het bij de inspanningen die je verricht op het gebied van datamanagement om het verifieerbaar maken van je onderzoeksresultaten en om de onderliggende data herbruikbaar te maken. Hiervoor moeten de data FAIR zijn: Findable, Accessible, Interoperable, Reusable. Met andere woorden je data moeten vindbaar, toegankelijk, uitwisselbaar, herbruikbaar en duurzaam opgeslagen zijn.

Meer informatie

Datamanagementparagraaf

Bij het indienen van een subsidieaanvraag kan de subsidieverstrekker verzoeken om in de aanvraag al een aantal zaken rond datamanagement te benoemen. Dit wordt de datamanagementparagraaf genoemd. We hebben de vragen die in een datamanagementparagraaf aan bod kunnen komen op een rijtje gezet met een advies hoe deze te beantwoorden.

Hulp

Als onderzoeker ben je zelf verantwoordelijk voor goed datamanagement. Maar kom je er even niet uit? Of heeft je datamanagementparagraaf of -plan een check nodig? Dan staat er binnen De Haagse Hogeschool een data steward met een team voor je klaar bestaande uit medewerkers van verschillende afdelingen, ieder met zijn/haar eigen specialisme: Team Onderzoek, Subsidiedesk, IT, Functionaris Gegevensbescherming en Bibliotheek. Stel je vraag via research@hhs.nl.

 

Research Drive: veilig opslaan van je onderzoeksdata