Data-behoud en -archivering

In het datamanagementplan leg je vast welke data je waar gaat archiveren na je onderzoek.

Deze beslissing kan worden beïnvloed door:

  • Het vakgebied waarin je onderzoek zich typeert
  • Het type data dat is gecreëerd binnen je onderzoek
  • Het gevoeligheidsniveau van de data
  • Of verder werk of publicaties zullen worden gebaseerd op de data

Financiers en uitgevers waarmee je in zee gaat kunnen dus eisen stellen aan data-behoud en -archivering, check hun databeleid.

Waar?

Je kunt je data archiveren in een door je financier opgericht datacenter, een disciplinaire data-repository of een institutionele data-repository.

De re3data.org website biedt een overzicht van algemene en disciplinaire data-repositories wereldwijd. Je kunt filteren op onderwerp, vakgebied of land. Gebruik de DCC-checklist voor het evalueren van data-repositories. Deze data-repositories faciliteren ook hergebruik van je data door het aanbieden van data-licenties (meer informatie op de pagina Data-uitwisseling en –hergebruik, persistent identifier systems en metadatastandaarden (meer informatie op de pagina Data over data).

Voorlopig kun je op de HHs ook voor de langdurige opslag terugvallen op het opslagmedium wat je ook gebruikt voor de opslag van je data tijdens je onderzoek (HHs-Netwerk Sharepoint). De Haagse Hogeschool doet momenteel een verkenning naar of een of meerdere geschikte eigen of externe systemen om aan te schaffen, in te richten, of onderzoekers naar door te verwezen voor de opslag van onderzoeksdata na afronding van het onderzoek. Zodra daar adviezen of besluiten uit voortkomen, maken we daar op deze pagina melding van.

Welke data?

Het is niet altijd nodig om al je data te archiveren. Wanneer niet?

  • Als er sprake is van een zeer grote dataset, kan het archiveren erg duur zijn. In sommige gevallen kunnen de kosten voor replicatie (indien mogelijk) lager zijn dan de kosten van archivering
  • Wanneer de modellen of de algoritmen waarmee de dataset is geproduceerd uiteindelijk belangrijker zijn dan de dataset zelf

Vragen die je jezelf kan stellen om te bepalen welke data je moet archiveren:

  • Zijn de data uniek? Bij het doen van consumentenonderzoek of het uitvoeren van expertinterviews is het bijvoorbeeld vaak onmogelijk om waarnemingsgegevens te repliceren. Als de studie wordt herhaalt, kunnen nooit dezelfde resultaten worden verkregen
  • Is het gemakkelijk om de data te repliceren? Wanneer dataverzameling veel lab-tijd of dure apparatuur vereist, zijn de kosten van replicatie onevenredig hoog, dan is dit een goede reden om de data te archiveren
  • Is er een formele verplichting om data voor de langere termijn te archiveren? De financier of uitgever heeft dergelijke vereisten gesteld

Data processing

Voordat je je data gaat archiveren, kun je je data opschonen en zorgen dat ze duurzaam worden. Denk daarbij aan volgende activiteiten:

  • Conversie van je data naar een duurzaam dataformat, kies voor een open format dat niet gebonden is aan een bepaalde softwareleverancier (proprietary software)
  • Reorganiseer je mappen en bestanden
  • Voeg metadata en een persistent identifier toe
  • Pak je dataset in en comprimeer de dataset zodat deze minder opslagruimte in beslag neemt

Consortium

Bij een samenwerking met andere instellingen of organisaties zal in gezamenlijkheid moeten gekeken worden welke data waar worden gearchiveerd. Deze afspraken moeten worden opgenomen in het (gezamenlijke) datamanagementplan maar daarnaast ook schriftelijk worden vastgelegd in een consortiumovereenkomst.