Wanneer je onderzoek is afgerond en je bezig bent met het publiceren van je onderzoeksoutput, komt ook het archiveren van je data om de hoek kijken. Hierdoor zorg je er enerzijds voor dat je onderzoek kan worden geverifieerd en gereproduceerd. Anderzijds archiveer je data voor toekomstig hergebruik, bijvoorbeeld voor verder onderzoek of onderwijsdoeleinden. Daarnaast kunnen de data niet blijven staan in Research Drive, het opslagsysteem dat is gebruikt tijdens het onderzoek. De Haagse Hogeschool adviseert onderzoekers hun data na afloop van het onderzoek te archiveren in het data-archief DANS Easy. DANS is het nationale expertisecentrum voor onderzoeksdata van Nederland.

As open as possible, as closed as necessary

De Haagse Hogeschool is aangesloten bij – en deelt de ambities van – de Vereniging Hogescholen. De Vereniging Hogescholen heeft de Berlin Declaration on Open Access to Knowledge in Science and Humanities ondertekend. Op het gebied van Open Science wordt onder andere gestreefd naar ‘het zorgvuldig bewaren van onderzoeksdata en het ontsluiten van onderzoeksdata volgens het FAIR principe’ (zie verder). De onderzoeksdata zijn dan beschikbaar voor collega’s binnen de eigen hogeschool, voor collega’s van andere hogescholen, voor onderzoekers verbonden aan kennisinstellingen (universiteiten, instellingen voor toegepast onderzoek) en voor partners uit de beroepspraktijk. Daarbij geldt ‘as open as possible, as closed as necessary’.

Ook de Nederlandse gedragscode wetenschappelijk integriteit vraagt van de onderzoeker om zowel de ruwe als bewerkte data zorgvuldig te bewaren gedurende een (voor het vakgebied en de methodologie) gepaste termijn en dat je de data zo veel mogelijk publiek beschikbaar maakt. Subsidieverstrekkers en uitgevers sluiten hierbij aan. Subsidieverstrekkers vragen dat je je inspant om na afronden van het onderzoek de data vrij toegankelijk te maken voor andere zoekers. En wanneer je wil publiceren in een tijdschrift, kan de uitgever verschillende dingen van je vragen. Bijvoorbeeld om je data te publiceren op de website van de uitgever, op te slaan in een data-archief of om je contactgegevens beschikbaar te stellen zodat de data opgevraagd kunnen worden.

FAIR data

Findable/vindbaar

Data zijn findable/vindbaar als:

  • De dataset is voorzien van een persistent identifier
  • De dataset voorziet in datacitatie
  • De dataset tevens is gekoppeld aan de persistent identifier van de auteur(s) (ORCID, ISNI)
  • De dataset voorzien in complete metadata volgens de juiste standaarden
  • De dataset is gelinkt aan de publicatie gebaseerd op de dataset
Accessible/toegankelijk

Data zijn accessible/toegankelijk als:

  • De dataset is opgenomen in en beschikbaar gemaakt via een betrouwbaar data-archief
  • De metadata openbaar toegankelijk zijn, ook al is de dataset dat zelf niet
  • Toegangsvoorwaarden (toegangsprotocollen, contactgegevens, embargo) duidelijk zijn vermeld
Interoperable/uitwisselbaar

Data zijn interoperable/uitwisselbaar als:

  • De (meta)data toegankelijk zijn gemaakt via een API (Application Programming Interface)
  • De (meta)data juiste termen en relevante woordenschat bevatten volgens de standaarden van je vakgebied
  • De (meta)data van de hoogste kwaliteit zijn
  • De data beschikbaar zijn in open gestandaardiseerde dataformaten
Reuasble/herbruikbaar

Data zijn reuasble/herbruikbaar als:

In deze video worden de FAIR principes uitgelegd. De videoclip ‘FAIR datamanagement’ is gemaakt in 2023 door DCC-PO, een netwerk van hogescholen voor de ondersteuning van Research Data Management.

 

Data archiveren

Indien je tijdens het onderzoek al goed datamanagement hebt toegepast, hoeft de transfer van je data naar een archief niet ingewikkeld te zijn. Je maakt de laatste overwegingen over welke data moeten of kunnen worden bewaard en je controleert of je data voldoen aan de eisen van het archief.

Dataformaten

Het bestandsformaat waarin data worden opgeslagen is van groot belang voor de langetermijntoegang van onderzoeksdata. DANS Easy, het voorkeursdata-archief voor onderzoekers van De Haagse Hogeschool, werkt met verschillende voorkeursformaten voor verschillende types onderzoeksdata. Het deponeren van onderzoeksdata in deze voorkeursformaten zal zonder meer door DANS worden geaccepteerd. Neem hun tabel met voorkeursformaten daarom goed door.

Als algemene richtlijn stelt DANS dat de bestandsformaten die het beste geschikt zijn voor duurzaamheid en toegankelijkheid op de lange termijn:

  • veel worden gebruikt;
  • open specificaties hebben;
  • onafhankelijk zijn van specifieke software, ontwikkelaars of leveranciers.
Dataselectie

Welke data zijn geschikt voor archivering?

  • Om hierover te beslissen, neem je eerst de volgende algemene criteria in beschouwing:
    • Onderzoeksresultaten die een hoge maatschappelijke impact hebben moeten altijd verifieerbaar blijven (bv. klinische trials)
    • Neem indien van toepassing de eisen, bepalingen of voorwaarden van je subsidieverstrekker en uitgever in acht
    • Archiveer data die een hoge potentiële hergebruikwaarde hebben
    • Neem de wetenschappelijke, culturele of historische betekenis van data mee in je overweging. Data die bijvoorbeeld waardevol zijn voor wetenschapshistorisch onderzoek komen in aanmerking voor archivering
    • Wanneer de waarde van data voortkomt uit de complexiteit om de data opnieuw te creëren komen ook deze data in aanmerking voor archivering. De waarde van het databehoud is dan groter dan de kosten om de data te creëren
    • Kijk naar de bruikbaarheid van de data: dataformaat, voldoende documentatie en metadata, duidelijkheid over het eigendomsrecht
  • Vervolgens kan je een gedetailleerde keuze maken met behulp van de volgende punten:
    • In het algemeen is de aangewezen praktijk om zo veel mogelijk de ruwe data te archiveren. Maar er bestaand redenen om de bewerkte data te delen, bijvoorbeeld als jouw onderzoek juist is bedoeld om een nieuwe methode te demonstreren. Het archiveren van interviews in audio- of videoformaten wordt ook afgeraden omdat het moeilijk is om zulke data te anonimiseren
    • Bij simulaties is het beter om de data te archiveren die voor de simulatie zijn gebruikt (in plaats van de data die het resultaat vormen van de simulatie)
    • In het geval van experimenten is het altijd verstandig om al de data te archiveren die noodzakelijk zijn om jouw experiment te herhalen
    • Archiveer de formuleringen en informatiesheets van je toestemmingsformulier. Mogelijk moet je ook de ondertekende toestemmingsformulieren archiveren omdat deze belangrijk zijn om te begrijpen hoe de gegevens in de toekomst kunnen worden gebruikt. Je moet er echter wel rekening mee houden dat het hier om persoonlijke gegevens gaat. Deze mogen volgens de Algemene verordening gegevensbescherming (AVG) nooit langer dan nodig bewaard worden. Ook moet je uitermate zorgvuldig zijn met het delen van data die persoonlijke gegevens bevatten
    • Wanneer je ingevulde vragenlijsten archiveert, is het niet nodig om de lege vragenlijsten ook te archiveren. Maar indien je vanwege de gevoeligheid van de data de antwoorden niet wilt delen, archiveer je wel de legen vragenlijsten om deze te kunnen delen
    • Ruwe data van interviews die persoonlijke gegevens en gevoelige informatie bevatten, dienen vernietigd te worden direct nadat ze geanonimiseerd zijn
    • Software en code zijn belangrijk om te archiveren zodat je zelf de simulaties kunt herhalen en zodat andere onderzoekers jouw code kunnen valideren en verder kunnen ontwikkelen
    • Het is meestal niet nodig om tussentijdse data of hulpdate te archiveren. De finale data zijn daarentegen belangrijk wanneer ze de basis vormen van jouw resultaten. Deze data zijn namelijk cruciaal voor de integriteit en de verificatie van je resultaten
    • Archiveer data van een externe partij alleen wanneer de licentie of de voorwaarden waaronder het toelaten om de data te archiveren. Zo niet, dan zorg je ervoor dat je deze data goed documenteert en archiveer je deze documentatie. Indien de externe partij zelf de data heeft gearchiveerd, kun je naar deze data verwijzen
Data verwijderen

Bij de data die je niet archiveert, moet je overgaan tot vervolgmaatregelen. Hier hoort bijvoorbeeld bij dat je de data zorgvuldig verwijdert. Geef daarbij extra aandacht aan gevoelige data. Bij het verwijderen van data moet je voorkomen dat dat alsnog hersteld kunnen worden en je moet ervoor zorgen dat de data verwijderd worden op al je opslaglocaties. De betrouwbaarste manier om data te vernietigen, is het volledig fysiek onbruikbaar maken van de drager. Bij device-onafhankelijke opslag of wanneer je je device wilt behouden, moeten bestanden worden overschreven om ze ontoegankelijk te maken. Dit wordt data erasure, data clearing, data wiping of data destruction genoemd. Dit kun je met behulp van software als CCleaner doen.

Bewaartermijn van data

De bewaartermijn van data hangt af van het vakgebied, de ontwikkelingen daarin, de kosten van opslag en toegankelijk maken, en het verwachte (her)gebruik. Datasets die tot erfgoed worden gerekend, zoals resultaten van archeologisch onderzoek, worden in de regel voor de eeuwigheid bewaard. In sommige gevallen is het wettelijk bepaald hoe lang data moeten worden bewaard. De Algemene verordening gegevensbescherming (AVG) noemt geen concrete bewaartermijn voor persoonsgegevens maar stelt wel dat die gegevens niet langer mogen worden bewaard dan noodzakelijk is. Volgens de Nederlandse gedragscode wetenschapsbeoefening is tien jaar een minimale bewaartermijn voor de ruwe onderzoeksgegevens in Nederland. DANS adviseert daarom deze periode als moment om opnieuw te kijken of onderzoeksdata nog bewaard moeten worden of dat deze vernietigd moeten worden.

Data beschrijven met metadata

Door je data te beschrijven en te voorzien van begeleidende metadata (data over data, kenmerken of eigenschappen van data) garandeer je de vindbaarheid van de data. Er zijn verschillende typen metadata en metadata worden ingedeeld op zowel bestands- als dataniveau. Lees meer over de types en niveaus in deze leidraad [Link naar bestand Leidraad mappenstructuur en datadocumentatie.docx]. Door gebruik te maken van een metadatastandaard wordt tevens uitwisselbaarheid tussen systeem gegarandeerd. Dit maakt dat je data breder toegankelijker worden.

DANS Easy, het voorkeursdata-archief voor onderzoekers van De Haagse Hogeschool, maakt gebruik van de metadatastandaard Dublin Core. Dit is een internationaal heel gangbare en algemene metadatastandaard. Bekijk een overzicht met toelichting van de metadatavelden die DANS Easy aanbiedt. Hoe meer velden je invult, hoe groter de vindbaarheid van de data. De metadata zijn openbaar. De velden dienen daarom alleen persoonsgegevens te bevatten ter verantwoording van de dataset en geen persoonsgegevens van onderzoekssubjecten.

Naast de algemene metadatastandaarden zoals Dublin Core bestaan er ook domeinspecifieke metadatastandaarden. Dit zijn metadatavelden die betrekking hebben op bijvoorbeeld numerieke data (sociale wetenschappen), materiële objecten en hun visualisaties (archeologie), primaire biodiversiteitsdata (biologie) of instrumenten om data vast te leggen (techniek).

Domeinspecifieke data-archieven maken uiteraard gebruik van domeinspecifieke metadatastandaarden, Maar domeinspecifieke metadata kunnen ook als aanvulling dien op een algemene metadatastandaard (die gebruikt worden door een algemeen data-archief). Zo bevat DANS Easy specifieke velden voor bijvoorbeeld data uit de archeologie die verwijzen naar het Archeologisch Basisregister.

Er zijn veel verschillende domeinspecifieke metadatastandaarden, afhankelijk van de onderzoeksgemeenschap, het doel, de functie in het domein. Het Engelse Digital Curation Centre geeft een goed overzicht. Ook de Research Data Alliance opgericht door de Europese Commissie onderhoudt een lijst.

DANS Easy en domeinspecifieke data-archieven.

De Haagse Hogeschool adviseert onderzoekers hun data na afloop van het onderzoek te archiveren in het data-archief DANS Easy. DANS Easy heeft een aantal aandachtspunten rond het deponeren van data in hun archief in een handleiding geplaatst. Neem deze aandachtig door. Voor het deponeren van je data sluit je een overeenkomst af met het archief: 

  • DANS krijgt het recht om de dataset op te nemen in haar archief en deze ter beschikking te stellen onder de aangegeven voorwaarden.
  • De overeenkomst is een ‘niet-exclusieve’ licentie. Dit houdt in dat de eigenaar van de dataset alle vrijheid houdt om deze ook elders te deponeren en/of beschikbaar te stellen.
  • U verklaart dat u rechthebbende bent, of dat u toestemming heeft van eventuele rechthebbenden voor het deponeren en ter beschikking stellen van de dataset. Denk hierbij aan auteurs-, databank- of octrooirecht.
  • U doetgeen afstand van databank- en mogelijke auteursrechten; tenzij de u ervoor kiest om de dataset in het publieke domein te plaatsen.

DANS Easy is een algemeen data-archief maar heeft aanleverspecificaties voor bepaalde disciplines, waaronder sociale- en gedragswetenschappen. Je kan ook kiezen voor een domeinspecifiek data-archief binnen jouw vakgebied, indien beschikbaar. Het voordeel van een diciplinespecifiek data-archief is dat de mogelijkheden nog meer toegespitst zijn op de betreffende onderzoekscommunity. De data kunnen op een rijkere manier worden beschreven door het gebruik van disicplinespecifieke metadatastandaarden. De re3data.org website biedt een overzicht van algemene en disciplinaire data-archieven wereldwijd. Je kunt filteren op onderwerp, vakgebied of land. Je hebt ook de mogelijkheid om te zoeken naar data-archieven met een datakeurmerk. Zo een keurmerk geeft aan dat het archief volgens derden een Trusted Digital Repository is en dat de onderzoeksdata die er zijn gedeponeerd ook in de toekomst gevonden en gedeeld kunnen worden. Een data-archief met een datakeurmerk zoals het CoreTrustSeal stelt langetermijntoegang, veiligheid, vindbaarheid en standaardisering voorop. 

Deze korte video met de titel ‘Archiveren’ illustreert de belangrijkste aspecten waarmee je rekening moet houden bij het archiveren van onderzoekdata. De video ‘Archiveren’ is gemaakt in 2023 door DCC-PO, een netwerk van hogescholen voor de ondersteuning van Research Data Management.

 

Data delen

Het publiekelijk delen van data van afgeronde (delen van) onderzoek ondersteund transparantie en openheid van onderzoek. Je komt tegemoet aan de eventuele eisen van subsidieverstrekkers of uitgevers en je eerbiedigt gedragscodes en declaraties. Je vergroot de impact van je onderzoek binnen en buiten je vakgebied en het komt de zichtbaarheid van jou als onderzoeker ten goede.

In de kern zijn er vier dingen belangrijk bij het delen van data: (1) plaats de herbruikbare data in een data-archief dat gebruikmaakt van (2) een metadatastandaard en (3) een persistent identifier en (4) voorzie de data van een licentie. (1) is nodig voor toegankelijkheid, (2) is nodig voor uitwisselbaarheid, (3) is nodig voor (terug)vindbaarheid en citeerbaarheid en (4) is nodig om daadwerkelijk hergebruik mogelijk te maken (en kan ook ingezet worden voor uitwisselbaarheid).

DANS Easy, het data-archief dat wordt aangeraden door De Haagse Hogeschool biedt alle opties. Metadatastandaard komt hierboven aan bod in het onderdeel Data archiveren. Hieronder gaan we in op licentiëren en citeren. Maar eerst bespreken we de redenen om het delen van data te beperken.  

Alles of niets?

Het delen van onderzoeksdata is geen alles- of niets keuze. Het varieert van het volledig open maken van data aan de ene kant tot ze volledig gesloten houden aan de andere kant, met daartussen verschillende mogelijke vormen van beperkte / gecontroleerde toegang

Open onderzoeksdata zijn data die ‘vrijelijk kunnen worden gebruikt, gewijzigd en gedeeld door iedereen voor elk doel’ (opendefinition.org). Gesloten onderzoeksdata zijn data die tijdelijk onder een embargo staan of helemaal niet gedeeld kunnen worden. Beperkte / gecontroleerde onderzoeksdata zijn data die niet op een volledig open manier worden gedeeld, maar beschikbaar worden gesteld onder beperktere toegangs- en gebruiksvoorwaarden. Dit betekent dat er grenzen zijn aan wie toegang heeft tot en gebruik kan maken van de data, hoe en/of met welk doel. De toegang tot data kan op verschillende manieren beperkt worden:

  • Allereerst kan er geworden met een login of authenticatie die gerelateerd is aan een bepaalde instelling/organisatie of met een lidmaatschap.
  • Je kunt ook kiezen om te werken met een overeenkomst tussen jou als de aanbieder van de data en diegene die je data willen hergebruiken, een Data Use Agreement. Jullie spreken af onder welke voorwaarden en op welke manieren jouw data hergebruikt mogen worden.
  • Een data-archief als DANS Easy biedt ook de mogelijkheid om je data (tijdelijk) van embargo te voorzien: gedurende de embargo-periode wordt vaak wel de beschrijving van de dataset gepubliceerd,maar zijn de data zelf niet beschikbaar voor hergebruik door anderen. Als je in DANS Easy een embargo op de data wilt instellen (maximaal twee jaar) kan dat in het veld ‘Date available’.

Bij DANS Easy kun je kiezen voor de toegangscategorie ‘Restricted Access’. Anderen kunnen dan via het data-archief toestemming aan jou vragen om je data in te zien en te downloaden. Ze moeten hun aanvraag motiveren. Voordat je toegang verleent kun je de ander aanvullende voorwaarden opleggen.

Of je kiest voor open, gesloten of beperkt/gecontroleerd, hangt grotendeels of van wat passend is gezien de aard van de data en van eigendomsrecht (of je beschikt over de juiste machtigingen / toestemming). Redenen om het delen van data te beperken:

  • De data vormen of bevatten persoonsgegevens, d.w.z. alle informatie over een (direct of indirect) geïdentificeerde of identificeerbare levende natuurlijk persoon. Indien mogelijk anonimiseer je deze data.
  • Je hebt anderszins de plicht of bent overeengekomen om de data vertrouwelijk te houden (bijvoorbeeld door een geheimhoudingsverklaring te ondertekenen of een overeenkomst met een vertrouwelijkheidsclausule).
  • De data kunnen mogelijk schade toebrengen (bijvoorbeeld aan bedreigde diersoorten, kwetsbare locaties of groepen, volksgezondheid, nationale veiligheid, …) als ze openbaar worden gemaakt.
  • De data worden niet gegenereerd in de loop van je eigen onderzoeksproject, maar worden aangeleverd door een andere partij (bijvoorbeeld een commerciële aanbieder, overheidsinstantie, …).
  • Onderzoeksdata- of liever de vorm waarin ze tot uitdrukking komen – kunnen onder bepaalde omstandigheden worden beschermd door auteursrecht en/of databankenrecht.
  • De onderzoekdata kunnen een octrooieerbare uitvinding zijn, of commercieel waardevolle knowhow bevatten. Als ze (voortijdig) worden gedeeld, kan dit jouw valorisatie-inspanningen in gevaar brengen.

Is er sprake van een legitieme reden zoals we hier beschreven hebben? Dan zullen subsidieverstrekkers, instellingen en gerenommeerde tijdschriften/uitgevers afwijken van de voorwaarden die zij hanteren met betrekking tot het delen van data. Er wordt wel van je verwacht dat je als onderzoekers de juiste rechtvaardiging opgeeft, bijvoorbeeld in het datamanagementplan of in een datatoegankelijkheidverklaring die je opneemt in je publicatie. Een datatoegankelijkheidsverklaring wordt meestal opgenomen in het onderdeel ‘Acknowledgment’ van je artikel. Zo’n verklaring geeft aan waar en hoe de data waarop het artikel is gebaseerd kunnen worden geraadpleegd. En als de data niet beschikbaar kunnen worden gemaakt, waarom dat het geval is.

Data licentiëren

Bij het openbaar maken van onderzoeksdata is het van belang om potentiële gebruikers vooraf te laten weten wat ze met die data mogen doen. Licenties zijn een effectieve manier om dit te doen. Een goed data-archief zal normaal gesproken een licentie toepassen op elke dataset die erin wordt opgenomen. Doorgaans kun je een keuze maken bij het deponeren van data. DANS Easy bied een hele lijst aan. Bij elke licentie wordt gelinkt naar de website met meer informatie over die specifieke licentie.

Een goede praktijk is het toepassen van een standaard en open licentie voor open onderzoeksdata, aangezien dit zorgt voor juridische uitwisselbaarheid en een zo breed mogelijk hergebruik. Een van de standaardlicenties die veel worden gebruikt voor onderzoeksdata, is de reeks Creative Commons (CC) -licenties.

  • De CC-licentie Naamsvermelding (CC BY) geeft anderen maximale vrijheid om de data te hergebruiken (d.w.z. kopiëren, herdistribueren, aanpassen), op voorwaarde dat ze de juiste erkenning geven.
  • DE CC-licentie Naamsvermelding-GelijkDelen (CC BY-SA) geef dezelfde vrijheid aan anderen als CC BY, maar vereist herdistributie van afgeleide werken (die op jouw data zijn gebaseerd) onder dezelfde licentie.
  • De CC-licentie Naamsvermelding-NietCommercieel zou je in kunnen zetten bij het aanvragen van een octrooi of het bij een andere manier commercialiseren van je onderzoek. Maar in de setting van onderzoek bij De Haagse Hogeschool waarin het onderzoek wordt gedaan met publieke middelen, is het zelf commercieel inzetten van je data niet gebruikelijk. Er is amper sprake van een open licentie.
  • De CC-licentie Naamsvermelding-GeenAfgeleideWerken geeft anderen de mogelijkheid om de data te gebruiken en de delen zoals ze zijn maar op geen enkele manier te wijzigen of te transformeren. Dit komt bij data echter op hetzelfde neer als ‘Alle rechten voorbehouden’ en anderen kunnen niet veel meer doen dan resultaten verifiëren die al uit de data zijn afgeleid. Er is amper sprake van een open licentie.

De CC-licenties zijn algemene licenties. Heel goed toepasbaar bij data, maar ook bij onder andere publicaties. Er bestaan licenties die specifiek van toepassing zijn op data. Dit zijn zogenaamde Open Data Commons, onder te verdelen in drie licenties:

En in het geval dat jouw dataset software bevat, kan je de Open Source Licenses gebruiken

Hulp nodig bij het selecteren van een geschikte standaardlicentie? Bekijk deze EUDAT-licentieselectietool

Bekendheid geven aan je data

Er bestaan verschillende mogelijkheden om de bekendheid en toegankelijkheid van je data te vergroten. Wanneer je onderzoeksoutput creëert, kun je je data toevoegen als aanvullend materiaal. Dit werkt bij posters, papers of andere publicaties. Een verrijkte publicatie is een online publicatie waarin een artikel vergezeld gaat met bijvoorbeeld (links naar) onderzoeksdata, illustraties, visualisaties, internetbronnen en commentaren.

Heb je een bijzondere dataset gecreëerd of verzameld? Of is de gebruikte methodologie innovatief en het waard om uitgebreider besproken te worden dan alleen in een korte paragraaf in een artikel? Dan kun je overwegen om een artikel te publiceren in een datatijdschrift. Dit is waardevol om de volgende redenen:

  • Samen met je artikel wordt je dataset peer-reviewed en zo krijgt het een wetenschappelijke accreditatie voor hergebruik.
  • Met het artikel over je dataset maak je je methodologie en resultaten nog transparanter.
  • De publicatie in een datatijdschrift is een andere toegankelijke route die leidt tot je dataset. Daarmee wordt de bekendheid van de publicatie vergroot.

Voorbeelden van datatijdschriften:

Datacitatie

De publicatie (het publiekelijk delen) van datasets telt steeds meer mee als citeerbare bijdrage aan het onderzoekscurriculum. Het citeren van onderzoeksdata maakt onderdeel uit van de Altmetrics-beweging (alternative metrics) die stelt dat de impact van je onderzoek bepaald wordt door (de verwijzingen naar) een breed scala aan onderzoeksoutput zoals datasets, software, blogposts, presentaties, etc.

Datacitatie:

  • maakt data makkelijker vindbaar;
  • bevordert reproduceerbaarheid;
  • bevordert hergebruik van data;
  • maakt het mogelijk de impact van de onderzoeksdata te volgen;
  • creëert een publicatiestructuur die langetermijnbeschikbaarheid van data mogelijk maakt;
  • biedt een structuur waarbinnen de impact van de data terug te voeren is naar de onderzoekers die de data creëerden.

Om citeerbaar te zijn, heeft een dataset een persistent identifier (PID) nodig. Bij het publiceren van data in een data-archief zoals DANS Easy wordt er automatisch een PID aan de dataset toegekend. Door de PID kunnen je data altijd gevonden worden, ook bij veranderen van naam en plaats. Gebroken links of ‘page not found’ meldingen worden voorkomen door het gebruik van een PID bij datacitatie. Digital Object Identifiers (DOI’s) worden algemeen geaccepteerd als de persistent identifier voor datacitatie. Ook DANS Easy maakt gebruik van DOI’s.

Een voorbeeld van een standaard-datacitatie naar een dataset in DANS Easy:

Hageraats, C. (Sweco)(1) (20190603)(2): Overzijde Karel van Gelreweg 22 te Eeerbeek Bureauonderzoek en inventarisered veldonderzoek door middel van verkennende boringen.(3) DANS.(4) https://doi.org

  1. Auteur: diegene die de dataset heeft gecreëerd, individuele personen en/of organisatie.
  2. Datum: het jaar waarin of de exacte datum waarop de dataset is gepubliceerd.
  3. Titel: de naam die is gegeven aan de dataset of de naam van het onderzoeksproject.
  4. Uitgever: het archief verantwoordelijk voor het beschikbaar stellen van de dataset.
  5. Online locatie: DOI of een andere persistent identifier.

Andere mogelijke elementen bij datacitatie zijn:

  • Redactie: persoon of personen (anders dan de auteur) verantwoordelijk voor het samenstellen, bewerken en redigeren van de dataset.
  • Het formaat van de databestanden.
  • Versie, indien er meerdere versies van de dataset zijn gedeponeerd.

Deze korte video met de titel ‘Publiceren’ illustreert de belangrijkste aspecten waarmee je rekening moet houden bij het publiceren van onderzoekdata. De video ‘Publiceren’ is gemaakt in 2022 door DCC-PO, een netwerk van hogescholen voor de ondersteuning van Research Data Management.

 

Consortium

Bij een samenwerking met andere instellingen of organisaties zal in gezamenlijkheid moeten gekeken worden bij welke instellingen welke data waar worden gearchiveerd en of en hoe het delen van de data wordt gefaciliteerd. Deze afspraken moeten worden opgenomen in het (gezamenlijke) datamanagementplan maar daarnaast ook schriftelijk worden vastgelegd in een consortiumovereenkomst. Ga periodiek na of alle partijen de procedures blijven naleven die zijn afgesproken.

Ondersteuning door een data steward

Onderzoekers kunnen ondersteuning krijgen bij research data management. De research data steward(s) van de HHs zijn te benaderen via researchsupport@hhs.nl.