Gå til hovedindhold

Hvornår skal man slette forskningsdata?

Dette emne var på dagsordenen, da data management specialister i løbet af maj måned var samlet ved en række online webinarer i form af Research Data Alliance´22. plenarmøde.
Af
09/07/2024 10:07
Billede
Klodser FAIR
Foto: iStock

Stigende datamængder indenfor forskning afstedkommer et øget behov for at vurdere, hvornår det er korrekt (og påbudt) at slette forskningsdata. Dette emne og flere andre var på dagsordenen, da forskere, bibliotekarer, data stewards og andre som arbejder med forsknings-data management kom med deres input til emnet under Research Data Alliance´22. plenarmøde. Birds of Feather (BOF) sessionen “When to dispose research data” fokuserede netop på sletning af data.

Øget behov for at se på sletning af forskningsdata

Mængden af forskningsdata stiger eksponentielt. Med implementering af FAIR-principperne steg mængden af data bevaret i forskellige repositorier således, og mens der ofte findes politikker på området, er der fortsat uklarheder omkring procedurer og implementering af politikkerne, særligt i forhold til, hvornår data skal slettes. Der er også meget ikke-publiceret forskningsdata, som sjældent slettes. I webinaret bidrog både forskere, bibliotekarer, data stewards og andre, som arbejder med forskningsdatamanagement, med deres input til emnet: hvornår skal man slette data?

Flere påpegede, at der er store differencer i praktiske løsninger på sletning af data. I et tilfælde ringede en data steward rundt til flere af landets store forskningsinstitutioner for at høre om, hvordan det rent praktisk foregik med sletning af forskningsdata. På trods af, at alle disse institutioner havde politikker på området, var der ingen, som kunne forklare, hvordan politikken blev eksekveret. Der var ingen, der vidste hvilke data, som blev slettet eller hvornår.

Anbefalinger til forskningsinstitutioner

De mange, gode input fra sessionen udmøntede sig i følgende anbefalinger til forskningsinstitutioner:

  • Der bør findes en politik for bevaring og sletning af data, inklusive overvejelser om data klassifikationer for varighed (f.eks. ubestemt tid, minimum opbevaringsperiode, ingen opbevaringsperiode m.m.)
  • Der bør findes en klar beskrivelse af roller og ansvar relateret til arbejdsprocesser
  • Der bør findes automatiserede handlinger for at sikre effektiv metadata-berigelse, opbevarings- og bortskaffelseshandlinger
  • Der bør være forskerinddragelse relateret til beslutninger om dataopbevaring og bortskaffelse
  • Der bør skabes fællesskab om praksis (strategier for sektorens tilpasning og bedste praksis)

Før forskeren kan værdisætte data bliver intet slettet

Jitka Stilund Hansen, senior research data management officer fra DTU, som har deltaget aktivt i forberedelserne og arbejdet op til BOF-sessionen, siger selv om emnet: 

”Hvornår man skal slette data, er et interessant og komplekst spørgsmål. Som RDM-supportperson har jeg haft stort fokus på at gøre data nyttige ved at gøre dem FAIR. Men det er kun en brøkdel af data som publiceres. Spørg forskeren, hvorvidt data, der ikke er publiceret, skal slettes - og hun siger ”nej”. Spørg om hun kan genbruge data fra 3 år tilbage, så bliver svaret sjældent entydigt ”ja”. Vi kan have politikker om sletning og stille alle de rigtige spørgsmål om bevaring og tilgængelighed af data i Data Management Planerne, men før vi har organisation, infrastrukturer, omkostningsmodeller og metadata, der hjælper forskeren til at værdisætte data, så bliver intet slettet.”

Research Data Alliances (RDA) 22. plenarmøde fandt sted fra den 15-23. maj i form af en række online webinarer.

Research Data Alliance (RDA)

Research Data Alliance (RDA), grundlagt i 2013, er en global organisation, der fokuserer på at bygge den sociale og tekniske infrastruktur, som muliggør åben deling og genbrug af data. RDA opererer igennem en række arbejdsgrupper (WGs) og interessentgrupper (IGs), der tager fat på specifikke datarelaterede emner. Grupperne udvikler anbefalinger, bedste praksis og standarder for at løse data management-relaterede udfordringer. RDA-fællesskabet består af individuelle fagfolk, akademiske institutioner, offentlige myndigheder og private organisationer.

Læs mere om Resarch Data Alliance (RDA) her: https://www.rd-alliance.org