Data vil afløse den videnskabelige artikel

Fremtidens forskning bygger på data snarere end artikler om data. Det var et af budskaberne fra professor Barend Mons på et møde for danske forskere om European Open Science Cloud.
Mogens Sandfær, DTU

Mogens Sandfær, der er chef for bibliometri og datamanagement på DTU, bød velkommen til arrangementet. Han fremhævede rapporten "Realising the European Open Science Cloud" fra højniveauekspertgruppen for European Open Science Cloud, som Barend Mons var formand for.

Barend Mons

"Ph.d.-studerende bruger i dag halvdelen af deres tid på at søge efter data, konvertere dataformater, importere og på anden måde behandle dem. Hvis de kunne få let adgang til data i et format, der var lige til at bruge, kunne de bruge den tid på forskning," siger Barend Mons.

Barend Mons er formand for den højniveau-ekspertgruppe, som EU-kommissæren for forskning har bedt komme med et udspil til, hvordan tankerne bag European Open Science Cloud kan blive til virkelighed. Han påtog sig opgaven, selvom han er uenig i alle de fire ord, der indgår i navnet.

Det fortalte han på et møde hos NORDUnet i november. DeIC havde inviteret ham til at orientere medlemmerne af Nationalt Forum for Forskningsdata Management og eScience komiteen om planerne.

"European Open Science Cloud er hverken European, open, science eller cloud," siger Barend Mons. Han uddybede det på denne måde:

Den er ikke europæisk, for der er tale om et globalt projekt.

Den skal ikke være åben, for nogle forskningsdata er nødt til at være fortrolige – for eksempel af hensyn til persondatalovgivningen. I stedet taler han hellere om, at adgang til data skal være FAIR – forkortelse for Findable, Accessible, Interoperable, Reusable.

Science – ja, European Open Science Cloud handler om forskning, men også om innovation og produktudvikling, ikke kun grundforskning. Desuden lægger ordet science vægt på de naturvidenskabelige fag, hvor data i fremtiden også vil komme fra humaniora og samfundsfag.

Cloud kan have mange betydninger, alt efter hvem der bruger udtrykket. Men European Open Science Cloud er ikke en nyetableret cloud-tjeneste, hvor al europæisk forskning skal samles.

I stedet handler det om at udnytte eksisterende teknologier – herunder cloud-tjenester.

Udfordringerne ligger i kulturen

"80-90 procent af udfordringerne på området er kulturelle og sociale. Vi ved godt, hvordan vi skal gøre det her teknisk. European Open Science Cloud handler ikke om en ny, disruptive teknologi – vi kan bruge eksisterende teknologi for 90 procents vedkommende," siger han.

Som eksempel på udfordringerne i kulturen og strukturerne peger han på det fokus, forskningsverdenen har på den videnskabelige artikel.

"Vi måler forskere på, hvor mange artikler de udgiver. Men artikler er skrevet for mennesker. PDF-filer er besværlige for computere at hente information ud af. Enhver artikel bygger på data. Derfor bør vi i stedet belønne produktionen og delingen af gode data. I dag udgiver nogle forskere artikler med et appendiks med data. I fremtiden bliver data den primære udgivelse, hvortil man så kan udgive en supplerende artikel," mener Barend Mons.

Derfor er der efter hans mening behov for en ny metode til at meritere forskere efter.

Nye kompetencer

Med overgangen til fokus på data opstår der behov for nye kompetencer i forskningskredse. Barend Mons taler om data stewards. Det er personer, der kombinerer en viden om datamanagement med en indsigt i det forskningsdomæne, projektet handler om. En data steward hjælper forskerne med at vælge den rette lagringsløsning og metadata.

"Ph.d.-studerende bruger i dag halvdelen af deres tid på at søge efter data, konvertere dataformater, importere og på anden måde behandle dem. Hvis de kunne få let adgang til data i et format, der var lige til at bruge, kunne de bruge den tid på forskning," siger han.

FAIR principper for data

Han vendte flere gange tilbage til FAIR-principperne. De siger, at forskningsdata skal opfylde disse krav:

  • Findable: Det skal være muligt at finde data. Det kræver gode metadata, der beskriver dataene. Det er vigtigt, at maskiner skal kunne finde data, da datamængderne er for store til, at mennesker kan håndtere dem.
  • Accessible: Data skal kunne tilgås, idet de er lagret med henblik på langtidsbevaring. Der skal være veldefinerede licensregler, og det skal være let at hente data.
  • Interoperable: Data skal være forberedt for at blive kombineret med andre datasæt.
  • Reusable: Data skal kunne bruges i fremtidige forskningsprojekter og viderebehandles.

I dag er under 20 procent af forskningsdata lagret på en måde, hvor de bliver bevaret og er til at finde.

Både EU og G20-organisationen har støttet op om FAIR-principperne.

Danmark kan være med

Endnu er European Open Science Cloud ikke særlig konkret. Men det betyder også, at man kan være med til at påvirke udviklingen.

Barend Mons opfordrede på mødet de danske forskningsmiljøer til at engagere sig i arbejdet. Danmark kunne for eksempel tilbyde at løse en konkret opgave på vejen mod at få forskningsdata, der følger FAIR-principperne.