Pilotprojekt gør det teknisk muligt at kombinere registerdata med genomdata på Computerome

Et pilotprojekt forsøger at lade forskere kombinere registerforskning med genomforskning samtidig med, at den adgangsgivende myndighed har fuld kontrol over data.
Jeppe Klok Due
"Dansk registerforskning har en førerposition på verdensplan. For at sikre den skal forskerne have bedre muligheder for at kombinere data fra flere dataansvarlige. Pilotprojektet på Computerome er første skridt på vejen," sagde projektleder Jeppe Klok Due fra KOR på DeiC konference 2017.

Hvad betyder sociale forhold for risikoen for, at en person udvikler skizofreni? Hvilket uddannelsesniveau havde vedkommendes forældre? Hvor tit var vedkommende indlagt på sygehus?

Den type spørgsmål kan registerforskning give svar på. Danmark har en lang tradition for at forske i data fra de registre, der følger danskerne fra vugge til grav.

Men hidtil har det været vanskeligt at kombinere data fra socioøkonomiske registre med personers biologiske data, fx genomdata.

Et pilotprojekt skal gøre det lettere at bygge bro mellem de to typer forskning ved at gøre det teknisk muligt for forskere at kombinere data på Computerome, samtidig med at ejeren af data har fuld kontrol over, hvem der bruger deres data til hvad.

"Det er et stort problem, at forskerne kun må arbejde med registerdata fra Danmarks Statistik på servere lokaliseret i Danmarks Statistik. Forskerne kan af sikkerhedshensyn ikke få data udleveret, så de kan behandle dem på deres egne computere. Den model giver problemer, fordi genomdata er meget omfattende. Derfor kræver det en supercomputer at behandle dem," fortalte projektleder Jeppe Klok Due fra Det Koordinerende Organ for Registerforskning (KOR) på DeiC konference 2017.

Folkene bag pilotprojektet, som er etableret af blandt andre KOR, Computerome Center og DeiC, håber, at de tekniske løsninger, der arbejdes med, vil gøre det muligt for forskerne at kombinere de to datatyper i nær fremtid.

Preben Bo Mortensen
"Flaskehalsene i vores forskning er sikkerhedskrav, fleksibel adgang til data og tilstrækkelig beregningskraft. Dette projekt kan blive det største fremskridt for dansk registerforskning i 15 år," sagde professor Preben Bo Mortensen fra iPsych-projektet.

Lukket område på Computerome

I pilotprojektet får data-ejeren stillet en virtuel maskine på Computerome til rådighed. Data-ejeren får fuld kontrol over maskinen og data på den – fuldstændig som hvis det var en computer, der stod inde hos dem selv.

DeiC leverer det lukkede område på Computerome, som dataene placeres på.

Endvidere er der etableret en dedikeret forbindelse via forskningsnettet fra data-ejeren til Computerome. På den måde kan data transmitteres sikkert, så uvedkommende ikke kan opsnappe dem.

Data-ejeren kan åbne for adgang til dele af de data, der ligger på maskinen. Herefter kan forskerne få adgang til dem, så de kan behandle dem sammen med øvrige data på Computerome.

Forskningsprojektet iPsych leverer en use case til pilotprojektet. IPsych er et stort forskningsprojekt, der undersøger årsager til udbredte psykiske sygdomme.

"IPsych er et unikt projekt på verdensplan, fordi vi anvender data, der er repræsentative for en hel befolkning. Projektet bygger på to grundelementer: Det samlede kompleks af de danske registre, hvor alt er registreret på cpr-nummer, og data fra biobanker," fortalte professor Preben Bo Mortensen fra Aarhus Universitet.

Læs mere