Gå til hovedindhold

Forskerne skal stille krav til digital forskningsinfrastruktur

Digital humaniora er en digital computer anvendt til humanistisk analyse - og det kræver en infrastruktur.
Af
22/04/2015 15:04

De humanistiske forskere skal melde ind med ønsker og krav til den infrastruktur, der gør det muligt at forske digitalt. Det var budskabet fra lektor Niels Brügger ved seminaret Digital humaniora, som Københavns Universitet, DeiC og DigHumLab afholdt den 20. april 2015.

Niels Brügger indledte seminaret med at definere, hvad digital humaniora er for en størrelse:

”Digital humaniora er en digital computer anvendt til humanistisk analyse. Vi taler altså om mere end bare at skrive noget i Word. Drivkraften for digital humaniora er, at væksten i analoge data er standset. Stort set alle nye data i verden kommer digitalt. Derfor er spørgsmålet ikke længere, om vi humanistiske forskere skal arbejde digitalt, spørgsmålet er hvordan,” sagde han.

Niels Brügger er lektor ved Institut for Æstetik og Kommunikation – Medievidenskab ved Aarhus Universitet. Han opdeler digitalt materiale i tre hovedtyper:

  1. Digitaliseret materiale, der tidligere var analogt.
  2. Født digitalt materiale.
  3. Genfødt digitalt materiale.

Digitaliseret analogt materiale kan for eksempel være en avisside, der bliver indscannet. Født digitalt materiale er eksempelvis websider.

Endelig er der det genfødt digitale materiale – det er en type, som Niels Brügger selv forsker i i form af arkiverede websider.

Niels Brügger:
At stille krav til en digital infrastruktur er ikke rigtig forskning, men det er nødvendigt, at forskerne går ind i arbejdet.

Webarkiv giver udfordringer

”Arkiverede websider er et godt eksempel på nogle af de udfordringer, som digitale materialer giver forskerne. Et websted er i konstant forandring, og det gør det vanskeligt at arkivere,” sagde han.

Niels Brügger ser forskning som en iterativ proces mellem fire elementer:

  1. Få fat i noget materiale.
  2. Analyser det.
  3. Diskuter det med andre forskere.
  4. Formidl det.

Processen går frem og tilbage mellem trinene. Ved websteder ligger udfordringen i første omgang i punkt 1: At få fat i materialet.

”Der findes ikke én original af en webside. Indholdet på den kan ændre sig, hver gang man klikker ind på den. Derfor må webarkiver gemme mange versioner af den samme side. Oven i købet kan der også opstå inkonsistens mellem hoved- og undersider. Måske lagrer vi en hovedside, der fortæller, at fodboldholdene AGF og Viborg skal spille mod hinanden senere i dag. Der er link til en underside om kampen. Fem timer senere arkiverer vi undersiden, der nu fortæller, at kampen endte 1-1,” gav han som eksempel.

En anden udfordring ligger i teknikken. Arkivering af websider foretages af crawler-programmer, der automatisk undersøger alle links og gemmer siderne bag dem.

”En crawler kan finde en kalender på et websted. Den klikker sig videre til næste måned. Og næste måned. Og næste måned. Det holder aldrig op, fordi webstedet automatisk genererer kalendersiderne, efterhånden som crawleren beder om at se dem. Det fortsætter, indtil crawleren bryder sammen af mangel på plads,” siger han.

Forskere skal definere behov

Udfordringerne med det digitale materiale betyder efter Niels Brüggers mening ikke, at forskerne skal holde sig fra det. Tværtimod skal de tage stilling til, hvilken digital infrastruktur de har brug for.

”I den analoge verden har vi altid haft en forskningsinfrastruktur. Vi har nok bare ikke tænkt på den som sådan. Den analoge forskningsinfrastruktur er biblioteker, museer med samlinger af artefakter, bygninger med reoler, hylder og kartotekskort. Den digitale verden har en tendens til at være mere kompleks, og det øger behovet for en velfungerende infrastruktur,” mente han.

Han foreslår, at forskerne tænker den digitale forskningsinfrastruktur som tre lag.

  • Det nederste lag er samlinger af data. Et eksempel kan være det danske netarkiv, der netop arkiverer websider.
  • Over det ligger et lag til tilgang, udvælgelse og isolering af de data, forskeren ønsker at arbejde med.
  • Øverst ligger analyselaget, som hjælper forskeren med at få noget ud af det udvalgte materiale.

”En digital forskningsinfrastruktur skaber ikke sig selv. Den skal være forskerdrevet – I skal stille krav til den,” sagde han til de forsamlede forskere på seminaret.

”Forskerne skal aktivt på banen. Digital forskningsinfrastruktur skabes i et samspil mellem samlingernes analytiske muligheder og begrænsninger og forskersamfundets konkrete ønsker og behov,” sagde han.

Samtidig erkendte han, at det at skabe en infrastruktur i sig selv ikke rigtig er forskning:

”Men der er ingen andre der tager sig af det. Derfor er forskere og samlingsansvarlige nødt til at selv at gå ind i dette nye felt. Vi skal også opbygge nye kompetencer, primært inden for det, jeg kalder den fagtonede it-kompetence,” sagde han.

Det er personer, der har en viden om it, som de kan koble med en forståelse af det fagområde, forskeren beskæftiger sig med.

Niels Brügger sluttede af med at nævne, at et forskningsprojekt med at analysere det danske web baseret på materiale i det danske netarkiv bliver et pilotprojekt under det kulturarvscluster, som DeiC er ved at etablere i samarbejde med Statsbiblioteket i Aarhus.

Niels Brügger ser forskning som en iterativ proces mellem fire elementer.

Den digitale forskningsinfrastruktur kan ses som en lagdelt model, hvor samlingerne er basis for behandling på de øvre lag.