DeIC Nationale Kulturarvscluster, Statsbiblioteket

DeIC Nationale Kulturarvscluster ved Statsbiblioteket i Aarhus giver forskere inden for samfundsfag og humaniora adgang til fire petabyte digitaliseret kulturarv.

KulturarvsclusteretDeIC Nationale Kulturarvscluster, Statsbiblioteket, er en supercomputer, der er placeret ved en række samlinger af digitalt indhold på Statsbiblioteket i Aarhus. Den består af 10 sammenkoblede Dell PowerEdge R730-computere med i alt 360 CPU-kerner.

Forskere får via Kulturarvsclusteret adgang til blandt andet disse samlinger:

  • En radio-tv-samling med over en million timers tv-udsendelser og over halvanden million timers radioudsendelser fra 1980'erne til i dag.
  • Et netarkiv med over 20 milliarder objekter hentet fra den danske del af internettet siden 2005.
  • En digital avissamling, der foreløbig indeholder 11 millioner avissider fra 1700-tallet frem til i dag.

Samlingerne indeholder både data og metadata om kulturarvselementerne. I alt står over fire petabyte data til rådighed for forskerne.

Softwaren bygger på BigInsights-platformen fra IBM, som har kombineret open source-systemet Open Data Platform med egne kommercielle applikationer. Kulturarvsclusteret benytter ud over BigInsights også Platform Symphony og Spectrum Scale-systemerne fra IBM.

Data lagres i et EMC Isilon-anlæg med en kapacitet på 1,6 PB og en EMC VNX med plads til 200 TB. Endvidere lagres data på bånd i et system med to båndrobotter.

Mere information

Kontakt: Per Møldrup-Dalum, Statsbiblioteket, pmd@statsbiblioteket.dk