Gå til hovedindhold

Supercomputing giver os dybere indsigter indenfor sprogvidenskab og sociale medier

Lektor i lingvistik Rebekah Baglini ved Aarhus Universitets Interacting Minds Centre anvender DeiC Interactive HPC i både forskning og undervisning.
Af
man, 12/11/2023 - 11:10
Billede
Rebeka Baglini
Foto: interactivehpc.dk

Supercomputing forbindes ofte med fagområder som fysik, ingeniørarbejde og datalogi. Men virkeligheden er, at flere humanvidenskabelige forskere også er blevet flittige brugere af supercomputing. Det giver dem mulighed for at dykke ned i uudforskede områder og gøre hidtil ukendte opdagelser.

Mange studier inden for humanvidenskab er baseret på historiske data. Anderledes forholder det sig for den forskning, som lektor i lingvistik Rebekah Baglini, Interacting Minds Centre ved Aarhus Universitet, udfører. Hendes forskning anvender nemlig supercomputing på nylige data.

I sine nuværende projekter anvender Rebekah Baglini supercomputing til indsamling, bearbejdning og annotering af store mængder mediedata fra både traditionelle og sociale mediekilder. Ved at undersøge dette forskelligartede datamateriale er det muligt for hende at drage kausale slutninger og kausale ræsonnementer fra et lingvistisk perspektiv. Hendes forskning indebærer anvendelse af semantisk modelteori og beregningsmæssige metoder for at afdække indsigter inden for lingvistik.

”Jeg sigter mod at udvikle supercomputer-drevne metoder til at identificere tendenser i det diskursive og informationsmæssige landskab omkring emner relateret til mediedynamik, folkesundhed, videnskabskommunikation, krise- og risikomeddelelser samt fremkomsten af fejl- og desinformation.”, fortæller Rebekah Baglini, lektor i lingvistik, Aarhus Universitet.

Udover sine lingvistiske undersøgelser stræber Rebekah Baglini også efter at forbedre de eksisterende sprogmodeller inden for flersprogede natural language processing (NLP) med særligt fokus på sprog med begrænsede ressourcer.

Humanvidenskabelige forskere kan i høj grad få fordele af high-performance computing (HPC)

Rebekahs bestræbelser demonstrerer den kontinuerlige udvikling inden for digital humaniora og de forsatte bestræbelser på at forbedre eksisterende sprogmodeller, hvilket i sidste ende fører til en dybere forståelse inden for humaniora.  

”Mit tidligere arbejde involverede mindre sprogkorpusser og krævede ikke HPC-ressourcer. Men da mine projekter voksede i omfang og involverede store datamængder, øgedes relevansen af supercomputing. Jeg anerkender, at ikke alle projekter kræver HPC. Det er dog nyttigt for forskere at få træning i HPC’s muligheder, parallel computing og store modeller, så de ved, hvad der er muligt, og potentielt kan håndtere projekter af større skala eller drage fordel af state-of-the-art ressourcer til databehandling, modellering og simulering.” fortæller Rebekah Baglini, lektor i lingvistik, Aarhus Universitet.

NLP og supercomputer-drevet lingvistik er blevet en integreret del af Rebekah Baglinis undervisning

Dette forklarer, hvorfor NLP og supercomputer-drevet lingvistik er blevet en integreret del Rebekah Baglinis undervisning. Det er nemlig med til at sikre, at de studerende får praktisk erfaring i at arbejde med omfattende datasæt og store sprogmodeller og fremmer hands-on læringsmuligheder. Hun understreger samtidig, at der er en betydelig indlæringskurve, når man dykker ned i supercomputingens verden.

”Der har bestemt været en indlæringskurve i overgangen fra lokalt baserede klynger til den cloud-baserede DeiC Interactive HPC-platform, især fordi det også er en relativt ny facilitet uden omfattende dokumentation, og min tilknytning til Center for Humanities Computing på Aarhus Universitet har været en værdifuld ressource, da der er en stor fælles erfaring og viden at trække på i fællesskabet.” fortæller Rebekah Baglini, lektor i lingvistik, Aarhus Universitet.

Rebekah har tidligere anvendt DeiC Interactive HPC-systemet til blandt andet at lagre og analysere nyheder og sociale medier i det nationale forskningsprojekt HOPE, som overvågede skandinavisk brugeradfærd under Covid-19.

I dag bruger hun systemet i sit eget AUFF Starting Grant-projekt CROSS: Causal Reasoning and Online Science Scepticism til at træne sprogmodeller i at identificere og analysere fremvoksende narrativer, der underminerer eller modarbejder verificerede meddelelser om videnskabelige resultater og anbefalinger inden for folkesundhed.

Se flere spændende HPC use cases indenfor humaniora med bl.a. Katrine Frøkjær Baunvig om "At skabe en Grundtvig-kunstig Intelligens ved hjælp af HPC", eller Rolf Lyneborg Lund om ”At forstå, hvordan mennesker forstår begreberne ”gode” og ”dårlige” nabolag ved hjælp af HPC og billedeAI”.

I gang med DeiC Interactive HPC?

Se mere om DeiC Interactive HPC her.

Læs mere om adgangen til DeiC Interactive HPC her og læs om aktiviteter og services her.

Find dit universitets Front Office, som kan hjælpe dig med at komme i gang med DeiC Interactive HPC.

Du kan også kontakte DeiCs HPC-team ved eske.christiansen@deic.dk, HPC-chef.

Denne historie er oprindeligt skrevet af og bragt på Center for Humanities Computing, AU for Deic Interactive HPC, hvor en engelsk version er tilgængelig. Læs nyheden her.