OpaData4All – AI hjälper forskare förstå hur politiska åsikter förändras

Savitha och Andreas.

Genom projektet OpaData4All tog OPaL-gruppen vid Örebro universitet hjälp av AI-forskare för att undersöka om AI-drivna språkmodeller kan användas för att analysera det digitaliserade arkivet av riksdagsdata.

OpaData4All, ett pilotprojekt inom AI.ALL kopplat till den strategiska inriktningen Hållbar stads- och samhällsutveckling.

Projekttid: september 2022 till februari 2023.

Teknisk ledare: Andreas Persson.

Status: Avslutat.

Under de senaste decennierna har det svenska utbildningssystemet genomgått en förvandling med bland annat kommunalisering av skolan, införandet av ett fritt skolval och en friskolereform. Resultaten och konsekvenserna av denna utveckling är ett intressant område för forskare att titta närmare på.

På Örebro universitet har OPaL-gruppen (The Open Parliament Laboratory) utgått från riksdagens öppna data och skapat ett digitaliserat arkiv som sträcker sig tillbaka till 1500-talet. 

– Metodutvecklingen inom maskininlärning och datorstödd textanalys har gjort stora framsteg under det senaste decenniet och detta öppnar nya möjligheter för att söka svar på forskningsfrågor som tidigare varit svåra att besvara. I vårt fall handlar det om att förstå hur politisk förändring sker över långa tidsperioder, säger Martin Karlsson, som är universitetslektor i statskunskap och en del av OPaL-gruppen.

Ska gå från en samling ord – till något som går att analysera

Andreas Persson, forskare i datavetenskap, och Savitha Sam Abraham, postdoktor i datavetenskap, kommer att använda sig av AI-drivna språkmodeller för att ”annotera alla nämnda entiteter i datamängderna”. Enkelt förklarat innebär det att riksdagens öppna data ska gå från att bara vara en samling ord till att bli en databank där innebörden som ligger bakom orden kan analyseras.

– Vårt mål är att utveckla ett system som kan generera svar på frågor om vissa aspekter av ett ämne, som till exempel hur ett politiskt partis åsikt har förändrats över tid. För att generera ett svar kan vi behöva sammanfatta innehåll från en myriad av olika dokument, säger Savitha Sam Abraham.