Betygens geografi - forskning om betyg och summativa bedömningar i Sverige och internationellt

Om projektet
Forskare

Projektuppgifter

Projektstatus

Pågående

Kontaktperson

Forskningsmiljöer

Utbildning och Demokrati

Syftet med studien är att systematiskt kartlägga och redovisa forskningsläget i Sverige och internationellt vad gäller betyg och betygssättning i relation till elevers kunskapsutveckling, lärares undervisning och betyg som styrdokument.

Studien har fyra övergripande frågeställningar:
hur betyg ur ett elevperspektiv påverkar självbild, motivation och lärande;
hur och vad lärare betygsätter och hur betyg påverkar undervisning;
hur betyg fungerar som styrinstrument på olika nivåer i utbildningssystemet;
vilka variationer av betygssystem det finns ur ett internationellt perspektiv.

Resultat
Ett övergripande resultat är att lärarsatta omdömen, som de svenska betygen, har en minskande betydelse internationellt sett. De fungerar som information till föräldrarna om barnets utveckling medan externa tester används vid selektion till andra utbildningar och som utvärderingsunderlag på olika nivåer inom systemet. Det som präglar det internationella forskningsfältet handlar om det vidare begreppet summativ bedömning. Betyg må vara en stor fråga i svensk skoldebatt men det är en liten fråga i internationell forskning.

Den första delstudien har undersökt forskning om hur summativa bedömningar påverkar elevernas lärande, motivation för lärande och prestationer. Här har vi granskat 2633 abstract av vilka 174 artiklar bedömdes relevanta att läsa i sin helhet. Av dessa var 64 artiklar relevanta för frågeställningen (summativa bedömningars påverkan på lärande och prestationer) men enbart 19 av artiklarna fokuserade på betygsättning och betygens effekter på elevernas lärande och prestationer.

Den andra delstudien handlar om, hur och vad lärare betygsätter och hur betyg påverkar undervisning. Här har vi läst 529 abstracts. Ur dessa valdes 94 artiklar ut för läsning i sin helhet. I slutändan var 40 av de internationella forskningsartiklarna relevanta för analysen. I svensk forskning hittade vi sammantaget 29, lic- och doktorsavhandlingar och artiklar som var relevanta för närläsning.

I den tredje delstudien om betyg ur ett systemperspektiv fick vi genom våra olika sökningar fram 2049 abstracts av vilka 109 valdes ut för närläsning. 67 av dessa lade grunden för tre tydliga teman kring betyg och styrning.

Den fjärde delstudien fokuserar betygen ur olika komparativa perspektiv. Det vi fokuserat på här är vad det är som brukar jämföras med hjälp av betyg samt hur olika betygssystem jämförs med varandra på nationell och internationell nivå. Initialt fick vi fram 824 abstracts med våra söktermer på detta område varav105 artiklar valdes ut för närläsning. 50 av dessa var relevanta för en vidare tematisering om jämförelser av och med betyg.

Den första delstudien har undersökt forskning om hur summativa bedömningar påverkar elevernas lärande, motivation för lärande och prestationer och vilka resultat den genererat.

Några övergripande slutsatser vi kan dra är, för det första, att resultaten från studierna till viss del är samstämmiga. Vuxna högpresterande studenter verkar påverkas positivt i sitt lärande. Prestationer av feedback som innehåller mycket information och som kommer i direkt anslutning till uppgiften bör vara positiv, jämfört med bedömningar med lite information. Samtidigt framkommer det att vuxna studenter inte påverkas negativt om feedback kommer i form av betyg. Detta förklaras av att vuxna studenter på universitetsnivå ”kan” systemet och har lång erfarenhet av summativa bedömningar och har utvecklat strategier för att hantera detta system samt att de är högpresterande. Däremot verkar det vara annorlunda för yngre elever och när representativa urval undersöks. En slutsats som kan dras av resultaten från de inkluderade studierna är att betyg generellt differentierar och påverkar äldre och yngre elever och låg- och högpresterande elever på olika sätt. Lågpresterande och yngre elever verkar påverkas mer negativt av betygsättning jämfört med äldre och högpresterande elever. Ålder och erfarenheter av bedömning tycks spela en stor roll för hur elevers lärande, motivation för lärande och prestationer påverkas av betygsättning.

Den andra delstudien handlar om hur och vad lärare betygsätter och hur betyg påverkar undervisning. Vi har studerat internationell respektive svensk forskning för att beskriva skillnader mellan svensk och internationell forskning. Gemensamt är att validitetsfrågan är central men häri ligger också skillnaden. I svensk forskning är det relationen mellan lärarens betygsättning och styrdokumenten som dominerar perspektivet. Utanför Sverige är det framförallt frågan om vad läraren bedömer som dominerar, t.ex. elevens kunskaper eller personliga egenskaper.

Att lärares dagliga verksamhet påverkas av betygens inflytande är mer framträdande i den svenska forskning vi funnit. Här är det framförallt godkäntgränsen som problematiseras men även hur betyg tar tid från lärarens pedagogiska arbete. Betygens inverkan på lärarens undervisning är däremot inte centralt i forskningen utanför Sverige. Där dominerar istället kritiken mot ett ökat inflytande av high-stakes tester och hur lärare upplever dessa som meningslösa i sin undervisning. Standardisering av betygsättningen och high-stakes tester ifrågasätts som ett problem som kan komma att riskera lärarens möjlighet att verka som professionell bedömare. Över huvud taget framkommer i de studier som tar upp betygens dilemman en spänning mellan styrning och kontroll och pedagogiska aspekter av lärarens bedömning.

I den tredje och fjärde delstudien har vi gått mer explorativt tillväga, då det inte funnits internationell forskning som primärt fokuserat betyg ur styrperspektiv. I den tredje delstudien fann vi tre centrala teman i forskning om betyg ur styrperspektiv: 1) Betyg ur rättvise- och jämlikhetsperspektiv, 2) Betyg som kunskaps- och urvalsmått, 3) Betyg som high-stakes i bedömnings- och utvärderingssystem. Ett tydligt resultat är att betygens roll i många utbildningssystem reducerats de senaste decennierna. Samtidigt visar genomgången av betyg ur ett systemperspektiv att betyg är bättre som urvalsinstrument för högre utbildning jämfört högskoleprov och andra liknande tester. I synnerhet kursbetyg på gymnasienivå som ges med stor bredd och i hög frekvens har en god predikativ förmåga.

Den fjärde delstudien fokuserar betygen ur olika komparativa perspektiv. Det vi fokuserat på är vad betyg jämför samt hur olika betygssystem jämförs med varandra på nationell och internationell nivå. När vi söker på bedömning och internationella jämförelser ser vi att betyg inte får en särskilt framträdande plats i artiklarna. I huvudsak är det tre områden forskarna fokuserar vid dessa jämförelser: system för accountability; kulturella förklaringar till varför bedömnings- och betygssystem ser olika ut i olika länder; variationer mellan olika lärares bedömningar i olika ämnen eller av olika elevgrupper.

Några viktiga iakttagelser i vår genomgång är att det länge funnits en internationell trend mot att upprätta olika system för ökad ansvarsskyldighet (accountability) för skolans resultat. Dessa resultat mäts främst i elevprestationer på test eller i betyg. Såväl kritiska forskare som OECD har dock på senare tid noterat, att förhoppningarna om att jämförelser av skolors resultat ska leda till resultatförbättringar har varit överdrivna. De system olika länder har för bedömning och accountability förklarar i princip ingenting av variationen i PISA resultat. Det är snarare vad lärarna gör i klassrummet som har betydelse.

Forskare

Christian Lundahl

Betygens geografi - forskning om betyg och summativa bedömningar i Sverige och internationellt

Projektuppgifter

Projektstatus

Kontaktperson

Forskningsmiljöer

Forskare

Finansiärer

Samarbetspartners

Om projektet

Projektuppgifter

Projektstatus

Kontaktperson

Forskningsmiljöer

Forskare

Finansiärer

Samarbetspartners