Att bedöma likvärdigt – En studie i interbedömarreliabilitet på mellanstadiet

I vår grupp enades vi i ett ganska tidigt skede i arbetet om att vi var intresserade av likvärdig bedömning mellan olika skolor, och kanske mest om hur man kan främja det. Utifrån det formulerade vi forskningsfrågan:

  • Blir bedömningen mer likvärdig när lärare från olika skolor tolkar kursplanen gemensamt, samplanerar undervisningen och bedömningsuppgifter?

I vår grupp hade vi den stora fördelen att vi alla arbetar med NO och teknik på mellanstadiet. Det underlättade vårt upplägg. Vi började med att enas om att vi ville utgå från fysikämnet och det centrala innehållet om Energiformer samt olika typer av energikällor och deras påverkan på miljön. När det var gjort bestämde vi oss för att dels hitta relevanta förmågor och betygskriterier i kursplanen dels att sedan gemensamt tolka dessa och anpassa dem mer efter just detta tema. Detta gav oss en samstämmig förståelse av vad undervisningen skulle innehålla och hur vi kunde förstå betygskriterierna i förhållande till undervisningen.

Redan innan vi började undervisningen konstruerade vi även den bedömningsuppgift vi skulle använda för att sedan kunna beräkna samstämmigheten i våra bedömningar. Bedömningsuppgiften är en öppen uppgift som ber eleven att välja ett kraftverk som ska placeras i deras kommun. Eleverna ska sedan skriva till kommunen och argumentera för detta val. I denna argumentation ska det finnas fördelar och nackdelar med det valda kraftverket, samt argument för varför det är fördelar respektive nackdelar. Uppgiften är som sagt öppen och eleverna svarar med löpande text – en uppgiftsform som är den typ som är svårast att bedöma likvärdigt. Uppgiften kunde ge max 9 poäng. För det krävdes att eleven hade valt ett kraftverk (1p), beskrivit två fördelar (2p) och argumenterat för dessa (2p), beskrivit två nackdelar (2p) och argumenterat för dessa (2p).

För att analysera bedömningsöverensstämmelsen valdes de tio första elevsvaren från varje deltagande klass ut. Dessa skickades till forskningsledaren som anonymiserade svaren och skickade ut de 40 svaren till var och en av lärarna. Lärarna bedömde sedan svaren självständigt utifrån de gemensamt framtagna bedömningsaspekterna och skickade sedan tillbaka bedömningarna i form av poäng till forskningsledaren.

Intraclass Correlation Coefficient (ICC) användes för att mäta bedömaröverensstämmelsen. Det är ett ofta använt statistiskt mått på hur konsekventa bedömningarna är mellan olika bedömare. En hög ICC indikerar stark samstämmighet. Resultaten kan variera mellan noll och ett. Vanligtvis brukar ett resultat på 0,75 beskrivas som hög samstämmighet. Resultaten i denna studie visade en ICC på 0.913 vilket indikerar en god samstämmighet mellan bedömarna och att vi därför kan svara ja på vår forskningsfråga – bedömningen tycks ha blivit mer likvärdig när vi tolkade kursplanen, planerade undervisningen och bedömningsuppgiften gemensamt.

I arbetet analyserade vi även specifika exempel på elevsvar som drog ner samstämmigheten, alltså svar där vi varit oeniga i bedömningen. Det handlade bland annat om svårigheter att tolka elevers språkliga uttryck och att bedöma relevansen i argumenten. Trots att vi i planeringen tyckte att vi var överens om vad godkända argument skulle vara, har just denna aspekt varit en utmaning i bedömningen.

Arbetet har också pekat mot några andra viktiga lärdomar. Inte minst vikten av samarbete för att nå likvärdig bedömning, gärna i form av överenskommelse om tydlighet i undervisningens innehåll, vilka kunskaper som ska bedömas och hur bedömningsuppgiften kan möjliggöra det. 

Trots vår fina samstämmighet i bedömningen uppmärksammade vi att samma poäng inte alltid innebar att vi var är överens om vad som gav poängen. Svar som fått samma poäng kunde fått det av olika anledningar. Det tydliggör hur viktigt det är att prata om bedömning även om statistiken pekar mot hög överensstämmelse.

Arbetet gav värdefulla insikter i komplexiteten av bedömning och vikten av att sträva efter ökad likvärdighet. Genom att synliggöra utmaningar och identifiera faktorer som påverkar bedömningsöverensstämmelsen, kan vi arbeta mot en mer rättvis och tillförlitlig bedömningspraktik i skolan.

Maria Draxö, Maria Engkvist, Anna Jeppsson, Anna Pettersson 

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *