Rammeverk for eksamen

5. Retningslinjer for utvikling av eksamensoppgaver

Når dere lager oppgaver til eksamen skal dere altså sikre at eksamen er mest mulig valid, reliabel, rettferdig og håndterbar innenfor rammene som til enhver tid gjelder for oppgaveutviklingen. Overordnet skal kandidaten få vise kompetansen sin på flere og varierte måter. Oppgavesettet skal samlet sett representere det som er mulig å vurdere til eksamen i læreplanen, altså den kompetansen og det faglige innholdet som er beskrevet i konstruktet. 

Da må dere ta hensyn til disse prinsippene for oppgaveutvikling som er beskrevet nedenfor.

5.1. Bruk flere oppgaver og oppgavetyper

Å la kandidater få svare på flere forskjellige oppgaver, der det fremkommer tydelig hvilke områder av kompetansen som blir vurdert, er svært viktig for å styrke reliabiliteten og validiteten i eksamen.

For å ivareta dette anbefaler vi sterkt at dere i eksamener med åpne oppgaver har minimum tre oppgaver som utgangspunkt for å vurdere elevenes besvarelse.

Hvilke oppgavetyper dere velger henger sammen med hvilken kompetanse dere ønsker at kandidaten skal vise. Vi har to hovedkategoriene av oppgaver som brukes til eksamen:

  • Åpne oppgaver der kandidater skriver et svar og
  • Lukkede oppgaver der elevene velger fra gitte svaralternativer  

Åpne oppgaver der kandidater skriver et svar er svært vanlige i eksamen. Et annet begrep for disse er «constructed response-oppgaver» (CR), for å markere at eleven konstruerer svaret selv, i motsetning til lukkede oppgaver med gitte svaralternativer (bl.a. flervalgsoppgaver), hvor eleven velger ett av flere alternativer. En åpen oppgave er å betrakte som en instruks til eleven: «Bruk faglig kompetanse for å utføre denne handlingen». Konkrete eksempler på slik fagkompetanse kan være en matematikkoppgave som skal prøve elevens matematikkfaglige kompetanse til å «lage, løyse og forklare likningssett knytte til praktiske situasjonar», eller en norskoppgave som skal prøve elevens kompetanse til å «utforske språklig variasjon og mangfold i Norge og reflektere over holdninger til ulike språk og talespråkvarianter».

Lukkede oppgaver der eleven velger ett av flere alternativer kalles også «selected response» (SR). Det mest kjente lukkede formatet er flervalgsoppgaven som består av et spørsmål eller en annen instruerende tekst og vanligvis to til fire svaralternativ. Et av alternativene er korrekt (den såkalte nøkkelen), og de andre alternativene fungerer som «distraktorer». Det finnes også andre typer lukkede oppgaver der eleven velger sitt svar fra ett eller flere alternativer, og eksempler på dette ligger i det nye gjennomføringssystemet for eksamen og prøver.

Å lage lukkede oppgaver er generelt vanskeligere og mer tidkrevende enn å lage åpne oppgaver, og krever statistisk analyse. Gevinsten med disse er at de kan prøve kandidatens kompetanse uten at skriveferdighetene påvirker resultatet. Kandidaten får vist sin kompetanse på flere oppgaver og de kan skåres automatisk. Begge deler gjør resultatet mer pålitelig. Det må imidlertid vurderes nøye i hvert enkelt fag hvilken kompetanse i læreplanen som eventuelt kan egne seg til denne typen oppgaver. Dette må dere vurdere om dere lager flervalgsoppgaver:

  • En oppgave skal fokusere på ett aspekt av kompetansen.
  • Alle oppgaver må være uavhengige av hverandre, dvs. at det ikke skal være mulig å svare riktig på en oppgave fordi en har svart riktig på foregående.
  • Oppgaven bør være så kortfattet og tydelig som mulig.
  • Stammen skal ikke inneholde negasjoner.
  • Alle svaralternativer skal være plausible.
  • Svaralternativer skal være omtrent like lange.
  • Svaralternativer skal ikke inneholde doble negasjoner.
  • Svaralternativer skal presenteres i logisk rekkefølge (for eksempel i alfabetisk eller nummerert rekkefølge).
  • Kun ett svaralternativ skal være korrekt.

 

5.2. Lag oppgaveinstrukser som er tydelige for kandidaten

Oppgavebestillingen må være forståelig for kandidaten og skal skrives slik at kandidaten ikke misforstår oppgaven. Det at oppgavebestillingen er tydelig, betyr likevel ikke at den ikke kan være kompleks/sammensatt. Dersom det er forberedelsesdel til eksamen, skal det fremgå tydelig hvordan denne skal forberede kandidatene på utfordringer de kan møte på eksamen. Det skal også fremgå tydelig i eksamensoppgavene hvordan kandidatene skal bruke det de har lært i forberedelsestida på eksamensdagen. 

5.3. Lag en eksamen som er så rettferdig som mulig

Nedenfor er noen eksempler på hva dere må passe på for å unngå bias i oppgavene 1. Begrepet bias kan oversettes med uheldig utfall, for eksempel at en eksamensoppgave utilsiktet favoriserer jenter, og dermed bidrar til at guttene skårer dårligere på den samme eksamen.

  • Oppgaver bør formuleres så tydelig og forståelig som mulig: unødvendig vanskelig syntaks og språkbruk skal unngås (det inkluderer regionale varianter, faste uttrykk som ikke kan antas være kjent av alle elever, f.eks. «å hoppe etter Wirkola» og lignende)
  • I eksamener som ikke krever det, bør emner, som det er grunn til å tro at visse elevgrupper vet mere om enn andre, unngås. Et eksempel er en spanskeksamen der alle oppgaver er knyttet til fotball.
  • Det er også viktig å vurdere hvordan oppgaver, i fag der dette er relevant, introduserer sensitive temaer på en måte som ikke støter kandidater unødvendig.
  • Oppgavene skal utformes på en slik måte at alle elever, uansett eventuelle spesialpedagogiske behov, skal kunne ta eksamen (universell utforming). Hvis oppgavene trenger tilpasninger skal disse være mulig å gjøre uten at oppgaven blir vesentlig forandret.

 1) Listen er basert på Zieky (2016), som er et kapitel i Lane et al. (2016).  

5.4. Gi tydelig informasjon om tidsrammer og hjelpemidler

En overordnet ramme for sentralt gitt skriftlig eksamen er at den skal vare i maksimalt fem timer. Det er viktig å spesifisere hvor lang tid en elev skal/bør/kan bruke på en oppgave, og hvilket omfang en oppgave må/kan ha. Slike tids- og omfangsfaktorer er en viktig del av instruksen fordi de skaper forutsigbarhet og trygghet for kandidaten, og de påvirker også hva som er mulig å si om kandidatens kompetanse.

Avhengig av hva en oppgave skal prøve, vil hjelpemidler og tilpasninger kunne påvirke hvordan svaret kan tolkes som et bevis på faglig kompetanse. Tilgang til eller begrensninger i digitale eller andre former for hjelpemidler til eksamen, bør begrunnes ut fra kompetansemålene i læreplanen, fagenes egenart, fagets nivå og eventuelle nye digitale oppgaveformater. Vurderingene må alltid ses opp mot gjeldende hjelpemiddelordning som rammer inn bruken av hjelpemidler på eksamen. Oppgavebestillingen skal bidra til at kandidatene bruker hjelpemidler på en hensiktsmessig måte for å løse oppgavene. Det må også fremgå i vurderingskriteriene hvordan bruk av hjelpemidler skal vurderes.

5.5. Lag tydelige vurderingskriterier for hvordan et kandidatsvar skal vurderes

For åpne oppgaver der elevene skal skrive et svar, skal det utvikles vurderingskriterier. Kandidaten og sensor må få kjennskap til hvilke kriterier som skal ligge til grunn for vurdering av kandidatens besvarelse. Kandidaten og sensor må også være kjent med om noen sider ved svaret skal vektes mer enn andre. For lukkede oppgaver og flervalgsoppgaver trenger vi ikke vurderingskriterier fordi jobben allerede er gjort når en lager alternativene med fasit.

Vurderingskriteriene skal lages slik at analytisk vurdering er mulig. Med analytisk vurdering mener vi at vurderingen skal deles opp i ulike vurderingsområder for å vise tydelig hvilke deler som til sammen sier noe om kandidatens samlede kompetanse. Disse kriteriene skal så langt det er mulig være de samme fra år til år. Nedenfor presenterer vi noen retningslinjer for hvordan kriterier skal utvikles og brukes. I eksemplet nedenfor er kriteriene stilt opp som en matrise.

Vurderingskriterier eksamen (eksempel)
                                                         Nivå 1 Nivå 2Nivå 3Nivå 4Nivå 5Nivå 6Skår
Vurderingsområde 1       
Vurderingsområde 2       
Vurderingsområde 3       
Vurderingsområde 4       
Vurderingsområde 5       
          Sumskår: 6-

I matrisen skal det fremkomme at eleven vil få et sumskår (samleskår) på oppgaven. Maksverdien vil være avhengig av antall vurderingsområder. I en matrise med fem områder og seks nivåer er maksimal sumskår 30. Med tre oppgaver er maksimalt eksamensresultat 90. Eksempelet her viser 6 nivåer, men det kan også være færre eller flere, avhengig av hvor mange kvalitetsnivåer det er mulig å skille mellom. Hvordan resultatet skal «oversettes» til en eksamenskarakter må vurderes av oppgaveutviklere sammen med Udir, og må tilpasses blant annet utformingen av læreplaner og fagenes egenart. 

5.6 Føringer for bruk av tekstvedlegg i oppgaver og oppgavesett

Dersom det er mulig skal tekstvedlegg (herunder sakprosa, skjønnlitteratur, bilder, film, grafikk og så videre) til oppgaver være autentiske slik at de i størst mulig grad gjenspeiler virkeligheten slik elevene møter den i opplæringen. Alle tekster som legges ved oppgaver skal ha tydelig kildeangivelse.

Enkelte ganger er det svært vanskelig for oppgaveutviklerne å finne egnede vedlegg til oppgavene, for eksempel fordi det ikke finnes originaltekster med riktig språklig nivå for faget. Andre ganger finnes det tekster som kan egne seg, men bare dersom de blir modifisert. Når det ikke er mulig å finne en egnet tekst til oppgavesettet som kan brukes i sin originale form, kan teksten modifiseres etter følgende retningslinjer:

  • Forkortede tekster skal være merket med «Utdrag», eventuelt også «Tilrettelagt for eksamen av Udir». Dersom det er forkortninger inne i løpende tekst, kan dette angis med klammeparentes slik [...].
  • Mindre endringer, for eksempel ortografiske eller grammatiske korrigeringer, små tilføyelser for å lette lesbarhet og lignende kan merkes med «tilrettelagt for eksamen av Udir».
  • Når det i enkelte tilfeller er nødvendig å produsere egen tekst som vedlegg til en oppgave må den være tydelig merket med «Produsert og tilrettelagt for eksamen av Udir».
  • Skjønnlitterære tekster skal være autentiske.