Prøver i fagfornyelsen - hvilke behov skal prøvene dekke?

Rapporten «Prøver i fagfornyelsen – hvilke behov skal prøvene dekke?» legger grunnlaget for å utvikle treffsikre prøver i fremtiden. Den beskriver en mulig vei å gå for å ivareta brukernes behov på en bedre måte enn i dag, i tråd med nye læreplaner.

I rapporten gjør vi rede for kunnskap og erfaringer vi har fra 15 år med nasjonale prøver og kartleggingsprøver. Vi beskriver brukerne av prøvene og deres behov, og drøfter prøvenes ulike egenskaper i lys av brukerbehovene. Ut ifra dette argumenterer vi for en mulig vei å gå framover.   

«Prøver i fagfornyelsen» skal åpne opp for gode diskusjoner, og inneholder derfor ikke en detaljert anbefaling. Mer utredningsarbeid ligger foran oss for å oppnå målet om mer treffsikre prøver. Den videre prosessen skal legge til rette for involvering av brukerne og andre relevante aktører for å kunne ta gode, kunnskapsbaserte beslutninger om fremtidens prøver.

Innhold

Innledning

Utdanningsdirektoratet fikk i brev fra KD, datert 18.06.2018, oppdrag om å utarbeide en helhetlig plan for prøvefeltet. Behovet for en slik plan er begrunnet i et behov for å tydeliggjøre formål med de ulike prøvetypene og informasjon om at det er stor variasjon i Skole-Norge i opplevelsen av nytte og bruk av dagens prøver.

Dagens prøvefelt har utviklet seg over år ved at nye prøver har kommet til gradvis og gjennom litt ulike prosesser, uten at det har vært en klar plan for helheten. Dette medfører at prøvefeltet kan fremstå som noe fragmentert og at det ikke kommer tydelig nok fram at prøvene er ment å dekke ulike behov. For at de ulike nivåene og brukerne skal få bedre og mer presis informasjon fra prøvene, trenger vi et prøvefelt med helhet og sammenheng.

Dette dokumentet er første skritt på veien mot fremtidens prøver, som ivaretar brukernes behov på en bedre måte enn i dag. Dokumentet har blitt til med en utforskende tilnærming, og er ikke bygget opp med tanke på å ende i en spesifikk og detaljert anbefaling. Mer utredningsarbeid ligger foran oss for å oppnå målet om et mer treffsikkert og helhetlig prøvefelt, og grunnlaget for dette arbeidet er samlet her. Gjennom dokumentet gjør vi rede for kunnskap og erfaringer vi har fra 15 år med nasjonale prøver og kartleggingsprøver, vi beskriver brukerne av prøvene og deres behov, drøfter prøvenes ulike egenskaper i lys av brukerbehovene og argumenterer for en mulig vei å gå framover.

Dokumentet er delt i tre hoveddeler:

  • Del 1 gir en introduksjon til dagens prøvefelt og oppsummerer kunnskapsgrunnlaget (kapittel 1 og 2)
  • Del 2 beskriver brukerne og deres behov, hvordan prøvene kan imøtekomme dette og hvilke konsekvenser brukerbehovene får for utforming av prøvene (kapittel 3 og 4)
  • Del 3 skisserer et forslag til tilnærming for å ivareta brukernes behov, samt forslag til videre prosess (kapittel 5, 6 og 7)

Del 1: nytte og bruk av ulike prøver

I del 1 gir vi en introduksjon til dagens prøver og oppsummerer kunnskapsgrunnlaget.

1 Introduksjon til dagens prøver

Nasjonale prøver ble første gang innført i 2004 for å dekke et behov for mer systematisk innhenting av elevenes læringsutbytte. Prøvene ble innført som en del av det nasjonale kvalitetsvurderingssystemet, NKVS.

I St.prp.nr.1 (2002-2003) skisseres prøvenes formål og bruk:
"Departementet mener at prøvene skal kunne dekke ulike formål. De skal både gi beslutningstakere på ulike nivåer i utdanningssektoren grunnlag for å iverksette nødvendige tiltak i sektoren, og elever og deres foresatte bedre grunnlag for å stille krav og/eller medvirke til forbedringer i opplæringen.

Prøvene skal også kunne brukes pedagogisk og forutsetter derfor tilbakemelding til skoleeier, skoleledere og lærere som grunnlag for forbedrings- og utviklingsarbeid på det enkelte lærested, og til den enkelte elev og elevens foresatte som grunnlag for elevens læring og utvikling. […] Prøvene skal utformes slik at de gir grunnlag for å vurdere utviklingen over tid, både på nasjonalt nivå, skoleeiernivå, skolenivå og elevnivå.”

De første nasjonale prøvene ble gjennomført i 2004 og 2005. Prøvene ble gjennomført på våren på 4., 7. og 10. trinn samt grunnkurs (vg1), i skriving, lesing, matematikk og engelsk. For å gjøre prøvene obligatoriske, var det nødvendig med en forskriftsbestemmelse. Denne kom i 2004 og omhandlet nasjonale prøver innenfor områdene lesing, skriving, matematikk og engelsk. Bestemmelsen kom til som en del av det nasjonale kvalitetsvurderingssystemet (NKVS).

I Ot.prp.nr. 80 (2002-2003)5 fremgår blant annet følgende:
«For å fremskaffe den nødvendige informasjon i forbindelse med opprettelsen av et nasjonalt system for kvalitetsvurdering må elevene kunne pålegges å delta i prøver, brukerundersøkelser og lignende. Skolene må kunne pålegges å rapportere data, også på individnivå. Opplysninger om læringsresultater på individnivå er en forutsetning for å kunne beregne sentrale kvalitetsindikatorer for skole og skoleeier. Data på individnivå vil også bli anvendt i forskning og derved bidra til et bedre kunnskapsgrunnlag for å iverksette tiltak lokalt og nasjonalt. Departementet presiserer at behandling av personopplysninger er regulert av personopplysningsloven, som blant annet sørger for at elevenes anonymitet er sikret.»

En evaluering av prøvegjennomføringen i 2005, Nasjonale prøver på ny prøve (ILS, 2005), viste at prøvenes kvalitet ikke var tilfredsstillende for verken pedagogisk bruk eller kvalitetsvurdering. Prøvene ble derfor stoppet, og oppdraget om nasjonale prøver endret. 

I oppdragsbrev fra KD til Udir, datert 23.5.2006, ble en ny generasjon nasjonale prøver beskrevet. Denne beskrivelsen er grunnlaget for dagens prøver 

“De nasjonale prøvene skal kartlegge om elevenes ferdigheter er i samsvar med læreplanens mål for de grunnleggende ferdighetene regning og lesing på norsk og engelsk, slik de er integrert i kompetansemål for fag i LKO6 etter 4. og 7. årstrinn. Prøvene skal gi informasjon til elever, lærere, foresatte, skoleeiere, de regionale myndigheter og det nasjonale nivået som grunnlag for forbedrings- og utviklingsarbeid.

Det er et stort behov for faglig veiledning om bruk av de nasjonale prøver og kartleggingsprøver.Det er også behov for støttemateriell og gode rapporter til bruk ved vurdering og oppfølging av prøvene. Målgruppene er både den enkelte lærer, skole, skoleeier og lærerutdanningen. Det er behov for å tilpasse materiellet til ulike målgrupper. Direktoratet bes om å ta ansvar for arbeidet med faglig veiledning og støttemateriell og at dette koordineres med fagmiljøene.”

Prøvene ble flyttet til høsten og skulle gjennomføres på 5. og 8. trinn i lesing, regning og engelsk. Som følge av denne endringen måtte også forskriften om prøvegjennomføring endres. Referansen til de konkrete prøvene fra 2004 ble tatt ut, og forskriften ble endret til en mer generell formulering. I 2006 ble ny forskrift til Opplæringsloven § 2-4 vedtatt, og denne bestemmelsen gjelder fortsatt for de obligatoriske prøvene:

§ 2-4. Prøver, utvalsprøver og andre undersøkingar: Elevar skal delta i prøver, utvalsprøver og andre undersøkingar fastsette av departementet. Skoleeigaren skal sørgje for at dette blir gjennomført.

I brevet med oppdraget om nye nasjonale prøver ble også oppdrag om utvikling av kartleggingsprøver gitt, disse skulle identifisere elever med behov for ekstra oppfølging. I første omgang skulle det utvikles obligatoriske prøver i lesing og regning på 2. trinn. Senere har det blitt utviklet prøver på flere trinn og i flere ferdigheter og fag.

I brevet fikk Udir videre i oppdrag å vurdere utvalgsprøver, i første omgang i skriving. Senere har det blitt utviklet flere utvalgsprøver i både fag og ferdigheter. Etter gjennomføring på et utvalg analyseres resultatene og prøvene blir tilbudt som frivillige prøver. Disse prøvene har fått navnet karakterstøttende og læringsstøttende prøver. 

Utviklingen av prøvesystemet slik vi kjenner det i dag har utgangspunkt i nevnte oppdragsbrev fra 2006. Flere oppdragsbrev har senere skissert nye prøver og utvikling innenfor en prøvetype. 

Sentrale utviklingsområder som kan nevnes er:

  • Overgang fra papirprøver til digitale prøver (gjelder alle prøver)
  • Måling av trend / utvikling over tid på nasjonale prøver
  • Utvikling av funksjonelle resultatrapporter i prøveadministrasjonssystemet (gjelder alle prøver)

Nasjonale prøver er fortsatt en sentral del av det nasjonale kvalitetsvurderingssystemet (NKVS). Nasjonale prøver sammen med Elevundersøkelsen og andre lokale data utgjør det sentrale kunnskapsgrunnlaget for skoleeiernes årlige tilstandsrapport, jf. opplæringsloven §13-10.

1.1 Oversikt over dagens prøver

Dagens prøvesystem har fire ulike prøvetyper:

  • Nasjonale prøver (NP): Skal gi kunnskap om elevenes grunnleggende ferdigheter i lesing, regning og engelsk. Informasjon fra prøvene skal danne grunnlag for underveisvurdering og kvalitetsutvikling på alle nivå i skolesystemet.
  • Kartleggingsprøver (KP): Skal hjelpe skolene å finne de elevene som trenger ekstra hjelp i løpet av de første skoleårene.
  • Læringsstøttende prøver (LS): Kan brukes som et verktøy i underveisvurderingen og gi læreren grunnlag for læringsfremmende tilbakemeldinger.
  • Karakterstøttende prøver (KS): Kan brukes som støtte i underveisvurderingen og bidra til å se underveisvurdering og sluttvurdering i sammenheng.

Tabell 1: Oversikt over dagens prøver 

Tabell som viser de ulike prøvetypene, på hvilke trinn disse prøvene ligger, og hvilke fag/ferdigheter prøvene måler.

Tabellen viser de ulike prøvetypene, på hvilke trinn disse prøvene ligger, og hvilke fag/ferdigheter prøvene måler. Oransje bokser betyr at prøvene er obligatoriske, mens grønne bokser betyr at prøvene er frivillige.

1.2 Hvem er interessentene?

De ulike prøvetypene gir informasjon til ulike nivåer i skolesystemet.

 

Tabell 2: Hvem får informasjon fra prøvene?
PrøvetypeHvem får informasjon fra prøvene?
Nasjonale prøver

Stat, kommune/skoleeier, skole, lærere, foresatte og elever,
samt at forskere kan søke om å få bruke resultatene i egen
forskning

Kartleggingsprøver

Skole, lærere, foresatte og elever. Skoleeier kan be om å få
resultatene fra den enkelte skole.

Læringsstøttende
prøver
Skole, lærere, foresatte og elever
Karakterstøttende prøverSkole, lærere, foresatte og elever

I tillegg til de som får direkte informasjon, er det også andre interessenter, som for eksempel: Media, politikere på ulike nivåer, KS, NHO, fagforeninger innen skole, Elevorganisasjonen,
interesseorganisasjoner som Dysleksi Norge og Blindeforbundet, lærerutdanningsinstitusjoner og læremiddelprodusenter.

1.3 Kort om prøveutvikling

Dagens prøver er utviklet på oppdrag fra Kunnskapsdepartementet. Udir utarbeider avtaler med eksterne fagmiljø som utvikler prøver ut fra et fastsatt rammeverk for prøveutvikling som beskriver formål, innhold, tekniske krav, gjennomføring og oppfølging av resultater. 

For de nasjonale prøvene foregår utviklingsarbeidet kontinuerlig, da det lanseres nye prøver hvert år. Kartleggingsprøvene og karakter- og læringsstøttende prøver nyutvikles ikke hvert år, men har en varighet på om lag fem år. Utvikling av en prøve, uavhengig av prøvetype, tar vanligvis ca. to år. Dette inkluderer utarbeidelse av prøvekonstrukt (beskrivelse av det prøven skal måle), utvikling av oppgaver, flere utprøvinger, analyse og utarbeidelse av veiledningsmateriell.

Etter hver prøvegjennomføring foretar de eksterne fagmiljøene og Udir analyser av resultatene. Disse bearbeides, presenteres og publiseres i ulike resultatvisninger som gir informasjon tilpasset de ulike brukergruppene og formålet med prøvene.

2 Kunnskap om nytte og bruk av prøvene

Forut for arbeidet med denne rapporten har vi gjennomført brukerinnsiktsprosjekter, samlet rapporter fra fagmiljøer og organisasjoner, og utført en litteraturgjennomgang på prøvefeltet i Norge. Vi har også gjennomført medieanalyser, som for det meste har omhandlet nasjonale prøver. Det samlede kunnskapsgrunnlaget ligger til grunn for arbeidet med en helhetlig plan for fremtidens prøvefelt.

I dette kapitlet gir vi en oppsummering av kunnskapsgrunnlaget.

2.1 Kvalitetsgjennomgang prøvefeltet (2017) – et brukerinnsiktsprosjekt

I 2017 gjennomførte Udir brukerinnsiktsprosjektet «Kvalitetsgjennomgang prøvefeltet». Målet med prosjektet var å få innsikt i brukernes opplevelse av nytteverdi fra prøvene. Prosjektet ble gjennomført dels med tjenestedesigntilnærming (spørreundersøkelse, observasjon og intervjuer på skoler og hos skoleeiere) og dels med en mer innspills-/høringsmetode (møter med og innspillsnotater fra UH-miljøer og organisasjoner).

Mange brukergrupper er representert med sin stemme i dette prosjektet: Elever, lærere, skoleledere, skoleeiere, UH-miljøer, organisasjoner som Elevorganisasjoner, Utdanningsforbundet, faglig råd for PPT og forlag.

Hovedfunn fra kvalitetsgjennomgangen:

  • Brukerne har høy tillit til prøvene, men formålet bør rendyrkes: Lærere opplever at prøvene viser en standard for hvor elevene bør ligge, og at prøveresultatene gir bekreftelse på egen vurdering. Formålet med kartleggingsprøvene misforstås av en del, noe som gir lærer og skole galt inntrykk av nivået på elevmassen.
  • Lærerne savner bedre verktøy for å måle progresjon: Lærere og skoler har få eller ingen verktøy for å følge elevenes faglige progresjon, og etterspør prøver som bygger på hverandre, der resultatene kan sammenlignes og ses opp mot læreplanene.
  • Opplevd nytte av prøvene avhenger av skolens ledelse: Lærernes opplevde verdi og nytte av prøvene avhenger sterkt av skoleledelsens fokus på, og vilje til, å sette rammer for oppfølging av resultatene.
  • One size doesn’t fit all: Det er behov for større tilpasning i kartleggings- og vurderingsverktøyene. Elevene med lav måloppnåelse sitter igjen med en tapsfølelse, mens det er vanskelig å identifisere elever med stort læringspotensial. Adaptive tilnærminger tiltrekker interesse.
  • Prøvene måler ikke alltid det de skal måle: Ord, begreper, tekstmengde og oppgaver i prøvene fører i en del tilfeller til at elevens språkferdigheter, ordforråd, leseferdigheter eller kulturelle bakgrunn hindrer eleven i å forstå hva oppgaven spør etter. Flere er usikre på reglementet for fritaksvedtak.
  • Eksamen (som redskap for underveisvurdering) styrer på ungdomstrinnet og i vgo: Lærerne opplever at prøvene ikke støtter opp om deres undervisning som forbereder elevene til eksamen. Ved videregående skoler og til dels ved ungdomsskoler er eierskapet til prøveresultatene lavt, sammenlignet med i barneskolen.
  • Det er behov for mer og bedre analysekompetanse i skolen: Flere skoleledere og lærere vet ikke helt hvordan de skal nyttiggjøre seg av prøveresultatene, og mange etterspør enda mer konkret hva elevene ikke mestrer, og forslag til tiltak og oppgaver for å følge opp enkeltelever og til bruk i klasserommet.
  • Digitale prøver fordrer gode og brukervennlige systemer: Stor positivitet til digitale prøver og læringsverktøy for alle elever, gitt at kvaliteten og brukeropplevelsen er god.

Ut fra brukerinnsikten ble det utledet tre beskrivelser for fremtidens prøver:

  1. Motivasjon og mestring – gi elevene utfordringer som er tilpasset deres faglige nivå slik at de opplever mestring.
  2. Sammenheng mellom prøver og læreplaner – være en ressurs for skoler og skoleledelse i arbeidet med å planlegge, gjennomføre og vurdere opplæringen
  3. Progresjon og oppfølging – gi lærere og skole grunnlag for å følge elevenes progresjon og avdekke behov for tidlig innsats

2.2 Litteraturgjennomgang på prøvefeltet

I 2019 gjennomførte vi en litteraturgjennomgang på prøvefeltet i Norge. Oppdraget ble utført av to eksterne forskere, og de søkte etter litteratur og prosjekter som ga informasjon om prøvene fra de siste 15 årene. Totalt er 81 publikasjoner gjennomgått.

Litteraturgjennomgangen har tatt utgangspunkt i ulike brukergruppers bruk og nytte av prøver som tilbys fra nasjonalt nivå. Hensikten var å utvikle vårt kunnskapsgrunnlag med tanke på å utarbeide en helhetlig plan for fremtidens prøvefelt. Sammendraget av litteraturgjennomgangen er organisert etter de ulike prøvetypene.

Nasjonale prøver

I litteraturgjennomgangen ble det funnet 50 publikasjoner som tar for seg nasjonale prøver. Det vises også til at forskningen har viet mest oppmerksomhet til nasjonale prøver i lesing. En forklaring på at de nasjonale prøvene er dominerende, kan være at de har vært obligatoriske og stabile siden innføringen av Kunnskapsløftet i 2006. Det vises også til at forskningen har viet mest oppmerksomhet til nasjonale prøver i lesing.

I litteraturgjennomgangen blir det påpekt at selv om rammeverkene for prøvene og selve prøvekvaliteten har utviklet seg i positiv retning, så gjenstår det en del arbeid for å hjelpe lærere og skoler til å nyttiggjøre seg informasjonen som de ulike prøvene gir. Oppfatningen av formålet med nasjonale prøver, og hvordan resultatene av prøvene skal benyttes i etterkant er ulikt fra skole til skole. Noen skoler har ikke en klar oppfatning av målet med bruk av nasjonale prøver, mens andre skoler har klare formål om at resultatene skal brukes i underveisvurderingen.

Flere av forskningsartiklene og masteroppgavene i litteraturgjennomgangen påpeker at mange informanter tror at nasjonale prøver bidrar til sammenligning og konkurranse mellom skolene. De er redde for at dette kan føre til at fokuset blir flyttet til prøveresultatene, og ikke elevens læringsprosess.

De fleste funnene omhandler nasjonale prøver brukt i læringsarbeid i klasserommet, mens det er lite forskning på nasjonale prøver til bruk til kvalitetsutvikling og styring. 

Kartleggingsprøver

I litteraturgjennomgangen ble det funnet åtte publikasjoner som omhandler kartleggingsprøver. Det som særlig kommer fram, er at det er vanskelig for skolene å nyttiggjøre seg disse prøvene. Ikke alle lærere hadde god nok forståelse av prøveformatet og hensikten med prøvene. Oppfølgingen ble ofte overlatt til den enkelte lærer, og der skolens ledelse ikke sørget for gode systemer og forvaltning av ressurser, ble det ofte tilfeldig hvorvidt elever ble fulgt opp. Gjennomgangen viser at bruken av prøvene må bli bedre for at de skal kunne bidra til utvikling av elevenes ferdigheter.

Læringsstøttende og karakterstøttende prøver 

Det var kun to publikasjoner på læringsstøttende prøver. Der ble det påpekt at læringsstøttende prøver er verdifulle for lærere med flerspråklige elever, siden prøvene gir en oversikt over mangler ved elevenes vokabular. Det ble samtidig pekt på at prøvene var vanskelige for mange elever, og at flere av elevene ga opp under prøven. 

I litteraturgjennomgangen var det ingen funn på karakterstøttende prøver.

2.3 Utvalgte studier

Vi har i tillegg til å oppsummere litteraturgjennomgangen valgt å beskrive fire prosjekter spesielt. Det er Evaluering av nasjonale prøver som system utført av Nordisk institutt for studier av innovasjon, forskning og utdanning (NIFU), Practices of Data Use in Municipalities and Schools (PraDa-prosjektet) og Ann Elisabeth Gunnulfsens doktorgradsarbeid som begge omhandler bruk av elevresultater, og til slutt prosjektet Vertikalt lenkedesign for de nasjonale prøvene i regning for 5.- 8. trinn ved Nasjonalt senter for matematikk i opplæringen og Center for Educational Measurement (CEMO).

2.3.1 Evaluering av nasjonale prøver som system (2013)

Nordisk institutt for studier av innovasjon, forskning og utdanning (NIFU) gjennomførte i 2013 en evaluering av nasjonale prøver. Formålet med evalueringen var å skaffe et bredt kunnskapsgrunnlag som kan brukes av flere nivåer, som et grunnlag for videre diskusjoner og videreutvikling av administrasjonen og gjennomføringen av nasjonale prøver. Undersøkelsen omhandler ikke det faktiske innholdet eller kvaliteten i de nasjonale prøvene, men redegjør for nasjonal og lokal praksis og holdninger til prøvene. Mange av funnene er i tråd med annen forskning, slik som at skoleledere er mer positive til nytten av prøvene enn hva lærerne er. Nasjonale prøver synes likevel å ha blitt en del av arbeidet for å styrke elevenes grunnleggende ferdigheter på de fleste skoler.

Skoleeier og lærere sier at prøvene i all hovedsak forberedes og gjennomføres i tråd med intensjonene. Skoleeierne og lærerne svarer i undersøkelsen at det er skolen, og fremfor alt lærerne, som avgjør hvor mye tid som skal brukes på forberedelser til nasjonale prøver. Det er et mindretall av lærerne på mellomtrinnet som legger annen undervisning til side for å forberede elevene på prøvene.

De fleste skoleeierne oppgir at de vurderer resultatet av prøvene som viktig for utviklingen av grunnskolen i kommunen. Likevel er det et skille mellom Østlandet og resten av landet, når det gjelder engasjement og vurdering av prøveresultatenes betydning, der Østlandet er mer engasjert enn resten.

2.3.2 Elevresultater - mellom kontroll og utvikling (PRADA 2017)

I PraDa-prosjektet (Practices of Data Use in Municipalities and Schools) har forskerne Guri Skedsmo, Sølvi Mausethagen og Tine S. Prøitz undersøkt bruk av elevresultater i norske skoler og kommuner i perioden 2014 til 2017. I prosjektet undersøker forskerne spesielt hvordan resultater fra nasjonale prøver tas i bruk av lærere og skoleledere og av skoleansvarlige i kommunen.

Funnene fra de kvalitative og kvantitative undersøkelsene diskuteres ut fra begrepene kontroll og utvikling på ulike nivåer i skolesystemet. Nasjonale prøver brukes som en sentral kilde, og forskerne begrunner dette i de politiske intensjonene med nasjonale prøver, som signaliserer en politisk forventning om både kontroll og utvikling. 

Funnene fra skoleeiernivået viser at kommunens strukturelle og organisatoriske faktorer, sammen med skoleansvarliges styringsstil, har betydning for hvordan resultatene følges opp, og i hvilken grad kontroll eller utvikling vektlegges. Forskerne finner at kommunene gjør ulike valg ut fra kommunenes lokale mål og vektlegger resultater og ansvaret for resultatene ulikt i møtet med skoleledere og lærere, og dette får konsekvenser for utformingen av skolens og kommunenes utviklingsarbeid.

Noen av funnene fra skolenivået er at nasjonale prøver har vært med på å introdusere en ny type organisasjonsrutine i skolen, «resultatmøtet». Resultatmøtet er et møte om resultater som skjer mellom skoleleder og lærere. Forskerne finner at skolelederne benytter seg av det de kaller «likhetsfremmende strategier» og «forenklingsstrategier» i dialogen med lærerne. Skolelederne jobber i stor grad for å oppnå konsensus i møtene heller enn å dyrke frem diskusjoner og utforske ulike meninger.

Videre viser funnene i PraDa at denne likhetsfremmende praksisen ser ut til å handle om å plassere problemene på utsiden av lærernes praksis heller enn å diskutere lærernes og skolens undervisning. Problemer blir omtalt i mer generelle ordelag og er lite preget av diskusjoner om grunnleggende spørsmål, både når det gjelder eksisterende undervisning og prøvene i seg selv. Forskerne viser til at løsninger ofte er mer behagelig og mer tilfredsstillende å diskutere enn problemer. Dette kan føre til at bruken av elevresultater på skolenivå blir preget av kortsiktighet og enighet. Forskerne viser til at dette ikke nødvendigvis er et problem i seg selv, men at kortsiktige tiltak ikke nødvendigvis er til det beste for elevene dersom de ikke etterfølges av en mer langsiktig plan og kritisk diskusjon om resultatene og bruken av dem.

PraDa-prosjektet viser tydelig at det er ulike forståelse og bruk av elevresultater på alle nivå i norsk skole, og at valgte praksis og ansvarstilnærming får betydning for utformingen av utviklingsarbeidet i skolen og kommunen.

2.3.3 Micro policy making in schools (2018)

I Ann Elisabeth Gunnulfsens doktorgradsarbeid, Micro Policy Making in Schools. Use of National Test Results in a Norwegian Context, 2018, kommer det blant annet fram at vi vet lite om hvordan skoler egentlig bruker resultater på nasjonale prøver for å forbedre elevers læring. Gunnulfsen har basert seg på et utvalg av fire skoler i samme kommune. Dette er et lite utvalg, og funnene må betraktes i lys av det.

Ingen av skolene i Gunnulfsens utvalg uttrykte negative holdninger til de nasjonale prøvene, og de var heller ikke opptatte av medias publisering av resultatene. Resultatene ble diskutert på skolenivå eller gruppenivå. Den enkelte elevs læring var ikke i fokus. Derimot brukte de mye tid på å diskutere hva som bidrar til god læring og undervisningspraksis generelt.

Gunnulfsen ga også ut en artikkel sammen med Astrid Roe i november 2019, der et av funnene er at jo mer kunnskap lærerne hadde om hvordan resultatene kunne brukes, jo mer brukte de dem, og jo mer positive var de til verdien av dem. Den viste også at jo mer kunnskap lærerne oppga at de hadde om prøvene jo bedre mente de prøvene fungerte i arbeidet med den enkelte elevs læring. Det var ulike meninger om i hvilken grad prøveresultatene bidro til ny innsikt i elevenes kompetanse. Her mente 30 prosent at de i liten eller ingen grad bidro, mens like mange mente at de i stor eller svært stor grad bidro.

2.3.4 Vertikalt lenkedesign for de nasjonale prøvene i regning 5. - 8. trinn (2020)

Våren 2018 ble Nasjonalt senter for matematikk i opplæringen (Matematikksenteret) tildelt et tilleggsoppdrag av Utdanningsdirektoratet knyttet til de nasjonale prøvene i regning. Formålet med tilleggsoppdraget var å undersøke om de nasjonale prøvene i regning egner seg til å fungere som «[…] robuste indikatorer for enkeltelevers utvikling av grunnleggende ferdigheter i regning over tid.»

Matematikksenteret, i samarbeid med Centre for Educational Measurement ved Universitetet i Oslo (CEMO), implementerte en vertikal lenke-pilot høsten 2018 for å undersøke om det er forsvarlig å koble sammen de nasjonale prøvene i regning. Hensikten med piloten var å undersøke om konstruktene som måles av prøven i regning for 5. og 8. trinn er såpass like at det er forsvarlig å plassere skårene fra prøvene på en felles skala.

Matematikksenteret konkluderer i sin rapport til Udir (april 2020) med at regneferdigheter, slik dette blir målt i de nasjonale prøvene, reflekterer et felles overordnet konstrukt, og ikke separate unike konstrukter for de to trinnene. De vurderer at overlappet mellom trinnene, både med tanke på ferdigheter og det målte konstruktet, åpner for en rekke muligheter. Blant annet at det kan være gunstig å utvikle oppgavebanker som er delt på tvers av trinn, både for å redusere arbeidsomfanget knyttet til oppgaveutvikling, og for å ha oppgaver tilgjengelig for flere ferdighetsnivåer. En annen mulighet kan være å åpne for at lærere og skoler kan benytte oppgaver/prøver ved andre tidspunkter enn de obligatoriske måletidspunktene. En slik mulighet vil gjøre det mulig for skoler å måle progresjonen til grupper med elever over tid, en mulighet som skoler per dags dato ikke har tilgjengelig instrumenter for.

2.4 Prøver i media

Det er spesielt nasjonale prøver som er omtalt og diskutert i media de siste 15 årene. Vi kan oppsummere utviklingen på følgende måte:

  • Kaos: De første nasjonale prøvene 2004-2005 var preget av kaos, boikott og mye kritikk i mediene. Det ble innført et pauseår i 2006 for å bygge nye nasjonale prøver og blant annet flytte gjennomføringen til høsten.
  • Rangering og kvalitetsdiskusjon: De første årene etter 2007 var mediene preget av at både nasjonale og lokale medier publiserte rangeringstabeller og artikler med beste og verste skoler/kommuner. Mediene publiserte også flere artikler med innhold som var kritisk til nasjonale prøver som system og at prøvene kunne av mange bli oppfattet som et enkelt svar på skolekvalitet. På den positive siden kan vi finne artikler som viser at det er nødvendig med offentliggjøring for å utvikle en mer transparent skolesektor og at prøvene er et egnet virkemiddel for å drøfte skolekvalitet på tvers i landet.
  • Skolekvalitet lokalt: De siste årene har vi sett et mediebilde som i mindre grad er preget av saker i nasjonale medier, men heller at lokale medier diskuterer skolekvalitet på bakgrunn av resultatene fra nasjonale prøver
  • Temadebatter: Noen gjengangere har preget mediebildet:
    • Juks og press: Magnus Marsdal utga i 2011 boken Kunnskapsbløffen - skoler som jukser, barn som gruer seg (Manifest forlag). Hovedbudskap i boken var at norsk skole kjennetegnes av prestasjonstester og at det foregår utbredt juksing på nasjonale prøver i utvalgte kommuner (Oslo og Sandefjord blir spesielt navngitt som juksere). Dette skapte sterk debatt og debatten har tidvis blitt gjentatt i ulike former etter 2011. Debatten om juks har dabbet av, men debatten om barn som gruer seg og kommuner som bruker resultatene til sterk styring har fortsatt.
    • Barn med lesevansker og synsutfordringer: Dysleksi Norge og Blindeforbundet har i flere år diskutert hvilken utfordring nasjonale prøver er for elever med behov for spesifikke hjelpemidler. Debatten har i stor grad handlet om elever med lesevansker og nasjonale prøver i lesing.
    • Utvalgsprøver: Både Utdanningsforbundet og enkelte politiske partier har i media ytret begrunnelser for at nasjonale prøver ikke bør gjennomføres i fullskala, men som utvalgsprøver. De argumenterer for at utvalgsprøver gir god nok informasjon til nasjonalt nivå og at fullskalaprøver er for tidkrevende. Debatten har eskalert det siste året, og i 2020 har debatten endt i en behandling i Stortinget (april 2020), der utfallet var at nasjonale prøver fortsatt skal være fullskalaprøver.

Mediebildet for prøvefeltet har i stor grad handlet om nasjonale prøver. Kartleggingsprøver har vært mindre debattert, og karakter- og læringsstøttende prøver har ikke vært debattert i media. Årsaken til dette er i stor grad fordi det er kun nasjonale prøver som blir analysert nasjonalt og offentliggjort.

Del 2: Hvilke behov skal prøvene fylle i fremtiden?

I denne delen tar vi utgangspunkt i hvem som er brukerne av prøvene, hva slags informasjon de har behov for, og hvordan prøvefeltet kan imøtekomme disse behovene. Vi drøfter ulike egenskaper ved prøvene i lys av dette. Denne drøftingen legger grunnlag for et forslag til utforming av fremtidens prøvefelt i del III.

3 Bedre brukertilpasning

Prøveutvikling som fagfelt har vært gjenstand for en betydelig modning og utvikling de siste årene, og vi har i dag mye mer kunnskap om nytte og bruk av prøvene enn vi hadde ved innføringen av nasjonale prøver. Ut fra kunnskapsgrunnlaget ser vi at mange brukere synes det er vanskelig å forstå hva prøvene måler, og hvordan resultatene kan tolkes og brukes. Et eksempel på dette er at resultatene fra kartleggingsprøvene forstås som informasjon om elever på alle ferdighetsnivåer, på lik linje med nasjonale prøver. Noe av årsaken til slike misoppfatninger kan være at dagens prøvesystem har vokst fram stykkevis og delt, uten tydelig sammenheng mellom alle prøvene.

Med innføringen av fagfornyelsen blir det nødvendig å endre innholdet i eller avvikle eksisterende prøver for å gjenspeile læreplanene i LK20/LK20S. Overgangen til nye prøver etter disse læreplanene vil innebære en restart av trendmålinger, et nytt år 0 for måling av utvikling over tid. Det gir en god anledning til å drive kunnskapsbasert videreutvikling av prøvene, og gjøre en helhetlig vurdering av prøvefeltet fra et faglig ståsted.

Resultatene fra nasjonale prøver er en viktig kilde for å vurdere og utvikle kvalitet i skolen. I Innst. 378 S (2017-2018) ber Stortinget regjeringen om å nedsette et utvalg som skal gjennomgå dagens kvalitetsvurderingssystem (NKVS) i lys av fagfornyelsen, hvor nasjonale prøver er en sentral komponent. En slik gjennomgang kan bidra til å løfte blikket mot hva slags informasjon prøvefeltet skal bidra med for å drive kvalitetsutvikling i skolen. I tillegg kan det å se på sammenhengen mellom virkemidler for kvalitetsutvikling og de nye læreplanene, som har et større utvalg av støtteressurser enn i LK06, gi en god anledning til å peke retning for prøvefeltet i fremtiden. Begrunnelsene for prøver og andre virkemidler i NKVS i St.prp.nr.1 (2002-2003) handlet i stor grad om behov for informasjon for å utvikle kvaliteten i skolen. I stedet for å vurdere dagens kvalitetsvurderingssystem, kan det være behov for å vurdere hva som er den gyldige begrunnelsen i dag, dvs. hvilke informasjonsbehov ulike nivå i skolen har for å kunne drøfte og utvikle kvalitet.

Disse forholdene gir et godt utgangspunkt for å gjøre en helhetlig vurdering av behovet for informasjon fra prøvefeltet, og utarbeide et prøvetilbud som besvarer dette behovet på best mulig måte. Slik kan prøvene blir bedre tilpasset brukernes behov enn de er i dag.

3.1 Hva slags informasjon kan prøvefeltet tilby?

Informasjon fra prøvefeltet dekker i dag hovedsakelig to behov hos brukerne; støtte til underveisvurdering og støtte til styring og kvalitetsutvikling. Enkelte prøvetyper bidrar til å fylle begge disse behovene, uten at vektleggingen mellom dem er tydelig definert. 

Støtte til underveisvurdering handler om å gi informasjon til lærere, elever og foresatte som legger grunnlag for underveisvurdering og videreutvikling. Informasjon i denne sammenheng handler ikke bare om resultater fra prøvene og analyser og rapportering av disse. Til prøvene hører også veiledningsmateriell som forteller hvordan resultatene kan forstås og følges opp, og hvordan videreutvikling av den aktuelle ferdigheten kan støttes. Noen oppgaver vil også ha en didaktisk verdi, der tema og problemstillinger brukes inn i undervisningen. Det er viktig å vurdere behovet for støtte til underveisvurdering i lys av andre tilgjengelige ressurser. Dette kan for eksempel gjelde støttemateriell utviklet til LK20/LK20S.

Resultatet fra prøvene kan også gi informasjon som legger grunnlag for styring og kvalitetsutvikling. Informasjon som forteller om norske elevers ferdigheter og kompetanse innenfor sentrale fagområder, er relevant både for nasjonale og lokale utdanningsmyndigheter. Ved å følge elevenes læringsutbytte over tid, får myndighetsnivåene kunnskap om kvaliteten på utdanningssystemet og hvordan den utvikler seg i takt med reformer, satsninger og tiltak. Dette er informasjon som benyttes i politikkutforming. Informasjon fra prøver som grunnlag for styring og kvalitetsutvikling vil være nyttig helt ned på skolenivå. Det er viktig å vurdere behovet for støtte til styring og kvalitetsutvikling i lys av andre kilder til styringsinformasjon. På nasjonalt nivå vil dette for eksempel gjelde de internasjonale undersøkelsene PISA, TIMMS og PIRLS. På lokalt nivå er blant annet brukerundersøkelsene og sluttvurdering aktuelle kilder.

3.2 Hvem er brukerne av prøvene?

Prøvene kan gi nyttig informasjon til brukere på alle nivåer av utdanningssystemet. Som skissert i kap. 1.2 strekker brukerne seg fra elever, lærere og foresatte via skoleledelse til skoleeier og nasjonalt myndighetsnivå. Data fra prøvene er også en viktig kilde for andre aktører som forskere, media, interesseorganisasjoner, lærerutdanninger og læremiddelprodusenter.

Brukerne av prøvene kan struktureres ut fra hvor de er plassert i sektoren. På klasseromsnivå finner vi brukere som er interessert i informasjon om den enkelte elev og elevgruppe, nemlig lærere, elever og foresatte. På skolenivå finner vi skoleledelsen, som har det overordnede ansvaret for oppfølgingen av elevenes resultater og for at lærerne får veiledning og støtte i sitt arbeid. Dernest har vi styringsnivåene skoleeiernivået og nasjonalt nivå. Begge disse skal drive henholdsvis lokal og nasjonal styring, kvalitetsutvikling og politikkutforming. Til sist har vi brukergruppen som står utenfor denne forvaltningslinjen, de eksterne brukerne. Disse brukerne omtales ikke som et eget brukernivå i dette dokumentet, men behovene deres kan i stor grad ivaretas av informasjon som rettes mot det nasjonale nivået.

3.3 Hvilke behov har de ulike brukernivåene?

For brukere på klasseromsnivået er det viktigst med informasjon som kan gi støtte til underveisvurdering for enkeltelever og elevgrupper. Resultater som forteller detaljert om elevenes prestasjonsnivå legger et godt grunnlag for tilbakemeldinger til elever og foresatte og for videre oppfølging. Etter fagfornyelsen blir informasjon som kan fortelle noe om elevenes progresjon enda viktigere enn tidligere, fordi progresjon og sammenheng i læreplanverket kommer tydeligere fram i LK20/LK20S.

På skolenivået har ledelsen behov for informasjon for å sikre at elevene får den opplæringen de har krav på. Den informasjonen kan legge grunnlag for veiledning og oppfølging av lærere. Skoleledelsen har også behov for informasjon som kan brukes til styring og kvalitetsutvikling på egen skole. For å evaluere eller utarbeide tiltak på skolenivå er det nyttig med data som sier noe om elevprestasjoner på utvalgte trinn eller på hele skolen, og hvordan resultatene endrer seg over tid.

Skoleeiernivået har behov for støtte til styring og kvalitetsutvikling. Dette brukernivået er sannsynligvis det som har mest behov for informasjon fra prøvene til dette formålet, sammenlignet med skolenivået og nasjonalt nivå. Skolenivået er tettere på elevene og har mange kilder, og nasjonalt nivå har data fra internasjonale undersøkelser. Prøveresultater fra standardiserte tester er gode datakilder for lokal styring og kan bidra til å informere lokalpolitikere i utformingen av utdanningspolitikk. De kan også brukes til å vurdere behov for, og effekt av, lokale satsninger i egen kommune. For skoleeiere er det nyttig å se resultater både fra de enkelte skolene og for kommunen som helhet. Det er også relevant å vurdere hvordan kommunen ligger an i forhold til andre kommuner eller opp mot et nasjonalt snitt. Det betyr at informasjonen må være egnet til sammenligning på tvers av kommuner over hele landet. Resultatene må kunne sammenlignes over tid. 

Det nasjonale nivået har mange av de samme behovene som skoleeierne. Her er det mest relevant å se på landets elever under ett, samt i noen tilfeller bryte ned dataene på kommunenivå. Måling av utvikling over tid er viktig på nasjonalt nivå, og det er kanskje ikke behov for så hyppig frekvens som hvert år. Politiske satsninger strekker seg gjerne over flere år, og endringer på bakgrunn av reformer og andre større prosesser tar lang tid. Det nasjonale nivået har behov for datagrunnlag for å evaluere ulike aspekter ved utdanningssystemet og til annet forsknings- og utviklingsarbeid.

3.4 Hvordan kan informasjon fra prøvene fylle disse behovene?

Prøvefeltet kan bidra med informasjon for å dekke behovene på alle disse nivåene. Det stiller imidlertid noen krav til utformingen av prøvene. I de følgende kapitlene beskriver vi hvilke egenskaper prøvene må ha for å imøtekomme behovene til de ulike brukernivåene. 

Med utgangspunkt i struktur og innhold i LK20/LK20S, er det flere områder som kan egne seg for måling i en prøve. Dagens prøver måler enten elevenes grunnleggende ferdigheter på tvers av fag eller deler av elevenes kompetanse i fag. Omfanget av prøver bør ikke være større enn det som er nødvendig for å bidra til kvalitetsutvikling, og prøving av fag eller ferdigheter bør derfor begrenses til et tilstrekkelig utvalg av prøver. 

Når det gjelder plassering av prøvene på trinn, er konteksten læreplanen og plassering av kompetansemål. De fleste læreplanene i LK20/LK20S har kompetansemål etter 2., 4., 7. og 10. trinn i grunnskolen. Prøvene bør legges i tilknytning til disse for å ivareta en god sammenheng mellom læreplaner og vurderingssystemet. 

Data som blir samlet inn gjennom prøvene, analyseres og rapporteres tilpasset brukerne. Datagrunnlaget fra den samme prøven kan analyseres og rapporteres på ulike måter avhengig av målgruppe, så det er ikke et én-til-én-forhold mellom prøvenes egenskaper og mulig analyse, men ønsket rapportering legger likevel noen føringer for prøvenes utforming.

3.4.1 Behov på klasseromsnivå

Prøver som skal gi god støtte til underveisvurdering, har noen sentrale kjennetegn. De må gi informasjon på individnivå, altså kan ikke prøvene være utvalgsprøver. De trenger imidlertid ikke være obligatoriske for alle, og kan eventuelt bare gjennomføres på det utvalget elever der det er behov for slik støtte.

For å oppfylle behovene på klasseromsnivå, er det ikke nødvendig at resultatene rapporteres oppover i systemet. Det er snarere en risiko for at rapportering og publisering av resultater kan påvirke bruken av prøvene i negativ retning. Vi vet fra kunnskapsgrunnlaget at prøver der resultatene bare benyttes til oppfølging i klasserommet (som kartleggingsprøvene), er godt likt av lærerne. En trygghet om at resultatene ikke brukes til annet enn det de er ment for, kan føre til at både lærere og elever får en bedre opplevelse og utnytter potensialet som ligger i prøvene i større grad. Ved rapportering og offentliggjøring av resultater ligger det i tillegg en risiko for at prøvene får større tilbakevirkende kraft på undervisningen, såkalt washback-effekt.

En prøve som skal gi støtte til underveisvurdering, er først og fremst et pedagogisk redskap. Det innebærer at oppgavene er utviklet for å gi mest mulig informasjon som er egnet til å fremme elevenes læring, og tilpasse undervisningen etter elevenes behov. I en slik prøve vil det å innhente rikholdig informasjon som læreren kan bruke direkte i oppfølging av enkeltelever og klassegrupper, være viktigere enn å måle elevenes ferdighetsnivå med høy presisjon. Tolkingen av resultatene skal sees i sammenheng med annen informasjon læreren har om elevene. 

De didaktiske kvalitetene ved oppgavene vil også tillegges vekt i tillegg til de måletekniske kvalitetene. For dette brukernivået kan prøvene også gi informasjon utover selve prøveresultatene. Det gjelder først og fremst veiledningsmateriell, som forteller hvordan resultatene kan brukes og forstås, og hvordan den aktuelle ferdigheten kan videreutvikles. I tillegg kan selve oppgavene i prøven ha didaktisk verdi for læreren og være utgangspunkt for undervisningsopplegg i klasserommet. Dette behovet må sees i sammenheng med hva brukerne på klasseromsnivå får dekket i støttemateriellet i tilknytning til ny læreplan. 

For lærerne som skal følge opp resultatene, og elevene som skal jobbe med videreutvikling av sine ferdigheter, bør gjennomføringstidspunktet til prøvene legges med tanke på rask iverksettelse av tiltak og langsiktig oppfølging. Her vil sannsynligvis et målepunkt tidlig i skoleåret være egnet. 

Som omtalt i kunnskapsgrunnlaget, er det gjort utredninger som viser at det er mulig å måle elevers utvikling over tid ved å lenke sammen resultater fra prøver på ulike trinn. Dette kan gjøres på individnivå og på systemnivå (trend). En slik tilnærming er det mulig å videreutvikle dersom man ønsker informasjon om progresjon fra prøvefeltet. For lærere, elever og foresatte vil informasjon om progresjon på individnivå være nyttig. 

For bruk på de høyere trinnene, vil informasjon som kan relateres direkte til fagene være relevant, særlig med tanke på sammenhengen mellom underveis- og sluttvurdering. I begynneropplæringen er gjerne vektleggingen av grunnleggende ferdigheter større, og her kan man tenke seg at prøver som sikter mot disse vil treffe bedre. 

For å gi lærerne god støtte til underveisvurdering, er rik informasjon om enkeltelevenes og egen elevgruppes prestasjoner verdifull. De har behov for å vite hva elevene kan, og hvor det trengs videre veiledning og undervisning. Denne typen informasjon bør ikke aggregeres opp på høyere systemnivå eller publiseres, fordi den ikke egner seg til sammenligninger og må tolkes lokalt.

3.4.2 Behov på skolenivå

Når prøvene brukes på skolenivå, er det skoleledelsen og kollegiet som helhet som er brukerne. Disse brukerne har mange av de samme behovene som i klasserommet, men for dem er det resultater for elevgrupper, trinn og hele skolen som er mest relevant. Skolen har behov for å vite hva elevene mestrer, og hvor det trengs videre veiledning og opplæring. En særskilt oppfølging av elever med spesielle behov, er et viktig ansvar for skoleledelsen. Informasjon fra prøvene kan sikre at skolen ivaretar elever som trenger ekstra oppfølging, og støtte arbeidet med tidlig innsats. 

På skolenivå foregår det også systematisk kvalitetsutvikling og styring. Prøvefeltet kan bidra til å gi informasjon som støtter opp om dette. Dersom skolen har iverksatt lokale satsninger eller tiltak, kan data fra prøvene brukes for å evaluere disse. De kan også brukes for å identifisere områder hvor det er behov for satsninger eller tiltak. For å imøtekomme dette behovet, må prøvene måle ferdigheter og kompetanse i fag som samsvarer med de mest utbredte satsningsområdene på skolenivå. Eksempler på slike områder kan være lesing, realfag og digitale ferdigheter.

Dersom skolen skal få data som egner seg til å vurdere egen virksomhet, må prøven ha oppgaver som måler elevenes ferdighetsnivå så presist som mulig. Alle elevene må også gjennomføre prøven. Resultatene er ment å gi god informasjon på gruppenivå, og gir dermed mindre rik informasjon på individnivå.

3.4.3 Behov på skoleeiernivå

Skoleeiere har behov for støtte til styring, kvalitetsutvikling og politikkutforming. Dersom alle kommuner skal få dette, må prøvene gjennomføres i fullskala. Vi har så mange små kommuner i Norge at det ikke lar seg gjøre å konstruere utvalg som vil gi tilstrekkelig data for hver kommune.

Som på skolenivå, har også skoleeiernivået behov for data som kan brukes for å evaluere lokale satsninger, og for å identifisere områder hvor det er behov for slike. Prøvene må dermed måle ferdigheter og kompetanse som er relevant for dette. 

Prøvene må generere data som er egnet til å gjøre komparative analyser. For at resultatene skal kunne sammenlignes på tvers av skoler, kommuner og årskull, er det viktig at prøvene gjennomføres under så like forutsetninger som mulig. Oppgavene må også ha egenskaper som gjør at de får likt utfall uavhengig av hvor prøven gjennomføres.

Styringsnivåene får informasjon om elevenes prestasjoner i fag blant annet fra eksamen og standpunktkarakterer, mens for grunnleggende ferdigheter er kildene færre. Dette kan påvirke hva slags informasjon skoleeierne har behov for fra prøvefeltet. For prøver som skal gi informasjon til styring og kvalitetsutvikling, vil det være egnet med et målepunkt mot slutten av skoleåret. Trendinformasjon vil være viktigst, uten at progresjonen til enkeltindividene rapporteres.

Støtte til styring og kvalitetsutvikling handler på dette nivået om å gi skoleeierne informasjon som er egnet til å vurdere skolene i egen kommune. Analyser som understøtter dette er i stor grad komparative, som sammenligning ved egen skole og mellom skolene, over tid eller med nasjonalt nivå. Data som er aggregert opp på hver skole og på kommunenivå vil være mest relevant for skoleeierne.

3.4.4 Behov på nasjonalt nivå

Prøver som skal gi styringsinformasjon på nasjonalt nivå trenger i utgangspunktet bare resultater fra et representativt utvalg av landets elever, men kan selvsagt gjennomføres på hele årskull om ønskelig.

Utviklingen i prøveresultatene over lengre tidsperioder gir nyttig informasjon til politikere og nasjonale utdanningsmyndigheter. Prøvene må derfor bestå av oppgaver som legger til rette for sammenligning over tid (trendmålinger). Som trendmålingene på nasjonale prøver har vist, er endringer i nasjonale gjennomsnittsresultater liten fra år til år. For å dekke behovet for denne typen informasjon er det sannsynligvis ikke nødvendig med så hyppige målepunkter som hvert år. 

Resultater fra standardiserte prøver er et verdifullt bidrag til det nasjonale kunnskapsgrunnlaget for grunnutdanningen. Det er behov for data som inngår i ulike indikatorsett, og benyttes i
evaluering, forskning og utvikling. Til dette trengs datasett fra prøvene som representerer elever i hele landet, og som egner seg til å sammenstilles med registerdata. 

Det er viktig å se behovet på nasjonalt nivå i lys av informasjon utdanningsmyndighetene får fra internasjonale storskalaundersøkelser, som for eksempel PISA, TIMSS og PIRLS. Innholdet i disse undersøkelsene samsvarer godt med norske læreplaner, selv om de er utviklet for bruk i mange land. De er imidlertid ikke skreddersydd for å innhente informasjon som er relevant for norske  utdanningsmyndigheter, og i så måte vil data fra et nasjonalt prøvefelt være betydelig mer treffsikkert. Norge har dessuten bare begrenset påvirkningskraft på hva som måles i de internasjonale undersøkelsene, mens et nasjonalt prøvesystem vil kunne tilpasses spesifikke behov, for eksempel i tilknytning til nasjonale satsninger eller evalueringer.

4 Konsekvenser for utforming av prøvene

Drøftingen over viser at de ulike behovene til brukerne påvirker hvordan prøvene utformes. Det gjelder for eksempel hva som er innholdet i prøvene, når de skal gjennomføres, på hvilken måte de måler elevenes ferdigheter, om alle elever eller bare et utvalg skal gjennomføre, og hvordan resultatene skal analyseres, rapporteres og presenteres. For å konkretisere hvilke konsekvenser dette får, har vi beskrevet to ytterpunkter som ivaretar behovene på henholdsvis nasjonalt nivå og klasseromsnivå. Dernest presenterer vi en grovskisse til en kombinasjon av disse som ivaretar behov på alle brukernivåene. Denne skissen vil bli mer utfyllende beskrevet i del III.

4.1 Prøver som ivaretar behov på nasjonalt nivå

Prøvene kan utformes slik:

Utvalgsprøver vs.
fullskala

For å få informasjon til nasjonalt nivå, trenger vi kun å
gjennomføre utvalgsprøver. Prøvene er obligatoriske for dem
som blir trukket i det nasjonale utvalget, og kan tilbys frivillig
på kommunenivå.

Trinn og tidspunkt

Trinn: Prøvene gjennomføres på utvalgte trinn med
kompetansemål, for eksempel 4., 7., 10. og Vg1.

Måletidspunkt: Prøvene kan gjennomføres mot slutten av
skoleåret.

Utvikling over tid

Hyppighet: Prøvene må ikke gjennomføres hvert år, men bør
inngå i en fast syklus slik at vi får en god og stabil
trendmåling.

Fag/ferdighet

Fag/ferdighet: Utvalgsprøvene er prøver i grunnleggende
ferdigheter. I tillegg kan det utvikles delprøver i andre aktuelle
ferdigheter/fag ved behov, for eksempel tilknyttet nasjonale
satsninger

Innhold og
oppgaver

Faste konstrukt med anerkjente indikatorer på ferdigheten.

Viktig at prøvene gjennomføres under så like forutsetninger
som mulig. Oppgavene må ha egenskaper som gjør at de
fungerer likt uavhengig av hvor prøven gjennomføres.

Rapportering/
analyse

Resultater rapporteres og analyseres på
kommunalt/nasjonalt nivå, ikke individnivå.

Fordeler Ulemper 

Gir god og stabil informasjon til
nasjonalt nivå for å dekke behovet for
styring og kvalitetsutvikling.

Gir ingen direkte informasjon til skoler
og skoleeiere ved gjennomføring kun på
et nasjonalt utvalg.

Gir informasjon til nye politikkområder,
samt kan evaluere/monitorere
nasjonale satsninger.

Kan oppleves som lite motiverende for
skoler og elever å gjennomføre siden
det ikke har direkte betydning for egen
utvikling.

Tid bespart i mange skoler og
kommuner.

Ingen felles indikator som utgangspunkt
for å diskutere skolekvalitet på tvers av
kommuner og skoler.

Kommuner kan vurdere eget behov for
informasjon til styring og
kvalitetsutvikling, og gjennomføre ved
behov.

Kan gi større ulikheter mellom
kommuners arbeid med
kvalitetsutvikling dersom noen velger å
bruke prøvene, mens andre ikke gjør
det.

4.2 Prøver som ivaretar behov på klasseromsnivået

Prøvene kan utformes slik:

Utvalgsprøver vs.
fullskala

Prøvene er frivillig for skoleeiere/skoler å gjennomføre

Trinn og tidspunkt

Trinn: Prøvene kan gjennomføres etter utvalgte trinn med
kompetansemål, slik at de kan legges for eksempel på høsten
3., 5., 8. trinn og Vg1.

Måletidspunkt: Prøvene gjennomføres tidlig i skoleåret, for å 
sikre god tid til oppfølging.

Utvikling over tid

For å kunne måle progresjon på individnivå, må alle elever som
skal måles gjennomføre ved hvert målepunkt.

Fag/ferdighet

For de tidligste målepunktene, kan det utvikles prøver i (et
utvalg) grunnleggende ferdigheter. Det kan også utvikles
prøver i (deler av) kompetanse i fag.

Innhold og
oppgaver

Innhold og oppgaver er utformet slik at de gir rik informasjon
til lærer.

Rapportering/
analyse

Det utvikles egne individ- og grupperapporter. Ingen
publisering.

Fordeler Ulemper 

Gir god informasjon om elevenes
progresjon.

Ingen informasjon til skoleeier eller
nasjonalt nivå.

Gir god støtte i underveisvurderingen. 

Ingen informasjon til indikatorutvikling. 

Gir valgmuligheter slik at lærere/skole
kan tilpasse gjennomføring etter behov
og lokale forhold.

Får ikke et felles nasjonalt grunnlag for
å drøfte kvalitet.

Ingen publisering. 

Ingen trendmålinger på skoleeiernivå
eller nasjonalt nivå.

Merk at det er mange mulige utforminger her. Vi kan for eksempel lage en oppgavebank som er helt åpen og tilgjengelig for alle til å sette sammen egne prøver (da blir det ikke mulig å måle progresjon).

4.3 Prøver som ivaretar behov på alle brukernivå

Vi mener at den mest treffsikre måten å ivareta alle brukernes behov på, er å kombinere to ulike prøvetyper; En prøvetype som er utviklet for å ivareta behovet for støtte til styring og kvalitetsutvikling og en annen prøvetype for støtte til underveisvurdering. 

En mulighet er å gjennomføre utvalgsprøver i for eksempel lesing og regning for å støtte styring og kvalitetsutvikling på nasjonalt nivå, og ha egne prøver for å støtte lærernes underveisvurdering. 

Et annet alternativ er å ha en kombinasjon av fullskalaprøver for å støtte styring og kvalitetsutvikling på skole-, skoleeier og nasjonalt nivå, og frivillige prøver i tillegg på utvalgte fag/ferdighetsområder for å støtte skolene og klasseromsnivået i sin underveisvurdering.

FordelerUlemper

Gir god og stabil informasjon til (skole-,
skoleeier- og) nasjonalt nivå til formålet
styring og kvalitetsutvikling.

To ulike prøvetyper kan være
utfordrende å forstå – feiltolkning av
formål og oppfølging av resultater

Gir informasjon til nye politikkområder,
samt kan evaluere/monitorere
nasjonale (og lokale) satsninger.

Ressurskrevende når det gjelder
prøveutvikling og analyse.

Gir god informasjon om elevenes
progresjon.

 
Gir god støtte i underveisvurderingen. 

Del 3 Hva er en god tilnærming for å ivareta brukernes behov?

I denne delen har vi utarbeidet et forslag til hvordan prøvefeltet kan utformes i fremtiden for at brukerne på de ulike nivåene skal få den informasjonen de har behov for. Hensikten med forslaget er å gi et grunnlag for videreutviklingen av fremtidens prøvefelt, og vi velger derfor å legge fram en modell som kan åpne opp for drøfting framfor å presentere ulike alternativer å velge mellom.

I brukerinnsiktsprosjektet i 2017 ble som nevnt tre aspekter ved fremtidens prøver trukket fram som sentrale; å gi elevene utfordringer tilpasset deres nivå, å ha god sammenheng mellom prøver og læreplaner og å gi informasjon om elevenes progresjon. Disse beskjedene har vi lagt vekt på i utarbeidelsen av forslaget. De følgende kapitlene beskriver forslaget på et overordnet nivå, uten å redegjøre i detalj for hvordan prøvene kan utformes. Noe av årsaken til dette er at vi har behov for å hente inn mer kunnskap og erfaring for å gi utfyllende anbefalinger.

5 To prøvertyper

I kunnskapsoversikten så vi at forskjellige prøvetyper som dekker ulike behov, kan skape forvirring og misforståelser ved tolking og bruk av prøvene. På den annen side er det fra et prøvefaglig ståsted utfordringer knyttet til å fylle alle brukernes behov i én og samme prøvetype, og det innebærer noen kompromisser på kvalitet. Vi mener at kvalitetsargumentet veier tyngst, men at løsningen må tilrettelegge for at misoppfatningene reduseres. Derfor foreslår vi å utvikle to helt ulike prøvekonsepter som ivaretar hver sine brukerbehov; nye nasjonale prøver og progresjonsprøver. Disse to prøvene skal støtte henholdsvis styring og kvalitetsutvikling, og underveisvurdering og progresjon. 

Med to forskjellige prøvetyper, blir det viktig at rapporteringen av resultatene understøtter tydelig hvordan resultatene skal brukes og forstås, for å unngå misoppfatninger tilsvarende de vi har sett med dagens prøvesystem. Det blir også viktig å synliggjøre forskjellen mellom de to prøvene i kommunikasjon og innpakning. Progresjonsprøvene kobles tydelig til læreplanen gjennom gode digitale løsninger for lettere å koble lærernes oppfølging av prøvene til læreplanen, og resultatene brukes bare lokalt. De nye nasjonale prøvene rapporteres til styringsnivåene og skal gi skolen, skoleeieren og nasjonalt nivå informasjon til bruk i egen styringsdialog og kvalitetsutvikling. 

Vi har diskutert muligheten for å ikke rapportere informasjon fra nye nasjonale prøver på skolenivå for å redusere opplevelsen av high stake og press for elever og lærere. Årsaken til at vi har landet på rapportering på skolenivå er at dagens Offentlighetslov tilsier at vi må levere ut resultater på skolenivå dersom noen ber om innsyn. Vurderingen vår er derfor at det er bedre med offentliggjøring i våre kvalitetssikrede statistikkverktøy enn at for eksempel mediene lager egne sammenstillinger fra dataene. Dette har vi erfaring fra i de første årene med dagens nasjonale prøver. Vi publiserte ikke skolenivået i Skoleporten, men leverte ut skoleresultater til de som ba om innsyn. Resultatet ble rangeringslister og sammenstillinger som i liten grad bidro til en god dialog om kvalitet i skolen. Etter vi startet med publisering av skolenivå i Skoleporten og statistikkportalen har etterspørselen etter disse sammenstillingene endret seg, og vi ser at interessentene i høy grad benytter seg av nasjonale verktøy for å finne data til sine behov. 

I de følgende kapitlene skisserer vi opp en mulig måte å utforme de to foreslåtte prøvetypene på.

5.1 Nye nasjonale prøver

Disse prøvene gir informasjon til styringsnivåene nasjonalt og lokalt. Resultatene herfra danner grunnlag for styring og kvalitetsutvikling hos skoler, skoleeiere og utdanningsmyndigheter.

Prøver som støtter styring og kvalitetsutvikling
FrekvensHvert andre år
DeltakereObligatorisk for alle elever på trinnet
Trinn4., 7. og 10.
TidspunktVår
Fag/ferdighetEt utvalg grunnleggende ferdigheter
Oppgaver«Strenge», høy presisjon, anerkjente indikatorer
Analyse/ rapportering

Aggregerte resultater på skole-, kommune- og nasjonalt
nivå. Komparative analyser. Offentliggjøring.

5.1.1 frekvens og deltakelse

Når vi ser på resultater fra dagens nasjonale prøver over tid, viser årlige målepunkter veldig liten endring mellom hver gjennomføring. De internasjonale undersøkelsene har frekvenser på 3–5 år mellom hvert målepunkt, som oppfattes som tilstrekkelig ofte for behovet for informasjon på nasjonalt nivå. Vi vurderer derfor at prøver til bruk for kvalitetsutvikling og styring på nasjonalt nivå sannsynligvis bør gjennomføres hvert andre år. For skole- og skoleeiernivået er usikkerheten omkring frekvens større, da vi ikke har erfaring tilsvarende den fra internasjonale undersøkelser å støtte oss på. Vi vurderer likevel at det er tilstrekkelig med informasjon fra nye nasjonale prøver hvert andre år også for skole- og kommunenivået. Å redusere frekvensen av nasjonale prøver til hvert andre år, vil begrense omfanget av rapportering i skolen, men får også konsekvenser for hvordan disse dataene kan brukes i årlige indikatorsett og utvelgelser av kommuner til oppfølgingsordningen.

Et alternativ kan være å rullere mellom to kommunegrupper som gjennomfører årlig, slik at hver kommune gjennomfører hvert andre år. Det må utredes nærmere om det lar seg gjøre å konstruere rullerende utvalg av kommuner som kan gi årlig informasjon på nasjonalt nivå, og om dataene lar seg sammenligne på tvers av kommuner. 

Prøven må være obligatorisk for alle elever på de aktuelle trinnene, for å sikre at alle skoler og skoleeiere får informasjon. Norge har for mange små kommuner til at det lar seg gjøre å konstruere utvalg som representerer alle kommuner, og det vil være umulig å lage utvalg på skolenivå. Dersom prøvene er frivillige på kommunenivå, risikerer vi større ulikheter mellom  skoleeieres arbeid med kvalitetsutvikling dersom noen velger å bruke prøvene, mens andre ikke gjør det.

I prosessen har vi vurdert om det kan være tilstrekkelig å gjennomføre prøvene hvert tredje år. Dette ville gitt skolene og kommunene anledning til å tenke mer langsiktig om bruken av prøveresultater i sin kvalitetsutvikling. Vi vet fra kunnskapsgrunnlaget at skoler og kommuner handler ut fra inneværende års resultater, og at det kan være mer utfordrende å bruke resultatene i en mer langsiktig planlegging og kvalitetsutvikling. 

Hovedårsaken til at vi ikke har anbefalt gjennomføring hvert tredje år er at vi med denne løsningen ville gjennomført prøvene på samme årskull gjennom skoleløpet. Læreplanen har kompetansemål på utvalgte trinn og vi har anbefalt at prøvene legges til disse hovedtrinnene, 4., 7. og 10. trinn.

5.1.2 Trinn og tidspunkt

Forslaget omfatter prøver på tre trinn, i tilknytning til kompetansemål i læreplanen. De tre målepunktene er 4., 7. og 10. trinn. Den første prøven vil måle elevenes ferdigheter i relasjon til kompetansemål etter 4. trinn, og gi informasjon som er relevant for tidlig innsats. Prøve 2 rettes mot kompetansemål etter 7. trinn, med formål om å gi informasjon om mellomtrinnet som kan være nyttig i overgangen mellom barnetrinn og ungdomstrinn. Begge prøvene legges tett opptil slutten av skoleåret. Den siste prøven relateres til kompetansemål etter 10. trinn, og legges så tett opptil avslutningen på grunnskolen som mulig, uten å kollidere med eksamen. 10. trinnsprøven vil dermed måle elevenes ferdigheter noen måneder før kompetansemålene skal være oppnådd, noe som må tas høyde for i prøveutviklingen.

5.1.3 Fag/ ferdighet

De nye nasjonale prøvene vil måle ferdigheter som er viktige for videre læring og samfunnsliv. Utgangspunktet er de grunnleggende ferdighetene, der styringsnivåene har få eller ingen andre kilder til informasjon om elevenes prestasjoner. Ferdigheter som lesing og regning har høy politisk oppmerksomhet, og har vært gjenstand for både nasjonale og lokale satsninger. Både skriftlige, muntlige og digitale ferdigheter er også sentrale i elevenes læring, og det må utredes videre hvilke ferdigheter som kan og bør inkluderes i en slik prøve. Det kan også utvikles delprøver innenfor ferdigheter eller fag som gjennomføres ved behov.

På det nasjonale nivået suppleres informasjonen fra de nye nasjonale prøvene med internasjonale undersøkelser, som PISA, TIMSS, PIRLS, ICCS og ICILS. Disse gir informasjon om fagområdene lesing, matematikk, naturfag, digitale ferdigheter, medborgerskap og demokratiforståelse, i stor grad samsvarende med innholdet i norske læreplaner. Innholdet i de nye nasjonale prøvene må sees i sammenheng med informasjonen man får fra disse undersøkelsene.

5.1.4 Innhold og oppgaver

Oppgavene i de nye nasjonale prøvene vil måle anerkjente indikatorer på ferdighetene prøvene omhandler. Det er viktig at de er så lite sensitive for kulturell kontekst som mulig, slik at de fungerer likt over hele landet. Prøvene vil bestå av lukkede oppgavetyper og vektlegge høy reliabilitet, for å gi presise målinger av ferdigheten, og legge til rette for måling av utvikling over tid (trend).

5.1.5 Analyse og rapportering

Data fra disse prøvene skal egne seg til komparative analyser, bruk i indikatorsett og sammenstilling med registerdata. I tillegg til brukerne på nasjonalt nivå, skoleeier- og skolenivå vil dataene fra de nye nasjonale prøvene også egne seg for forsknings- og utviklingsarbeid, og som kilde for andre aktører, som organisasjoner, UH-sektoren og media.

Resultatene rapporteres og offentliggjøres på nasjonalt-, kommunalt- og skolenivå.

Vi har, som nevnt i innledningen til dette kapittelet, vurdert om vi skulle anbefale at skolenivået ikke ble en del av rapporteringen. I tillegg til det vi beskrev innledningsvis om offentliggjøring og Offentlighetsloven, vil en konsekvens av å utelate skolenivået være at skoleeier og allmennheten ikke får direkte informasjon om tilstanden for hver enkelt skole fra disse prøvene. 

Skoleeierne trenger informasjon på skolenivå for å sikre oppfølging av tilstanden i kommunen og en rapportering på skolenivå gir mulighet til å følge med på skolenes utvikling over tid, både for skolen selv og for skoleeieren.

5.2 Progresjonsprøver

Disse prøvene gir informasjon til lærere, elever, foresatte og skoleledere. Resultatene herfra danner grunnlag for underveisvurdering og oppfølging av enkeltelever og elevgrupper.

Prøver som støtter underveisvurdering og måling av progresjon
FrekvensÅrlig
DeltakereFrivillig for alle
Trinn3., 5., 8. og Vg1
TidspunktHøst
Fag/ ferdighetEnkeltfag eller grunnleggende ferdigheter
Oppgaver

«Rike», gir mye informasjon, didaktisk verdi, utvides med
veiledningsmateriell

 Analyse/ rapporteringResultater rapporteres på elev- og gruppenivå.
Individuelloppfølging. Ingen publisering.
5.2.1 Frekvens og deltakelse

Progresjonsprøvene gjennomføres årlig, slik at alle elever i prinsippet har likeverdig tilgang til den støtten til individuell oppfølging prøvene gir. Prøvene er frivillige, men for å måle progresjon må samme elev gjennomføre på minst to etterfølgende målepunkt.

5.2.2 Trinn og tidspunkt

For progresjonsprøvene er det også trinnene med kompetansemål i læreplanen som er utslagsgivende for hvor prøvene legges. Disse prøvene vil gjennomføres på høsten etter trinn med kompetansemål, og legges på 3., 5., 8. og Vg1. Prøvetidspunktet tidlig høst gir god oversikt over elevenes ferdigheter ved oppstart av skoleåret, og god tid til oppfølging av resultatene.

5.2.3 Fag/ ferdighet

I del II argumenterte vi for at brukerne på klasseromsnivået har behov for informasjon om elevenes grunnleggende ferdigheter i begynneropplæringen. Disse vil derfor være naturlige områder å inkludere i prøvene på de første målepunktene. Hvilke ferdigheter som vektlegges, og i hvilken grad prøvene kan kombinere ulike ferdigheter, må utredes nærmere. Vi må også vurdere om behovet for å følge med på progresjon i de nye læreplanene heller tilsier at vi bør utvikle progresjonsprøvene i enkeltfag. I LK20/LK20S er progresjon vektlagt, og denne dimensjonen kan gi et behov for at prøvene bør utformes i enkeltfag for å støtte lærerne i vurderingsarbeidet i fagene.

Som vist i kunnskapsgrunnlaget, har vi positive erfaringer med å måle progresjon i regning, men for andre ferdigheter og fag må det utredes nærmere hvorvidt og hvordan dette kan gjøres.

5.2.4 Innhold og oppgaver

For brukerne av progresjonsprøvene er face validity av avgjørende betydning, altså at innholdet i prøvene blir sett på som dekkende og treffende for det de hevder å måle. At oppgavene har en stringent utforming som måler ferdighetsnivå veldig presist, er mindre viktig her enn for de nye nasjonale prøvene, selv om progresjonsprøvene selvsagt må ha tilfredsstillende psykometrisk kvalitet, ikke minst for å gjøre det mulig å måle progresjon. 

Ettersom resultatene skal tolkes og forstås av brukere som er nær elevene, kan prøvene inneholde åpnere oppgavetyper med større rom for tolkning og skjønn. Her blir det viktig med fyldig veiledningsmateriell som er godt tilpasset målgruppen, som støtter vurderingen av resultatene og inneholder informasjon om oppfølging og videreutvikling. Dette veiledningsmateriellet kan gjerne kobles med støttemateriell til LK20/LK20S for å tydeliggjøre sammenheng mellom prøvene og læreplanen. 

Med denne typen oppgaver som er beskrevet her, vil prøven også ha en didaktisk verdi for lærerne. Oppgavene inneholder ofte problemstillinger som egner seg godt for refleksjon og diskusjon i klasserommet. Dette er ikke hovedhensikten med progresjonsprøvene, men gitt prøvenes utforming vil de i stor grad ha en slik tilleggsverdi.

5.2.5 analyse og rapportering

Progresjonsprøvene genererer rapporter på elev- og gruppenivå til bruk for lærer i underveisvurdering, oppfølging og i dialog med elev/foresatt. Resultatene vil vise progresjon på  individnivå. For å ivareta en opplevelse av mindre press og stress for både elever og lærere, som beskrevet i innledningen til kapittel 5, vil resultatene ikke rapporteres oppover i systemet eller offentliggjøres. Resultatene vil imidlertid nyttiggjøres på skolenivå, ved å analysere og følge opp elevresultatene i en større sammenheng i lærerkollegiet og i skoleledelsen. Slik kan prøvene også ha en verdi for profesjonsfellesskapet.

6 Hvilke ferdigheter skal prøvene måle?

Prøvene vi har i dag, måler enten elevenes ferdighetsnivå relatert til en bekymringsgrense eller søker å gi informasjon om prestasjoner på alle nivåer. 

En prøve som måler alle nivåer av ferdigheten, vil gi noe informasjon om alle elevers nivå i motsetning til prøver som måler i relasjon til en bekymringsgrense. Dersom prøven også skal gi sikker informasjon om elevene som presterer høyest, kreves det flere av de aller vanskeligste oppgavene i alle prøver, noe som kan oppleves som negativt for elever som presterer på lavere nivåer. Vår erfaring med prøvene har vist at det er svært vanskelig å gi god informasjon om elever på det høyeste ferdighetsnivået. Oppgaver som er så vanskelige at kun et fåtall av elevene svarer riktig, og som måler den aktuelle ferdigheten og ikke andre forutsetninger, er krevende å utvikle. Vi ser rett og slett at det er få oppgaver i dagens prøver som måler godt «i toppen». 

En prøve som opererer med en bekymringsgrense for ferdigheten, er utviklet for å måle svært nøyaktig rundt denne grensen, og identifiserer hvilke elever som trenger tettere oppfølging. Gjennomføringstiden for disse prøvene er som regel kortere enn for en prøve som måler hele ferdigheten. Oppgavene er svært lette, og de fleste elevene vil oppleve mestring. Prøven vil imidlertid ikke gi informasjon om elever som har et ferdighetsnivå over det som defineres som bekymringsgrensen. Man kan også tenke seg en prøve som måler i toppen av ferdigheten som er utviklet for å gi mye informasjon om høytpresterende elever, men en slik prøve må målrettes mot den aktuelle elevgruppa. 

For støtte til styring og kvalitetsutvikling vil det være naturlig å tilby informasjon om elever på alle ferdighetsnivåer. Unntakene kan være ved særlige satsninger, for eksempel tidlig innsats, eller rettet mot elever med høyt prestasjonsnivå. Disse satsningene kan være på lokalt eller nasjonalt nivå. For støtte til underveisvurdering er det også nyttig med informasjon om alle elevers ferdighetsnivå. Prøver som sikter seg inn mot deler av ferdighetsnivåene, kan være relevante i mer målrettede gjennomføringer for utvalgte elever. En annen løsning for å oppnå dette formålet kan være å konstruere prøvene slik at de er en «bank» av oppgaver som læreren kan plukke fra ved behov. Denne metoden gir større muligheter for fleksibilitet og tilpasning til målgruppe, men vil ikke gi informasjon om elevers progresjon.

6.1 Adaptivitet

Ved å gjøre prøver adaptive, vil alle elever bli tildelt oppgaver tilpasset egne ferdigheter. Da kan man i større grad måle alle nivåer av ferdigheten uten at elever må gjennomføre prøver som er altfor lette eller vanskelige ut fra deres forutsetninger. For å oppnå dette, kreves det imidlertid et omfattende utviklingsarbeid, ettersom det er et område der vi har forholdsvis lite erfaring. Det mest aktuelle designet å prøve ut er et blokkdesign, der oppgavene kommer i «blokker» og elevene styres videre til neste blokk avhengig av hvordan de skårer.

Problemstillinger som er viktig å utrede grundig, er blant annet om og hvordan progresjon kan måles i en adaptiv modell, og hvordan vi kan generere data som egner seg til aggregering og komparative analyser brukerne har behov for. Det er også viktig å sikre at modellen ikke blir så kompleks at resultatrapportene blir vanskelige å bruke og forstå for brukerne.

6.2 Vår vurdering om ferdighetsnivå

Som vi har gjort rede for i kapittel 6, er det flere utfordringer med å ha oppgaver i prøvene som er så vanskelige at de retter seg mot å måle ferdighetsnivået til elever som presterer høyt. Utfordringene knytter seg både til at vi har erfaring med at slike oppgaver er vanskelige å utvikle, og at mange elever utsettes for oppgaver de ikke har forutsetninger for å løse. I kunnskapsgrunnlaget ser vi at slike brukererfaringer om tapsfølelse er en av de største etiske og omdømmemessige utfordringene vi har med dagens nasjonale prøver. De høytpresterende elevene er selvsagt en gruppe det er viktig å ivareta, men det å gi informasjon om «toppen» av ferdigheten bør ivaretas av andre verktøy enn prøver.

Adaptivitet er som beskrevet et område vi har lite erfaring med og kunnskap om. Det er imidlertid en metodikk det knyttes store forventinger til og som er premissendrende for mye av det som er beskrevet i dette dokumentet. I brev av 18.06.2018 fra Kunnskapsdepartementet er det å prøve ut adaptivitet ett av tiltakene. Vi foreslår å starte utredning og utprøving av adaptivitet i tilknytning til prøver som skal brukes til kvalitetsutvikling og styring, ettersom det å kombinere adaptivitet og progresjon sannsynligvis er en mer kompleks problemstilling.

7 Forslag til videre prosess

Med dette dokumentet foreslår vi en prosess som skal føre fram til fremtidens prøver. Det er viktig at denne prosessen involverer brukere og berørte parter på en god måte, for å sikre god forankring i sektoren og bevare prøvefeltets legitimitet. Vi anbefaler fortsatt bred involvering av representanter for brukernivåene, samt å innhente innspill fra eksterne aktører som benytter prøvedataene. Vi anbefaler også å involvere relevante fagmiljøer fra UH-sektoren og lærerutdanningsinstitusjoner. 

Å utvikle gode prøver krever tid. Dagens prøver har vanligvis en utviklingssyklus på to år, inkludert utvikling av prøvekonstrukt, utprøving av oppgaver og ferdigstilling av endelig prøve med veiledningsmateriell. I den følgende fremdriftsplanen tar vi utgangspunkt i at vi mottar oppdrag om utvikling av prøver innen utgangen av 2020. Tidslinjen er et foreløpig anslag og må konkretiseres etter beslutning om videre prøveutvikling er tatt. 

Tidslinje
TidspunktHendelse
Q4 2020Oppdrag om utvikling av nye prøver
2021
  • Utredning og utvikling av rammeverk
  • Utlysning oppdrag om prøveutvikling
Q3 2022Sluttutprøving progresjonsprøver
Q1/Q2 2023Sluttutprøving nye nasjonale prøver
Q3 20231. gjennomføring progresjonsprøver
Q1/Q2 20241. gennomføring nye nasjonale prøver

Fagfornyelsen er en viktig premissgiver for dette forslaget til fremtidens prøver. De nye prøvene vil imidlertid ikke være klare til bruk i skolen før skoleåret 2024/2025, flere år etter iverksettelsen av nye læreplaner. I dialogen med brukerne blir det viktig å kommunisere tydelig at dette har sammenheng med kravene til kvalitet i utviklingen av standardiserte prøver, og at vi vil være sikre på at prøvene fungerer etter intensjonen. 

Vi understreker at tidslinjen er tentativ. Det kan være mulig å utvikle nye nasjonale prøver noe raskere enn progresjonsprøvene dersom de nye nasjonale prøvene skal utvikles etter et liknende rammeverk som dagen nasjonale prøver. Videre er det aktuelt å diskutere om det er hensiktsmessig med en pause i gjennomføringen av nasjonale prøver for å indikere et brudd og få tid til å utvikle nye nasjonale prøver.

Oppsummering

I dette dokumentet har vi beskrevet en mulig vei å gå for å videreutvikle prøvefeltet i en mer treffsikker og brukerorientert retning. Med bakgrunn i de gode erfaringene og den nyttige lærdommen fra feltet, tar vi en helhetlig tilnærming til brukernes behov for informasjon, og foreslår en sammensetning av prøver som imøtekommer disse best mulig. 

Informasjon fra prøvefeltet er en verdifull kilde til informasjon for brukere på alle nivåer i utdanningssystemet. Med fagfornyelsen øker behovet for å få informasjon om elevenes progresjon. Prøver av høy kvalitet som støtter underveisvurdering og måler progresjon vil være et viktig verktøy for lærerne i klasserommet og gi nyttig informasjon til elever og foresatte. For å drive kvalitetsutvikling på skole-, skoleeier- og nasjonalt nivå hentes data inn ved hjelp av prøver som er spesielt utviklet for dette formålet. 

Det er et overordnet forslag som blir presentert i dette dokumentet. Vi lar også noen større spørsmål stå ubesvart, kanskje først og fremst knyttet til hvilke ferdigheter eller fag prøvene skal måle. En videre prosess som legger til rette for involvering av brukerne og andre relevante aktører er nødvendig for å ta gode, kunnskapsbaserte beslutninger, både fra et faglig og et politisk ståsted. Vi er imidlertid trygge på at dette forslaget beskriver riktig retning å gå i for å ivareta brukernes behov på best mulig måte, og at det utgjør et godt utgangspunkt for en konkretisering og utarbeiding av fremtidens prøvefelt.