Prøver i fagfornyelsen - hvilke behov skal prøvene dekke?

Del 1: nytte og bruk av ulike prøver

I del 1 gir vi en introduksjon til dagens prøver og oppsummerer kunnskapsgrunnlaget.

1 Introduksjon til dagens prøver

Nasjonale prøver ble første gang innført i 2004 for å dekke et behov for mer systematisk innhenting av elevenes læringsutbytte. Prøvene ble innført som en del av det nasjonale kvalitetsvurderingssystemet, NKVS.

I St.prp.nr.1 (2002-2003) skisseres prøvenes formål og bruk:
"Departementet mener at prøvene skal kunne dekke ulike formål. De skal både gi beslutningstakere på ulike nivåer i utdanningssektoren grunnlag for å iverksette nødvendige tiltak i sektoren, og elever og deres foresatte bedre grunnlag for å stille krav og/eller medvirke til forbedringer i opplæringen.

Prøvene skal også kunne brukes pedagogisk og forutsetter derfor tilbakemelding til skoleeier, skoleledere og lærere som grunnlag for forbedrings- og utviklingsarbeid på det enkelte lærested, og til den enkelte elev og elevens foresatte som grunnlag for elevens læring og utvikling. […] Prøvene skal utformes slik at de gir grunnlag for å vurdere utviklingen over tid, både på nasjonalt nivå, skoleeiernivå, skolenivå og elevnivå.”

De første nasjonale prøvene ble gjennomført i 2004 og 2005. Prøvene ble gjennomført på våren på 4., 7. og 10. trinn samt grunnkurs (vg1), i skriving, lesing, matematikk og engelsk. For å gjøre prøvene obligatoriske, var det nødvendig med en forskriftsbestemmelse. Denne kom i 2004 og omhandlet nasjonale prøver innenfor områdene lesing, skriving, matematikk og engelsk. Bestemmelsen kom til som en del av det nasjonale kvalitetsvurderingssystemet (NKVS).

I Ot.prp.nr. 80 (2002-2003)5 fremgår blant annet følgende:
«For å fremskaffe den nødvendige informasjon i forbindelse med opprettelsen av et nasjonalt system for kvalitetsvurdering må elevene kunne pålegges å delta i prøver, brukerundersøkelser og lignende. Skolene må kunne pålegges å rapportere data, også på individnivå. Opplysninger om læringsresultater på individnivå er en forutsetning for å kunne beregne sentrale kvalitetsindikatorer for skole og skoleeier. Data på individnivå vil også bli anvendt i forskning og derved bidra til et bedre kunnskapsgrunnlag for å iverksette tiltak lokalt og nasjonalt. Departementet presiserer at behandling av personopplysninger er regulert av personopplysningsloven, som blant annet sørger for at elevenes anonymitet er sikret.»

En evaluering av prøvegjennomføringen i 2005, Nasjonale prøver på ny prøve (ILS, 2005), viste at prøvenes kvalitet ikke var tilfredsstillende for verken pedagogisk bruk eller kvalitetsvurdering. Prøvene ble derfor stoppet, og oppdraget om nasjonale prøver endret. 

I oppdragsbrev fra KD til Udir, datert 23.5.2006, ble en ny generasjon nasjonale prøver beskrevet. Denne beskrivelsen er grunnlaget for dagens prøver 

“De nasjonale prøvene skal kartlegge om elevenes ferdigheter er i samsvar med læreplanens mål for de grunnleggende ferdighetene regning og lesing på norsk og engelsk, slik de er integrert i kompetansemål for fag i LKO6 etter 4. og 7. årstrinn. Prøvene skal gi informasjon til elever, lærere, foresatte, skoleeiere, de regionale myndigheter og det nasjonale nivået som grunnlag for forbedrings- og utviklingsarbeid.

Det er et stort behov for faglig veiledning om bruk av de nasjonale prøver og kartleggingsprøver.Det er også behov for støttemateriell og gode rapporter til bruk ved vurdering og oppfølging av prøvene. Målgruppene er både den enkelte lærer, skole, skoleeier og lærerutdanningen. Det er behov for å tilpasse materiellet til ulike målgrupper. Direktoratet bes om å ta ansvar for arbeidet med faglig veiledning og støttemateriell og at dette koordineres med fagmiljøene.”

Prøvene ble flyttet til høsten og skulle gjennomføres på 5. og 8. trinn i lesing, regning og engelsk. Som følge av denne endringen måtte også forskriften om prøvegjennomføring endres. Referansen til de konkrete prøvene fra 2004 ble tatt ut, og forskriften ble endret til en mer generell formulering. I 2006 ble ny forskrift til Opplæringsloven § 2-4 vedtatt, og denne bestemmelsen gjelder fortsatt for de obligatoriske prøvene:

§ 2-4. Prøver, utvalsprøver og andre undersøkingar: Elevar skal delta i prøver, utvalsprøver og andre undersøkingar fastsette av departementet. Skoleeigaren skal sørgje for at dette blir gjennomført.

I brevet med oppdraget om nye nasjonale prøver ble også oppdrag om utvikling av kartleggingsprøver gitt, disse skulle identifisere elever med behov for ekstra oppfølging. I første omgang skulle det utvikles obligatoriske prøver i lesing og regning på 2. trinn. Senere har det blitt utviklet prøver på flere trinn og i flere ferdigheter og fag.

I brevet fikk Udir videre i oppdrag å vurdere utvalgsprøver, i første omgang i skriving. Senere har det blitt utviklet flere utvalgsprøver i både fag og ferdigheter. Etter gjennomføring på et utvalg analyseres resultatene og prøvene blir tilbudt som frivillige prøver. Disse prøvene har fått navnet karakterstøttende og læringsstøttende prøver. 

Utviklingen av prøvesystemet slik vi kjenner det i dag har utgangspunkt i nevnte oppdragsbrev fra 2006. Flere oppdragsbrev har senere skissert nye prøver og utvikling innenfor en prøvetype. 

Sentrale utviklingsområder som kan nevnes er:

  • Overgang fra papirprøver til digitale prøver (gjelder alle prøver)
  • Måling av trend / utvikling over tid på nasjonale prøver
  • Utvikling av funksjonelle resultatrapporter i prøveadministrasjonssystemet (gjelder alle prøver)

Nasjonale prøver er fortsatt en sentral del av det nasjonale kvalitetsvurderingssystemet (NKVS). Nasjonale prøver sammen med Elevundersøkelsen og andre lokale data utgjør det sentrale kunnskapsgrunnlaget for skoleeiernes årlige tilstandsrapport, jf. opplæringsloven §13-10.

1.1 Oversikt over dagens prøver

Dagens prøvesystem har fire ulike prøvetyper:

  • Nasjonale prøver (NP): Skal gi kunnskap om elevenes grunnleggende ferdigheter i lesing, regning og engelsk. Informasjon fra prøvene skal danne grunnlag for underveisvurdering og kvalitetsutvikling på alle nivå i skolesystemet.
  • Kartleggingsprøver (KP): Skal hjelpe skolene å finne de elevene som trenger ekstra hjelp i løpet av de første skoleårene.
  • Læringsstøttende prøver (LS): Kan brukes som et verktøy i underveisvurderingen og gi læreren grunnlag for læringsfremmende tilbakemeldinger.
  • Karakterstøttende prøver (KS): Kan brukes som støtte i underveisvurderingen og bidra til å se underveisvurdering og sluttvurdering i sammenheng.

Tabell 1: Oversikt over dagens prøver 

Tabell som viser de ulike prøvetypene, på hvilke trinn disse prøvene ligger, og hvilke fag/ferdigheter prøvene måler.

Tabellen viser de ulike prøvetypene, på hvilke trinn disse prøvene ligger, og hvilke fag/ferdigheter prøvene måler. Oransje bokser betyr at prøvene er obligatoriske, mens grønne bokser betyr at prøvene er frivillige.

1.2 Hvem er interessentene?

De ulike prøvetypene gir informasjon til ulike nivåer i skolesystemet.

 

Tabell 2: Hvem får informasjon fra prøvene?
PrøvetypeHvem får informasjon fra prøvene?
Nasjonale prøver

Stat, kommune/skoleeier, skole, lærere, foresatte og elever,
samt at forskere kan søke om å få bruke resultatene i egen
forskning

Kartleggingsprøver

Skole, lærere, foresatte og elever. Skoleeier kan be om å få
resultatene fra den enkelte skole.

Læringsstøttende
prøver
Skole, lærere, foresatte og elever
Karakterstøttende prøverSkole, lærere, foresatte og elever

I tillegg til de som får direkte informasjon, er det også andre interessenter, som for eksempel: Media, politikere på ulike nivåer, KS, NHO, fagforeninger innen skole, Elevorganisasjonen,
interesseorganisasjoner som Dysleksi Norge og Blindeforbundet, lærerutdanningsinstitusjoner og læremiddelprodusenter.

1.3 Kort om prøveutvikling

Dagens prøver er utviklet på oppdrag fra Kunnskapsdepartementet. Udir utarbeider avtaler med eksterne fagmiljø som utvikler prøver ut fra et fastsatt rammeverk for prøveutvikling som beskriver formål, innhold, tekniske krav, gjennomføring og oppfølging av resultater. 

For de nasjonale prøvene foregår utviklingsarbeidet kontinuerlig, da det lanseres nye prøver hvert år. Kartleggingsprøvene og karakter- og læringsstøttende prøver nyutvikles ikke hvert år, men har en varighet på om lag fem år. Utvikling av en prøve, uavhengig av prøvetype, tar vanligvis ca. to år. Dette inkluderer utarbeidelse av prøvekonstrukt (beskrivelse av det prøven skal måle), utvikling av oppgaver, flere utprøvinger, analyse og utarbeidelse av veiledningsmateriell.

Etter hver prøvegjennomføring foretar de eksterne fagmiljøene og Udir analyser av resultatene. Disse bearbeides, presenteres og publiseres i ulike resultatvisninger som gir informasjon tilpasset de ulike brukergruppene og formålet med prøvene.

2 Kunnskap om nytte og bruk av prøvene

Forut for arbeidet med denne rapporten har vi gjennomført brukerinnsiktsprosjekter, samlet rapporter fra fagmiljøer og organisasjoner, og utført en litteraturgjennomgang på prøvefeltet i Norge. Vi har også gjennomført medieanalyser, som for det meste har omhandlet nasjonale prøver. Det samlede kunnskapsgrunnlaget ligger til grunn for arbeidet med en helhetlig plan for fremtidens prøvefelt.

I dette kapitlet gir vi en oppsummering av kunnskapsgrunnlaget.

2.1 Kvalitetsgjennomgang prøvefeltet (2017) – et brukerinnsiktsprosjekt

I 2017 gjennomførte Udir brukerinnsiktsprosjektet «Kvalitetsgjennomgang prøvefeltet». Målet med prosjektet var å få innsikt i brukernes opplevelse av nytteverdi fra prøvene. Prosjektet ble gjennomført dels med tjenestedesigntilnærming (spørreundersøkelse, observasjon og intervjuer på skoler og hos skoleeiere) og dels med en mer innspills-/høringsmetode (møter med og innspillsnotater fra UH-miljøer og organisasjoner).

Mange brukergrupper er representert med sin stemme i dette prosjektet: Elever, lærere, skoleledere, skoleeiere, UH-miljøer, organisasjoner som Elevorganisasjoner, Utdanningsforbundet, faglig råd for PPT og forlag.

Hovedfunn fra kvalitetsgjennomgangen:

  • Brukerne har høy tillit til prøvene, men formålet bør rendyrkes: Lærere opplever at prøvene viser en standard for hvor elevene bør ligge, og at prøveresultatene gir bekreftelse på egen vurdering. Formålet med kartleggingsprøvene misforstås av en del, noe som gir lærer og skole galt inntrykk av nivået på elevmassen.
  • Lærerne savner bedre verktøy for å måle progresjon: Lærere og skoler har få eller ingen verktøy for å følge elevenes faglige progresjon, og etterspør prøver som bygger på hverandre, der resultatene kan sammenlignes og ses opp mot læreplanene.
  • Opplevd nytte av prøvene avhenger av skolens ledelse: Lærernes opplevde verdi og nytte av prøvene avhenger sterkt av skoleledelsens fokus på, og vilje til, å sette rammer for oppfølging av resultatene.
  • One size doesn’t fit all: Det er behov for større tilpasning i kartleggings- og vurderingsverktøyene. Elevene med lav måloppnåelse sitter igjen med en tapsfølelse, mens det er vanskelig å identifisere elever med stort læringspotensial. Adaptive tilnærminger tiltrekker interesse.
  • Prøvene måler ikke alltid det de skal måle: Ord, begreper, tekstmengde og oppgaver i prøvene fører i en del tilfeller til at elevens språkferdigheter, ordforråd, leseferdigheter eller kulturelle bakgrunn hindrer eleven i å forstå hva oppgaven spør etter. Flere er usikre på reglementet for fritaksvedtak.
  • Eksamen (som redskap for underveisvurdering) styrer på ungdomstrinnet og i vgo: Lærerne opplever at prøvene ikke støtter opp om deres undervisning som forbereder elevene til eksamen. Ved videregående skoler og til dels ved ungdomsskoler er eierskapet til prøveresultatene lavt, sammenlignet med i barneskolen.
  • Det er behov for mer og bedre analysekompetanse i skolen: Flere skoleledere og lærere vet ikke helt hvordan de skal nyttiggjøre seg av prøveresultatene, og mange etterspør enda mer konkret hva elevene ikke mestrer, og forslag til tiltak og oppgaver for å følge opp enkeltelever og til bruk i klasserommet.
  • Digitale prøver fordrer gode og brukervennlige systemer: Stor positivitet til digitale prøver og læringsverktøy for alle elever, gitt at kvaliteten og brukeropplevelsen er god.

Ut fra brukerinnsikten ble det utledet tre beskrivelser for fremtidens prøver:

  1. Motivasjon og mestring – gi elevene utfordringer som er tilpasset deres faglige nivå slik at de opplever mestring.
  2. Sammenheng mellom prøver og læreplaner – være en ressurs for skoler og skoleledelse i arbeidet med å planlegge, gjennomføre og vurdere opplæringen
  3. Progresjon og oppfølging – gi lærere og skole grunnlag for å følge elevenes progresjon og avdekke behov for tidlig innsats

2.2 Litteraturgjennomgang på prøvefeltet

I 2019 gjennomførte vi en litteraturgjennomgang på prøvefeltet i Norge. Oppdraget ble utført av to eksterne forskere, og de søkte etter litteratur og prosjekter som ga informasjon om prøvene fra de siste 15 årene. Totalt er 81 publikasjoner gjennomgått.

Litteraturgjennomgangen har tatt utgangspunkt i ulike brukergruppers bruk og nytte av prøver som tilbys fra nasjonalt nivå. Hensikten var å utvikle vårt kunnskapsgrunnlag med tanke på å utarbeide en helhetlig plan for fremtidens prøvefelt. Sammendraget av litteraturgjennomgangen er organisert etter de ulike prøvetypene.

Nasjonale prøver

I litteraturgjennomgangen ble det funnet 50 publikasjoner som tar for seg nasjonale prøver. Det vises også til at forskningen har viet mest oppmerksomhet til nasjonale prøver i lesing. En forklaring på at de nasjonale prøvene er dominerende, kan være at de har vært obligatoriske og stabile siden innføringen av Kunnskapsløftet i 2006. Det vises også til at forskningen har viet mest oppmerksomhet til nasjonale prøver i lesing.

I litteraturgjennomgangen blir det påpekt at selv om rammeverkene for prøvene og selve prøvekvaliteten har utviklet seg i positiv retning, så gjenstår det en del arbeid for å hjelpe lærere og skoler til å nyttiggjøre seg informasjonen som de ulike prøvene gir. Oppfatningen av formålet med nasjonale prøver, og hvordan resultatene av prøvene skal benyttes i etterkant er ulikt fra skole til skole. Noen skoler har ikke en klar oppfatning av målet med bruk av nasjonale prøver, mens andre skoler har klare formål om at resultatene skal brukes i underveisvurderingen.

Flere av forskningsartiklene og masteroppgavene i litteraturgjennomgangen påpeker at mange informanter tror at nasjonale prøver bidrar til sammenligning og konkurranse mellom skolene. De er redde for at dette kan føre til at fokuset blir flyttet til prøveresultatene, og ikke elevens læringsprosess.

De fleste funnene omhandler nasjonale prøver brukt i læringsarbeid i klasserommet, mens det er lite forskning på nasjonale prøver til bruk til kvalitetsutvikling og styring. 

Kartleggingsprøver

I litteraturgjennomgangen ble det funnet åtte publikasjoner som omhandler kartleggingsprøver. Det som særlig kommer fram, er at det er vanskelig for skolene å nyttiggjøre seg disse prøvene. Ikke alle lærere hadde god nok forståelse av prøveformatet og hensikten med prøvene. Oppfølgingen ble ofte overlatt til den enkelte lærer, og der skolens ledelse ikke sørget for gode systemer og forvaltning av ressurser, ble det ofte tilfeldig hvorvidt elever ble fulgt opp. Gjennomgangen viser at bruken av prøvene må bli bedre for at de skal kunne bidra til utvikling av elevenes ferdigheter.

Læringsstøttende og karakterstøttende prøver 

Det var kun to publikasjoner på læringsstøttende prøver. Der ble det påpekt at læringsstøttende prøver er verdifulle for lærere med flerspråklige elever, siden prøvene gir en oversikt over mangler ved elevenes vokabular. Det ble samtidig pekt på at prøvene var vanskelige for mange elever, og at flere av elevene ga opp under prøven. 

I litteraturgjennomgangen var det ingen funn på karakterstøttende prøver.

2.3 Utvalgte studier

Vi har i tillegg til å oppsummere litteraturgjennomgangen valgt å beskrive fire prosjekter spesielt. Det er Evaluering av nasjonale prøver som system utført av Nordisk institutt for studier av innovasjon, forskning og utdanning (NIFU), Practices of Data Use in Municipalities and Schools (PraDa-prosjektet) og Ann Elisabeth Gunnulfsens doktorgradsarbeid som begge omhandler bruk av elevresultater, og til slutt prosjektet Vertikalt lenkedesign for de nasjonale prøvene i regning for 5.- 8. trinn ved Nasjonalt senter for matematikk i opplæringen og Center for Educational Measurement (CEMO).

2.3.1 Evaluering av nasjonale prøver som system (2013)

Nordisk institutt for studier av innovasjon, forskning og utdanning (NIFU) gjennomførte i 2013 en evaluering av nasjonale prøver. Formålet med evalueringen var å skaffe et bredt kunnskapsgrunnlag som kan brukes av flere nivåer, som et grunnlag for videre diskusjoner og videreutvikling av administrasjonen og gjennomføringen av nasjonale prøver. Undersøkelsen omhandler ikke det faktiske innholdet eller kvaliteten i de nasjonale prøvene, men redegjør for nasjonal og lokal praksis og holdninger til prøvene. Mange av funnene er i tråd med annen forskning, slik som at skoleledere er mer positive til nytten av prøvene enn hva lærerne er. Nasjonale prøver synes likevel å ha blitt en del av arbeidet for å styrke elevenes grunnleggende ferdigheter på de fleste skoler.

Skoleeier og lærere sier at prøvene i all hovedsak forberedes og gjennomføres i tråd med intensjonene. Skoleeierne og lærerne svarer i undersøkelsen at det er skolen, og fremfor alt lærerne, som avgjør hvor mye tid som skal brukes på forberedelser til nasjonale prøver. Det er et mindretall av lærerne på mellomtrinnet som legger annen undervisning til side for å forberede elevene på prøvene.

De fleste skoleeierne oppgir at de vurderer resultatet av prøvene som viktig for utviklingen av grunnskolen i kommunen. Likevel er det et skille mellom Østlandet og resten av landet, når det gjelder engasjement og vurdering av prøveresultatenes betydning, der Østlandet er mer engasjert enn resten.

2.3.2 Elevresultater - mellom kontroll og utvikling (PRADA 2017)

I PraDa-prosjektet (Practices of Data Use in Municipalities and Schools) har forskerne Guri Skedsmo, Sølvi Mausethagen og Tine S. Prøitz undersøkt bruk av elevresultater i norske skoler og kommuner i perioden 2014 til 2017. I prosjektet undersøker forskerne spesielt hvordan resultater fra nasjonale prøver tas i bruk av lærere og skoleledere og av skoleansvarlige i kommunen.

Funnene fra de kvalitative og kvantitative undersøkelsene diskuteres ut fra begrepene kontroll og utvikling på ulike nivåer i skolesystemet. Nasjonale prøver brukes som en sentral kilde, og forskerne begrunner dette i de politiske intensjonene med nasjonale prøver, som signaliserer en politisk forventning om både kontroll og utvikling. 

Funnene fra skoleeiernivået viser at kommunens strukturelle og organisatoriske faktorer, sammen med skoleansvarliges styringsstil, har betydning for hvordan resultatene følges opp, og i hvilken grad kontroll eller utvikling vektlegges. Forskerne finner at kommunene gjør ulike valg ut fra kommunenes lokale mål og vektlegger resultater og ansvaret for resultatene ulikt i møtet med skoleledere og lærere, og dette får konsekvenser for utformingen av skolens og kommunenes utviklingsarbeid.

Noen av funnene fra skolenivået er at nasjonale prøver har vært med på å introdusere en ny type organisasjonsrutine i skolen, «resultatmøtet». Resultatmøtet er et møte om resultater som skjer mellom skoleleder og lærere. Forskerne finner at skolelederne benytter seg av det de kaller «likhetsfremmende strategier» og «forenklingsstrategier» i dialogen med lærerne. Skolelederne jobber i stor grad for å oppnå konsensus i møtene heller enn å dyrke frem diskusjoner og utforske ulike meninger.

Videre viser funnene i PraDa at denne likhetsfremmende praksisen ser ut til å handle om å plassere problemene på utsiden av lærernes praksis heller enn å diskutere lærernes og skolens undervisning. Problemer blir omtalt i mer generelle ordelag og er lite preget av diskusjoner om grunnleggende spørsmål, både når det gjelder eksisterende undervisning og prøvene i seg selv. Forskerne viser til at løsninger ofte er mer behagelig og mer tilfredsstillende å diskutere enn problemer. Dette kan føre til at bruken av elevresultater på skolenivå blir preget av kortsiktighet og enighet. Forskerne viser til at dette ikke nødvendigvis er et problem i seg selv, men at kortsiktige tiltak ikke nødvendigvis er til det beste for elevene dersom de ikke etterfølges av en mer langsiktig plan og kritisk diskusjon om resultatene og bruken av dem.

PraDa-prosjektet viser tydelig at det er ulike forståelse og bruk av elevresultater på alle nivå i norsk skole, og at valgte praksis og ansvarstilnærming får betydning for utformingen av utviklingsarbeidet i skolen og kommunen.

2.3.3 Micro policy making in schools (2018)

I Ann Elisabeth Gunnulfsens doktorgradsarbeid, Micro Policy Making in Schools. Use of National Test Results in a Norwegian Context, 2018, kommer det blant annet fram at vi vet lite om hvordan skoler egentlig bruker resultater på nasjonale prøver for å forbedre elevers læring. Gunnulfsen har basert seg på et utvalg av fire skoler i samme kommune. Dette er et lite utvalg, og funnene må betraktes i lys av det.

Ingen av skolene i Gunnulfsens utvalg uttrykte negative holdninger til de nasjonale prøvene, og de var heller ikke opptatte av medias publisering av resultatene. Resultatene ble diskutert på skolenivå eller gruppenivå. Den enkelte elevs læring var ikke i fokus. Derimot brukte de mye tid på å diskutere hva som bidrar til god læring og undervisningspraksis generelt.

Gunnulfsen ga også ut en artikkel sammen med Astrid Roe i november 2019, der et av funnene er at jo mer kunnskap lærerne hadde om hvordan resultatene kunne brukes, jo mer brukte de dem, og jo mer positive var de til verdien av dem. Den viste også at jo mer kunnskap lærerne oppga at de hadde om prøvene jo bedre mente de prøvene fungerte i arbeidet med den enkelte elevs læring. Det var ulike meninger om i hvilken grad prøveresultatene bidro til ny innsikt i elevenes kompetanse. Her mente 30 prosent at de i liten eller ingen grad bidro, mens like mange mente at de i stor eller svært stor grad bidro.

2.3.4 Vertikalt lenkedesign for de nasjonale prøvene i regning 5. - 8. trinn (2020)

Våren 2018 ble Nasjonalt senter for matematikk i opplæringen (Matematikksenteret) tildelt et tilleggsoppdrag av Utdanningsdirektoratet knyttet til de nasjonale prøvene i regning. Formålet med tilleggsoppdraget var å undersøke om de nasjonale prøvene i regning egner seg til å fungere som «[…] robuste indikatorer for enkeltelevers utvikling av grunnleggende ferdigheter i regning over tid.»

Matematikksenteret, i samarbeid med Centre for Educational Measurement ved Universitetet i Oslo (CEMO), implementerte en vertikal lenke-pilot høsten 2018 for å undersøke om det er forsvarlig å koble sammen de nasjonale prøvene i regning. Hensikten med piloten var å undersøke om konstruktene som måles av prøven i regning for 5. og 8. trinn er såpass like at det er forsvarlig å plassere skårene fra prøvene på en felles skala.

Matematikksenteret konkluderer i sin rapport til Udir (april 2020) med at regneferdigheter, slik dette blir målt i de nasjonale prøvene, reflekterer et felles overordnet konstrukt, og ikke separate unike konstrukter for de to trinnene. De vurderer at overlappet mellom trinnene, både med tanke på ferdigheter og det målte konstruktet, åpner for en rekke muligheter. Blant annet at det kan være gunstig å utvikle oppgavebanker som er delt på tvers av trinn, både for å redusere arbeidsomfanget knyttet til oppgaveutvikling, og for å ha oppgaver tilgjengelig for flere ferdighetsnivåer. En annen mulighet kan være å åpne for at lærere og skoler kan benytte oppgaver/prøver ved andre tidspunkter enn de obligatoriske måletidspunktene. En slik mulighet vil gjøre det mulig for skoler å måle progresjonen til grupper med elever over tid, en mulighet som skoler per dags dato ikke har tilgjengelig instrumenter for.

2.4 Prøver i media

Det er spesielt nasjonale prøver som er omtalt og diskutert i media de siste 15 årene. Vi kan oppsummere utviklingen på følgende måte:

  • Kaos: De første nasjonale prøvene 2004-2005 var preget av kaos, boikott og mye kritikk i mediene. Det ble innført et pauseår i 2006 for å bygge nye nasjonale prøver og blant annet flytte gjennomføringen til høsten.
  • Rangering og kvalitetsdiskusjon: De første årene etter 2007 var mediene preget av at både nasjonale og lokale medier publiserte rangeringstabeller og artikler med beste og verste skoler/kommuner. Mediene publiserte også flere artikler med innhold som var kritisk til nasjonale prøver som system og at prøvene kunne av mange bli oppfattet som et enkelt svar på skolekvalitet. På den positive siden kan vi finne artikler som viser at det er nødvendig med offentliggjøring for å utvikle en mer transparent skolesektor og at prøvene er et egnet virkemiddel for å drøfte skolekvalitet på tvers i landet.
  • Skolekvalitet lokalt: De siste årene har vi sett et mediebilde som i mindre grad er preget av saker i nasjonale medier, men heller at lokale medier diskuterer skolekvalitet på bakgrunn av resultatene fra nasjonale prøver
  • Temadebatter: Noen gjengangere har preget mediebildet:
    • Juks og press: Magnus Marsdal utga i 2011 boken Kunnskapsbløffen - skoler som jukser, barn som gruer seg (Manifest forlag). Hovedbudskap i boken var at norsk skole kjennetegnes av prestasjonstester og at det foregår utbredt juksing på nasjonale prøver i utvalgte kommuner (Oslo og Sandefjord blir spesielt navngitt som juksere). Dette skapte sterk debatt og debatten har tidvis blitt gjentatt i ulike former etter 2011. Debatten om juks har dabbet av, men debatten om barn som gruer seg og kommuner som bruker resultatene til sterk styring har fortsatt.
    • Barn med lesevansker og synsutfordringer: Dysleksi Norge og Blindeforbundet har i flere år diskutert hvilken utfordring nasjonale prøver er for elever med behov for spesifikke hjelpemidler. Debatten har i stor grad handlet om elever med lesevansker og nasjonale prøver i lesing.
    • Utvalgsprøver: Både Utdanningsforbundet og enkelte politiske partier har i media ytret begrunnelser for at nasjonale prøver ikke bør gjennomføres i fullskala, men som utvalgsprøver. De argumenterer for at utvalgsprøver gir god nok informasjon til nasjonalt nivå og at fullskalaprøver er for tidkrevende. Debatten har eskalert det siste året, og i 2020 har debatten endt i en behandling i Stortinget (april 2020), der utfallet var at nasjonale prøver fortsatt skal være fullskalaprøver.

Mediebildet for prøvefeltet har i stor grad handlet om nasjonale prøver. Kartleggingsprøver har vært mindre debattert, og karakter- og læringsstøttende prøver har ikke vært debattert i media. Årsaken til dette er i stor grad fordi det er kun nasjonale prøver som blir analysert nasjonalt og offentliggjort.