Många människor har mycket starka åsikter om standardiserade provs roll i utbildningen. Vissa anser att de ger ett opartiskt sätt att fastställa en individs kognitiva färdigheter samt kvaliteten på en skola eller ett distrikt. Andra anser att resultat från standardiserade prov är nyckfulla, inte representerar vad eleverna kan och att de är missvisande när de används för ansvarsutkrävande ändamål. Många pedagogiska psykologer och experter på testning har nyanserade åsikter och gör skillnad mellan den information som standardiserade test kan ge om elevernas prestationer och hur testresultaten tolkas och används. Enligt denna nyanserade syn uppstår många av de problem som är förknippade med standardiserade prov på grund av att de används med höga insatser, t.ex. genom att använda resultatet på ett prov för att bestämma urvalet till ett program, examen eller licensiering, eller genom att bedöma en skola som hög respektive lågpresterande.

Är standardiserade prov fördomsfulla?

I ett multikulturellt samhälle är en viktig fråga: Är standardiserade prov fördomsfulla mot vissa sociala klasser, raser eller etniska grupper? Denna fråga är mycket mer komplicerad än vad den verkar eftersom fördomar har en mängd olika betydelser. En vardaglig innebörd av bias innebär ofta att det är rättvist att använda resultaten av standardiserade test för att förutsäga potentiella resultat hos missgynnade elever som tidigare har haft få utbildningsresurser. Skulle till exempel Dwayne, en gymnasieelev som arbetat hårt men haft begränsade utbildningsmöjligheter på grund av de dåliga skolorna i hans bostadsområde och få utbildningsresurser i hans hem, nekas att ta examen från gymnasiet på grund av sitt resultat på ett prov? Det var inte hans fel att han inte hade utbildningsresurser, och om han fick en chans att förändra sin miljö (t.ex. genom att gå på college) skulle hans prestationer kunna blomstra. Enligt detta synsätt återspeglar provresultat samhälleliga ojämlikheter och kan straffa elever som är mindre privilegierade, och de tolkas ofta felaktigt som en återspegling av en fast nedärvd förmåga. Forskare tar vanligtvis hänsyn till fördomar på mer tekniska sätt, och tre frågor kommer att diskuteras: innehåll och format för testet, förutsägelsernas noggrannhet och stereotypt hot.

Innehåll och format för testet. Testuppgifterna kan vara svårare för vissa grupper än för andra. Ett exempel på sociala klassbias i ett flervalsuppdrag där eleverna tillfrågades om innebörden av begreppet fält. Eleverna ombads att läsa den inledande meningen i kursiv stil och sedan välja det svar som hade samma innebörd som fält (Popham 2004, s. 24):

  1. Min pappas fält är datorgrafik.
    1. Kastaren kunde spela på fältet på sin position
    2. Vi förberedde fältet genom att plöja det
    3. Läkaren undersökte mitt synfält
    4. Vilket fält kommer du att gå inom efter college?

Barn till yrkesverksamma är mer benägna att förstå denna innebörd av fält eftersom läkare, journalister och advokater har ”fält”, medan kassörskor och underhållsarbetare har jobb så deras barn är mindre benägna att känna till denna innebörd av fält. (Rätt svar är 4).

Testföretag försöker minimera denna typ av innehållsproblem genom att låta testutvecklare med olika bakgrunder granska uppgifterna och genom att statistiskt undersöka om vissa grupper finner vissa uppgifter lättare eller svårare. Det finns dock problem, och en nyligen genomförd analys av de verbala SAT-testerna visade att vita tenderar att få bättre resultat på lätta uppgifter medan afroamerikaner, latinamerikaner och asiatiska amerikaner får bättre resultat på svåra uppgifter (Freedle, 2002). Även om dessa skillnader inte är stora kan de påverka testresultaten. Forskarna tror att de lätta frågorna som rör ord som används i vardagliga samtal kan ha subtilt olika betydelser i olika subkulturer, medan de svåra orden (t.ex. vehemence, sycophant) inte används i alla samtal och därför inte har dessa variationer i betydelsen. Testformatet kan också påverka testresultatet. Kvinnor får vanligtvis bättre resultat på essäfrågor och när SAT nyligen lade till en essäkomponent förbättrades kvinnornas totala SAT verbalresultat i förhållande till männens (Hoover, 2006).

Förutsägelsernas träffsäkerhet

Standardiserade tester används bland annat för att avgöra vem som kommer att bli antagen till selektiva högskolor. Denna praxis motiveras av bevis för prediktiv validitet – dvs. att poäng på ACT eller SAT används för att förutsäga betyg från första året på college. Nya studier har visat att förutsägelserna för svarta och latinamerikanska studenter är mindre korrekta än för vita studenter och att förutsägelser för kvinnliga studenter är mindre korrekta än för manliga studenter (Young, 2004). Det är dock kanske överraskande att testresultaten tenderar att något överprognostisera framgången i college för svarta och latinamerikanska studenter, dvs. att dessa studenter sannolikt kommer att uppnå lägre betygsgenomsnitt för första årskursen än vad som förutspås av deras testresultat. Däremot tenderar testresultaten att något underskatta framgången i college för kvinnliga studenter, dvs. att dessa studenter sannolikt kommer att uppnå ett högre genomsnitt av betygspoäng på första årskursen än vad som förutspås av deras testresultat. Forskarna är inte säkra på varför det finns skillnader i hur exakt SAT- och ACT-testet förutsäger nybörjarbetyg.

Stereotypt hot

Grupper som är negativt stereotypa på något område, t.ex. kvinnors prestationer i matematik, riskerar att utsättas för stereotypt hot, dvs. oro för att andra kommer att betrakta dem genom den negativa eller stereotypa linsen (Aronson & Steele, 2005). Studier har visat att testresultatet för stereotypa grupper (t.ex. afroamerikaner, latinamerikaner, kvinnor) sjunker när det betonas för dem som gör testet att (a) testet har höga insatser, mäter intelligens eller matematik och (b) de påminns om sin etnicitet, ras eller sitt kön (t.ex. genom att de före testet ombeds att fylla i ett kort demografiskt frågeformulär). Även om individer tror att de är kompetenta kan stereotypt hot minska arbetsminneskapaciteten eftersom individer försöker undertrycka de negativa stereotyperna. Stereotypt hot verkar särskilt starkt för de individer som önskar prestera bra. Standardiserade testresultat för individer från stereotypa grupper kan avsevärt underskatta deras faktiska kompetens i testsituationer med låga krav.

Undervisar lärare för testerna?

Det finns belägg för att skolor och lärare anpassar läroplanen så att den återspeglar vad som står på testerna och även förbereder eleverna för formatet och typerna av uppgifter på testerna. Flera undersökningar av lärare i grundskolan visade att mer tid lades på matematik och läsning och mindre på samhällskunskap och naturvetenskap 2004 än 1990 (Jerald, 2006). Rektorer i skolor med många minoriteter i fyra delstater rapporterade 2003 att de hade minskat den tid de ägnade åt konst. Ny forskning inom kognitionsvetenskapen tyder på att läsförståelse i ett ämne (t.ex. naturvetenskap eller samhällskunskap) kräver att eleverna förstår mycket ordförråd och bakgrundskunskap i det ämnet (Recht & Leslie, 1988). Detta innebär att även om eleverna får goda läsfärdigheter kommer de att tycka att det är svårt att lära sig naturvetenskap och samhällskunskap om lite tid har ägnats åt dessa ämnen.

Det kan vara svårt att göra ett prov med ett okänt format, så lärarna hjälper eleverna att förbereda sig för specifika provformat och provuppgifter (t.ex. dubbla negationer i flervalsuppgifter; konstruerade svar). Tidigare i det här kapitlet beskrev en mellanstadielärare, Erin, och rektorn Dr. Mucci hur de betonar provförberedelserna i sina skolor. Det finns en växande oro för att den mängd provförberedelser som nu sker i skolorna är överdriven och att eleverna inte utbildas utan tränas för att göra prov (Popham, 2004).

Fuskar elever och lärare?

Det är svårt att få fram bra uppgifter om hur utbrett fusket är, men vi vet att elever som gör prov fuskar och att andra, inklusive provadministratörer, hjälper dem att fuska (Cizek, 2003; Popham 2006). Åtgärder för att förhindra att elever fuskar är bland annat att skydda provets säkerhet, se till att eleverna förstår hur proven administreras, hindra eleverna från att ta med sig anteckningar eller otillåtna elektroniska apparater samt att titta på varandras svar. Vissa lärare och rektorer har ertappats med att använda oetiska metoder för provförberedelser, t.ex. att ge eleverna verkliga provuppgifter strax före proven, ge eleverna mer tid än vad som är tillåtet, svara på elevernas frågor om provuppgifterna och faktiskt ändra elevernas svar (Popham, 2006). Oron i Texas för fusk ledde till att en oberoende arbetsgrupp skapades i augusti 2006 med 15 anställda från Texas Education Agency som fick i uppdrag att utreda oegentligheter i samband med proven. (Jacobson, 2006). Även om trycket på skolor och lärare att få sina elever att prestera bra är stort är dessa metoder helt klart oetiska och har lett till att skolpersonal fått sparken från sina jobb (Cizek, 2003).

Aronson, J., & Steele, C. M. (2005). Stereotyper och bräckligheten hos akademisk kompetens, motivation och självuppfattning. I A. J. Elliott & C. S. Dweck (red.). Handbook of competence and motivation. (s. 436-456) Guilford Publications, New York.

Cizek, G. J. (2003). Att upptäcka och förebygga fusk i klassrummet: Främja integritet i bedömningen. Corwin Press, Thousand Oaks, CA.

Freedle, R. O. (2003). Correcting the SAT’s ethnic and social-class bias: A method for reestimating SAT scores. Harvard Educational Review, 73(1), 1-42.

Hoover, E. (2006, 21 oktober). SAT-poäng ser största nedgången på 31 år. Chronicle of Higher Education, 53(10), A1.

Jacobson, L. (2006). Undersökning av oegentligheter i testet: Texas startar utredning om fusk på prov. Education Week, 28(1), 28

Jerald, C. D (2006,augusti).The Hidden costs of curriculum narrowing. Issue Brief, Washington DC: Center for Comprehensive School Reform and Improvement. Tillgänglig den 21 november 2006 från www.centerforcsri.org/

Popham, W. J. (2004). Amerikas ”misslyckade” skolor. Hur föräldrar och lärare kan kopiera med No Child Left Behind. New York: Routledge Falmer.

Popham, W. J. (2006). Pedagogiskt fusk på No Child Left Behind-testerna. Educational Week, 25(32) 32-33.

Recht, D. R. & Leslie, L. (1988). Effekten av förkunskaper på bra och dåliga läsares minne av text. Journal of Educational Psychology 80, 16-20.

Young, J. W. (2004). Differentiell validitet och prediktion: Race and sex differences in college admissions testing. I R. Zwick (Ed). Rethinking the SAT: The future of standardized testing in university admissions. New York (s. 289-301). Routledge Falmer.

Lämna ett svar

Din e-postadress kommer inte publiceras.