Monilla ihmisillä on hyvin vahvoja näkemyksiä standardoitujen testien roolista koulutuksessa. Jotkut uskovat, että ne tarjoavat puolueettoman tavan määrittää yksilön kognitiiviset taidot sekä koulun tai alueen laadun. Toiset taas katsovat, että standardoitujen kokeiden tulokset ovat mielivaltaisia, eivät kuvaa sitä, mitä oppilaat osaavat, ja ovat harhaanjohtavia, kun niitä käytetään tilivelvollisuustarkoituksiin. Monilla koulutuspsykologeilla ja testauksen asiantuntijoilla on vivahteikkaita näkemyksiä, ja he erottavat toisistaan sen tiedon, jota standardoidut testit voivat antaa oppilaiden suorituksista, ja sen, miten testituloksia tulkitaan ja käytetään. Tämän vivahteikkaan näkemyksen mukaan monet standardoituihin kokeisiin liittyvistä ongelmista johtuvat niiden käytöstä, jossa on paljon panoksia, kuten yhden kokeen suorituksen käyttäminen päättämään valinnasta johonkin ohjelmaan, tutkinnon suorittamisesta tai toimiluvan saamisesta tai koulun arvioimisesta hyvin tai huonosti suoriutuvaksi.
Ovatko standardoidut kokeet puolueellisia?
Monikulttuurisessa yhteiskunnassa yksi ratkaiseva kysymys on: Ovatko standardoidut kokeet puolueellisia tiettyihin yhteiskunnallisiin luokkiin kuuluvia sosiaalisiin, rodullisiin tai etnisiin ryhmiin nähden? Tämä kysymys on paljon monimutkaisempi kuin miltä se näyttää, koska puolueellisuudella on useita eri merkityksiä. Harhaanjohtavuuden jokapäiväiseen merkitykseen liittyy usein se, että standardoitujen testitulosten avulla voidaan ennustaa heikommassa asemassa olevien oppilaiden, joilla on aiemmin ollut vain vähän koulutusresursseja, mahdollisia suorituksia. Pitäisikö esimerkiksi Dwayne, lukiolainen, joka teki ahkerasti töitä mutta jolla oli rajalliset koulutusmahdollisuudet, koska hänen asuinalueensa koulu oli huono ja hänen kotonaan oli vain vähän koulutusresursseja, jättää valmistumatta lukiosta yhden testin tuloksen perusteella? Ei ollut hänen syynsä, että hänellä ei ollut koulutusresursseja, ja jos hänelle annetaan mahdollisuus muuttaa ympäristöään (esim. menemällä yliopistoon), hänen suorituksensa voi kukoistaa. Tämän näkemyksen mukaan koetulokset heijastavat yhteiskunnallista eriarvoisuutta ja voivat rangaista heikommassa asemassa olevia oppilaita, ja ne tulkitaan usein virheellisesti kiinteän perityn kyvykkyyden heijastukseksi. Tutkijat tarkastelevat puolueellisuutta yleensä teknisemmillä tavoilla, ja seuraavassa käsitellään kolmea kysymystä: testitehtävien sisältö ja muoto, ennusteiden tarkkuus ja stereotyyppinen uhka.
Tehtävien sisältö ja muoto. Testitehtävät voivat olla joillekin ryhmille vaikeampia kuin toisille. Esimerkki sosiaaliluokkavinoumasta monivalintatehtävässä, jossa opiskelijoilta kysyttiin termin ”pelto” merkitystä. Oppilaita pyydettiin lukemaan kursiivilla kirjoitettu alkulause ja valitsemaan sen jälkeen vastaus, jolla oli sama merkitys kuin kentällä (Popham 2004, s. 24):
- Isäni ala on tietokonegrafiikka.
- Kannuttaja pystyi kenttään asemapaikalleen
- Valmistelimme kentän kyntämällä sen
- Lääkäri tutki kenttääni
- Mille alalle pääset opiskelun jälkeen?
Ammattilaisten lapset ymmärtävät todennäköisemmin tämän kentän merkityksen, sillä lääkäreillä, toimittajilla ja lakimiehillä on ”kenttä”, kun taas kassanhoitajilla ja huoltotyöntekijöillä on työpaikka, joten heidän lapsensa tietävät vähemmän todennäköisesti tämän kentän merkityksen. (Oikea vastaus on 4).
Testausyritykset pyrkivät minimoimaan tämäntyyppiset sisällölliset ongelmat siten, että testien kehittäjät, joilla on erilaisia taustoja, tarkistavat tehtävät ja tutkivat tilastollisesti, pitävätkö tietyt ryhmät joitakin tehtäviä helpompina tai vaikeampina. Ongelmia kuitenkin esiintyy, ja hiljattain tehdyt analyysit sanallisista SAT-kokeista osoittivat, että valkoihoiset saavat yleensä paremmat pisteet helpoista tehtävistä, kun taas afroamerikkalaiset, latinalaisamerikkalaiset ja aasialaisamerikkalaiset saavat paremmat pisteet vaikeista tehtävistä (Freedle, 2002). Vaikka nämä erot eivät ole suuria, ne voivat vaikuttaa testituloksiin. Tutkijat arvelevat, että helpoilla kysymyksillä, joihin liittyy jokapäiväisessä keskustelussa käytettyjä sanoja, voi olla hienovaraisesti erilaisia merkityksiä eri alakulttuureissa, kun taas vaikeilla sanoilla (esim. kiihkeys, mielistelijä) ei käytetä jokaisessa keskustelussa, joten niillä ei ole tällaisia merkityksen vaihteluita. Myös testin muoto voi vaikuttaa testisuoritukseen. Naiset saavat tyypillisesti paremmat pisteet esseekysymyksistä, ja kun SAT-testiin hiljattain lisättiin esseekomponentti, naisten SAT-testin verbaalinen kokonaispistemäärä parani miehiin verrattuna (Hoover, 2006).
Ennusteiden tarkkuus
Standardoituja testejä käytetään muiden kriteerien ohella sen määrittämiseen, ketkä pääsevät valikoiviin korkeakouluihin. Tätä käytäntöä perustellaan näyttöön perustuvalla ennakoivalla validiteetilla – eli sillä, että ACT- tai SAT-kokeiden pistemääriä käytetään ennustamaan ensimmäisen vuoden korkeakouluarvosanoja. Viimeaikaiset tutkimukset ovat osoittaneet, että mustaihoisten ja latino-opiskelijoiden ennusteet ovat epätarkempia kuin valkoisten opiskelijoiden ja että naisopiskelijoiden ennusteet ovat epätarkempia kuin miesopiskelijoiden (Young, 2004). Ehkä yllättäen testitulokset ennustavat kuitenkin hieman liikaa mustaihoisten ja latinalaisamerikkalaisten opiskelijoiden menestystä korkeakoulussa, eli nämä opiskelijat saavuttavat todennäköisesti alhaisemman ensimmäisen vuoden pistekeskiarvon kuin heidän testituloksensa ennustavat. Sen sijaan naisopiskelijoiden opintomenestystä testitulokset ennustavat yleensä hieman heikommin, eli nämä opiskelijat saavuttavat todennäköisesti korkeamman ensimmäisen vuoden pistekeskiarvon kuin heidän testituloksensa ennustavat. Tutkijat eivät ole varmoja siitä, miksi on eroja siinä, miten tarkasti SAT- ja ACT-testit ennustavat fuksin arvosanoja.
Stereotyyppinen uhka
Ryhmät, jotka ovat negatiivisesti stereotyyppisiä jollakin osa-alueella, kuten naisten suoriutuminen matematiikassa, ovat vaarassa joutua kärsimään stereotyyppisestä uhasta eli huolista siitä, että muut näkevät heidät negatiivisen tai stereotyyppisen linssin läpi (Aronson & Steele, 2005). Tutkimukset ovat osoittaneet, että stereotyyppisten ryhmien (esim. afroamerikkalaiset, latinalaisamerikkalaiset, naiset) koesuoritukset heikkenevät, kun kokeeseen osallistuville korostetaan, että a) koe on vaativa, mittaa älykkyyttä tai matematiikkaa ja b) heitä muistutetaan etnisestä taustastaan, rodustaan tai sukupuolestaan (esim. pyytämällä heitä ennen koetta täyttämään lyhyt demografinen kyselylomake). Vaikka yksilöt uskoisivat olevansa päteviä, stereotyyppinen uhka voi vähentää työmuistin kapasiteettia, koska yksilöt yrittävät tukahduttaa negatiiviset stereotypiat. Stereotypiauhka näyttää olevan erityisen voimakas niille yksilöille, jotka haluavat suoriutua hyvin. Stereotyyppisiin ryhmiin kuuluvien henkilöiden standardoidut testitulokset saattavat aliarvioida merkittävästi heidän todellista pätevyyttään matalan kynnyksen testitilanteissa.
Opettavatko opettajat testejä varten?
On näyttöä siitä, että koulut ja opettajat muokkaavat opetussuunnitelmaa niin, että se heijastaa testeissä esitettäviä asioita, ja valmistavat oppilaita myös testien muotoon ja tehtävätyyppeihin. Useat peruskoulun opettajille tehdyt tutkimukset osoittivat, että vuonna 2004 käytettiin enemmän aikaa matematiikkaan ja lukemiseen ja vähemmän yhteiskuntaoppiin ja luonnontieteisiin kuin vuonna 1990 (Jerald, 2006). Neljässä osavaltiossa sijaitsevien vähemmistökoulujen rehtorit ilmoittivat vuonna 2003 vähentäneensä taideaineisiin käytettyä aikaa. Viimeaikaiset kognitiotieteelliset tutkimukset viittaavat siihen, että luetun ymmärtäminen jossakin oppiaineessa (esim. luonnontieteissä tai yhteiskuntaopissa) edellyttää, että oppilaat ymmärtävät paljon kyseisen oppiaineen sanastoa ja taustatietoa (Recht & Leslie, 1988). Tämä tarkoittaa, että vaikka oppilaat hankkisivat hyvän lukutaidon, he kokevat luonnontieteiden ja yhteiskuntaopin oppimisen vaikeaksi, jos näihin oppiaineisiin on käytetty vain vähän aikaa.
Tuntemattomassa koemuodossa olevan kokeen tekeminen voi olla vaikeaa, joten opettajat auttavat oppilaita valmistautumaan tiettyihin koemuotoihin ja -tehtäviin (esim. kaksinkertaiset negaatiot monivalintatehtävissä; konstruoitu vastaus). Aiemmin tässä luvussa yläasteen opettaja Erin ja rehtori Mucci kuvailivat, miten heidän kouluissaan painotetaan kokeisiin valmistautumista. Yhä useammat ovat huolissaan siitä, että kouluissa on nykyään liikaa koevalmistelua ja että oppilaita ei kouluteta vaan valmennetaan tekemään kokeita (Popham, 2004).
Huijaavatko oppilaat ja opettajat?
Hyviä tietoja huijaamisen yleisyydestä on vaikea saada, mutta tiedämme, että kokeisiin osallistuvat opiskelijat huijaavat ja että muut, mukaan lukien kokeiden ylläpitäjät, auttavat heitä huijaamaan (Cizek, 2003; Popham 2006). Opiskelijoiden harjoittaman huijaamisen estämiseksi on muun muassa suojattava kokeiden turvallisuus, varmistettava, että opiskelijat ymmärtävät kokeiden hallinnointimenettelyt, estettävä opiskelijoita tuomasta muistiinpanojaan tai käyttämästä hyväksymättömiä elektronisia laitteita sekä katsomasta toistensa vastauksia. Jotkut opettajat ja rehtorit ovat jääneet kiinni epäeettisistä koevalmistelukäytännöistä, kuten siitä, että he ovat antaneet oppilaille todellisia koetehtäviä juuri ennen koetta, antaneet oppilaille enemmän aikaa kuin on sallittua, vastanneet oppilaiden kysymyksiin koetehtävistä ja muuttaneet oppilaiden vastauksia (Popham, 2006). Teksasissa huoli huijaamisesta johti siihen, että elokuussa 2006 perustettiin riippumaton työryhmä, johon kuului 15 Texasin opetusviraston työntekijää ja jonka tehtävänä oli tutkia kokeisiin liittyviä väärinkäytöksiä. (Jacobson, 2006). Vaikka kouluihin ja opettajiin kohdistuva paine saada oppilaat suoriutumaan hyvin on suuri, nämä käytännöt ovat selvästi epäeettisiä, ja ne ovat johtaneet siihen, että koulujen henkilökunta on saanut potkut työpaikoiltaan (Cizek, 2003).
Aronson, J., & Steele, C. M. (2005). Stereotypiat ja akateemisen pätevyyden, motivaation ja minäkäsityksen hauraus. Teoksessa A. J. Elliott & C. S. Dweck (toim.). Kompetenssin ja motivaation käsikirja. (s. 436-456) Guilford Publications, New York.
Cizek, G. J. (2003). Luokkahuoneessa tapahtuvan huijaamisen havaitseminen ja estäminen: Arvioinnin rehellisyyden edistäminen. Corwin Press, Thousand Oaks, CA.
Freedle, R. O. (2003). SAT:n etnisen ja sosiaaliluokkaisen vinoutuman korjaaminen: A method for reestimating SAT scores. Harvard Educational Review, 73(1), 1-42.
Hoover, E. (2006, October 21). SAT-pistemäärässä suurin notkahdus 31 vuoteen. Chronicle of Higher Education, 53(10), A1.
Jacobson, L. (2006). Probing Test irregularities: Texas käynnistää tutkimuksen kokeissa tapahtuneesta huijaamisesta. Education Week, 28(1), 28
Jerald, C. D (2006,August).The Hidden costs of curriculum narrowing. Issue Brief, Washington DC: The Center for Comprehensive School Reform and Improvement. Accessed November 21, 2006 from www.centerforcsri.org/
Popham, W. J. (2004). Amerikan ”epäonnistuvat” koulut. Miten vanhemmat ja opettajat voivat kopioida No Child Left Behind -ohjelman. New York: Routledge Falmer.
Popham, W. J. (2006). Kouluttajien huijaaminen No Child Left Behind -testeissä. Educational Week, 25(32) 32-33.
Recht, D. R. & Leslie, L. (1988). Ennakkotiedon vaikutus hyvien ja huonojen lukijoiden tekstimuistiin. Journal of Educational Psychology 80, 16-20.
Young, J. W. (2004). Differentiaalinen validiteetti ja ennustaminen: Race and sex differences in college admissions testing. Teoksessa R. Zwick (toim.). Rethinking the SAT: The future of standardized testing in university admissions. New York (s. 289-301). Routledge Falmer.