Sok embernek nagyon határozott nézetei vannak a standardizált tesztek oktatásban betöltött szerepéről. Egyesek úgy vélik, hogy elfogulatlan módot biztosítanak az egyén kognitív képességeinek, valamint az iskola vagy a körzet minőségének meghatározására. Mások úgy vélik, hogy a szabványosított tesztek eredményei szeszélyesek, nem tükrözik a tanulók tudását, és félrevezetőek, ha elszámoltathatósági célokra használják őket. Számos oktatáspszichológus és tesztelési szakértő árnyaltan vélekedik, és különbséget tesz a szabványosított tesztek által a tanulók teljesítményéről szolgáltatott információk, valamint a tesztek eredményeinek értelmezése és felhasználása között. Ezen árnyalt nézet szerint a standardizált tesztekkel kapcsolatos számos probléma a nagy tétekkel járó használatukból ered, például abból, hogy az egy tesztben nyújtott teljesítmény alapján határozzák meg a programba való felvételt, az érettségit vagy az engedélyt, vagy hogy egy iskolát magas vagy alacsony teljesítményűnek ítélnek meg.
A standardizált tesztek elfogultak?
A multikulturális társadalomban az egyik legfontosabb kérdés az, hogy a standardizált tesztek elfogultak-e bizonyos társadalmi osztályokhoz, faji vagy etnikai csoportokhoz képest? Ez a kérdés sokkal bonyolultabb, mint amilyennek látszik, mert az elfogultságnak többféle jelentése van. Az előítéletesség hétköznapi jelentése gyakran azt jelenti, hogy a szabványosított teszteredményeket igazságosan használják fel a hátrányos helyzetű, korábban kevés oktatási forrással rendelkező tanulók potenciális teljesítményének előrejelzésére. Például, hogy Dwayne-t, egy olyan középiskolás diákot, aki keményen dolgozott, de korlátozott oktatási lehetőségekkel rendelkezett, mivel a környékének iskolái rosszak, és otthonában kevés oktatási forrás állt rendelkezésre, egy teszten elért pontszáma miatt ne engedjék leérettségizni a középiskolában. Nem az ő hibája, hogy nem rendelkezett az oktatási forrásokkal, és ha a környezetének megváltoztatásával (pl. főiskolára járással) esélyt kap, a teljesítménye felvirágozhat. E nézet szerint a teszteredmények a társadalmi egyenlőtlenségeket tükrözik, és büntethetik a kevésbé kiváltságos tanulókat, és gyakran tévesen úgy értelmezik őket, mint egy rögzített, öröklött képesség tükrözését. A kutatók az elfogultságot jellemzően technikai szempontból vizsgálják, és három kérdésről lesz szó: a tesztelemek tartalma és formátuma; az előrejelzések pontossága és a sztereotip fenyegetés.
A tesztelemek tartalma és formátuma. A tesztfeladatok egyes csoportok számára nehezebbek lehetnek, mint mások számára. Egy példa a társadalmi osztályok közötti torzításra egy feleletválasztós feladatban, amely a mező fogalmának jelentését kérdezte a diákoktól. A diákokat arra kérték, hogy olvassák el a dőlt betűvel szedett kezdő mondatot, majd válasszák ki azt a választ, amelyik a mező jelentésével megegyezik (Popham 2004, 24. o.):
- Apa szakterülete a számítógépes grafika.
- A dobó tudott menni a posztjára
- A szántással készítettük elő a mezőt
- Az orvos megvizsgálta a látómezőmet
- Melyik területre készülsz az egyetem után?
A szakemberek gyermekei nagyobb valószínűséggel értik a mezőnek ezt a jelentését, mivel az orvosoknak, újságíróknak és ügyvédeknek van “mezőjük”, míg a pénztárosoknak és karbantartóknak van munkájuk, így az ő gyermekeik kevésbé valószínű, hogy ismerik a mezőnek ezt a jelentését. (A helyes válasz a 4.).
A tesztelő cégek úgy próbálják minimalizálni az ilyen jellegű tartalmi problémákat, hogy a tesztek fejlesztői különböző háttérrel rendelkeznek, és statisztikailag megvizsgálják, hogy bizonyos csoportok könnyebbnek vagy nehezebbnek találnak-e egyes feladatokat. A problémák azonban léteznek, és a szóbeli SAT-tesztek nemrégiben végzett elemzése azt mutatta, hogy a fehérek általában jobban teljesítenek a könnyű tételeknél, míg az afroamerikaiak, a spanyolajkúak és az ázsiai amerikaiak jobban teljesítenek a nehéz tételeknél (Freedle, 2002). Bár ezek a különbségek nem nagyok, befolyásolhatják a teszteredményeket. A kutatók úgy vélik, hogy a mindennapi beszélgetésekben használt szavakat tartalmazó könnyű tételek a különböző szubkultúrákban finoman eltérő jelentéssel bírhatnak, míg a nehéz szavak (pl. vehemencia, talpnyaló) nem minden beszélgetésben használatosak, és így nem rendelkeznek ilyen jelentésbeli eltérésekkel. A tesztformátum is befolyásolhatja a tesztteljesítményt. A nők jellemzően jobban teljesítenek az esszékérdésekben, és amikor a SAT nemrégiben kiegészült egy esszé komponenssel, a nők általános SAT verbális pontszámai javultak a férfiakhoz képest (Hoover, 2006).
A jóslatok pontossága
A szabványosított teszteket más kritériumok mellett annak meghatározására is használják, hogy kiket vesznek fel a szelektív főiskolákra. Ezt a gyakorlatot a prediktív érvényességre vonatkozó bizonyítékok indokolják – azaz, hogy az ACT vagy SAT pontszámok alapján megjósolják az első évi főiskolai jegyeket. A legújabb tanulmányok kimutatták, hogy a fekete és latin-amerikai diákok előrejelzései kevésbé pontosak, mint a fehér diákoké, és hogy a női diákok előrejelzői kevésbé pontosak, mint a férfi diákoké (Young, 2004). Talán meglepő módon azonban a teszteredmények a fekete és latin-amerikai diákok esetében kissé túljósolják az egyetemi sikereket, azaz ezek a diákok valószínűleg alacsonyabb elsőéves tanulmányi átlagot érnek el, mint amit a teszteredményeik előre jeleznek. Ezzel szemben a női hallgatók esetében a teszteredmények kissé alulbecsülik a főiskolai sikereket, azaz ezek a hallgatók valószínűleg magasabb elsőéves tanulmányi átlagot érnek el, mint amit a teszteredményeik előre jeleznek. A kutatók nem biztosak abban, hogy miért vannak különbségek abban, hogy a SAT és az ACT teszt milyen pontosan jósolja meg a gólya jegyeket.
Sztereotípiák fenyegetése
A valamilyen területen negatívan sztereotipizált csoportokat, például a nők matematikában nyújtott teljesítményét, fenyegeti a sztereotípiák fenyegetése, vagyis az az aggodalom, hogy mások a negatív vagy sztereotipizált szemüvegen keresztül fogják őket nézni (Aronson & Steele, 2005). Tanulmányok kimutatták, hogy a sztereotipizált csoportok (pl. afroamerikaiak, latinok, nők) vizsgateljesítménye csökken, ha a vizsgázóknak hangsúlyozzák, hogy a) a teszt magas tétű, intelligenciát vagy matematikát mér, és b) emlékeztetik őket etnikai, faji vagy nemi hovatartozásukra (pl. azzal, hogy a teszt előtt megkérik őket egy rövid demográfiai kérdőív kitöltésére). Még ha az egyének kompetensnek is hiszik magukat, a sztereotípiák fenyegetése csökkentheti a munkamemória kapacitását, mivel az egyének megpróbálják elnyomni a negatív sztereotípiákat. A sztereotípiafenyegetettség különösen erősnek tűnik azoknál az egyéneknél, akik jó teljesítményre vágynak. A sztereotipizált csoportokhoz tartozó egyének standardizált teszteredményei jelentősen alulbecsülhetik tényleges kompetenciájukat az alacsony tétű tesztelési helyzetekben.
A tanárok a tesztekhez tanítanak?
Bizonyított, hogy az iskolák és a tanárok úgy igazítják a tantervet, hogy az tükrözze a teszteken szereplő anyagokat, és a diákokat is felkészíti a tesztek formátumára és feladattípusaira. Az általános iskolai tanárok körében végzett több felmérés azt mutatta, hogy 2004-ben több időt fordítottak a matematikára és az olvasásra, és kevesebbet a társadalomtudományokra és a természettudományokra, mint 1990-ben (Jerald, 2006). Négy államban a nagyszámú kisebbség által látogatott iskolák igazgatói arról számoltak be 2003-ban, hogy csökkentették a művészetekre fordított időt. A kognitív tudományok legújabb kutatásai azt sugallják, hogy egy tantárgy (pl. természettudományok vagy társadalomtudományok) olvasásértése megköveteli, hogy a tanulók sok szókincset és háttérismeretet értsenek az adott tantárgyból (Recht & Leslie, 1988). Ez azt jelenti, hogy még ha a tanulók jó olvasási készségekre tesznek szert, akkor is nehéznek fogják találni a természettudományok és a társadalomtudományok tanulását, ha kevés időt fordítottak ezekre a tantárgyakra.
Egy ismeretlen formátumú teszt megírása nehéz lehet, ezért a tanárok segítenek a tanulóknak felkészülni a speciális tesztformátumokra és tételekre (pl. kettős negáció a feleletválasztós tételekben; konstruált válasz). Korábban ebben a fejezetben egy középiskolai tanár, Erin, és Dr. Mucci igazgató leírta, hogy iskolájukban milyen hangsúlyt fektetnek a tesztfelkészítésre. Egyre nagyobb aggodalomra ad okot, hogy az iskolákban manapság túlzottan sok tesztkészítés folyik, és a diákokat nem oktatják, hanem felkészítik a tesztek elvégzésére (Popham, 2004).
Csalnak a diákok és a pedagógusok?
Nehéz jó adatokat szerezni arról, hogy mennyire elterjedt a csalás, de azt tudjuk, hogy a teszteket író diákok csalnak, és mások, köztük a tesztfelelősök segítenek nekik a csalásban (Cizek, 2003; Popham 2006). A diákok csalásának megakadályozására tett lépések közé tartozik a tesztek biztonságának védelme, annak biztosítása, hogy a diákok megértsék az adminisztrációs eljárásokat, annak megakadályozása, hogy a diákok jegyzeteket vagy nem engedélyezett elektronikus eszközöket hozzanak be, valamint egymás válaszainak megnézése. Egyes tanárokat és igazgatókat már rajtakaptak olyan etikátlan tesztelőkészítési gyakorlatokon, mint például az, hogy közvetlenül a tesztek előtt tényleges tesztelemeket adtak a diákoknak, a megengedettnél több időt adtak a diákoknak, válaszoltak a diákok tesztelemekkel kapcsolatos kérdéseire, és ténylegesen megváltoztatták a diákok válaszait (Popham, 2006). A csalással kapcsolatos aggodalmak Texasban 2006 augusztusában egy független munkacsoport létrehozásához vezettek, amely a Texasi Oktatási Ügynökség 15 munkatársából állt, és amelynek feladata a tesztekkel kapcsolatos szabálytalanságok kivizsgálása volt. (Jacobson, 2006). Bár nagy a nyomás az iskolákon és a tanárokon, hogy a diákjaik jól teljesítsenek, ezek a gyakorlatok egyértelműen etikátlanok, és az iskolai személyzet elbocsátásához vezettek (Cizek, 2003).
Aronson, J., & Steele, C. M. (2005). Sztereotípiák és az akadémiai kompetencia, a motiváció és az énkép törékenysége. In A. J. Elliott & C. S. Dweck (szerk.). A kompetencia és a motiváció kézikönyve. (pp. 436-456) Guilford Publications, New York.
Cizek, G. J. (2003). Az osztálytermi csalás felismerése és megelőzése: Az integritás elősegítése az értékelésben. Corwin Press, Thousand Oaks, CA.
Freedle, R. O. (2003). A SAT etnikai és társadalmi-osztálybeli torzításának korrekciója: A módszer a SAT pontszámok újrabecslésére. Harvard Educational Review, 73(1), 1-42.
Hoover, E. (2006, October 21). A SAT pontszámok 31 év óta a legnagyobb visszaesést mutatják. Chronicle of Higher Education, 53(10), A1.
Jacobson, L. (2006). A teszt szabálytalanságainak vizsgálata: Texas vizsgálatot indít a vizsgákon elkövetett csalások ügyében. Education Week, 28(1), 28
Jerald, C. D (2006,augusztus).The Hidden costs of curriculum narrowing. Issue Brief, Washington DC: The Center for Comprehensive School Reform and Improvement. Accessed November 21, 2006 from www.centerforcsri.org/
Popham, W. J. (2004). Amerika “bukott” iskolái. Hogyan másolhatják a szülők és a tanárok a No Child Left Behind (Nem hagyott gyermek) programot. New York: Routledge Falmer.
Popham, W. J. (2006). Pedagógus csalás a No Child Left Behind teszteken. Educational Week, 25(32) 32-33.
Recht, D. R. & Leslie, L. (1988). Az előzetes tudás hatása a jó és rossz olvasók szövegemlékezetére. Journal of Educational Psychology 80, 16-20.
Young, J. W. (2004). Differenciális érvényesség és előrejelzés: Faji és nemi különbségek a főiskolai felvételi tesztekben. In R. Zwick (szerk.). Rethinking the SAT: The future of standardized testing in university admission. New York (pp. 289-301). Routledge Falmer.