Multe persoane au păreri foarte puternice despre rolul testelor standardizate în educație. Unii consideră că acestea oferă o modalitate imparțială de a determina abilitățile cognitive ale unui individ, precum și calitatea unei școli sau a unui district. Alții sunt de părere că scorurile de la testele standardizate sunt capricioase, nu reprezintă ceea ce știu elevii și sunt înșelătoare atunci când sunt folosite în scopuri de responsabilitate. Mulți psihologi educaționali și experți în testare au puncte de vedere nuanțate și fac distincții între informațiile pe care testele standardizate le pot furniza cu privire la performanțele elevilor și modul în care sunt interpretate și utilizate rezultatele testelor. În această viziune nuanțată, multe dintre problemele asociate cu testele standardizate decurg din utilizarea lor cu miză mare, cum ar fi utilizarea performanțelor la un test pentru a determina selecția într-un program, absolvirea sau obținerea licenței, sau judecarea unei școli ca fiind foarte performantă sau puțin performantă.
Sunt testele standardizate părtinitoare?
Într-o societate multiculturală, o întrebare crucială este: Sunt testele standardizate părtinitoare față de anumite clase sociale, rasiale sau grupuri etnice? Această întrebare este mult mai complicată decât pare, deoarece prejudecata are o varietate de semnificații. Un înțeles cotidian al prejudecății implică adesea corectitudinea utilizării rezultatelor testelor standardizate pentru a prezice performanța potențială a elevilor dezavantajați care au avut anterior puține resurse educaționale. De exemplu, ar trebui ca lui Dwayne, un elev de liceu care a muncit din greu, dar care a avut oportunități educaționale limitate din cauza școlilor sărace din cartierul său și a puținelor resurse educaționale din casa sa, să i se refuze absolvirea liceului din cauza scorului obținut la un test. Nu a fost vina lui că nu a avut resursele educaționale și, dacă i se oferă o șansă cu o schimbare a mediului său (de exemplu, mergând la facultate), performanța sa ar putea să înflorească. Din acest punct de vedere, notele obținute la teste reflectă inegalitățile din societate și îi pot pedepsi pe elevii mai puțin privilegiați, fiind adesea interpretate în mod eronat ca o reflectare a unei capacități moștenite fixe. Cercetătorii iau în considerare de obicei prejudecata în moduri mai tehnice și vor fi discutate trei aspecte: conținutul și formatul itemului; acuratețea predicțiilor și amenințarea stereotipului.
Conținutul și formatul itemului. Itemii testului pot fi mai dificili pentru unele grupuri decât pentru altele. Un exemplu de prejudecată de clasă socială într-un item cu alegere multiplă a cerut elevilor semnificația termenului de câmp. Elevii au fost rugați să citească propoziția inițială în italice și apoi să selecteze răspunsul care avea același înțeles al cuvântului domeniu (Popham 2004, p. 24):
- Domeniul tatălui meu este grafică pe calculator.
- Aruncătorul putea să facă teren pe poziția sa
- Am pregătit terenul arându-l
- Doctorul mi-a examinat câmpul vizual
- În ce domeniu vei intra după facultate?
Copiii profesioniștilor au mai multe șanse să înțeleagă acest sens al cuvântului domeniu, deoarece medicii, jurnaliștii și avocații au „domenii”, în timp ce casierele și lucrătorii de întreținere au locuri de muncă, astfel încât copiii lor au mai puține șanse să cunoască acest sens al cuvântului domeniu. (Răspunsul corect este 4).
Companii de testare încearcă să minimalizeze aceste tipuri de probleme de conținut prin faptul că au elaborat teste din medii diferite pentru a revizui itemii și prin examinarea statistică a faptului dacă anumite grupuri găsesc unii itemi mai ușor sau mai greu. Cu toate acestea, există probleme, iar o analiză recentă a testelor verbale SAT a indicat faptul că albii tind să obțină scoruri mai bune la itemii ușori, în timp ce afro-americanii, hispano-americanii și asiaticii americani obțin scoruri mai bune la itemii dificili (Freedle, 2002). Deși aceste diferențe nu sunt mari, ele pot influența scorurile la teste. Cercetătorii sunt de părere că itemii ușori, care implică cuvinte folosite în conversațiile de zi cu zi, pot avea înțelesuri subtil diferite în diferite subculturi, în timp ce cuvintele dificile (de exemplu, vehemență, lingușitor) nu sunt folosite în fiecare conversație și, prin urmare, nu au aceste variații de sens. Formatul testului poate, de asemenea, să influențeze performanța la test. De obicei, femeile obțin scoruri mai bune la întrebările de tip eseu, iar atunci când SAT a adăugat recent o componentă de eseu, scorurile globale ale femeilor la SAT verbal s-au îmbunătățit în raport cu cele ale bărbaților (Hoover, 2006).
Acuratețea predicțiilor
Testele standardizate sunt folosite, printre alte criterii, pentru a determina cine va fi admis la colegiile selective. Această practică este justificată de dovezile validității predictive – de exemplu, scorurile de la ACT sau SAT sunt folosite pentru a prezice notele din primul an de facultate. Studii recente au demonstrat că predicțiile pentru studenții de culoare și latino-americani sunt mai puțin precise decât pentru studenții albi și că predicțiile pentru studentele de sex feminin sunt mai puțin precise decât cele pentru studenții de sex masculin (Young, 2004). Cu toate acestea, poate în mod surprinzător, notele obținute la teste tind să supraestimeze ușor succesul la facultate în cazul studenților de culoare și latino-americani, adică este probabil ca acești studenți să obțină medii mai mici în primul an decât cele prevăzute de notele obținute la teste. În schimb, scorurile obținute la teste tind să subestimeze ușor succesul la facultate în cazul studenților de sex feminin, adică este probabil ca acești studenți să obțină medii mai mari decât cele prezise de scorurile obținute la teste. Cercetătorii nu sunt siguri de ce există diferențe în ceea ce privește acuratețea cu care testele SAT și ACT prezic notele din primul an.
Amenințarea stereotipului
Grupurile care sunt stereotipate negativ într-un anumit domeniu, cum ar fi performanța femeilor la matematică, sunt în pericol de amenințare stereotipică, adică îngrijorarea că ceilalți le vor privi prin prisma negativă sau stereotipică (Aronson & Steele, 2005). Studiile au arătat că performanța la test a grupurilor stereotipate (de exemplu, afro-americani, latino-americani, femei) scade atunci când se subliniază celor care dau testul că (a) testul este cu miză mare, măsoară inteligența sau matematica și (b) li se amintește de etnia, rasa sau sexul lor (de exemplu, cerându-le înainte de test să completeze un scurt chestionar demografic). Chiar dacă indivizii cred că sunt competenți, amenințarea stereotipurilor poate reduce capacitatea memoriei de lucru, deoarece indivizii încearcă să suprime stereotipurile negative. Amenințarea stereotipurilor pare deosebit de puternică pentru acei indivizi care doresc să aibă performanțe bune. Scorurile standardizate la teste ale indivizilor din grupuri stereotipizate pot subestima semnificativ competența reală a acestora în situații de testare cu miză redusă.
Profesorii predau pentru teste?
Există dovezi că școlile și profesorii ajustează programa școlară astfel încât să reflecte ceea ce se regăsește în teste și, de asemenea, îi pregătesc pe elevi pentru formatul și tipurile de itemi de la test. Mai multe sondaje efectuate în rândul profesorilor din școlile primare au indicat faptul că în 2004 s-a alocat mai mult timp matematicii și cititului și mai puțin timp studiilor sociale și științelor decât în 1990 (Jerald, 2006). Directorii din școlile cu un număr mare de înscrieri ale minorităților din patru state au raportat în 2003 că au redus timpul alocat artelor. Cercetări recente în domeniul științelor cognitive sugerează că înțelegerea lecturii într-o materie (de exemplu, științe sau studii sociale) necesită ca elevii să înțeleagă o mulțime de vocabular și cunoștințe de bază în acea materie (Recht & Leslie, 1988). Acest lucru înseamnă că, chiar dacă elevii dobândesc abilități bune de citire, ei vor găsi dificilă învățarea științelor și a studiilor sociale dacă s-a petrecut puțin timp cu aceste subiecte.
Facerea unui test cu un format nefamiliar poate fi dificilă, astfel încât profesorii îi ajută pe elevi să se pregătească pentru formate și itemi de test specifici (de exemplu, negații duble în itemi cu alegere multiplă; răspuns construit). Mai devreme în acest capitol, o profesoară de gimnaziu, Erin, și directorul Dr. Mucci au descris accentul pus pe pregătirea pentru teste în școlile lor. Există o îngrijorare din ce în ce mai mare cu privire la faptul că volumul de pregătire a testelor care are loc acum în școli este excesiv și că elevii nu sunt educați, ci antrenați pentru a face teste (Popham, 2004).
Elevii și educatorii trișează?
Este dificil de obținut date bune despre cât de răspândit este trișatul, dar știm că elevii care dau teste trișează și alții, inclusiv administratorii de teste, îi ajută să trișeze (Cizek, 2003; Popham 2006). Măsurile de prevenire a trișării de către elevi includ protejarea securității testelor, asigurarea faptului că elevii înțeleg procedurile de administrare, împiedicarea elevilor de a-și aduce notițe sau dispozitive electronice neaprobate, precum și de a se uita la răspunsurile celorlalți. Unii profesori și directori au fost prinși folosind practici de pregătire a testelor lipsite de etică, cum ar fi oferirea de subiecte de test reale elevilor chiar înainte de teste, acordarea de mai mult timp decât este permis, răspunsul la întrebările elevilor cu privire la subiectele de test și modificarea efectivă a răspunsurilor elevilor (Popham, 2006). Îngrijorările din Texas cu privire la trișare au dus la crearea unui grup de lucru independent în august 2006, format din 15 membri ai personalului de la Agenția pentru Educație din Texas, care a fost desemnat să investigheze nereguli la teste. (Jacobson, 2006). În timp ce presiunea asupra școlilor și profesorilor pentru ca elevii lor să aibă performanțe bune este mare, aceste practici sunt în mod clar lipsite de etică și au dus la concedierea personalului școlar (Cizek, 2003).
Aronson, J., & Steele, C. M. (2005). Stereotipurile și fragilitatea competenței academice, a motivației și a conceptului de sine. În A. J. Elliott & C. S. Dweck (Eds.). Manual de competență și motivație. (pp.436-456) Guilford Publications, New York.
Cizek, G. J. (2003). Detectarea și prevenirea copiatului în clasă: Promovarea integrității în evaluare. Corwin Press, Thousand Oaks, CA.
Freedle, R. O. (2003). Corectarea prejudecății etnice și de clasă socială a SAT-ului: O metodă de reestimare a scorurilor SAT. Harvard Educational Review, 73(1), 1-42.
Hoover, E. (2006, 21 octombrie). Scorurile SAT înregistrează cea mai mare scădere din ultimii 31 de ani. Chronicle of Higher Education, 53(10), A1.
Jacobson, L. (2006). Sondajul neregulilor la teste: Texas lansează o anchetă privind copiatul la examene. Education Week, 28(1), 28
Jerald, C. D (2006,August).The Hidden costs of curriculum narrowing. Issue Brief, Washington DC: The Center for Comprehensive School Reform and Improvement. Accesat la 21 noiembrie 2006 de la www.centerforcsri.org/
Popham, W. J. (2004). Școlile „falimentare” din America. Cum pot părinții și profesorii să copieze cu No Child Left Behind. New York: Routledge Falmer.
.
Popham, W. J. (2006). Trișarea educatorilor la testele No Child Left Behind. Săptămâna educațională, 25(32) 32-33.
Recht, D. R. & Leslie, L. (1988). Efectul cunoștințelor anterioare asupra memoriei textului de către cititorii buni și slabi. Journal of Educational Psychology 80, 16-20.
Young, J. W. (2004). Validitate diferențială și predicție: Diferențe de rasă și sex în testele de admitere la facultate. În R. Zwick (Ed). Rethinking the SAT: The future of standardized testing in university admissions. New York (pp. 289-301). Routledge Falmer.