Molte persone hanno opinioni molto forti sul ruolo dei test standardizzati nell’educazione. Alcuni credono che forniscano un modo imparziale per determinare le abilità cognitive di un individuo e la qualità di una scuola o di un distretto. Altri credono che i punteggi dei test standardizzati siano capricciosi, non rappresentino ciò che gli studenti sanno e siano fuorvianti quando vengono usati per scopi di responsabilità. Molti psicologi dell’educazione ed esperti di test hanno una visione sfumata e fanno distinzioni tra le informazioni che i test standardizzati possono fornire sulle prestazioni degli studenti e come i risultati dei test vengono interpretati e utilizzati. In questa visione sfumata, molti dei problemi associati ai test standardizzati derivano dal loro uso ad alta posta in gioco, come l’uso delle prestazioni di un test per determinare la selezione in un programma, la laurea, o la licenza, o giudicare una scuola come ad alto o basso rendimento.
I test standardizzati sono di parte?
In una società multiculturale una domanda cruciale è: i test standardizzati sono di parte contro certe classi sociali, razze o gruppi etnici? Questa domanda è molto più complicata di quanto sembri, perché bias ha una varietà di significati. Un significato quotidiano di pregiudizio spesso coinvolge l’equità di usare i risultati dei test standardizzati per prevedere il potenziale rendimento di studenti svantaggiati che hanno avuto poche risorse educative in precedenza. Per esempio, se a Dwayne, uno studente di scuola superiore che ha lavorato duramente ma ha avuto limitate opportunità educative a causa delle scuole povere del suo quartiere e delle poche risorse educative della sua casa, venisse negato il diploma di scuola superiore a causa del suo punteggio in un test. Non è stata colpa sua se non ha avuto le risorse educative e se gli è stata data una possibilità con un cambiamento del suo ambiente (per esempio andando al college) il suo rendimento può fiorire. In questa visione, i punteggi dei test riflettono le disuguaglianze sociali e possono punire gli studenti che sono meno privilegiati, e sono spesso erroneamente interpretati come un riflesso di una capacità ereditaria fissa. I ricercatori tipicamente considerano il bias in modi più tecnici e tre questioni saranno discusse: contenuto e formato degli item; accuratezza delle previsioni e minaccia degli stereotipi.
Contenuto e formato degli item. I test possono essere più difficili per alcuni gruppi che per altri. Un esempio di pregiudizio di classe sociale in un item a scelta multipla chiedeva agli studenti il significato del termine campo. Agli studenti è stato chiesto di leggere la frase iniziale in corsivo e poi selezionare la risposta che aveva lo stesso significato di campo (Popham 2004, p. 24):
- Il campo di mio padre è la computer grafica.
- Il lanciatore poteva mettere in campo la sua posizione
- Abbiamo preparato il campo arandolo
- Il dottore ha esaminato il mio campo visivo
- Che campo entrerai dopo il college?
I figli dei professionisti hanno maggiori probabilità di capire questo significato di campo poiché medici, giornalisti e avvocati hanno dei “campi”, mentre i cassieri e gli addetti alla manutenzione hanno dei lavori per cui i loro figli hanno meno probabilità di conoscere questo significato di campo. (La risposta corretta è 4).
Le società di test cercano di minimizzare questo tipo di problemi di contenuto facendo rivedere gli item a sviluppatori di test provenienti da una varietà di background ed esaminando statisticamente se certi gruppi trovano alcuni item più facili o più difficili. Tuttavia, i problemi esistono e una recente analisi dei test SAT verbali ha indicato che i bianchi tendono a ottenere punteggi migliori su domande facili mentre gli afroamericani, gli ispanoamericani e gli asiatici americani ottengono punteggi migliori su domande difficili (Freedle, 2002). Anche se queste differenze non sono grandi, possono influenzare i punteggi del test. I ricercatori pensano che gli item facili che coinvolgono parole che sono usate nella conversazione di tutti i giorni possono avere significati sottilmente diversi nelle diverse sottoculture, mentre le parole difficili (es. veemenza, sicofante) non sono usate in tutte le conversazioni e quindi non hanno queste variazioni di significato. Anche il formato del test può influenzare le prestazioni. Le femmine tipicamente ottengono un punteggio migliore alle domande di saggio e quando il SAT ha recentemente aggiunto una componente di saggio, i punteggi verbali complessivi del SAT delle femmine sono migliorati rispetto ai maschi (Hoover, 2006).
Precisione delle previsioni
I test standardizzati sono usati tra gli altri criteri per determinare chi sarà ammesso ai college selettivi. Questa pratica è giustificata da prove di validità predittiva, cioè i punteggi dell’ACT o SAT sono usati per prevedere i voti del primo anno di college. Studi recenti hanno dimostrato che le previsioni per gli studenti neri e latini sono meno accurate che per gli studenti bianchi e che i predittori per le studentesse sono meno accurati degli studenti maschi (Young, 2004). Tuttavia, forse in modo sorprendente, i punteggi dei test tendono a prevedere leggermente di più il successo al college per gli studenti neri e latini, vale a dire che questi studenti hanno la probabilità di raggiungere medie dei voti inferiori a quelle previste dai punteggi dei loro test. Al contrario, i punteggi dei test tendono a prevedere un po’ meno il successo all’università per le studentesse, vale a dire che è probabile che queste studentesse raggiungano medie dei voti più alte di quelle previste dai punteggi dei loro test. I ricercatori non sono sicuri del perché ci siano differenze nell’accuratezza con cui i test SAT e ACT predicono i voti delle matricole.
Minaccia agli stereotipi
I gruppi che sono stereotipati negativamente in qualche area, come il rendimento delle donne in matematica, sono in pericolo di minaccia agli stereotipi, cioè la preoccupazione che gli altri li vedano attraverso le lenti negative o stereotipate (Aronson & Steele, 2005). Gli studi hanno dimostrato che le prestazioni nei test di gruppi stereotipati (ad esempio, afroamericani, latini, donne) diminuiscono quando si sottolinea a coloro che fanno il test che (a) il test è di alto livello, misura l’intelligenza o la matematica e (b) viene loro ricordata la loro etnia, razza o sesso (ad esempio, chiedendo loro prima del test di completare un breve questionario demografico). Anche se gli individui credono di essere competenti, la minaccia degli stereotipi può ridurre la capacità della memoria di lavoro perché gli individui stanno cercando di sopprimere gli stereotipi negativi. La minaccia degli stereotipi sembra particolarmente forte per quegli individui che desiderano avere buone prestazioni. I punteggi dei test standardizzati di individui provenienti da gruppi stereotipati possono sottostimare significativamente la loro effettiva competenza in situazioni di test a bassa valutazione.
Gli insegnanti insegnano ai test?
Ci sono prove che le scuole e gli insegnanti adattano il curriculum in modo da riflettere ciò che è presente nei test e preparano anche gli studenti al formato e ai tipi di elementi del test. Diverse indagini sugli insegnanti delle scuole elementari hanno indicato che nel 2004 è stato dedicato più tempo alla matematica e alla lettura e meno agli studi sociali e alle scienze rispetto al 1990 (Jerald, 2006). I presidi delle scuole con un alto numero di iscrizioni di minoranze in quattro stati hanno riferito nel 2003 di aver ridotto il tempo dedicato alle arti. Recenti ricerche nelle scienze cognitive suggeriscono che la comprensione della lettura in una materia (per esempio scienze o studi sociali) richiede che gli studenti comprendano molto vocabolario e conoscenze di base in quella materia (Recht & Leslie, 1988). Questo significa che anche se gli studenti acquisiscono buone capacità di lettura, troveranno difficile l’apprendimento delle scienze e degli studi sociali se è stato dedicato poco tempo a queste materie.
Fare un test con un formato non familiare può essere difficile, così gli insegnanti aiutano gli studenti a prepararsi per formati di test e articoli specifici (ad esempio, doppia negazione in articoli a scelta multipla; risposta costruita). All’inizio di questo capitolo un’insegnante di scuola media, Erin, e il preside Mucci hanno descritto l’enfasi della preparazione ai test nelle loro scuole. C’è una crescente preoccupazione che la quantità di preparazione ai test che si sta verificando nelle scuole sia eccessiva e che gli studenti non vengano istruiti ma addestrati a fare i test (Popham, 2004).
Gli studenti e gli educatori imbrogliano?
E’ difficile ottenere buoni dati su quanto sia diffuso l’imbroglio, ma sappiamo che gli studenti che fanno i test imbrogliano e altri, inclusi gli amministratori dei test, li aiutano ad imbrogliare (Cizek, 2003; Popham 2006). Le misure per prevenire l’imbroglio da parte degli studenti includono la protezione della sicurezza dei test, assicurandosi che gli studenti capiscano le procedure di somministrazione, impedendo agli studenti di portare i loro appunti o dispositivi elettronici non approvati e di guardare le risposte degli altri. Alcuni insegnanti e presidi sono stati sorpresi a usare pratiche non etiche per la preparazione dei test, come dare agli studenti gli elementi del test appena prima delle prove, dare agli studenti più tempo di quello consentito, rispondere alle domande degli studenti sugli elementi del test e cambiare effettivamente le risposte degli studenti (Popham, 2006). Le preoccupazioni in Texas riguardo agli imbrogli hanno portato alla creazione di una task force indipendente nell’agosto 2006 con 15 membri dello staff della Texas Education Agency incaricati di indagare sulle scorrettezze dei test. (Jacobson, 2006). Mentre la pressione sulle scuole e sugli insegnanti affinché i loro studenti ottengano buoni risultati è grande, queste pratiche sono chiaramente immorali e hanno portato al licenziamento del personale scolastico (Cizek, 2003).
Aronson, J., & Steele, C. M. (2005). Stereotipi e la fragilità della competenza accademica, della motivazione e del concetto di sé. In A. J. Elliott & C. S. Dweck (Eds.). Manuale di competenza e motivazione. (pp.436-456) Guilford Publications, New York.
Cizek, G. J. (2003). Rilevare e prevenire l’imbroglio in classe: Promuovere l’integrità nella valutazione. Corwin Press, Thousand Oaks, CA.
Freedle, R. O. (2003). Correggere le distorsioni etniche e di classe sociale del SAT: Un metodo per rivalutare i punteggi del SAT. Harvard Educational Review, 73(1), 1-42.
Hoover, E. (2006, 21 ottobre). I punteggi SAT vedono il più grande calo in 31 anni. Chronicle of Higher Education, 53(10), A1.
Jacobson, L. (2006). Irregolarità nei test: Il Texas lancia un’inchiesta sugli imbrogli agli esami. Education Week, 28(1), 28
Jerald, C. D (2006, agosto).The Hidden costs of curriculum narrowing. Issue Brief, Washington DC: The Center for Comprehensive School Reform and Improvement. Accessed November 21, 2006 from www.centerforcsri.org/
Popham, W. J. (2004). Le scuole “fallimentari” d’America. Come genitori e insegnanti possono copiare con No Child Left Behind. New York: Routledge Falmer.
Popham, W. J. (2006). L’imbroglio degli educatori nei test di No Child Left Behind. Educational Week, 25(32) 32-33.
Recht, D. R. & Leslie, L. (1988). Effetto della conoscenza precedente sulla memoria del testo di buoni e poveri lettori. Journal of Educational Psychology 80, 16-20.
Young, J. W. (2004). Validità differenziale e predizione: Differenze di razza e di sesso nei test di ammissione al college. In R. Zwick (Ed). Ripensare il SAT: The future of standardized testing in university admissions. New York (pp. 289-301). Routledge Falmer.