Definizioni statistiche >Tabella di contingenza
Tabella di contingenza: Panoramica
Le tabelle di contingenza (chiamate anche tabelle incrociate o tabelle a due vie) sono usate in statistica per riassumere la relazione tra diverse variabili categoriche. Una tabella di contingenza è un tipo speciale di tabella di distribuzione di frequenza, dove due variabili sono mostrate simultaneamente.
Per esempio, un ricercatore potrebbe indagare la relazione tra AIDS e preferenze sessuali. Le due variabili sarebbero AIDS e PREFERENZA SESSUALE. La domanda è “C’è una relazione significativa tra l’AIDS e la preferenza sessuale? Un test chi-quadro potrebbe essere eseguito sulla tabella per determinare se c’è una relazione tra le due variabili.
La seguente tabella di contingenza mostra l’esposizione a una potenziale fonte di malattia alimentare (in questo caso, il gelato). Dalla tabella, si può vedere che 13 persone in un caso studio hanno mangiato il gelato; 17 persone non l’hanno fatto:
Immagine: Michigan Dept. of Agriculture
Nell’immagine sopra, c’è un calcolo dell’Odds Ratio. Per maggiori informazioni, vedere: Cos’è l’Odds Ratio?
Test del chi-quadro
Un test del chi2 può essere condotto sulle tabelle di contingenza per verificare se esiste o meno una relazione tra le variabili. Questi effetti sono definiti come relazioni tra righe e colonne. Il test chi2:
dove “O” è il valore osservato, “E” è il valore atteso e “i” è la posizione “iesima” nella tabella. Il sigma (Σ) è il simbolo della somma. L’immagine seguente mostra come potrebbe apparire la vostra tabella di contingenza con i vostri dati, più i risultati dell’esecuzione di un test chi2 sui vostri dati. Un piccolo valore di chi2 significa che c’è poca relazione tra le variabili categoriche. Un valore chi2 grande significa che c’è una chiara correlazione tra le due variabili. Siccome ci sono delle prove piuttosto forti che l’orientamento sessuale è legato ad un rischio più alto di contrarre l’AIDS, non è una sorpresa che il valore chi2 sia piuttosto alto:
Tuttavia, la nota sotto i risultati afferma che “4 cellule (66,7%) hanno un conteggio atteso inferiore a 5”. Generalmente, se questo è superiore al 25%, il risultato potrebbe essere dovuto solo al caso. Pertanto, i risultati di questo particolare test non sono statisticamente significativi.
Tabella di contingenza in Excel
Le tabelle di contingenza sono notoriamente laboriose da produrre e comportano il calcolo della frequenza attesa per ogni cella. La procedura è ulteriormente complicata dal fatto che potresti dover fare una correzione per la continuità se la frequenza attesa delle celle è inferiore a 5 (la correzione per la continuità per le tabelle 2 x 2 è chiamata correzione Yates). Molti programmi popolari hanno la capacità di fare tabelle di contingenza, incluso Microsoft Excel (si noti che anche in Excel, il processo è abbastanza complicato, coinvolgendo la creazione di tabelle pivot).
Una tabella di contingenza in Excel viene creata in Excel con lo strumento Tabella pivot. Guarda questo video in due parti su come crearne una in Excel 2013:
Agresti, A. An Introduction to Categorical Data Analysis (Wiley Series in Probability and Statistics) 3rd Edition, 2018.
Image credit: Missouri State University
Stephanie Glen. “Tabella di contingenza: A cosa serve?” Da StatisticsHowTo.com: Statistica elementare per il resto di noi! https://www.statisticshowto.com/what-is-a-contingency-table/
——————————————————————————
Hai bisogno di aiuto per un compito a casa o per un test? Con Chegg Study, puoi ottenere soluzioni passo dopo passo alle tue domande da un esperto del settore. I tuoi primi 30 minuti con un tutor Chegg sono gratuiti!