Definiții statistice > Tabel de contingență
Tabel de contingență: Prezentare generală
Tabele de contingență (numite și tabele încrucișate sau tabele cu două direcții) sunt utilizate în statistică pentru a rezuma relația dintre mai multe variabile categorice. Un tabel de contingență este un tip special de tabel de distribuție a frecvențelor, în care două variabile sunt prezentate simultan.
De exemplu, un cercetător ar putea investiga relația dintre SIDA și preferințele sexuale. Cele două variabile ar fi SIDA și PREFERINȚA SEXUALĂ. Întrebarea este „Există o relație semnificativă între SIDA și preferința sexuală?”. Un test chi-pătrat ar putea fi apoi rulat pe tabel pentru a determina dacă există o relație între cele două variabile.
Următorul tabel de contingență arată expunerea la o sursă potențială de toxiinfecție alimentară (în acest caz, înghețata). Din tabel, puteți vedea că 13 persoane dintr-un studiu de caz au mâncat înghețată; 17 persoane nu au mâncat înghețată:
Imagine: Michigan Dept. of Agriculture
În imaginea de mai sus, există un calcul Odds Ratio. Pentru mai multe informații, a se vedea: What is the Odds Ratio?
Teste Chi-Square
Un test chi2 poate fi efectuat pe tabelele de contingență pentru a testa dacă există sau nu o relație între variabile. Aceste efecte sunt definite ca relații între rânduri și coloane. Testul chi2:
Unde „O” este valoarea observată, „E” este valoarea așteptată și „i” este a „i-a” poziție în tabel. Sigma (Σ) este simbolul de însumare. Următoarea imagine arată cum ar putea arăta tabelul de contingență cu datele dumneavoastră, plus rezultatele obținute în urma efectuării unui test chi2 pe datele dumneavoastră. O valoare mică a chi2 înseamnă că există o relație mică între variabilele categoriale. O valoare mare a chi2 înseamnă că există o corelație clară între cele două variabile. Având în vedere că există dovezi destul de puternice că orientarea sexuală este legată de un risc mai mare de a contracta SIDA, nu este surprinzător faptul că valoarea chi2 este destul de mare:
Cu toate acestea, nota de sub rezultate afirmă că „4 celule (66,7%) au un număr așteptat mai mic de 5”. În general, dacă aceasta este mai mare de 25%, rezultatul ar putea fi datorat doar întâmplării. Prin urmare, rezultatele acestui test particular nu sunt semnificative din punct de vedere statistic.
Tabele de contingență în Excel
Tabelele de contingență sunt, în mod notoriu, foarte laborioase pentru a fi produse și implică calcularea frecvenței așteptate pentru fiecare celulă. Procedura este complicată și mai mult de faptul că este posibil să trebuiască să faceți o corecție pentru continuitate dacă frecvența așteptată a celulelor este sub 5 (corecția pentru continuitate pentru tabelele 2 x 2 se numește corecția Yates). Multe programe populare au capacitatea de a realiza tabele de contingență, inclusiv Microsoft Excel (rețineți că, chiar și în Excel, procesul este destul de complicat, implicând crearea de tabele pivot).
Un tabel de contingență în Excel este creat în Excel cu ajutorul instrumentului Pivot Table. Urmăriți acest videoclip în două părți despre cum să creați unul în Excel 2013:
Agresti, A. An Introduction to Categorical Data Analysis (Wiley Series in Probability and Statistics) 3rd Edition, 2018.
Creditul imaginii: Missouri State University
Stephanie Glen. „Contingency Table: La ce se folosește?” De pe StatisticsHowTo.com: Statistică elementară pentru noi toți ceilalți! https://www.statisticshowto.com/what-is-a-contingency-table/
——————————————————————————
Nevoie de ajutor cu o temă pentru acasă sau o întrebare de test? Cu Chegg Study, puteți obține soluții pas cu pas la întrebările dvs. de la un expert în domeniu. Primele 30 de minute cu un tutore Chegg sunt gratuite!