Statistikdefinitioner >Kontingenttabell
Kontingenttabell: Översikt
Kontingenstabeller (även kallade korsstabeller eller tvåvägstabeller) används inom statistiken för att sammanfatta förhållandet mellan flera kategoriska variabler. En contingencytabell är en speciell typ av frekvensfördelningstabell, där två variabler visas samtidigt.
En forskare kan till exempel undersöka förhållandet mellan aids och sexuell preferens. De två variablerna skulle vara aids och sexuell preferens. Frågan är ”Finns det ett signifikant samband mellan aids och sexuell preferens?”. Ett chi-två-test skulle sedan kunna utföras på tabellen för att avgöra om det finns ett samband mellan de två variablerna.
Följande kontingenstabell visar exponering för en potentiell källa till livsmedelsburna sjukdomar (i det här fallet glass). Av tabellen kan du se att 13 personer i en fallstudie åt glass; 17 personer åt inte glass:
Bild: I bilden ovan finns en beräkning av Odds Ratio. För mer information, se:
Chi2-test
Ett chi2-test kan utföras på kontingenstabeller för att testa om det finns ett samband mellan variabler eller inte. Dessa effekter definieras som relationer mellan rader och kolumner. Chi2-testet:
Varvid ”O” är det observerade värdet, ”E” är det förväntade värdet och ”i” är den ”i:e” positionen i tabellen. Sigma (Σ) är en summeringssymbol. Följande bild visar hur din kontingenta tabell kan se ut med dina data, plus resultaten från att köra ett chi2-test på dina data. Ett litet chi2-värde innebär att det finns ett litet samband mellan de kategoriska variablerna. Ett stort chi2-värde innebär att det finns ett tydligt samband mellan de två variablerna. Eftersom det finns ganska starka bevis för att sexuell läggning är kopplad till en högre risk att drabbas av aids, är det ingen överraskning att chi2-värdet är ganska högt:
I anmärkningen under resultaten står det dock att ”4 celler (66,7 %) har ett förväntat antal som är mindre än 5”. I allmänhet, om detta är över 25 %, kan resultatet bero enbart på slumpen. Därför är resultaten från just det här testet inte statistiskt signifikanta.
Kontingenttabell i Excel
Kontingenttabeller är notoriskt arbetskrävande att ta fram och innebär att man måste beräkna den förväntade frekvensen för varje cell. Förfarandet kompliceras ytterligare av att du kan behöva göra en korrigering för kontinuitet om den förväntade cellfrekvensen är lägre än 5 (korrigeringen för kontinuitet för 2 x 2 tabeller kallas Yates-korrigering). Många populära program har möjlighet att göra kontingenstabeller, bland annat Microsoft Excel (observera att även i Excel är processen ganska komplicerad och innebär att man måste skapa pivottabeller).
En kontingenstabell i Excel skapas i Excel med verktyget Pivottabell. Titta på denna video i två delar om hur man skapar en sådan i Excel 2013:
Agresti, A. An Introduction to Categorical Data Analysis (Wiley Series in Probability and Statistics) 3rd Edition, 2018.
Bildkredit: Missouri State University
Stephanie Glen. ”Contingency Table: Vad används den till?” Från StatisticsHowTo.com: Elementär statistik för oss andra! https://www.statisticshowto.com/what-is-a-contingency-table/
——————————————————————————
Behövs hjälp med en läxa eller en provfråga? Med Chegg Study kan du få steg-för-steg-lösningar på dina frågor från en expert inom området. Dina första 30 minuter med en Chegg-handledare är gratis!