Share on

Definicje statystyk > Contingency Table

Contingency Table: Overview

Please accept statistics, marketing cookies to watch this video.

Tablice kontyngencji (zwane również crosstabs lub two-way tables) są używane w statystyce do podsumowania relacji pomiędzy kilkoma zmiennymi kategorycznymi. Tabela kontyngencji jest specjalnym rodzajem tabeli rozkładu częstości, gdzie dwie zmienne są pokazane jednocześnie.

Na przykład, badacz może badać związek pomiędzy AIDS a preferencjami seksualnymi. Dwie zmienne to AIDS i PREFERENCJA SEKSUALNA. Pytanie brzmi: „Czy istnieje znaczący związek między AIDS a preferencjami seksualnymi?”. Test chi kwadrat mógłby zostać przeprowadzony na tabeli, aby ustalić, czy istnieje związek między tymi dwiema zmiennymi.

Następująca tabela kontyngencji pokazuje ekspozycję na potencjalne źródło choroby przenoszonej przez żywność (w tym przypadku, lody). Z tabeli widać, że 13 osób w studium przypadku jadło lody; 17 osób nie jadło:

Obraz: Michigan Dept. of Agriculture

Na powyższym obrazku znajduje się obliczenie Odds Ratio. Aby uzyskać więcej informacji, zobacz: What is the Odds Ratio?

Chi-Square Tests

Test chi2 może być przeprowadzony na tabelach kontyngencji, aby sprawdzić, czy istnieje związek między zmiennymi. Efekty te są definiowane jako relacje między wierszami i kolumnami. Test chi2:


Gdzie „O” jest wartością obserwowaną, „E” jest wartością oczekiwaną, a „i” jest „i-tą” pozycją w tabeli. Sigma (Σ) jest symbolem sumowania. Poniższy rysunek pokazuje, jak może wyglądać tabela kontyngencji z twoimi danymi oraz wyniki testu chi2 na twoich danych. Mała wartość chi2 oznacza, że istnieje niewielki związek między zmiennymi kategorycznymi. Duża wartość chi2 oznacza, że istnieje zdecydowana korelacja między tymi dwiema zmiennymi. Ponieważ istnieją dość mocne dowody na to, że orientacja seksualna jest związana z wyższym ryzykiem zachorowania na AIDS, nie jest niespodzianką, że wartość chi2 jest dość wysoka:


Jednakże uwaga pod wynikami stwierdza, że „4 komórki (66,7%) mają oczekiwaną liczbę mniejszą niż 5.” Generalnie, jeśli jest to ponad 25%, to wynik może być spowodowany wyłącznie przypadkiem. Dlatego wyniki tego konkretnego testu nie są statystycznie istotne.

Tabela kontyngencji w Excelu

Tabele kontyngencji są notorycznie pracochłonne w produkcji i obejmują obliczanie oczekiwanej częstości dla każdej komórki. Procedurę dodatkowo komplikuje fakt, że być może trzeba będzie wprowadzić poprawkę na ciągłość, jeśli oczekiwana częstotliwość komórek jest mniejsza niż 5 (poprawka na ciągłość dla tabel 2 x 2 nazywana jest poprawką Yatesa). Wiele popularnych programów ma możliwość tworzenia tabel kontyngencji, w tym Microsoft Excel (zauważ, że nawet w Excelu proces ten jest dość skomplikowany i obejmuje tworzenie tabel przestawnych).

Tabela kontyngencji w Excelu jest tworzona w Excelu za pomocą narzędzia Tabela przestawna. Obejrzyj ten dwuczęściowy film o tym, jak utworzyć jedną w programie Excel 2013:

Proszę zaakceptować statystyki, marketingowe pliki cookie, aby obejrzeć ten film.

Agresti, A. An Introduction to Categorical Data Analysis (Wiley Series in Probability and Statistics) 3rd Edition, 2018.

Image credit: Missouri State University

CITE THIS AS:
Stephanie Glen. „Contingency Table: What is it used for?” Z StatisticsHowTo.com: Elementarna statystyka dla reszty z nas! https://www.statisticshowto.com/what-is-a-contingency-table/

——————————————————————————

Potrzebujesz pomocy z zadaniem domowym lub pytaniem testowym? Dzięki Chegg Study możesz uzyskać rozwiązania swoich pytań krok po kroku od eksperta w danej dziedzinie. Pierwsze 30 minut z korepetytorem Chegg jest bezpłatne!

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.