Définitions des statistiques >Tableau de contingence
Tableau de contingence : Vue d’ensemble
Les tableaux de contingence (également appelés tableaux croisés ou tableaux à deux voies) sont utilisés en statistiques pour résumer la relation entre plusieurs variables catégorielles. Un tableau de contingence est un type spécial de tableau de distribution de fréquences, où deux variables sont présentées simultanément.
Par exemple, un chercheur pourrait étudier la relation entre le sida et la préférence sexuelle. Les deux variables seraient le SIDA et la PRÉFÉRENCE SEXUELLE. La question est « Existe-t-il une relation significative entre le SIDA et la préférence sexuelle ? ». Un test de chi carré pourrait alors être exécuté sur le tableau pour déterminer s’il existe une relation entre les deux variables.
Le tableau de contingence suivant montre l’exposition à une source potentielle de maladie d’origine alimentaire (dans ce cas, la crème glacée). À partir du tableau, vous pouvez voir que 13 personnes dans une étude de cas ont mangé de la crème glacée ; 17 personnes n’en ont pas mangé :
Image : Michigan Dept. of Agriculture
Dans l’image ci-dessus, il y a un calcul du rapport de cotes. Pour plus d’informations, voir : Qu’est-ce que l’Odds Ratio?
Tests du chi-carré
Un test du chi2 peut être effectué sur des tableaux de contingence pour tester si une relation existe ou non entre les variables. Ces effets sont définis comme des relations entre les lignes et les colonnes. Le test du chi2 :
Où « O » est la valeur observée, « E » est la valeur attendue et « i » est la « ième » position dans le tableau. Le sigma (Σ) est le symbole de la sommation. L’image suivante montre à quoi pourrait ressembler votre tableau de contingence avec vos données, ainsi que les résultats de l’exécution d’un test du chi2 sur vos données. Une petite valeur de chi2 signifie qu’il y a peu de relation entre les variables catégorielles. Une valeur de chi2 élevée signifie qu’il existe une corrélation certaine entre les deux variables. Comme il existe des preuves assez solides que l’orientation sexuelle est liée à un risque plus élevé de contracter le sida, il n’est pas surprenant que la valeur du chi2 soit plutôt élevée :
Cependant, la note sous les résultats indique que « 4 cellules (66,7%) ont un nombre attendu inférieur à 5. » En général, si ce chiffre est supérieur à 25 %, le résultat pourrait être dû au seul hasard. Par conséquent, les résultats de ce test particulier ne sont pas statistiquement significatifs.
Tableau de contingence dans Excel
Les tableaux de contingence sont notoirement laborieux à produire et impliquent le calcul de la fréquence attendue pour chaque cellule. La procédure est encore compliquée par le fait que vous pouvez avoir à effectuer une correction de continuité si la fréquence attendue des cellules est inférieure à 5 (la correction de continuité pour les tableaux 2 x 2 est appelée la correction de Yates). De nombreux programmes populaires ont la capacité de faire des tableaux de contingence, y compris Microsoft Excel (notez que même dans Excel, le processus est assez compliqué, impliquant la création de tableaux croisés dynamiques).
Un tableau de contingence dans Excel est créé dans Excel avec l’outil Tableau croisé dynamique. Regardez cette vidéo en deux parties sur la façon d’en créer un dans Excel 2013 :
Agresti, A. Une introduction à l’analyse des données catégorielles (Wiley Series in Probability and Statistics) 3e édition, 2018.
Crédit image : Missouri State University
Stephanie Glen. « Tableau de contingence : A quoi sert-il ? » De StatisticsHowTo.com : Des statistiques élémentaires pour le reste d’entre nous ! https://www.statisticshowto.com/what-is-a-contingency-table/
——————————————————————————
Vous avez besoin d’aide pour un devoir ou une question de test ? Avec Chegg Study, vous pouvez obtenir des solutions étape par étape à vos questions de la part d’un expert dans le domaine. Vos 30 premières minutes avec un tuteur Chegg sont gratuites !