Definiciones de estadísticas >Tabla de contingencia
Tabla de contingencia: Visión general
Las tablas de contingencia (también llamadas tablas cruzadas o tablas de dos vías) se utilizan en estadística para resumir la relación entre varias variables categóricas. Una tabla de contingencia es un tipo especial de tabla de distribución de frecuencias, donde se muestran dos variables simultáneamente.
Por ejemplo, un investigador podría estar investigando la relación entre el SIDA y la preferencia sexual. Las dos variables serían SIDA y PREFERENCIA SEXUAL. La pregunta es «¿Existe una relación significativa entre el SIDA y la preferencia sexual?». A continuación, se podría realizar una prueba de chi-cuadrado en la tabla para determinar si existe una relación entre las dos variables.
La siguiente tabla de contingencia muestra la exposición a una fuente potencial de enfermedades transmitidas por los alimentos (en este caso, los helados). En la tabla se puede ver que 13 personas de un estudio de caso comieron helado; 17 personas no lo hicieron:
Imagen: Michigan Dept. of Agriculture
En la imagen anterior, hay un cálculo de Odds Ratio. Para más información, consulte: ¿Qué es el Odds Ratio?
Pruebas de chi-cuadrado
Se puede realizar una prueba de chi2 en tablas de contingencia para comprobar si existe o no una relación entre las variables. Estos efectos se definen como relaciones entre filas y columnas. La prueba chi2:
Donde «O» es el valor observado, «E» es el valor esperado e «i» es la «iésima» posición en la tabla. La sigma (Σ) es el símbolo de la suma. La siguiente imagen muestra el aspecto que podría tener la tabla de contingencia con sus datos, además de los resultados de ejecutar una prueba chi2 en sus datos. Un valor de chi2 pequeño significa que hay poca relación entre las variables categóricas. Un valor de chi2 grande significa que hay una correlación definitiva entre las dos variables. Dado que existen pruebas bastante sólidas de que la orientación sexual está relacionada con un mayor riesgo de contraer el SIDA, no es de extrañar que el valor de chi2 sea bastante alto:
Sin embargo, la nota bajo los resultados indica que «4 celdas (66,7%) tienen un recuento esperado inferior a 5». Por lo general, si este porcentaje es superior al 25%, el resultado podría deberse únicamente al azar. Por lo tanto, los resultados de esta prueba en particular no son estadísticamente significativos.
Tabla de contingencia en Excel
Las tablas de contingencia son notoriamente laboriosas de producir e implican el cálculo de la frecuencia esperada para cada celda. El procedimiento se complica aún más por el hecho de que es posible que tenga que hacer una corrección por continuidad si la frecuencia esperada de las celdas es inferior a 5 (la corrección por continuidad para las tablas de 2 x 2 se llama corrección de Yates). Muchos programas populares tienen la capacidad de hacer tablas de contingencia, incluyendo Microsoft Excel (tenga en cuenta que incluso en Excel, el proceso es bastante complicado, que implica la creación de tablas dinámicas).
Una tabla de contingencia en Excel se crea en Excel con la herramienta de tabla dinámica. Vea este vídeo de dos partes sobre cómo crear una en Excel 2013:
Agresti, A. An Introduction to Categorical Data Analysis (Wiley Series in Probability and Statistics) 3rd Edition, 2018.
Crédito de la imagen: Missouri State University
Stephanie Glen. «Tabla de contingencia: ¿Para qué se utiliza?» De StatisticsHowTo.com: ¡Estadística elemental para el resto de nosotros! https://www.statisticshowto.com/what-is-a-contingency-table/
——————————————————————————
¿Necesitas ayuda con los deberes o con un examen? Con Chegg Study, puede obtener soluciones paso a paso a sus preguntas de un experto en la materia. ¡Tus primeros 30 minutos con un tutor de Chegg son gratis!