La prueba χ2 se utiliza para determinar si la distribución de frecuencias en los valores de una variable se aparta de los que se esperaría a partir de una distribución aleatoria de casos. En el caso más sencillo -que ejemplifico aquí- se supone que todos los valores de la variable tienen la misma probabilidad de ocurrir. En este ejemplo, se presentan 32 casos en los que se registra la frecuencia con la que se presenta cada uno de los 3 valores de una variable hipotética.
Var 1 | 2 | 3 | 1 | 1 | 1 | 1 | 2 | 1 | 1 | 2 | 2 | 3 | 1 | 1 | 2 | 1 | 2 | 1 | 2 | 1 | 1 | 2 | 3 | 3 | 1 | 1 | 1 | 2 | 3 | 1 | 2 | 3 |
El primer paso es contar cuántas veces se presenta cada uno de los valores de la variable. La Tabla 1 muestra las frecuencias observadas de cada valor de la variable en el conjunto de datos (O).
Valor | 1 | 2 | 3 | Total |
Frecuencia | 16 | 10 | 6 | 32 |
Asumiendo que los valores de la variable son equiprobables, la frecuencia esperada (E) de cada valor se obtiene dividiendo el número de casos entre el número de valores de la variable:
Ej = N / J
Donde N es el número de casos y J el número de valores de la variable en cuestión. En la Tabla 2 se muestran las frecuencias esperadas para este ejemplo.
Valor | 1 | 2 | 3 |
Frecuencia Esperada |
10.67 | 10.67 | 10.67 |
Finalmente, para cada celda se divide el valor (Ej-Oj)2 entre el valor Ej de acuerdo con la fórmula:
La Tabla 3 muestra estos resultados para cada celda:
Valor | 1 | 2 | 3 |
Cociente | 2.667 | 0.042 | 2.042 |
χ2 =
4.75
La significancia del valor χ2 se consulta en la tabla de la distribución χ2 con grados de libertad igual al número de valores de la variable menos 1:
gl = J-1 =2