Prueba χ2 para una variable

La prueba χ2 se utiliza para determinar si la distribución de frecuencias en los valores de una variable se aparta de los que se esperaría a partir de una distribución aleatoria de casos. En el caso más sencillo -que ejemplifico aquí- se supone que todos los valores de la variable tienen la misma probabilidad de ocurrir. En este ejemplo, se presentan 32 casos en los que se registra la frecuencia con la que se presenta cada uno de los 3 valores de una variable hipotética.

Tabla 1. Datos
Var 1 2 3 1 1 1 1 2 1 1 2 2 3 1 1 2 1 2 1 2 1 1 2 3 3 1 1 1 2 3 1 2 3

El primer paso es contar cuántas veces se presenta cada uno de los valores de la variable. La Tabla 1 muestra las frecuencias observadas de cada valor de la variable en el conjunto de datos (O).

Tabla 1. Frecuencias Observadas (O)
Valor 1 2 3 Total
Frecuencia 16 10 6 32

Asumiendo que los valores de la variable son equiprobables, la frecuencia esperada (E) de cada valor se obtiene dividiendo el número de casos entre el número de valores de la variable:

Ej = N / J

Donde N es el número de casos y J el número de valores de la variable en cuestión. En la Tabla 2 se muestran las frecuencias esperadas para este ejemplo.

Tabla 2. Frecuencias
Esperadas (E)
Valor 1 2 3
Frecuencia
Esperada
10.67 10.67 10.67

Finalmente, para cada celda se divide el valor (Ej-Oj)2 entre el valor Ej de acuerdo con la fórmula:

La Tabla 3 muestra estos resultados para cada celda:

Tabla 3. Cocientes por celda
Valor 1 2 3
Cociente 2.667 0.042 2.042

χ2 = 4.75

La significancia del valor χ2 se consulta en la tabla de la distribución χ2 con grados de libertad igual al número de valores de la variable menos 1: gl = J-1 =2