Tablas de distribucion

Distribución muestral.

Cuando se selecciona aleatoriamente un elemento de una población y se le mide con base en una variable aleatoria que puede asumir M valores dentro del rango [0 .. (M-1)], la probabilidad de obtener el valor x será igual a 1/M. Si en lugar de tomar un sólo elemento se obtiene una muestra con N elementos, el número de muestras posibles con diferente composición será igual a M^N. Para cada muestra es posible obtener un valor representativo tal como la media la suma, la varianza, la moda, etcétera. Si calculamos las sumas de los valores de cada muestra, es posible obtener valores entre 0 -si todos los elementos tienen un valor de 0- hasta (M-1) * N -si todos los elementos tienen un valor de M-1. En este caso, cada valor posible es llamado un punto muestral y el conjunto total de muestras diferentes que es posible obtener recibe el nombre de espacio muestral.

Se puede obtener la probabilidad de cada punto muestral si se divide la frecuencia con que ocurre cada punto muestral entre el número total de muestras posibles. Ahora se tiene una distribución muestral, que se define como una representación de todos los valores que pueden resultar de una muestra de tamaño N junto con la probabilidad asociada a cada uno de ellos. Esta representación se puede hacer mediante una tabla, una figura o una fórmula.

Abajo se presentan dos distribuciones muestrales. En la primera se tienen muestras con cinco elementos y una variable con dos valores. En la segunda se tienen muestras con cuatro elementos y una variable con dos valores.

Una vez que haya comprendido esta breve exposición, le recomiendo que visite este enlace para observar varias distribuciones muestrales en las cuales se mantiene fijo el tamño de la muestra mientras se varía el número de valores que puede asumir la variable.

Este otro enlace muestra también una familia de distribuciones muestrales, pero a diferencia de la anterior, se mantiene fijo el número de valores de la variable mientras se varía el tamaño de la muestra.

Note que aunque cambia el número de valores de la distribución muestral, si se toma en cuenta la distancia entre X y la media en unidades de desviación estándar (puntuación z, o puntuación tipificada), tanto la forma de la distribución como el rango se mantienen más o menos estables. En estas distribuciones se anota en la abscisa el valor z de cada punto muestral para poder comparar las distribuciones entre sí. También se suprimen las tablas de frecuencias para hacer más compacta la p gina. Por otro lado, se pretende también mostrar de qué manera al aumentar el tamaño de la muestra o la continuidad de la variable, la forma de la distribución muestral se aproxima gradualmente a la forma de la distribución normal

Ejemplos de distribuciones muestrales

Valores muestrales
S 4 S 3 S 2 S 1 S 0 Suma

0 0 0 0 0 0

0 0 0 0 1 1

0 0 0 1 0 1

0 0 0 1 1 2

0 0 1 0 0 1

0 0 1 0 1 2

0 0 1 1 0 2

0 0 1 1 1 3

0 1 0 0 0 1

0 1 0 0 1 2

0 1 0 1 0 2

0 1 0 1 1 3

0 1 1 0 0 2

0 1 1 0 1 3

0 1 1 1 0 3

0 1 1 1 1 4

1 0 0 0 0 1

1 0 0 0 1 2

1 0 0 1 0 2

1 0 0 1 1 3

1 0 1 0 0 2

1 0 1 0 1 3

1 0 1 1 0 3

1 0 1 1 1 4

1 1 0 0 0 2

1 1 0 0 1 3

1 1 0 1 0 3

1 1 0 1 1 4

1 1 1 0 0 3

1 1 1 0 1 4

1 1 1 1 0 4

1 1 1 1 1 5

Aquí se muestra una distribución compuesta por todas las muestras diferentes que se pueden formar con 5 elementos con base en una variable que puede asumir 2 valores enteros entre 0 y 1; en la tercera columna se incluye la suma de los elementos y finalmente, en la cuarta columna se muestra el valor z de X. Como se puede notar, aún cuando todas las muestras tienen la misma probabilidad de ser obtenidas, los valores muestrales no tienen la misma probabilidad de ocurrir: es más probable obtener un valor cercano al centro de la distribución que un valor alejado del promedio. Esto es más notable cuando aumenta el número de valores que puede asumir la variable, o al aumentar el tamaño de la muestra.
Media = 2.5000000
Desviación estándar = 1.1359237
Distribución muestral
X f fr Z

0 1 0.0313 -2.2009

1 5 0.1563 -1.3205

2 10 0.3125 -0.4402

3 10 0.3125 0.4402

4 5 0.1563 1.3205

5 1 0.0313 2.2009

Este conocimiento es útil para hacer suposiciones razonables acerca de la probabilidad de que una muestra aleatoria tenga un valor muestral que se encuentre dentro de cierto rango de interés.
Por ejemplo, la probabilidad de obtener un valor muestral menor que 2 (filas en color verde) es:

P_{(X < 2)} = P_(X=0) + P_(X=1) = 0.187500
Por otro lado, la probabilidad de obtener un valor muestral mayor o igual que 2 y menor o igual que 4 (filas en color azul) es:

P_{(2 <= X <= 4)} = P_(X=2) P_(X=3) P_(X=4) = 0.781250
Como último ejemplo, La probabilidad de obtener un valor muestral mayor que 4 (filas en color rojo) es:

P_{(X > 4)} = P_(X=5) = 0.031250

Ejemplos de distribuciones muestrales

Valores muestrales
S 3 S 2 S 1 S 0 Suma

0 0 0 0 0

0 0 0 1 1

0 0 0 2 2

0 0 1 0 1

0 0 1 1 2

0 0 1 2 3

0 0 2 0 2

0 0 2 1 3

0 0 2 2 4

0 1 0 0 1

0 1 0 1 2

0 1 0 2 3

0 1 1 0 2

0 1 1 1 3

0 1 1 2 4

0 1 2 0 3

0 1 2 1 4

0 1 2 2 5

0 2 0 0 2

0 2 0 1 3

0 2 0 2 4

0 2 1 0 3

0 2 1 1 4

0 2 1 2 5

0 2 2 0 4

0 2 2 1 5

0 2 2 2 6

1 0 0 0 1

1 0 0 1 2

1 0 0 2 3

1 0 1 0 2

1 0 1 1 3

1 0 1 2 4

1 0 2 0 3

1 0 2 1 4

1 0 2 2 5

1 1 0 0 2

1 1 0 1 3

1 1 0 2 4

1 1 1 0 3

1 1 1 1 4

1 1 1 2 5

1 1 2 0 4

1 1 2 1 5

1 1 2 2 6

1 2 0 0 3

1 2 0 1 4

1 2 0 2 5

1 2 1 0 4

1 2 1 1 5

1 2 1 2 6

1 2 2 0 5

1 2 2 1 6

1 2 2 2 7

2 0 0 0 2

2 0 0 1 3

2 0 0 2 4

2 0 1 0 3

2 0 1 1 4

2 0 1 2 5

2 0 2 0 4

2 0 2 1 5

2 0 2 2 6

2 1 0 0 3

2 1 0 1 4

2 1 0 2 5

2 1 1 0 4

2 1 1 1 5

2 1 1 2 6

2 1 2 0 5

2 1 2 1 6

2 1 2 2 7

2 2 0 0 4

2 2 0 1 5

2 2 0 2 6

2 2 1 0 5

2 2 1 1 6

2 2 1 2 7

2 2 2 0 6

2 2 2 1 7

2 2 2 2 8

Aquí se muestra una distribución compuesta por todas las muestras diferentes que se pueden formar con 4 elementos con base en una variable que puede asumir 3 valores enteros entre 0 y 2; en la tercera columna se incluye la suma de los elementos y finalmente, en la cuarta columna se muestra el valor z de X. Como se puede notar, aún cuando todas las muestras tienen la misma probabilidad de ser obtenidas, los valores muestrales no tienen la misma probabilidad de ocurrir: es más probable obtener un valor cercano al centro de la distribución que un valor alejado del promedio. Esto es más notable cuando aumenta el número de valores que puede asumir la variable, o al aumentar el tamaño de la muestra.
Media = 4.0000000
Desviación estándar = 1.6431677
Distribución muestral
X f fr Z

0 1 0.0123 -2.4343

1 4 0.0494 -1.8257

2 10 0.1235 -1.2172

3 16 0.1975 -0.6086

4 19 0.2346 0.0000

5 16 0.1975 0.6086

6 10 0.1235 1.2172

7 4 0.0494 1.8257

8 1 0.0123 2.4343

Este conocimiento es útil para hacer suposiciones razonables acerca de la probabilidad de que una muestra aleatoria tenga un valor muestral que se encuentre dentro de cierto rango de interés.
Por ejemplo, la probabilidad de obtener un valor muestral menor que 3 (filas en color verde) es:

P_{(X < 3)} = P_(X=0) + P_(X=1) + P_(X=2) = 0.185185
Por otro lado, la probabilidad de obtener un valor muestral mayor o igual que 4 y menor o igual que 6 (filas en color azul) es:

P_{(4 <= X <= 6)} = P_(X=4) P_(X=5) P_(X=6) = 0.555556
Como último ejemplo, La probabilidad de obtener un valor muestral mayor que 7 (filas en color rojo) es:

P_{(X > 7)} = P_(X=8) = 0.012346

Distribución muestral.

P(X < 2) = P(X=0) + P(X=1) = 0.187500

P(2 <= X <= 4) = P(X=2) P(X=3) P(X=4) = 0.781250

P(X > 4) = P(X=5) = 0.031250

P(X < 3) = P(X=0) + P(X=1) + P(X=2) = 0.185185

P(4 <= X <= 6) = P(X=4) P(X=5) P(X=6) = 0.555556

P(X > 7) = P(X=8) = 0.012346

P_{(X < 2)} = P_(X=0) + P_(X=1) = 0.187500

P_{(2 <= X <= 4)} = P_(X=2) P_(X=3) P_(X=4) = 0.781250

P_{(X > 4)} = P_(X=5) = 0.031250

P_{(X < 3)} = P_(X=0) + P_(X=1) + P_(X=2) = 0.185185

P_{(4 <= X <= 6)} = P_(X=4) P_(X=5) P_(X=6) = 0.555556

P_{(X > 7)} = P_(X=8) = 0.012346