Cuando se selecciona aleatoriamente un elemento de una población y se le mide con base en una variable aleatoria que puede asumir M valores dentro del rango [0 .. (M-1)], la probabilidad de obtener el valor x será igual a 1/M. Si en lugar de tomar un sólo elemento se obtiene una muestra con N elementos, el número de muestras posibles con diferente composición será igual a MN. Para cada muestra es posible obtener un valor representativo tal como la media la suma, la varianza, la moda, etcétera. Si calculamos las sumas de los valores de cada muestra, es posible obtener valores entre 0 -si todos los elementos tienen un valor de 0- hasta (M-1) * N -si todos los elementos tienen un valor de M-1. En este caso, cada valor posible es llamado un punto muestral y el conjunto total de muestras diferentes que es posible obtener recibe el nombre de espacio muestral.
Se puede obtener la probabilidad de cada punto muestral si se divide la frecuencia con que ocurre cada punto muestral entre el número total de muestras posibles. Ahora se tiene una distribución muestral, que se define como una representación de todos los valores que pueden resultar de una muestra de tamaño N junto con la probabilidad asociada a cada uno de ellos. Esta representación se puede hacer mediante una tabla, una figura o una fórmula.
Abajo se presentan dos distribuciones muestrales. En la primera se tienen muestras con cinco elementos y una variable con dos valores. En la segunda se tienen muestras con cuatro elementos y una variable con dos valores.
Una vez que haya comprendido esta breve exposición, le recomiendo que visite este enlace para observar varias distribuciones muestrales en las cuales se mantiene fijo el tamño de la muestra mientras se varía el número de valores que puede asumir la variable.
Este otro enlace muestra también una familia de distribuciones muestrales, pero a diferencia de la anterior, se mantiene fijo el número de valores de la variable mientras se varía el tamaño de la muestra.
Note que aunque cambia el número de valores de la distribución muestral, si se toma en cuenta la distancia entre X y la media en unidades de desviación estándar (puntuación z, o puntuación tipificada), tanto la forma de la distribución como el rango se mantienen más o menos estables. En estas distribuciones se anota en la abscisa el valor z de cada punto muestral para poder comparar las distribuciones entre sí. También se suprimen las tablas de frecuencias para hacer más compacta la p gina. Por otro lado, se pretende también mostrar de qué manera al aumentar el tamaño de la muestra o la continuidad de la variable, la forma de la distribución muestral se aproxima gradualmente a la forma de la distribución normal
|
Aquí se muestra una distribución compuesta por todas las muestras diferentes
que se pueden formar con 5 elementos con base en una variable que puede
asumir 2 valores enteros entre 0 y 1; en la tercera columna se incluye la suma de los elementos y finalmente,
en la cuarta columna se muestra el valor z de X.
Como se puede notar, aún cuando todas las muestras tienen la misma probabilidad de
ser obtenidas, los valores muestrales no tienen la misma probabilidad de ocurrir:
es más probable obtener un valor cercano al centro de la distribución que un valor
alejado del promedio. Esto es más notable cuando aumenta el número de valores que
puede asumir la variable, o al aumentar el tamaño de la muestra.
Media = 2.5000000
Este conocimiento es útil para hacer suposiciones razonables acerca de la probabilidad de que una muestra aleatoria tenga un valor muestral que se encuentre dentro de cierto rango de interés. Por ejemplo, la probabilidad de obtener un valor muestral menor que 2 (filas en color verde) es: P(X < 2) = P(X=0) + P(X=1) = 0.187500Por otro lado, la probabilidad de obtener un valor muestral mayor o igual que 2
y menor o igual que 4 (filas en color azul) es: P(2 <= X <= 4) = P(X=2) P(X=3) P(X=4) = 0.781250Como último ejemplo, La probabilidad de obtener un valor muestral mayor que 4
(filas en color rojo) es: P(X > 4) = P(X=5) = 0.031250 |
|
Aquí se muestra una distribución compuesta por todas las muestras diferentes
que se pueden formar con 4 elementos con base en una variable que puede
asumir 3 valores enteros entre 0 y 2; en la tercera columna se incluye la suma de los elementos y finalmente,
en la cuarta columna se muestra el valor z de X.
Como se puede notar, aún cuando todas las muestras tienen la misma probabilidad de
ser obtenidas, los valores muestrales no tienen la misma probabilidad de ocurrir:
es más probable obtener un valor cercano al centro de la distribución que un valor
alejado del promedio. Esto es más notable cuando aumenta el número de valores que
puede asumir la variable, o al aumentar el tamaño de la muestra.
Media = 4.0000000
Este conocimiento es útil para hacer suposiciones razonables acerca de la probabilidad de que una muestra aleatoria tenga un valor muestral que se encuentre dentro de cierto rango de interés. Por ejemplo, la probabilidad de obtener un valor muestral menor que 3 (filas en color verde) es: P(X < 3) = P(X=0) + P(X=1) + P(X=2) = 0.185185Por otro lado, la probabilidad de obtener un valor muestral mayor o igual que 4
y menor o igual que 6 (filas en color azul) es: P(4 <= X <= 6) = P(X=4) P(X=5) P(X=6) = 0.555556Como último ejemplo, La probabilidad de obtener un valor muestral mayor que 7
(filas en color rojo) es: P(X > 7) = P(X=8) = 0.012346 |