Distribución muestral.

Cuando se selecciona aleatoriamente un elemento de una población y se le mide con base en una variable aleatoria que puede asumir M valores dentro del rango [0 .. (M-1)], la probabilidad de obtener el valor x será igual a 1/M. Si en lugar de tomar un sólo elemento se obtiene una muestra con N elementos, el número de muestras posibles con diferente composición será igual a MN. Para cada muestra es posible obtener un valor representativo tal como la media la suma, la varianza, la moda, etcétera. Si calculamos las sumas de los valores de cada muestra, es posible obtener valores entre 0 -si todos los elementos tienen un valor de 0- hasta (M-1) * N -si todos los elementos tienen un valor de M-1. En este caso, cada valor posible es llamado un punto muestral y el conjunto total de muestras diferentes que es posible obtener recibe el nombre de espacio muestral.

Se puede obtener la probabilidad de cada punto muestral si se divide la frecuencia con que ocurre cada punto muestral entre el número total de muestras posibles. Ahora se tiene una distribución muestral, que se define como una representación de todos los valores que pueden resultar de una muestra de tamaño N junto con la probabilidad asociada a cada uno de ellos. Esta representación se puede hacer mediante una tabla, una figura o una fórmula.

Abajo se presentan dos distribuciones muestrales. En la primera se tienen muestras con cinco elementos y una variable con dos valores. En la segunda se tienen muestras con cuatro elementos y una variable con dos valores.

Una vez que haya comprendido esta breve exposición, le recomiendo que visite este enlace para observar varias distribuciones muestrales en las cuales se mantiene fijo el tamño de la muestra mientras se varía el número de valores que puede asumir la variable.

Este otro enlace muestra también una familia de distribuciones muestrales, pero a diferencia de la anterior, se mantiene fijo el número de valores de la variable mientras se varía el tamaño de la muestra.

Note que aunque cambia el número de valores de la distribución muestral, si se toma en cuenta la distancia entre X y la media en unidades de desviación estándar (puntuación z, o puntuación tipificada), tanto la forma de la distribución como el rango se mantienen más o menos estables. En estas distribuciones se anota en la abscisa el valor z de cada punto muestral para poder comparar las distribuciones entre sí. También se suprimen las tablas de frecuencias para hacer más compacta la p gina. Por otro lado, se pretende también mostrar de qué manera al aumentar el tamaño de la muestra o la continuidad de la variable, la forma de la distribución muestral se aproxima gradualmente a la forma de la distribución normal

Ejemplos de distribuciones muestrales
Valores muestrales
S 4S 3S 2S 1S 0Suma
000000
000011
000101
000112
001001
001012
001102
001113
010001
010012
010102
010113
011002
011013
011103
011114
100001
100012
100102
100113
101002
101013
101103
101114
110002
110013
110103
110114
111003
111014
111104
111115
Aquí se muestra una distribución compuesta por todas las muestras diferentes que se pueden formar con 5 elementos con base en una variable que puede asumir 2 valores enteros entre 0 y 1; en la tercera columna se incluye la suma de los elementos y finalmente, en la cuarta columna se muestra el valor z de X. Como se puede notar, aún cuando todas las muestras tienen la misma probabilidad de ser obtenidas, los valores muestrales no tienen la misma probabilidad de ocurrir: es más probable obtener un valor cercano al centro de la distribución que un valor alejado del promedio. Esto es más notable cuando aumenta el número de valores que puede asumir la variable, o al aumentar el tamaño de la muestra.

Media = 2.5000000
Desviación estándar = 1.1359237

Distribución muestral
XffrZ
010.0313-2.2009
150.1563-1.3205
2100.3125-0.4402
3100.3125 0.4402
450.1563 1.3205
510.0313 2.2009

Este conocimiento es útil para hacer suposiciones razonables acerca de la probabilidad de que una muestra aleatoria tenga un valor muestral que se encuentre dentro de cierto rango de interés.

Por ejemplo, la probabilidad de obtener un valor muestral menor que 2 (filas en color verde) es:

P(X < 2) = P(X=0) + P(X=1) = 0.187500

Por otro lado, la probabilidad de obtener un valor muestral mayor o igual que 2 y menor o igual que 4 (filas en color azul) es:

P(2 <= X <= 4) = P(X=2) P(X=3) P(X=4) = 0.781250

Como último ejemplo, La probabilidad de obtener un valor muestral mayor que 4 (filas en color rojo) es:

P(X > 4) = P(X=5) = 0.031250

Ejemplos de distribuciones muestrales
Valores muestrales
S 3S 2S 1S 0Suma
00000
00011
00022
00101
00112
00123
00202
00213
00224
01001
01012
01023
01102
01113
01124
01203
01214
01225
02002
02013
02024
02103
02114
02125
02204
02215
02226
10001
10012
10023
10102
10113
10124
10203
10214
10225
11002
11013
11024
11103
11114
11125
11204
11215
11226
12003
12014
12025
12104
12115
12126
12205
12216
12227
20002
20013
20024
20103
20114
20125
20204
20215
20226
21003
21014
21025
21104
21115
21126
21205
21216
21227
22004
22015
22026
22105
22116
22127
22206
22217
22228
Aquí se muestra una distribución compuesta por todas las muestras diferentes que se pueden formar con 4 elementos con base en una variable que puede asumir 3 valores enteros entre 0 y 2; en la tercera columna se incluye la suma de los elementos y finalmente, en la cuarta columna se muestra el valor z de X. Como se puede notar, aún cuando todas las muestras tienen la misma probabilidad de ser obtenidas, los valores muestrales no tienen la misma probabilidad de ocurrir: es más probable obtener un valor cercano al centro de la distribución que un valor alejado del promedio. Esto es más notable cuando aumenta el número de valores que puede asumir la variable, o al aumentar el tamaño de la muestra.

Media = 4.0000000
Desviación estándar = 1.6431677

Distribución muestral
XffrZ
010.0123-2.4343
140.0494-1.8257
2100.1235-1.2172
3160.1975-0.6086
4190.2346 0.0000
5160.1975 0.6086
6100.1235 1.2172
740.0494 1.8257
810.0123 2.4343

Este conocimiento es útil para hacer suposiciones razonables acerca de la probabilidad de que una muestra aleatoria tenga un valor muestral que se encuentre dentro de cierto rango de interés.

Por ejemplo, la probabilidad de obtener un valor muestral menor que 3 (filas en color verde) es:

P(X < 3) = P(X=0) + P(X=1) + P(X=2) = 0.185185

Por otro lado, la probabilidad de obtener un valor muestral mayor o igual que 4 y menor o igual que 6 (filas en color azul) es:

P(4 <= X <= 6) = P(X=4) P(X=5) P(X=6) = 0.555556

Como último ejemplo, La probabilidad de obtener un valor muestral mayor que 7 (filas en color rojo) es:

P(X > 7) = P(X=8) = 0.012346