Ensayo de Rendimiento
DISTRIBUCIÓN DE ESTADÍSTICOS MUESTRALES
Muestreo
Objetivo: conocer propiedades de una población a partir de una muestra
Propiedades
Parámetros
Los estadísticos muestrales sirven como estimación (aproximación) de los parámetros
Muestreo
Los parámetros son constantes Los estadísticos son variables aleatorias y poseen distribución asociada
Distribución de estadísticos muestrales: objetivos
• Comprender la naturaleza aleatoria de los estadísticos muestrales.
• Estudiar las propiedades estadísticas de la media y la varianza muestrales.
• Adquirir destrezas en el cálculo de probabilidades estadísticos.
asociadas
a
estos
Distribución de estadísticos muestrales
Las distribuciones de los estadísticos muestrales se estudian suponiendo poblaciones de tamaño infinito.
Distribución de los estadísticos muestrales Muestreo aleatorio con reposición: las unidades seleccionadas pueden repetirse dentro de la muestra y entre muestras.
Muestreo aleatorio sin reposición: las unidades seleccionadas no se repiten dentro de la muestra y entre muestras.
Distribución del estadístico media muestral: ejemplo Se tiene una población (finita) de cuatro plantas de zapallos (N=4), donde la característica de interés es el número de zapallos por planta.
Se realizará un muestreo aleatorio simple con reposición, para muestras de tamaño 2. Objetivo: estudiar la distribución de la media muestral.
Distribución del estadístico media muestral
P1 P2 P3 P4
X = Nº de frutos 3 2 1 4
f(xi) 1/4 1/4 1/4 1/4
0.50
f(x)
Planta
Función de densidad del número de frutos en una población de 4 plantas de zapallo.
0.25
0.00 1
2
3
Número de frutos
4
Distribución del estadístico media muestral La esperanza será:
i x i f ( x i ) 1
1
4
2
1
4
3
1
4
4
1
4
1 2 3 4 4
2.5
Distribución del estadístico media muestral La varianza será:
2 i xi 1 2.5 2
2
1 4
= + 4 2.5
2
f (x ) 2
2 2.5 1 4
1.25
i
2
1 4
3 2.5
2
1 4
Distribución del estadístico media muestral
Tomando muestras de dos plantas con reposición, hay N2 muestras posibles para extraer, esto es 42=16 muestras.
Distribución del estadístico media muestral Espacio muestral generado por muestreo aleatorio con muestras de tamaño n=2, con reposición, de una población de cuatro plantas de zapallo. Muestra
Plantas
Nro. de frutos
Media muestral
Muestra
Plantas
Nro. de frutos
Media muestral
1
P1P1
3; 3
3.0
9
P3P1
1; 3
2.0
2
P1P2
3; 2
2.5
10
P3P2
1; 2
1.5
3
P1P3
3; 1
2.0
11
P3P3
1; 1
1.0
4
P1P4
3; 4
3.5
12
P3P4
1; 4
2.5
5
P2 P1
2; 3
2.5
13
P4P1
4; 3
3.5
6
P2 P2
2; 2
2.0
14
P4P2
4; 2
3.0
7
P2 P3
2; 1
1.5
15
P4P3
4; 1
2.5
8
P2 P4
2; 4
3.0
16
P4P4
4; 4
4.0
Distribución del estadístico media muestral Media Muestral 1,0
1.(1/16) = 0,0625
1,5
2.(1/16) = 0,1250
2,0
3.(1/16) = 0,1875
2,5
4.(1/16) = 0,2500
3,0
3.(1/16) = 0,1875
3,5
2.(1/16) = 0,1250
4,0
1.(1/16) = 0,0625
Valores que asume la variable aleatoria “media muestral del número de frutos” en muestras de tamaño n=2 y sus densidades.
Distribución del estadístico media muestral 0.25
f(x)
0.20
0.15
0.10
0.05 1.0
1.5
2.0
2.5
3.0
Medias muestrales
3.5
4.0
Función de densidad de la variable aleatoria media muestral del número de frutos.
Distribución del estadístico media muestral
x 2.5 x 2
2
n
1.25
0.625
2
Error Estándar
EE
x 2
2
n
Distribución del estadístico media muestral Si se hubieran utilizado muestras de mayor tamaño, se vería que la función de densidad se aproxima más aún a la gráfica de una densidad normal, con idéntica esperanza y varianza inversamente proporcional al tamaño muestral. 0.25
f(x)
0.20
0.15
0.10
0.05 1.0
1.5
2.0
2.5
3.0
Medias muestrales
3.5
4.0
Este comportamiento no es casual sino la consecuencia de un importantísimo resultado que se resume en el siguiente teorema:
Teorema Central del Límite Sea X varianza muestra definida
una variable aleatoria con esperanza µ y finita 2. Sea la media muestral de una aleatoria de tamaño n y Z la variable aleatoria como:
Z
X n
entonces, la distribución de Z se aproxima a la distribución normal estándar cuando n se aproxima a infinito.
Ejemplo de un muestreo aleatorio sin reposición desde una población finita Rendimientos (N=15) 99.04 95.74 102.64 107.66 104.48 Sin reposición
de
un
híbrido
94.98 96.42 111.75 103.49 101.24
= 101.77
de
101.52 85.44 112.86 104.93 104.31
2 = 44.67
maíz
Muestreo
Muestreo: todas las muestras posibles de tamaño n Estadísticos: media y varianza muestrales
Distribución de las medias de muestras con n=2 Ajuste: Normal(101.766,20.940)
0.37
frecuencia relativa
0.28
0.19
0.09
0.00 89.00
92.43
95.86
99.29 102.71 106.14 109.57 113.00
Media (n=2)
Distribución de las medias de muestras con n=3 Ajuste: Normal(101.766,12.792)
0.26
frecuencia relativa
0.19
0.13
0.06
0.00 93.22 90.89
97.90 95.56
102.57 107.25 111.92 100.24 104.91 109.59
Media (n=3)
Distribución de las medias de muestras con n=5 Ajuste: Normal(101.766,6.384) 0.20
frecuencia relativa
0.15
0.10
0.05
0.00 91.0 89.0
95.0 93.0
99.0 103.0 107.0 111.0 97.0 101.0 105.0 109.0 113.0
Media (n=5)
Distribución de las medias de muestras con n=8 Ajuste: Normal (101.766, 2.792) 0.18
frecuencia relativa
0.13
0.09
0.04
0.00 92.43 89.00
99.29 95.86
106.14 102.71
Media (n=8)
113.00 109.57
Distribución del estadístico media muestral Cuando se hace un muestreo aleatorio sin reposición desde una población finita las expresiones para obtener la esperanza y la varianza de la variable media muestral son:
x
Corrección por finitud
N n x n N 1 2
2
En síntesis: n2
n3
n5
n8
x 101.766 x 101.766
x 101.766 x 101.766
x 2
x 2
x 2
x 2
2
n
2
n
2
n
2
n
N n N 1 N n N 1 N n N 1 N n N 1
2
15 1
44.67 15 5 5
15 1
44.67 15 3 3
44.67 15 2
15 1
44.67 15 8 8
15 1
20.94
12.76
6.38
2.76
En síntesis: Ajuste: Normal(101.766,20.940)
0.37
frecuencia relativa
n=2
0.19
0.09
frecuencia relativa
0.19
0.28
0.00 89.00
Ajuste: Normal(101.766,12.792)
0.26
n=3
0.13
0.06
0.00 92.43
95.86
93.22
99.29 102.71 106.14 109.57 113.00
90.89
Media (n=2)
97.90 95.56
102.57 107.25 111.92 100.24 104.91 109.59
Media (n=3)
Ajuste: Normal(101.766,6.384) 0.20
Ajuste: Normal (101.766, 2.792) 0.18
0.13
0.10
n=5
0.05
0.09
n=8
0.04
0.00
0.00 91.0 89.0
frecuencia relativa
frecuencia relativa
0.15
95.0 93.0
99.0 103.0 107.0 111.0 97.0 101.0 105.0 109.0 113.0
Media (n=5)
92.43 89.00
99.29 95.86
106.14 102.71
Media (n=8)
113.00 109.57
Conclusión Cuando el tamaño de la muestra aumenta, la varianza de las medias disminuye Recordando… Error Estándar
EE
x 2
2
n
Ejemplo El diámetro de las tortas de girasol se distribuye normalmente con media 18 cm y desviación estándar de 6 cm. En una muestra de 10 tortas, ¿cuál es la probabilidad de encontrar tortas con diámetro promedio inferior a 16 cm?
Ejemplo ¿Cuál es la probabilidad, en una muestra con n=10, de encontrar tortas con diámetro inferior a 16 cm. si la distribución del diámetro se aproxima a una N (18;36/10)?
0
4
7
11
14
16
18
21
25
28
32
16 18 P X 16 P Z P Z 1.05 0.14885 0.15 6 10
35
Ejemplo Área: P(Zz) Tabla de Cuantiles de la Distribución Normal z
área
z
área
z
área
quantil
z
-3.25
0.00058
-1.00
0.15866
1.25
0.89435
0.00001
-4.265
-3.20
0.00069
-0.95
0.17106
1.30
0.90320
0.0001
-3.719
-3.15
0.00082
-0.90
0.18406
1.35
0.91149
0.001
-3.090
-3.10
0.00097
-0.85
0.19766
1.40
0.91924
0.00
-2.576
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
-1.20
0.11507
1.05
0.85314
3.30
0.99952
0.995
2.576
-1.15
0.12507
1.10
0.86433
3.35
0.99960
0.999
3.090
-1.10
0.13567
1.15
0.87493
3.40
0.99966
0.9999
3.719
-1.05
0.14686
1.20
0.88493
3.45
0.99972
0.99999
4.265
Distribución del estadístico media muestral Cuando no poblacional:
se
conoce
X T S n
la
varianza
Tn1 Grados de libertad
Observación: los grados de libertad de la T se corresponden con el tamaño de la muestra con la que se calculó S.
Distribución T de Student 0.45
Dist. Normal
Densidad
0.34
Dist. T 0.23
0.11
0.00 -5
-4
-3
-2
-1
0
1
2
3
4
5
Ejemplo Si la producción diaria de leche se aproxima a una distribución normal y se tiene la siguiente muestra de producciones diarias de leche (en litros): 67.9 69.3 70.0 74.8 75.3 69.6 67.3 65.8 70.5
¿Cuál es la probabilidad que una variable T, con los grados de libertad apropiados para este problema, exceda el valor de T obtenido a partir de los datos anteriores, si se supone que la producción promedio de leche en la población es de 67 litros?
Ejemplo X 70.0556 lts. S = 3.1887 lts. n=9 = 67 lts. -5.0
-4.0
-3.0
-2.0
-1.0
0.0
1.0
2.0
3.0
4.0
5.0
X 70.06 67 P T P T 3.19 P T 2.87 0.01 S n 9
Ejemplo Tabla de Cuantiles de la Distribución T 1 2 . 8 9 10 11 . 49 50
0.700 0.725 0.727 0.854 0.617 0.713 . . 0.546 0.624 0.543 0.621 0.542 0.619 0.540 0.617 . . 0.528 0.602 0.528 0.602 0.300 0.275
0.750 0.775 0.800 0.825 1.000 1.171 1.376 1.632 0.816 0.931 1.061 1.210 . . . . 0.706 0.794 0.889 0.993 0.703 0.790 0.883 0.986 0.700 0.786 0.879 0.980 0.697 0.783 0.876 0.976 . . . . 0.680 0.762 0.849 0.944 0.679 0.761 0.849 0.943 0.250 0.225 0.200 0.175
0.850 0.875 0.900 0.925 1.963 2.414 3.078 4.165 1.386 1.604 1.886 2.282 . . . . 1.108 1.240 1.397 1.592 1.100 1.230 1.383 1.574 1.093 1.221 1.372 1.559 1.088 1.214 1.363 1.548 . . . . 1.048 1.164 1.299 1.462 1.047 1.164 1.299 1.462 0.150 0.125 0.100 0.075
0.950 0.975 0.990 0.995 6.314 12.71 31.82 63.66 2.920 4.303 6.965 9.925 . . . . 1.860 2.306 2.896 3.355 1.833 2.262 2.821 3.250 1.812 2.228 2.764 3.169 1.796 2.201 2.718 3.106 . . . . 1.677 2.010 2.405 2.680 1.676 2.009 2.403 2.678 0.050 0.025 0.010 0.005
Distribución asociada al estadístico varianza muestral Espacio muestral generado por muestreo aleatorio con muestras de tamaño n=2, con reposición, de una población de cuatro plantas de zapallo. Muestra
Plantas
Nº de frutos
Varianza
Muestra
Plantas
Nº de frutos
Varianza
1
P1P1
3-3
0.0
9
P3P1
1-3
2.0
2
P1P2
3-2
0.5
10
P3P2
1-2
0.5
3
P1P3
3-1
2.0
11
P3P3
1-1
0.0
4
P1P4
3-4
0.5
12
P3P4
1-4
4.5
5
P2P1
2-3
0.5
13
P4P1
4-3
0.5
6
P2P2
2-2
0.0
14
P4P2
4-2
2.0
7
P2P3
2-1
0.5
15
P4P3
4-1
4.5
8
P2P4
2-4
2.0
16
P4P4
4-4
0.0
Distribución del estadístico varianza muestral Varianza Muestral
P S 2 s2
0
4.(1/16) = 0.25
0.5
6.(1/16) = 0.375
2
4.(1/16) = 0.25
4.5
2.(1/16) = 0.125
Valores que asume la variable aleatoria “varianza muestral del número de frutos” en muestras de tamaño n=2 y sus densidades.
Distribución del estadístico varianza muestral 0.40
0.30
F(s2)
0.20
0.10
0.00 0.00
1.50
3.00
S2
4.50
Función de densidad de la variable aleatoria varianza muestral del número de frutos.
Distribución de las varianzas de muestras con n=3 0.54
Estadística descriptiva Variable Media Var(n) VarianzaC(n=3) 44.67 1977.49
frecuencia relativa
0.40
0.27
0.13
0.00 0.0
56.2 28.1
112.4 84.3
168.5 140.4
VarianzaC(n=3)
224.7 196.6
252.8
Distribución de las varianzas de muestras con n=5 0.24
Estadística descriptiva Variable Media Var(n) VarianzaC(n=5) 44.67 873.27
frecuencia relativa
0.18
0.12
0.06
0.00 0.0
25.2 12.6
50.5 37.9
75.7 63.1
88.4
VarianzaC(n=5)
101.0 126.2 113.6 138.8
Distribución Ji-cuadrado (2) Para calcular probabilidades asociadas a varianzas muestrales se utiliza la distribución de la variable:
S (n 1) 2
2
2 n 1 Grados de libertad
Distribución Ji-cuadrado 0.48
2 gl
Densidad
0.36
4 gl 0.24
6 gl
0.12
0.00 0
4
8
11
15
Ejemplo Un fitomejorador desea controlar la variabilidad de los brotes comerciales de espárrago, ya que las normas de embalaje establecen una longitud máxima de cajas de 23,5 cm.
La variable largo del brote de espárrago sigue una distribución normal, con una varianza de 2,25 cm2.
Ejemplo ¿Cuál es la probabilidad que una muestra de 5 cajas, tenga una desviación estándar que exceda a 2 cm, si la verdadera desviación estándar es de 1,5 cm?
0.0
2.0
4.0
6.0
8.1 10.1 12.1 14.1 16.1 18.1
2 S n 1 2 4 4 2 2 P S 2 P S 4 P P 2 2.25
P 2 7.11 1 P 2 7.11 1 0.85 0.15
Ejemplo Tabla de Cuantiles de la Distribución Chi-Cuadrado
0.010 0.025 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 1 0.0002 0.0010 0.0039 0.0158 0.0358 0.0642 0.1015 0.1485 0.2059 0.2750 0.3573 0.4549 . . . . . . . . . . . . . 4 0.2971 0.4844 0.7107 1.0636 1.3665 1.6488 1.9226 2.1947 2.4701 2.7528 3.0469 3.3567 . . . . . . . . . . . . . 49 28.9407 31.5549 33.9303 36.8182 38.8588 40.5344 42.0104 43.3664 44.6491 45.8895 47.1114 48.3350 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.999 1 0.5707 0.7083 0.8735 1.0742 1.3233 1.6424 2.0723 2.7055 3.8415 5.0239 6.6349 10.8278 . . . . . . . . . . . . . 4 3.6871 4.0446 4.4377 4.8784 5.3853 5.9886 6.7449 7.7794 9.4877 11.1433 13.2767 18.4670 . . . . . . . . . . . . . 49 49.5796 50.8659 52.2186 53.6697 55.2653 57.0786 59.2411 62.0375 66.3386 70.2224 74.9194 85.3511