Distribución de estadísticos muestrales

Los estadísticos muestrales sirven como estimación (aproximación) ... Distribución del estadístico media muestral: ejemplo ..... Estadística descriptiva. Variable.
534KB Größe 8 Downloads 84 vistas
Ensayo de Rendimiento

DISTRIBUCIÓN DE ESTADÍSTICOS MUESTRALES

Muestreo

Objetivo: conocer propiedades de una población a partir de una muestra

Propiedades

Parámetros

Los estadísticos muestrales sirven como estimación (aproximación) de los parámetros

Muestreo

Los parámetros son constantes Los estadísticos son variables aleatorias y poseen distribución asociada

Distribución de estadísticos muestrales: objetivos

• Comprender la naturaleza aleatoria de los estadísticos muestrales.

• Estudiar las propiedades estadísticas de la media y la varianza muestrales.

• Adquirir destrezas en el cálculo de probabilidades estadísticos.

asociadas

a

estos

Distribución de estadísticos muestrales

Las distribuciones de los estadísticos muestrales se estudian suponiendo poblaciones de tamaño infinito.

Distribución de los estadísticos muestrales Muestreo aleatorio con reposición: las unidades seleccionadas pueden repetirse dentro de la muestra y entre muestras.

Muestreo aleatorio sin reposición: las unidades seleccionadas no se repiten dentro de la muestra y entre muestras.

Distribución del estadístico media muestral: ejemplo Se tiene una población (finita) de cuatro plantas de zapallos (N=4), donde la característica de interés es el número de zapallos por planta.

Se realizará un muestreo aleatorio simple con reposición, para muestras de tamaño 2. Objetivo: estudiar la distribución de la media muestral.

Distribución del estadístico media muestral

P1 P2 P3 P4

X = Nº de frutos 3 2 1 4

f(xi) 1/4 1/4 1/4 1/4

0.50

f(x)

Planta

Función de densidad del número de frutos en una población de 4 plantas de zapallo.

0.25

0.00 1

2

3

Número de frutos

4

Distribución del estadístico media muestral La esperanza será:

  i x i f ( x i )  1

    1

4

2

1

4

3

1

4

4

1

4



1 2  3  4 4

 2.5

Distribución del estadístico media muestral La varianza será:



 2  i xi     1  2.5  2

2

1 4

= +  4  2.5 

2

 f (x ) 2

  2  2.5  1 4

 1.25

i

2

1 4

  3  2.5 

2

1 4



Distribución del estadístico media muestral

Tomando muestras de dos plantas con reposición, hay N2 muestras posibles para extraer, esto es 42=16 muestras.

Distribución del estadístico media muestral Espacio muestral generado por muestreo aleatorio con muestras de tamaño n=2, con reposición, de una población de cuatro plantas de zapallo. Muestra

Plantas

Nro. de frutos

Media muestral

Muestra

Plantas

Nro. de frutos

Media muestral

1

P1P1

3; 3

3.0

9

P3P1

1; 3

2.0

2

P1P2

3; 2

2.5

10

P3P2

1; 2

1.5

3

P1P3

3; 1

2.0

11

P3P3

1; 1

1.0

4

P1P4

3; 4

3.5

12

P3P4

1; 4

2.5

5

P2 P1

2; 3

2.5

13

P4P1

4; 3

3.5

6

P2 P2

2; 2

2.0

14

P4P2

4; 2

3.0

7

P2 P3

2; 1

1.5

15

P4P3

4; 1

2.5

8

P2 P4

2; 4

3.0

16

P4P4

4; 4

4.0

Distribución del estadístico media muestral Media Muestral 1,0

1.(1/16) = 0,0625

1,5

2.(1/16) = 0,1250

2,0

3.(1/16) = 0,1875

2,5

4.(1/16) = 0,2500

3,0

3.(1/16) = 0,1875

3,5

2.(1/16) = 0,1250

4,0

1.(1/16) = 0,0625

Valores que asume la variable aleatoria “media muestral del número de frutos” en muestras de tamaño n=2 y sus densidades.

Distribución del estadístico media muestral 0.25

f(x)

0.20

0.15

0.10

0.05 1.0

1.5

2.0

2.5

3.0

Medias muestrales

3.5

4.0

Función de densidad de la variable aleatoria media muestral del número de frutos.

Distribución del estadístico media muestral

 x  2.5   x  2



2



n

1.25

 0.625

2

Error Estándar

EE 

x   2

2

n

Distribución del estadístico media muestral Si se hubieran utilizado muestras de mayor tamaño, se vería que la función de densidad se aproxima más aún a la gráfica de una densidad normal, con idéntica esperanza y varianza inversamente proporcional al tamaño muestral. 0.25

f(x)

0.20

0.15

0.10

0.05 1.0

1.5

2.0

2.5

3.0

Medias muestrales

3.5

4.0

Este comportamiento no es casual sino la consecuencia de un importantísimo resultado que se resume en el siguiente teorema:

Teorema Central del Límite Sea X varianza muestra definida

una variable aleatoria con esperanza µ y finita 2. Sea la media muestral de una aleatoria de tamaño n y Z la variable aleatoria como:

Z

     

 X      n 

entonces, la distribución de Z se aproxima a la distribución normal estándar cuando n se aproxima a infinito.

Ejemplo de un muestreo aleatorio sin reposición desde una población finita Rendimientos (N=15) 99.04 95.74 102.64 107.66 104.48 Sin reposición

de

un

híbrido

94.98 96.42 111.75 103.49 101.24

 = 101.77

de

101.52 85.44 112.86 104.93 104.31

2 = 44.67

maíz

Muestreo

Muestreo: todas las muestras posibles de tamaño n Estadísticos: media y varianza muestrales

Distribución de las medias de muestras con n=2 Ajuste: Normal(101.766,20.940)

0.37

frecuencia relativa

0.28

0.19

0.09

0.00 89.00

92.43

95.86

99.29 102.71 106.14 109.57 113.00

Media (n=2)

Distribución de las medias de muestras con n=3 Ajuste: Normal(101.766,12.792)

0.26

frecuencia relativa

0.19

0.13

0.06

0.00 93.22 90.89

97.90 95.56

102.57 107.25 111.92 100.24 104.91 109.59

Media (n=3)

Distribución de las medias de muestras con n=5 Ajuste: Normal(101.766,6.384) 0.20

frecuencia relativa

0.15

0.10

0.05

0.00 91.0 89.0

95.0 93.0

99.0 103.0 107.0 111.0 97.0 101.0 105.0 109.0 113.0

Media (n=5)

Distribución de las medias de muestras con n=8 Ajuste: Normal (101.766, 2.792) 0.18

frecuencia relativa

0.13

0.09

0.04

0.00 92.43 89.00

99.29 95.86

106.14 102.71

Media (n=8)

113.00 109.57

Distribución del estadístico media muestral Cuando se hace un muestreo aleatorio sin reposición desde una población finita las expresiones para obtener la esperanza y la varianza de la variable media muestral son:

x  

Corrección por finitud

  N n x    n  N 1  2

2

En síntesis: n2

n3

n5

n8

 x  101.766  x  101.766

 x  101.766  x  101.766

x  2

x  2

x  2

x  2



2

n



2

n



2

n



2

n

   

N n N 1 N n N 1 N n N 1 N n N 1

   



2 

15  1

44.67 15  5 5



15  1

44.67 15  3 3



   

44.67 15  2

15  1

44.67 15  8 8

15  1

   

 20.94

 12.76

 6.38

 2.76

En síntesis: Ajuste: Normal(101.766,20.940)

0.37

frecuencia relativa

n=2

0.19

0.09

frecuencia relativa

0.19

0.28

0.00 89.00

Ajuste: Normal(101.766,12.792)

0.26

n=3

0.13

0.06

0.00 92.43

95.86

93.22

99.29 102.71 106.14 109.57 113.00

90.89

Media (n=2)

97.90 95.56

102.57 107.25 111.92 100.24 104.91 109.59

Media (n=3)

Ajuste: Normal(101.766,6.384) 0.20

Ajuste: Normal (101.766, 2.792) 0.18

0.13

0.10

n=5

0.05

0.09

n=8

0.04

0.00

0.00 91.0 89.0

frecuencia relativa

frecuencia relativa

0.15

95.0 93.0

99.0 103.0 107.0 111.0 97.0 101.0 105.0 109.0 113.0

Media (n=5)

92.43 89.00

99.29 95.86

106.14 102.71

Media (n=8)

113.00 109.57

Conclusión Cuando el tamaño de la muestra aumenta, la varianza de las medias disminuye Recordando… Error Estándar

EE 

x   2

2

n

Ejemplo El diámetro de las tortas de girasol se distribuye normalmente con media 18 cm y desviación estándar de 6 cm. En una muestra de 10 tortas, ¿cuál es la probabilidad de encontrar tortas con diámetro promedio inferior a 16 cm?

Ejemplo ¿Cuál es la probabilidad, en una muestra con n=10, de encontrar tortas con diámetro inferior a 16 cm. si la distribución del diámetro se aproxima a una N (18;36/10)?

0

4

7

11

14

16

18

21

25

28

32

  16  18   P  X  16   P  Z   P  Z  1.05  0.14885  0.15  6   10  

35

Ejemplo Área: P(Zz) Tabla de Cuantiles de la Distribución Normal z

área

z

área

z

área

quantil

z

-3.25

0.00058

-1.00

0.15866

1.25

0.89435

0.00001

-4.265

-3.20

0.00069

-0.95

0.17106

1.30

0.90320

0.0001

-3.719

-3.15

0.00082

-0.90

0.18406

1.35

0.91149

0.001

-3.090

-3.10

0.00097

-0.85

0.19766

1.40

0.91924

0.00

-2.576

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

-1.20

0.11507

1.05

0.85314

3.30

0.99952

0.995

2.576

-1.15

0.12507

1.10

0.86433

3.35

0.99960

0.999

3.090

-1.10

0.13567

1.15

0.87493

3.40

0.99966

0.9999

3.719

-1.05

0.14686

1.20

0.88493

3.45

0.99972

0.99999

4.265

Distribución del estadístico media muestral Cuando no poblacional:

se

conoce

   X   T   S     n  

la

varianza

Tn1 Grados de libertad

Observación: los grados de libertad de la T se corresponden con el tamaño de la muestra con la que se calculó S.

Distribución T de Student 0.45

Dist. Normal

Densidad

0.34

Dist. T 0.23

0.11

0.00 -5

-4

-3

-2

-1

0

1

2

3

4

5

Ejemplo Si la producción diaria de leche se aproxima a una distribución normal y se tiene la siguiente muestra de producciones diarias de leche (en litros): 67.9 69.3 70.0 74.8 75.3 69.6 67.3 65.8 70.5

¿Cuál es la probabilidad que una variable T, con los grados de libertad apropiados para este problema, exceda el valor de T obtenido a partir de los datos anteriores, si se supone que la producción promedio de leche en la población es de 67 litros?

Ejemplo X  70.0556 lts. S = 3.1887 lts. n=9  = 67 lts. -5.0

-4.0

-3.0

-2.0

-1.0

0.0

1.0

2.0

3.0

4.0

5.0

    X   70.06  67    P T    P  T  3.19   P T  2.87   0.01 S     n 9    

Ejemplo Tabla de Cuantiles de la Distribución T  1 2 . 8 9 10 11 . 49 50

0.700 0.725 0.727 0.854 0.617 0.713 . . 0.546 0.624 0.543 0.621 0.542 0.619 0.540 0.617 . . 0.528 0.602 0.528 0.602 0.300 0.275

0.750 0.775 0.800 0.825 1.000 1.171 1.376 1.632 0.816 0.931 1.061 1.210 . . . . 0.706 0.794 0.889 0.993 0.703 0.790 0.883 0.986 0.700 0.786 0.879 0.980 0.697 0.783 0.876 0.976 . . . . 0.680 0.762 0.849 0.944 0.679 0.761 0.849 0.943 0.250 0.225 0.200 0.175

0.850 0.875 0.900 0.925 1.963 2.414 3.078 4.165 1.386 1.604 1.886 2.282 . . . . 1.108 1.240 1.397 1.592 1.100 1.230 1.383 1.574 1.093 1.221 1.372 1.559 1.088 1.214 1.363 1.548 . . . . 1.048 1.164 1.299 1.462 1.047 1.164 1.299 1.462 0.150 0.125 0.100 0.075

0.950 0.975 0.990 0.995 6.314 12.71 31.82 63.66 2.920 4.303 6.965 9.925 . . . . 1.860 2.306 2.896 3.355 1.833 2.262 2.821 3.250 1.812 2.228 2.764 3.169 1.796 2.201 2.718 3.106 . . . . 1.677 2.010 2.405 2.680 1.676 2.009 2.403 2.678 0.050 0.025 0.010 0.005

Distribución asociada al estadístico varianza muestral Espacio muestral generado por muestreo aleatorio con muestras de tamaño n=2, con reposición, de una población de cuatro plantas de zapallo. Muestra

Plantas

Nº de frutos

Varianza

Muestra

Plantas

Nº de frutos

Varianza

1

P1P1

3-3

0.0

9

P3P1

1-3

2.0

2

P1P2

3-2

0.5

10

P3P2

1-2

0.5

3

P1P3

3-1

2.0

11

P3P3

1-1

0.0

4

P1P4

3-4

0.5

12

P3P4

1-4

4.5

5

P2P1

2-3

0.5

13

P4P1

4-3

0.5

6

P2P2

2-2

0.0

14

P4P2

4-2

2.0

7

P2P3

2-1

0.5

15

P4P3

4-1

4.5

8

P2P4

2-4

2.0

16

P4P4

4-4

0.0

Distribución del estadístico varianza muestral Varianza Muestral

P  S 2  s2 

0

4.(1/16) = 0.25

0.5

6.(1/16) = 0.375

2

4.(1/16) = 0.25

4.5

2.(1/16) = 0.125

Valores que asume la variable aleatoria “varianza muestral del número de frutos” en muestras de tamaño n=2 y sus densidades.

Distribución del estadístico varianza muestral 0.40

0.30

F(s2)

0.20

0.10

0.00 0.00

1.50

3.00

S2

4.50

Función de densidad de la variable aleatoria varianza muestral del número de frutos.

Distribución de las varianzas de muestras con n=3 0.54

Estadística descriptiva Variable Media Var(n) VarianzaC(n=3) 44.67 1977.49

frecuencia relativa

0.40

0.27

0.13

0.00 0.0

56.2 28.1

112.4 84.3

168.5 140.4

VarianzaC(n=3)

224.7 196.6

252.8

Distribución de las varianzas de muestras con n=5 0.24

Estadística descriptiva Variable Media Var(n) VarianzaC(n=5) 44.67 873.27

frecuencia relativa

0.18

0.12

0.06

0.00 0.0

25.2 12.6

50.5 37.9

75.7 63.1

88.4

VarianzaC(n=5)

101.0 126.2 113.6 138.8

Distribución Ji-cuadrado (2) Para calcular probabilidades asociadas a varianzas muestrales se utiliza la distribución de la variable:

S (n  1) 2



2



2 n 1 Grados de libertad

Distribución Ji-cuadrado 0.48

2 gl

Densidad

0.36

4 gl 0.24

6 gl

0.12

0.00 0

4

8

11

15

Ejemplo Un fitomejorador desea controlar la variabilidad de los brotes comerciales de espárrago, ya que las normas de embalaje establecen una longitud máxima de cajas de 23,5 cm.

La variable largo del brote de espárrago sigue una distribución normal, con una varianza de 2,25 cm2.

Ejemplo ¿Cuál es la probabilidad que una muestra de 5 cajas, tenga una desviación estándar que exceda a 2 cm, si la verdadera desviación estándar es de 1,5 cm?

0.0

2.0

4.0

6.0

8.1 10.1 12.1 14.1 16.1 18.1

2  S  n  1   2 4  4   2 2 P  S  2  P  S  4  P      P     2  2.25     

 P   2  7.11  1  P   2  7.11  1  0.85  0.15

Ejemplo Tabla de Cuantiles de la Distribución Chi-Cuadrado 

0.010 0.025 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 1 0.0002 0.0010 0.0039 0.0158 0.0358 0.0642 0.1015 0.1485 0.2059 0.2750 0.3573 0.4549 . . . . . . . . . . . . . 4 0.2971 0.4844 0.7107 1.0636 1.3665 1.6488 1.9226 2.1947 2.4701 2.7528 3.0469 3.3567 . . . . . . . . . . . . . 49 28.9407 31.5549 33.9303 36.8182 38.8588 40.5344 42.0104 43.3664 44.6491 45.8895 47.1114 48.3350 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.999  1 0.5707 0.7083 0.8735 1.0742 1.3233 1.6424 2.0723 2.7055 3.8415 5.0239 6.6349 10.8278 . . . . . . . . . . . . . 4 3.6871 4.0446 4.4377 4.8784 5.3853 5.9886 6.7449 7.7794 9.4877 11.1433 13.2767 18.4670 . . . . . . . . . . . . . 49 49.5796 50.8659 52.2186 53.6697 55.2653 57.0786 59.2411 62.0375 66.3386 70.2224 74.9194 85.3511