MUESTREO 1. Supongamos que en un centro escolar los alumnos y docentes se distribuyen de acuerdo con la tabla siguiente: 3 ESO 4 ESO 1º Bach 2º Bach Prof Hombres 85 80 100 83 24 Mujeres 95 96 110 91 31 Si quieres realizar una encuesta entre ellos de tamaño n = 80 por el método de muestreo estratificado por sexo y nivel de trabajo, ¿a cuantas personas de cada clase deberás preguntar? Solución: Se divide la población en subgrupos o estratos homogéneos en los cuales se toman muestras aleatorias simples. La ventaja es que todas las partes en que la población se divide estarán representadas adecuadamente. Si N1,..., Nk es el nº de elementos en cada estrato (N1+... +Nk = N) se elige el tamaño de la muestra ni (n1 +... + nk = n) de forma que n1 n n = ... = k = N1 Nk N Con los datos de la tabla se calcula el número total de elementos N i = 795
∑
A partir del número total de datos se hace un muestreo estratificado proporcional al número total de datos:
3 ESO Hombres 85 ⋅ 80 = 8'55 Mujeres
795 80 95 ⋅ = 9'56 795
4 ESO 80 = 8'05 795 80 96 ⋅ = 9'66 795
80 ⋅
1º Bach 80 = 10'06 795 80 110 ⋅ = 11'07 795 100 ⋅
2º Bach 80 = 8'35 795 80 91 ⋅ = 9'16 795
83 ⋅
Prof 80 = 2'42 795 80 31 ⋅ = 3'12 795 24 ⋅
Redondeando
Hombres Mujeres
3 ESO
4 ESO
1º Bach
2º Bach
Prof
9 10
8 10
10 11
8 9
2 3
2. En un instituto la estatura del alumnado sigue una distribución normal N(170,8). Si elegimos un alumno al azar que probabilidad hay de que su estatura esté comprendida entre (168 − 164). Solución: Se pide calcular la probabilidad de que una variable que sigue una distribución normal, este comprendida dentro de un intervalo, para lo cual habrá que tipificar la variable. x −µ Z= σ 168 − 170 164 − 170 p(164 5’7) = 30’85 % b) ¿Cuál es la probabilidad de que una muestra de 49 alumnos tenga una media superior a 5’7? Solución: Si se toman muestras aleatorias de tamaño 49 y de cada una se obtiene la media, se obtiene una nueva distribución de medias muestrales que también sigue un comportamiento Normal, siendo sus parámetros: σ 0'8 = N x (5'3, 0'11) = N x 5'3, x : N x µ, n 49
Se pide calcular:
p(x > 5'7 ) tipificando la variable con los nuevos parámetros de la distribución se obtiene: 5'7 − 5'3 x = 5'7 → z = = 3'5 0'11 Fila : 3'5 p(x > 5'7 ) = p(z > 3'50 ) = p(z ≤ 3'50 ) = 1 − p(z ≤ 3'50) = 1 − φ(3'50) = = 1 − 0'9998 = 0'0002 Columna : 0'00 p(x > 5'7 ) = 0'03%
4. Con los mismos datos del problema anterior, calcula el intervalo de probabilidad de las muestras de tamaño 49 con una confianza de: . a) 51’6% Solución: 0'8 es: El intervalo de confianza para una variable que sigue una distribución Normal N x 5'3, 49 σ σ µ − Z α ⋅ , µ + Zα ⋅ 2 2 n n
α 0'484 Z α = φ −1 1 − −1 −1 = φ (0'758) = 0'70 : Z α = φ 1 − 2 2 2 2 N.C. = 1 − α = 0'516 : α = 0'484 Sustituyendo en la expresión del intervalo: 0'8 0'8 5'3 − 0'70 ⋅ = (5’22 , 5’38) ,5'3 + 0'70 ⋅ 49 49
b) 76’2% Solución: Igual que el anterior, lo único que cambia es el Z crítico, ya que se varia el nivel de confianza. α 0'238 Z α = φ −1 1 − −1 −1 = φ (0'881) = 1'18 : Z α = φ 1 − 2 2 2 2 N.C. = 1 − α = 0'762 : α = 0'328 Sustituyendo en la expresión del intervalo: 0'8 0'8 5'3 − 1'18 ⋅ = (5’17 , 5’43) ,5'3 + 1'18 ⋅ 49 49 c) 90’9% Solución: Igual que el anterior, lo único que cambia es el Z crítico, ya que se varia el nivel de confianza. α 0'091 Z α = φ −1 1 − −1 −1 = φ (0'9545) = 1'69 : Z α = φ 1 − 2 2 2 2 N.C. = 1 − α = 0'909 : α = 0'091 Sustituyendo en la expresión del intervalo: 0'8 0'8 = (5’11 , 5’49) 5'3 − 1'69 ⋅ ,5'3 + 1'69 ⋅ 49 49
A medida que aumenta el nivel de confianza, también aumenta la amplitud del intervalo
5 El peso de los adultos de una población numerosa se distribuye normalmente con una media 65 Kg y desviación típica 12 Kg: Se elige una muestra de 30 individuos al azar. Calcula la probabilidad de que la media de esa muestra sea: a) Mayor de 60 Kg Solución: x ≡ Peso de los adultos de una población. Distribución Normal cuyos parámetros son: x : N(µ, σ ) = N(65, 12 ) Si se toman muestras de tamaño 30 y de cada una su media, se obtiene una distribución de medias maestrales que también sigue una distribución normal, cuyos parámetros son ahora: 12 σ = N (65, 2'19) = N 65, x : N x µ, x x n 30
(
)
Se pide calcular: p x > 60 . Tipificando la variable con: z =
(
x −µ se obtiene: σ n
)
60 − 65 p x > 60 = z = = −2'28 = p(z > −2'28) = {Por simetria} = p(z < 2'28) = φ(2'28) 2'19 El valor de φ, se obtiene en la tabla de la N(0, 1). F : 2'2 φ(2'28) = = 0'9887 C : 0'08 por lo tanto: p x > 60 = 98'87 %
(
)
b) Mayor de 68 Kg Solución:
(
)
x −µ se obtiene: σ n
Se pide calcular: p x > 68 . Tipificando la variable con: z =
(
)
(
)
68 − 65 p x > 68 = z = = 1'37 = p(z > 1'37 ) = p z ≤ 1'37 = 1 − p(z ≤ 1'37 ) = 1 − φ(1'37 ) 2'19 El valor de φ, se obtiene en la tabla de la N(0, 1). F : 1'3 φ(1'37 ) = = 0'9147 C : 0'07
(
)
p x > 68 = 1 − φ(1'37 ) = 1 − 0'9147 = 0'0853
por lo tanto:
(
)
p x > 68 = 8'53 %
c) Esté en el intervalo (60, 68) Solución: Se pide calcular: p 60 < x < 68 . Para ello, se pueden aprovechar los resultados obtenidos en los dos primeros apartados para resolver este último. p 60 < x < 68 = p x > 60 − p x > 68 = 98'87 − 8'53 = 90'34 por lo tanto: p 60 < x < 68 = 90'34 %
(
)
(
) (
(
) (
)
)
6. El perímetro torácico de los individuos adultos (hombres) en una población se distribuye según la ley normal N(90’6) cm. a) ¿Cómo se distribuye las medias de las muestras de tamaño 81 extraídas de esa población? Solución: x ≡ perímetro torácico medio de una muestra de 81 hombres adultos. Sigue una distribución Normal cuyos parámetros son: σ 6 = N (90, 0'67) = N 90, x : N x µ, x x n 81 b) ¿Cuál es la probabilidad de que una de esas medias sea menor de 87 cm? ¿ Y de que sea mayor de 91 cm? Solución: x −µ z= σ p x > 87 = = p(z > −3'83) = {Por simetria} = p(z < 3'83) = φ(3'83) n 87 − 90 = −3'83 z = 0'67 F : 3'8 N(0, 1) : : φ(3'83) = 0'9999 C : 0'03
(
)
(
)
p x > 87 = 99'99 %
x −µ z= σ p x > 91 = = p(z > 1'50 ) = p z ≤ 1'50 = 1 − p(z ≤ 1'50) = 1 − φ(1'50 ) n 91 − 90 = 1'50 z = 0 ' 67 F : 1'5 N(0, 1) : : φ(1'50 ) = 0'9332 C : 0'00
(
)
(
)
p(z > 1'50 ) = 1 − 0'9332 = 0'0668
por lo tanto
(
)
p x > 91 = 6'68 %
7. La altura de los mozos de un llamamiento al Servicio Militar sigue una distribución normal media 174 y desviación típica 10 cm. Si se halla la media x de una muestra de tamaño 144, calcula p 173 < x < 175 Solución: x ≡ Altura media de una muestra de 144 mozos. Sigue una distribución Normal cuyos parámetros son: σ 10 = N 174, = N (174, 0'83) x : N x µ, x x n 144 Se pide calcular:
(
(
p 173 < x < 175
)
TIPIFICANDO LA VARIABLE x
=
173 − 174 = −1'20 0'83 = p(− 1'20 < z < 1'20 ) 175 − 174 x = 175 → z = = +1'20 0'83 = 173 → z =
p(− 1'20 < z < 1'20) = p(z < 1'20) − p(z ≤ −1'20) POR
=
COMPLEMENTARIO
(
)
POR
=
SIMETRIA
p(z < 1'20) − p(z ≥ 1'20) =
p(z < 1'20 ) − p z < 1'20 = p(z < 1'20 ) − (1 − p(z < 1'20 )) = 2 ⋅ p(z < 1'20 ) − 1 =
)
F : 1'2 = 2 ⋅ φ(1'20 ) − 1 = N(0, 1) : φ(1'20 ) = = 0'8849 = 2 ⋅ 0'8849 − 1 = 0'7698 C : 0'00
por lo tanto:
(
)
p 173 < x < 175 = 76'98 %
8. El tamaño de las parcelas de una determinada provincia se distribuye normalmente. Si su media es 3 Ha y su desviación típica es 0’6 Ha, ¿cual es la probabilidad de que elegidos al azar 225 propietarios, tengan al menos un total de 652’5 Ha? (Sugerencia: determina antes la media de esas parcelas.) Solución: x ≡ Superficie de parcela. Sigue una distribución Normal cuyos parámetros son: x : N(µ, σ ) = N(3, 0'6 ) Para que el total de la superficie de 225 parcelas sea mayor o igual que 652’5 Ha se deberá de 652'5 cumplir que la media la superficie de esas 225 parcelas sea mayor o igual que 2’9 Ha = 2'9 . 225 Si x es una variable con comportamiento Normal, las medias maestrales de tamaño n de esta variable también tendrán un comportamiento Normal cuyos parámetros son: σ 0'6 = N (3, 0'04) = N 3, x : N x µ, x x n 225
(
Por lo tanto el problema se reduce a calcular p x > 2'9
)
Tipificando POR 2'9 − 3 = p(z ≥ −2'5) = p(z ≤ 2'5) = φ(2'5) p x ≥ 2'9 = x 2'9 → z = = −2'5 SIMETRIA = 0'04 F : 2 ' 5 Utilizando la N(0, 1): φ(2'5) = = 0'9938 C : 0 ' 00 Por lo tanto: p x > 2'9 = 99'38 %
(
)
(
)
9. En las elecciones a decano de una facultad se representaron dos candidatos: A y B. El resultado de la votación fue del 60% para A y 40% para B. Si antes de la elección se hizo una encuesta a 36 votantes, ¿cuál habría sido la probabilidad de acertar el ganador? Solución: Se pide hacer una estimación de una proporción muestral (pˆ ) de votantes a un determinado candidato conocida la proporción poblacional (resultado electoral). Puesto que el número de elementos de la muestra es superior a 30, la distribución de las proporciones muestrales de tamaño n siguen una ley Normal cuyos parámetros son: p ⋅ q N p, n p = proporción de votantes del candidato A = 0'60 donde: q = 1 − p = 1 − 0'60 = 0'40 n = n º de elementos de la muestra = 36 Por lo tanto las proporciones de muestras de 36 elementos siguen una normal: 0'6 ⋅ 0'4 pˆ : N 0'6, = N(0'6, 0'08) 36
Para que una encuesta realizada sobre 36 votantes hubiese acertado el ganador de las elecciones, la proporción muestral de votantes debería haber sido superior al 50%, por lo que el problema se reduce a ) calcular p(p > 0'50) Los valores de estas distribuciones se tipifican con la siguiente expresión ) ) p−p p − 0'60 Z= = 0'08 p⋅q n POR 0'50 − 0'60 ) ) p(p > 0'50 ) = p = 0'50 → z = = −1'25 = p(z > −1'25) = p(z < 1'25) = φ(1'25) SIMETRIA 0'08 F : 1'2 φ(1'25) = = 0'8944 C : 0'05
La probabilidad de que una encuesta realizada sobre 36 votantes hubiese acertado el resultado electoral habría sido del 89’44 %
10. Halla la probabilidad de que en los 200 próximos nacimientos se produzcan en tu ciudad: a) Menos del 40% sean niños; b) entre el 48% y el 52% sean niños. Nota: La probabilidad (a posteriori) de que un recién nacido sea niña es p = 0’485.) Solución: Menos del 40% sean niños. a. Se pide una estimación para la proporción muestral de recién nacidos, conocida la proporción poblacional. Si se define p como la proporción poblacional de recién nacidos niños, y el número de elementos de las muestras es superior a 30, las proporciones muetrales sigue una distribución Normal cuyos parámetros son: p ⋅ q ) p : N p, n p = Proporción poblacional de niños = 0'515 siendo: q = Proporción poblacional de niñas = 0'485 n = número de elementos de la muestra = 200 0'515 ⋅ 0'485 ) p : N 0'515, = N(0'515, 0'035) 200 El problema se transforma en calcular: POR POR 0'40 − 0'515 ) ) p(p < 0'40 ) = p = 0'40 → z = = −3'29 = p(z < −3'29 ) = p(z > 3'29 ) = p z ≤ 3'29 = SIMETRIA COMPL 0'035
(
)
F : 3'2 = 1 − p(z ≤ 3'29 ) = 1 − φ(3'29 ) = N(0, 1) : φ(3'29 ) = = 0'9995 = 1 − 0'9995 = 0'0005 C : 0'09 La probabilidad de que en un muestra de 200 recién nacidos la proporción de niños sea inferior al 40%, es del 0’05 %
b.
Entre el 48% y el 52% sean niños. Con la misma distribución para la proporción del apartado a, esta vez piden: 0'48 − 0'515 ) = −1'00 p = 0'48 → z = ) 0 ' 035 p(0'48 < p < 0'52 ) = = p(− 1'00 < z < 0'14 ) = p(z < 0'14 ) − p(z ≤ −1'00 ) = 0'52 − 0'515 ) p = 0'52 → z = = 0'14 0'035
SIMETR
=
p(z < 0'14) − p(z ≥ 1'00)
= φ(0'14) − (1 − φ(1'00))
COMPL
=
(
)
p(z < 0'14) − p z < 1'00 = p(z < 0'14) − (1 − p(z < 1'00)) =
F : 0'1 φ(0'14) = = 0'5557 C : 0'04 = = 0'5557 − (1 − 0'8413) = 0'3970 F : 1 ' 0 φ(1'00) = = 0'8413 C : 0'00
N (0,1)
La probabilidad de que el porcentaje de niños en 200 nacimientos este comprendido entre el 48% y 52% es del 39’7 %
11. De 1000 muestras de 200 niños cada una, ¿en cuantas de ellas cabe esperar? : a) Menos del 40% de niños; b) ¿Entre el 48 y el 52% de niños? Supónganse equiprobables los sucesos niño / niña Solución: a. Menos del 40% sean niños. El número medio de muestras con una proporción determinada, también denominada esperanza matemática para la proporción, se obtiene multiplicando el número de elementos por la probabilidad de que se de esa proporción ) µ = N ⋅ p(p < 0'40) ) p ≡ proporción de niños en una muestra 200 individuos. Sigue una distribución normal cuyos parámetros son: p ⋅ q ) p : N p, n p = Proporción poblacional de niños = 0'50 siendo: q = Proporción poblacional de niñas = 0'50 n = número de elementos de la muestra = 200 0'50 ⋅ 0'50 ) p : N 0'50, = N(0'50, 0'035) 200 N (050, 0'035) SIMETRIA 0'40 − 0'50 ) ) p(p < 0'40) = = −2'86 = p(z < −2'86) = p(z > 2'86) = p = 040 → z = 0'035 N (0, 1) F : 2'8 p z ≤ 2'86 = 1 − p(z ≤ 2'86 ) = 1 − φ(2'86 ) = φ(2'86 ) = = 0'9979 = 1 − 0'9979 = 0'0021 C : 0'06 µ = 1000 ⋅ 0'0021 = 2'1 En 1000 muestras de 200 nacimientos habrá 2 que tengan una proporción de niños menor del 40%
COMPLEMENTARIO
=
b.
(
)
¿Entre el 48 y el 52% de niños? ) µ = N ⋅ p(0'48 < p < 0'52) 0'48 − 0'50 ) = −0'57 N (0 '50, 0'035)p = 0'48 → z = ) 0 ' 035 = p(0'48 < p < 0'52 ) ) = p(− 0'57 < z < 0'57 ) = 0'52 − 0'50 p = 0'52 → z = = 0'57 0'035
= p(z < 0'57 ) − p(z ≤ −0'57 )
SIMETRIA
=
p(z < 0'57 ) − p(z ≥ 0'57 )
COMPL
=
(
)
p(z < 0'57 ) − p z < 0'57 =
F : 0'50 p(z < 0'57 ) − (1 − p(z < 0'57 )) = 2 ⋅ p(z < 0'57 ) − 1 = 2 ⋅ φ(0'57 ) − 1 = = 2 ⋅ 0'7157 − 1 = 0'4314 C : 0`07
De 1000 muestras de 200 recién nacidos, 431 de ellas tendrán una proporción de niños comprendida entre el 48% y el 52%. 12. La cantidad de dinero que llevan (en sus bolsillos) las personas de una determinada ciudad se distribuye normalmente, con media µ = 30 € y σ = 6 € ¿cuál es la probabilidad de que un grupo de 125 individuos lleve un total inferior a 3525 €. Solución: x ≡ Cantidad de dinero. Variable continua con distribución Normal x : N(µ, σ ) = N(30, 6 )
Si se toman muestras de tamaño 125, las medias de estas siguen también una distribución Normal 6 σ = N (30,0'54) = N 30, x : N x µ, x x n 125 Para la variable media muestral, se pide: N (30,0 '54 ) SIM 3525 28'2 − 30 = x = 28'2 → z = = −3'33 = p(z < −3'33) = p(z > 3'33) = p x < = p x < 28'2 125 0'54 COMPL F : 3 ' 3 = p z ≤ 3'33 = 1 − p(z ≤ 3'33) = 1 − φ(3'33) = = 1 − 0'9996 = 0'0004 C : 0 ' 03 La probabilidad que en un grupo de 125 personas la cantidad de dinero que llevan entre todos sea menor de 3525 € es del 0’04 %
(
)
(
)
13. Supónganos que el 25% de los jóvenes carecen de sensibilidad ecológicas. Calcula el intervalo de probabilidad al 99%, para la proporción de insensibles en muestras de tamaño 100. Solución: ) p ≡ proporción de los jóvenes que carecen de sensibilidad ecológica. Se pide calcular un intervalo de probabilidad para la proporción en muestras de tamaño 100, con una confianza del 99%.
Intervalo de probabilidad para la proporción: ) ) ) ) ) p − Z α ⋅ p ⋅ q , p) + Z α ⋅ p ⋅ q n n 2 2 ) p = 0'25 ) donde: q = 0'75 , Z α se relaciona con el nivel de significación (α), y este a su vez con el de confianza 2 n = 100 (1−α). Si el nivel de confianza es del 99%, el nivel de significación es: α = 1 − 0’99 =0’01 Conocido α, se calcula Z α mediante: 2
0'01 α −1 Z α = φ −1 1 − = φ −1 1 − = φ (0'9950) = 2'58 2 2 2 sustituyendo en el intervalo de confianza: 0'25 − 2'58 ⋅ 0'25 ⋅ 0'75 , 0'25 + 2'58 ⋅ 0'25 ⋅ 0'75 = (0'138, 0'362) 100 100 En muestras de 100 jóvenes, la proporción de los que carecen de sensibilidad ecológica con una probabilidad del 99% estará comprendida entre 13’8% y el 36’2%.
14. Al acto de presentación de unas oposiciones asistió el 65% de los candidatos. Si se hubiesen tomado, elegidos al azar, 81 opositores, ¿cuál es la probabilidad de que se presenten menos de 55? Solución: Se pide hacer una estimación de una proporción muestral (pˆ ) de asistentes a unas oposiciones conocida la proporción poblacional. Puesto que el número de elementos de la muestra es superior a 30, la distribución de las proporciones muestrales de tamaño n siguen una ley Normal cuyos parámetros son: p ⋅ q N p, n p = proporción de asistentes = 0'65 donde: q = 1 − p = 1 − 0'65 = 0'35 n = n º de elementos de la muestra = 81
Por lo tanto las proporciones de muestras de 81 elementos siguen una normal: 0'65 ⋅ 0'35 pˆ : N 0'65, = N(0'65, 0'05) 81 55 − 0'65 F : 0'5 ) 55 N (0'65, 0'05) ) 55 = → z = 81 = 0'58 = p(z < 0'58) = p p < = 0'7190 p = 0'05 81 81 C : 0'08 La probabilidad de que asistan menos de 55 opositores de entre 81 es del 71’9 % 15. El 40% de los ciudadanos de una región se opone a la construcción de una presa. Si se pregunta a 60 personas de esa región, ¿qué probabilidad hay de que ganen los que se oponen? Solución: Se pide hacer una estimación de una proporción muestral conocido la proporción poblacional. p ≡ Proporción de ciudadanos que se oponen a la construcción de una presa. p = 0’40. Puesto que el número de elementos de la muestra es superior a 30, la distribución de las proporciones muestrales de tamaño n siguen una ley Normal cuyos parámetros son: p ⋅ q 0'40 ⋅ 0'60 ) p : N p, = N 0'40, = N(0'40, 0'06) n 60 Para que ganen los que se oponen, la proporción de la muestra tendrá que ser mayor del 50%. N (0'40, 0'06) COMPL 0'50 − 0'40 ) ) p(p > 0'50) = = 1'67 = p(z > 1'67 ) = p z ≤ 1'67 = 1 − p(z ≤ 1'67 ) = p = 0'50 → z = 0'06
(
)
N (0, 1) F : 1'6 = 1 − φ(1'67 ) = φ(1'67 ) = = 0'95251 − 0'9525 = 0'0475 C : 0'07
Con la proporción poblacional del 40% para los que se oponen, la probabilidad de que en una muestra de 60 individuos ganen los que se oponen es del 4’75%.
16. ¿Cuantos unos deben de salir al lanzar un dado 200 veces para que con un nivel de confianza del 95% podamos asegurar que el dada no está trucado? Solución: Se pide calcular el intervalo de confianza para la proporción de unos al lanzar un dado 200 veces, y una vez obtenido este que se transforme en valores medios. Si el dado no está trucado la proporción de unos debe ser 1 , y en muestras de 200 lanzamientos la 6 proporción muestral seguirá una ley Normal cuyos parámetros son: 1 5 ⋅ p⋅q 1 ) = N , 6 6 = N(0'167, 0'026) p : N p, n 6 200 El intervalo de probabilidad para la proporción de unos en doscientos lanzamientos es: p − Zα ⋅ p ⋅ q , p + Zα ⋅ p ⋅ q n n 2 2 Para un nivel de confianza del 95%, el nivel de significación (α) es: 1 − α = 0’95 → α = 0’05 Conocido el nivel de significación se obtiene el valor de Z α . 2
Zα
α 0'05 −1 = φ 1 − = φ −1 1 − = φ (0'9750 ) = 1'96 2 2 −1
2
Sustituyendo: 1 5 1 5 ⋅ ⋅ 1 − 1'96 ⋅ 6 6 , 1 + 1'96 ⋅ 6 6 = (0'115, 0'219 ) 6 200 6 200 aplicando esta proporción a 200 lanzamientos, el número de unos que nos deben de aparece debe estar comprendido entre (23, 43) , ambos inclusive
17. Para una muestra, de tamaño 81, de alumnas de segundo de bachillerato se obtuvo una estatura media de 167 cm. Si por trabajos anteriores se sabe que la desviación típica de la altura de la población de chicas de segundo de bachillerato es de 8 cm, construye los intervalos de confianza para la estatura media de la población. a) al 90%; b) al 95%. Solución: Se pide calcular el intervalo de probabilidad para la altura media de muestras de 81 alumnas de 2º de bachiller conocida una media muestral a dos niveles diferentes de confianza. El intervalo de probabilidad a un nivel de confianza 1 − α a partir de una media muestral es: σ σ x − Zα ⋅ , x + Zα ⋅ 2 2 n n donde: x = 167 , σ = 8, n = 81 8 8 167 − Z α ⋅ ,167 + Z α ⋅ 2 2 81 81
Para un nivel de confianza del 90%: α 0'1 1 − α = 0’90 → α = 0’1 : Z α = φ −1 1 − = φ −1 1 − = φ −1 (0'9500 ) = 1'65 2 2 2 8 8 167 − 1'65 ⋅ = (165'5, 168'5) , 167 + 1'65 ⋅ 81 81 Para un nivel de confianza del 95%: α 0'05 −1 1 − α = 0’95 → α = 0’05 : Z α = φ −1 1 − = φ −1 1 − = φ (0'9750 ) = 1'96 2 2 2 8 8 167 − 1'96 ⋅ = (165'3, 168'7) , 167 + 1'96 ⋅ 81 81 Al aumentar el nivel de confianza, aumenta la amplitud del intervalo.
18. Para la población de alumnas de segundo de bachillerato visto en el problema anterior: ¿Qué error máximo se admite para la media poblacional en cada una de las estimaciones hechas?, al 90% y 95% de confianza. Solución: Se define el error máximo para una media muestral como: ε max > µ − x a)
En función de los parámetros que caracterizan la distribución de las medias muestrales y del nivel de confianza que se le quiera dar, el error máximo se define como: σ ε max > Z α ⋅ 2 n Sustituyendo la desviación y el número de datos 8 ε max > Z α ⋅ 2 81
•
Para un nivel de confianza del 90%:
α 0'1 1 − α = 0’90 → α = 0’1 : Z α = φ −1 1 − = φ −1 1 − = φ −1 (0'9500) = 1'65 2 2 2 sustituyendo en el error máximo: 8 ε max > 1'65 ⋅ = 1'5 81 •
Para un nivel de confianza del 95%:
α 0'05 −1 1 − α = 0’95 → α = 0’05 : Z α = φ −1 1 − = φ −1 1 − = φ (0'9750) = 1'96 2 2 2 sustituyendo en el error máximo: 8 ε max > 1'96 ⋅ = 1'7 81 Manteniendo el número de elementos de las muestras constantes, si se quiere aumentar el nivel de confianza, se debe aumentar el error máximo admitido.
b) ¿Qué tamaño muestral sería necesario en cada caso si se admite un error de 1cm? Solución: Partiendo de la definición de error máximo admitido, se puede despejar el número de elementos de la muestra. σ → n > Z α ⋅ ε 2 2 n max Sustituyendo la desviación y el error máximo admitido ε max > Z α ⋅
σ
8 n > Zα ⋅ 1 2 •
2
2
Para un nivel de confianza del 90%: Z α = 1'65 2
sustituyendo en tamaño muestral: 2
8 n > 1'65 ⋅ = 174'25 1 n ≥ 175 •
Para un nivel de confianza del 95%: Z α = 1'96 2
sustituyendo en tamaño muestral: 2
8 n > 1'96 ⋅ = 245'86 1 n ≥ 246 Si se quiere aumentar el nivel de confianza manteniendo el máximo error admitido constante, se debe aumentar el tamaño de las muestras
19. Una investigación examina los gastos en consumo de una muestra de 64 familias españolas elegidas al azar. La media muestral es de 10 000 € y la desviación típica s = 2 000 €. Construir el intervalo de confianza 95% para todas las familias españolas. Solución: x ≡ gasto en consumo de las familias españolas. Variable continua que sigue una distribución normal, de la que se conoce la desviación y se desconoce la media poblacional. Las medias de las muestras de tamaño 64 tamaño 64 también siguen una distribución Normal. El intervalo de probabilidad a partir de una media muestral con un nivel de confianza 1 − α viene representado por: σ σ x o − Zα ⋅ , x o + Zα ⋅ 2 2 n n Para un nivel de confianza del 95%, el Z crítico se calcula de la siguiente forma: α 0'05 −1 1 − α = 0’95 → α = 0’05 : Z α = φ −1 1 − = φ −1 1 − = φ (0'9750) = 1'96 2 2 2 Sustituyendo en el intervalo los datos del enunciado y el valor del Z crítico: 2 000 2 000 = (9 510 , 10 490) 10 000 − 1'96 ⋅ , 10 000 + 1'96 ⋅ 64 64 Con una probabilidad del 95%, el gasto medio en consumo de 64 familias Españolas estará comprendido entre 9510 y 10490 €.
20. En 1995, un informe de uno de los grandes bancos españoles afirmaba, a partir de una muestra de tamaño n = 1200, que el 65 % de las familias españolas tenía dificultades económicas para llegar a fin de mes. Construye el intervalo de confianza al 95% para la totalidad de las familias españolas. Solución: 21. En un instituto, de los 250 alumnos de Bachillerato 180 de ellos eligen la religión católica como optativa. En el supuesto de que esos alumnos sean representativos de su ciudad, determina el intervalo de confianza para la proporción de los alumnos que eligen tal opción en toda la población, con una confianza del 99%. Solución: 22. Un granjero quiere conocer el peso ganado por sus pollos tras un periodo de 15 días con una nueva alimentación. Estima el número de pollos que habrá que pesar para conocer el peso medió ganado por cada pollo, con un error máximo de 50g y una confianza del 90%, si por estudios sobre nutrición se sabe que la desviación típica del aumento de pesos es de 150 gramos. Solución: 36. septiembre 1999 (Puntuación máxima: 2 puntos) Una variable aleatoria tiene una distribución normal de media µ y desviación típica σ. Si se extraen muestras aleatorias simples de tamaño n, a) ¿Qué distribución tiene la variable aleatoria media muestral X ? Solución: La media de las medias muéstrales (x ) , es igual a la media real de la población (µ), mientras que la σ desviación típica de las medias muéstrales viene dada por σ x = . Esto significa que la distribución de las n medias muéstrales de tamaño n, extraídas de una población normal N(µ,σ), se ajustan a una normal : σ N x µ, n b) Si se toman muestras de tamaño n = 4 de una variable aleatoria X con distribución N(165, 12) calcúlese p( X < 173'7) . Solución: Si tomamos muestras, de tamaño 4, de una distribución N(165,12), las medias de estas muestras seguirán una 12 , es decir, x tendrá una distribución N(165,6). Para calcular la p(x > 173'7 ) , habrá distribución N165, 4 que tipificar la variable con los parámetros de la distribución. x − µ 173'7 − 165 = = 1'45 , por lo tanto Sí x = 173'7 entonces Z = σx 6 p(x > 173'7 ) = p(Z > 1'45) = p(Z ≤ 1'45) = 1 − p(Z ≤ 1'45) = 1 − φ(1'45) = 0'0735 F → 1'4 φ(1'45) = TABLA = 0'0735 C → .05
38. (Puntuación máxima 2 puntos) Se está realizando una encuesta sobre el nivel de conocimientos generales de los estudiantes de Bachillerato de Madrid. Para ello, se ha elegido una muestra aleatoria de 9 de éstos estudiantes, a los que se ha realizado un examen. Las calificaciones obtenidas han sido las siguientes: 7’8 6’5 5’4 7’1 5’0 8’3 5’6 6’6 6’2. Se supone que la variable aleatoria objeto de estudio sigue una distribución normal de desviación típica conocida e igual a 1. Se pide: a) Un intervalo de confianza al 98% para la media de las calificaciones en el examen b) El tamaño mínimo que debería tener la muestra, en el caso de admitir un error máximo de 0,5 puntos, con un nivel de confianza del 95%. Solución: a) Se pide calcular un intervalo de confianza para la media (se supone poblacional) con un nivel de confianza del 98%, a partir de una media obtenida de una muestra de tamaño 9. En estos casos la variable σ con lo que la distribución media de las muestras sigue una distribución del tipo N(x, σ x ) , donde σ x = n σ . queda de la forma: N x x, n El intervalo de confianza para una variable con esta distribución viene dado por la expresión: σ σ x − Zα 2 ⋅ , x + Zα 2 ⋅ n n Donde α representa el riesgo que se asume. Nivel de confianza = 1 − α = 0’98; α = 0’02; α = 0'01; φ −1 Z α 2 = 1 − α = 0'99 ⇒ Z α 2 = 2'33 2 2 7'8 + 6'5 + 5'4 + 7'1 + 5'0 + 8'3 + 5'6 + 6'6 + 6'2 x= = 6'5 9 1 1 6'5 − 2'33 ⋅ = (5'7 , 7'3) , 6'5 + 2'33 ⋅ 9 9
(
b) E máx = Z α 2 ⋅
)
2
σ despejando n: n > Z α 2 ⋅ E n máx 1 − α = 0’95; Z α 2 = 1'96
σ
2
1 n > 1'96 ⋅ = 15'4 ⇒ n ≥ 16 0'5
39 (Puntuación máxima 2 puntos) Dos variables aleatorias independientes X1 y X2 siguen una distribución normal con media µ y la desviación típica σ. a)
¿Qué distribución tiene la variable aleatoria X =
b) Si µ=15 y σ=√8, calcúlese p(X1+X2>28). Solución.
X1 + X 2 ? 2
a. La nueva distribución será la correspondiente a una variable media muestral con tamaño de muestra n = 2, por lo que su distribución será: σ N X µ, 2 X + X 2 28 < p(X 1 + X 2 < 28) = p 1 = p(X < 14 ) 2 2 siendo X la variable media muestral de tamaño 2, cuya distribución es: 8 = N X (15, 2 ) N X 15, 2
b.
14 − 15 p(X < 14) = Z = = −0'5 = p(Z < −0'5) = p(Z > 0'50) = p(Z ≤ 0'50) = 1 − p(Z ≤ 0'50 ) = 1 − φ(0'50) = 2 Simetrica = 1 − 0’6915 = 0’3085 p(X1+X2>28) = 30’85%