Estad´ıstica Descriptiva y Probabilidad (Teor´ıa y problemas) 3a Edici´on Autores I. Espejo Miranda F. Fern´andez Palac´ın M. A. L´opez S´anchez M. Mu˜ noz M´arquez A. M. Rodr´ıguez Ch´ıa A. S´anchez Navas C. Valero Franco
c Copyright °2006 Universidad de C´ adiz. Se concede permiso para copiar, distribuir y/o modificar este documento bajo los t´ erminos de la Licencia de Documentaci´ on Libre de GNU, Versi´ on 1.2 o cualquier otra versi´ on posterior publicada por la Free Software Foundation. Una traducci´ on de la licencia est´ a incluida en la secci´ on titulada “Licencia de Documentaci´ on Libre de GNU”.
c Copyright °2006 Universidad de C´ adiz. Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation. A copy of the license is included in the section entitled “GNU Free Documentation License”.
Edita: Servicio de Publicaciones de la Universidad de C´ adiz C/ Dr. Mara˜ n´ on, 3 11002 C´ adiz http://www.uca.es/publicaciones
ISBN: 978-84-9828-058-6 Dep´osito legal:
Estad´ ıstica Descriptiva y Probabilidad. Teor´ ıa y Problemas (Revisi´ on: Febrero 2006) I. Espejo Miranda, F. Fern´ andez Palac´ın, M. A. L´ opez S´ anchez, M. Mu˜ noz M´ arquez, A. M. Rodr´ıguez Ch´ıa, A. S´ anchez Navas, C Valero Franco c °2006 Servicio de Publicaciones de la Universidad de C´ adiz. Documento bajo Licencia de Documentaci´ on Libre de GNU (Versi´ on 1.2 o posterior). http://www.uca.es/teloydisren
Cap´ıtulo 5 Variable aleatoria
1.
Concepto
En el cap´ıtulo anterior se introduc´ıa el concepto de probabilidad definido sobre el ´algebra de Boole de los sucesos. Sin embargo, este concepto presenta el inconveniente de que no es susceptible de un buen manejo matem´atico, debido fundamentalmente a la diversidad de las categor´ıas de los resultados de un experimento, de ah´ı que sea necesario realizar una abstracci´on cuantificada de dicho experimento que permita agrupar los sucesos seg´ un determinadas caracter´ısticas comunes y consecuentemente se facilite su manejo y la aplicaci´on del an´alisis matem´atico. Dicha abstracci´on se realiza asignando un n´ umero real a cada suceso del espacio muestral. La funci´on mediante la cual se realiza esta correspondencia recibe el nombre de variable aleatoria. M´as formalmente, se define la variable aleatoria como cualquier funci´on medible que asocia a cada suceso un n´ umero real. Profundizando en la idea de variable aleatoria como abstracci´on de los resultados de un experimento aleatorio, y puesto que cada suceso tiene una determinada probabilidad de ocurrencia, se puede trasladar dicha probabilidad al valor correspondiente de la variable aleatoria, por lo que se puede hablar de la probabilidad de que una variable aleatoria tome un determinado valor. As´ı,
146 Cap´ıtulo 5. Variable aleatoria 1. Al lanzar una moneda, se le puede asociar el valor 1 al suceso elemental “cara” y el valor 0 al suceso “cruz”. 2. Al lanzar dos dados al aire se puede asociar a cada resultado la suma de los puntos obtenidos. Es importante observar que la asignaci´on de valores a los resultados del experimento no es u ´nica, de hecho basta con fijar valores distintos a resultados distintos, para obtener una infinidad de funciones. No obstante, la idea es que dicha asignaci´on sea lo m´as natural posible para que una vez manipulada la variable aleatoria los resultados sean f´acilmente interpretables en t´erminos del experimento de partida. 2.
Variables discretas y continuas
Una variable aleatoria, en lo sucesivo v.a., se denomina discreta si toma valores aislados o puntuales. Ejemplo 5.1
La variable X=“N´ umero de hijos varones de una familia de 2 hijos”, puede tomar los valores 0, 1 y 2. Si se desea calcular la probabilidad de que X tome cada uno de sus valores posibles, suponiendo que la probabilidad de que un hijo sea var´ on es 0’49, y en el supuesto de que los sucesos sean independientes, se tiene que: P (X = 2) = 00 49 · 00 49 = 00 2401 P (X = 1) = 00 49 · 00 51 + 00 51 · 00 49 = 00 4998 P (X = 0) = 00 51 · 00 51 = 00 2601 . Siendo la suma de estas probabilidades, como era de esperar, la unidad.
Una v.a. es continua si puede tomar cualquier valor dentro de uno o varios intervalos determinados. As´ı, la variable X que asocia a cada individuo de un colectivo su estatura es continua; en este caso, la probabilidad de que la variable tome exactamente un valor determinado, 160 cms. por ejemplo, es cero. Esto tiene su justificaci´on intuitiva, des-
5.3 Variables unidimensionales 147 de el punto de vista de la regla de Laplace, en que el n´ umero de casos favorables es uno s´olo, mientras que el n´ umero de casos posibles es infinito. De hecho, esa es la principal caracter´ıstica de la variable continua y obligar´a a darle un tratamiento especial. Para terminar, se puede considerar una v.a. mixta, la cual toma valores dentro de uno o varios intervalos y algunos valores puntuales m´as fuera de ´el o de ellos. Lo dicho hasta ahora vale tanto para experimentos simples –lanzar un dado y anotar el n´ umero de la cara superior–, como para experimentos complejos –medir el peso, la estatura y la edad en a˜ nos de un grupo de personas–. En el primer caso la variable asociada ser´a unidimensional –discreta en el ejemplo–, y en el segundo multidimensional, tridimensional, continua para las dos primeras dimensiones y discreta para la edad. 3.
Variables unidimensionales
3.1.
Caracterizaci´ on de variables aleatorias
Como se ha visto, la v.a. es una abstracci´on num´erica que se hace de los resultados de un experimento aleatorio, y puesto que cada suceso tiene una determinada probabilidad de ocurrencia se traslada dicha probabilidad al valor correspondiente de la v.a. Si la variable es discreta y toma pocos valores distintos, como en el ejemplo de los hijos varones, es factible, e incluso conveniente, dar todos esos valores con sus probabilidades de una forma expl´ıcita. Pero si la variable es discreta y toma muchos valores diferentes (tal vez infinitos) o si es continua, lo anterior es poco recomendable o incluso imposible. Por ello es necesario apoyarse en una serie de funciones, relacionadas ´ıntimamente con dichas probabilidades, que nos permitan resolver el problema. Estas funciones son la funci´ on de cuant´ıa en el caso discreto, la de densidad en el continuo; as´ı como, la de distribuci´ on, la caracter´ıstica y la generatriz de momentos, entre otras, en ambos casos. Este apartado se centra en las tres primeras.
148 Cap´ıtulo 5. Variable aleatoria 3.1.1. Caso discreto Si una v.a. toma valores x1 , x2 , . . . , xn , . . ., (finitos o infinitos) la regla que asocia a cada uno de ellos las probabilidades p1 , p2 , . . . , pn , . . ., respectivamente, donde pi = P (X = xi ) se denomina funci´ on de cuant´ıa. Como la suma de todas las probabilidades de los sucesos elementales es uno, se tiene que: (n/∞)
X
pi = 1 .
i=1
Una v.a. discreta queda perfectamente determinada cuando se conoce su funci´on de cuant´ıa, pudi´endose expresar ´esta de dos formas, por extensi´on o a trav´es de una funci´on. Ejemplo 5.2
Utilizando la distribuci´on del ejemplo 5.1, la funci´on de cuant´ıa puede darse como: x P (X = x) 0 00 2601 1 00 4998 2 00 2401 O bien: P (X = x) =
µ ¶ 2 0 x 0 2−x 0 49 · 0 51 x
para x = 0, 1, 2. Otra forma de caracterizar una v.a. es a trav´es de la llamada Funci´ on de Distribuci´ on, definida por: F (x) = P (X ≤ x) . La funci´on de distribuci´on en un valor x, es la probabilidad de que X tome valores menores o iguales a x. Es decir, es una funci´on que acumula toda la probabilidad entre menos infinito y el punto donde est´a definida.
5.3 Variables unidimensionales 149 Propiedades de la funci´ on de distribuci´ on. La funci´on de distribuci´on de una variable aleatoria discreta cumple las siguientes propiedades (figura 5.1): 1. Est´a definida en toda la recta real. 2. Es no decreciente y no negativa. 3. Toma el valor cero en menos infinito y el valor uno en m´as infinito. 4. S´olo tiene discontinuidades de salto -precisamente en los puntos donde la funci´on de cuant´ıa es distinta de cero-. Ejemplo 5.3
Algunos valores de la funci´on de distribuci´on para el ejemplo que se arrastra son: F (−00 5) F (0) F (1) F (2)
= = = = = F (20 5) =
Y de aqu´ı es F (x) =
P (X P (X P (X P (X 1 1.
≤ −00 5) = 0 = 0) = 00 2601 = 0) + P (X = 1) = 00 7599 = 0) + P (X = 1) + P (X = 2)
f´acil ver que: 0 si x < 0 00 2601 si 0 ≤ x < 1 00 7599 si 1 ≤ x < 2 1 si x ≥ 2 .
Esta funci´on se representa gr´aficamente en la figura 5.1. 3.1.2. Caso continuo Como se dijo en su presentaci´on, la caracter´ıstica principal de la variable continua es que la probabilidad de que tome un determinado valor es cero. Sin embargo, a´ un siendo ello cierto, no todos los valores tienen “la misma ocurrencia”. Se puede comprobar que hay bastantes
150 Cap´ıtulo 5. Variable aleatoria F (x) 6
s
1 0’76
s
0’26 s
c
c
c
-
1
2
x
Figura 5.1: Funci´on de distribuci´on discreta. individuos que tienen estatura alrededor de 160 cms, muchos menos alrededor de 210 cms y ninguno en el entorno de los 350 cms. Lo anterior hace que interese, no ya la probabilidad de tomar exactamente un valor, sino la probabilidad de que la variable se encuentre en el entorno de un punto, es decir, que tome valores dentro de un intervalo. As´ı, se considera un intervalo peque˜ no centrado en 160 cms. y de amplitud ∆, sea ´este: [160 − ∆/2, 160 + ∆/2] con lo que la probabilidad de que X tome alg´ un valor del intervalo ser´a peque˜ na, pero no nula. Si a continuaci´on se levanta sobre el intervalo considerado un rect´angulo de altura h(160), tal que su ´area sea igual al valor de la probabilidad anterior, se tiene: ´ Area = h(160) · ∆ = P (160 − ∆/2 ≤ X ≤ 160 + ∆/2) . De ah´ı que la altura del rect´angulo pueda asociarse a una densidad de probabilidad, por ser igual al cociente entre la probabilidad del intervalo y su tama˜ no. Si se seleccionan ahora valores xi de la v.a. X, distantes entre s´ı una distancia ∆ y se determinan las alturas h(xi ) de los infinitos intervalos as´ı obtenidos se obtiene un histograma y uniendo los centros de las caras superiores de los rect´angulos, el correspondiente pol´ıgono de frecuencias (figura 5.2).
5.3 Variables unidimensionales 151
h(x) 6
h(x) 6
©@ © @ ¡ ¡ @ @H H
¡ H H
f(x) 6
¡BB ¡ @
¡
@
¡
@ @
HH H
∆ 4
@
¡
@ @
HH H
-
∆
h(x) 6
¡A ¡ A
∆ 2
-
-
-
X Figura 5.2: Obtenci´on esquem´atica de la funci´on de densidad.
La suma de las ´areas de los rect´angulos debe ser uno, por ser igual a la probabilidad de que X tome cualquier valor. Si se hace que la anchura de los rect´angulos tienda a cero, el pol´ıgono de frecuencias se transforma en una curva (figura 5.2). Dicha curva es la representaci´ on gr´afica de la funci´on f , denominada funci´ on de densidad de la v.a. X, obtenida como l´ımite de los valores h: P (x − ∆/2 ≤ X ≤ x + ∆/2) = f (x) . ∆→0 ∆
l´ım h(x) = l´ım
∆→0
Si se desea calcular la probabilidad de que la variable se encuentre entre dos valores dados, ´esta es igual al ´area bajo la curva f entre a y b (figura 5.3). Es decir: Z b P (a ≤ X ≤ b) = f (x) d x . a
L´ogicamente se verifica que: Z
+∞
P (−∞ < X < +∞) = −∞
f (x) d x = 1 .
(5.1)
Obviamente f es no negativa. Cualquier funci´on no negativa que verifique la condici´on dada en (5.1) ser´a una funci´on de densidad.
152 Cap´ıtulo 5. Variable aleatoria f(x) 6
a
-
b
X
Figura 5.3: Probabilidad de que X tome valores entre a y b. f(x) 6
F(x)
-
x
X
Figura 5.4: Funci´on de distribuci´on de una variable continua. Al igual que en el caso discreto, la Funci´ on de Distribuci´ on, F , de una variable aleatoria X, se define como: Z
x
F (x) = P (X ≤ x) = −∞
f (u) d u .
La funci´on de distribuci´on en x da la probabilidad de que X tome valores menores o iguales a x, dicho valor es el ´area de la superficie rayada en la figura 5.4. Las propiedades de la funci´on de distribuci´on en el caso continuo son id´enticas a las del caso discreto con la u ´nica excepci´on de que ahora ´esta no presenta discontinuidades de salto. Para ciertas variables continuas de uso frecuente, los valores de F se encuentran tabulados, lo cual facilita considerablemente el c´alculo de probabilidades. Para terminar este ep´ıgrafe, se muestra la relaci´on existente entre las funciones
5.3 Variables unidimensionales 153 definidas: Z
b
P (a < X < b) = P (a ≤ X ≤ b) = a
Ejemplo 5.4
f (x) d x = F (b) − F (a) .
Si 1−x k f (x) = 0
si 0 ≤ x ≤ 1 si 2 ≤ x ≤ 3 en caso contrario.
1. Para que f sea funci´on de densidad debe verificar: a) f (x) ≥ 0, ∀x Z +∞ b) f (x) d x = 1 . −∞
La primera propiedad se cumple siempre que k ≥ 0. Se cuestiona para qu´e valor de k se verifica la segunda propiedad. Z +∞ Z 1 Z 3 f (x) d x = (1 − x) d x + kdx −∞
0
2
¶¯1 µ x2 ¯¯ = x− + kx|32 2 ¯0 1 = 1 − + 3k − 2k . 2
Por tanto, para que f sea funci´on de densidad, debe verificarse que 1 − 12 + 3k − 2k = 1 o equivalentemente k = 12 . 2. La funci´on de distribuci´on de la variable anterior es: Si R x x < 0 entonces F (x) = P (X ≤ x) = −∞ 0 d x = 0. Rx Si 0 ≤ x < 1 entonces F (x) = −∞ f (x) d x = R0 Rx x2 −∞ 0 d x + 0 (1 − x) d x = x − 2 .
154 Cap´ıtulo 5. Variable aleatoria Si 1 ≤ x < 2 entonces F (x) = R1 Rx 1 (1 − x) x + d 0 1 0 d x = 2.
R0
−∞ 0 d x
+
R0 Si 2 ≤ x < 3 entonces F (x) = −∞ 0 d x + R1 R2 Rx 1 x−1 0 (1 − x) d x + 1 0 d x + 2 2 d x = 2 . Si x ≥ 3 entonces F (x) = 1. Resumiendo: 0 x− F (x) =
3.2.
1 2 x−1 2
x2 2
1
si si si si si
x 00 25) = 1 − P (X ≤ 00 25) = 1 − 0
00 25
(2 − 2x) d x
¡ ¢¯00 25 = 1 − 2x − x2 ¯0 = 00 5625 . e) Para calcular la funci´on de densidad de B = 6X − 3, se aplica la f´ormula del cambio de variable: ¯ ¯ ¯d x¯ ¯ ¯ g(b) = f (x) ¯ db¯ b+3 b = 6x − 3 =⇒ x = µ µ ¶¶ 6 b+3 1 3−b g(b) = 2−2 = . 6 6 18
176 Cap´ıtulo 5. Variable aleatoria Se calcula el dominio de definici´on de esta nueva funci´on de densidad. Si b = 6x − 3 y 0 ≤ x ≤ 1 =⇒ −3 ≤ b ≤ 3, entonces ½ g(b) =
3−b 18
0
si − 3 ≤ b ≤ 3 en el resto.
La funci´on de distribuci´on viene dada por: Z
b
F (b) = −∞ Z b
= =
g(x) d x
3−x dx −3 18 µ ¶¯b x x2 ¯¯ 6b − b2 + 27 − ) ¯ = 6 36 36 −3
cuando b ∈ (−3, 3), por lo que: F (b) =
5.2.
0 6b−b2 +27 36
1
si b < −3 si −3 ≤ b ≤ 3 si b > 3 .
Ejercicios propuestos 5.1. Una v.a. tiene como funci´on de densidad: f (x) =
1 3
kx 0
si 0 < x < 1 si 2 < x < 4 en el resto.
a) Encuentre k para que f sea funci´on de densidad. b) Calcule la funci´on de distribuci´on. c) Obtenga la media, moda y mediana de la variable X.
5.5 Ejercicios 177 5.2. Una v.a. toma los valores −2, −1, 0, 1, 2. Se sabe que cada valor tiene la misma probabilidad que su opuesto, que P (X = 0) = 00 2 y que la probabilidad del valor 1 es el doble que la del 2. Calcule: a) La funci´on de cuant´ıa y la funci´on de distribuci´on. b) P (−1 ≤ X ≤ 1), P (−1 ≤ X < 1), P (X ≥ 2). c) La funci´on de cuant´ıa de la variable Y = 2X 2 . d) El valor esperado de la variable Y 2 . 5.3. Debido al aniversario de un centro comercial se regala por cada 30e de compra una llave para abrir un cofre de los 50 que hay. Entre ellos hay 2 que contienen premio, uno de 600e. y otro de 400e. ¿Cu´al es la ganancia esperada para una persona que tiene dos llaves? 5.4. Observando una determinada v.a. de un experimento se obtiene que su funci´on de densidad viene dada por: ½ f (x) =
1 2
+x 0
si 0 < x ≤ a en el resto.
a) Encuentre a para que f sea funci´on de densidad. b) Obtenga su funci´on de distribuci´on. c) Calcule su media, moda y mediana. d) Calcule P (X ≤ 3), P (0 ≤ X ≤ 00 5), P (X ≤ −00 5) e) En un experimento posterior se comprob´o que una nueva variable ven´ıa dada en funci´on de ´esta por: Y = Ln X. Calcule su funci´on de densidad. 5.5. ¿Existe alg´ un valor de k para el cual la funci´on: ½ f (x) =
k(1 − x) 0
si − 1 ≤ x ≤ 2 en el resto,
sea funci´on de densidad? En caso afirmativo calcule su funci´on de distribuci´on.
178 Cap´ıtulo 5. Variable aleatoria 5.6. El tiempo de vida, en meses, de determinados insectos viene dado por una v.a. cuya funci´on de distribuci´on es: ½ F (x) =
0 si K(1 − e−2x ) si
x