Media, mediana, moda y otras medidas de tendencia central

mos comunes, lag G =Hog 453600 = ~(5.6567) = 0.8081, entonces, G = 6.43 (re- dondeado a la centésima más cercana). Alternativamente puede utilizarse una ...
1MB Größe 168 Downloads 530 vistas
Media, mediana, moda y otras medidas de tendencia central

NOTACiÓN DE íNDICES Denotemos por Xj (léase "X sub l') cualquiera de los N valores XI' X2 , X 3"'" XN que toma una variableX. La letrajenXj , que puede valer 1,2,3, ... , N se llama subíndice. Es claro que es posible emplear cualquier otra letra en vez dej; por ejemplo, i, k, p, q o s.

El símbolo I1=1 Xj denota la suma de todos los Xj desde j = 1 hasta j = N; por definición, N

LX

j

= XI + X 2 + X 3 + ... + X N

j=1

Cuando no ocasione confusión, se denotará esa suma simplemente con El símbolo I es la letra griega sigma mayúscula, que significa suma.

EJEMPLO 1 EJEMPLO 2

3

j

j

N

?Xjlj = XI YI + X2Y2 + X3 Y3 + ... + XNYN

}=¡

N

N

¿aXj = aX¡ + aX2 + ... + aXN = a(X¡ + X2 + ... + XN) = aLXj

~

~

.

donde a es una constante. Más simple:

EJEMPLO

Ix, IX o I J0.

y

Si a, b c son constantes, entonces

I

aX = a Ix.

I(aX + bY - cZ) = a Ix + b Iy - e Iz (véase el problema 3.3).

PROMEDIOS O MEDIDAS DE TENDENCIA CENTRAL Un promedio es un valor típico o representativo de una conjunto de datos. Como tales valores suelen situarse hacia el centro del conjunto de datos ordenados por magnitud, los promedios se conocen como medidas de tendencia central.

\, La media aritmética ponderada.

59

Se definen varios tipos. siendo los más comunes la media aritmética. la mediana. la moda. la media geométrica y la media armónica. Cada una tiene ventajas y desventajas. según los datos y el objetivo perseguido .

.·'.J..@$UUJiiUk$$)ii4 \ LA

MEDIA ARITMÉTICA

La media aritmética. o simplemente media. de un conjunto de N números XI' X2 • X 3 ••••• X N se denota por X(léase "X barra") y se define por

(1)

EJEMPLO

4

La media aritmética de los números 8. 3. 5.12 Y 10 es

X = 8 + 3 + 5 + 12 + 10 = 38 = 7.6 5

5

Si los números XI' X2..... X KocurrenJ¡.h... .• fK veces. respectivamente (es decir, con frecuenciasJ¡.h •...• fK).la media aritmética es

(2)

donde N

EJEMPLO

5

=Lf es lafrecuencia total (es decir. el número total de casos).

Si 5, 8. 6 Y2 ocurren con frecuencias 3. 2.4 Y 1, en ese orden. su media aritmética es

X = (3)(5) + (2)(8) + (4)(6) + (1)(2) = 15 + 16 + 24 + 2 = 5.7 10

3+2+4+1

LA MEDIA ARITMÉTICA PONDERADA A veces se asocia a los números XI' X2••••• XKciertosfactores de peso (o pesos) W¡. dependiendo de la influencia asignada a cada número. En tal caso.

x=

_+_.'_'_+_W.::K_X...::.k + ... +WK

_\1....:.'1X--'-I_+_W.::.2X ----"-2

W¡ +w2

LWX

W 2••••• W K•

(3)

LW

se llama media aritmética ponderada con pesos J¡. h .... ./K' Obsérvese la similitud con la ecuación (2). que puede considerarse una media aritmética ponderada con pesosJ¡,f2'" .,fK'

EJEMPLO 6

Si el examen final de un curso cuenta tres veces más que una evaluación parcial y un estudiante obtiene una calificación de 85 en el examen final. y 70 Y90 en los dos parciales, la calificación media es

X = (1)(70) + (1)(90) + (3)(85) 1+1+3

= 415 = 83

5

60

CAPíTULO 3 •

Media, mediana, moda y otras medidas de tendencia central

PROPIEDADES DE LA MEDIA ARITMÉTICA 1.

EJEMPLO 7

La suma algebraica de las desviaciones de un conjunto de números con respecto a su media aritmética es cero.

Las desviaciones de los números 8, 3, 5, 12 Y10 en relación con su media aritmética 7.6 son 8 -7.6,

3 -7.6, 5 -7.6, 12-7.6y 10-7.6, o sea, 0.4,--4.6,-2.6,4.4 Y2.4, con suma algebraica 0.4-4.6- 2.6 + 4.4 + 2.4 =O. 2.

La suma de los cuadrados de las desviaciones de un conjunto de números Xj con respecto de un cierto número a es mínima si y sólo si a =X (véase el problema 4.27).

3.

Si/¡ números tienen media m¡,A números tiene media ~, .. . ,fK números tienen media mK , entonces la media de todos los números es

X =I¡m¡ +12 m2 + ... +IKmK /1 +fz+···+fK

(4)

es decir, una media aritmética ponderada de todas las medias (véase el problema 3.12). 4.

Si A es una media aritmética supuesta o conjeturada (que puede ser cualquier número) y si dj = Xj - A son las desviaciones de Xj respecto de A, las ecuaciones (1) y (2) se convierten, respectivamente, en

(5)

(6)

donde N =¿ ~=¡ h

=¿f. Observe que las fórmulas (5) y (6) se resumen en la ecuación

X =A + ¡¡ (véase el problema 3.18).

CÁLCULO DE LA MEDIA ARITMÉTICA PARA DATOS AGRUPADOS Cuando los datos se presentan en una distribución de frecuencias, todos los valores que caen dentro de un intervalo de clase dado se consideran iguales a la marca de clase, o punto medio del intervalo. Las fórmulas (2) y (6) son válidas para tales datos agrupados y se interpretan Xj como la marca de clase'h como su correspondiente frecuencia de clase, A como cualquier marca de clase conjeturada o supuesta y dj = Xj - A como las desviaciones de ~ respecto de A. Los cálculos con las fórmulas (2) y (6) se llaman métodos largos y métodos cortos, respectivamente (véanse los problemas 3.15 y 3.20). Si todos los intervalos de clase son del mismo tamaño c, las desviaciones dj = Xj - A pueden expresarse como cUj ' donde uj serían números enteros positivos, negativos o cero, es decir, O, ±1, ±2, ±3, ... , Yla fórmula (6) se convierte en

(7)

La moda.

61

que es equivalente a la ecuación X= A + cü (véase el problema 3.21). Esto se conoce como método de codificación para calcular la media. Es un método corto y debe usarse siempre para datos agrupados con intervalos de clase de tamaños iguales (véanse los problemas 3.22 y 3.23). Véase que en el método de codificación los valores de la variable X se transforman en los valores de la variable u de acuerdo con X = A + cu.

,LA MEDIANA La mediana de un conjunto de números ordenados en magnitud es el valor central o la media de los dos valores centrales.

EJEMPLO

8

EJEMPLO 9

El conjunto de números 3, 4, 4, 5, 6, 8, 8, 8 Y 10 tiene mediana 6. El conjunto de números 5, 5, 7, 9, 11, 12, 15 Y 18 tiene mediana!C9 + 11) = 10. Para datos agrupados, la mediana, obtenida por interpolación, está dada por

Mediana

-(L:!)¡ ) N

= L¡ +

2

(

donde:



c

(8)

fmediana

= frontera inferior de la clase de la mediana (es decir, la clase que contiene a

N= (2-/)¡ = fmediana = c=

la mediana) número de datos (es decir, la frecuencia total) suma de las frecuencias de las clases inferiores a la clase de la mediana frecuencia de la clase de la mediana tamaño del intervalo de clase de la mediana

Geométricamente, la mediana es el valor de X (abscisa), que corresponde a la recta vertical que divide un histograma en dos partes de área igual. Ese valor de X suele denotarse por X.

r

~MODA La moda de una conjunto de números es el valor que ocurre con mayor frecuencia; es decir, el valor más frecuente. La moda puede no existir e incluso no ser única.

EJEMPLO 10

El conjunto 2, 2, 5, 7, 9, 9, 9,10,10, 11, 12 Y 18 tiene moda 9.

EJEMPLO 11

El conjunto 3, 5, 8, 10, 12, 15 Y 16 carece de moda.

EJEMPLO 12

El conjunto 2, 3,4,4,4,5,5,7,7,7 Y9 cuenta con dos modas, 4 y 7, Yse le conoce como bimodal. La distribución con una sola moda se llama unimodal. En el caso de datos agrupados donde se haya construido una curva de frecuencias, para ajustar los datos, la moda será(n) el(los) valorees) de X correspondiente(s) al(os) máximo(s) de la curva. Ese valor de X se denota por X. La moda llega a obtenerse de una distribución de frecuencias o de un histograma a partir de la fórmula: Moda = L¡

+

C~¡~¡~Jc

(9)

62

CAPíTULO 3



Media, mediana, moda y otras medidas de tendencia central

donde

L¡ = frontera inferior de la clase modal (clase que contiene a la moda) = diferencia de la frecuencia modal con la frecuencia de la clase inferior inmediata. ~2 = diferencia de la frecuencia modal con la frecuencia de la clase superior inmediata. c = tamaño del intervalo de la clase modal.



;j(uu;q;:;¿;MPAtJlJi)Sb14UJQlt$§(i RELACiÓN EMPíRICA ENTRE MEDIA,

MEDIANA Y MODA Para curvas de frecuencia unimodales, que sean moderamente sesgadas o asimétricas, se tiene la siguiente relación empírica: Media - moda = 3(media - mediana)

(JO)

Las figuras 3-1 y ~-2 indican las posiciones relativas de la media, la mediana y la moda para curvas de frecuencia sesgadas a la derecha y a la izquierda, respectivamente. Para curvas simétricas, los valores de la media, la mediana y la moda coinciden.

FIGURA 3-1

FIGURA 3-2

LA MEDIA GEOMÉTRICA G La media geométrica G de un conjunto de N números positivos X¡, X 2 , X 3, ••• , X N es la raíz Nésima del producto de esos números: (11)

EJEMPLO 13

La

medi'á'g~bmétrica de los números 2, 4 Y8 es G =

"V(2)(4)(8) = "V64 = 4.

Puede calcular G por medio de logaritmos (véase el problema 3.35) o con una calculadora. Para la media geométrica de datos agrupados, véanse los problemas 3.36 y 3.9 I.

_

LA MEDIA ARMÓNICA H La media armónica H de un conjunto de números XI' X 2 , X 3, ••• , X N es el recíproco de la media aritmética de los recíprocos de los números:

1

N

1 l -¿N Xi

LX

H=----=N

i=l

1

(12)

~

Cuartiles, deciles y percentiles.

63

En la práctica puede ser más fácil recordar que

(13)

EJEMPLO 14

La media armónica de los números 2, 4 Y8 es

(Para la media armónica de datos agrupados, véanse los problemas 3.99 y 3.100.) Me

(1%.444#$$44$*$# $X

RELACiÓN ENTRE LAS MEDIAS ARITMÉTICA, GEOMÉTRICA Y ARMÓNICA La media geométrica de un conjunto de números positivos XI' X 2 , ••• , XNes menor o igual a su media aritmética, pero es mayor o igual a su media armónica. Es decir,

H5G5X

(14)

Los signos de igualdad se incluyen s610 si todos los números XI' X2 , ••• , XN son idénticos.

EJEMPLO 15

El conjunto 2, 4, 8 tiene media aritmética de 4.67, media geométrica de 4 y media armónica de 3.43.

LA MEDI~ CUADRÁTICA (MC) La media cuadrática (MC) de un conjunto de números XI' X 2 , ••• , X N algunas veces se simboliza por ~ y se define como

(15)

Este tipo de promedio sé utiliza con frecuencia en aplicaciones físicas.

EJEMPLO 16

La Me del conjunto 1,3,4,5 Y7 es 2 2 2 _12_+_3__+_4_2_+_5__+_7_ = 5

p

J20 =

4.47

CUARTILES, DECILES y PERCENTILES Si un conjunto de datos se ordena de acuerdo consu magnitud, el valor central (o la media aritmética de los dos valores centrales) que divide al conjunto en dos partes iguales es la mediana. Extendiendo esta idea, es posible considerar los valores que dividen al conjunto en cuatro partes iguales. Estos valores, denotados por QI' Q2 y Q3' se denominan como primero, segundo y tercer cuartiles, respectivamente, donde Q2 es igual a la mediana. De forma similar, los valores que dividen los datos en 10 partes iguales son llamados deciles; los cuales se denotan por DI' D 2 , ••• , D 9 , mientras que los valores que dividen a los datos en 100 partes iguales se conocen como percentiles y se indican con PI' P2 ,·.·, P 99 • El

64

CAPíTULO 3



Media, mediana, moda y otras medidas de tendencia central quinto decil y el 500. percentil coinciden con la mediana. Los percentiles 250. y 750. corresponden al primero y tercer cuartiles, respectivamente. De manera conjunta, cuartiles, deciles y percentiles, lo mismo que otros valores obtenidos por medio de subdivisiones iguales de los datos, son denominados cuantiles. Para el cálculo de éstos, a partir de datos agrupados, véanse los problemas 3.44 al 3.46.

Problemas resueltos Notación de sumatoria 3.1

Escriba los términos explícitos de cada una de las siguientes sumas indicadas: 6

a) b)

N

e)

LXj

La

j=1

}=I

4

5

d)

L(Yj - 3)2 j=¡

3

e)

L(Xj - a) j=1

LfkXk k=¡

SOLUCiÓN

b)

XI + X2 + X3 + X4 + Xs + X6 (Y I - W + (Y2 - 3f + (Y3 - 3)2 + (Y4 - 3)2

e)

a + a + a + ... + a = Na

d)

flX I + hX2 + jjX3+ f~4 + fsXs

~

~-~+~-~+~-~=~+~+~-~

a)

3.2

Exprese en notación de sumatoria cada uno de los siguientes términos: a) Xi + X~ + X~ + ... + Xro b)

(XI + Y¡) + (X2 + Y2)

+ ... + (Xg + Ys)

e) f¡Xi + AX~ + ... + f2oX~O d) a¡b¡ + a 2b2 + a 3b3 + ... + a,)JN

e) J¡X¡Y¡ + AX2 Y2 + f3X3Y3+ f4X4Y4 SOLUCiÓN lO

LX] j=1

b)

L(Xj + Y)) j='

e)

LfjX] j=1

d)

Lajbj j='

g

3.3

4

20

a)

e)

L fjX¡l j='

N

Pruebe que If=¡(aXj + blj - cZj) =aIf=¡ Xj + bIf=¡ lj - cIf=1 Zj' donde son cualesquiera constantes.

a, b y e

SOLUCiÓN N

L

}=,

(aXj

+ bY¡ -

cZj)

= (aX, + bY,

- cZ¡)

+ (aX2 + bY2 -

CZ2)

+ ... + (aXN + bYN -

CZN)

= (aXI + aX2 + ... + aXN) + (bY¡ + bY2 + ... + bYN )- (CZI + CZ2 + ... + CZN) =a(X, +X2 +···+XN)+b(Y¡ N

N

+ Y 2 +···+

YN)-c(Z¡ +Z2+,··+ZN)

N

= aLXj +b L Yj - CLZj

}=,

j=1

j=1

o, más breve, I(aX + bY - cZ) = aIX + bIY -

cIz.

Problemas resueltos. 3.4

65

Dos variables, X y Y, toman los valores XI = 2, X 2 = - 5, X 3 = 4, X 4 = -8 Y YI = - 3, Y2 = -8, Y3 = 10, Y4 = 6, respectivamente. Calcule a) b) e) d) e) g) h) + Y)(X - Y). ,

Irz,f) (Ix)(IY), Ixrz y I(x

Ix, Iy, Ixy, Ixz,

SOLUCiÓN

Obsérvese que en cada caso el subíndice j de X y Y ha sido omitido y que ¿ es entendida como ¿1=1' Así, por ejemplo, ¿X es la abreviatura de ¿1=1 Xj .

3.5

a)

¿X = (2) + (- 5) + (4) + (-8) = 2 -

b)

¿Y=(-3)+(-8)+(10)+(6)=-3 - 8+ 10+6=5

5 + 4 - 8 = -7

c)

¿XY= (2)(-3) + (-5)(-8) + (4)(10) + (-8)(6) = -6 +40+40 -48 =26

d)

¿X2= (2)2 + (-5)2 + (4)2 + (-8f=4 + 25 + 16 + 64= 109

e)

¿YZ = (-3)2 + (-8)2 + (lW + (6)2 = 9 + 64 + 100 + 36 = 209

f)

(¿X)(¿Y)=( -7)(5)= - 35, utilizando los incisos a) yb). Véase que (¿X) (¿Y)#¿XY.

g)

Ixyz = (2)( - W + (- 5)( -8)2 + (4)(10)2 + (-8)(6)2 = -190

h)

¿(X + Y)(X - Y) = ¿(X2 d) ye).

Si ¿~IXj

= -4 Y ¿~=IXJ =

YZ) = ¿X2 -

¿y2 = 109 -209 = -100, usando los incisos

10, calcule a) ¿~I (2Xj + 3), b) ¿~=IXlXj- 1) y

e) I~=I (~- 5)2. SOLUCiÓN 6

a)

6

j=1

j=1

6

b)

6

j=1

j=1

6

6

6

¿X)(X) -1) = ¿(X)2 - X) = ¿X)2 - ¿X) = 10 - (-4) = 14 j=1

j=1

6

e)

6

~)2X) + 3) = ¿2X) + ¿ 3 = 2 ¿X) + (6)(3) = 2(-4) + 18 = 10

j=1

6

j=1

6

¿(X) - 5)2 = ¿(Xl - 1Ox¡ + 25) =

¿

j=1

j=1

j=1

6

x¡2 - 10

¿

X¡ + 25(6) = 10 - 10(-4) + 25(6) = 200

j=1

Si así se desea, se puede omitir el subíndice j y utilizar ¿ en lugar de ¿J=I> siempre y cuando se comprendan bien estas abreviaturas.

La media aritmética 3.6

Las calificaciones de un estudiante en seis exámenes fueron: 84,91,72,68,87 Y 78. Encuentre la media aritmética. SOLUCiÓN

x = LX = 84 + 91 + 72 + 68 + 87 + 78 = 480 = 80 N

6

6

Con frecuencia el término promedio se utiliza como sinónimo de media aritmética. Sin embargo, estrictamente hablando, esto es incorrecto, dado que existen otros promedios además de la media aritmética.

3.7

Un científico registró diez mediciones del diámetro de un cilindro: 3.88, 4.09, 3.92, 3.97, 4.02, 3.95, ~:.Q1.. 3.92, }~~.y_4.:º§_~,~p.tí'E~t.!:.()§..c~!P). Determine su media aritmética. ¡ UN;",:.::;::',','. :;, ','ro': ¡

66

CAPíTULO 3



Media, mediana, moda y otras medidas de tendencia central SOLUCiÓN

-_¿ X _ N -

X -

3.8

3.88 + 4.09

~

3.92 + 3.97 + 4.02 + 3.95 + 4.03 + 3.92 + 3.98 + 4.06 _ 39.82 _ 9 10 - --¡-¡) - 3. 8cm

El siguiente resultado con Minitab muestra el tiempo por semana que pasaron en línea 30 usuarios de Internet, y también la media de los 30 tiempos. ¿Diría usted que este promedio es típico de los 30 tiempos? MTB

> print cl

Data Display

time 3 4 4 5 5 5 5 5 6 5 6 7 7 8 6 6 7 7 7 8 9 10 10 10 10 10 10 12 55 60 MTB

> mean el

Column Mean

Mean of time

= 10.400

SOLUCiÓN

La media de lOA horas no es típica o representativa de los tiempos. Obsérvese que 21 de los 30 tiempos son de un solo dígito, pero la media es de 1004 horas. Una gran desventaja de la media es que se ve fuertemente afectada por valores extremos.

3.9

Encuentre la media aritmética de los números 5, 3, 6, 5, 4, 5, 2,8,6,5,4,8,3,4,5, 4,8,2,5 Y4. SOLUCiÓN

Primer método

x= EX = 5+3+6+5+4+5+2+8+6+5+4+8+3+4+5+4+8+2+5+4 = 96 =48 20

N

20

.

Segundo método

Hay seis 5, dos 3, dos 6, cinco 4, dos 2 y tres 8. Por lo tanto,

x = EfX = EfX = (6)(5) + (2)(3) + (2)(6) + (5)(4) + (2)(2) + (3)(8) = 96 = 4.8 El

3.10

6+2+2+5+2+3

N

20

De un total de 100 números, 20 eran cuatros, 40 eran cincos, 30 eran seises, y los restantes eran sietes. Obtenga la media aritmética de los números. SOLUCiÓN

x = EfX = EfX = (20)(4) + (40)(5) + (30)(6) + (10)(7) = 530 = 5.30 El

3.11

N

100

100

Las calificaciones finales de un estudiante en matemáticas, física, inglés e higiene son, en ese orden, 82, 86, 90 Y 70. Si los créditos respectivos recibidos por estos cursos son 3, 5, 3 Y 1, determine un promedio de calificaciones apropiado.

Problemas resueltos.

67

SOLUCiÓN

Se utiliza una media aritmética ponderada, con pesos asociados a cada calificación considerada, como el número de créditos recibidos. Así, pues,

x = ¿wX = ¿I\"

3.12

(3)(82) + (5)(86) + (3)(90) + (1)(70) = 85 3+5+3+1

Una empresa tiene 80 empleados, 60 ganan $10.00 por hora y 20, $13.00 por hora. a)

Determine la ganancia media por hora.

b) ¿Sería igual la respuesta en a) si los 60 empleados tuvieron un salario medio

de $10.00 por hora? Compruebe su respuesta. e) ¿Considera que el salario medio por hora es representativo? SOLUCiÓN

a)

x = ¿.IX = i 60)($1O.00) + (20)($13.00) = $10 75 N

b)

60+ 20

.

Sí, el resultado es el mismo. Para probarlo, supóngase quell números tienen media mi y que.12 números tienen media m2. Debe probar que la media de todos los números es

X =fi m ¡ +12 m 2 fi +/2 Considere que la suma de los II números sea MI y la suma de 10s.12 números sea M 2 • Entonces, de acuerdo con la definición de la media aritmética, el resultado es: y

o MI = 11 m I y M 2 = .12m2' Siendo que los (f¡ +.12) números se suman (MI + M 2), la media aritmética de todos los números es

X _ MI + M 2 _/lml +12 m2 - I¡+fi - /1+12 como se pidió. El resultado se generaliza fácilmente. e)

Se puede decir que $10.75 es un salario por hora "representativo""en el sentido de que la mayoría de los empleados ganan $10.00, que no se aleja mucho de $10,75 por hora. Es necesario recordar que siempre que se resumen datos numéricos en un solo número (como sucede en un promedio), es posible que se cometa algún error. Sin embargo, el resultado no es tan engañoso como el del problema 3.8. En realidad, para asegurarse, se deben dar ciertos estimados de la "dispersión" o "variación" de los datos respecto de la media (u otro promedio). Esto se conoce como dispersión de los datos. En el capítulo 4 se presentan diversas medidas de dispersión,

3.13

Cuatro grupos de estudiantes, consistentes de 15, 20, 10 Y 18 individuos, reportaron pesos medios de 162, 148, 153 Y 140 libras (lb), respectivamente. Encuentre el peso medio de todos los estudiantes. SOLUCiÓN

x = UX = (15)(162) + (20)(148) + (10)(153) + (18)(140) = 150 lb

U 3.14

15 + 20 + 10 + 18

Si los ingresos medios anuales de trabajadores agrícolas y no agrícolas son de $25 000 Y $35 000, respectivamente. ¿El ingreso medio anual de ambos grupos sería de $30 000?

68

CAPíTULO 3



Media, mediana, moda y otras medidas de tendencia central SOLUCIÓN

Sería de $30 000 sólo si el número de trabajadores agrícolas y no agrícolas fuera el mismo. Para determinar la media verdadera del ingreso anual, se tendría que conocer el número relativo de trabajadores en cada grupo. Suponga que 10% de todos los trabajadores son agrícolas, entonces la media sería (0.10)(25 000) + (0.90)(35 000) = $34 000. Si hubiera el mismo número de ambos tipos de trabajadores, entonces la media sería (0.50)(25 000) + (0.50)(35 000) = $30 000.

3.15

Utilice la distribución de frecuencias de estaturas de la tabla 3-1 para encontrar la estatura media de los 100 estudiantes hombres de la universidad XYZ. SOLUCIÓN

En la tabla 3-1 se indica la forma de resolverlo. Opsérvese que todos los estudiantes con estaturas de 60 a 62 pulgadas (pulg), de 63 a 65 pulgadas, etcétera, se consideran con estaturas de 61 pulgadas, 64 pulgadas, etcétera. Entonces, el problema se reduce a encontrar la estatura media de 100 estudiantes donde 5 miden 61 pulgadas, 18 miden 64, etcétera. Los cálculos necesarios suelen resultar tediosos, especialmente en casos en que los números son grandes y en los que existen muchas clases. Hay técnicas breves que reducen el trabajo en tales situaciones; por ejemplo, véanse los problemas 3.20 y 3.22.

Tabla 3-1 Estatura (pulg)

Marca de clase (X)

Frecuencia (j)

60-62

61

5

305

63-65

64

18

I 152

66-68

67

42

2814

69-71

70

27

1890

72-74

73

8

584

N=¿f= 100

fX

N=¿f=6745

- ¿fX ¿fX 6745 X =- - =- - =- - =67.45 pulg ¿f N lOO

Propiedade~ 3.16

de la media aritmética

Pruebe que la suma de las desviaciones de Xl' X2 , ••• , XN , respecto de su media, es igual a cero. SOLUCIÓN

Seand¡ =X¡-x, d2 =X2 -X, ... , dN=XN-Xlas desviaciones deX¡, X2, ... , XN, a partir de su media X. Entonces Suma de las desviaciones = ¿di = ¿(Xi -X) = ¿Xi - NX

=LXj-N(LNXj ) =LJ0-LXj =O donde se ha usado ¿ en lugar de ¿~=¡. Se hubiera podido omitir el subíndice j en Xi' dado que queda Xi sobreentendido.

3.17

Si Z¡ =X¡

+ Y¡. ~ = X2 + Y2 , ... , ZN= XN+ YN, pruebe que Z=X +f.

SOLUCIÓN

Por definición,

- LX X=-N

- L

y

Y=_·N

- LZ

Z=N

69

Problemas resueltos.

z = E Z = E (X + Y) = E X + E

Luego:

N

N

y

N

= E X +E N

y

=X+Y

N

donde los subíndicesj de X, Yy Z se han omitido y donde I significa I1=l.

3.18

a) Si N números Xl' X2 , ... , XN tienen desviaciones respecto de cualquier número A, dadas por d l = Xl - A, d2 = X2 - A, .. . , dN = X N - A, respectivamente, pruebe que N

¿~

X = A + j=1

N

=A +E

N

d

b) En caso de que Xl' X2 , • •• , XK tengan, en ese orden, las frecuencias J¡, h" ... ,A, y d l = Xl - A, ... , dK = X k - A, demuestre que el resultado del inciso a) es

sustituido por

K

¿Jj=Ef=N

donde

j=1

SOLUCiÓN a)

Primer método

Dado que dj = Xj

-

EXj

X=--= N

-

A YXj = A + dj , por ello,

E(A+d¡) N

donde se utiliza I en lugar de

=

EA+Edj N

=

NA+Edj Edj =A+-N N

I1=l por brevedad.

Segundo método

Se tiene d =X - A o X =A + d, omitiendo los subíndices en d y X. Así, por el problema 3.17,

dado que la media de varias constantes todas iguales a A es A. K

b)

X_

LijXj }=1

-~

_ EijXj _ Eij(A + di) _ -NN -

E Aij + Eijd¡ _ N

-

A

Eij + Eijd¡ N

0ij j=1

=

AN + "6 j,·d· E j,·d· " Id J~=A+ __ J_~=A+_6_ N N N

Obsérvese que formalmente el resultado se obtiene del inciso a) sustituyendo dj por jj dj , y sumando desde j = 1 hasta K, en lugar de hacerlo desde j = 1 hasta N. El resultado es equivalente a X=A + donde =C2jd)/N.

a,

a

Cálculo de la media aritmética para datos agrupados 3.19

Utilice el método del problema 3.18a) para encontrar la media aritmética de los números 5, 8, 11, 9, 12, 6, 14 Y 10, eligiendo como la "media supuesta" A los valores a) 9 y b) 20.

70

CAPíTULO 3



Media, mediana, moda y otras medidas de tendencia central SOLUCiÓN a)

Las desviaciones de los números dados respecto de 9 son -4, -1,2, 0,3, - 3,5 Y 1. La suma de las desviaciones es Id =-4 -1 + 2 + O + 3 - 3 + 5 + 1 =3. Por lo tanto,

-

¿d

3

X = A +-¡:¡-= 9+ b)

8=

9.375

Las desviaciones de los números dados respecto de 20 son -15, -12, -9, -11, -8, -14, -6 Y -lO, lo mismo que Id = -85. Por lo tanto,

x = A + ¿Nd = 20 + (-85) = 9.375 8 3.20

Utilice el método del problema 3.18b) para encontrar la media aritmética de las estaturas de 100 estudiantes hombres de la universidad XYZ (véase el problema 3.15). SOLUCiÓN

El procedimiento puede ordenarse como en la tabla 3-2. Aquí se consideró la marca de clase 67 (con la mayor frecuencia) como la media supuesta A, aunque es posible utilizar cualquier marca de clase para A. Obsérvese que los cálculos son más sencillos que los del problema 3.15. Para abreviar el trabajo aún más, se procederá como en el problema 3.22, donde se usa el hecho de que todas las desviaciones (columna 2 de tabla 3-2) son múltiplos enteros del tamaño del intervalo de clase.

Tabla 3-2 Desviación d=X -A

Marca de clase (X)

64 --->

Id

5 18 42 27 8

-30 -54 O 81 48

-6 -3 O

61 A

Frecuencia if)

67 70 73

3 6

N=¿1=100

-

X

3.21

=A

+

¿Id

---¡¡- = 67 +

¿

Id =45

45

100 = 67.45 pulg

Sea que dj = Xj - A represente las desviaciones de cualquier marca de clase Xi' en una distribución de frecuencias respecto de una marca de clase dada A. Pruebe que si todos los intervalos de clase son del mismo tamaño c, entonces a) todas las desviaciones son múltiplos de (es decir, j 0, ±1, ±2, ... ) Y b) la j ' donde j media aritmética puede calcularse a partir de la fórmula

c

d =cU

u=

X=A+ (LjU)c SOLUCiÓN

a)

El resultado se ilustra en la tabla 3-2 del problema 3.20, donde se observa que todas las desviaciones en la columna 2 son múltiplos del tamaño del intervalo de clase c = 3 pulg. Para ver que el resultado es verdadero casi siempre, nótese que si XI, X2 , Xl, ... son marcas de clase sucesivas, su diferencia común será, para este caso, igual a c, de manera que X2 = XI + c, X3 = XI + 2c y, en general, Xj = XI + (j - l)c. Entonces, cualquier par de marcas de clase, por ejemplo, Xp y Xq, diferirán en .Xp-Xq = [XI + (p-l)c] - [XI + (q-l)c] = (p - q)c,

que es un múltiplo de c.

71

Problemas resueltos. b)

Por el inciso a), las desviaciones de todas las marcas de clase, a partir de cualquiera de ellas, son múltiplos de c (es decir, d¡ =cu¡). Entonces, utilizando el problema 3.18b):

Nótese que esto es equivalente al resultado X = A + cit, que es posible obtener a partir de X=A + d, colocando d = cu y observando que d = cit (véase el problema 3.18).

3.22

Utilice el resultado del problema 3.21b) para encontrar la estatura media de 100 estudiantes hombres de la universidad XYZ (véase el problema 3.20). SOLUCiÓN El procedimiento puede ordenarse como en la tabla 3-3. El método se denomina método de compilación y debe utilizarse siempre que sea posible.

Tabla 3-3

x

u

f

fu

61

-2 -1 O 1 2

5 18 42 27 8

-10 -18

N= 100

'Lfu= 15

64

A -1->

67 70 73

O 27 16

x = A + ('Lfu)c = 67 + C~0)(3) = 67.45 in 3.23

Calcule el salario semanal medio de los 65 empleados de la empresa P&R, a partir de la distribución de frecuencias de la tabla 2-5, usando a) el método largo y b) el método de codificación. SOLUCiÓN Las tablas 3-4 y 3-5 contienen las soluciones para a) y b), respectivamente.

Tabla 3-4

Tabla 3-5

x

f

fX

x

u

f

fu

$255.00

8 10 16 14

$2040.00 2650.00 4400.00 3990.00 2950.00 1525.00 630.00

$255.00

-2 -1

8 10 16 14

-16 -10

265.00 275.00 285.00 295.00 305.00 315.00

10 5 2

N=65

'L fX

= $18 185.00

265.00 A -f-----> 275.00 285.00 295.00 305.00 315.00

O 1 2 3 4

10 5 2

N=65

O 14 20 15 8

'Lfu= 31

72

CAPíTULO 3



Media, mediana, moda y otras medidas de tendencia central Puede suponerse que se han introducido errores en estas tablas, dado que las marcas de clase en realidad son $254.995, $264.995, etcétera, en lugar de $255.00, $265.00 ... Si se utilizan las marcas de clase verdaderas en la tabla 3-4, entonces la marca de clase resulta ser $279.76 en vez de $279.77, cuya diferencia es insignificante.

_ ¿IX

X =- - = N '

3.24

$18185.00

$279.77

65

x = A+ (EfU) e = $275.00 + !~ ($10.00) = $279.77

Utilizando la tabla 2-9d), encuentre el salario medio de los 70 empleados de la empresa P&R. SOLUCiÓN

En este caso, los intervalos de clase no son del mismo tamaño, por lo que habrá que utilizar el método largo, como se indica en la tabla 3-6.

Tabla 3-6

x

f

IX

$255.00 265.00 275.00 285.00 295.00 310.00 350.00

8 10 16 15 10 8 3

$2040.00 2650.00 4400.00 4275.00 2950.00 2480.00 1050.00

N=70

EIX

-

$19845.00

x= ¿IX =$19 845.00 =$283.50 N

70

La mediana 3.25

El siguiente resultado de Minitab muestra el tiempo que 30 usuarios de Internet pasaron realizando búsquedas en línea, así como la mediana de los 30 tiempos. Verifique la mediana. ¿Considera que este promedio es representativo de los 30 tiempos? Compare sus resultados con los del problema 3.8. MTB

> print

el

Data Display time 3 4 6 6 9 10 MTB

4 6 10

5 7 10

5 7 10

5 7 10

5 7 10

5 7 12

5

6

8

8

55

60

> median el

Column Median Median of time = 7 . 0000 SOLUCiÓN

Obsérvese que los dos valores intermedios son 7 y que la media de los dos valores intermedios es 7. En el problema 3.8la media fue de lOA horas. La mediana es más representativa de los tiempos que la media.

Problemas resueltos. 3.26

73

Se registró el número de transacciones de ATM por día en 15 lugares de una gran ciudad. Los datos fueron: 35,49,225,50,30,65,40,55,52, 76,48,325,47,32 Y 60. Encuentre a) la mediana de las transacciones y b) la media de las transacciones. SOLUCiÓN

3.27

a)

Los datos ordenados son: 30,32,35,40,47,48,49,50,52,55,60,65,76,225 Y325. Debido a que el número de datos es impar, sólo existe un valor intermedio, 50, que es la mediana.

b)

La suma de los 15 valores es 1 189. La media es 1 189/15 = 79.267. Obsérvese que la mediana no se ve afectada por los dos valores extremos 225 y 325, mientras que la media sí. En este caso, la mediana es un mejor indicador del promedio del número de transacciones diarias de ATM.

Si a) 85 y b) 150 números se ordenan, ¿cómo calcularía la mediana de dichos números? SOLUCiÓN

3.28

a)

Dado que son 85 datos, que es un número impar, sólo existe un valor intermedio con 42 números por debajo y 42 por encima. Por lo tanto, la mediana es el número 43.

b)

Puesto que son 150 datos, un número par, hay dos valores intermedios con 74 números por debajo y 75 por encima de ellos. Los dos valores intermedios son los números 750. y 760., Y su media aritmética es la mediana.

A partir del problema 2.8, encuentre la mediana de los pesos de los 40 estudiantes de la universidad estatal; utilizando a) la distribución de frecuencias de la tabla 2-7 (reproducida aquí como tabla 3-7), y b) los datos originales. SOLUCiÓN a)

Primer método (por interpolación)

Se supone que los pesos en la distribución de frecuencias de la tabla 3-7 se distribuyen de manera continua. En tal caso, la mediana es aquel peso que deja por encima a la mitad de la frecuencia total (40/2 = 20) Y por debajo a la otra mitad.

Tabla 3-7 Peso (lb) 118-126 127-135 136-144 145-153 154-162 163-171 172-180

Frecuencia 3 5 9 12 5 4 2

)

:'

Tota140 La suma de las primeras tres frecuencias de clase es 3 + 5 + 9 = 17. Por lo tanto, para llegar al valor deseado, 20, se requieren tres más de los 12 casos de la cuarta clase. Dado que el cuarto intervalo de clase, 145-153, en realidad corresponde a los pesos de 144.5 a 153.5, la mediana debe estar a 3/12 de distancia entre 144.5 y 153.5; es decir, la mediana es 3 3 144.5 + 12 (153.5 - 144.5) = 144.5 + 12 (9) = 146.8 lb

74

CAPíTULO 3 •

Media, mediana, moda y otras medidas de tendencia central Segundo método (utilizando la fórmula) Debido a que la suma de las primeras tres y las primeras cuatro frecuencias de clase son 3 + 5 + 9 = 17 Y3 + 5 + 9 + 12 = 29, respectivamente, queda claro que la mediana se encuentra en la cuarta clase, la cual es, por lo tanto, la clase de la mediana. Entonces:

L¡ = frontera inferior de la clase de la mediana = 144.5 N = número de datos =40

C¿f)¡ = suma de todas las clases inferiores a la clase de la mediana = 3 + 5 + 9 = 17 ¡mediana

= frecuencia de la clase de la mediana = 12

e = tamaño del intervalo de clase de la mediana = 9 por 10 tanto,

Mediana = L¡

+

(N/2¡ eL

medIana

b)

f)¡)c = 144.5 + (40/2 - 17) v-;;b. Si esto es cierto. entonces, elevando al cuadrado ambos lados, Ha 2 + b 2) > ab, de tal modo que a 2 + b2 > 2ab, a 2 - 2ab + b2 > 00 (a - bj2 > O' Esta última desigualdad es verdadera, da'do que el cuadrado de cualquier número real distinto de cero debe ser positivo. La prueba consiste en invertir el procedimiento anterior. Así. comenzando con (a b)2 > O que se sabe es cierto, se puede demostr~ que a 2 + b2 > 2ab, ha 2 + b 2) > ab y, finalmente, Vha 2 + b 2) > v-;;b, como se pidió. Obsérvese que V~(a2 + b2 )

= Vab, si y sólo si a = b:

Cuartiles, deciles y percentiles 3.44

Encuentre a) los cuartiles Q¡, Q2Y Q3' Y b) los deciles D¡, D 2 , ••• , D9 para los salarios de los 65 empleados de la empresa P&R (véase el problema 2.3). SOLUCiÓN

,!

a)

El primer cuartil Q¡ es el salario obtenido contando N/4 = 65/4 =Í6.25 de los casos, empezando con la primera clase (la inferior). Ya que la primera clase incluye 8 casos, debe tomar 8.25 (16.25 - 8) de los !O casos de la segunda clase. Por el método de interpolación lineal se tiene Q1 = $259.995 + 8~~5 ($10.00) = $268.25

El segundo cuartil Q2 se obtiene contando los primeros 2N/4 = N/2 = 65/2 = 32.5 casos. Dado que las dos primeras clases incluyen 18 casos, habrá que tomar 32.5 - 18 = 14.5 de los 16 casos de la tercera clase; por lo tanto, Q2

1~5 $ = $269.995 + ~ ($10.00) = 279.06

Véase que Q2 es, en realidad, la mediana.

81

Problemas resueltos.

El tercer cuartil Q3 se obtiene contando los primeros 3N/4 = i(65) = 48.75 de los casos. Puesto que las cuatro primeras clases comprenden 48 casos, se tiene que tomar 48.75 - 48 = 0.75 de los 10 casos de la quinta clase; entonces Q3

0.75 ( = $289.995 + 10 $10.00) = $290.75

Por lo tanto, 25% de los empleados reciben $268.25 o menos, 50% gana $279.06 o menos y 75% perciben $290.75 o menos. b)

El primero, segundo, ... , noveno deciles se obtienen contando NilO, 2NIl O, ... , 9NIl0 de los casos, comenzando con la primera clase (inferior). ASÍ: DI

= $249.995 + 6.5 ($10.00) =$258.12 . 8

5 D2 = $259.995 + 10 ($10.00) D3

=$265.00

= $269.995 + ~.~ ($10.00) =$270.94

8 D4 = $269.995 + 16 ($10.00) Ds = $269.995 +

=$275.00

D6 = $279.995 + ~($1O.00)

14

=$283.57

D7 = $279.995 + 1;¡($1O.00) Ds = $289.995 +

=$288.21

1~ ($10.00) =$294.00

D9 = $299.995 + 9f :¡:: ca

...

Qj

40

ca

·u t:

CI)

20

::J U

... CI)

u.

250 260

310 320

Salarios (dólares)

Problemas complementarios Notación de sumatoria 3.47

Escriba los términos de cada una de las siguientes sumas: 4

a)

e)

j=1

¿Uj (Uj +6)

¿4Xj Yj j=1

N

¿JjXJ

d)

j=1

3.48

e)

j=1

5

b)

4

3

¿(Xj +2)

¿(Yf -4) k=1

Exprese en notación de sumatoria: a)

(X¡ + 3)3 + (X2 + 3)3 + (X3 + 3)3

b) J¡(Y¡ - a)2 + h