MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN Lic. Esperanza García Cribilleros
ANÁLISIS EXPLORATORIO DE DATOS ¾Diagrama de tallo y hojas ¾Diagrama de caja
DESCRIPCIÓN DE LOS DATOS ¾ Tablas ¾ Gráficos ¾ Medidas de
resumen
Diagrama de Tallos y hojas Los datos tienen un decimal tallo
8 datos menores e iguales que 10.9
11 datos entre 13 y 13.4 y uno de ellos es la mediana 8 datos mayores e iguales que 14.5
Stem-and-Leaf Display: Perdida de peso Stem-and-leaf of Pérdida de peso N = 65 Leaf Unit = 0.10 hojas Terminación de dígitos del 0 al 4 1 90 Terminación de dígitos del 5 al 9 2 95 5 10 000 8 10 569 13 11 00003 15 11 78 26 12 00000000123 29 12 566 (11) 13 00000000224 25 13 555667 19 14 00000222333 8 14 556 5 15 00033
BOXPLOT (Diagrama de Cajas) ¾
Es un gráfico que nos sirve para ver cómo están distribuidas las observaciones (distribución sesgada a la derecha o izquierda), comparación de la dispersión de dos o mas conjuntos de datos y si existen valores extremos que afectan a la distribución.
X mínimo Q1 Mediana Q3 Xmáximo
¾ ¾ ¾ ¾
Xmínino : Es la observación de menor valor Xmáximo : Es la observación de mayor valor Q1 : Primer Cuartil Q3 : Tercer Cuartil
¾ ¾
Si aparece * en la grafica significa que es un valor extremo
EJEMPLO: Se tienen las edades de 35 pacientes: 35
32
21
43
39
28
28
36
12
54
45
37
53
26
45
23
64
21
34
22
29
36
45
55
20
38
46
27
22
38
35
56
45
33
28
Explorar los datos especialmente para ver la simetría.
DIAGRAMA DE CAJAS EDAD DE 35 MADRES 70 60
Valor máximo
Valor Máximo
Edad
50 40 30
Q3 Me Q1
20 10
Valor mínimo
Diagrama de tallos y hojas Stem-and-leaf of Edad N = 35 Leaf Unit = 1.0 12 madres tienen 29 años o menos
11 madres tiene 43 años o más
1 12 (12) 11 5 1
1 2 3 4 5 6
Tallo
2 01122367889 234556678889 355556 3456 4
Hojas
MEDIDAS DE RESUMEN PARA VARIABLES CUANTITATIVAS MEDIDAS DE TENDENCIA CENTRAL O DE POSICIÓN: MEDIA ARITMÉTICA, MEDIANA, MODA OTRAS MEDIDAS : PERCENTILES Y CUARTILES MEDIDAS DE DISPERSIÓN: RANGO VARIANZA DESVIACION ESTANDAR COEFICIENTE DE VARIACION INTERVALO CUARTILAR
MEDIDAS DE TENDENCIA CENTRAL O POSICIÓN Son valores que indican el centro de la distribución de los datos. Es el valor representativo de estos. Las más usadas son: la media aritmética o promedio, la mediana, moda, cuartiles y percentiles .
MEDIDA DE ASIMETRÍA Distribución simétrica: Cuando su curva de frecuencia es simétrica con respecto al centro de los datos, en este caso μ=Me=Mo. Distribucion simetrica 9 8 7