UNIDAD 8
Estadística Descriptiva Covarianza y Correlación
Estadística Descriptiva • Medidas de Tendencia Central, Dispersión y Asimetría. Describen 1 variable
• Medidas de Asociación Lineal Describen la relación entre 2 variables
Covarianza y Correlación Ejercicio 3- En diferentes puntos del país la tasa de incendios por año ha aumentado. Para comenzar a indagar sobre sus causas un grupo de gestión ambiental relevó la cantidad de incendios producidos, el número de sitios de acampe en la zona y la precipitación media anual en 30 puntos distintos del país
Indique Unidad experimental, población y muestra ¿Que variables se estan observando? ¿De que tipo son? ¿De que tipo de experimento se trata?
Covarianza y Correlación Ejercicio 3- En diferentes puntos del país la tasa de incendios por año ha aumentado. Para comenzar a indagar sobre sus causas un grupo de gestión ambiental relevó la cantidad de incendios producidos, el número de sitios de acampe en la zona y la precipitación media anual en 30 puntos distintos del país
A cada UE le registramos tres variables variables x: n° de incendios/año
UE: Cada punto del país
y: n° de sitios de acampe z: Precipitación media anual
Experimento mensurativo
Covarianza y Correlación Ejercicio 3- En diferentes puntos del país la tasa de incendios por año ha aumentado. Para comenzar a indagar sobre sus causas un grupo de gestión ambiental relevó la cantidad de incendios producidos, el número de sitios de acampe en la zona y la precipitación media anual en 30 puntos distintos del país
No nos interesa la tendencia central, la dispersión o la asimetría de la cantidad de incendios que se produjeron Sino que... Nos interesa saber si la cantidad de incendios está relacionada con los sitios de acampe ó con las precipitaciones en el área de estudio
Covarianza y Correlación Nos interesa conocer la “relación” entre dos variables. Incendios /año 32 32 39 27 27 8 10 13 13 14 26 29 21 21 3 5 23 25 9 10 30 22 28 29 21 16 31 5 26 22
Sitios de Precipitación acampe media anual 18 876 17 234 19 231 15 349 15 345 1 760 5 659 6 573 5 465 6 340 15 321 13 239 10 669 10 673 0 1030 1 850 14 543 14 889 3 530 5 450 14 334 13 221 14 765 12 543 11 453 7 567 14 543 2 560 13 129 9 320
Covarianza y Correlación ¿Como se relacionan la cantidad de incentidos con la cantidad de sitios de acampe? Incendios / año 32 32 39 27 27 8 10 13 13 14 26 29 21 21 3 5 23 25 9 10 30 22 28 29 21 16 31 5 26 22
Sitios de acampe 18 17 19 15 15 1 5 6 5 6 15 13 10 10 0 1 14 14 3 5 14 13 14 12 11 7 14 2 13 9
Incendios/ año
Sitios de Acampe
Covarianza y Correlación ¿Como se relacionan la cantidad de incentidos con la cantidad de sitios de acampe? Incendios /año 32 32 39 27 27 8 10 13 13 14 26 29 21 21 3 5 23 25 9 10 30 22 28 29 21 16 31 5 26 22
Sitios de acampe 18 17 19 15 15 1 5 6 5 6 15 13 10 10 0 1 14 14 3 5 14 13 14 12 11 7 14 2 13 9
Incendios/ año
32
x
18
Sitios de Acampe
Covarianza y Correlación ¿Como se relacionan la cantidad de incentidos con la cantidad de sitios de acampe? Incendios /año 32 32 39 27 27 8 10 13 13 14 26 29 21 21 3 5 23 25 9 10 30 22 28 29 21 16 31 5 26 22
Sitios de acampe 18 17 19 15 15 1 5 6 5 6 15 13 10 10 0 1 14 14 3 5 14 13 14 12 11 7 14 2 13 9
Diagrama de Dispersión
Covarianza y Correlación ¿Como se relacionan la cantidad de incentidos con la cantidad de sitios de acampe? Se puede ver una asociación lineal positiva.
A más sitios de acampe más incendios ¿Podemos dar alguna medida al nivel de asociación lineal entre las variables?
Diagrama de Dispersión
Covarianza y Correlación ¿Como se relacionan la cantidad de incentidos con la cantidad de sitios de acampe? Se puede ver una asociación lineal positiva.
A más sitios de acampe más incendios ¿Podemos dar alguna medida al nivel de asociación lineal entre las variables?
covarianza y correlación
Diagrama de Dispersión
Covarianza y Correlación Desvío de X respecto a su media
Desvío de Y respecto a su media
Mide como varían conjuntamente ambas variables
Covarianza Media de Incendios =20,57
Media de acampe =10
Covarianza (+) x (+) = (+)
(+)
(+)
Covarianza (-) x (-) = (+)
(-)
(-)
Covarianza =49,18
Siempre que los puntos se concentren en el 1er y 3er cuadrante la covarianza será positiva
I
III
Se puede ver una asociación lineal positiva. A más sitios de acampe más incendios
Covarianza y Correlación ¿Como se relacionan la cantidad de incentidos con las precipitaciones anuales medias? Incendios / año 32 32 39 27 27 8 10 13 13 14 26 29 21 21 3 5 23 25 9 10 30 22 28 29 21 16 31 5 26 22
Precipitación media anual 876 234 231 349 345 760 659 573 465 340 321 239 669 673 1030 850 543 889 530 450 334 221 765 543 453 567 543 560 129 320
Diagrama de Dispersión
Covarianza Media de Incendios =20,57
Media de precipitaciones =515,13
Covarianza (-) x (+) = (-) (-)
(+)
(-)
(+)
Covarianza = - 944,87 =49,18
Siempre que la mayoría de los puntos se concentren en el 2do y 4to cuadrante la covarianza será negativa
II
IV
Covarianza = - 944,87 =49,18
II
(-) En éste caso, en realidad los los valores negativos de los cuadrantes 2do y 4to se van a ver parcialmente compensados por los del 1er cuadrante pero no lo suficiente como para que la relación no sea negativa
Siempre que la mayoría de los puntos se concentren en el 2do y 4to cuadrante la covarianza será negativa
I
(+) IV
(-)
Covarianza y Correlación
Covarianza = 49,18 Incendios – Areas de Acampe Covarianza Positiva (+) Acampe (+) Incendios
= - 944,87
Incendios – Precipitaciones Covarianza Negativa (+) Precipitaciones (-) Incendios
Pero... ¿Por que el valor absoluto de la covarianza de las precipitaciones es tanto mayor al de las areas de acampe si la relación lineal era mucho menos clara en el segundo caso?
Covarianza =49,18
= - 944,87
Incendios – Areas de Acampe Covarianza Positiva
Incendios – Precipitaciones Covarianza Negativa
La covarianza al igual que la varianza tiene dos problemas: 1. No se puede utilizar para comparar los niveles de asociación lineal entre distintas variables. Es una medida absluta. 2. Al no tener sentido sus unidades su valor no es interpretable en términos del problema. Sólo nos permite identificar relaciones positivas, negativas y nulas.
Covarianza y Correlación
El coeficiente de correlación de Pearson (ρ) es una medida de covarianza estandarizada por el desvío de cada variable Nos permite comparar el nivel de asociación entre distintas variables. Varía entre 1 y -1
Covarianza y Correlación
El coeficiente de correlación de Pearson (ρ) es una medida de covarianza estandarizada por el desvío de cada variable Nos permite comparar el nivel de asociación entre distintas variables. Varía entre 1 y -1
Correlación =49,18
= - 944,87 D.E (incendios)= 9,57
D.E (acampe)= 5,49
Incendios – Areas de Acampe Covarianza Positiva
Incendios – Precipitaciones Covarianza Negativa
D.E (precipitaciones)= 229,59
Correlación =49,18
= - 944,87 D.E (incendios)= 9,57
Incendios – Areas de Acampe Covarianza Positiva
Incendios – Precipitaciones Covarianza Negativa
D.E (acampe)= 5,49
49,18 =0,94 = (9,57 x 5,49)
(−944,87) =−0,43 = (9,57 x 229,59)
D.E (precipitaciones)= 229,59 Incendios – Areas de Acampe Coef de Correlación Pearson
Incendios – Precipitaciones Covarianza Negativa
Correlación 49,18 =0,94 = (9,57 x 5,49)
(−944,87) =−0,43 = (9,57 x 229,59)
Incendios – Areas de Acampe Coef de Correlación Pearson
Incendios – Precipitaciones Covarianza Negativa
Se puede ver que los número de acampes guarda una correlación positiva con el numero de incendios mientras que la precipitaciones promedio guardan una correlación negativa A su vez se puede ver que el nivel de correlación entre el número de acampes y la cantidad de incendios es más fuerte que la correlación existente entre las precipitaciones y los incendios.
NO OLVIDAR Correlación ≠ Asociación causal