Estadística multivariada Ventajas: • Reflejar con más seguridad la verdadera
naturaleza multivariada, multidimensional de los sistemas naturales. • Proveer una forma de manejar conjuntos de datos con gran cantidad de variables. • Proveer formas de resumir la redundancia en conjuntos grandes de datos. • Proveer reglas para combinar variables de una manera óptima. Fuente:Applied Multivariate Statistics for Ecology and Conservation Course website: http://www.umass.edu/landeco/teaching/multivariate/multivariate.ht ml Dr. Hui-Yu Wang and Brad Timm
Ventajas de estadística multivariada
• Suministrar soluciones a problemas de
comparaciones múltiples controlando la tasa de error experimental. • Encontrar formas de detectar y cuantificar verdaderos patrones multivariados que surgen de la estructura correlacional del conjunto de variables. • Proveer formas de explorar conjuntos de datos complejos por patrones y relaciones de las cuales las hipótesis pueden ser generadas y subsecuentemente testeadas experimentalmente.
¿Qué es estadística multivariada? Modelo
técnicas
Y = x1 + x2 + ........+ x j
Regresión, análisis de Varianza, tablas de contingencia
y1 + y2 +......yi = x
ANOVA multivariado, análisis discriminante, CART, MRPP, MANTEL
y1 + y2 + ......yi = x1 + x2 + ........+ xj
Análisis corr canónica, anal correspondencia canónica, de redundancia
y 1 + y 2 + ...... y i
Análisis de ordinación, análisis de cluster Estadística multivariada
1. Ejemplo: gradiente ambiental Matriz de datos
Ordenación
Datos en espacio dimensional
Ejemplo 2: estructura de la comunidad Matriz de datos
ordenación
Especies en espacio dimensional
Ejemplo 2: estructura de la comunidad Matriz de datos
Análisis de cluster
Especies en espacio dimensional
Ejemplo 2: estructura de la comunidad Matriz de datos
Ordenación
Espacio muestral dimensional
Ejemplo 2: estructura de la comunidad Matriz de datos
Ordenación
Espacio en 3 dimensiones ordenado
Ejemplo 3- Separación de nichos Matriz de datos
Espacio de los datos en una dimensión
Ejemplo 3- Separación de nichos Matriz de datos
Espacio de datos en dos dimensiones
Ejemplo 3- Separación de nichos Matriz de datos
(Mac Garigal et al., 2000)
Ejemplo 3- Separación de nichos Matriz de datos
Espacio de datos en 3 dimensiones
Ejemplo 3- Separación de nichos Matriz de datos
(Mac Garigal et al., 2000)
Ejemplo 4 – Uso del hábitat Matriz de datos
Espacio de datos en 3 dimensiones
Ejemplo 5- Ordenación constrastante Matriz de datos
Espacio ambiental 3D
Puntos claves • La estadística multivariada involucra casos de variables “dependientes”
o un cjto de variables que se consideran dependientes sobre factores desconocidos pero subyacentes. • Todos los problemas multivariados pueden ser representados por una
matriz de datos de doble entrada en la cual las filas representan las entidades de muestreo y las columnas representan las variables; la estructura interna de la matriz con respecto a grupos de entidades de muestreo o relaciones de dependencia entre variables distingue entre las diversas técnicas multivariadas. • Todos los problemas multivariados pueden ser geométricamente
conceptualizados como una nube de datos en un espacio P dimensional, donde las dimensiones (o ejes) son definidos por las p variables de interés, las técnicas multivariadas describen la forma, agrupamiento y dispersión de esta nube.
Descripción multivariada versus inferencia Desde el punto de vista descriptivo: • Provee reglas para combinar las variables en un camino óptimo.
Este camino óptimo puede variar de una técnica a otra.
Desde el punto de vista inferencial • Provee explicito control sobre la tasa de error experimental. Muchas
situaciones en las cuales las técnicas multivariadas son aplicadas podrían ser analizados a través de series de tests de significancia univariadas. Y así referirnos a la población a través de las muestras.
Técnicas multivariadas Técnicas
Objetivos
Ordenación no contratante (ACP, PO, AC, DCA, NMDS)
Extraer gradientes de variación máxima
Análisis de Cluster o agrupamiento (familia de técnicas)
Establecer grupos de entidades similares, clasifica
Discriminación (MRPP, MANTEL, DA, CART, ...)
Test para diferenciar entre grupos de entidades o predecir miembro grupo
Ordenación contrastante (RDA, ACC, CAPS, CanCorr)
Extraer gradientes de variación en variables dependientes explicable por variables independientes.
Técnicas multivariadas Técnicas
Tipo de dependencia
Ordenación no contratante (PCA, PO, CA, DCA, NMDS)
Interdependencia
Análisis de Cluster o agrupamiento (familia de técnicas)
Interdependencia
Discriminación (MRPP, MANTEL, DA, CART, ...)
Dependencia
Ordenación contrastante (RDA, CCA, CAPS, CanCorr)
Dependencia
Técnicas multivariadas técnicas Ordenación no contratante (PCA, PO, CA, DCA, NMDS)
Estructura de datos Un conjunto >>2 variables
Análisis de Cluster o agrupamiento Un conjunto >>2 variables (familia de técnicas) Discriminación (MRPP, MANTEL, DA, CART, ...)
Dos cjtos; 1 variable agrupadora >>2 variables discriminantes
Ordenación contrastante (RDA, CCA, CAPS, CanCorr)
Dos cjtos >>2 variables dependientes, >>2 variables independientes
Técnicas multivariadas
Técnicas
Características muestreales
Ordenación no contratante (ACP, PO, AC, DCA, NMDS)
N (de cantidades de poblaciones de conocidas o desconocidas)
Análisis de Cluster o agrupamiento (familia de técnicas)
N (de cantidades de poblaciones conocidas o desconocidas)
Discriminación (MRPP, MANTEL, AD, CART, ...)
N (de cantidades de poblaciones conocidas) o N1, N2, .. (de poblaciones separadas)
Ordenación contrastante (RDA, ACC, CAPS, CanCorr)
N (de una poblaciòn)
Bibliografía Sugerida Kent, M. and P. Coker. 1992. Vegetation description and analysis: a practical approach. CRC Press. Mc Garical, K. , Cushman S. & Stafford S. 2000. Multivariate Statistics for Wildlife and Ecology Research. Springer. 283 pp. Manly, B.F.J. 1995. Multivariate statistical methods: A primer. Chapman & Hall. Matteuci S. y Colma A. 1982. Metodología para el estudio de la vegetación. Serie monográfica N° 22. Secretaría Gral de la Organización de los Estados Americanos. Programa Regional de Des. Cient. Y Tecnol. Pla, Casanoves, Di Rienzo, Trelew, 2009. Biodiversidad específica y funcional. Estimación e inferencia. Valdano S.2008. Introducción al Algebra matricial. Río Cuarto. Córdoba. Wang Hui Yu & Timm B. 2009. Course website:
http://www.umass.edu/landeco/teaching/multivariate/multivariate.html Winzer N. Nociones de Análisis Multivariado. 69 pp.