Ventajas de estadística multivariada

sistemas naturales. • Proveer una forma de manejar conjuntos de ... Proveer formas de explorar conjuntos de .... Introducción al Algebra matricial. Río Cuarto.
748KB Größe 23 Downloads 152 vistas
Estadística multivariada Ventajas: • Reflejar con más seguridad la verdadera

naturaleza multivariada, multidimensional de los sistemas naturales. • Proveer una forma de manejar conjuntos de datos con gran cantidad de variables. • Proveer formas de resumir la redundancia en conjuntos grandes de datos. • Proveer reglas para combinar variables de una manera óptima. Fuente:Applied Multivariate Statistics for Ecology and Conservation Course website: http://www.umass.edu/landeco/teaching/multivariate/multivariate.ht ml Dr. Hui-Yu Wang and Brad Timm

Ventajas de estadística multivariada

• Suministrar soluciones a problemas de

comparaciones múltiples controlando la tasa de error experimental. • Encontrar formas de detectar y cuantificar verdaderos patrones multivariados que surgen de la estructura correlacional del conjunto de variables. • Proveer formas de explorar conjuntos de datos complejos por patrones y relaciones de las cuales las hipótesis pueden ser generadas y subsecuentemente testeadas experimentalmente.

¿Qué es estadística multivariada? Modelo

técnicas

Y = x1 + x2 + ........+ x j

Regresión, análisis de Varianza, tablas de contingencia

y1 + y2 +......yi = x

ANOVA multivariado, análisis discriminante, CART, MRPP, MANTEL

y1 + y2 + ......yi = x1 + x2 + ........+ xj

Análisis corr canónica, anal correspondencia canónica, de redundancia

y 1 + y 2 + ...... y i

Análisis de ordinación, análisis de cluster Estadística multivariada

1. Ejemplo: gradiente ambiental Matriz de datos

Ordenación

Datos en espacio dimensional

Ejemplo 2: estructura de la comunidad Matriz de datos

ordenación

Especies en espacio dimensional

Ejemplo 2: estructura de la comunidad Matriz de datos

Análisis de cluster

Especies en espacio dimensional

Ejemplo 2: estructura de la comunidad Matriz de datos

Ordenación

Espacio muestral dimensional

Ejemplo 2: estructura de la comunidad Matriz de datos

Ordenación

Espacio en 3 dimensiones ordenado

Ejemplo 3- Separación de nichos Matriz de datos

Espacio de los datos en una dimensión

Ejemplo 3- Separación de nichos Matriz de datos

Espacio de datos en dos dimensiones

Ejemplo 3- Separación de nichos Matriz de datos

(Mac Garigal et al., 2000)

Ejemplo 3- Separación de nichos Matriz de datos

Espacio de datos en 3 dimensiones

Ejemplo 3- Separación de nichos Matriz de datos

(Mac Garigal et al., 2000)

Ejemplo 4 – Uso del hábitat Matriz de datos

Espacio de datos en 3 dimensiones

Ejemplo 5- Ordenación constrastante Matriz de datos

Espacio ambiental 3D

Puntos claves • La estadística multivariada involucra casos de variables “dependientes”

o un cjto de variables que se consideran dependientes sobre factores desconocidos pero subyacentes. • Todos los problemas multivariados pueden ser representados por una

matriz de datos de doble entrada en la cual las filas representan las entidades de muestreo y las columnas representan las variables; la estructura interna de la matriz con respecto a grupos de entidades de muestreo o relaciones de dependencia entre variables distingue entre las diversas técnicas multivariadas. • Todos los problemas multivariados pueden ser geométricamente

conceptualizados como una nube de datos en un espacio P dimensional, donde las dimensiones (o ejes) son definidos por las p variables de interés, las técnicas multivariadas describen la forma, agrupamiento y dispersión de esta nube.

Descripción multivariada versus inferencia Desde el punto de vista descriptivo: • Provee reglas para combinar las variables en un camino óptimo.

Este camino óptimo puede variar de una técnica a otra.

Desde el punto de vista inferencial • Provee explicito control sobre la tasa de error experimental. Muchas

situaciones en las cuales las técnicas multivariadas son aplicadas podrían ser analizados a través de series de tests de significancia univariadas. Y así referirnos a la población a través de las muestras.

Técnicas multivariadas Técnicas

Objetivos

Ordenación no contratante (ACP, PO, AC, DCA, NMDS)

Extraer gradientes de variación máxima

Análisis de Cluster o agrupamiento (familia de técnicas)

Establecer grupos de entidades similares, clasifica

Discriminación (MRPP, MANTEL, DA, CART, ...)

Test para diferenciar entre grupos de entidades o predecir miembro grupo

Ordenación contrastante (RDA, ACC, CAPS, CanCorr)

Extraer gradientes de variación en variables dependientes explicable por variables independientes.

Técnicas multivariadas Técnicas

Tipo de dependencia

Ordenación no contratante (PCA, PO, CA, DCA, NMDS)

Interdependencia

Análisis de Cluster o agrupamiento (familia de técnicas)

Interdependencia

Discriminación (MRPP, MANTEL, DA, CART, ...)

Dependencia

Ordenación contrastante (RDA, CCA, CAPS, CanCorr)

Dependencia

Técnicas multivariadas técnicas Ordenación no contratante (PCA, PO, CA, DCA, NMDS)

Estructura de datos Un conjunto >>2 variables

Análisis de Cluster o agrupamiento Un conjunto >>2 variables (familia de técnicas) Discriminación (MRPP, MANTEL, DA, CART, ...)

Dos cjtos; 1 variable agrupadora >>2 variables discriminantes

Ordenación contrastante (RDA, CCA, CAPS, CanCorr)

Dos cjtos >>2 variables dependientes, >>2 variables independientes

Técnicas multivariadas

Técnicas

Características muestreales

Ordenación no contratante (ACP, PO, AC, DCA, NMDS)

N (de cantidades de poblaciones de conocidas o desconocidas)

Análisis de Cluster o agrupamiento (familia de técnicas)

N (de cantidades de poblaciones conocidas o desconocidas)

Discriminación (MRPP, MANTEL, AD, CART, ...)

N (de cantidades de poblaciones conocidas) o N1, N2, .. (de poblaciones separadas)

Ordenación contrastante (RDA, ACC, CAPS, CanCorr)

N (de una poblaciòn)

Bibliografía Sugerida Kent, M. and P. Coker. 1992. Vegetation description and analysis: a practical approach. CRC Press. Mc Garical, K. , Cushman S. & Stafford S. 2000. Multivariate Statistics for Wildlife and Ecology Research. Springer. 283 pp. Manly, B.F.J. 1995. Multivariate statistical methods: A primer. Chapman & Hall. Matteuci S. y Colma A. 1982. Metodología para el estudio de la vegetación. Serie monográfica N° 22. Secretaría Gral de la Organización de los Estados Americanos. Programa Regional de Des. Cient. Y Tecnol. Pla, Casanoves, Di Rienzo, Trelew, 2009. Biodiversidad específica y funcional. Estimación e inferencia. Valdano S.2008. Introducción al Algebra matricial. Río Cuarto. Córdoba. Wang Hui Yu & Timm B. 2009. Course website:

http://www.umass.edu/landeco/teaching/multivariate/multivariate.html Winzer N. Nociones de Análisis Multivariado. 69 pp.