COMPARACIÓN DE COMUNIDADES ASOCIACIÓN DE ESPECIES. FUNCIONES DE SEMEJANZA. DENDROGRAMAS. Objetivos: Inferir la complejidad en comparaciones de comunidades biológicas Ordenar correctamente datos en matrices primarias y derivadas Aplicar índices de asociación de especies Relacionar la información de la comunidad con factores ambientales. Interpretar gráficos
Heterogeneidad de la vegetación
Vegetación: Describir la heterogeneidad espacial y temporal de la vegetación y entender cuáles son los factores determinantes
Un gradiente y una especie
Un gradiente y varias especies
¿Se diferencian las comunidades?
1. “Escuela organísmica" (Clements, 1916 y Tansley) superorganismo", “cuasiorganismo” con límites discretos organización cerrada.
¿Se diferencian las comunidades?
2. “Concepto individualista (Gleason & Whittaker) organización abierta.
Ecotono: zona de transición entre comunidades con reposición rápida de especies a lo largo del gradiente y presenta mayor diversidad
Anímese a definir Comunidad
La heterogeneidad de la vegetación
Clement
Gleason
Visión individualista (Gleason)
Enfoque organísmico (Clement)
La comunidad como agregado de organismos. Sps conviven en un mismo lugar y momento. Sin cohesión, independientes entre sí
La comunidad como un superorganismo. Sistema viviente distintivo con su propia organización y estructura, relaciones, desarrollo y función. Sistema coordinado y autorregulado.
Entidades distintivas, reconocibles. Asociaciones en sistemas jerárquicos Límites- Stands (ecotono)
especies distribuidas independientemente en gradientes ambientales. Continuo Intergradación- gradientes
Muestreos en áreas homogéneas
Muestreo en áreas heterogéneas
Escuela fitosociológica (BraunBlanquet)
Escuela del continuum (CurtisWhittaker)
Clasificación
Ordenamiento
¿Qué factores o condiciones tendrías en cuenta al momento de definir una comunidad? ¿Cuáles y porqué?
Clasificación
Ordenamiento
Agrupamiento de casos con propiedades en común. Se basa en índices de similitud.
Disposición de casos a lo largo de ejes de variación contínua. Estudia los gradientes ambientales. ACP, NMDS, CA. CCA, RDA
Análisis de Cluster
estructura de la comunidad. Gradiente ambiental Matriz de datos En filas se encuentran los objetos que se ordenarán y en columnas las variables (especies) sobre las que se ordenarán los objetos.
Especies en espacio dimensional
ordenación
estructura de la comunidad Matriz de datos No es lo mismo ordenar muestras (sitios) que ordenar especies. Depende de posición de filas y columnas. Si se gira 90° la matriz siguiente, todo cambia y lo que se ordenan son las especies en función de las muestras.
Espacio muestral dimensional
Ordenación
Estadística Multivariada
• Todos los problemas multivariados pueden ser representados por una
matriz de datos de doble entrada en la cual las filas representan los objetos a ordenar o agrupar y las columnas representan las variables en base a las cuales se ordenó o agruparon los objetos. • Todos los problemas multivariados pueden ser geométricamente
conceptualizados como una nube de datos en un espacio P dimensional, donde las dimensiones (o ejes) son definidos por las p variables de interés donde se grafican las unidades de interés.
Calidad de ribera, arroyo Tafí y Las Cañadas
Matríz básica de datos de arroyo Las Cañitas y subcuenca arroyo Tafí Matriz (N X M) N = filas = sitios M= columnas = variables = especies Celda = dato cualitativo = 0 (ausencia); 1(presencia) sitio
Acacia macracant
Allophylus ed
Acacia praecox Griseb.
Anadenanther a colub
… …
…… …
…… …
…… …… ..
… … ….
……..
Celtis iguan
JMRO
0
0
0
0
0
0
0
0
0
0
0
MAT
0
0
0
0
1
0
0
0
0
0
0
EFCI
1
0
0
0
0
1
0
1
0
0
0
VILL
1
1
0
0
0
0
0
1
0
0
1
TOME
0
0
0
1
0
0
0
1
0
1
1
SAUC
1
1
1
0
0
0
0
1
0
1
1
TONU
1
0
1
0
0
0
1
1
0
1
1
CORZ
1
1
1
0
0
0
1
1
1
1
1
CITR
0
0
0
0
1
1
0
0
0
0
0
GACI
0
0
1
1
1
1
0
0
0
0
1
ATUS
1
0
0
0
0
1
0
0
0
0
0
VCOL
1
0
1
0
0
1
0
0
0
1
0
CEDR
1
0
1
0
0
0
1
1
0
1
1
LAUR
0
0
1
0
0
0
0
1
0
0
1
FAG
0
0
0
0
0
0
0
1
0
1
1
Técnicas de clasificación o clustering Agrupan a los sitios que comparten gran parte de las especies, en clases a las que denominan tipos de comunidad.
•Se puede organizar 6 entidades de muestreo en clases discretas, tal que la similitud dentro del grupo sea maximizada y la similitud entre grupos sea minimizada (maximizar la disimilitud) de acuerdo algún criterio.
Los métodos de clasificación o agrupamiento permiten el reconocimiento de tipos de comunidades como abstracción a partir de la matriz original de muestra (especies X muestras) o (muestras x especies).
Resultado finales un gráfico tipo árbol denominado dendrograma donde las entidades que están en filas de matriz se agrupan según las similitudes en las variables ubicadas en columnas.
Análisis de agrupamiento: el conjunto de datos Cjto único de variables sin distinción entre variables independientes y dependientes. Variables contínuas, categóricas o de conteos usualmente en la misma escala. Cada entidad de muestra (fila) debe ser medida sobre el mismo cjto de variables.
Puede haber menos muestras (filas) que la cantidad de variables (columnas) (matriz no tiene rango total).
Análisis de cluster: el conjunto de datos Datos ecológicos en dos vías: variables ambientales por sitios nichos por especie características ambientales por especie características por especímenes por muestras de especies.
Un buen método de clasificación o clustering debería identificar agrupamientos que tengan entre sí:
-Alta similitud intraclase, dentro de un grupo de especies o sitios. -Baja similitud interclase, entre grupos de especies o sitios.
Las clasificaciones buscan agrupar sitios con mayor similitud de especies o viceversa. La calidad del método de clustering depende de la medida de similitud
La forma de representación de un cluster puede afectar el resultado.
Procedimiento general para un método de clasificación Entrada= matriz de datos originales Estandarización o no según tipo de datos
Salida=Gráfico : dendrograma
Índices de similitud
Tipo de ligamiento
Clasificación jerárquica Indices de similitud Datos cualitativos
Datos cuantitativos
apareamiento simple (simple matching) Jaccard Roggers y Tanimoto Sorensen Sokal y Sneath Índice de información
Bray Curtis Canberra Czekanowski Distancia ecuclidea Distancia euclidea cuadrada Distancia Blok o manhatan Morisita Coeficiente de correlación
Indices de similitud, datos cualitativos . Presencia de especies Tabla de contingencia sitio 1
Sitio 2
Presente s
Ausentes
Presentes
a
b
Ausentes
c
d
Jaccard
IS = a / (a+b+c) Sorensen IS = 2a/(2a + b + c)
Se basa en especies que comparten entre dos sitios
No contempla ausencias conjuntas, datos binarios .Da igual peso a una especie común que a una rara.
Enfatiza coincidencias
Índices de similitud - datos cuantitativos Distancia euclidiana Coeficiente de correlación
Matriz de similitud triangular intermedia según índice de Jaccard (matriz intermedia) = fila X fila (sitio X sitio) JMRO
CITR
0
0.57
0.64
0.81
0.85
0.87
0.92
0.88
0.83
0.38
0.56
0.86
0.62
0.93
0.91
0.89
CITR
0.57
0
0.78
0.8
0.84
0.92
0.93
0.89
0.84
0.45
0.68
0.88
0.58
0.92
0.87
0.88
GACI
0.64
0.78
0
0.7
0.69
0.78
0.78
0.78
0.76
0.69
0.75
0.75
0.76
0.76
0.74
0.81
ATUS
0.81
0.8
0.7
0
0.68
0.8
0.77
0.74
0.85
0.85
0.67
0.74
0.85
0.69
0.73
0.8
0.85
0.84
0.69
0.68
0
0.7
0.72
0.82
0.74
0.86
0.79
0.76
0.88
0.71
0.65
0.73
0.87
0.92
0.78
0.8
0.7
0
0.55
0.5
0.53
0.84
0.79
0.69
0.76
0.64
0.46
0.53
0.92
0.93
0.78
0.77
0.72
0.55
0
0.62
0.6
0.86
0.86
0.75
0.76
0.5
0.41
0.45
0.88
0.89
0.78
0.74
0.82
0.5
0.62
0
0.59
0.85
0.79
0.72
0.69
0.55
0.64
0.54
0.83
0.84
0.76
0.85
0.74
0.53
0.6
0.59
0
0.78
0.8
0.74
0.78
0.53
0.54
0.53
0.38
0.45
0.69
0.85
0.86
0.84
0.86
0.85
0.78
0
0.66
0.86
0.45
0.86
0.81
0.76
0.56
0.68
0.75
0.67
0.79
0.79
0.86
0.79
0.8
0.66
0
0.79
0.58
0.8
0.83
0.81
0.86
0.88
0.75
0.74
0.76
0.69
0.75
0.72
0.74
0.86
0.79
0
0.73
0.7
0.67
0.69
0.62
0.58
0.76
0.85
0.88
0.76
0.76
0.69
0.78
0.45
0.58
0.73
0
0.78
0.75
0.7
0.93
0.92
0.76
0.69
0.71
0.64
0.5
0.55
0.53
0.86
0.8
0.7
0.78
0
0.5
0.39
TONU
0.91
0.87
0.74
0.73
0.65
0.46
0.41
0.64
0.54
0.81
0.83
0.67
0.75
0.5
0
0.36
CORZ
0.89
0.88
0.81
0.8
0.73
0.53
0.45
0.54
0.53
0.76
0.81
0.69
0.7
0.39
0.36
0
JMRO
TOME
SAUC
TONU
CORZ
A partir de matriz intermedia (basada en medida de similitud) se utiliza un método de ligamiento para llegar a construir en dendrograma. Ejemplo inferior con ligamiento tipo simple ( o vecino más cercano, empezando por dos entidades con mayor similitud se unen para formar un primer núcleo.
Dendrograma. Especies agrupadas según los sitios
Diferentes criterios de corte
grupo
Subgrupo
núcleo
Resultados de estudio de calidad de Ribera. Uso del Programa Infostat Dendrograma
n Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Encadenamiento Simple (Single linkage) Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Distancia: (Jaccard (1-S)) Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
n Estudiantil
n Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil VILL Versión Estudiantil TOME Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil SACÑ n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil FAG Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil LAUR n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil SAUC Versión Estudiantil CORZ Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil TONU n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil CEDR Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil VCOL n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil EFCI ATUS Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil GACI n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil MAT Versión Estudiantil CITR Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil JMR Versión Estudiantil
n Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil 0.00 0.18 0.36 0.53 0.71 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Ver
Versión Estud
(AverageVersión linkage) Versión Estudiantil Promedio Versión Estudiantil Estudiantil Ver Distancia: (Jaccard (1-S)) Versión Estud Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil
El corte en el dendrogramaVersión para Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver TOME establecer la cantidad de Versión Estudiantil VILL Versión Estudiantil Versión Estudiantil Versión Estud grupos es subjetivo. Lo FAG Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver establece el investigador. SACÑ Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estud En este caso, se podrían SAUC Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver diferenciar dos grupos: LAUR Versión Estudiantil CORZ Versión Estudiantil Versión Estudiantil Versión Estud Mat, CITR y JMR (sitios TONU altamente contaminados) Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver CEDR del resto de sitios. Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estud
EFCI Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver Puede haber Versión coeficiente de ATUS VCOL Versión Estudiantil Versión Estudiantil Versión Estud correlación cofenético Versión Estudiantil GACI (mide cuantoVersión el modelo Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver MAT propuesto se asemeja aVersión la Estudiantil CITR Versión Estudiantil Versión Estudiantil Versión Estud base datos original. Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver JMR Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estud 0.00 0.21 0.43 0.64 0.85 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver Versión Estudiantil
Versión Estudiantil
Versión Estudiantil corte Versión Estud
Análisis de agrupamiento. Cluster
�Agrupa
a los censos similares en cuanto a las especies que aparecen en ellos. �Estos grupos se suelen denominar tipos de comunidad(o comunidades). �La técnica permite reconocer tipos de comunidades como abstracción a partir de la matriz original de muestreos por especie. �Los grupos florísticos serían aquellos conjuntos de especies que coinciden en su presencia y/o abundancia en el conjunto de los muestreos.
Técnicas de ordenamiento para análisis de gradientes Ordenan los muestreos en relación a unas pocas y nuevas variables (ejes o dimensiones), que son combinaciones de las variables originales. Se buscan las variables que más discriminen o separen los grupos, que posean “mayor peso”.
Análisis directo de gradiente En gral, se analiza si hay asociación entre una matriz de sitios X especies con una matriz de sitios X factores ambientales: ACC, RDA.
Análisis indirecto de gradiente Los gradientes ambientales no son estudiados directamente sino que se infieren a partir de la identificación de gradientes de variación en la composición de la vegetación o fauna, matriz sitiosXespecies: ACP, AC, NMDS
Ordenamiento Los métodos de ordenación son parte del análisis de gradientes. Estas técnicas son un grupo de métodos para la exploración y reducción de los datos, a partir de lo cual se pueden generar hipótesis. Las entidades de muestreo ( especies, sitios, observaciones colocadas en las filas de una matriz de datos) se organizan u ordenan a lo largo de gradientes ecológicos continuos. Los métodos son esencialmente descriptivos y permite formular ideas sobre la estructura de las comunidades vegetales, y las • posibles relaciones causales entre la variación de la vegetación o fauna y su ambiente.
Métodos de ordenamiento. Matriz original de datos
Método ordenamiento de gradiente indirecto • Datos ecológicos en dos vías (filas X columnas):
sitios por especie. nicho por especie. Características ambientales por especie Características de especímenes de especies por especie.
Gradiente ambiental - Ordenamiento de muestras
Salida: gráfico de biplot
X1 = cobertura canopy, X2 = densidad; X3 = altura del canopy. PC1= está más representado por X1 y X2 (variables con más peso) PC2= está más representado por X3 (variable con más peso). PC2 vs PC1 se conoce como gráfico biplot
El análisis de Componentes principales de tablas florísticas (presencia-ausencia) como herramienta para análisis de gradientes ambientales. Un estudio de caso en la quebrada de Vaquerías (Valle Hermoso, Córdoba). Montaña, C. Ezcurra E., 1991. Ecología Austral 1:56-69.
Los dos primeros ejes sintetizan más la estructura de datos (explican la mayor variabilidad, por lo menos un 50 o 60%). Debe luego observarse cual variable (especie, o sitio) tiene “más peso” para explicar cada eje . Similar a un coeficiente o pendiente en una regresión lineal.
¿Cuántas comunidades quedarían representadas?
Esquema conceptual
Heterogeneidad de vegetación
Gradiente ambiental
Según Clement
Áreas
(Superorganismo)
homogéneas
Límites, ecotono
Agrupamiento (clasificación) Cluster
Comunidad Según Gleason (individualismo)
Áreas heterogéneas
Gradiente ambiental
Ordenamiento ACP
Matriz básica de datos (N X M) N=filas, unidades a ordenar o clasificar M= columnas, variables Clasificación
Ordenamiento
Alta similitud dentro de grupo y baja similitud entre grupos.
maximizar la diferenciación (ausencia de correlación) entre entidades a ordenar.
Matriz intermedia Índices de similitud Datos cualitativos
Matriz intermedia de distancias
Datos cuantitativos
Métodos de ligamiento Gráfico: Dendrograma
Gráfico: Biplot
Bibiliografía •Manly B. Multivariate Statistical Methods. 1995. Chapman & Hall Matteuci S. y Colma A. 1982. Metodología para el estudio de la vegetación. Serie monográfica N° 22. Secretaría Gral de la Organización de los Estados Americanos. Programa Regional de Des. Cient. Y Tecnol. •Montaña, C. Ezcurra E., 1991. El análisis de Componentes principales de tablas florísticas de presencia-ausencia como herramienta para análisis de gradientes ambientales. Un estudio de caso en la quebrada de Vaquerías (Valle Hermoso, Córdoba). Ecología Austral 1:56-69.
Actividades prácticas 1) Mediante el uso de la planilla en excel de un matriz especies X sitios, en el archivo ¨planilla de yungas argentinas.xls¨, realice un dendrograma en el programa infostat. 2) Para la elaboración final de dendrograma, tenga en cuenta el agrupamiento de sitios y agrupamiento de especies, detecte diferencias con uso de distintos ligamientos. 3) Concluya.