COMPARACIÓN DE COMUNIDADES ASOCIACIÓN DE ESPECIES. FUNCIONES DE SEMEJANZA. DENDROGRAMAS. Objetivos: Inferir la complejidad en comparaciones de comunidades biológicas Ordenar correctamente datos en matrices primarias y derivadas Aplicar índices de asociación de especies Relacionar la información de la comunidad con factores ambientales. Interpretar gráficos
Heterogeneidad de la vegetación
Vegetación: Describir la heterogeneidad espacial y temporal de la vegetación y entender cuáles son los factores determinantes
Un gradiente y una especie
Un gradiente y varias especies
¿Se diferencian las comunidades?
1. “Escuela organísmica" (Clements, 1916 y Tansley) superorganismo", “cuasiorganismo” con límites discretos organización cerrada.
¿Se diferencian las comunidades?
2. “Concepto individualista (Gleason & Whittaker) organización abierta.
Ecotono: zona de transición entre comunidades con reposición rápida de especies a lo largo del gradiente y presenta mayor diversidad
Anímese a definir Comunidad
La heterogeneidad de la vegetación
Clement
Gleason
Visión individualista (Gleason)
Enfoque organísmico (Clement)
La comunidad como agregado de organismos. Sps conviven en un mismo lugar y momento. Sin cohesión, independientes entre sí
La comunidad como un superorganismo. Sistema viviente distintivo con su propia organización y estructura, relaciones, desarrollo y función. Sistema coordinado y autorregulado.
Entidades distintivas, reconocibles. Asociaciones en sistemas jerárquicos
Límites- Stands (ecotono)
especies distribuidas independientemente en gradientes ambientales. Continuo
Intergradación- gradientes
Muestreos en áreas homogéneas
Muestreo en áreas heterogéneas
Escuela fitosociológica (BraunBlanquet)
Escuela del continuum (CurtisWhittaker)
Clasificación
Ordenamiento
¿Qué factores o condiciones tendrías en cuenta al momento de definir una comunidad? ¿Cuáles y porqué?
Clasificación
Ordenamiento
Agrupamiento de casos con propiedades en común. Se basa en índices de similitud.
Disposición de casos a lo largo de ejes de variación contínua. Estudia los gradientes ambientales. ACP, NMDS, CA. CCA, RDA
Análisis de Cluster
Calidad de ribera, arroyo Tafí y Las Cañadas
estructura de la comunidad. Gradiente ambiental Matriz de datos En filas se encuentran los objetos que se ordenarán y en columnas las variables (especies) sobre las que se ordenarán los objetos.
Especies en espacio dimensional
ordenación
estructura de la comunidad. Clasificación Matriz de datos En filas se encuentran los objetos que se agruparán y en columnas las variables (especies) sobre las que se clasifican o agrupan los objetos.
Especies en espacio dimensional
Análisis de cluster
estructura de la comunidad Matriz de datos No es lo mismo ordenar muestras (sitios) que ordenar especies. Depende de posición de filas y columnas. Si se gira 90° la matriz siguiente, todo cambia y lo que se ordenan son las especies en función de las muestras.
Espacio muestral dimensional
Ordenación
Matriz de datos
Espacio de los datos en una dimensión
Estadística Multivariada
• Todos los problemas multivariados pueden ser representados por una
matriz de datos de doble entrada en la cual las filas representan los objetos a ordenar o agrupar y las columnas representan las variables en base a las cuales se ordenó o agruparon los objetos.
• Todos los problemas multivariados pueden ser geométricamente
conceptualizados como una nube de datos en un espacio P dimensional, donde las dimensiones (o ejes) son definidos por las p variables de interés donde se grafican las unidades de interés.
Matríz básica de datos de arroyo Las Cañitas y subcuenca arroyo Tafí Matriz (N X M) N = filas = sitios M= columnas = variables = especies Celda = dato cualitativo = 0 (ausencia); 1(presencia) muestra
Acacia macra cant
Acacia praecox Griseb.
Allophylus ed
Anadenant hera colub
……
………
………
…………..
……….
……..
Celtis iguan
JMRO
0
0
0
0
0
0
0
0
0
0
0
MAT
0
0
0
0
1
0
0
0
0
0
0
EFCI
1
0
0
0
0
1
0
1
0
0
0
VILL
1
1
0
0
0
0
0
1
0
0
1
TOME
0
0
0
1
0
0
0
1
0
1
1
SAUC
1
1
1
0
0
0
0
1
0
1
1
TONU
1
0
1
0
0
0
1
1
0
1
1
CORZ
1
1
1
0
0
0
1
1
1
1
1
CITR
0
0
0
0
1
1
0
0
0
0
0
GACI
0
0
1
1
1
1
0
0
0
0
1
ATUS
1
0
0
0
0
1
0
0
0
0
0
VCOL
1
0
1
0
0
1
0
0
0
1
0
CEDR
1
0
1
0
0
0
1
1
0
1
1
LAUR
0
0
1
0
0
0
0
1
0
0
1
FAG
0
0
0
0
0
0
0
1
0
1
1
SACÑ
1
0
1
0
0
0
0
1
0
0
1
Técnicas de clasificación o clustering Agrupan a los sitios que comparten gran parte de las especies, en clases a las que denominan tipos de comunidad.
•Se puede organizar 6 entidades de muestreo en clases discretas, tal que la similitud dentro del grupo sea maximizada y la similitud entre grupos sea minimizada (maximizar la disimilitud) de acuerdo algún criterio.
Los métodos de clasificación permiten el reconocimiento de tipos de comunidades como abstracción a partir de la matriz original de muestreos por especie (especies X muestras).
Análisis de cluster: el conjunto de datos Cjto único de variables sin distinción entre variables independientes y dependientes. Variables contínuas, categóricas o de conteos usualmente en la misma escala. Cada entidad de muestra (fila) debe ser medida sobre el mismo cjto de variables.
Puede haber menos muestras (filas) que la cantidad de variables (columnas) (matriz no tiene rango total).
Análisis de cluster: el conjunto de datos Datos ecológicos en dos vías: ¾ variables ambientales por sitios ¾ nichos por especie ¾ características ambientales por especie ¾ características por especímenes por muestras de especies.
Un buen método de clasificación o clustering debería identificar agrupamientos que tengan entre sí:
-Alta similitud intraclase, dentro de un grupo de especies o sitios. -Baja similitud interclase, entre grupos de especies o sitios.
Las clasificaciones buscan agrupar sitios con mayor similitud de especies o viceversa. La calidad del método de clustering depende de la medida de similitud
La forma de representación de un cluster puede afectar el resultado.
Clasificación jerárquica Indices de similitud Datos cualitativos
Datos cuantitativos
apareamiento simple (simple matching) Jaccard Roggers y Tanimoto Sorensen Sokal y Sneath Índice de información
Bray Curtis Canberra Czekanowski Distancia ecuclidea Distancia euclidea cuadrada Distancia Blok o manhatan Morisita Coeficiente de correlación
Indices de similitud, datos cualitativos . Presencia de especies Tabla de contingencia Censo A Presentes Ausentes Censo B
Presentes Ausentes
Jaccard
IS = a / (a+b+c) Sorensen IS = 2a/(2a + b + c)
a c
b d
Se basa en especies que comparten entre dos sitios
No contempla ausencias conjuntas, datos binarios .Da igual peso a una especie común que a una rara.
Enfatiza coincidencias
Índices de similitud - datos cuantitativos Distancia euclidiana Coeficiente de correlación
Matriz de similitud según índice de Jaccard (matriz intermedia) = fila X fila (sitio X sitio) JMRO
CITR
SAUC
TONU
0
0.57
0.64
0.81
0.85
0.87
0.92
0.88
0.83
0.38
0.56
0.86
0.62
0.93
0.91
0.89
CITR
0.57
0
0.78
0.8
0.84
0.92
0.93
0.89
0.84
0.45
0.68
0.88
0.58
0.92
0.87
0.88
GACI
0.64
0.78
0
0.7
0.69
0.78
0.78
0.78
0.76
0.69
0.75
0.75
0.76
0.76
0.74
0.81
ATUS
0.81
0.8
0.7
0
0.68
0.8
0.77
0.74
0.85
0.85
0.67
0.74
0.85
0.69
0.73
0.8
0.85
0.84
0.69
0.68
0
0.7
0.72
0.82
0.74
0.86
0.79
0.76
0.88
0.71
0.65
0.73
0.87
0.92
0.78
0.8
0.7
0
0.55
0.5
0.53
0.84
0.79
0.69
0.76
0.64
0.46
0.53
0.92
0.93
0.78
0.77
0.72
0.55
0
0.62
0.6
0.86
0.86
0.75
0.76
0.5
0.41
0.45
0.88
0.89
0.78
0.74
0.82
0.5
0.62
0
0.59
0.85
0.79
0.72
0.69
0.55
0.64
0.54
0.83
0.84
0.76
0.85
0.74
0.53
0.6
0.59
0
0.78
0.8
0.74
0.78
0.53
0.54
0.53
0.38
0.45
0.69
0.85
0.86
0.84
0.86
0.85
0.78
0
0.66
0.86
0.45
0.86
0.81
0.76
0.56
0.68
0.75
0.67
0.79
0.79
0.86
0.79
0.8
0.66
0
0.79
0.58
0.8
0.83
0.81
0.86
0.88
0.75
0.74
0.76
0.69
0.75
0.72
0.74
0.86
0.79
0
0.73
0.7
0.67
0.69
0.62
0.58
0.76
0.85
0.88
0.76
0.76
0.69
0.78
0.45
0.58
0.73
0
0.78
0.75
0.7
0.93
0.92
0.76
0.69
0.71
0.64
0.5
0.55
0.53
0.86
0.8
0.7
0.78
0
0.5
0.39
TONU
0.91
0.87
0.74
0.73
0.65
0.46
0.41
0.64
0.54
0.81
0.83
0.67
0.75
0.5
0
0.36
CORZ
0.89
0.88
0.81
0.8
0.73
0.53
0.45
0.54
0.53
0.76
0.81
0.69
0.7
0.39
0.36
0
JMRO
TOME
CORZ
Procedimiento general para un método de clasificación Entrada= matriz de datos originales
estandarización
Salida=Gráfico : dendrograma
similitud
ligamiento
A partir de matriz intermedia (basada en medida de similitud) se utiliza un método de agrupamiento para llegar a construir en dendrograma
Dendrograma. Especies agrupadas según los sitios
grupo
Subgrupo
núcleo
Resultados de estudio de calidad de Ribera. Uso del Programa Infostat Dendrograma tudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estud
Encadenamiento Simple (Single linkage) Ver Versión Estudiantil Versión Estudiantil Versión Estudiantil Distancia: (Jaccard (1-S)) Versión Estud tudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver VILL TOME Versión Estudiantil Versión Estudiantil Versión Estud tudiantil SACÑ Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver FAG tudiantil Versión Estudiantil Versión Estudiantil Versión Estud LAUR Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver SAUC CORZ Versión Estudiantil Versión Estudiantil Versión Estud tudiantil TONU Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver CEDR tudiantil VCOL Versión Estudiantil Versión Estudiantil Versión Estud Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver EFCI ATUS Versión Estudiantil Versión Estudiantil Versión Estud tudiantil GACI Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver MAT tudiantil CITR Versión Estudiantil Versión Estudiantil Versión Estud Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver JMR tudiantil
Versión Estudiantil Versión Estudiantil Versión Estud 0.00 0.18 0.36 0.53 0.71 Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver di
il
ió
di
il
ió
di
il
ió
d
tudiantil
El corte en el dendrograma para establecer la cantidad de grupos es subjetivo. Lo establece el investigador. En este caso, se podrían diferenciar dos grupos: Mat, CITR y JMR (sitios altamente contaminados) del resto de sitios.
Versión Estudiantil
Versión Estudiantil
Versión Estud
(AverageVersión linkage) Versión Estudiantil Promedio Versión Estudiantil Estudiantil Ver Distancia: (Jaccard (1-S)) Versión Estud tudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver TOME VILL Versión Estudiantil Versión Estudiantil Versión Estud tudiantil FAG Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver SACÑ tudiantil Versión Estudiantil Versión Estudiantil Versión Estud SAUC Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver LAUR CORZ Versión Estudiantil Versión Estudiantil Versión Estud tudiantil TONU Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver CEDR tudiantil EFCI Versión Estudiantil Versión Estudiantil Versión Estud Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver ATUS VCOL Versión Estudiantil Versión Estudiantil Versión Estud tudiantil GACI Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver MAT tudiantil CITR Versión Estudiantil Versión Estudiantil Versión Estud Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver JMR tudiantil
Versión Estudiantil Versión Estudiantil Versión Estud 0.00 0.21 0.43 0.64 0.85 Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver di
il
ió
di
il
ió
di
il corte ió
d
Análisis de agrupamiento. Cluster
Agrupa a los censos similares en cuanto a las especies que aparecen en ellos. Estos grupos se suelen denominar tipos de comunidad(o comunidades). La técnica permite reconocer tipos de comunidades como abstracción a partir de la matriz original de muestreos por especie. Los grupos florísticos serían aquellos conjuntos de especies que coinciden en su presencia y/o abundancia en el conjunto de los muestreos.
Técnicas de ordenamiento para análisis de gradientes Ordenan los muestreos en relación a unas pocas y nuevas variables (ejes o dimensiones), que son combinaciones de las variables originales. Se buscan las variables que más discriminen o separen los grupos, que posean “mayor peso”.
Análisis directo de gradiente En gral, se analiza si hay asociación entre una matriz de sitios X especies con una matriz de sitios X factores ambientales: ACC, RDA.
Análisis indirecto de gradiente Los gradientes ambientales no son estudiados directamente sino que se infieren a partir de la identificación de gradientes de variación en la composición de la vegetación o fauna, matriz sitiosXespecies: ACP, AC, NMDS
Ordenamiento Los métodos de ordenación son parte del análisis de gradientes. Estas técnicas son un grupo de métodos para la exploración y reducción de los datos, a partir de lo cual se pueden generar hipótesis.
Las entidades de muestreo ( especies, sitios, observaciones colocadas en las filas de una matriz de datos) se organizan u ordenan a lo largo de gradientes ecológicos continuos.
Los métodos son esencialmente descriptivos y permite formular ideas sobre la estructura de las comunidades vegetales, y las • posibles relaciones causales entre la variación de la vegetación o fauna y su ambiente.
Métodos de ordenamiento. Matriz original de datos
ACP: La matriz original de datos • Datos ecológicos en dos vías (filas X columnas):
¾ sitios por especie. ¾ nicho por especie. ¾Características ambientales por especie ¾ Características de especímenes de especies por especie.
Muchos análisis multivariados de ordenamiento requieren cumplir supuestos • Supuesto de
Normalidad multivariada
Gradiente ambiental - Ordenamiento de muestras
Salida: gráfico de biplot
La extracción de los ejes o componentes debe ser de tal manera que maximice la no correlación entre sitios, para separarlos o discriminarlos (x eso ejes perpendiculares).
Al ser correlación cero implica que dos ejes perpendiculares entre sí son independientes y esos ejes separan más los grupos
Hay correlación entre los puntos A y B (implican que se parecen entre sí) no se separan.
X1 = cobertura canopy, X2 = densidad; X3 = altura del canopy. PC1= está más representado por X1 y X2 (variables con más peso) PC2= está más representado por X3 (variable con más peso). PC2 vs PC1 se conoce como gráfico biplot
Matriz original de datos y matriz intermedia de distancias
El análisis de Componentes principales de tablas florísticas (presencia-ausencia) como herramienta para análisis de gradientes ambientales. Un estudio de caso en la quebrada de Vaquerías (Valle Hermoso, Córdoba). Montaña, C. Ezcurra E., 1991. Ecología Austral 1:56-69.
Los dos primeros ejes sintetizan más la estructura de datos (explican la mayor variabilidad, por lo menos un 50 o 60%). Debe luego observarse cual variable (especie, o sitio) tiene “más peso” para explicar cada eje . Similar a un coeficiente o pendiente en una regresión lineal.
¿Cuántas comunidades quedarían representadas?
Análisis de componentes principales
Ordena los conteos a lo largo de un eje en cuanto a las especies que aparecen en ellos La técnica permite realizar un análisis indirecto de gradiente. El gradiente ambiental se infiere al identificar la variación en la presencia y/o abundancia de las especies. El gradiente estaría asociado a variaciones espaciales en factores ambientales
Esquema conceptual
Heterogeneidad de vegetación
Gradiente ambiental
Según Clement
Áreas
(Superorganismo)
homogéneas
Límites, ecotono
Agrupamiento (clasificación) Cluster
Comunidad Según Gleason (individualismo)
Áreas heterogéneas
Gradiente ambiental
Ordenamiento ACP
Matriz básica de datos (N X M) N=filas, unidades a ordenar o clasificar M= columnas, variables Clasificación
Ordenamiento
Alta similitud dentro de grupo y baja similitud entre grupos.
maximizar la diferenciación (ausencia de correlación) entre entidades a ordenar.
Matriz intermedia Índices de similitud Datos cualitativos
Matriz intermedia de distancias
Datos cuantitativos
Métodos de ligamiento
Gráfico: Dendrograma
Gráfico: Biplot
Bibiliografía •Manly B. Multivariate Statistical Methods. 1995. Chapman & Hall •Matteuci S. y Colma A. 1982. Metodología para el estudio de la vegetación. Serie monográfica N° 22. Secretaría Gral de la Organización de los Estados Americanos. Programa Regional de Des. Cient. Y Tecnol. •Montaña, C. Ezcurra E., 1991. El análisis de Componentes principales de tablas florísticas de presencia-ausencia como herramienta para análisis de gradientes ambientales. Un estudio de caso en la quebrada de Vaquerías (Valle Hermoso, Córdoba). Ecología Austral 1:56-69.