920655390.similitud y ordenamiento 2013.pdf

Heterogeneidad de la vegetación. Vegetación: Describir la heterogeneidad espacial y temporal de la vegetación y entender cuáles son los factores ...
4MB Größe 12 Downloads 48 vistas
COMPARACIÓN DE COMUNIDADES ASOCIACIÓN DE ESPECIES. FUNCIONES DE SEMEJANZA. DENDROGRAMAS. Objetivos: Inferir la complejidad en comparaciones de comunidades biológicas Ordenar correctamente datos en matrices primarias y derivadas Aplicar índices de asociación de especies Relacionar la información de la comunidad con factores ambientales. Interpretar gráficos

Heterogeneidad de la vegetación

Vegetación: Describir la heterogeneidad espacial y temporal de la vegetación y entender cuáles son los factores determinantes

Un gradiente y una especie

Un gradiente y varias especies

¿Se diferencian las comunidades?

1. “Escuela organísmica" (Clements, 1916 y Tansley) superorganismo", “cuasiorganismo” con límites discretos organización cerrada.

¿Se diferencian las comunidades?

2. “Concepto individualista (Gleason & Whittaker) organización abierta.

Ecotono: zona de transición entre comunidades con reposición rápida de especies a lo largo del gradiente y presenta mayor diversidad

Anímese a definir Comunidad

La heterogeneidad de la vegetación

Clement

Gleason

Visión individualista (Gleason)

Enfoque organísmico (Clement)

La comunidad como agregado de organismos. Sps conviven en un mismo lugar y momento. Sin cohesión, independientes entre sí

La comunidad como un superorganismo. Sistema viviente distintivo con su propia organización y estructura, relaciones, desarrollo y función. Sistema coordinado y autorregulado.

Entidades distintivas, reconocibles. Asociaciones en sistemas jerárquicos

Límites- Stands (ecotono)

especies distribuidas independientemente en gradientes ambientales. Continuo

Intergradación- gradientes

Muestreos en áreas homogéneas

Muestreo en áreas heterogéneas

Escuela fitosociológica (BraunBlanquet)

Escuela del continuum (CurtisWhittaker)

Clasificación

Ordenamiento

¿Qué factores o condiciones tendrías en cuenta al momento de definir una comunidad? ¿Cuáles y porqué?

Clasificación

Ordenamiento

Agrupamiento de casos con propiedades en común. Se basa en índices de similitud.

Disposición de casos a lo largo de ejes de variación contínua. Estudia los gradientes ambientales. ACP, NMDS, CA. CCA, RDA

Análisis de Cluster

Calidad de ribera, arroyo Tafí y Las Cañadas

estructura de la comunidad. Gradiente ambiental Matriz de datos En filas se encuentran los objetos que se ordenarán y en columnas las variables (especies) sobre las que se ordenarán los objetos.

Especies en espacio dimensional

ordenación

estructura de la comunidad. Clasificación Matriz de datos En filas se encuentran los objetos que se agruparán y en columnas las variables (especies) sobre las que se clasifican o agrupan los objetos.

Especies en espacio dimensional

Análisis de cluster

estructura de la comunidad Matriz de datos No es lo mismo ordenar muestras (sitios) que ordenar especies. Depende de posición de filas y columnas. Si se gira 90° la matriz siguiente, todo cambia y lo que se ordenan son las especies en función de las muestras.

Espacio muestral dimensional

Ordenación

Matriz de datos

Espacio de los datos en una dimensión

Estadística Multivariada

• Todos los problemas multivariados pueden ser representados por una

matriz de datos de doble entrada en la cual las filas representan los objetos a ordenar o agrupar y las columnas representan las variables en base a las cuales se ordenó o agruparon los objetos.

• Todos los problemas multivariados pueden ser geométricamente

conceptualizados como una nube de datos en un espacio P dimensional, donde las dimensiones (o ejes) son definidos por las p variables de interés donde se grafican las unidades de interés.

Matríz básica de datos de arroyo Las Cañitas y subcuenca arroyo Tafí Matriz (N X M) N = filas = sitios M= columnas = variables = especies Celda = dato cualitativo = 0 (ausencia); 1(presencia) muestra

Acacia macra cant

Acacia praecox Griseb.

Allophylus ed

Anadenant hera colub

……

………

………

…………..

……….

……..

Celtis iguan

JMRO

0

0

0

0

0

0

0

0

0

0

0

MAT

0

0

0

0

1

0

0

0

0

0

0

EFCI

1

0

0

0

0

1

0

1

0

0

0

VILL

1

1

0

0

0

0

0

1

0

0

1

TOME

0

0

0

1

0

0

0

1

0

1

1

SAUC

1

1

1

0

0

0

0

1

0

1

1

TONU

1

0

1

0

0

0

1

1

0

1

1

CORZ

1

1

1

0

0

0

1

1

1

1

1

CITR

0

0

0

0

1

1

0

0

0

0

0

GACI

0

0

1

1

1

1

0

0

0

0

1

ATUS

1

0

0

0

0

1

0

0

0

0

0

VCOL

1

0

1

0

0

1

0

0

0

1

0

CEDR

1

0

1

0

0

0

1

1

0

1

1

LAUR

0

0

1

0

0

0

0

1

0

0

1

FAG

0

0

0

0

0

0

0

1

0

1

1

SACÑ

1

0

1

0

0

0

0

1

0

0

1

Técnicas de clasificación o clustering Agrupan a los sitios que comparten gran parte de las especies, en clases a las que denominan tipos de comunidad.

•Se puede organizar 6 entidades de muestreo en clases discretas, tal que la similitud dentro del grupo sea maximizada y la similitud entre grupos sea minimizada (maximizar la disimilitud) de acuerdo algún criterio.

Los métodos de clasificación permiten el reconocimiento de tipos de comunidades como abstracción a partir de la matriz original de muestreos por especie (especies X muestras).

Análisis de cluster: el conjunto de datos Cjto único de variables sin distinción entre variables independientes y dependientes. Variables contínuas, categóricas o de conteos usualmente en la misma escala. Cada entidad de muestra (fila) debe ser medida sobre el mismo cjto de variables.

Puede haber menos muestras (filas) que la cantidad de variables (columnas) (matriz no tiene rango total).

Análisis de cluster: el conjunto de datos Datos ecológicos en dos vías: ¾ variables ambientales por sitios ¾ nichos por especie ¾ características ambientales por especie ¾ características por especímenes por muestras de especies.

Un buen método de clasificación o clustering debería identificar agrupamientos que tengan entre sí:

-Alta similitud intraclase, dentro de un grupo de especies o sitios. -Baja similitud interclase, entre grupos de especies o sitios.

Las clasificaciones buscan agrupar sitios con mayor similitud de especies o viceversa. La calidad del método de clustering depende de la medida de similitud

La forma de representación de un cluster puede afectar el resultado.

Clasificación jerárquica Indices de similitud Datos cualitativos

Datos cuantitativos

apareamiento simple (simple matching) Jaccard Roggers y Tanimoto Sorensen Sokal y Sneath Índice de información

Bray Curtis Canberra Czekanowski Distancia ecuclidea Distancia euclidea cuadrada Distancia Blok o manhatan Morisita Coeficiente de correlación

Indices de similitud, datos cualitativos . Presencia de especies Tabla de contingencia Censo A Presentes Ausentes Censo B

Presentes Ausentes

Jaccard

IS = a / (a+b+c) Sorensen IS = 2a/(2a + b + c)

a c

b d

Se basa en especies que comparten entre dos sitios

No contempla ausencias conjuntas, datos binarios .Da igual peso a una especie común que a una rara.

Enfatiza coincidencias

Índices de similitud - datos cuantitativos Distancia euclidiana Coeficiente de correlación

Matriz de similitud según índice de Jaccard (matriz intermedia) = fila X fila (sitio X sitio) JMRO

CITR

SAUC

TONU

0

0.57

0.64

0.81

0.85

0.87

0.92

0.88

0.83

0.38

0.56

0.86

0.62

0.93

0.91

0.89

CITR

0.57

0

0.78

0.8

0.84

0.92

0.93

0.89

0.84

0.45

0.68

0.88

0.58

0.92

0.87

0.88

GACI

0.64

0.78

0

0.7

0.69

0.78

0.78

0.78

0.76

0.69

0.75

0.75

0.76

0.76

0.74

0.81

ATUS

0.81

0.8

0.7

0

0.68

0.8

0.77

0.74

0.85

0.85

0.67

0.74

0.85

0.69

0.73

0.8

0.85

0.84

0.69

0.68

0

0.7

0.72

0.82

0.74

0.86

0.79

0.76

0.88

0.71

0.65

0.73

0.87

0.92

0.78

0.8

0.7

0

0.55

0.5

0.53

0.84

0.79

0.69

0.76

0.64

0.46

0.53

0.92

0.93

0.78

0.77

0.72

0.55

0

0.62

0.6

0.86

0.86

0.75

0.76

0.5

0.41

0.45

0.88

0.89

0.78

0.74

0.82

0.5

0.62

0

0.59

0.85

0.79

0.72

0.69

0.55

0.64

0.54

0.83

0.84

0.76

0.85

0.74

0.53

0.6

0.59

0

0.78

0.8

0.74

0.78

0.53

0.54

0.53

0.38

0.45

0.69

0.85

0.86

0.84

0.86

0.85

0.78

0

0.66

0.86

0.45

0.86

0.81

0.76

0.56

0.68

0.75

0.67

0.79

0.79

0.86

0.79

0.8

0.66

0

0.79

0.58

0.8

0.83

0.81

0.86

0.88

0.75

0.74

0.76

0.69

0.75

0.72

0.74

0.86

0.79

0

0.73

0.7

0.67

0.69

0.62

0.58

0.76

0.85

0.88

0.76

0.76

0.69

0.78

0.45

0.58

0.73

0

0.78

0.75

0.7

0.93

0.92

0.76

0.69

0.71

0.64

0.5

0.55

0.53

0.86

0.8

0.7

0.78

0

0.5

0.39

TONU

0.91

0.87

0.74

0.73

0.65

0.46

0.41

0.64

0.54

0.81

0.83

0.67

0.75

0.5

0

0.36

CORZ

0.89

0.88

0.81

0.8

0.73

0.53

0.45

0.54

0.53

0.76

0.81

0.69

0.7

0.39

0.36

0

JMRO

TOME

CORZ

Procedimiento general para un método de clasificación Entrada= matriz de datos originales

estandarización

Salida=Gráfico : dendrograma

similitud

ligamiento

A partir de matriz intermedia (basada en medida de similitud) se utiliza un método de agrupamiento para llegar a construir en dendrograma

Dendrograma. Especies agrupadas según los sitios

grupo

Subgrupo

núcleo

Resultados de estudio de calidad de Ribera. Uso del Programa Infostat Dendrograma tudiantil

Versión Estudiantil

Versión Estudiantil

Versión Estud

Encadenamiento Simple (Single linkage) Ver Versión Estudiantil Versión Estudiantil Versión Estudiantil Distancia: (Jaccard (1-S)) Versión Estud tudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver VILL TOME Versión Estudiantil Versión Estudiantil Versión Estud tudiantil SACÑ Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver FAG tudiantil Versión Estudiantil Versión Estudiantil Versión Estud LAUR Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver SAUC CORZ Versión Estudiantil Versión Estudiantil Versión Estud tudiantil TONU Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver CEDR tudiantil VCOL Versión Estudiantil Versión Estudiantil Versión Estud Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver EFCI ATUS Versión Estudiantil Versión Estudiantil Versión Estud tudiantil GACI Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver MAT tudiantil CITR Versión Estudiantil Versión Estudiantil Versión Estud Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver JMR tudiantil

Versión Estudiantil Versión Estudiantil Versión Estud 0.00 0.18 0.36 0.53 0.71 Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver di

il



di

il



di

il



d

tudiantil

El corte en el dendrograma para establecer la cantidad de grupos es subjetivo. Lo establece el investigador. En este caso, se podrían diferenciar dos grupos: Mat, CITR y JMR (sitios altamente contaminados) del resto de sitios.

Versión Estudiantil

Versión Estudiantil

Versión Estud

(AverageVersión linkage) Versión Estudiantil Promedio Versión Estudiantil Estudiantil Ver Distancia: (Jaccard (1-S)) Versión Estud tudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver TOME VILL Versión Estudiantil Versión Estudiantil Versión Estud tudiantil FAG Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver SACÑ tudiantil Versión Estudiantil Versión Estudiantil Versión Estud SAUC Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver LAUR CORZ Versión Estudiantil Versión Estudiantil Versión Estud tudiantil TONU Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver CEDR tudiantil EFCI Versión Estudiantil Versión Estudiantil Versión Estud Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver ATUS VCOL Versión Estudiantil Versión Estudiantil Versión Estud tudiantil GACI Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver MAT tudiantil CITR Versión Estudiantil Versión Estudiantil Versión Estud Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver JMR tudiantil

Versión Estudiantil Versión Estudiantil Versión Estud 0.00 0.21 0.43 0.64 0.85 Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver di

il



di

il



di

il corte ió

d

Análisis de agrupamiento. Cluster

Agrupa a los censos similares en cuanto a las especies que aparecen en ellos. Estos grupos se suelen denominar tipos de comunidad(o comunidades). La técnica permite reconocer tipos de comunidades como abstracción a partir de la matriz original de muestreos por especie. Los grupos florísticos serían aquellos conjuntos de especies que coinciden en su presencia y/o abundancia en el conjunto de los muestreos.

Técnicas de ordenamiento para análisis de gradientes Ordenan los muestreos en relación a unas pocas y nuevas variables (ejes o dimensiones), que son combinaciones de las variables originales. Se buscan las variables que más discriminen o separen los grupos, que posean “mayor peso”.

Análisis directo de gradiente En gral, se analiza si hay asociación entre una matriz de sitios X especies con una matriz de sitios X factores ambientales: ACC, RDA.

Análisis indirecto de gradiente Los gradientes ambientales no son estudiados directamente sino que se infieren a partir de la identificación de gradientes de variación en la composición de la vegetación o fauna, matriz sitiosXespecies: ACP, AC, NMDS

Ordenamiento Los métodos de ordenación son parte del análisis de gradientes. Estas técnicas son un grupo de métodos para la exploración y reducción de los datos, a partir de lo cual se pueden generar hipótesis.

Las entidades de muestreo ( especies, sitios, observaciones colocadas en las filas de una matriz de datos) se organizan u ordenan a lo largo de gradientes ecológicos continuos.

Los métodos son esencialmente descriptivos y permite formular ideas sobre la estructura de las comunidades vegetales, y las • posibles relaciones causales entre la variación de la vegetación o fauna y su ambiente.

Métodos de ordenamiento. Matriz original de datos

ACP: La matriz original de datos • Datos ecológicos en dos vías (filas X columnas):

¾ sitios por especie. ¾ nicho por especie. ¾Características ambientales por especie ¾ Características de especímenes de especies por especie.

Muchos análisis multivariados de ordenamiento requieren cumplir supuestos • Supuesto de

Normalidad multivariada

Gradiente ambiental - Ordenamiento de muestras

Salida: gráfico de biplot

La extracción de los ejes o componentes debe ser de tal manera que maximice la no correlación entre sitios, para separarlos o discriminarlos (x eso ejes perpendiculares).

Al ser correlación cero implica que dos ejes perpendiculares entre sí son independientes y esos ejes separan más los grupos

Hay correlación entre los puntos A y B (implican que se parecen entre sí) no se separan.

X1 = cobertura canopy, X2 = densidad; X3 = altura del canopy. PC1= está más representado por X1 y X2 (variables con más peso) PC2= está más representado por X3 (variable con más peso). PC2 vs PC1 se conoce como gráfico biplot

Matriz original de datos y matriz intermedia de distancias

El análisis de Componentes principales de tablas florísticas (presencia-ausencia) como herramienta para análisis de gradientes ambientales. Un estudio de caso en la quebrada de Vaquerías (Valle Hermoso, Córdoba). Montaña, C. Ezcurra E., 1991. Ecología Austral 1:56-69.

Los dos primeros ejes sintetizan más la estructura de datos (explican la mayor variabilidad, por lo menos un 50 o 60%). Debe luego observarse cual variable (especie, o sitio) tiene “más peso” para explicar cada eje . Similar a un coeficiente o pendiente en una regresión lineal.

¿Cuántas comunidades quedarían representadas?

Análisis de componentes principales

Ordena los conteos a lo largo de un eje en cuanto a las especies que aparecen en ellos La técnica permite realizar un análisis indirecto de gradiente. El gradiente ambiental se infiere al identificar la variación en la presencia y/o abundancia de las especies. El gradiente estaría asociado a variaciones espaciales en factores ambientales

Esquema conceptual

Heterogeneidad de vegetación

Gradiente ambiental

Según Clement

Áreas

(Superorganismo)

homogéneas

Límites, ecotono

Agrupamiento (clasificación) Cluster

Comunidad Según Gleason (individualismo)

Áreas heterogéneas

Gradiente ambiental

Ordenamiento ACP

Matriz básica de datos (N X M) N=filas, unidades a ordenar o clasificar M= columnas, variables Clasificación

Ordenamiento

Alta similitud dentro de grupo y baja similitud entre grupos.

maximizar la diferenciación (ausencia de correlación) entre entidades a ordenar.

Matriz intermedia Índices de similitud Datos cualitativos

Matriz intermedia de distancias

Datos cuantitativos

Métodos de ligamiento

Gráfico: Dendrograma

Gráfico: Biplot

Bibiliografía •Manly B. Multivariate Statistical Methods. 1995. Chapman & Hall •Matteuci S. y Colma A. 1982. Metodología para el estudio de la vegetación. Serie monográfica N° 22. Secretaría Gral de la Organización de los Estados Americanos. Programa Regional de Des. Cient. Y Tecnol. •Montaña, C. Ezcurra E., 1991. El análisis de Componentes principales de tablas florísticas de presencia-ausencia como herramienta para análisis de gradientes ambientales. Un estudio de caso en la quebrada de Vaquerías (Valle Hermoso, Córdoba). Ecología Austral 1:56-69.