maxent

Page 1. Diciembre de 2013. Universidad Autónoma de Entre Ríos. CeReGeo- PIECAS. Capacitación en Geomática aplicada a la. Gestión Ambiental del ...
3MB Größe 22 Downloads 41 vistas
Universidad Autónoma de Entre Ríos CeReGeo- PIECAS Capacitación en Geomática aplicada a la Gestión Ambiental del CLRP

ACTIVIDAD 3 PRÁCTICA Diciembre de 2013

Objetivos de la práctica Aplicar los contenidos previos desarrollados en los módulos previos. Analizar y evaluar la disponibilidad de información ambiental a escala regional y global para el CLRP. Discutir técnicas de integración de información espacial y de campo.

MODELOS ¿Que son?

Ej: DEM Escenarios Worldclim Comportamiento de plantas

Otro tipo de Modelos.... Modelos de Distribución de especies (SDM)

Los modelos de distribución de especies indican la idoneidad del hábitat (NICHO) para el desarrollo de poblaciones de una especie concreta o de una comunidad, calculada a partir de observaciones de campo y una serie de variables ambientales que actúan como predictores.

Ejemplo: Modelos de nichos ECOCROP 1600

Precipitation (mm)

1400 Marginal conditions

1200 1000 800

Death

Optimum conditions

Not suitable conditions

600 400 200 0 -5

0

5

10

15 20 25 Temperature (ºC)

30

35

40

http://ecocrop.fao.org/ecocrop/srv/en/cropFindForm Mirar en: http://gisweb.ciat.cgiar.org/ClimateChange/EcoCropFB/

Existencia de “áreas” con diferente aptitud para la presencia/desarrollo de una población

Aportes al estudio de modelos de distribución de especies

Algunos aportes al estudio de modelos de distribución de especies para Bolivia

Criterios para la construcción de los Modelos de distribución de especies Factores que afectan la precisión del resultado final: Las variables predictoras seleccionadas (es recomendable realizar primero un test para evaluar posibles correlaciones)

Criterios para la construcción de los Modelos de distribución de especies Factores que afectan la precisión del resultado final: La calidad de los datos de localización de la especie: -

Registros de presencia

-

Registros de presencia-ausencia.

-Métodos basados en registros de presencia-ausencia (GLM), GAM (generalized additive models) y redes neuronales . Método basados únicamente en presencias como (Bioclim, Domain, ENFA, GARP y MaxEnt)

Los modelos basados únicamente en presencias representan generalmente la distribución espacial del nicho ecológico fundamental de la especie. Los modelos basados en presencia-ausencia indican de modo más aproximado la distribución del nicho ecológico realizado .

MAXENT: El principio o método de Máxima Entropia (MaxEnt) es un procedimiento para generar distribuciones de probabilidad de forma sistemática y objetiva. MaxEnt estima la probabilidad de ocurrencia de la especie buscando la distribución de máxima entropía (lo más uniforme posible) sujeta a la condición de que el valor esperado de cada variable ambiental según esta distribución coincide con su media empírica.

Modelos de distribución de especies basados en registros de presencia.

Software Maxent Descarga libre del sitio: http://www.cs.princeton.edu/~schapire/maxent/

Programa basado en una distribución de Máxima Entropía para la modelización de la distribución geográfica de las especies Soporte técnico y teórico Software Maxent Steven J. Phillips, Miroslav Dudík, Robert E. Schapire. A maximum entropy approach to species distribution modeling. In Proceedings of the Twenty-First International Conference on Machine Learning, pages 655-662, 2004. Steven J. Phillips, Robert P. Anderson, Robert E. Schapire. Maximum entropy modeling of species geographic distributions. Ecological Modelling, 190:231-259, 2006. Jane Elith, Steven J. Phillips, Trevor Hastie, Miroslav Dudík, Yung En Chee, Colin J. Yates. A statistical explanation of MaxEnt for ecologists. Diversity and Distributions, 17:43-57, 2011. TUTORIAL MAXENT.

EXPLORANDO LA NTERFASE SOFTWARE MAXENT

Requisitos para modelar...... 1) Datos Biológicos: Archivo con los lugares de presencia de la especies (“muestras”)

2) Datos geográficos: Un directorio (carpeta) que contenga las variables ambientales. Se carga el directorio completo. En formato ASCII. Deben ser interpretados con precaución cuando las variables explicativas están correlacionadas.

3) Directorio (carpeta) de salida.

1) Datos Biológicos: El archivo “presencia.csv” contiene las localidades de presencia, y sus primeras líneas son: Es FUNDAMENTAL respetar species,longitude,latitude este esquema … caso contrario nombre,-65.4,-10.3833 no funciona el software... nombre,-65.3833,-10.3833

Vista de Maxent con el archivo de presencia (csv)

Si el archivo de “muestras” tiene datos duplicados (muestreos múltiples para la misma especie en la misma celda), se pueden eliminar desde el menú “Settings → Delete duplicates”.

2) Datos geográficos: Son coberturas ambientales en formato raster, (ASCII) (en formato .asc de ESRI) Todas deben tener la misma extensión geográfica y tamaño de píxel.

Se han tomado como ejemplo algunas de las variables de worldclim.

EXPLORAR LOS SETTINGS...

Iteracciones: A mayor cantidad de iteracciones, se mejora el ajuste de la distribución de los datos modelados.

Selección de puntos de muestreo y testeo: Los puntos de muestreo para realizar el test del modelo son una muestra tomada al azar de las localidades de presencia de la especie. •MaxEnt utiliza el mismo conjunto de datos tomados al azar en cada vuelta del modelo, mientras que la opción “random seed” (en el panel de “settings”) no esté seleccionada. El “25” de la casilla “random test porcentaje” indica al programa que guarde un 25% de los puntos de muestreo, elegidos al azar, para realizar el test final sobre el modelo. (Las probabilidades binomiales se calculan con exactitud si el número de muestras de ensayo es a lo sumo 25%).

MaxEnt soporta 3 formatos de resultados para los valores del modelo: Datos brutos (modelo exponencial de MaxEnt). Cumulativo, (valor bruto r, que es el porcentaje de la distribución de MaxEnt con valor máximo r) Logistico: (si c es el exponente de la entropía de la distribución de MaxEnt, entonces el valor logístico correspondiente al valor bruto de r es c·r/(1+c·r). El resultado por defecto es logístico, ya que es el más fácil de conceptualizar: da una estimación entre 0 y 1 de la probabilidad de presencia.

Corriendo el modelo... Una vez que se han cargado las capas, definido los parámetros y los directorios de almacenamiento de los resultados----- se corre el modelo!!

“gain” es una medida de la bondad de ajuste utilizada en modelos de distribución de especies (SDM). Por ejemplo, si el gain toma valor de 2, ello significa que el valor medio de los píxeles que contienen un punto de presencia es exp(2) ≈ 7.4 veces mayor que una distribución al azar sobre dicho píxel. MaxEnt no calcula directamente la “probabilidad de ocurrencia” (Ʃ prob pixeles =1)

Salidas del modelo: De acuerdo a los settings seleccionados, el modelo proporciona diferentes tipos de resultados:

Carpeta con gráficos de relaciones entre variables y mapa Grilla del modelo (Formato ASCII o GRD.) Resultados del modelo (Formato html)

Resultados parciales: ventana que muestra el directorio de salida del modelo Maxent. Se observan los diferentes archivos y carpetas generadas de acuerdo a los parámetros escogidos.

Salidas del modelo: El archivo html:

Análisis estadísticos de MAXENT

En el gráfico vemos como la omisión en los puntos de entrenamiento coincide muy bien con la tasa de omisión predicha, que se corresponde con la tasa de omisión para el test de la propia distribución de MaxEnt.

Curva operacional (curva ROC)Receiver Operating Characteristic

La curva roja (entrenamiento) representa el ajuste del modelo a los datos de muestreo. La curva azul (test) indica el grado de ajuste del modelo a los datos y supone el test real del poder predictivo del modelo. La línea negra representa la línea esperada si el modelo no fuese mejor que “por azar”.

Umbrales y tasas de omisión

Los umbrales de corte se estiman, para cada modelo seleccionado (logistico/cumulativo) obteniendo aquel valor de umbral mayor para el cual la tasa de omisión de entrenamiento es menor. (herramienta para la clasificación de los GRID resultantes).

La imagen utiliza colores para indicar la probabilidad predicha de condiciones favorable. (Color rojo : alta probabilidad de condiciones favorables para las especies consideradas, el verde indica condiciones típicas y los tonos claros de azul indican una baja probabilidad de condiciones ambientales favorables para la especie.

Análisis de la contribución de las variables Estimación de las contribuciones relativas de las variables ambientales al modelo Maxent. Para determinar la estimación, en cada iteración del algoritmo de entrenamiento, el aumento en la ganancia de regularización se añade la contribución de la variable correspondiente, o se resta de él, si el cambio en el valor absoluto de la lambda es negativo.

La temperatura media del cuartil más frío y la precipitación anual explican más del 80% de la distribución de la especie.

Parámetros del modelo:

Importar el resultado a DIVA GIS Data> Import to gridfile > single file (para transformar de ASCII a GRID) Ingresar datos de variables estudiadas y Registro de especies.

DIVA GIS Modelado

Resultado del modelo Bioclim (Diva GIS)

Ver con los puntos de presencia de coberturas, q walter los mencione p la clasificacion (inputs p validar) q pablo los tome en el campo, q fernando los sistematice y pamela los aplique en un modelo d potencialidad d habita(DIVA)