Clasificación Digital de Imágenes Satelitales

Básicamente, la clasificación digital de imágenes satelitales consiste en un método estadístico por el cual, a través de un muestreo de píxeles, se agrupa en.
580KB Größe 282 Downloads 221 vistas
Clasificación Digital de Imágenes Satelitales Editado por Marcos Angelini El objetivo de una clasificación consiste en agrupar los píxeles que posean una misma característica. Generalmente la característica tomada es el valor digital de los mismos, que se corresponderá a un tipo de cobertura del terreno. Básicamente, la clasificación digital de imágenes satelitales consiste en un método estadístico por el cual, a través de un muestreo de píxeles, se agrupa en categorías o clases al resto de los píxeles de una imagen. Los métodos de clasificación pueden agruparse en: 

Clasificación Supervisada



Clasificación No Supervisada

La clasificación supervisada consiste en conocer a priori las categorías en las cuales se quiere separar la imagen, y para ello se debe validar el muestreo de píxeles con un trabajo de campo. En cambio, en la clasificación no supervisada no se conocen las clases a separar, por lo tanto se debe determinar en cuantas clases se quiere separar la imagen y el ordenador definirá las clases. La labor posterior es identificar, con trabajo a campo, a que cobertura pertenece cada clase. El problema de este método es que no toma en cuenta la variabilidad que tiene cada clase. Por ejemplo, la variabilidad espectral de un pastizal natural en mucho mayor que la variabilidad de un cuerpo de agua profundo y transparente. En esta guía sólo se desarrollará el método de clasificación supervisada, ya que es el más utilizado y exacto. No por ello debe descartarse el uso del resto de las metodologías para casos puntuales.

Clasificación Supervisada El Proceso de clasificación supervisada se puede separar en una serie de pasos: 

Trabajo de Campo



Identificación y selección de sitios de entrenamiento



Selección del método de asignación de píxeles



Evaluación de la clasificación



Preparación del mapa temático

Trabajo de Campo Para la salida a campo debe procesarse la imagen a utilizar (con los métodos vistos en el apartado anterior) de manera de poder identificar las distintas coberturas del terreno. La fecha de adquisición de la imagen debe ser lo más cercana posible a la fecha de salida a campo, y a su ves, que las cobertura de interés estén es su mayor expresión en la misma.

1

El objetivo del trabajo de campo es reconocer las distintas coberturas del área de estudio para luego poder identificarlas fehacientemente sobre la imagen. Generalmente es conveniente diseñar el trabajo de campo de manera tal de recorrer todas las coberturas observadas en la imagen. Cada punto visitado debe caracterizarse con datos como tipo de cobertura, porcentaje de cobertura de suelo, estado de la cobertura, fenología (para cultivos) y todas aquellas características que puedan modificar la respuesta espectral de la las mismas. El número de sitios visitados debe ser suficientes como para que sean representativos del número de coberturas y de la variabilidad de las mismas. Identificación y selección de sitios de entrenamiento Esta etapa puede considerarse el punto crítico de una clasificación ya que de la correcta definición de los sitios de entrenamiento dependerá el resultado de la clasificación, para lo cual debe contarse con buena información de campo. Los sitios de entrenamiento son grupos de píxeles que representan a una clase o categoría, de los cuales se extraerá datos como media aritmética, desvío estándar, rango, etc. Para seleccionarlos, dichos sitios, deben cumplir con los siguientes requisitos: 

Deben ser representativos de la clase



Deben ser lo más homogéneos posibles en cuanto a su valor espectral

En cuanto al primer requisito, la bibliografía indica que una clase no debería estar definida por menos de 100 píxeles, aunque ello puede resultar insuficiente cuando nos encontramos con clases con gran extensión y variabilidad. Vale decir que el número de píxeles está en función de la variabilidad y la extensión de una clase. Para cumplir con el segundo ítem, se deberá generar más de una categoría en aquellas clases con gran variabilidad. Así, se tendrá que, por ejemplo, que la clase Maíz puede estar definida por las clases Maíz_1, Maíz_2, Maíz_3…; en este caso cada clase de Maíz corresponde a distintos estadios fenológicos del cultivo o diferentes situaciones de campo que modifican la respuesta espectral, como ser un cultivo enmalezado o inundado. La siguiente figura muestra el proceso por el cual se obtienen los valores estadísticos de un sitio de entrenamiento. Generalmente los software poseen herramientas interactivas para seleccionar un área sobre la imagen. Al encerrar un grupo de píxeles se calcula las estadísticas para cada banda incluida en la proceso (en el ejemplo son tres bandas). Por lo tanto cada clase tendrá una media, desvío estándar, etc. para cada banda. En conocimiento de esta metodología, se recolectarán los distintos sitios de entrenamiento. Una herramienta que suele encontrarse en los software con distintos nombres es la de “semillado” (seeding), para PCI Geomatics, que permite hacer un clic sobre un píxel y automáticamente seleccionara los vecinos que tengan un valor espectral dentro de un rango preestablecido. Esto permite seleccionar áreas homogéneas.

2

A continuación se muestran las áreas seleccionadas con la herramienta de semillado:

Una vez recolectados los sitios de entrenamiento debe evaluarse su precisión, para lo que existen una serie de herramientas visuales y estadísticas destinadas a tal fin. La más sencilla de todas es la firma espectral de cada clase. Esta se confecciona con los valores medios de cada clase en cada banda, y permite ver si dos clases son prácticamente iguales o se diferencian en alguna de las bandas incluidas en la clasificación, si bien sólo se logrará una apreciación cualitativa ya que el gráfico no mostrará la variabilidad de cada clase. Otra de ellas es el Scatter Plot o histograma bidimensional donde cada punto observado en su interior representa el valor de un píxel en una banda y en otra (cada eje es una banda). De esta forma podemos visualizar el total de la imagen o solo algunas de las clases generadas. Para este caso se están visualizando tres clases.

3

Esta herramienta permite ver la dispersión de las clases y evaluar si es necesario redefinir una clase, aunque sólo es aplicable en casos groseros en que una clase se confunde con otra, ya que permite analizar de a pares de bandas por vez. Comúnmente es utilizada mientras se seleccionan los sitios de entrenamiento. Una herramienta más objetiva es la Transformada Divergente que analiza la separabilidad de dos clases, con un índice que va de 0 a 2, donde 0 indica que las clases se encuentran totalmente superpuestas y 2 que están totalmente separadas. Esta herramienta es utilizada generalmente al finalizar la recolección de los sitios de entrenamiento, pero su resultado puede implicar que deben redefinirse uno o más sitios de entrenamiento. En el reporte que se muestra a continuación puede observarse que la clase agua tiene máxima separabilidad con todas las restantes clases, mientras que los valores más bajos se encuentran entre las subclases de una misma categoría, por ejemplo, Forestal1 y Forestal2 (1,018790). Una vez comprobada la exactitud de la definición de sitios de entrenamiento se está en condiciones de realizar la asignación de píxeles a una clase.

Selección del método de asignación de píxeles Los criterios más comunes de asignación de píxeles a una clase de dividen en paramétricos, si asume que la distribución de los niveles digitales de cada clase es normal, o no paramétricos, si asume que la distribución no es normal. Para ayudar a entender cada uno de los métodos se simplificará la clasificación al uso de dos banda (1 y 2) y se supondrá tener sólo tres clases (A, B y C). A continuación se muestra un histograma bidimensional donde cada punto de color forma parte de los píxeles de los sitios de entrenamiento de cada clase y el punto con recuadro negro representa un píxel a clasificar. Los puntos amarillos en el centro de cada clase representan el promedio de la clase:

4

Dentro de los métodos paramétricos se encuentra el de Paralelepípedos y el de Distancia Mínima, que a continuación se detalla: Clasificador por Paralelepípedos Este clasificador toma en cuenta el rango de valores en que se encuentra definida una clase, es decir que si un píxel cumple con la condición de estar dentro del rango de valores para cada banda es incorporado a la clase, por lo contrario quedaría sin clasificar.

En el gráfico se pueden deducir algunos problemas de este método: Por un lado el píxel a clasificar ha quedado fuera de toda clase, por lo tanto no será clasificado.

5

Por otro lado hay un área de confusión entre las clases A y B. Las áreas de superposición entre clases no pueden ser resultas por el método, por lo tanto tampoco serán clasificadas. Se debe tener especial cuidado en la selección de los sitios de entrenamiento, ya que un píxel incluido como muestra, que no sea de la categoría correspondiente, modificará los rangos de una clase y por ende el resultado de la clasificación. Además, si no todos los píxeles de una clase son incluidos en el muestreo pueden quedar sin clasificar alguno de ellos. Como ventajas del método puede remarcarse la sencillez y rapidez de procesado. Suele utilizarse también en casos que se necesita hacer una máscara, por ejemplo de la cobertura agua, que es una clase de por sí homogénea, ya que con sólo seleccionar los sitios de entrenamiento correspondientes a agua se obtendrá una clasificación rápida. Clasificador por Distancia Mínima La clasificación por Distancia Mínima más exacto que el método anterior y toma como parámetro de decisión la distancia que hay entre un píxel cualquiera y la media de cada clase. El cálculo de la distancia es análogo al el Teorema de Pitágoras (el cuadrado de la distancia es igual a la suma de los cuadrados de los catetos):

Una ventaja del método es que todos los píxeles serán incorporados en alguna de las clases. En este caso, el píxel en cuestión es incorporado a la clase más cercana, o sea, como clase C. La desventaja del método, es que al ser paramétrico, no toma en cuenta la variabilidad de cada clase y es propenso a cometer errores en este sentido. Hasta aquí hemos visto los dos métodos paramétricos más difundidos. A continuación se desarrollará el método de Máxima Probabilidad, el cual se clasifica como no paramétrico.

6

Clasificador por Máxima Probabilidad Este método mide la probabilidad de que un píxel pertenezca a una clase, y se vale del promedio y la desviación estándar de cada clase para el cálculo. En el gráfico pueden verse las elipses que representan los desvíos estándar de cada clase:

En este caso el píxel a clasificar entra en el segundo anillo de probabilidad de la Clase A, por lo tanto a ella es a quien tiene más probabilidad de pertenecer. En el caso en que un píxel quede incluido en el área de misma probabilidad de dos clases se debe resolver por un método paramétrico (mínima distancia, por ejemplo). El clasificador de Máxima Probabilidad es el más complejo y el que demanda mayor volumen de cálculo. Sin embargo, es el más empleado en teledetección, por su robustez y por ajustarse con más rigor a la disposición original de los datos. Si bien este método es el más ampliamente utilizado en Teledetección, en los últimos años han surgido software de clasificación (por ejemplo, e-Cognition) que funcionan a modo de “árbol de decisión”, donde se le suministra que condiciones debe cumplir un píxel para pertenecer a una clase, incorporando parámetros propios de interpretación visual como ser: forma, asociación y conectividad, tamaño, etc., además de nivel digital. También utilizan otras capas de información como pueden ser mapas temáticos (Mapa de uso, Mapa de suelos, etc.) o modelos digitales de terreno.

Evaluación de la clasificación

7

Una vez realizada la asignación de píxeles el resultado de la clasificación será una imagen de una banda en el cual el valor de cada píxel corresponderá al número de clase. Es decir que habrá una correspondencia entre un número y una clase. En el reporte de la clasificación se podrá observar alguno de los siguientes datos: Cantidad de píxeles en cada clase, con lo que se puede deducir la superficie ocupada por dichas clases (30 x 30 m Landsat = 0,09 ha)

Matriz de confusión

8

La Matriz de confusión se genera a partir del de los píxeles que se tomaron como muestras. Del conjunto de píxeles muestreados, la matriz compara como definió las clases el usuario (en las columnas) y como las encontró el clasificador (en las filas). Así, en la diagonal de la matriz se encuentran los aciertos, o sea, aquellos píxeles que tanto el clasificador como el usuario ubicaron en la misma clase. Los residuales de las filas son los errores por omisión mientras que los residuales de las columnas son los de comisión. O sea que, los errores por omisión son aquellos píxeles que incluidos como pertenecientes a una clase por el usuario el clasificador los encontró como otra clase. Por el contrario, los errores por comisión son aquellos píxeles que el clasificador encuentra perteneciente a una clase y que no fue definido de la misma manera por el usuario. La relación entre la suma de los aciertos y el total indica la fiabilidad de la clasificación, aunque más bien esta asociada a correcta definición de los sitios de entrenamiento. Algunos datos de fiabilidad son mostrados en el reporte, si bien cada software posee sus formatos. En el siguiente se muestran la fiabilidad promedio, fiabilidad global, y coeficiente kappa:

9

Para poder abordar un análisis de la confiabilidad de la clasificación, el mejor método es utilizando los resultados de la clasificación contra la información de terreno. Para ello en el trabajo de campo se debió recolectar información a tal fin, que no haya sido utilizada en los sitios de entrenamiento. Una metodología muy utilizada consta de distribuir puntos al azar sobre la imagen y sobre la clasificación, que serán corroborados por la información de campo y la experiencia del intérprete. Luego, de la relación entre los sitios bien clasificados y el total se pueden construir indicadores de fiabilidad como los ya mencionados. La clave en esta etapa es determinar de qué manera deben ser distribuidos los puntos (estratificada, sobre las clases de interés), a fin de dar con el resultado correcto de clasificación. Generalmente son aceptados valores de precisión del orden del 80%, aunque este valor dependerá del objetivo del trabajo. Preparación del mapa temático Generalmente, en una imagen clasificada se verán una gran cantidad de píxeles que, producto de los bordes de las categorías o de mezclas de las mismas, pueden encontrarse aislados o poco asociados a las categorías vecinas. Para mejorar visualmente este defecto suelen utilizarse filtros de moda con mascaras de 3 x 3 hasta 5 x 5, el cual interactivamente se analizará la mejor opción. Hay que tener en cuenta que un filtrado de media no tendría sentido aplicar ya que los valores de la matriz no corresponden a valores espectrales sino a un identificador de las categorías. A continuación se muestra la clasificación original y el resultado del filtrado con una matriz de 3 x 3 de Moda:

Para finalizar, al generar un mapa temático se debe tener en cuenta que el mismo debe contener datos anexos a la imagen clasificada, como ser vías de comunicación, localidades, cursos de agua, una grilla de coordenadas, leyendas, entre otros, con el objetivo de facilitar su lectura.

10