Sei sulla pagina 1di 10

Clasificacin Digital de Imgenes Satelitales

Editado por Marcos Angelini

El objetivo de una clasificacin consiste en agrupar los pxeles que posean una
misma caracterstica. Generalmente la caracterstica tomada es el valor digital de
los mismos, que se corresponder a un tipo de cobertura del terreno.
Bsicamente, la clasificacin digital de imgenes satelitales consiste en un
mtodo estadstico por el cual, a travs de un muestreo de pxeles, se agrupa en
categoras o clases al resto de los pxeles de una imagen.
Los mtodos de clasificacin pueden agruparse en:
Clasificacin Supervisada
Clasificacin No Supervisada
La clasificacin supervisada consiste en conocer a priori las categoras en las
cuales se quiere separar la imagen, y para ello se debe validar el muestreo de
pxeles con un trabajo de campo.
En cambio, en la clasificacin no supervisada no se conocen las clases a separar,
por lo tanto se debe determinar en cuantas clases se quiere separar la imagen y el
ordenador definir las clases. La labor posterior es identificar, con trabajo a campo,
a que cobertura pertenece cada clase. El problema de este mtodo es que no toma
en cuenta la variabilidad que tiene cada clase. Por ejemplo, la variabilidad espectral
de un pastizal natural en mucho mayor que la variabilidad de un cuerpo de agua
profundo y transparente.
En esta gua slo se desarrollar el mtodo de clasificacin supervisada, ya que
es el ms utilizado y exacto. No por ello debe descartarse el uso del resto de las
metodologas para casos puntuales.

Clasificacin Supervisada

El Proceso de clasificacin supervisada se puede separar en una serie de pasos:

Trabajo de Campo
Identificacin y seleccin de sitios de entrenamiento
Seleccin del mtodo de asignacin de pxeles
Evaluacin de la clasificacin
Preparacin del mapa temtico

Trabajo de Campo
Para la salida a campo debe procesarse la imagen a utilizar (con los mtodos
vistos en el apartado anterior) de manera de poder identificar las distintas
coberturas del terreno. La fecha de adquisicin de la imagen debe ser lo ms
cercana posible a la fecha de salida a campo, y a su ves, que las cobertura de
inters estn es su mayor expresin en la misma.

1
El objetivo del trabajo de campo es reconocer las distintas coberturas del rea
de estudio para luego poder identificarlas fehacientemente sobre la imagen.
Generalmente es conveniente disear el trabajo de campo de manera tal de
recorrer todas las coberturas observadas en la imagen. Cada punto visitado debe
caracterizarse con datos como tipo de cobertura, porcentaje de cobertura de suelo,
estado de la cobertura, fenologa (para cultivos) y todas aquellas caractersticas
que puedan modificar la respuesta espectral de la las mismas.
El nmero de sitios visitados debe ser suficientes como para que sean
representativos del nmero de coberturas y de la variabilidad de las mismas.

Identificacin y seleccin de sitios de entrenamiento

Esta etapa puede considerarse el punto crtico de una clasificacin ya que de la


correcta definicin de los sitios de entrenamiento depender el resultado de la
clasificacin, para lo cual debe contarse con buena informacin de campo.
Los sitios de entrenamiento son grupos de pxeles que representan a una clase o
categora, de los cuales se extraer datos como media aritmtica, desvo estndar,
rango, etc. Para seleccionarlos, dichos sitios, deben cumplir con los siguientes
requisitos:
Deben ser representativos de la clase
Deben ser lo ms homogneos posibles en cuanto a su valor espectral
En cuanto al primer requisito, la bibliografa indica que una clase no debera
estar definida por menos de 100 pxeles, aunque ello puede resultar insuficiente
cuando nos encontramos con clases con gran extensin y variabilidad. Vale decir
que el nmero de pxeles est en funcin de la variabilidad y la extensin de una
clase.
Para cumplir con el segundo tem, se deber generar ms de una categora en
aquellas clases con gran variabilidad. As, se tendr que, por ejemplo, que la clase
Maz puede estar definida por las clases Maz_1, Maz_2, Maz_3; en este caso
cada clase de Maz corresponde a distintos estadios fenolgicos del cultivo o
diferentes situaciones de campo que modifican la respuesta espectral, como ser un
cultivo enmalezado o inundado.
La siguiente figura muestra el proceso por el cual se obtienen los valores
estadsticos de un sitio de entrenamiento. Generalmente los software poseen
herramientas interactivas para seleccionar un rea sobre la imagen. Al encerrar un
grupo de pxeles se calcula las estadsticas para cada banda incluida en la proceso
(en el ejemplo son tres bandas). Por lo tanto cada clase tendr una media, desvo
estndar, etc. para cada banda.
En conocimiento de esta metodologa, se recolectarn los distintos sitios de
entrenamiento.
Una herramienta que suele encontrarse en los software con distintos nombres es
la de semillado (seeding), para PCI Geomatics, que permite hacer un clic sobre un
pxel y automticamente seleccionara los vecinos que tengan un valor espectral
dentro de un rango preestablecido. Esto permite seleccionar reas homogneas.

2
A continuacin se muestran las reas seleccionadas con la herramienta de
semillado:

Una vez recolectados los sitios de


entrenamiento debe evaluarse su precisin,
para lo que existen una serie de herramientas
visuales y estadsticas destinadas a tal fin.
La ms sencilla de todas es la firma espectral
de cada clase. Esta se confecciona con los
valores medios de cada clase en cada banda, y
permite ver si dos clases son prcticamente
iguales o se diferencian en alguna de las bandas
incluidas en la clasificacin, si bien slo se
lograr una apreciacin cualitativa ya que el
grfico no mostrar la variabilidad de cada
clase.
Otra de ellas es el Scatter Plot o histograma
bidimensional donde cada punto observado en
su interior representa el valor de un pxel en
una banda y en otra (cada eje es una banda).
De esta forma podemos visualizar el total de
la imagen o solo algunas de las clases
generadas. Para este caso se estn visualizando
tres clases.

3
Esta herramienta permite ver la dispersin de las clases y evaluar si es
necesario redefinir una clase, aunque slo es aplicable en casos groseros en que
una clase se confunde con otra, ya que permite analizar de a pares de bandas por
vez. Comnmente es utilizada mientras se seleccionan los sitios de entrenamiento.
Una herramienta ms objetiva es la Transformada Divergente que analiza la
separabilidad de dos clases, con un ndice que va de 0 a 2, donde 0 indica que las
clases se encuentran totalmente superpuestas y 2 que estn totalmente separadas.
Esta herramienta es utilizada generalmente al finalizar la recoleccin de los sitios de
entrenamiento, pero su resultado puede implicar que deben redefinirse uno o ms
sitios de entrenamiento.
En el reporte que se muestra a continuacin puede observarse que la clase agua
tiene mxima separabilidad con todas las restantes clases, mientras que los valores
ms bajos se encuentran entre las subclases de una misma categora, por ejemplo,
Forestal1 y Forestal2 (1,018790).
Una vez comprobada la exactitud de la definicin de sitios de entrenamiento se
est en condiciones de realizar la asignacin de pxeles a una clase.

Seleccin del mtodo de asignacin de pxeles

Los criterios ms comunes de asignacin de pxeles a una clase de dividen en


paramtricos, si asume que la distribucin de los niveles digitales de cada clase es
normal, o no paramtricos, si asume que la distribucin no es normal.
Para ayudar a entender cada uno de los mtodos se simplificar la clasificacin
al uso de dos banda (1 y 2) y se supondr tener slo tres clases (A, B y C). A
continuacin se muestra un histograma bidimensional donde cada punto de color
forma parte de los pxeles de los sitios de entrenamiento de cada clase y el punto
con recuadro negro representa un pxel a clasificar. Los puntos amarillos en el
centro de cada clase representan el promedio de la clase:

4
Dentro de los mtodos paramtricos se encuentra el de Paraleleppedos y el de
Distancia Mnima, que a continuacin se detalla:

Clasificador por Paraleleppedos


Este clasificador toma en cuenta el rango de valores en que se encuentra
definida una clase, es decir que si un pxel cumple con la condicin de estar dentro
del rango de valores para cada banda es incorporado a la clase, por lo contrario
quedara sin clasificar.

En el grfico se pueden deducir algunos problemas de este mtodo: Por un lado


el pxel a clasificar ha quedado fuera de toda clase, por lo tanto no ser clasificado.
5
Por otro lado hay un rea de confusin entre las clases A y B. Las reas de
superposicin entre clases no pueden ser resultas por el mtodo, por lo tanto
tampoco sern clasificadas. Se debe tener especial cuidado en la seleccin de los
sitios de entrenamiento, ya que un pxel incluido como muestra, que no sea de la
categora correspondiente, modificar los rangos de una clase y por ende el
resultado de la clasificacin. Adems, si no todos los pxeles de una clase son
incluidos en el muestreo pueden quedar sin clasificar alguno de ellos.
Como ventajas del mtodo puede remarcarse la sencillez y rapidez de
procesado. Suele utilizarse tambin en casos que se necesita hacer una mscara,
por ejemplo de la cobertura agua, que es una clase de por s homognea, ya que
con slo seleccionar los sitios de entrenamiento correspondientes a agua se
obtendr una clasificacin rpida.

Clasificador por Distancia Mnima


La clasificacin por Distancia Mnima ms exacto que el mtodo anterior y toma
como parmetro de decisin la distancia que hay entre un pxel cualquiera y la
media de cada clase. El clculo de la distancia es anlogo al el Teorema de
Pitgoras (el cuadrado de la distancia es igual a la suma de los cuadrados de los
catetos):

Una ventaja del mtodo es que todos los pxeles sern incorporados en alguna
de las clases. En este caso, el pxel en cuestin es incorporado a la clase ms
cercana, o sea, como clase C.
La desventaja del mtodo, es que al ser paramtrico, no toma en cuenta la
variabilidad de cada clase y es propenso a cometer errores en este sentido.

Hasta aqu hemos visto los dos mtodos paramtricos ms difundidos. A


continuacin se desarrollar el mtodo de Mxima Probabilidad, el cual se clasifica
como no paramtrico.

6
Clasificador por Mxima Probabilidad
Este mtodo mide la probabilidad de que un pxel pertenezca a una clase, y se
vale del promedio y la desviacin estndar de cada clase para el clculo.
En el grfico pueden verse las elipses que representan los desvos estndar de
cada clase:

En este caso el pxel a clasificar entra en el segundo anillo de probabilidad de la


Clase A, por lo tanto a ella es a quien tiene ms probabilidad de pertenecer.
En el caso en que un pxel quede incluido en el rea de misma probabilidad de
dos clases se debe resolver por un mtodo paramtrico (mnima distancia, por
ejemplo).
El clasificador de Mxima Probabilidad es el ms complejo y el que demanda
mayor volumen de clculo. Sin embargo, es el ms empleado en teledeteccin, por
su robustez y por ajustarse con ms rigor a la disposicin original de los datos.
Si bien este mtodo es el ms ampliamente utilizado en Teledeteccin, en los
ltimos aos han surgido software de clasificacin (por ejemplo, e-Cognition) que
funcionan a modo de rbol de decisin, donde se le suministra que condiciones
debe cumplir un pxel para pertenecer a una clase, incorporando parmetros
propios de interpretacin visual como ser: forma, asociacin y conectividad,
tamao, etc., adems de nivel digital. Tambin utilizan otras capas de informacin
como pueden ser mapas temticos (Mapa de uso, Mapa de suelos, etc.) o modelos
digitales de terreno.

Evaluacin de la clasificacin

7
Una vez realizada la asignacin de pxeles el resultado de la clasificacin ser
una imagen de una banda en el cual el valor de cada pxel corresponder al nmero
de clase. Es decir que habr una correspondencia entre un nmero y una clase.
En el reporte de la clasificacin se podr observar alguno de los siguientes
datos:
Cantidad de pxeles en cada clase, con lo que se puede deducir la superficie
ocupada por dichas clases (30 x 30 m Landsat = 0,09 ha)

Matriz de confusin

8
La Matriz de confusin se genera a partir del de los pxeles que se tomaron
como muestras. Del conjunto de pxeles muestreados, la matriz compara como
defini las clases el usuario (en las columnas) y como las encontr el clasificador
(en las filas). As, en la diagonal de la matriz se encuentran los aciertos, o sea,
aquellos pxeles que tanto el clasificador como el usuario ubicaron en la misma
clase. Los residuales de las filas son los errores por omisin mientras que los
residuales de las columnas son los de comisin. O sea que, los errores por omisin
son aquellos pxeles que incluidos como pertenecientes a una clase por el usuario el
clasificador los encontr como otra clase. Por el contrario, los errores por comisin
son aquellos pxeles que el clasificador encuentra perteneciente a una clase y que
no fue definido de la misma manera por el usuario.
La relacin entre la suma de los aciertos y el total indica la fiabilidad de la
clasificacin, aunque ms bien esta asociada a correcta definicin de los sitios de
entrenamiento.
Algunos datos de fiabilidad son mostrados en el reporte, si bien cada software
posee sus formatos. En el siguiente se muestran la fiabilidad promedio, fiabilidad
global, y coeficiente kappa:

9
Para poder abordar un anlisis de la confiabilidad de la clasificacin, el mejor
mtodo es utilizando los resultados de la clasificacin contra la informacin de
terreno. Para ello en el trabajo de campo se debi recolectar informacin a tal fin,
que no haya sido utilizada en los sitios de entrenamiento.
Una metodologa muy utilizada consta de distribuir puntos al azar sobre la
imagen y sobre la clasificacin, que sern corroborados por la informacin de
campo y la experiencia del intrprete. Luego, de la relacin entre los sitios bien
clasificados y el total se pueden construir indicadores de fiabilidad como los ya
mencionados.
La clave en esta etapa es determinar de qu manera deben ser distribuidos los
puntos (estratificada, sobre las clases de inters), a fin de dar con el resultado
correcto de clasificacin. Generalmente son aceptados valores de precisin del
orden del 80%, aunque este valor depender del objetivo del trabajo.

Preparacin del mapa temtico


Generalmente, en una imagen clasificada se vern una gran cantidad de pxeles
que, producto de los bordes de las categoras o de mezclas de las mismas, pueden
encontrarse aislados o poco asociados a las categoras vecinas. Para mejorar
visualmente este defecto suelen utilizarse filtros de moda con mascaras de 3 x 3
hasta 5 x 5, el cual interactivamente se analizar la mejor opcin. Hay que tener en
cuenta que un filtrado de media no tendra sentido aplicar ya que los valores de la
matriz no corresponden a valores espectrales sino a un identificador de las
categoras. A continuacin se muestra la clasificacin original y el resultado del
filtrado con una matriz de 3 x 3 de Moda:

Para finalizar, al generar un mapa temtico se debe tener en cuenta que el


mismo debe contener datos anexos a la imagen clasificada, como ser vas de
comunicacin, localidades, cursos de agua, una grilla de coordenadas, leyendas,
entre otros, con el objetivo de facilitar su lectura.

10

Potrebbero piacerti anche