Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
R
La deteccin de zonas de inundacin es fundamental para la prevencin
de desastres, por este motivo en este trabajo se presenta una herramienta
computacional desarrollada en MATLAB que ofrece una alternativa a las
existentes en el mercado para la clasificacin supervisada de imgenes
SAR (Synthetic Aperture Radar) de zonas de inundacin. En particular se
usaron diferentes mtodos de clasificacin para seleccionar de acuerdo al
desempeo el mejor para el estudio de zonas de inundacin en Colombia.
Los datos de entrenamiento fueron generados con los resultados de las
segmentaciones Fuzzy- Clustering, K-means y Region-Growing sobre
imgenes SAR de zonas de inundacin. Los mtodos de clasificacin
implementados fueron un clasificador basado en el mtodo Bayesiano y
un clasificador basado en m quinas de vectores de soporte (SVM). Para
evaluar el desempeo de los clasificadores se utilizaron ndices como la
exactitud total, la exactitud dependiendo del usuario, el ndice Kappa
y R. De acuerdo a los resultados el clasificador basado en mquinas de
soporte presenta mayor exactitud; sin embargo, el clasificador bayesiano
se desempea mejor clasificando pixeles que corresponden a poblaciones,
aun con pocos datos de entrenamiento.
A
In order to prevent natural flood disasters it important to identify the flood
areas. In Colombia, there is space to develop automatic tools able to detect
and study flood areas. For this reason, in this work we propose a computa-
tional tool in MATLAB, able to detect and classify Colombias flood zones
in SAR imager. In particular, we used different classifiers, and according to
the performance we selected the best. The training database was generated
with the results of Fuzzy Clustering, K -means and Region -Growing seg-
mentations on flood zones in SAR imagery. We used two different classifiers:
the first one is a Bayes classifier, while the second one is a Support Vector
Machine (SVM). In order to evaluate the performance, we used indices
such as the overall accuracy, user accuracy and Kappa index. According to
the results, the SVM classifier presents better accuracy. However, the Bayes
classifier had better results classifying pixels corresponding to populations
even with little training data.
Keywords. SAR, Classification, Segmentation, flood areas imagery.
Esta informacin puede ser clasificada en tierra, las imgenes como por ejemplo: puntos de inte-
agua, poblaciones y otras clases de un sector geo- rs, bordes, contornos, regiones, etc. Para el caso
grfico. Estas imgenes originalmente poseen un de la imgenes SAR las tcnicas ms usadas son
ruido conocido como Speckle, el cual no permite las que estn enfocadas en caracterizar regiones.
una buena interpretacin visual o digital de la Fuzzy Clustering y K-means son tcnicas de iden-
imagen. Muchos algoritmos de segmentacin uti- tificacin no supervisada de patrones que buscan
lizan la informacin presente en cada pixel, por agrupar clases por su similitud, Region- Growing
esta razn las imgenes SAR deben ser mejoradas es una tcnica de segmentacin que toma en
a travs de filtros y muchas veces es necesario rea- cuenta la informacin de los pixeles vecinos
lizar procesos de fusin con otras imgenes de la para despus agruparlos. Si estos algoritmos son
misma zona provenientes de diferentes sensores implementados sobre imgenes SAR el resultado
con el fin de mejorar la calidad de la imagen. Para ser una agrupacin de pixeles dentro de la ima-
solucionar este inconveniente se han realizado gen que representa zonas homogneas dentro de
estudios como el de Gambini [1] quien en 2006 la misma. En 2007 Yu and Clausi [2], realizaron
creun modelo estadstico del ruido Speckle y un sistema para el anlisis de hielo marino sobre
posteriormente elaboro un mtodo para filtrarlo. imgenes SAR de zonas canadienses, los datos
Los programas informticos que existen hoy en fueron obtenidos del Servicio Canadiense de
da para el procesamiento de imgenes satelitales, Hielo Canadian Ice Service (CIS). El algoritmo
como por ejemplo ARGIS y ENVI-SAR, poseen de segmentacin se bas en la tcnica de creci-
herramientas de segmentacin y clasificacin de miento de regin (Region Growing), debido a que
imgenes, pero no se puede hacer una compara- esta guarda una buena segmentacin y produce
cin entre varias opciones para establecer cul es etiquetas semnticas de manera interactiva. El
el mejor mtodo de clasificacin, estos programas enfoque de este trabajo se llam Iterative Region
estn hechos para varios usos y no slo para el Growing using Semantics (IRGS) y fue evaluado
uso de imgenes SAR y menos de una sola rea por la interpretacin visual de varios expertos del
territorial. Otro problema que existe es que no CIS quienes concluyeron que esta tcnica es muy
hay un patrn universal para evaluar los clasifi- til en el anlisis del hielo marino, despus de
cadores y decidir cul es mejor para este tipo de haber aplicado este algoritmo sobre varios con-
imgenes, como tampoco existen muchos datos junto de datos. Por otro lado en 2010 Huan-Min
de entrenamiento para realizar las clasificacio- Luo et al. [3], implementaron los algoritmos de
nes supervisadas. El IDEAM puede acceder a Fuzzy Clustering y K-means para la segmentacin
imgenes satelitales de las zonas de inters, pero y posterior clasificacin de zonas de bosques en
no cuenta con un software desarrollado para el datos POLInSAR (Polarimetric Interferometric
estudio espacial y temporal de dichas zonas y de SAR), aprovechando la informacin Fsica y las
esta manera observar por separado los ros, tierra propiedades estticas de los datos polarimetricos
o poblacin. Un software que sea capaz de pro- e interferometricos. En 2012, Samanta and San-
porcionar informacin precisa acerca de la can- yal [4], realizaron segmentacin de imgenes
tidad de reas que el ro inunda en condiciones SAR, teniendo en cuenta las funciones de objeti-
de invierno o la cantidad de agua que desaparece vo de dos diferentes tcnicas de Fuzzy-Clustering
en caso de sequa; una herramienta con la cual se su resultado fue que la tcnica propuesta es efec-
pueda hacer simulaciones del comportamiento tiva a la hora de segmentar imgenes SAR. Este
histrico (temporal) de un ro para evaluar las mismo ao Yu and Clausi implementaron una
zonas ms aptas que permitan elaborar Planes de extensin al algoritmo Iterative Region Growing
Desarrollo Territorial (POT) acordes a mapas de with Semantics (IRGS) propuesto en [2] para
riesgo. la segmentacin y clasificacin no supervisada
de datos SAR [5]. Un trabajo que muestra la
. T importancia de las imgenes SAR en el estudio
de fenmenos fsicos es el presentado por Sae-
En la segmentacin de imgenes existen diferen- puloh et al. [6] quienes en 2012 realizaron una
tes tcnicas que buscan extraer caractersticas de aplicacin con base a la decisin bayesiana para
la clasificacin de datos polarimtricos Pi-SAR mos ya que esto permite evaluar por medio de
en la cual se extrajeron caractersticas geomorfo- comparaciones el comportamiento de los clasifi-
lgicas y estructurales de un volcn activo, ellos cadores. Con el objeto de establecer criterios de
exponen que la comprensin geomorfolgica y calidad en 2004 Dou et al. [11], implementaron
la distribucin de los materiales de la superficie un nuevo enfoque para la evaluacin de la preci-
de un volcn activo son cruciales para la ca- sin en la clasificacin de imgenes llamado R.
racterizacin de las erupciones y mitigacin de Los resultados obtenidos arrojaron un mtodo
riesgos volcnicos, citan que en el estudio de los nuevo y eficaz para la evaluacin de la eficiencia
volcanes los sensores remotos SAR son la nica en la clasificacin de imgenes. En comparacin
observacin y tecnologa til para el monitoreo con el ndice de kappa el cual slo puede reflejar
en cualquier condicin meteorolgica. Pal et al. la precisin total de la clasificacin el mtodo R
[7] en 2005, experimentaron sobre Landsat 7 permite evaluar la clasificacin por cada clase. En
ETM+ con datos hiperespectrales, los resulta- 2007 Liu et al. [12] realizaron una revisin y eva-
dos indicaron la superioridad de una SVM frente luacin comparativa sobre las medidas de pre-
los mtodos de Mxima probabilidad (maximun cisin de los clasificadores con el fin de ofrecer
likehood) y Backpropagation Artificial Neural varias alternativas para evaluar la clasificacin
Networks a la hora de que la dimensin de datos haciendo uso de la matriz de confusin.
de entrada aumenta y los conjuntos de datos de
entrenamiento decrecen. En el 2007, Tan et al. . S
[8] formularon una nueva tcnica que combin
SAR
la descomposicin de entropa y la clasificacin
por SVMs. Su enfoque fue probado en imge- La segmentacin busca extraer caractersticas
nes multi-temporales SAR para el monitoreo de de las imgenes como por ejemplo: puntos de
arroz y fue especialmente til cuando recogi in- inters, bordes, contornos, regiones, etc. Este
formacin polarimtrica por cada clase resultan- proceso divide la imagen en grupos de pixeles u
do una buena separacin entre clases. En 2009 objetos dando como resultado un conjunto de
Lardeux et al. [9], usaron SVMs para clasificar segmentos que cubren la imagen, o un conjunto
densidad tropical de vegetacin en imgenes de curvas de nivel extradas de la imagen. Dass
SAR, sus resultados mostraron precisiones 20 et al. [13]. La segmentacin se aplica a diversos
% ms altas que en los mtodos de clasificacin campos como por ejemplo: en procesos mdicos,
de Wishart. Ellos sealaron que una SVM imgenes diagnsticas, planeacin de trata-
puede realizar mejor aproximacin que la tpica mientos y estudios de anatoma, localizacin de
aproximacin de Wishart cuando el radar no carreteras, bosques, pueblos, agua, en imgenes
sigue una Distribucin de Wishart. En 2010 satelitales, entre otras aplicaciones que necesiten
Mladicih et al. [10], evaluaron tres paquetes identificar alguna caracterstica. Durante mu-
comerciales de software para la deteccin de chos aos se ha investigado sobre algoritmos para
objetos basada en la clasificacin binaria de reas segmentar imgenes pero no se tienen mtodos
perturbadas y no perturbadas sobre imgenes en universales y esto hace que sea un problema no
alta resolucin. El software ENVI fue uno de los resuelto, siendo un desafo vigente para estudio
tres evaluados y este incorporaba un algoritmo del procesamiento digital de imgenes.
ajustado desde la librera de Support Vector
Machine (LIBSVM). Los resultados en las tres . Regin Growing
herramientas fueron comparados con Definiens
Classification mostrando que las SVMs tienen Este mtodo fue desarrollado por Adamas and
alta consistencia comparadas con otros algo- Bischof en 1994 [14] y busca por medio de un
ritmos de clasificacin. Para la evaluacin de la criterio de similitud agrupar pixeles. El pro-
clasificacin muchas veces es necesario hacer ceso empieza con unos valores de intensidad
uso de la interpretacin visual, pero la correcta de pixel dentro de la imagen que son definidos
evaluacin de los mtodos de clasificacin es inicialmente, a estos valores se les conoce como
importante para el desarrollo de buenos algorit- semillas. La tcnica busca agrupar pixeles vecinos
a las semillas que cumplan con el criterio de simi- centroides converge. El algoritmo para k-means
litud determinado, este proceso de agrupacin se se resume de la siguiente manera:
realiza hasta que no se encuentre ms valores de
En conclusin el algoritmo de k-means, pretende
intensidad de pixel que cumplan con el criterio
minimizar la funcin de costo:
de similitud.
Algoritmo 2 K-means
Algoritmo 1. Region Growing
1. Seleccionar la ubicacin inicial de los k-cen-
1. Seleccionar las semillas dentro de la imagen. troides. Este paso es muy importante para la
2. Establecer el criterio de similitud. correcta agrupacin de los elementos, se pro-
3. Comprobar los pixeles cercanos a la semilla cura que cada centroide quede lo ms alejado
y determinar si cumplen con el criterio de uno del otro.
similitud. 2. Determinar la distancia de cada elemento
4. Si cumplen con el criterio estos pixeles se con respecto a cada k-centroide, asignadole la
agregan a la semilla formando as una nueva etiqueta del k- centroide de menos distancia.
semilla y se repite el paso 3. Si no cumple con la frmula para calcular las distancias es:
el criterio no se agrupan estos pixeles y se
termina el proceso. C (i) := mink ||x(i) uk ||2
(1)
5. Realizar los pasos 3 y 4 con todas las semillas (i)
Donde C es la etiqueta asignada a cada
definidas.
elemento x(i) correspondiente al k-centroide
con menor distancia, uk es la ubicacin de
. Clustering cada k-centroide, ||x(i) uk ||2 es la distancia
del elemento x(i) al clster uk .
En el procesamiento digital de imgenes la seg- 3. Cuando se tiene la asignacin total de etique-
mentacin por Clustering tiene como objetivo tas de los elementos a agrupar, se procede a
agrupar pixeles en Clusters o racimos. Estos m- calcular la nueva posicin de los k-centroides
todos son algoritmos interactivos en los cuales esto se realiza calculando el valor medio de
inicialmente se selecciona el nmero de Clusters los elementos agrupados a cada centroide por
(K ), y seguidamente el algoritmo de manera au- medio de la siguiente frmula:
1 X (i)
L
tnoma agrupa los datos dentro de las imgenes
entregando como resultado una imagen segmen- uk = x
L i=1 k
tada en colores, textura, intensidad o una mezcla (2)
de los anteriores Donde L es el nmero de elementos asigna-
dos a cada centroide k.
1) k-means: Este mtodo fue desarrollado por
MacQueen en 1967 [15]. Es uno de los mto- 4. Los pasos 2 y 3 se realizan hasta que el valor
de los k-centroides converge.
dos no supervisados para agrupar Clusters. Su
funcionamiento consiste en escoger en primera
instancia k-centroides de cada elemento a agru-
X
K X
m
(k)
par, la colocacin de estos centroides juegan un j= ||xi uk ||2
papel importante a la hora de tener una buena k=1 i=1
(3)
agrupacin. Despus de que se han colocado los
centroides se procede a calcular la distancia de Donde K = Nmero de Clusters y m = Nmero
cada elemento a cada centroide, etiquetando de elementos (pxeles).
el elemento con el centroide con el cual tiene 2) Fuzzy-Clustering: Conocido tambin como
menor distancia de separacin. Una vez se han Fuzzy- Clustering C-means (FCM), fue desarro-
asignado las etiquetas a todos los elementos se llado por Dunn en 1974 [16], y mejorado por
encuentra nuevamente la ubicacin de cada Bezdek en 1981 [17], busca agrupar los elemen-
centroide calculando la media de los valores tos por medio del grado de pertenencia de los
asignados al grupo del centroide. Los pasos an- elementos a cada clster. Este algoritmo busca
teriores se repiten hasta que la ubicacin de los minimizar la siguiente funcin de costo:
X
m X
K . Clasificador Bayesiano
jm = (uki )q ||xi ck ||2
i=1 k=1 Este mtodo se basa en el teorema de decisin de
(4)
Bayes el cual fue elaborado por Thomas Bayes en
Dnde uki es el grado de pertenencia de xi al
1763 y est definido como:
cluster ck, q es un exponente de ponderacin
para cada pertenencia difusa donde 1 q < , P (B|Ai )P (Ai )
m el nmero de elementos a segmentar, K es el P (Ai |B) =
P (B) (7)
nmero de clusters que debe ser 2 K < m. Yang
and Huang, 2007 [18]. Dnde: P (Ai |B) son las probabilidades a poste-
riori, P (B|Ai) es la probabilidad de B en la hip-
El grado de pertenencia uki es calculado de la
tesis Ai y P (Ai) son las probabilidades a priori.
siguiente manera: Una descripcin completa de cmo funciona el
1 clasificador bayesiano puede ser encontrada en
uki =
PK ||xi cj || q1
2
el libro de Pajares y de la Cruz, [19].
k=1 ||xi ck ||
(5)
El algoritmo para la clasificacin bayesiana que-
Donde cj es el valor del centro del clster, calcu- da definido de la siguiente manera:
lado de la siguiente manera:
1 Algoritmo 4 Clasificador Bayesiano
uki =
PK 2
||xi cj || q1
k=1
1. Definir el nmero de clases C de acuerdo a los
||xi ck ||
(6) vectores de entrenamiento que se tengan.
En resumen el algoritmo de Fuzzy-Clustering es: 2. Calcular la media de cada vector de entrena-
miento.
Algoritmo 3. Fuzzy-Clustering 3. Calcular la distancia de Mahalanobis de cada
elemento con respecto a la media de cada
1. Escoger los valores de K, q y el Criterio de vector de entrenamiento, y clasificar el ele-
terminacin E que vara entre 0 y 1. mento con respecto a la siguiente ecuacin:
2. Inicializar la matriz de particin difusa con:
X Ci , si d2E (X, mi ) < d2E (X, mj )
U(0), U = [uki]. i 6= j, i, j = 1, 2, . . . , c (8)
3. Por cada cluster se calcula el valor del centro,
C (k) = [cj] con U (k), usando la ecuacin 6. dnde
4. Actualizar U (k) ,U (k+1), ecuacin 5. d2E = ||x y||2 = (x y)T (x y) (9)
5. Verificar si ||U (k+1) U (k) || < E Si esto
es cierto el algoritmo termina de lo contrario
vuelve al paso 3.
. Clasificador basado en SVM
. C Las SVMs fueron desarrolladas por Cortes y
Vapnik en 1995 [20]. Fueron pensadas en un
principio para la clasificacin binaria. Estn
La clasificacin de imgenes se puede definir dentro de los clasificadores supervisados debido
como el proceso que busca identificar la clase a la a que requieren muestras de entrenamiento,
que pertenece cada pixel, objeto o regin dentro pero la literatura muestra que las SVMs no son
una imagen. La clasificacin puede ser supervi- relativamente sensibles al tamao de la muestra
sada y consiste en que se utilizan datos (firmas Mountrakis et al. 2011 [21]. Esta tcnica de clasi-
espectrales) ya identificados como muestras para ficacin busca separar las clases lo mejor posible
encontrar datos no identificados. La no super- aun si es necesario proyectar los datos en un es-
visada busca datos en una imagen sin datos de pacio diferente al original. Cuando los datos no
muestra es decir sin la ayuda de un experto o un son separables linealmente se realiza un cambio
estudio previo de la imagen. de espacio por medio de transformaciones no
!
X
f (x) = sgn i K(xi , xj ) + b
i
(10)
El algoritmo para la clasificacin por SVM es:
Datos de Referencia
Datos Clasificados
1 2 ... m Total
1 P11 P12 ... P1m P1+
2 P21 P22 ... P2m P2+
... ... ... ... ... ...
m Pm1 Pm2 ... Pmm Pm+
Total P+1 P+2 ... P+m N
En la actualidad existen muchos ndices que Es una razn entre el nmero de elementos co-
miden la eficiencia de los clasificadores, algunos rrectamente clasificados por clase y los elemen-
de estos correlacionados entre s, pero es dif- tos que pertenecen a esa categora, este ndice
cil labor decir cul de estos ndices es la mejor comprende valores entre 0 y 1, siendo 1 el mejor
manera de evaluar la clasificacin de imgenes valor posible. Si el resultado es 1 esto indica que
remotas. El trabajo de Liu and Kumar, 2007 [12] el mtodo aplicado clasifica bien los datos de
hace un resumen de diferentes mediadas para la referencia de esa categora.
evaluacin de los clasificadores, ellos exponen
en su trabajo que los ndices de Users Accuracy, . Overall Accuracy (OA):
Producers Accuracy y Overall Accuracy no de-
ben faltar a la hora de evaluar el desempeo de 1 X
m
. Kappa
Pm Pm
Pii i P+i Pi+
Kappa = i Pm (15)
1 i P+i Pi+
(a) Imagen
Original
Chang et al. [28], esta librera tiene dentro de . Configuracin del experimento
sus funciones la validacin cruzada herramienta
que se us para elegir los mejores parmetros (g Este proyecto us imgenes SAR de Colombia de
= gamma) y (c = costo), los cuales para este caso diciembre de 2010, poca de grandes inundacio-
nes, estas imgenes corresponden a la zona del
fueron de c = 4 y g = 1024. Con estos parme-
ro Magdalena bajo y fueron obtenidas del banco
tros la clasificacin co SVM logr una eficiencia
de imgenes del IDEAM y estn previamente
del 98.8 %; se utilizel Kernel RBF (Radial Basis
procesadas en cuanto al ruido Speckle. Todas
Funtion). En cuanto al clasificador bayesiano se
las imgenes usadas en este proyecto son de
us el programa que Pajares et al. [19] ofrece
polarizacin HH, con resolucin radiomtrica de
en su libro Ejercicios resueltos de Visin por
16 bits, resolucin espacial de 10 metros y son
Computador. Despus de que se garantiz que
provenientes del sensor remoto RADARSAT-2.
se contaba con una buena base de datos para el
entrenamiento y que ambos algoritmos de clasi-
ficacin estaban funcionando correctamente se 7. E
desarroll una GUI en MATLAB que permiti
evaluar los algoritmos de clasificacin imple- Se implementaron los algoritmos de clasificacin
mentados mediante los ndices de comparacin: propuestos en este trabajo sobre la imagen sint-
Producers Accuracy, Userss Accuracy, Ri por tica, cambiando para cada algoritmo el nmero
clase, Overall Accuracy (OA), Overall Error de datos de entrenamiento (10, 100, 500 y 1000).
(OE), Kappa, Mean Square Error (MSE) y R. Para mostrar los resultados de la clasificacin
se usaron tres colores: verde para la clase tierra,
. Creacin de la imagen de referencia azul para la clase agua y rojo para la clase pobla-
cin. Figura 8.
Para la evaluacin de los clasificadores fue nece-
En los cuadros 3 y 4 estn las matrices de confu-
sario crear una imagen de referencia de la cual
sin de cada clasificador para 1000 muestras, los
se pudiera conocer la clasificacin exacta de las
cuadros 5, 6 y 7 muestran los ndices de evalua-
clases dentro de la misma. Para su creacin se es- cin de cada clasificador con diferente nmero
cogieron aleatoriamente pixeles dentro de zonas de datos de entrenamiento. Los cuadros 5, 6 y 7
homogneas de las imgenes reales correspon- comparan los resultados de la clasificacin por
dientes a cada clase (agua, tierra y poblaciones). clase (agua, tierra y poblaciones) entre los dos
Cabe aclarar que en la clase tierra se encuentran
las firmas espectrales de los pixeles de suelos
expuestos, reas de pastizales, vegetacin ras-
trera y todo tipo de terreno que no corresponda
a las poblaciones (asfalto, edificios, carreteras,
etc.) El resultado fue una imagen de 128 x 128
(a)
(a) Esperado
Esperado
pixeles con tres zonas diferentes como se puede
observar en la Figura 7 donde: la parte superior
corresponde a agua, la intermedia a tierra y la
inferior a poblaciones.
(b)
(b)SVM(10)
SVM(10) (c)(c)
SVM(100)
SVM(100)(d) (d)
SVM(500) (e) (e)
SVM(500) SVM(1000)
SVM(1000)
Figura 7.
Imagen (f) Bay.(10) (g) Bay.(100) (h) Bay.(500) (i) Bay.(1000)
sinttica
Figura 8. Resultados clasificacin imagen sinttica
algoritmos, mientras que el cuadro 8 compara el y con la clase poblacin se puede observar una
resultado total de la evaluacin de los dos algo- tendencia a disminuir.
ritmos de clasificacin. Los siguientes resultados
En el cuadro 7 donde se ilustran los resultados
se obtuvieron al implementar los algoritmos de
de R por clase se puede observar que: con la
clasificacin propuestos en este trabajo usando
clase agua el ndice para el SVM es mayor que
MATLAB 2011b sobre un computador con sis- el del bayesiano pero se mantienen a medida de
tema operativo Windows 8, con un procesador que se aumentan los datos de entrenamiento,
AMD Athlon (tm) II Dual-core M320 a 2.10Ghz para el caso de la clase tierra este ndice aumen-
y 3 Gb de RAM. ta en el SVM pero se mantiene en el bayesiano y
Como se puede observar en el cuadro 8, el con la clase poblacin ambos ndices aumentan
algoritmo de SVM tiene una eficiencia menor a mayor nmero de muestras pero las SVM tie-
que el bayesiano cuando se usan pocos datos de nen mejores resultados.
entrenamiento, pero cuando se usa mayor n- Los resultados del cuadro 6 muestran que en el
mero datos de entrenamiento la eficiencia de al- caso de que se no se cuente con muchos datos
goritmo con SVM aumenta mientras que la del para el entrenamiento y que se buscara una buena
bayesiano empieza a disminuir. El ndice Kappa clasificacin de las poblaciones seria pertinente
el cual es una medida de concordancia entre usar el algoritmo bayesiano en vez del basado en
dos matrices, aumenta en el SVM a medida de vectores de soporte, cabe aclarar que lo anterior
que se usan ms datos para el entrenamiento y servira para aplicarlos a este caso de estudio, con
en el Bayesiano a partir de 1000 datos de entre- esta base de datos y las imgenes con las cuales se
namiento empieza a disminuir. El ndice R con trabajo en este proyecto.
10 datos para el entrenamiento es igual para
los dos algoritmos pero a medida de que se au-
mentan los datos de entrenamiento este ndice Cuadro 3. Matriz de confusin svm (1000 muestras)
empieza a subir para el SVM y a disminuir para Agua Tierra Pobla. Total
el algoritmo Bayesiano. En el cuadro 6 se puede Agua 5266 238 0 5504
observar que las SVM clasifican mejor la clase
Tierra 13 5418 73 5504
agua que el bayesiano, que ambos algoritmos
Pobla. 0 0 5376 5376
despus de 100 muestras no se equivocan cla-
Total 5279 5656 5449 16384
sificando poblaciones y que ambos tienen casi
una misma precisin de clasificacin de la clase
tierra. En el cuadro 5 se ilustran los resultados Cuadro 4. Matriz de confusin bayesiano
del PRODUCERS ACCURACY y se puede (1000 muestras)
evidenciar que: a medida de que se aumenta el Agua Tierra Pobla. Total
nmero de muestras la eficiencia del clasificar
Agua 5064 440 0 5504
los pixeles de referencia de la clase agua se man-
Tierra 2 5277 225 5504
tiene en las SVM y disminuye en el Bayesiano,
en la clase tierra se evidencia un crecimiento Pobla. 0 0 5376 5376
de este ndice por parte de los dos algoritmos Total 5066 5717 5601 16384
SVM Bayesiano
No. Muetras
Agua Tierra Pobla Agua Tierra Pobla.
10 99.79 86.888 98.794 100 87.465 98.148
100 99.96 92.947 98.914 100 91.591 96.43
500 99.79 95.12 98.642 99.96 92.741 95.982
1000 99.753 95.792 98.66 99.96 92.303 95.982
SVM Bayesiano
No. Muetras
Agua Tierra Pobla. Agua Tierra Pobla.
10 94.949 98.728 89.918 91.151 98.255 94.642
100 92.496 98.891 100 91.151 96.384 100
500 94.949 98.455 100 92.496 95.875 100
1000 95.67 98.437 100 92.005 95.875 100
8QLYHUVLGDG$QWRQLR1DULxR5HYLVWD)DFXOWDGHVGH,QJHQLHUtD
Jonathan Avendao Prez, Jaime Alberto Parra Plazas, Jhon Fredy Bayona
[12] C. Liu, P. Frazier, and L. Kumar, Comparative [21] G. Mountrakis, J. Im, and C. Ogole, Support vec-
assessment of the measures of thematic classifica- tor machines in remote sensing: A review, {ISPRS}
tion acuracy, Remote Sensing of En- vironment, pp. Journal of Photogrammetry and Remote Sensing, vol.
606616, 2007. 66, no. 3, pp. 247 259, 2011. [Online]. Available:
[13] R. Dass, Priyanka, and S. Devi, Image segmenta- http://www.sciencedirect.com/science/article/pii/
tion techniques, International Journal of Electronics S0924271610001140
& Communication Technology IJEC, vol. 3, no. 14, pp. [22] B. Schlkopf and A. J. Smola, Learning with Ker-
6670, March 2012. nels: Support Vector Machines, Regularization, Opti-
[14] R. Adams and L. Bischof, Seeded region mization, and Beyond. The MIT Press, 2001.
growing, Pattern Analysis and Machine Intelligence, [23] A. Gidudu, G. Hulley, and T. Marwala, Image
IEEE Transactions on, vol. 16, no. 6, pp. 641647, classification using svms: One-against-one vs one-
1994. against-all, CoRR, vol. abs/0711.2914, 2007.
[15] J. B. MacQueen, Some methods for classification
[24] M. Story and R. G. Congalton, Accuracy as-
and analysis of multivariate observations, in Proc. of
sessment - A users perspective, Photogrammetric
the fifth Berkeley Symposium on Mathematical Sta-
Engineering and Remote Sensing, vol. 52, no. 3,
tistics and Probability, L. M. L. Cam and J. Neyman,
pp. 397399, Mar. 1986. [Online]. Available: http://
Eds., vol. 1, Proc. of the fifth Berkeley Symposium on
www.asprs.org/publications/pers/scans/ 1986jour-
Mathematical Statistics and Probability. University of
nal/mar/1986 mar 397-399.pdf
California Press, 1967, pp. 281297.
[16] J. C. Dunn, A fuzzy relative of the ISODATA [25] J. Cohen, A Coefficient of Agreement for Nomi-
process and its use in detecting compact well-separa- nal Scales, Educatio- nal and Psychological Measure-
ted clusters, 1974. ment, vol. 20, no. 1, p. 37, 1960.
[17] J. C. Bezdek, Pattern recognition with fuzzy ob- [26] R. Congalton and R. A. Mead, A Quantitative
jective function algo- rithms, 1981. Method to Test for Consistency and Correctness
[18] Y. Yang and S. Huang, Image segmentation by in Photointerpretation, PHOTOGRAMMETRIC
fuzzy c-means clustering algorithm with a novel pe- ENGINEERING & REMOTE SENSING, vol. 49, no.
nalty term, COMPUTING AND INFORMATICS, vol. 1, pp. 6974, 1983. [Online]. Available: http://www.
26, no. 1, 2007. [Online]. Available: http://www.cai.sk/ citeulike.org/group/7074/article/6012274
ojs/index.php/cai/article/view/296 [27] J. R. Landis and G. G. Koch, The Measurement
[19] G. Pajares and J. M. de la Cruz Garcia, Ejercicios of Observer Agreement for Categorical Data, Biome-
resuletos de Vision por Computador. Mexico D.F., 221 trics, vol. 33, no. 1, pp. 159174, Mar. 1977.
Mexico: Alfaomega, 2008. [28] C.-C. Chang and C.-J. Lin, LIBSVM: A library for
[20] C. Cortes and V. Vapnik, Support-vector net- support vector machines, ACM Transactions on Inte-
works, Mach. Learn., vol. 20, no. 3, pp. 273297, lligent Systems and Technology, vol. 2, pp. 27:127:27,
Sep. 1995. [Online]. Available: http://dx.doi. 2011, software available at http://www.csie.ntu. edu.
org/10.1023/A:1022627411411 tw/cjlin/libsvm.