Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Resumen: Sentinel-2 (S2) es un nuevo satlite de la ESA que cuenta con 13bandas proporcionando imgenes de alta
calidad radiomtrica y excelente resolucin espacial (10y 20m) ideal para trabajos de clasificacin. En este trabajo
se han abordado dos objetivos: determinar el mejor mtodo de clasificacin con S2, y cuantificar su mejora respecto
a otras misiones operativas, como SPOT. Para ello se han seleccionado cuatro clasificadores (LDA, RF, rboles de
decisin, K-NN) que se han aplicado en dos zonas agrarias: una en la huerta de Valencia (Espaa) y otra en la regin
de Buenos Aires (Argentina). Se han probado todos los clasificadores usando, por una parte, todas las bandas de S2,
y por otra usando slo las cuatro que coinciden con SPOT. En todos los casos se han aplicando porcentajes entre el
10y el 50% de datos de entrenamiento y usado el resto de datos como validacin. Como resultado se ha generado
un mapa de usos del suelo a partir del mejor clasificador, basndose en el ndice Kappa, proporcionando informacin
cientficamente relevante como es el rea ocupada por cada una de las clases.
Palabras clave: clasificacin, teledeteccin, usos del suelo, ndice Kappa, Sentinel-2.
To cite this article: Borrs, J., Delegido, J., Pezzola, A., Pereira, M., Morassi, G., Camps-Valls, G. 2017. Land use classification from Sentinel-2
imagery. Revista de Teledeteccin, 48, 55-66. https://doi.org/10.4995/raet.2017.7133
*
Autor para la correspondencia: Juboher@alumni.uv.es
Attribution-NonCommercial-NoDerivatives 4,0 International (CC BY-NC-ND 4,0) 55
Borrs et al.
un indicador biofsico que describe los materiales El primer objetivo del presente trabajo es
que cubren el territorio, como por ejemplo, asfal- cuantificar la mejora en las clasificaciones con
to, vegetacin, suelo desnudo, agua, etc. S2respecto a otras misiones como SPOT, aplican-
do diferentes mtodos con diferentes porcentajes
Segn Comber etal. (2005), la cobertura del suelo
de entrenamiento. El segundo objetivo es estudiar
es entendida de forma diferente segn las discipli-
qu clasificador automtico es mejor para cla-
nas cientficas. Los eclogos definen la cobertura
sificar las imgenes de S2, individualmente y
del suelo segn la presencia y abundancia de espe-
combinando todos los clasificadores, para calcular
cies vegetales, mientras que para los edaflogos es
un indicador de la composicin y los tipos de sue- la cantidad de cada cultivo que existe en una zona.
los. Por otra parte, en la bibliografa en castellano Usaremos para ello datos de campo e imgenes
existe el trmino ocupacin del suelo que segn de dos zonas agrarias diferentes: una en la huerta
Lpez Gonzlez etal. (2002) hace referencia a cercana a Valencia (Espaa), y otra en una zona
la cobertura, entendida como los materiales que agraria del sur de Argentina.
cubren el territorio, mientras que otros autores la
consideran como una combinacin de los concep- 2.Mtodos
tos de uso y cobertura (Del Bosque etal., 2005).
Es muy habitual la utilizacin conjunta de los En primer lugar mostraremos las diferentes tcni-
trminos uso y cobertura, ya que, en funcin del cas de clasificacin de imgenes seleccionadas y
objetivo final de la cartografa, se definen leyendas posteriormente los indicadores de calidad usados
donde coexisten clases que corresponden a usos en este trabajo.
con otras que corresponden a coberturas.
A lo largo de los ltimos aos ha aumentado el
2.1.Tcnicas de clasificacin
inters y la necesidad de disponer de una infor- La clasificacin supervisada parte de un grupo de
macin de usos y coberturas del territorio fiable elementos pertenecientes a la imagen, conocidos
y actualizada, siendo numerosos los proyectos de como reas de entrenamiento, de los que se co-
carcter local, nacional e internacional cuyo ob- noce con un nivel de exactitud alto la clase a la
jetivo es la creacin y actualizacin de bases de que pertenecen. La clasificacin del conjunto de la
datos de usos y ocupacin del suelo. imagen es el proceso por el que a cada elemento
Los procedimientos metodolgicos para llevar contenido en la imagen se le asigna una categora,
a cabo estas tareas requieren un alto grado de basndose en los atributos contenidos en las reas
intervencin humana, ya que estn basados casi de entrenamiento. La clasificacin supervisada
ntegramente en la fotointerpretacin de imge- fuerza el resultado para que se corresponda con
nes, o su comparacin con otras imgenes u otra coberturas del suelo definidas por el usuario, y
base de datos. Sin embargo las recientes mejoras por tanto, de su inters, pero no garantiza que las
en la calidad de los sensores, tanto aerotransporta- clases sean separables desde el punto de vista es-
dos como espaciales, han supuesto un incremento tadstico (Rees, 2005).
significativo en la disponibilidad de imgenes de Debido al inters de la clasificacin, se han de-
alta resolucin. sarrollado un elevado nmero de clasificadores
Entre las nuevas misiones satelitales destaca automticos que pueden ser divididos en cuatro
Sentinel-2(S2). El lanzamiento del primer satlite grupos (Hastie etal., 2009). En este trabajo se ha
S2en 2015por la ESA (European Space Agency) elegido un clasificador de cada grupo, seleccionan-
ha despertado un gran inters en la comunidad do los ms utilizados: un clasificador paramtrico
cientfica debido a sus mltiples aplicaciones, pues lineal, un clasificador no paramtrico que organiza
su alta resolucin espacial, temporal, espectral de forma jerrquica el conjunto de decisiones,
y radiomtrica, as como la distribucin gratuita un clasificador no paramtrico que depende de
de los datos adquiridos abren una nueva era en la los vecinos ms cercanos y un clasificador no
observacin de la Tierra (ESA, 2015), mejorando paramtrico basado en rboles de decisin. En
las misiones operativas actuales, como pueden ser concreto los mtodos seleccionados son LDA
Landsat o SPOT. (Linear Discriminant Analysis) (Camps-Valls
etal., 2008), TREE (rbol de decisin) (Breiman, una condicin elegida en el conjunto de atributos
1984), K-NN (Camps-Valls, 2016), y RF (Random y cada ramificacin de un nodo interno representa
Forest) (Breiman, 2001). un valor del dominio de la condicin del atributo.
Los nodos terminales u hojas contienen una nica
LDA o Linear Discriminant Analysis es una
etiqueta, que corresponde, en este caso, a la cu-
tcnica de clasificacin basada en el aprendizaje
bierta del suelo. Desde la raz del rbol hasta una
supervisado. La idea central de LDA es obtener una
determinada hoja, el camino conforma una regla
proyeccin de los datos entrantes, con el fin de que
de clasificacin (Rodrguez-Galiano etal., 2012).
la separabilidad de las clases sea la mayor posible.
Si el objetivo final es un resultado de clasificacin
Cuando las clases estn bien separadas, las esti-
tomando valores desde 1hasta las k clases, los
maciones de parmetros de modelos de regresin
nicos cambios necesarios en el algoritmo del
logstica son sorprendentemente inestables, en
rbol pertenecen a los criterios para seleccionar
cambio el LDA no sufre de este problema (James
nodos (Hastie etal., 2009). Los rboles de deci-
etal., 2015). Es una tcnica supervisada ya que
sin predicen que cada observacin pertenece a
para poder buscar esa proyeccin se debe entrenar
la clase de entrenamiento ms frecuente en dicha
el sistema con patrones etiquetados (Camps-Valls
regin de observaciones (James etal., 2015).
etal., 2008). El modelo de anlisis discriminan-
te utiliza un algoritmo que busca funciones o El algoritmo de los k vecinos ms prximos (K-
vectores discriminantes, esto es, combinaciones NN) es un mtodo no paramtrico en clasificacin
lineales o cuadrticas de las variables originales y regresin. Estima la clase de un individuo (pxel,
que maximizan la varianza de las distribuciones parcela, etc.) en funcin de los k vecinos ms
entre clases a la vez que minimizan las varianzas cercanos mediante un sistema de seleccin, donde
inter-clases. Una vez determinada la funcin la mayora determina la clase, es decir, cada ele-
discriminante es posible establecer fronteras ex- mento de entrenamiento tiene una etiqueta de clase
plcitas que separan las regiones del espacio que asociada, y la clasificacin de un punto depender
pertenecen a cada categora, mediante una recta, del elemento de entrenamiento que tenga ms
o un plano o hiperplano, donde se igualan las cercano. El ms cercano es generalmente definido
probabilidades de pertenencia a una u otra clase. por la distancia Eucldea en el espacio de caracte-
Esta lnea recta o plano es ortogonal a la funcin rsticas, despus de que cada caracterstica se haya
discriminante encontrada. LDA es un clasificador normalizado para tener la media 0 y la varianza
con un buen historial de proyectos debido a que 1en el dato de entrenamiento, ya que es posible
los datos slo pueden soportar lmites de decisin que tengan diferentes unidades. Adems la distan-
simples, tales como lineal o cuadrtico, y las esti- cia Eucldea es apropiada para las caractersticas
maciones proporcionadas a travs de los modelos cuantitativas. El modelo K-NN est basado en la
gaussianos son estables (Hastie etal., 2009). memoria, y no requiere ningn otro modelo para
estar entrenado. A pesar de su simplicidad, K-NN
Los rboles de decisin (TREE) son mtodos no
suele ser exitoso cuando cada clase tiene muchos
paramtricos en clasificacin. Un rbol representa
elementos de entrenamiento y el lmite de decisin
un conjunto de condiciones que se organizan de
es muy irregular (Hastie etal., 2009).
forma jerrquica, y que se aplican sucesivamente
desde una raz hasta llegar a un nodo terminal u El algoritmo Random Forest (RF) que fue pro-
hoja del rbol (Breiman, 1984; Quinlan, 1993). puesto por Breiman (2001), construye una gran
Los rboles de decisin se representan mediante coleccin de rboles des-correlacionados, y lue-
un grfico con estructura arbrea que ha sido indu- go los promedia. Segn James etal. (2015), los
cido desde un conjunto de datos de entrenamiento. Random Forest proporcionan una mejora respecto
Todo rbol de decisin comienza con un nodo a los rboles de decisin por el hecho de construir
al que pertenecen todos los casos de la muestra estos rboles des-correlacionados. Se trata de un
que se quiere clasificar. A este nodo se le deno- algoritmo no paramtrico de aprendizaje autom-
mina raz. Adems del nodo o raz, en un rbol tico ampliamente utilizado, que genera y combina
de decisin pueden distinguirse nodos internos un conjunto de rboles de decisin, donde cada
y nodos terminales, que tambin se denominan uno se genera usando un subconjunto de elemen-
hojas. Los nodos internos se corresponden con tos de entrenamiento diferente en cada iteracin,
y los nodos se dividen utilizando la mejor de las La matriz de confusin, tambin llamada tabla
variables de una muestra aleatoria de estas. La de contingencias, consta de una tabla de doble
clase de salida se obtiene como la seleccin de entrada, que confronta los valores reales o verdad-
la mayora de las salidas de un gran nmero de terreno con los resultados de la clasificacin. La
rboles individuales (Breiman, 2001), es decir, diagonal de la matriz nos muestra la cantidad de
cada rbol ha votado la clase que consideraba, y pxeles reales y de la clasificacin que coinciden
luego se ha clasificado usando el voto de la mayo- por categora, mientras que los restantes, nos
ra (Hastie etal., 2009). El algoritmo produce una vienen a decir aquellos que se confunden con
estimacin objetiva interna de la generalizacin de otras categoras. Es decir, en sentido vertical se
error, utilizando las llamadas out-of-bag, el cual representa el porcentaje de pxeles reales que se
es un mtodo para medir el error de prediccin confundieron en la verdad-terreno, y en sentido
de los Random Forest cuando existen muestras horizontal el porcentaje de pxeles despus de la
que no estn incluidas en el subconjunto de en- clasificacin que se han confundido.
trenamiento. El muestreo aleatorio conduce a una Como medida de precisin, se ha utilizado el
mayor estabilidad y una mejor exactitud de la cla- ndice Kappa, propuesto por Cohen (1960). El
sificacin en comparacin con un enfoque nico ndice Kappa se usa para evaluar la concordancia
de un rbol de decisin. Este clasificador tambin de mtodos cuyo resultado es categrico, con dos
es relativamente insensible a la cantidad de datos o ms clases. Este ndice representa la proporcin
de entrada y multicolinealidad de los datos (Hastie de acuerdos observados respecto del mximo
etal., 2009). RF se ha aplicado con xito en varios acuerdo posible ms all del azar. En la interpre-
problemas de regresin y clasificacin de los datos tacin del ndice Kappa hay que tener en cuenta
de observacin de la Tierra y en general logra bue- que el ndice depende del acuerdo observado, pero
nos resultados (Gislason etal., 2006). tambin de la prevalencia del carcter estudiado y
Inicialmente se puede suponer que los cuatro de la simetra de los totales marginales (Abraira,
algoritmos seleccionados sern bastante precisos 2001).
y de su aplicacin se obtendrn resultados acep- Para cuantificar la mejora de S2respecto a SPOT,
tables. Pero adems, en este trabajo se pretende calcularemos el ndice Kappa con todas las bandas
demostrar que ningn algoritmo de clasificacin de S2y con las de SPOT, usando diferentes por-
independiente es el ptimo y que es posible obte- centajes de entrenamiento (10, 20, 30, 40y 50%
ner mejores resultados por la combinacin de dos de datos para entrenamiento y el resto de valida-
o ms algoritmos. La combinacin de clasifica- cin). La divisin entre datos de entrenamiento y
dores se realiz mediante mximo voto (es decir, validacin se realiza al azar. Para cada porcentaje
cada pxel es clasificado con todos los mtodos se han aplicado los cuatro clasificadores, y la
y al final se asigna a la clase que ms veces se combinacin de ellos. Adems calcularemos el in-
repite) por resultar muy sencilla de implementar y tervalo de confianza para un nivel de significacin
robusta en general. del 95%, para determinar cmo la mejora obtenida
es estadsticamente significativa.
2.2.Indicadores de calidad de los
clasificadores 3.Datos
Un tema clave es la evaluacin de fiabilidad de Los datos de los que se parte en este trabajo son
los procedimientos empleados y su calidad en los por una parte los datos de campo, obtenidos de la
resultados finales. La calidad final de un mtodo informacin sobre el terreno de las dos zonas en
de clasificacin o de combinacin de clasificado- estudio, y por otra parte las imgenes de telede-
res, se puede extraer a partir de un coeficiente de teccin de S2.
precisin, de forma que se otorga mayor confianza
a aquel clasificador que haya demostrado mayor 3.1.Datos de campo
acierto. En este trabajo usaremos la matriz de con-
fusin y derivaremos distintos ndices de calidad Las dos zonas en estudio son dos reas distantes
a partir de ella. entre s, una situada en el continente europeo y la
otra en el americano. La primera corresponde a la requiriendo un buen sistema de drenaje para evitar
zona de huerta ubicada entre Valencia, Burjassot, los problemas de salinidad originados por la des-
Moncada y Alboraia, situada en la zona norte del embocadura del Ro Curac sobre el Ro Colorado.
rea metropolitana de Valencia (Espaa), en la El aporte de sales de esta agua al Colorado es una
comarca de lHorta Nord (Figura1). enorme preocupacin para el Valle Bonaerense
del Ro Colorado. El principal cultivo de esta zona
La superficie es casi llana y se encuentra a unos
es la cebolla, complementado con girasol, maz y
50m de altitud sobre el nivel del mar. Como toda
alfalfa, entre otros cultivos (Pezzola, 2014).
la comarca, posee un clima mediterrneo. En ella
se cultivan principalmente ctricos y hortalizas. En la zona de estudio de la huerta de Valencia,
En cada parcela se pueden obtener 2o 3cosechas se tomaron los datos los das 1y 2de Mayo de
al ao de diferentes cultivos, por lo que en cada 2016, coincidiendo con una imagen de S2des-
poca del ao se observan diferentes especies pejada de la zona (del 1 de Mayo). Para el
vegetales. Con una extensa red de acequias cons- trabajo se seleccionaron y etiquetaron 14 clases
truidas en el periodo islmico, se canaliza el agua con un total de 91parcelas con diferentes culti-
del ro Turia para llevar a cabo el regado que se vos o suelos: 2 parcelas de suelo abandonado,
realiza por inundacin. Las parcelas suelen tener 11parcelas de suelo desnudo, 4parcelas de
entre 50y 100m aproximadamente de lado. alfalfa (Medicago sativa), 9parcelas de asfalto,
11 parcelas de cauce seco, 6 parcelas de cebolla
La segunda rea de estudio se corresponde al
(Allium cepa), 1parcela de coles (Brassica ole-
Valle Bonaerense del Ro Colorado (VBRC), en
racea), 3parcelas de lechuga (Lactuca sativa L.),
Argentina. La regin se ubica al sudoeste de la
9parcelas de naranjo (Citrus sinensis), 1parcela
provincia de Buenos Aires sobre los partidos de
de palmeras (Phoenix roebelenii), 13parcelas de
Villarino y Patagones (Figura2). Est formada por
las localidades de Pedro Luro, Hilario Ascasubi,
Villalonga, Juan A. Pradere y Mayor Buratovich.
Se encuentra ubicada aproximadamente a 100km
al sur de la ciudad de Baha Blanca y a 800km de
la Capital Federal, Buenos Aires.
El VBRC tiene un clima semirido estepario
templado. Los suelos son muy variados con
predominio de los suelos arenosos que permiten
el desarrollo de una amplia gama de cultivos,
Figura 1. Mapa de ubicacin de la huerta de Burjassot, Figura 2. Mapa de ubicacin del VBRC, Buenos Aires,
Valncia. Argentina.
patata (Solanum tuberosum), 9parcelas de cons- ESA. Este programa fue diseado para suministrar
trucciones, 3parcelas de viveros y 9parcelas de informacin actualizada y de fcil acceso para me-
alcachofa (Cynara scolymus). En cada una de las jorar la gestin del medio ambiente, y comprender
91parcelas se ha tomado un ROI (region of inter- y mitigar los efectos del cambio climtico. El
est) de entre 12y 16pxeles centrales, de manera programa tiene planificadas cinco misiones y cada
que se dispone al final de 1387pxeles como base una est conformada por varios satlites.
de datos de entrenamiento y validacin.
La misin S2se basa en una constelacin de dos
En el estudio del Valle Bonaerense del Ro satlites. El primero, S2A, fue lanzado el 23 de
Colorado, la toma de los datos se realiz en el mes junio de 2015. El S2B fue lanzado el 7de marzo
de Marzo los das 2y 17. En la campaa argen- de 2017. El par de satlites S2entregar datos de
tina fueron seleccionadas y etiquetadas 11clases todas las superficies de la Tierra con un tiempo
con un total de 190parcelas con diferentes cul- efectivo de revisita en el Ecuador de cinco das.
tivos o suelos: 41parcelas de agua, 9parcelas de
S2proporciona datos para la generacin de pro-
viveros, 13 parcelas de caminos, 14 parcelas de
ductos tales como: mapas de usos del suelo, mapas
construcciones, 17parcelas de pasto natural (hier-
de cambios a lo largo del tiempo, mapas de riesgo,
ba), 16 parcelas de maz (Zea mays), 3 parcelas
e imgenes rpidas para prevencin de desastres.
de girasoles (Helianthus annuus), 23parcelas de
Tambin proporciona datos para la generacin
cebolla (Allium cepa), 17 parcelas sin cultivo,
de variables biofsicas de la vegetacin como la
23parcelas de alfalfa (Medicago sativa), y 14par-
cobertura vegetal, el contenido de clorofila o el
celas de agropiro (Thinopyrum ponticum). La
contenido de agua en las hojas. Este satlite cuen-
imagen S2 usada para clasificar los cultivos fue
ta con un instrumento de captura multiespectral
seleccionada el 16de Enero, pues en esa poca
mejorando los datos de otras misiones operativas
los cultivos se encontraban en pleno desarrollo.
(Drusch etal., 2012).
En cada una de las 190parcelas se ha tomado un
ROI de entre 20 y 50 pxeles centrales, pues las El instrumento multiespectral (MSI) a bordo de
parcelas son mucho ms grandes que en la huerta S2 cuenta con 13 bandas espectrales, las cua-
de Valencia, de manera que se dispone al final de les van desde el espectro visible y el infrarrojo
8032pxeles como base de datos de entrenamiento cercano (NIR), hasta el infrarrojo de onda corta
y validacin. (SWIR). Entre ellas hay cuatro bandas de 10 m
(tres del visible y una del NIR), seis bandas de
En las dos reas de estudio se han usado los datos
20 m, y tres bandas de 60 m de resolucin para
de campo como datos de entrenamiento y valida-
correccin atmosfrica y deteccin de nubes.
cin, realizando las particiones de entrenamiento
y validacin-test mediante asignacin aleatoria de S2incorpora tres nuevas bandas en la regin del
los pxeles. El hecho de que el nmero de pxeles red-edge que mejora la configuracin del sensor
de cada base de datos sea superior a 1200asegura para estudios de aguas y vegetacin (Delegido
que al dividirlos aleatoriamente en dos grupos ten- etal., 2011). Aunque est previsto que S2pro-
gamos pxeles de las distintas clases distribuidos porcione productos de alto nivel (Nivel 2b/3),
por toda la zona. Sin embargo, solo en el rea de actualmente los datos S2 disponibles son un
la huerta de Burjassot-Valencia se hizo el estudio producto de radiancia TOA formado por un con-
comparando los cuatro mtodos y cuantificando la junto de grillas (granules) contiguas de 100km2,
mejora respecto a SPOT. Una vez que se ha deter- correspondientes al nivel 1c. Para el procesado de
minado que el mejor clasificador es el K-NN se ha los datos 1c la ESA ha desarrollado el software
aplicado este mtodo a ambas imgenes en las dos Sen2Cor (Sentinel 2 Corrections), basado en un
zonas de estudio. conjunto de tcnicas para la correccin atmosf-
rica y un mdulo de clasificacin de escena (ESA,
3.2.Descripcin de datos SENTINEL-2 2016). El resultado es un producto de reflectivida-
des BOA, correspondiente al nivel 2a, adems de
Las imgenes usadas en este trabajo fueron toma- un mapa de espesor ptico de aerosoles, un mapa
das por S2, misin que forma parte del Programa de vapor de agua y un mapa de clasificacin de
Coprnico para la Observacin de la Tierra de la la escena junto con los indicadores de calidad.
Sen2Cor se basa en una amplia base de look-up imagen con todas las bandas S2, y en la Tabla2con
tables que son compiladas a partir del modelo solo las cuatro bandas de S2 que coinciden con
de transferencia radiativa atmosfrica basada en SPOT (que son las 3del visible y la del NIR). Tal
libRadtran1. como se aprecia en la Tabla 1, cuando usamos
todas las bandas, todos los clasificadores han dado
El satlite S2 mejora misiones operativas como
un resultado bueno, pero algunos han dado incluso
Landsat o SPOT proporcionando bandas ms
mejor que la combinacin, como son el K-NN y
estrechas y con canales adicionales para evaluar
el RF.
vegetacin, y bandas dedicadas a la mejora de la
correccin atmosfrica y la deteccin de nubes Tabla 1. ndice Kappa para la imagen de Burjassot con to-
cirrus. La rbita de este satlite es heliosincrnica das las bandas S2, con porcentajes de pxeles aplicados a
y se encuentra a 786 km de altitud, tomando la entrenamiento quedando el resto como validacin.
imagen de una zona a las 10:30am. Esta hora local
Comb. Comb.
es la mejor para reducir al mnimo la cobertura de Sin Sin LDA
nubes y asegurar una iluminacin del Sol plena, y % LDA K-NN Tree RF Comb. LDA ni Tree
adems est cerca de la hora de paso de Landsat y 10 0,76 0,82 0,62 0,84 0,86 0,82 0,84
casi idntica a la del SPOT-5. El satlite est dise- 20 0,81 0,88 0,75 0,88 0,89 0,88 0,89
ado para una vida til de 7aos, con propulsor 30 0,80 0,91 0,81 0,91 0,91 0,91 0,92
de 12aos de operaciones, incluyendo la salida 40 0,81 0,94 0,82 0,94 0,92 0,93 0,94
final de rbita. 50 0,80 0,96 0,87 0,95 0,95 0,96 0,96
La misin est dedicada a una cobertura plena
de las superficies terrestres (incluyendo las islas
Si analizamos por partes las Tablas 1y 2, observa-
mayores) a partir de los 56 S (Amrica del Sur)
mos que el clasificador LDA, nos da un resultado
hasta los 83 N (Groenlandia).
Kappa que corresponde a un grado de acierto sus-
Para la obtencin de datos, la ESA ha desarrollado tancial, tanto con 4bandas como con todas.
un portal en el que se tiene acceso gratuitamente
a las imgenes del satlite Sentinel-2, pudiendo Tabla 2. ndice Kappa para la imagen de Burjassot con
acceder tambin a las imgenes de Sentinel-1. 4bandas SPOT (RGB y NIR), con porcentajes de pxeles
aplicados a entrenamiento quedando el resto como valida-
Las imgenes utilizadas son del da 1de Mayo de cin.
2016para Valencia, y del 13de Enero de 2016para
Argentina. Fueron elegidas por no tener nubes y Comb. Comb.
fueron corregidas atmosfricamente con Sen2cor. Sin Sin LDA
% LDA K-NN Tree RF Comb. LDA ni Tree
10 0,70 0,79 0,61 0,77 0,78 0,77 0,79
4.Resultados 20 0,71 0,85 0,75 0,82 0,83 0,83 0,85
En esta seccin se mostrarn los resultados de los 30 0,71 0,89 0,78 0,88 0,86 0,88 0,90
ndices Kappa calculados con todos los clasifica- 40 0,72 0,91 0,79 0,90 0,89 0,90 0,91
dores para ambas imgenes. Despus obtendremos 50 0,72 0,94 0,82 0,92 0,91 0,92 0,94
la matriz de confusin para analizar los resultados
obtenidos. Posteriormente se mostrarn los mapas
El clasificador K-NN da unos resultados con un
de usos del suelo obtenidos con el mejor clasifica-
grado de acierto casi perfecto en todas las clasifi-
dor para ambas zonas. Y por ltimo, se calcular
caciones, excepto con el 10% de entrenamiento con
el rea ocupada por cada cultivo en las zonas de
la imagen de cuatro bandas, que da un ndice de
estudio.
0,79, considerado sustancial con el acierto. Adems
empieza a dar mejores resultados que la combina-
4.1.ndice Kappa cin a partir del 40% de datos de entrenamiento con
todas las bandas, mientras que con cuatro bandas,
En la Tabla 1 se muestran los ndices Kappa
da siempre mejor que la combinacin.
para la imagen de Espaa, aplicando todos los
clasificadores mencionados, y los porcentajes El clasificador Tree, cuando se clasifica con todas
de entrenamiento entre el 10y el 50%, para una las bandas, da un grado de acierto sustancial para
Tabla 4. Intervalos de confianza para el 95% sobre la imagen de Burjassot con todas las bandas de S2, con porcentajes de
pxeles aplicados a entrenamiento quedando el resto como validacin.
Tabla 5. Intervalos de confianza para el 95% sobre la imagen de Burjassot con las 4 bandas de SPOT (RGB y NIR) , con
porcentajes de pxeles aplicados a entrenamiento quedando el resto como validacin.
Construcciones
Suelo aband.
Suelo desn.
Cauce seco
Alcachofa
Lechuga
Palmera
Cebolla
naranjo
Asfalto
Alfalfa
Vivero
Patata
Coles
CLASE
Suelo aband. 100,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
Alfalfa 0,0 100,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
Asfalto 0,0 0,0 96,7 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,7 0,0 0,0 0,0
Cauce seco 0,0 0,0 0,0 94,2 0,0 0,0 0,0 3,5 0,0 0,0 0,0 0,5 0,0 0,0
Resultados clasificacin
Cebolla 0,0 0,0 0,0 1,9 97,9 0,0 0,0 0,0 9,1 0,4 0,0 0,5 0,0 3,6
Coles 0,0 0,0 0,0 0,0 0,0 92,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
Lechuga 0,0 0,0 0,0 0,0 0,0 0,0 94,7 0,0 0,0 0,0 0,0 0,5 0,0 0,0
Naranja 0,0 0,0 0,0 1,3 0,0 0,0 0,0 93,0 9,1 0,0 0,0 0,0 0,0 0,0
Palmera 0,0 0,0 0,0 1,3 0,0 0,0 0,0 1,2 63,6 0,0 0,0 0,0 0,0 0,0
Patata 0,0 0,0 0,0 0,0 0,0 0,0 5,3 0,0 0,0 99,6 0,0 0,0 0,0 0,9
Construc. 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 97,1 0,5 0,0 0,0
Suelo desn. 0,0 0,0 3,3 1,3 0,0 0,0 0,0 0,0 0,0 0,0 2,1 98,1 0,0 0,0
Vivero 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 100,0 0,0
Alcachofa 0,0 0,0 0,0 0,0 2,1 8,0 0,0 2,3 18,2 0,0 0,0 0,0 0,0 95,5
Si analizamos la Tabla 7se aprecia como la clase 4.4.rea ocupada por clase
mejor etiquetada y clasificada ha sido el maz, con
En la Tabla 8se muestran las cantidades de cul-
un 95,1%. Por el contrario, la clase peor etiquetada
tivo calculadas para cada zona asignando a cada
y por lo tanto peor clasificada ha sido el agropiro
pxel un rea de 100m2. En la tabla de la huerta
con un 61,9% de aciertos.
de Burjassot se aprecia cmo el cultivo que mayor
Agropiro
Caminos
Cebolla
Viveros
Girasol
Alfalfa
Agua
Maz
CLASE
Pasto natural 84,8 0,0 0,0 0,1 2,0 6,4 6,1 0,5 21,0 0,3 0,0
Viveros 0,0 93,1 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
Resultados de la clasificacin
Maz 0,0 0,0 95,1 1,8 0,0 0,9 0,0 0,0 0,0 0,0 11,9
Girasol 0,0 0,0 0,0 87,7 0,0 0,0 0,0 1,5 0,0 0,0 0,0
Cebolla 0,0 0,0 1,3 0,0 77,2 2,8 0,0 0,0 0,0 7,1 15,5
Construcciones 0,0 0,0 0,0 0,1 0,0 70,6 0,0 1,5 0,0 1,8 1,8
Parcela sin cultivo 1,0 0,0 0,0 0,0 8,3 1,8 90,9 1,0 4,8 1,6 0,0
Caminos 0,3 6,9 0,0 0,0 0,0 6,4 2,9 76,4 76,4 0,0 0,0
Alfalfa 13,9 0,0 0,1 6,0 0,0 1,8 0,0 0,5 74,1 74,1 3,4
Agua 0,0 0,0 2,8 0,0 11,7 1,8 0,0 10,8 10,8 88,7 5,4
Agropiro 0,0 0,0 0,7 4,2 0,7 7,3 0,0 7,9 0,0 0,2 61,9
Tabla 8. rea ocupada por las clases de la huerta de Bur- Breiman, L. 1984. Classification and regression trees.
jassot, VLC, y VBRC, BsAs. Chapman & Hall/CRC.
Breiman, L. 2001. Random forests. Machine
Huerta de Burjassot INTA Argentina
Learning, 45(1), 5-32. https://doi.
Clase rea (ha) Clase rea (ha) org/10.1023/A:1010933404324
Suelo aband. 8,26 Parcela sin cult. 2665,74
Camps-Valls, G., Gmez Chova, L., Muoz Mar, J.,
Alfalfa 7,13 Girasol 804,47
Rojo lvarez, J.L., Martnez-Ramn, M. 2008.
Asfalto 185,79 Maz 1210,27
Kernel based framework for muli-temporal and
Cauce seco 227,69 Cebolla 1073,30 multi-source remote sensing data classification
Cebolla 101,80 Agua 1276,88 and change detection. IEEE Trans. Geosc. Rem.
Col 10,86 Pasto natural 748,76 Sens., 46(6), 1822-1835. https://doi.org/10.1109/
Lechuga 32,29 Agropiro 3309,03 TGRS.2008.916201
Naranjo 261,71 Alfalfa 2120,34 Camps-Valls, G., Tuia, D., Gmez-Chova, L., Jimnez,
Palmera 14,46 Construcciones 1239,00 S., Malo, J. 2011. Remote Sensing Image Processing.
Patata 122,01 Caminos 1887,38 Synthesis Lectures on Image, Video, and Multimedia
Construcc. 144,13 Viveros 2099,71 Processing, 5(1), 1-192. https://doi.org/10.2200/
Suelo desn. 324,23 S00392ED1V01Y201107IVM012
Vivero 46,78 Cohen J. A. 1960. Coefficient of agreement for nominal
scales. Educ. Psychol. Meas., 20(1), 37-46. https://
Alcachofa 124,56
doi.org/10.1177/001316446002000104
Comber, A., Fisher, P., Wadsworth, R. 2005. You know
what land cover is but does anyone else? ... an
superficie ocupa es el naranjo, y el que menor investigation into semantic and ontological confusion.
ocupa es la alfalfa. En la tabla de la zona de estu- International Journal of Remote Sensing, 26(1), 223-
dio de Argentina se observa cmo el cultivo que 228. https://doi.org/10.1080/0143116042000274032
ms rea ocupa es el agropiro, mientras que el Del Bosque, I., Arozarena, A., Villa, G., Valcrcel,
pasto natural es el que menos ocupa. N., Porcuna, A. 2005. Creacin de un sistema de
informacin geogrfico de ocupacin del suelo en
Espaa."Proyecto SIOSE". Actas del XI Congreso
5.Conclusiones Nacional de Teledeteccin, 21-23 Septiembre,
Puerto de la Cruz, Espaa, 255-262.
En este trabajo se han obtenido los mapas de usos
Delegido, J., Verrelst, J., Alonso, L., Moreno, J. 2011.
del suelo con el rea de cada cultivo para dos Evaluation of Sentinel-2 Red-Edge Bands for
zonas agrarias con imgenes S2. Se ha observado Empirical Estimation of Green LAI and Chlorophyll
que el mejor clasificador para imgenes S2 es Content. Sensors, 11, 7063-7081. https://doi.
el K-NN, y la combinacin del K-NN y el RF. org/10.3390/s110707063
Adems, se ha demostrado la mejora de S2 res- Drusch, M., Del Bello, U., Carlier, S., Colin, O.,
pecto a SPOT cuantificndose entre 2 y 5% por Fernndez, V., Gascn, F., Hoersch, B., Isola, C.,
encima. Por otro lado, la precisin global para Laberinti, P., Martimort, P., Meygret, A., Spoto,
la huerta de Burjassot fue 96,52%, mientras que F., Sy, O., Marchese, F., Bargellini, P. 2012.
Sentinel-2: ESAs Optical High-Resolution Mission
para la zona de Argentina fue del 85,28%, es decir,
for GMES Operational Services. Remote sensing of
el porcentaje de que las muestras estuviesen co- Environment, 120, 25-36. https://doi.org/10.1016/j.
rrectamente clasificadas fue mejor en Espaa que rse.2011.11.026
en Argentina. Finalmente, los resultados de este
ESA. 2016. www.esa.int/. Consultado el 10 de julio de
trabajo muestran que la mejora en la resolucin 2016.
espacial y radiomtrica de S2respecto a otras
Gislason, P.O., Benediktsson, J.A., Sveinsson, J.R.
misiones operativas, permite tambin la mejora en 2006. Random Forests for land cover classification.
los resultados de la clasificacin. Pattern Recognition Letters, 27(4), 294-300. https://
doi.org/10.1016/j.patrec.2005.08.011
Referencias Hastie, T., Tibshirani, R., Friedman, J. 2009. The
Elements of Statistical Learning: Data Mining,
Abraira, V. 2001. El ndice kappa. Semergen, Inference, and Prediction, 2nd ed.; Springer: New
27(5), 247-249. https://doi.org/10.1016/S1138- York, NY, USA. https://doi.org/10.1007/978-0-387-
3593(01)73955-X 84858-7