Sei sulla pagina 1di 54

HOMER, HOMSPLIDOM Y

UTILES ADICIONALES
Software eficiente para homogenización interactiva
de redes climáticas

Por: Enric Aguilar Anfrons, Center for Climate Change, C3,


URV de Tarragona (España)
¿HOMOGÉNEO?

- Una serie temporal es homogénea cuando


todas sus observaciones han sido medidas en
las mismas condiciones, son comparables y
sus fluctuaciones no dependen de factores
distintos de los meteorológicos y climáticos
- Existen múltiples causas de inhomogeneidad:
cambios de emplazamiento, cambios de
instrumentación, cambios en la exposición de
los instrumentos, etc.
- Las inhomogeneidades son cambios de
carácter sistemático
HOMOGENIZACION EN 5’
- La homogenización es el proceso que consiste en
detectar cambios artificiales en las series climáticas y
ajustarlas al objeto de hacer todas las observaciones
comparables
- Para detectar inhomogeneidades, el climatólogo
utiliza técnicas gráficas, estadísticas y el uso de la
historia de la estación o metadatos
- La homogenización se realiza preferentemente de
forma relativa, entendiendo que estaciones cercanas
comparten una misma señal climática más un efecto
propio de la estación, el cual es constante si la serie
es homogénea o, de lo contrario, constante entre dos
inhomogeneidades
- La detección de puntos de cambio se realiza
normalmente sobre datos anuales o mensuales,
menos ruidosos que los datos diarios
- Los datos ajustados mejoran su calidad Y AUMENTAN
LA COHERENCIA REGIONAL, pero no permiten
cualquier uso. Por ejemplo, el cómputo de índices
como los de RCLimdex o Climpact, será más sólido
sobre datos ajustados; por el contrario, tratar de
decir qué día presentó el valor extremo de la serie no
es aceptable si no se tiene en cuenta la
incertidumbre introducida por la homogenización
CARACTERÍSTICAS DE
HOMER (I)
• Fruto de COST-HOME, 5 años de investigación
europea.
• Diversas herramientas de control de calidad de
datos mensuales
• Diversos sistemas de detección: emparejada
(pairwise), conjunta (joint) y ajuste del mes de
cambio
• Posibilidades interactivas
• Generación de gráficos y estadísticos de
documentación del proceso
• Herramienta de visualización
CARACTERÍSTICAS DE
HOMER (II)
– Detección emparejada:

Derivada de PRODIGE (Caussinus y Mestre, 2004).

Basada en la comparación de pares de estaciones

Consiste en estimar el número y posición óptima de los puntos de cambio, utilizando un término de
penalización
– Detección conjunta

Entiende que las estaciones próximas están sometidas a las mismas condiciones climáticas
simultáneamente, presunción segura a escala annual y mensual

Utiliza un modelo ANOVA de dos factores, en el que cada serie de observaciones puede ser descompuesta
en un efecto climático, un efecto de estación y ruido blanco aleatorio

El efecto de estación es constante si una serie es homogénea; si una série es inhomogénea, dicho efecto es
constante entre dos puntos de cambio

El paquete R cghseg (cuyas funcionalidades y bases teóricas se describen en Pickard et al, 2011) permite
mediante programación dinámica estimar simultáneamente para un conjunto de estaciones sus puntos de
cambio

Los coeficientes del modelo ANOVA se utilizan para la corrección

La estimación del modelo puede ser realizada con valores perdidos, siempre que exista un valor por año en
el conjunto de la red y un valor para cada subperiodo homogéneo en cada serie
– Ajuste del mes de cambio

Para una mejor detección, HOMER utiliza promedios anuales y/o estacionales en sus procesos de detección
principales

Cuando un punto de cambio es detectado, cabe realizar un nuevo proceso de detección conjunta entre las
observaciones mensuales desestacionalizadas adyacentes a dicho punto de cambio ( ~ 3 años). El proceso
queda constreñido a detectar esa única inhomogenidad, afinando su fecha
PROCESO DE HOMOGENIZACIÓN SIMPLIFICADO (PHS)

HERRAMIENTA FAST QC (identificación de outliers, identificación


preliminar de puntos de cambio, generación de fichero de
outliers y supresión de los mismos)

DETECCIÓN EMPAREJADA (detección visual de puntos de


cambio)

DETECCIÓN CONJUNTA
(creación semiautomática de fichero de puntos de cambio)

CORRECCIÓN y visualización de detección emparejada sobre


datos corregidos (evaluación y mejora)

AJUSTE DEL MES DE CAMBIO y NUEVA CORRECCIÓN


ALGUNOS EJEMPLOS
• Los ejemplos que se ofrecen en las
próximas diapositivas se han
realizado sobre una red simplificada
de datos simulados generados
mediante la técnica de surrogates y
pertenecen al benchmark de
COST-HOME.
FAST QC OUTLIER

Puntos de Cambio muy evidentes


en 1921, 1929, 1953, 1973, 1984,
1994
DETECCIÓN EMPAREJADA
DETECCIÓN CONJUNTA
TN 49281001 SAINT-GEORGES-DES-GARDES
2

o
+
o
+ o
+
1
TN DIFF. ( )

0
-1

o
+ o
+
o
+
-2

1900 1910 1920 1930 1940 1950 1960 1970 1980 1990 2000
RESPECTO A SNHT
• Mayor complejidad estadística
• Mejor detección cuando existen
puntos de cambio cercanos o hacia
los extremos de las series
• Modelo de corrección más sólido, de
nuevo especialmente cuando existen
puntos de cambio cercanos o hacia
los extremos
• Imputación de valores perdidos
PROCESO COMPLETO

PHS

EVALUACI VISUALIZA
ÓN CIÓN
VISUALIZACIÓN Y
EVALUACIÓN (I)

homogenizac

homogenización
Antes de la

Después de la
ión

Nota: la restitución de valores no


afecta la detección ni la estimación
del modelo y puede ser fácilmente
suprimida
VISUALIZACIÓN Y
EVALUACIÓN (II)
Antes de la Después de la
homogenización homogenización
• ra/ratnm49281001d.txt • ho/hotnm49281001d.txt
• ---------------------- • ----------------------
• TN 49281001 SAINT-GEORGES-DES-GARDES : 1900 - 1999 • TN 49281001 SAINT-GEORGES-DES-GARDES : 1900 - 1999
• LS trend estimate : -0.011181 • LS trend estimate : -6.5e-05
• Two sided Kendall test p-value : 0.0104 • Two sided Kendall test p-value : 0.7704
• Click on left button to see next plot • Click on left button to see next plot
• •
• ra/ratnm56069001d.txt • ho/hotnm56069001d.txt
• ---------------------- • ----------------------
• TN 56069001 GROIX : 1900 - 1999 • TN 56069001 GROIX : 1900 - 1999
• LS trend estimate : 0.00181 • LS trend estimate : 0.000629
• Two sided Kendall test p-value : 0.71638 • Two sided Kendall test p-value : 0.58781
• Click on left button to see next plot • Click on left button to see next plot
• •
• ra/ratnm41097001d.txt • ho/hotnm41097001d.txt
• ---------------------- • ----------------------
• TN 41097001 GIEVRES : 1900 - 1999 • TN 41097001 GIEVRES : 1900 - 1999
• LS trend estimate : -0.009571 • LS trend estimate : -0.000245
• Two sided Kendall test p-value : 2e-05 • Two sided Kendall test p-value : 0.97624
• Click on left button to see next plot • Click on left button to see next plot
• •
• ra/ratnm61377001d.txt • ho/hotnm61377001d.txt
• ---------------------- • ----------------------
• TN 61377001 ST-CORNIER-DES-LANDES : 1900 - 1999 • TN 61377001 ST-CORNIER-DES-LANDES : 1900 - 1999
• LS trend estimate : -0.013534 • LS trend estimate : 0.000278
• Two sided Kendall test p-value : 0 • Two sided Kendall test p-value : 0.89104
• Click on left button to see next plot • Click on left button to see next plot
• •
• ra/ratnm85152001d.txt • ho/hotnm85152001d.txt
• ---------------------- • ----------------------
• TN 85152001 LA-MOTHE-ACHARD : 1900 - 1999 • TN 85152001 LA-MOTHE-ACHARD : 1900 - 1999
• LS trend estimate : 0.000113 • LS trend estimate : -0.000718
• Two sided Kendall test p-value : 0.86291 • Two sided Kendall test p-value : 0.75677
• Click on left button to see next plot • Click on left button to see next plot
VISUALIZACIÓN Y EVALUACIÓN (III)
Antes de la Después de la
homogenización homogenización
OBSERVACIONES FINALES
• HOMER es una herramienta puntera para la homogenización de datos mensuales que
ha sido posible gracias a 5 años de colaboración de un buen numero de científicos
europeos, bajo el paraguas de la acción COST-HOME y muy especialmente gracias a
su chair, Olivier Mestre (Météo-France)
• HOMER está descrito en : Mestre O, Domonkos P, Picard F, Auer I, Robin S, Lebarbier
E, Böhm R, Aguilar E , Guijarro J, Vertacnik G, Klancar M, Dubuisson B, Stepanek P:
2013 HOMER : HOMogenisation softwarE in R- methods and applications.Idöjárás 117,
47-67.
• Aunque HOMER puede realizar control de calidad sobre datos mensuales, se obtienen
mejores resultados trabajando con datos que hayan sido QC’ados a escala diaria
• La homogenización de datos diarios, sigue siendo nuestro talón de aquiles. El método
más seguro sigue siendo la interpolación de los factores mensuales al valor diario,
aunque recientemente esta recibiendo muchas críticas por parte de diversos autores
que defienden métodos de quantile-matching, los cuales intentan reproducir la
distribución estadística del último segmento homogéneo en los segmentos previos
• Los métodos Q-M si se aplican de forma relativa requieren grandes solapamientos y
correlaciones muy elevadas entre pares de series; si se aplican de forma absoluta
asumen que la distribución se mantiene constante.
• Mientras que la interpolación de factores mensuales al dato diario no es posible en la
precipitación, los métodos Q-M si ofrecen, al menos teóricamente, esta posibilidad
ESTRUCTURA DE
DIRECTORIOS (I)
• HOMER necesita tener la información
organizada en distintos directorios.
La versión facilitada en este WS
incluye una utilidad para crearlos y
mover las series mensuales a su
directorio de trabajo
ESTRUCTURA DE
DIRECTORIOS (II)

./ra ./qc ./ho

./fig ./meta ./temp


INSTALANDO HOMER
• Paquetes adicionales requeridos:
– maps
– mapproj
– cghseg
• HOMER contiene puede instalar los dos primeros paquetes
en tiempo de ejecución, siempre que estemos conectados
a internet
• cghseg no puede ser instalado automáticamente, ya que la
versión presente en los repositorios de R, produce errores
– necesitaremos el fichero cghseg_0.0.1.zip para instalarlo
directamente desde la consola (windows) o cghseg_0.0.1.tar.gz
para instalarlo desde la línea de comandos (linux)
PREPARACIÓN DATOS
● Series en formato RClimdex:
– 1 fichero por estación
– Convención nombre: sscccccccc.txt, dónde ss es el estatus (ra, qc, ho) y cccccccc
un código numérico correspondiente a la estación, rellenado con ceros a la
izquierda de ser necesario
– Fichero estaciones, según muestra en siguiente diapositiva, de nombre libre,
aunque se sugiere “stations.txt” . Contendrá un registro para cada estación, con los
siguientes campos:
● Nombre del fichero; grados lat; minutos lat; segudos lat; grados lon; minutos lon; segundos lon
; elevación; nombre de la estación en una sola cadena (es decir “Buenos_Aires” en lugar
de “Buenos Aires”, sin acentos ni caracteres conflictivos (es decir “Espanya” en lugar de
“España”; “Bahia” en lugar de “Bahía”.
– 1 registro por día: yyyy,mm,pc (mm),tx (c),tn (c)
– Valor perdido = -99.9; registros sin ningún elemento presente no son necesarios
stations.txt
qc00087129.txt 27 46 0 64 18 0 199 Santiago
qc00087148.txt 26 49 0 60 27 0 92 Presidencia_Roque_SP
qc00087166.txt 27 27 0 58 46 0 62 Corrientes_Aero
qc00087244.txt 29 54 0 63 41 0 341 Villa_MRS
qc00087257.txt 29 53 0 61 57 0 88 Ceres
qc00087276.txt 28 26 0 58 55 0 1 Bella_Vista
qc00087328.txt 31 95 0 65 13 0 1 Villa_Dolores
qc00087349.txt 34 40 0 63 53 0 338 Pilar
qc00087374.txt 31 47 0 60 29 0 78 Parana_Aero
qc00087393.txt 30 16 0 57 39 0 54 Monte_Caseros_Aero
qc00087395.txt 31 30 0 58 2 0 1 Concordia
qc00087436.txt 33 16 0 66 21 0 713 San_Luis
qc00087453.txt 33 7 0 64 14 0 421 Rio_Cuarto_Aero
qc00087480.txt 32 55 0 60 47 0 25 Rosario
qc00087497.txt 33 0 0 58 37 0 21 Gualeguaychu_Aero
qc00087525.txt 35 45 0 60 88 0 1 Nueve_julio
qc00087548.txt 34 33 0 60 55 0 81 Junin_Aero
qc00087585.txt 34 40 0 58 39 0 22 Bueno_Aires_Obs
qc00087623.txt 36 34 0 64 16 0 191 Santa_Rosa_Aero
qc00087641.txt 36 50 0 59 53 0 147 Azul_Aero
qc00087648.txt 36 35 0 57 73 0 1 Dolores
PREPARACIÓN PARA
HOMOGENIZACIÓN CON HOMER
● R 2.15: otras versiones impedirán que cghseg funcione

Instalar manualmente los paquetes adicionales que se requiren (cghseg_0.0.1,
maps y mapproj) y que se facilitan
– Linux: install.packages('name',source=TRUE)
– Windows: menú, instalar paquetes desde zip local

Cargar el código utiles.R
– Utilizar su función makemonthly(minyear=1931,maxyear=2010,percent=5) para
calcular valores mensuales entre 1931 y 2010, permitiendo un máximo del 5% de datos
faltantes para computar cualquier mes
– Se crearán los ficheros mensuales necesarios (rr, tx, tn, tm, rn), que se nombrarán y
emplazarán en el directorio adecuado (./qc o ./ra) para HOMER
– Se crearán los ficheros de estaciones necesarios para HOMER:
● 000001stations.txt = precipitación
● 000002stations.txt = tx
● 000003stations.txt = tn
● 000004stations.txt = tm
● 000005stations.txt = rn
HOMOGENEIZACIÓN DEL DATO DIARIO

● Si has homogeneizado con HOMER siguiendo las


instrucciones previamente facilitadas, estás listo para
interpolar los factores mensuales de temperatura a las
series diarias
● Sal de HOMER y carga de nuevo utiles.R
● Usa la función hdwlv().
● Apareceran en tu ordenador una serie de ficheros
ho????????.txt, que contendrán la interpolación de los
factores mensuales al dato diario
● Realiza un control de calidad sobre los resultados para
valorar la frecuencia de overshooting. De ser excesiva,
considera revisar la homogeneización del dato mensual.
¿CÓMO CORREGIR EL OVERSHOOTING?

●DTRa = DTR para los datos mensuales originales mes y año del dato
que incurre en overshooting
●DTRb = DTR para los datos mensuales homogeneizados para el mes y

año del dato que incurre en overshooting


●DTRc = DTRb/DTRa

●DTRdia = DTR original del día que incurre en overshooting

●DTRerr = DTR ajustado y negativo (erróneo) del día que incurre en

overshooting
●DTRtarget= DTRc*DTRdia-DTRerr

●Sumar DTRtarget/2 a la TX y restar DTRtarget/2 a la TN


HOMSPLIDHOM

● Usa regresión no lineal (cubic spline) para ajustar HSPs


(SPLIDHOM) o distribuciones de valores extremos (HOM)
● Necesita r > 0.8, preferentemente r > 0.9
● Menú intuitivo con opciones
● Si has trabajado con HOMER, siguiendo las indicaciones de
este taller:
– Sal de HOMER
– Carga utiles.R
– Ejecuta tosplidhom()
– Aparecerá en tu directorio una carpeta splidhom, desde la cual deberás
cargar el codigo HOMSPLIDOM.R y seguir instrucciones
– Require la instalación de los paquetes date, spam, lmomco y grid (que, en
principio, pueden istalarse con normalidad desde el repositorio de r-cran)
QUÉ HACER CON LA PRECIPITACIÓN

● Investigar
● Aplicar el factor annual al dato diario

● Filtrar la precipitación < 3mm

●Arriesgarse con metodos QM (!)


¡MOSKIS,VAMOS A
PROBAR HOMER !
HOMER, HOMSPLIDOM Y
UTILES ADICIONALES
Software eficiente para homogenización interactiva
de redes climáticas

Por: Enric Aguilar Anfrons, Center for Climate Change, C3,


URV de Tarragona (España)
¿HOMOGÉNEO?

- Una serie temporal es homogénea cuando


todas sus observaciones han sido medidas en
las mismas condiciones, son comparables y
sus fluctuaciones no dependen de factores
distintos de los meteorológicos y climáticos
- Existen múltiples causas de inhomogeneidad:
cambios de emplazamiento, cambios de
instrumentación, cambios en la exposición de
los instrumentos, etc.
- Las inhomogeneidades son cambios de
carácter sistemático
HOMOGENIZACION EN 5’
- La homogenización es el proceso que consiste en
detectar cambios artificiales en las series climáticas y
ajustarlas al objeto de hacer todas las observaciones
comparables
- Para detectar inhomogeneidades, el climatólogo
utiliza técnicas gráficas, estadísticas y el uso de la
historia de la estación o metadatos
- La homogenización se realiza preferentemente de
forma relativa, entendiendo que estaciones cercanas
comparten una misma señal climática más un efecto
propio de la estación, el cual es constante si la serie
es homogénea o, de lo contrario, constante entre dos
inhomogeneidades
- La detección de puntos de cambio se realiza
normalmente sobre datos anuales o mensuales,
menos ruidosos que los datos diarios
- Los datos ajustados mejoran su calidad Y AUMENTAN
LA COHERENCIA REGIONAL, pero no permiten
cualquier uso. Por ejemplo, el cómputo de índices
como los de RCLimdex o Climpact, será más sólido
sobre datos ajustados; por el contrario, tratar de
decir qué día presentó el valor extremo de la serie no
es aceptable si no se tiene en cuenta la
incertidumbre introducida por la homogenización
CARACTERÍSTICAS DE
HOMER (I)
• Fruto de COST-HOME, 5 años de investigación
europea.
• Diversas herramientas de control de calidad de
datos mensuales
• Diversos sistemas de detección: emparejada
(pairwise), conjunta (joint) y ajuste del mes de
cambio
• Posibilidades interactivas
• Generación de gráficos y estadísticos de
documentación del proceso
• Herramienta de visualización
CARACTERÍSTICAS DE
HOMER (II)
– Detección emparejada:

Derivada de PRODIGE (Caussinus y Mestre, 2004).

Basada en la comparación de pares de estaciones

Consiste en estimar el número y posición óptima de los puntos de cambio, utilizando un término de
penalización
– Detección conjunta

Entiende que las estaciones próximas están sometidas a las mismas condiciones climáticas
simultáneamente, presunción segura a escala annual y mensual

Utiliza un modelo ANOVA de dos factores, en el que cada serie de observaciones puede ser descompuesta
en un efecto climático, un efecto de estación y ruido blanco aleatorio

El efecto de estación es constante si una serie es homogénea; si una série es inhomogénea, dicho efecto es
constante entre dos puntos de cambio

El paquete R cghseg (cuyas funcionalidades y bases teóricas se describen en Pickard et al, 2011) permite
mediante programación dinámica estimar simultáneamente para un conjunto de estaciones sus puntos de
cambio

Los coeficientes del modelo ANOVA se utilizan para la corrección

La estimación del modelo puede ser realizada con valores perdidos, siempre que exista un valor por año en
el conjunto de la red y un valor para cada subperiodo homogéneo en cada serie
– Ajuste del mes de cambio

Para una mejor detección, HOMER utiliza promedios anuales y/o estacionales en sus procesos de detección
principales

Cuando un punto de cambio es detectado, cabe realizar un nuevo proceso de detección conjunta entre las
observaciones mensuales desestacionalizadas adyacentes a dicho punto de cambio ( ~ 3 años). El proceso
queda constreñido a detectar esa única inhomogenidad, afinando su fecha
PROCESO DE HOMOGENIZACIÓN SIMPLIFICADO (PHS)

HERRAMIENTA FAST QC (identificación de outliers, identificación


preliminar de puntos de cambio, generación de fichero de
outliers y supresión de los mismos)

DETECCIÓN EMPAREJADA (detección visual de puntos de


cambio)

DETECCIÓN CONJUNTA
(creación semiautomática de fichero de puntos de cambio)

CORRECCIÓN y visualización de detección emparejada sobre


datos corregidos (evaluación y mejora)

AJUSTE DEL MES DE CAMBIO y NUEVA CORRECCIÓN


ALGUNOS EJEMPLOS
• Los ejemplos que se ofrecen en las
próximas diapositivas se han
realizado sobre una red simplificada
de datos simulados generados
mediante la técnica de surrogates y
pertenecen al benchmark de
COST-HOME.
FAST QC OUTLIER

Puntos de Cambio muy evidentes


en 1921, 1929, 1953, 1973, 1984,
1994
DETECCIÓN EMPAREJADA
DETECCIÓN CONJUNTA
TN 49281001 SAINT-GEORGES-DES-GARDES
2

o
+
o
+ o
+
1
TN DIFF. ( )

0
-1

o
+ o
+
o
+
-2

1900 1910 1920 1930 1940 1950 1960 1970 1980 1990 2000
RESPECTO A SNHT
• Mayor complejidad estadística
• Mejor detección cuando existen
puntos de cambio cercanos o hacia
los extremos de las series
• Modelo de corrección más sólido, de
nuevo especialmente cuando existen
puntos de cambio cercanos o hacia
los extremos
• Imputación de valores perdidos
PROCESO COMPLETO

PHS

EVALUACI VISUALIZA
ÓN CIÓN
VISUALIZACIÓN Y
EVALUACIÓN (I)

homogenizac

homogenización
Antes de la

Después de la
ión
Nota: la restitución de valores no
afecta la detección ni la estimación
del modelo y puede ser fácilmente
suprimida
VISUALIZACIÓN Y
EVALUACIÓN (II)
Antes de la Después de la
homogenización homogenización
• ra/ratnm49281001d.txt • ho/hotnm49281001d.txt
• ---------------------- • ----------------------
• TN 49281001 SAINT-GEORGES-DES-GARDES : 1900 - 1999 • TN 49281001 SAINT-GEORGES-DES-GARDES : 1900 - 1999
• LS trend estimate : -0.011181 • LS trend estimate : -6.5e-05
• Two sided Kendall test p-value : 0.0104 • Two sided Kendall test p-value : 0.7704
• Click on left button to see next plot • Click on left button to see next plot
• •
• ra/ratnm56069001d.txt • ho/hotnm56069001d.txt
• ---------------------- • ----------------------
• TN 56069001 GROIX : 1900 - 1999 • TN 56069001 GROIX : 1900 - 1999
• LS trend estimate : 0.00181 • LS trend estimate : 0.000629
• Two sided Kendall test p-value : 0.71638 • Two sided Kendall test p-value : 0.58781
• Click on left button to see next plot • Click on left button to see next plot
• •
• ra/ratnm41097001d.txt • ho/hotnm41097001d.txt
• ---------------------- • ----------------------
• TN 41097001 GIEVRES : 1900 - 1999 • TN 41097001 GIEVRES : 1900 - 1999
• LS trend estimate : -0.009571 • LS trend estimate : -0.000245
• Two sided Kendall test p-value : 2e-05 • Two sided Kendall test p-value : 0.97624
• Click on left button to see next plot • Click on left button to see next plot
• •
• ra/ratnm61377001d.txt • ho/hotnm61377001d.txt
• ---------------------- • ----------------------
• TN 61377001 ST-CORNIER-DES-LANDES : 1900 - 1999 • TN 61377001 ST-CORNIER-DES-LANDES : 1900 - 1999
• LS trend estimate : -0.013534 • LS trend estimate : 0.000278
• Two sided Kendall test p-value : 0 • Two sided Kendall test p-value : 0.89104
• Click on left button to see next plot • Click on left button to see next plot
• •
• ra/ratnm85152001d.txt • ho/hotnm85152001d.txt
• ---------------------- • ----------------------
• TN 85152001 LA-MOTHE-ACHARD : 1900 - 1999 • TN 85152001 LA-MOTHE-ACHARD : 1900 - 1999
• LS trend estimate : 0.000113 • LS trend estimate : -0.000718
• Two sided Kendall test p-value : 0.86291 • Two sided Kendall test p-value : 0.75677
• Click on left button to see next plot • Click on left button to see next plot
VISUALIZACIÓN Y EVALUACIÓN (III)
Antes de la Después de la
homogenización homogenización
OBSERVACIONES FINALES
• HOMER es una herramienta puntera para la homogenización de datos mensuales que
ha sido posible gracias a 5 años de colaboración de un buen numero de científicos
europeos, bajo el paraguas de la acción COST-HOME y muy especialmente gracias a
su chair, Olivier Mestre (Météo-France)
• HOMER está descrito en : Mestre O, Domonkos P, Picard F, Auer I, Robin S, Lebarbier
E, Böhm R, Aguilar E , Guijarro J, Vertacnik G, Klancar M, Dubuisson B, Stepanek P:
2013 HOMER : HOMogenisation softwarE in R- methods and applications.Idöjárás 117,
47-67.
• Aunque HOMER puede realizar control de calidad sobre datos mensuales, se obtienen
mejores resultados trabajando con datos que hayan sido QC’ados a escala diaria
• La homogenización de datos diarios, sigue siendo nuestro talón de aquiles. El método
más seguro sigue siendo la interpolación de los factores mensuales al valor diario,
aunque recientemente esta recibiendo muchas críticas por parte de diversos autores
que defienden métodos de quantile-matching, los cuales intentan reproducir la
distribución estadística del último segmento homogéneo en los segmentos previos
• Los métodos Q-M si se aplican de forma relativa requieren grandes solapamientos y
correlaciones muy elevadas entre pares de series; si se aplican de forma absoluta
asumen que la distribución se mantiene constante.
• Mientras que la interpolación de factores mensuales al dato diario no es posible en la
precipitación, los métodos Q-M si ofrecen, al menos teóricamente, esta posibilidad
ESTRUCTURA DE
DIRECTORIOS (I)
• HOMER necesita tener la información
organizada en distintos directorios.
La versión facilitada en este WS
incluye una utilidad para crearlos y
mover las series mensuales a su
directorio de trabajo
ESTRUCTURA DE
DIRECTORIOS (II)

./ra ./qc ./ho

./fig ./meta ./temp


INSTALANDO HOMER
• Paquetes adicionales requeridos:
– maps
– mapproj
– cghseg
• HOMER contiene puede instalar los dos primeros paquetes
en tiempo de ejecución, siempre que estemos conectados
a internet
• cghseg no puede ser instalado automáticamente, ya que la
versión presente en los repositorios de R, produce errores
– necesitaremos el fichero cghseg_0.0.1.zip para instalarlo
directamente desde la consola (windows) o cghseg_0.0.1.tar.gz
para instalarlo desde la línea de comandos (linux)
PREPARACIÓN DATOS
● Series en formato RClimdex:
– 1 fichero por estación
– Convención nombre: sscccccccc.txt, dónde ss es el estatus (ra, qc, ho) y cccccccc
un código numérico correspondiente a la estación, rellenado con ceros a la
izquierda de ser necesario
– Fichero estaciones, según muestra en siguiente diapositiva, de nombre libre,
aunque se sugiere “stations.txt” . Contendrá un registro para cada estación, con los
siguientes campos:
● Nombre del fichero; grados lat; minutos lat; segudos lat; grados lon; minutos lon; segundos lon
; elevación; nombre de la estación en una sola cadena (es decir “Buenos_Aires” en lugar
de “Buenos Aires”, sin acentos ni caracteres conflictivos (es decir “Espanya” en lugar de
“España”; “Bahia” en lugar de “Bahía”.
– 1 registro por día: yyyy,mm,pc (mm),tx (c),tn (c)
– Valor perdido = -99.9; registros sin ningún elemento presente no son necesarios
stations.txt
qc00087129.txt 27 46 0 64 18 0 199 Santiago
qc00087148.txt 26 49 0 60 27 0 92 Presidencia_Roque_SP
qc00087166.txt 27 27 0 58 46 0 62 Corrientes_Aero
qc00087244.txt 29 54 0 63 41 0 341 Villa_MRS
qc00087257.txt 29 53 0 61 57 0 88 Ceres
qc00087276.txt 28 26 0 58 55 0 1 Bella_Vista
qc00087328.txt 31 95 0 65 13 0 1 Villa_Dolores
qc00087349.txt 34 40 0 63 53 0 338 Pilar
qc00087374.txt 31 47 0 60 29 0 78 Parana_Aero
qc00087393.txt 30 16 0 57 39 0 54 Monte_Caseros_Aero
qc00087395.txt 31 30 0 58 2 0 1 Concordia
qc00087436.txt 33 16 0 66 21 0 713 San_Luis
qc00087453.txt 33 7 0 64 14 0 421 Rio_Cuarto_Aero
qc00087480.txt 32 55 0 60 47 0 25 Rosario
qc00087497.txt 33 0 0 58 37 0 21 Gualeguaychu_Aero
qc00087525.txt 35 45 0 60 88 0 1 Nueve_julio
qc00087548.txt 34 33 0 60 55 0 81 Junin_Aero
qc00087585.txt 34 40 0 58 39 0 22 Bueno_Aires_Obs
qc00087623.txt 36 34 0 64 16 0 191 Santa_Rosa_Aero
qc00087641.txt 36 50 0 59 53 0 147 Azul_Aero
qc00087648.txt 36 35 0 57 73 0 1 Dolores
PREPARACIÓN PARA
HOMOGENIZACIÓN CON HOMER
● R 2.15: otras versiones impedirán que cghseg funcione
● Instalar manualmente los paquetes adicionales que se requiren (cghseg_0.0.1,
maps y mapproj) y que se facilitan
– Linux: install.packages('name',source=TRUE)
– Windows: menú, instalar paquetes desde zip local
● Cargar el código utiles.R
– Utilizar su función makemonthly(minyear=1931,maxyear=2010,percent=5) para
calcular valores mensuales entre 1931 y 2010, permitiendo un máximo del 5% de datos
faltantes para computar cualquier mes
– Se crearán los ficheros mensuales necesarios (rr, tx, tn, tm, rn), que se nombrarán y
emplazarán en el directorio adecuado (./qc o ./ra) para HOMER
– Se crearán los ficheros de estaciones necesarios para HOMER:
● 000001stations.txt = precipitación
● 000002stations.txt = tx
● 000003stations.txt = tn
● 000004stations.txt = tm
● 000005stations.txt = rn
HOMOGENEIZACIÓN DEL DATO DIARIO

● Si has homogeneizado con HOMER siguiendo las


instrucciones previamente facilitadas, estás listo para
interpolar los factores mensuales de temperatura a las
series diarias
● Sal de HOMER y carga de nuevo utiles.R
● Usa la función hdwlv().
● Apareceran en tu ordenador una serie de ficheros
ho????????.txt, que contendrán la interpolación de los
factores mensuales al dato diario
● Realiza un control de calidad sobre los resultados para
valorar la frecuencia de overshooting. De ser excesiva,
considera revisar la homogeneización del dato mensual.
¿CÓMO CORREGIR EL OVERSHOOTING?

●DTRa = DTR para los datos mensuales originales mes y año del dato
que incurre en overshooting
●DTRb = DTR para los datos mensuales homogeneizados para el mes y

año del dato que incurre en overshooting


●DTRc = DTRb/DTRa

●DTRdia = DTR original del día que incurre en overshooting

●DTRerr = DTR ajustado y negativo (erróneo) del día que incurre en

overshooting
●DTRtarget= DTRc*DTRdia-DTRerr

●Sumar DTRtarget/2 a la TX y restar DTRtarget/2 a la TN


HOMSPLIDHOM

● Usa regresión no lineal (cubic spline) para ajustar HSPs


(SPLIDHOM) o distribuciones de valores extremos (HOM)

Necesita r > 0.8, preferentemente r > 0.9
● Menú intuitivo con opciones
● Si has trabajado con HOMER, siguiendo las indicaciones de
este taller:
– Sal de HOMER
– Carga utiles.R
– Ejecuta tosplidhom()
– Aparecerá en tu directorio una carpeta splidhom, desde la cual deberás
cargar el codigo HOMSPLIDOM.R y seguir instrucciones
– Require la instalación de los paquetes date, spam, lmomco y grid (que, en
principio, pueden istalarse con normalidad desde el repositorio de r-cran)
QUÉ HACER CON LA PRECIPITACIÓN

● Investigar
● Aplicar el factor annual al dato diario

● Filtrar la precipitación < 3mm

●Arriesgarse con metodos QM (!)


¡MOSKIS,VAMOS A
PROBAR HOMER !

Potrebbero piacerti anche