Sei sulla pagina 1di 21

Anlisis de Estacionariedad

Waldo Lavado
Basado en e-learning CLIMANDES 1
Algunos aspectos que se vern en los
datos a travs del AED y que
probablemente se descubrirn:
Problemas de datos (valores atpicos,
lagunas en el registro, etc.)
La variacin estacional.
Patrones regionales y espaciales.
Correlaciones (entre variables o sitios).
Patrones temporales (por ejemplo,
tendencia o cambio en la media)
Si se identifica, muchos de los aspectos anteriores
se pueden encontrar en la fase del AED. AED
tambin puede servir para examinar cuestiones
como la:
independencia y autocorrelacin
distribucin estadstica de los valores de los
datos
detalles de la estructura estacional.
El AED es a menudo til en la identificacin de
problemas de calidad de datos. Sin embargo, no es
un sustituto para un adecuado control de calidad
de los datos.
NIVEL DE
SIGNIFICANCIA

Al plantear un estudio sobre una poblacin, idealmente


debemos estudiar a todos los individuos que la
conforman; pero no siempre podemos acceder a todos,
entonces tenemos que escoger una muestra; sin embargo
los resultados obtenidos de esta manera nunca sern
exactamente iguales, a los que se obtendran de estudiar
a toda la poblacin; es decir, siempre va a haber un
margen de error.

Sociedad Peruana de Bioestadstica


www.bioestadistico.com
Nivel de
Significancia
Antes de realizar el estudio debemos plantearnos; que
proporcin de error estamos dispuestos a aceptar para dar por
vlido nuestro. El error es el objetivo principal del estudio. El
anlisis estadstico consiste en calcular la probabilidad de
cometer este error y esperamos que sea menor al planteado
preliminarmente como nivel significancia.
Nivel de
Confianza
Es la confianza que debemos alcanzar para generalizar el
resultado de una muestra hacia toda la poblacin. Es el
complemento del nivel de significancia; es la confianza que
tenemos, de que la conclusin a la que hemos llegado es cierta.
Una probabilidad elevada nos da la tranquilidad de que lo que
hemos calculado es cercano a lo real y no debida al azar.

Sociedad Peruana de Bioestadstica


www.bioestadistico.com
Niveles Convenidos
a) = 5%
Existe 5% (0.05) de probabilidad de equivocarse y
95% (0.95) de confianza.

b) = 1%
Existe 1% (0.01) de probabilidad de equivocarse y
99% (0.99) de confianza.

Sociedad Peruana de Bioestadstica


www.bioestadistico.com
Definicin de Trminos
El error tipo I: Ocurre cuando afirmamos la hiptesis del
investigador, siendo que es falsa. Por lo tanto, es un juicio
de valor equivocado..

El p - valor: Es la probabilidad de equivocarse al aceptar


nuestra hiptesis del investigador como verdadera; es decir
la probabilidad de cometer un error tipo I.

El nivel de significancia: Es la mxima probabilidad de


error que estamos dispuestos aceptar para dar como vlida
nuestra hiptesis del investigador.

Sociedad Peruana de Bioestadstica


www.bioestadistico.com
Tests Paramtricos (TP) y No Paramtricos (TNP)
La mayora de test asume que las series de tiempo son
independientes e idnticamente distribuidos.

TP asume que las series de tiempo y los errores


(desviaciones respecto a la tendencia) sigue una
particular distribucin por lo general normalmente
distribuidos. TP son prcticos ya que ellos cuantifican el
cambio en los datos (p.e. cambio en la media o gradiente
de la tendencia). TP son generalmente mas poderosos
que TNP.

TNP son generalmente de libre distribucin


probabilstica. Ellos detectan la tendencia/cambio pero
no cuantifican el tamao de la tendencia/cambio. Ellos
son bastante usados porque la mayora de series
hidrolgicas tiene una distribucin no normal.
ANLISIS DE INDEPENDENCIA
SERIAL (aleatoriedad)

En la estadstica paramtrica se supone que


los datos provienen de observaciones
independientes, cosa que muchas veces no
ocurre en la realidad.
La auto correlacin complica la aplicacin
de test estadsticos ya que reduce el
numero real de valores a tomar en cuenta
de la muestra. Auto correlacin puede
tambin complicar la correlacin entre
series de tiempo
ANLISIS DE ESTACIONARIEDAD

El criterio de ESTACIONARIEDAD implica


que los datos deben estar libres de
TENDENCIA durante el periodo de
observacin. Una serie de tiempo de datos
hidrolgicos, se dice estrictamente
estacionaria, solo si sus propiedades
estadsticas (media, varianza y momentos de
orden superior) no son afectados por la
eleccin del momento de origen de la serie
de datos (Dahmen y Hall, 1990).
Porque las climatologas son por lo general
calculados en los ltimos 30 aos?
En resumen, la variabilidad interanual es
bastante alta. Muchos procesos climticos
tienen largas escalas de tiempo que pueden
influir en dcadas enteras de clima. Si se
predice una tendencia con slo 10 aos,
muchos de estos procesos ms duraderos no
han tenido tiempo de mostrar su rango
completo de influencia.
Vea lo que sucede con las tendencias previstas
en el grfico siguiente si se utilizan los ltimos
5, 10, 30, 50, 100 o 150 aos de datos.
Discusin
Es 30 aos una buena longitud de
tiempo para usar para calcular las
tendencias?
Cules son las ventajas y
desventajas de usar una ventana de
tiempo ms corta o ms larga para
calcular las tendencias?
Propsito de los test de Tendencia
Una serie de tiempo aleatoria de muchas estaciones han
sido recolectados sobre el mismo periodo de tiempo.
Nosotros desearamos saber si las series de tiempo en
general aumentan o disminuyen.
En trminos estadsticos es la determinacin si la
probabilidad de distribucin que tiene la serie ha
cambiado con el tiempo.
Para eso nosotros debemos describir el valor o tasa de
cambio, en trminos de cambio en base algun valor de
distribucin central como la media o la mediana.
Resultados espaciales son interesantes para el analisis.
Ejemplos de tendencia (1)

DESCENSO EN LOS CAUDALES DE -0.83% Y DE -0.81%


PARA LAS LLUVIAS Y LOS CAUDALES RESPECTIVAMENTE
Espinoza et al. (2006)
Tendencias significativas en verano (1965-2007) por estaciones
(VERANO)
Azul: positivos; Rojo: ngativos
LLUVIA TEMPERATURA EVAPOTRANSPIRACION

Lavado (2010)
TESTS ESTADISTICOS PARA TENDENCIAS
Tests para tendencias
Mann-Kendall (no- paramtrico)
Spearmans Rho (no- paramtrico)
Regresin Linear (paramtrico)
Tests para cambio en media/mediana
Distribucin Free CUSUM (no- parametrico)
Cumulative Deviation (paramtrico)
Worsley Likelihood Ratio (paramtrico)
Tests para diferencia en media/mediana en dos
diferentes periodos de la serie
Rank-Sum (no-parametrico)
Students t-test (paramtrico)
ATENCION
Debera tener una buena data y debera entender los
datos (va anlisis exploratorio de datos).

Debera entender los test estadsticos y sus supuestos.

Un test estadstico provee evidencia no prueba.

Significancia no es lo mismo que importancia ( p. e. un


cambio puede ser detectado, pero el tamao puede ser
bastante pequeo que no es importante en nuestro
anlisis).

Si H0 es rechazado, las razones de la tendencia/cambio


deberan ser investigado.

Potrebbero piacerti anche