Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Datos climticos
Observaciones
interpolados)
(datos
medidos;
Simulaciones o pronsticos
(posibilidad de variar condiciones
iniciales o de borde)
datos
Robustez y resistencia
Es deseable que un mtodo de anlisis de datos sea poco
sensible a suposiciones sobre la naturaleza de los datos.
P. ej., que los resultados no dependan esencialmente de que
los datos sigan una distribucin gaussiana.
Un mtodo es robusto cuando sus resultados no dependen
esencialmente de cul sea la distribucin de los datos.
Un mtodo es resistente si no es influido considerablemente
por unos pocos datos atpicos (outliers)
Ejemplo:
dados los conjuntos
{11 12 13 14 15 16 17 18 19}
y
{11 12 13 14 15 16 17 18 91}
Distintas medidas de tendencia central:
En ambos casos, el valor central es 15, pero
los promedios son 15 y 23 respectivamente.
Ej:
{7 -2 1 7 -3 4 0}
{-3 -2 0 1 4 7 7}
{7 -2 2 7 -3 4 0}
percentil 50
Cuantiles
Ej. 2) Sea ahora la muestra {7 1 7 -3 4 0}
Cul ser la mediana?
{-3 0 1 4 7 7}
Convencionalmente, se suele tomar el promedio entre los dos valores
centrales, o sea
(1 + 4) /2 = 2.5.
Pero, si no se tiene ms informacin, podra elegirse cualquier valor en ese
intervalo (1,4)
qp
p
P(X qp) = p
1- p
P(X qp) = 1 - p
Localizacin
N
Media
Mediana
i 1
q0.50
Localizacin
Ejemplo: (con muy pocos datos!!)
_
11
14
x 8
_
11
7004
x 1406
(outlier) ??
La media no es robusta ni resistente
Se puede estimar que P (X 9) ~ 0.5 ~ P(X 9)
Localizacin
Los cuantiles ms
usados
Mediana q0.5
Terciles, q0.33 , q0.66
Cuartiles, q0.25 , q0.75
Quintiles, deciles,
q0.05
q0.95
Trimedia
Matlab
Variable
Comando
media
mean
cuantil
quantile
percentil
prctile
mediana
median
Dispersin
Intervalo intercuartil
IQR = q0.75 - q0.25
(Robusto y resistente)
Dispersin
Desviacin estndar muestral
1
N 1
2
(x
i
x
)
(2 = varianza de la poblacin)
i 1
Simetra
Coeficiente de asimetra
de la muestra
Indice de Yule-Kendall
>0
<0
Boxplots (barritas)
Boxplots (barritas)
Min = 3.20
q0.50 = 60.345
q0.25 = 43.645
. .
Max = 124.27
q0.75 = 84.96
Histogramas
Adems
de
la
localizacin,
la
dispersin, y la simetra, tambin
muestran
si
los
datos
son
multimodales
Histogramas
Precipitacin Rivera agosto 1914-1997
25
mediana=78.5 mm
No. de ocurrencias
20
15
media = 97.9 mm
10
50
100
150
200
250
300
Histogramas
Precipitacin Rivera abril 1914-1997
mediana=110.5 mm
media = 141.7 mm
Histogramas
110.5 mm
mediana=110.5 mm
P(X110.5) = 0.5
P (X x)
Matlab
Variable
Comando
Desviacin
estndar,
varianza
std
var
Intervalo
intercuartil
iqr
Desv. abs. de
la mediana
mad
histograma
hist
Distr. de
frecuencia
acumulada
ecdf