Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Outliers
Outliers
1
28/04/2009
2
28/04/2009
Outliers - 3 fases
Seleo de outlier
Verificao dos outlier
O que fazer com as observaes
discordantes ?
3
28/04/2009
Outliers
Outliers
4
28/04/2009
Outliers
Boxplot
10
10
5
28/04/2009
Boxplot
Pode ser encarada como a representao
grfica de algumas medidas de localizao:
mediana
Q1 Q3 outliers e extremos
11
11
6
28/04/2009
modelo de discordncia
considerada a hiptese nula, segundo a qual a amostra foi
retirada de uma populao com distribuio especfica que pode
ou no ser conhecida e ser especificada completamente ou no, e
onde no existem observaes "anormais".
Em oposio, a hiptese alternativa considera que todas as
observaes ou apenas as "anormais" tm uma distribuio
diferente da hiptese nula.
A hiptese nula ser rejeitada em favor da hiptese alternativa se
existirem observaes aberrantes.
13
7
28/04/2009
Outliers
8
28/04/2009
Exemplo: IRIS
18
9
28/04/2009
Exemplo: IRIS
19
Exemplo: IRIS
20
10
28/04/2009
Exemplo: IRIS
21
Exemplo: IRIS
22
11
28/04/2009
12
28/04/2009
Outliers
13
28/04/2009
14
28/04/2009
Outliers
15
28/04/2009
Outliers
16
28/04/2009
33
Referncias
Data Mining: concepts and techniques, de Han, J. &
Kamber, M., Morgan Kaufmann , 2001
Efficient Algoritms for Mining Outliers from Data sets.
Sridhar Ramaswamy, Rajeev Ratogi e Kyuseok Shim.
2000
Outlier Detection for High Dimensional Data. Charu C.
Aggarwal e Philip S. Yu. 2001
Identification of Outliers, D. Hawkins, Chapman and Hall,
London, 1980.
17