Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Introduo
Dcada de 80
Extrao de informaes importantes a partir de um grande volume de dados
Dcada de 90
Anlise das informaes obtidas a partir de um grande volume de dados
Desenvolvimento da Minerao de
dados
Minerao
no
direcionada:
Na
minerao
de
dadosno
direcionadatentamos criar grupos de dados, ou achar padres em
dados existentes criando o grupo demogrfico "Me de Futebol", por
exemplo.
2. Integrao dos dados: etapa onde diferentes fontes de dados podem ser combinadas
produzindo um nico repositrio de dados.
3. Seleo: etapa onde so selecionados os atributos que interessam ao usurio. Por exemplo, o
usurio pode decidir que informaes como endereo e telefone no so de relevantes para
decidir se um cliente um bom comprador ou no.
Principais Tarefas
Analise de Regras de Associao: Uma regra de associao
um padro da forma X->Y, onde X e Y so conjuntos de valores Exemplo
cliente que compram po e tambm leite.
Classificao e Predio:
10
Principais Tarefas
Analise de Clusters (Agrupamento): Diferentemente da
classificao e predio onde os dados de treinamento esto
devidamente classificados e as etiquetas das classes so conhecidas, a
anlise de clusters trabalha sobre dados onde as etiquetas das classes
no esto definidas. Consiste em identificar agrupamentos de objetos,
agrupamentos estes que identificam uma classe. Exemplo: Grupos
homogneos de clientes.
Analise de Outliers
11
Avaliar Padres
12
Sistemas comerciais
13
Estudo de Caso
14
Ele tambm tem uma API geral, assim possvel incorporar o WEKA,
como qualquer outra biblioteca, a seus prprios aplicativos para fazer
coisas como tarefas de minerao de dados automatizadas no lado do
servidor.
15
16
17
Introduo de Regresso
Desenvolvimento regresso
18
Tamanho
da casa
Tamanho
(ps
Quartos
do lote
quadrad
os)
Granito
Banheiro
Preo de
reformad
venda
o?
3529
9191
$205,00
0
3247
10061
$224,90
0
4032
10150
$197,90
0
2397
14156
$189,90
0
2200
9600
1`
$195,00
0
3536
19994
$325,00
0
2983
9365
$230,00
0
19
Aplicao
20
21
22
23
24
25
26
O granito no tem importncia O WEKA s usa as colunas que contribuem estatisticamente para a preciso do modelo (medido
em R ao quadrado, mas que est fora do escopo deste artigo). Ele descarta e ignora as colunas que no ajudam a criar um bom
modelo. Assim, este modelo de regresso est nos dizendo que o granito da cozinha no afeta o valor da casa.
J os banheiros so importantes Como usamos um simples valor 0 ou 1 para um banheiro reformado, podemos usar o
coeficiente do modelo de regresso para determinar o valor que um banheiro reformado representa para o valor da casa. O
modelo nos diz para acrescentarmos $42.292 ao valor da casa.
Casas maiores reduzem o valor O WEKA est nos dizendo que quanto maior for nossa casa, menor ser o preo de venda? Isto
pode ser visto pelo coeficiente negativo na frente da varivel houseSize. O modelo est nos dizendo que cada p quadrado
adicional da casa reduz seu preo em $26? Isso no faz nenhum sentido. Estamos na Amrica! Maior melhor, especialmente
onde moro, no Texas. Como devemos interpretar isto? Este um bom exemplo de lixo entrando, lixo saindo. O tamanho da casa,
infelizmente, no uma varivel independente porque est relacionado varivel dos quartos, o que faz sentido porque casas
maiores tendem a ter mais quartos. Assim, nosso modelo no est perfeito. Mas ns podemos consertar isso. Lembre-se: Na guia
Preprocess possvel remover colunas do conjunto de dados. Para sua prpria prtica, remova a coluna houseSize e crie outro
modelo. Como isso afeta o preo de minha casa? Este novo modelo faz mais sentido? (O valor de minha casa agora : $217,894).
27
Concluso
28
Referncias