Sei sulla pagina 1di 8

Aula Prática

Classificação
EXERCÍCIO 1
• Entre no Weka e carregue o arquivo golf.arff (preprocess/open
file)
• Examine os dados
• escolha a aba de Classificação (Classify) e selecione o
classificador J48 (Choose/Trees/J48) e execute com os
parâmetros default (start)
• Compreenda a saída fornecida
• Visualize a árvore gerada (clicando com o botão direito na
lista de resultados e escolhendo visualize tree)
Outros classificadores no Weka
• Nome de alguns classificadores vistos em aula, no Weka:
– C 4.5: Choose/trees/J48
– ID3: Choose/trees/Id3
– naïve bayes: Choose/bayes/NaiveBayes
– k-NN: Choose/lazy/IBk
– SVM: Choose/functions/SMO
– Rede neural backpropagation: Choose/functions/MultilayerPerceptron
Exercício 2
• Carregue o arquivo iris.arff (150 registros)
• Execute o classificador J48 com os parâmetros default.
• Se familiarize com o formato da saída fornecida, incluindo a matriz de
confusão
• Visualize a árvore gerada
• Visualize os erros de classificação. No gráfico, como se diferenciam as
instancias corretamente das incorretamente classificadas? Como pode-se ver
informações detalhadas de uma instância (registro)?
• Execute outras formas de avaliação e verifique o efeito:
– Use training set (usa para teste o mesmo arquivo do treinamento)
– Percentage split (divide o arquivo em uma parte para o treinamento e outra para o
teste)
• Use outros algoritmos de classificação e anote o seu nome e o resultado
(acurácia)
• Qual foi o melhor algoritmo?
EXERCÍCIO 3
• Carregue o arquivo credit-g.arff (arquivo com dados para decisão
sobre crédito bancário, com 1000 registros)
• Use percentage split como método de avaliação (o número de
registros é razoavelmente grande).
• Para este problema, considere que um falso positivo (prever que a
classe é good quando na verdade é bad) tem um custo 5 vezes
maior que o de um falso negativo.
• Encontre o menor custo com o J48 (usando a matriz de confusão ),
considerando os custos:
VP=-1; VN=-1; FP=5; FN=1.
• Utilizando os valores default dos parâmetros, teste com outros
classificadores e anote o resultado em uma tabela com:
classificador, acurácia, custo, tempo de execução
EXERCÍCIO 4
• Abra o arquivo hepatitis.arff
• Execute o J48 com os parâmetros default. Salve o
resultado. Execute outros classificadores e anote o
resultado.
• Qual o melhor? Compare as matrizes de confusão
geradas pelos diversos classificadores
Exercício 5
• Abra o arquivo mushroom.arff.
• Utilize alguns algoritmos de classificação. Faça
uma tabela com o classificador e acurácia
obtida. Qual o melhor resultado, com que
classificador?
Salvar e utilizar o modelo de classificação
Salvar:
1. executar o algoritmo de classificação (por exemplo, o J48) para realizar o
treinamento (geração do modelo)
2. Clique o botão direito sobre o modelo que deve ser salvo, na Results list
3. Selecione Save model e salve o modelo.

Carregar (o modelo salvo anteriormente)


1. Carregue os dados de teste usando a opção Supplied test set
2. Clique o botão direito na Results list, selecione Load model e escolha o
modelo salvo para carregar
3. Selecione Re-evaluate model on current test set

OBS:
- o arquivo usado para teste deve conter os mesmos nomes de atributos e os mesmos
tipos que o arquivo usado para gerar o modelo.
- Quando se carrega um arquivo CSV, o primeiro registro é usado para nomear os atributos.

Potrebbero piacerti anche