Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Objetivos
Referencial Teórico
Metodologia dos Experimentos
Experimentos
Resultados
Conclusão
24 de junho de 2010
Motivação
Crescimento espantoso da audiência das Redes Sociais na Web;
Público passa a ganhar maior espaço de decisão e transformação de
conteúdo;
Interesse em captar a percepção de usuários sobre determinados
temas, marcas ou produtos.
Objetivos
Problema
Como captar de forma fácil e eficiente a percepção dos usuários e como
identificar o sentimento por trás das postagens?
Ideia
Aplicar algoritmos de classificação (previsão de classes) a fim de se obter
informação quantitativa e qualitativa dos posts.
Proposta
Estudar, aplicar e comparar algoritmos de classificação de texto buscando
a melhor técnica para detectar o sentimento presente em posts no Twitter.
Naive Bayes
Naive Bayes
P(tokeni |classe)P(classe)
P(classe|documento) = P(tokeni )
Metodologia
API Twitter
Interface de exibição e classificação do conteúdo
Acurácia
Matriz de Confusão
Experimentos
Velox
Caracterı́sticas
413 postagens
333 negativos, 36 neutros, 44 positivos
Velox
SVM
Cross-validation: (341/413) 82,6%
a b c
a - neg 330 0 3
b - neu 34 2 0
c - pos 35 0 9
Velox
Bayes
Cross-validation: (313/413) 75,8%
a b c
a - neg 294 20 19
b - neu 26 3 7
c - pos 25 3 16
Velox
Considerações:
SVM obteve melhores resultados com validação cruzada
Bayes apresentou resultados superiores ao SVM quando o arquivo de
treino era relativamente grande (40% da base) (Acurácia: 89.1% e
92.2% quando a distribuição no treino era equivalente)
Tanto o Bayes(=54%) quanto o SVM(=44%) obtiveram resultados
inferiores quando o treino foi balanceado.
Honda
Caracterı́sticas
188 postagens
16 negativos, 164 neutros, 8 positivos
Honda
SVM
Cross-validation: (163/188) 86,7%
a b c
a - neg 2 14 0
b - neu 2 161 1
c - pos 0 8 0
Honda
Bayes
Cross-validation: (154/188) 82,3%
a b c
a - neg 6 10 0
b - neu 5 151 5
c - pos 0 7 1
Honda
Considerações:
SVM obteve melhores resultados com a validação cruzada
Bayes apresentou resultados superiores ao SVM com arquivo de treino
maior (40% da base) (Acurácia: 95.6%)
O Bayes obteve acurácia de 55.1% contra 90.9% do SVM quando o
treino foi feito balanceado.
Conclusão