Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
I.
manuscritos;
INTRODUO
A. Base de dados
As imagens de dgitos foram extradas da base NIST
SD19 [5], que uma base de formulrios numricos,
disponibilizada pelo NIST (National Institute of Standards
and Technology, dos Estados Unidos da Amrica). Cada
imagem contm variadas quantidades de dgitos, como se
pode ver na Figura 1.
A. Estatstica descritiva
Calculamos a mdia, desvio padro e mediana dos
algoritmos em estudo (Tabela I). No foi includa a moda nas
medidas pelo fato de os dados serem contnuos. Como pode
se observar na Tabela I, as mdias e medianas so bastante
prximas para cada classificador. Isso indica certa tendncia
normalidade visto que na distribuio normal, a mdia e a
mediana so iguais.
TABELA 1: ESTATSTICA DESCRITIVA DOS ALGORITMOS
Poli1
Poli2
Poli3
RBF8
RBF9
RBF10
RBF11
Mdia
0,9298793
0,9591030
0,9593137
0,9653980
0,9671793
0,9675053
0,9669787
Mediana
0,92923
0,95857
0,959
0,965495
0,96716
0,967405
0,967105
C. Implementaes
As implementaes deste trabalho foram realizadas em
dois softwares/linguagens: o R [9] e o MATLAB [10].
Especificamente, no R se fez toda a parte de anlise dos
dados, e a maior parte dos testes de hiptese (com exceo
do teste de Lilliefors, que foi feito no MATLAB).
D. Variveis estudadas
Basicamente, a varivel a ser estudada e analisada na
pesquisa a taxa de acerto mdia dos classificadores. Isso
ocorre porque se deseja verificar se os desempenhos deles
so equivalentes ou no, e de forma natural, determinar qual
classificador apresenta melhor desempenho. Assim, os testes
de hiptese visam dar suporte determinao da melhor
configurao de parmetros do classificador de dgitos
manuscritos utilizado.
No se fez uma anlise de tempo porque como estamos
estudando vrias configuraes do mesmo algoritmo, os
tempos de treinamento so praticamente os mesmos, no
importando o classificador em questo.
IV.
ANLISE EXPLORATRIA
B. Testes de aderncia
A confirmao das amostras seguirem uma distribuio
normal foi obtida realizando os testes de aderncia. Dois
testes foram executados com as amostras padronizadas:
Kolmogorov-Smirnov [11] e Lilliefors [12] (Tabela 2). A
padronizao dos dados foi necessria porque os testes se
baseiam na diferena entre a distribuio normal padro e a
distribuio da amostra. Logo, se as amostras no so
padronizadas, o resultado do teste tende a rejeitar a hiptese
de normalidade, j que provavelmente no se tem amostras
com mdia zero, e varincia um, como a normal padro.
Em todas as tabelas, adotamos a conveno Poli para
os ncleos polinomiais, e o parmetro interno de cada funo
kernel descrito pelo nmero ao lado do nome da funo.
V.
RESULTADOS
Poli1
Poli2
Poli3
RBF8
RBF9
RBF10
RBF11
P-values
Kolmogorov-Smirnov
0,7350677
0,9120706
0,9595365
0,8051991
0,8966829
0,6535829
0,7211455
Lilliefors
0,2612
0,5000*
0,5000*
0,3613
0,5000*
0,2236
0,2981
Poli1
Poli2
Poli3
RBF8
RBF9
RBF10
RBF11
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
Poli2
Poli3
Poli2
Poli3
RBF8
RBF9
RBF10
RBF11
RBF8
Poli1
RBF9
Poli2
RBF10
Poli3
RBF8
RBF9
RBF10
Poli1
Poli2
>
Poli2
Poli3
RBF8
RBF9
RBF10
RBF11
8,481e-28
1,0000000
4,851e-27
1,0000000
9,382e-29
1,0000000
1,277e-29
1,0000000
2,960e-30
1,0000000
9,105e-30
1,0000000
0,7636
7,367e-11
1,0000000
3,402e-14
1,0000000
5,526e-14
1,0000000
9,580e-13
1,0000000
2,641e-13
1,0000000
1.855e-15
1,0000000
3.343e-16
1,0000000
4.377e-16
1,0000000
4,542e-11
1,0000000
5,073e-09
1,0000000
5,850e-06
0.9999971
0,0372400
0,98138
0,3696756
Poli3
Poli2
Poli3
RBF8
RBF9
RBF10
RBF11
1.50000
1.56667
3.28333
4.91667
5.30000
4.43333
0.06667
1.78333
3.41667
3.80000
2.93333
1.71667
3.35000
3.73333
2.86667
1.63333
2.01667
1.15000
0.383333
0.483333
RBF8
Poli1
RBF9
Poli2
RBF10
Poli3
RBF8
RBF9
RBF10
0.866667
0,000975
0,000487
VI.
CONCLUSES
[4]
REFERNCIAS
[11]
[1]
[2]
[3]
[5]
[6]
[7]
[8]
[9]
[10]
[12]
[13]