Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
RA 074342
Negativo atual
Positivo previsto
TP
FP
Negativo previsto
FN
TN
Com esses dados, podemos definir a taxa de falso positivo (FPR) como a frao de
exemplos negativos que so classificados erroneamente como positivo, a taxa de
verdadeiro positivo (TPR) como a frao de exemplos positivos que so classificados
corretamente, Recall (que vai ser o mesmo que a taxa de verdadeiro positivo) e
Precision, que mede a frao de exemplos classificados como positivos que so
verdadeiramente positivos, ou seja:
FP
F P R = FP+TN
TP
T P R = TP+FN
TP
Recall = TP+FN
TP
P recision = TP+FP
rvores de Deciso
Para os dados passados, relativos a presena ou no de um espcime em certos locais
sob certas condies ambientais, possuimos 6 atributos, sendo 5 numricos
(temperatura mdia, umidade mdia, altura de chuva mensal, precipitao em 21 dias,
nmero de dias chuvosos no ms) e 1 categrico (local), que possuem as seguintes
configuraes:
Temperatura mdia:
Mnimo: 12,82
Mximo: 21,98
Mdia: 18,448
Desvio padro: 2,965
Umidade mdia:
Mnimo: 68,38
Mximo: 97,83
Mdia: 90,306
Desvio padro: 7,247
Altura de chuva mensal (mm):
Mnimo: 9
Mximo: 273,7
Mdia: 107,779
Desvio padro: 71,769
Precipitao em 21 dias (mm):
Mnimo: 0
Mximo: 216,9
Mdia: 85,179
Desvio padro: 62,745
rvore de deciso
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
no_pessoas = 4
| preco_compra = vhigh
| | preco_manutencao = vhigh: unacc (12.0)
| | preco_manutencao = high: unacc (12.0)
| | preco_manutencao = med
| | | tam_bagagem = small: unacc (4.0)
| | | tam_bagagem = med: unacc (4.0/2.0)
| | | tam_bagagem = big: acc (4.0)
| | preco_manutencao = low
| | | tam_bagagem = small: unacc (4.0)
| | | tam_bagagem = med: unacc (4.0/2.0)
| | | tam_bagagem = big: acc (4.0)
| preco_compra = high
| | tam_bagagem = small: unacc (16.0)
| | tam_bagagem = med
| | | no_portas = 2: unacc (4.0)
| | | no_portas = 3: unacc (4.0)
| | | no_portas = 4: acc (4.0/1.0)
| | | no_portas = 5more: acc (4.0/1.0)
| | tam_bagagem = big
| | | preco_manutencao = vhigh: unacc (4.0)
| | | preco_manutencao = high: acc (4.0)
| | | preco_manutencao = med: acc (4.0)
| | | preco_manutencao = low: acc (4.0)
| preco_compra = med
| | preco_manutencao = vhigh
| | | tam_bagagem = small: unacc (4.0)
| | | tam_bagagem = med: unacc (4.0/2.0)
| | | tam_bagagem = big: acc (4.0)
| | preco_manutencao = high
| | | tam_bagagem = small: unacc (4.0)
| | | tam_bagagem = med: unacc (4.0/2.0)
| | | tam_bagagem = big: acc (4.0)
| | preco_manutencao = med: acc (12.0)
| | preco_manutencao = low
| | | tam_bagagem = small: acc (4.0)
| | | tam_bagagem = med: acc (4.0/2.0)
| | | tam_bagagem = big: good (4.0)
| preco_compra = low
| | preco_manutencao = vhigh
| | | tam_bagagem = small: unacc (4.0)
| | | tam_bagagem = med: unacc (4.0/2.0)
| | | tam_bagagem = big: acc (4.0)
| | preco_manutencao = high: acc (12.0)
| | preco_manutencao = med
| | | tam_bagagem = small: acc (4.0)
| | | tam_bagagem = med: acc (4.0/2.0)
| | | tam_bagagem = big: good (4.0)
| | preco_manutencao = low
| | | tam_bagagem = small: acc (4.0)
| | | tam_bagagem = med: acc (4.0/2.0)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Redes Bayesianas
Foram fornecidas 1000 amostras e 8 variveis, sendo que a segunda varivel ter
valor de 1 a 7, e as outras sero binrias (tero valores 1 para falso e 2 para verdadeiro).
A rede bayesiana resultante ser a seguinte:
Tabelas de probabilidades:
Varivel (1):
(1) = 1
(1) = 2
0,5014
0,4986
Varivel (2):
(2) = 1
(2) = 2
(2) = 3
(2) = 4
(2) = 5
(2) = 6
(2) = 7
(5) = 1
0,2633
0,1904
0,1769
0,1641
0,1182
0,0655
0,0216
(5) = 2
0,1159
0,1414
0,1283
0,1261
0,1657
0,1548
0,1677
(3) = 1
(3) = 2
(4) = 1
0,3373
0,6627
(4) = 2
0,9802
0,0198
(4) = 1
(4) = 2
(5) = 1
0,5949
0,4051
(5) = 2
0,7509
0,2491
Varivel (3):
Varivel (4):
Varivel (5):
(5) = 1
(5) = 2
0,1481
0,8519
Varivel (6):
(6) = 1
(6) = 2
(5) = 1,
(8) = 1
0,8788
0,1212
(5) = 1,
(8) = 2
0,5888
0,4112
(5) = 2,
(8) = 1
0,0528
0,9472
(5) = 2,
(8) = 2
0,1587
0,8413
Varivel (7):
(7) = 1
(7) = 2
0,5028
0,4972
Varivel (8):
(8) = 1
(8) = 2
0,4820
0,5180
TensorFlow
O TensorFlow uma biblioteca open source para machine learning e deep
learning que funciona utilizando grafos de fluxo de dados.
O Google usa o TensorFlow em vrias aplicaes, desde reconhecimento de voz,
traduo de linguas, Smart Reply no Inbox (que sugere respostas rpidas a emails), at
para melhorar o resultado de buscas como por exemplo a busca na plataforma Google
Photos.
Os usurios podem utilizar essa plataforma atravs da criao de grafos de fluxo
de dados, aonde os ns representam operaes matemticas, enquanto as arestas
representam vetores de dados multidimensionais (chamados de tensors) entre as
operaes. Por ter uma arquitetura flexivel, permite implantar esse processamento em
um ou mais CPUs (ou GPUs), desde desktops, servidores ou mesmo em um celular
utilizando a mesma API.
O fluxo de informao feito atravs da criao de grafos de fluxo de dados..
Bibliografia
(1) Dados usados para experimento do WEKA
https://drive.google.com/file/d/0B4AWZfNeWl7DVHlaanBBRDJ3YXc/view?usp=sharing