Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
SELEÇÃO DE EQUAÇÕES DE REGRESSÃO
Três fases distintas de ajuste e seleção de
equações de regressão (Loetsch et al., 1973):
VII SELEÇÃO DE REGRESSÃO E CRITÉRIOS
ESTATÍSTICOS • Seleção de um número de árvores amostrais
suficientes e representativas;
• Medição das variáveis dependentes e
independentes;
Prof. Paulo Renato Schneider
• Seleção da melhor equação mediante certos
critérios estatísticos.
CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES
• Coeficiente de determinação (R2) • Erro padrão da estimativa (Syx)
Expressa a quantidade da variação total explicada pela • O erro padrão da estimativa é uma medida de dispersão entre os
valores observados e estimados pela regressão, sendo desejável
regressão aquele que tenha o menor valor.
• Coeficiente de determinação ajustado (R2aj) • Erro padrão em percentagem, como alternativa para a
comparação de equações com variáveis dependentes de
Ajustado para o número de coeficientes da equação diferentes unidades (Meyer , 1938).
1
15/06/2019
CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES
CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES
Sendo: N = número de observações; P = número de coeficientes; Y = variável dependente; Syx = erro padrão da
• Transformação para logarítmo decimal, a equação de Furnival será: estimativa.
• Índice de Furnival Relativo (IF%)
Sendo: N = número de observações; P = número de coeficientes; Y = variável dependente; Syx = erro padrão da estimativa.
2
15/06/2019
CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES EXEMPLO: CÁLCULO DO INDICE DE FURNIVAL
EXEMPLO: CÁLCULO DO INDICE DE FURNIVAL CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES
D
14
H
16
V
78
LOG V
1,8921
LN V
4,3567 • Distribuição dos resíduos
14 20 85 1,9294 4,4427
14
14
14
16
67
71
1,8261
1,8513
4,2047
4,2627 Essa análise permite detectar possíveis
16 32 170 2,2304 5,1358
16
16
24
20
124
115
2,0934
2,0607
4,8203
4,7449
tendências de ajuste ao longo da linha de
18
18
20
36
40
48
215
274
300
2,3324
2,4378
2,4771
5,3706
5,6131
5,7038
regressão para a tomada de decisão quanto a
Soma
Média 149,9
21,1307
2,1131
48,6553
4,8655
utilização ou não do modelo.
Símbolo Eq.1 Eq.2 Eq.3 Eq.4
Syx 19,1455 14,1736 0,0323 0,0744
∑ log V 0 0 21,1307 21,1307
∑ log V/N 0 0 2,1131 2,1131
antilog.2,3026 1 1 298,7384
Sendo: Ei = resíduo da i‐ésima observação; = variável dependente observada; = variável
antilog 129,7396
dependente estimada pela regressão;
IF 28,5617 20,1132 13,6938 13,6986
CV(%) 12,7722 9,45537 1,5286 1,5291
R aj.
2 0,9507 0,973 0,9825 0,9825
3
15/06/2019
CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES TESTES DE ADERÊNCIA DE MODELOS DE REGRESSÃO
• Discrepância logarítmica • Teste de Anderson‐Darling
A transformação das variáveis ocasiona erros sistemáticos definidos com
discrepância logarítmica
A discrepância logarítmica origina‐se quando é determinada antilogaritmo
da variável dependente estimada.
Expressão para se obter a média aritmética da variável dependente
estimada (MEYER, 1944):
• Para logaritmo decimal:
Sendo:
ni = número de árvores na iéssima combinação de idade da amostra;
xj = diâmetro, ordenado em ordem ascendente em cada combinação de idade da amostra
• Para logaritmo neperiano:
a, b, c = parâmetros da distribuição de Weibull.
TESTES DE ADERÊNCIA DE MODELOS DE REGRESSÃO TESTES DE ADERÊNCIA DE MODELOS DE REGRESSÃO
Sendo: Sendo:
F(x) = probabilidade de freqüência observada na classe i; n = número de observações;
F’(x) = probabilidade de freqüência estimada na classe i; SQE = soma de quadrados do erro;
Fi = probabilidade de freqüência estimada na classe i; p = número de coeficientes do modelo.
n = freqüência total.
4
15/06/2019
TESTES DE ADERÊNCIA DE MODELOS DE REGRESSÃO TESTES DE ADERÊNCIA DE MODELOS DE REGRESSÃO
Sendo: Sendo:
p = número de coeficientes do modelo; ni = número de árvores na i‐éssima combinação de idade‐amostra;
= quadrado médio do erro do modelo considerado; xj = diâmetro, ordenado em ordem crescente em cada combinação de idade‐amostra
= quadrado médio do modelo completo; n = número de observações.
TESTES DE ADERÊNCIA DE MODELOS DE REGRESSÃO TESTES DE ADERÊNCIA DE MODELOS DE REGRESSÃO
• Teste de Reynolds • Teste de Shapiro‐Wilk
O teste de Shapiro‐Wilk é recomendado para amostras pequenas,
com número inferior a 2000 observações
Sendo:
= índice do erro das i‐éssima combinação de idade‐amostra;
nik e = número de árvores por hectare observadas e estimadas por classe de diâmetro na classe k de
uma i‐éssima combinação de idade‐amostra;
Sendo:
x(i) = valores ordenados;
x(1) = menor valor da amostra;
ai = constante gerada pela média, variância e covariância da amostra normal.
5
15/06/2019
TESTES DE VALIDAÇÃO DE MODELOS DE REGRESSÃO TESTES DE VALIDAÇÃO DE MODELOS DE REGRESSÃO
• a) Tendência absoluta (Bias): • d) Desvio padrão residual (S):
• b) Tendência relativa (Bias %):
• e) Desvio padrão residual relativo (S%):
• c) Eficiência (E):
• f) Desvio médio (D):
TESTES DE VALIDAÇÃO DE MODELOS DE REGRESSÃO TESTES DE VALIDAÇÃO DE MODELOS DE REGRESSÃO
• g) Desvio médio relativo (D%): • j) Desvio médio absoluto em percentagem (e %):
• h) Qui‐quadrado: Sendo:
= valor observado da densidade de árvores por hectare
= valor média das densidades de árvores por hectare,
= valor estimado de densidade de árvores por hectare,
n = número de observações.
• i) Desvio médio absoluto (e):
6
15/06/2019
VALOR PONDERADO DE ESCORES ESTATÍSTICOS UNIDADE DA EQUAÇÃO
• O valor ponderado é determinado atribuindo‐se valores ou pesos às • A unidade de uma equação de regressão traz um
estatísticas calculadas.
grande reflexo na sua precisão, produzindo
• As estatísticas são ordenadas de acordo com sua eficiência, sendo atribuído valores maiores ou menores no erro padrão da
peso 1 para a equação mais eficiente e pesos crescentes para as demais
equações (ranking) (Thiersch, 1997). estimativa.
• Valor ponderado de uma equação: • É importante observar com atenção a unidade da
variável dependente para a definição do erro
padrão da estimativa.
• Na comparação ou seleção de equações não se
Sendo: Pi = peso da iésima colocação; Nri = número de registros que obtiveram a iésima colocação;
VP= valor ponderado da equação.
pode utilizar o erro padrão da estimativa de
equações com unidades diferentes.
MODELOS DE RELAÇÃO HIPSOMÉTRICA MODELOS VOLUMÉTRICOS
7
15/06/2019
MODELOS SIGMOIDAIS DE CRESCIMENTO EXEMPLO: SELEÇÃO DE EQUAÇÕES DE VOLUME
25 Logística 2 Schumacher-Hall
3 Spurr Logarítmica
26 Richards
4 Schumacher-Hall Log.
EXEMPLO: SELEÇÃO DE EQUAÇÕES DE VOLUME
Coeficientes
Eq. R²Aj. Syx IF CV% F
b0 b1 b2 b3/b4
1 0,0045 0,0004 - - 0,85 0,0199 0,0322 28,14 583,39