Sei sulla pagina 1di 8

15/06/2019

SELEÇÃO DE EQUAÇÕES DE REGRESSÃO

Três fases distintas de ajuste e seleção de 
equações de regressão (Loetsch et al., 1973): 
VII SELEÇÃO DE REGRESSÃO E CRITÉRIOS 
ESTATÍSTICOS • Seleção de um número de árvores amostrais 
suficientes e representativas;
• Medição das variáveis dependentes e 
independentes; 
Prof. Paulo Renato Schneider
• Seleção da melhor equação mediante certos 
critérios estatísticos.

CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES

• Coeficiente de determinação (R2) • Erro padrão da estimativa (Syx)
Expressa a quantidade da variação total explicada pela  • O erro padrão da estimativa é uma medida de dispersão entre os 
valores observados e estimados pela regressão, sendo desejável 
regressão aquele que tenha o menor valor.

• Coeficiente de determinação ajustado (R2aj) • Erro padrão em percentagem, como alternativa para a 
comparação de equações com variáveis dependentes de 
Ajustado para o número de coeficientes da equação diferentes unidades (Meyer , 1938).

Sendo: K = número de variáveis independentes da equação; N = número de  • Sendo:  = erro padrão da estimativa;   = erro padrão da estimativa em percentagem;   = média 


aritmética da variável dependente; QMresíduo = quadrado médio do resíduo, obtido na análise da variância.
observações; R² = coeficiente de determinação.

1
15/06/2019

CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES

• Índice de Furnival (IF) • Índice de Furnival (IF)


O Índice de Furnival permite a comparação de equações  Quando da transformação da variável dependente (Y) para 
ponderadas ou não com as variáveis dependentes transformadas  logaritmo decimal (log Y) a derivada primeira será (Y’)‐1  tem‐
para logaritimo. se o  índice:
O Índice de Furnival (IF) é obtido em três etapas:
a) Ajuste da regressão com os dados e determinação do erro 
padrão da estimativa;
b) Determinação das médias geométricas de todas as variáveis  Então, a derivada parcial resulta:
dependentes com auxílio do logaritmo;
c) O erro padrão da estimativa deve ser multiplicado pelo Índice 
de Furnival

• FURNIVAL, G. M. An index for comparing equations used in constructing vlume tables. Forest 


Science, Bethesda, v.7, n.4, p.337‐441, 1961.
Sendo: I = Índice; N = número de observações; Y = variável dependente transformada.

CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES

• Índice de Furnival (IF) Para a variável dependente transformada ou não  há necessidade 


Transformação para logarítmo neperiano (ln Y), a equação de Furnival de fazer a correção do erro padrão da estimativa, o que resulta no 
será:
Índice de Furnival expresso por: 

Sendo: N = número de observações; P = número de coeficientes;     Y = variável dependente; Syx = erro padrão da 
• Transformação para logarítmo decimal, a equação de Furnival será: estimativa.

• Índice de Furnival Relativo (IF%)

Sendo: N = número de observações; P = número de coeficientes;     Y = variável dependente; Syx = erro padrão da estimativa.

• SILVA, J.A. da; BAILEY, R.L. Considerações teóricas sobre o uso concreto do índice de Furnival na seleção de equações 


volumétricas. Revista Árvore. Viçosa, v.15, n.3, p.323‐327, set./dez., 1991.
Sendo: IF = Índice de Furnival; Y = variável dependente

2
15/06/2019

CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES EXEMPLO: CÁLCULO DO INDICE DE FURNIVAL

• Índice de Furnival (IF):  Equações ajustadas:


Derivada primeira da  variável dependente transformada (Alder, 1980)

Variável dep. Recíproca da  Cálculo 


1. V = b1.d + b2.h
transformada derivada 1ª (f’(Y)‐1) IF
Sem 1 log(1) = 0 (nulo)
2. V = b0 + b1.d + b2.h
log (Y) 2,3026 log(Y). 2,3026
ln (Y) Y log (Y)
Yk 1/(K.Yk‐1) log(1/(K.YK‐1) 3. logV = b0 + b1.d + b2.h
Y/W W log(W)
1/Y ‐Y2 log(‐Y2) 4. lnV = b0 + b1.lnd + b2.lnh
2.      log(2.      )
• ALDER, D. Forest volume estimation and yield prediction: yield prediction. V.2, Roma. FAO. 1980.

EXEMPLO: CÁLCULO DO INDICE DE FURNIVAL CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES

D
14
H
16
V
78
LOG V
1,8921
LN V
4,3567 • Distribuição dos resíduos
14 20 85 1,9294 4,4427
14
14
14
16
67
71
1,8261
1,8513
4,2047
4,2627 Essa análise permite detectar possíveis 
16 32 170 2,2304 5,1358
16
16
24
20
124
115
2,0934
2,0607
4,8203
4,7449
tendências de ajuste ao longo da linha de 
18
18
20
36
40
48
215
274
300
2,3324
2,4378
2,4771
5,3706
5,6131
5,7038
regressão para a tomada de decisão quanto a 
Soma
Média 149,9
21,1307
2,1131
48,6553
4,8655
utilização ou não do modelo.
Símbolo Eq.1 Eq.2 Eq.3 Eq.4
Syx 19,1455 14,1736 0,0323 0,0744
∑ log V 0 0 21,1307 21,1307
∑ log V/N 0 0 2,1131 2,1131
antilog.2,3026 1 1 298,7384
Sendo: Ei = resíduo da i‐ésima observação; = variável dependente observada; =  variável 
antilog 129,7396
dependente estimada pela regressão;
IF  28,5617 20,1132 13,6938 13,6986
CV(%) 12,7722 9,45537 1,5286 1,5291
R aj.
2 0,9507 0,973 0,9825 0,9825

3
15/06/2019

CRITÉRIOS PARA SELEÇÃO DE EQUAÇÕES TESTES DE ADERÊNCIA DE MODELOS DE REGRESSÃO

• Discrepância logarítmica • Teste de Anderson‐Darling
A transformação das variáveis ocasiona erros sistemáticos definidos com 
discrepância logarítmica
A discrepância logarítmica origina‐se quando é determinada antilogaritmo
da variável dependente estimada.
Expressão para se obter a média aritmética da variável dependente 
estimada (MEYER, 1944):
• Para logaritmo decimal:
Sendo: 
ni = número de árvores na iéssima combinação de idade da amostra; 
xj = diâmetro, ordenado em ordem ascendente em cada combinação de idade da amostra
• Para logaritmo neperiano:
a, b, c = parâmetros da distribuição de Weibull.

Sendo: Yv = estimativa corrigida; Syx2 = quadrado do erro padrão da estimativa; 


Vd = variável dependente calculada

TESTES DE ADERÊNCIA DE MODELOS DE REGRESSÃO TESTES DE ADERÊNCIA DE MODELOS DE REGRESSÃO

• Teste de Cramer ‐ von Mises • AIC (Akaike Information Criterion)

Sendo:   Sendo:
F(x)  = probabilidade de freqüência observada na classe i;  n = número de observações; 
F’(x)  = probabilidade de freqüência estimada na classe i;  SQE = soma de quadrados do erro; 
Fi =  probabilidade de freqüência estimada na classe i;  p = número de coeficientes do modelo.
n = freqüência total. 

4
15/06/2019

TESTES DE ADERÊNCIA DE MODELOS DE REGRESSÃO TESTES DE ADERÊNCIA DE MODELOS DE REGRESSÃO

• CP de Mallow • Teste de Kolmogorov‐Smirnov – KS 


A estatística de Mallow é muito utilizada na modelagem de equações, pois  O teste de Kolmogorov‐Smirnov é recomendado para amostras com 
mede o ganho de precisão com a inclusão de mais uma variável no modelo  tamanho superior a 2000 observações
original. 
Se uma variável importante for colocada no modelo, a estatística de 
Mallow é geralmente maior do que p.

Sendo:  Sendo:
p = número de coeficientes do modelo;   ni = número de árvores na i‐éssima combinação de idade‐amostra;
= quadrado médio do erro do modelo considerado;  xj = diâmetro, ordenado em ordem crescente em cada combinação de idade‐amostra
= quadrado médio do modelo completo; n = número de observações. 

TESTES DE ADERÊNCIA DE MODELOS DE REGRESSÃO TESTES DE ADERÊNCIA DE MODELOS DE REGRESSÃO

• Teste de Reynolds  • Teste de Shapiro‐Wilk
O teste de Shapiro‐Wilk é recomendado para amostras pequenas, 
com número inferior a 2000 observações

Sendo:

= índice do erro das i‐éssima combinação de idade‐amostra; 
nik e        = número de árvores por hectare observadas e estimadas por classe de diâmetro na classe k de 
uma i‐éssima combinação de idade‐amostra;

Sendo: 
x(i) = valores ordenados; 
x(1) = menor valor da amostra; 
ai = constante gerada pela média, variância e covariância da amostra normal.

5
15/06/2019

TESTES DE VALIDAÇÃO DE MODELOS DE REGRESSÃO TESTES DE VALIDAÇÃO DE MODELOS DE REGRESSÃO

• a) Tendência absoluta (Bias): • d) Desvio padrão residual (S):

• b) Tendência relativa (Bias %):
• e) Desvio padrão residual relativo (S%):

• c) Eficiência (E):
• f) Desvio médio (D):

TESTES DE VALIDAÇÃO DE MODELOS DE REGRESSÃO TESTES DE VALIDAÇÃO DE MODELOS DE REGRESSÃO

• g) Desvio médio relativo (D%): • j) Desvio médio absoluto em percentagem (e %):

• h) Qui‐quadrado: Sendo:
=  valor observado da densidade de árvores por hectare
= valor média das densidades de árvores por hectare, 
= valor estimado de densidade de árvores por hectare, 
n =  número de observações.

• i) Desvio médio absoluto (e): 

6
15/06/2019

VALOR PONDERADO DE ESCORES ESTATÍSTICOS UNIDADE DA EQUAÇÃO

• O valor ponderado é determinado atribuindo‐se valores ou pesos às  • A unidade de uma equação de regressão traz um 
estatísticas calculadas. 
grande reflexo na sua precisão, produzindo 
• As estatísticas são ordenadas de acordo com sua eficiência, sendo atribuído  valores maiores ou menores no erro padrão da 
peso 1 para a equação mais eficiente e pesos crescentes para as demais 
equações (ranking)  (Thiersch, 1997).  estimativa. 
• Valor ponderado de uma equação: • É importante observar com atenção a unidade da 
variável dependente para a definição do erro 
padrão da estimativa. 
• Na comparação ou seleção de equações não se 
Sendo: Pi = peso da iésima colocação; Nri = número de registros que obtiveram a iésima colocação; 
VP= valor ponderado da equação.
pode utilizar o erro padrão da estimativa de 
equações com unidades diferentes.

MODELOS DE RELAÇÃO HIPSOMÉTRICA  MODELOS VOLUMÉTRICOS 

No. Modelos Autores


Número Modelos

04 V = b0 + b1.d2 + b2.d2h+ b3.h + e Stoate


01 h = 1,30 + [1 / (b0 + b1.1/d)]2 ] + e

05 h = 1,30 + 1 / (b0 + b1.1/d + b2.1/d2) + e 06 V = b0 + b1.d2 + b2.d2h + e Spurr

06 log (h - 1,30) = b0 + b1. log(d) + e 07 log(V) = b0 + b1.log(d) + b2.log(h) + e Schumacher- Hall


07 log (h - 1,30) = b0 + b1. log(d) + b2 .log2(d) +e
08 log(V) = b0 + b1.log(d2h) + e Spurr

7
15/06/2019

MODELOS SIGMOIDAIS DE CRESCIMENTO EXEMPLO: SELEÇÃO DE EQUAÇÕES DE VOLUME

Equação Modelo Autor


24 Gompertz
1 Spurr

25 Logística 2 Schumacher-Hall

3 Spurr Logarítmica
26 Richards
4 Schumacher-Hall Log.

• Ajuste pelo método dos mínimos quadrados não ordinários 5 I.B.W. Alemanha


• Não ocorre alteração da variável dependente

EXEMPLO: SELEÇÃO DE EQUAÇÕES DE VOLUME

Coeficientes
Eq. R²Aj. Syx IF CV% F
b0 b1 b2 b3/b4
1 0,0045 0,0004 - - 0,85 0,0199 0,0322 28,14 583,39

2 -0,107 0,0152 0,0025 - 0,80 0,0217 0,0298 32,64 204,97

3 -9,973 0,9911 - - 0,87 0,3171 0,0207 -10,46 656,35

4 -9,885 1,5925 1,2566 - 0,89 0,3041 0,0198 -10,05 360,10


1,6701
5 -7,638 -1,031 0,6202 0,88 0,3043 0,0221 -10,04 181,01
-0,083

Escore dos parâmetros estatísticos Valor dos


Equação
R²Aj. Syx IF CV% F escores
1 4 1 5 4 2 16 (15)
2 5 2 4 5 4 20 (18)
3 3 5 2 3 1 14 (9)
4 1 3 1 2 3 10 (7)
5 2 4 3 1 5 15 (11)

Potrebbero piacerti anche