Sei sulla pagina 1di 114

INTRODUO IDENTIFICAO

DE
MODELOS DISCRETOS PARA SISTEMAS DINMICOS

Faculdade de Engenharia de Universidade do Porto

Novembro de 2002

A. Paulo G.M. Moreira, Paulo J. G. Costa, Paulo J. Lopes dos Santos

-1-
NDICE
1. MODELOS.................................................................................................................................................... 4
1.1 - Introduo ..................................................................................................................................... 4
1.2 Modelos deterministicos .............................................................................................................. 5
1.2.1 Modelos de entrada-sada .................................................................................................................. 5
1.2.2 Modelos de estado .............................................................................................................................. 7
1.3 Modelos estocsticos .................................................................................................................... 7
1.3.1 Modelos de entrada-sada .................................................................................................................. 8
1.3.2 Modelos de estado ............................................................................................................................ 12
1.3.3 Previses da sada e erros de previso em sistemas com perturbaes .......................................... 13
1.4 - Resumo ........................................................................................................................................ 15
2 - MNIMOS QUADRADOS ........................................................................................................................... 18
2.1 - Formulao.................................................................................................................................. 18
2.2 Interpretao geomtrica .......................................................................................................... 20
2.3 Interpretao estatstica ............................................................................................................ 21
2.3.1 Teoria geral ...................................................................................................................................... 21
2.3.2 Teoria normal................................................................................................................................... 25
2.4 - Resumo ........................................................................................................................................ 30
3. MNIMOS QUADRADOS NA IDENTIFICAO DE SISTEMAS DINMICOS................................ 32
3.1 Mnimos quadrados ordinrios ................................................................................................ 32
3.2- Variveis instrumentais............................................................................................................... 36
3.3- Mnimos quadrados generalizados............................................................................................. 39
3.4 - Resumo ........................................................................................................................................ 41
4- PLANEAMENTO DE EXPERINCIAS DE IDENTIFICAO ............................................................ 44
4.1 Condies mnimas para o sinal de excitao.......................................................................... 44
4.2 Sequncias binrias pseudo-aleatrias..................................................................................... 45
4.3 Testes de ordem do modelo ....................................................................................................... 48
4.3.1 Mtodos baseados na anlise dos resduos...................................................................................... 48
4.3.2 Diagrama de plos e zeros ................................................................................................................ 49
4.3.3 Simulao com outro conjunto de dados.......................................................................................... 50
4.4 Consideraes gerais.................................................................................................................. 50
5. EXEMPLO 1: MODELIZAO E IDENTIFICAO DE UM ROBOT MVEL (INCAL) ........... 52
5.1 Cinemtica .................................................................................................................................. 53
5.2 - Equaes Cinemticas em Tempo Discreto ..................................................................... 54
5.2.1 - Discretizao Por Diferenas Avanadas.................................................................................. 54
5.2.2 Discretizao Por Diferenas Centradas ..................................................................................... 55
5.2.3 Discretizao Exacta .................................................................................................................... 56
5.3 Estimao dos Parmetros das Equaes Cinemticas..................................................... 56
5.4 Cinemtica em Aco ........................................................................................................... 57
5.5 Dinmica................................................................................................................................ 59
5.6 Modelo Terico dos Motores ............................................................................................... 59
5.7 A No Linearidade dos Motores ......................................................................................... 61
5.8 Equaes da Dinmica ......................................................................................................... 62
5.9 Estimao dos Parmetros das Equaes da Dinmica .................................................... 63
5.9.1 Outros Estimadores ...................................................................................................................... 64
5.10 Resultados da Estimao ..................................................................................................... 64

-2-
5.10.1 Experincia I................................................................................................................................. 65
5.10.2 Experincia II ............................................................................................................................... 75
5.11 A Incerteza da Estimativa.................................................................................................... 80
5.12 Estimao dos Parmetros da No linearidade Associada aos Motores ......................... 86
6 EXEMPLO 2: MODELO TRMICO DE UMA CUBA DE FERMENTAO ................................... 90
6.1 - Modelos deterministicos............................................................................................................. 90
6.1.1 - Modelo de estrutura variante............................................................................................................ 92
6.1.2 - Modelo de estrutura fixa ................................................................................................................... 98
6.2 - Modelos estocsticos ................................................................................................................. 101
APNDICE A - ESTIMADORES.................................................................................................................. 105

REFERNCIAS BIBLIOGRAFICAS ........................................................................................................... 114

-3-
1. MODELOS

1.1 - Introduo

A rpida evoluo dos computadores e dos sistemas baseados em microprocessadores possibilitou que
hoje em dia possam ser utilizados em larga escala nos sistemas de controlo digital.

r(tk ) u(tk ) u(t) processo y(t)


algoritmo de conversor contnuo a
controlo D/A
controlar

conversor
y(tk ) A/D

Fig. 1.1 - Sistema controlado por um computador digital

Na figura 1.1 pode-se observar um diagrama de blocos de um sistema controlado digitalmente. O


sinal y(t) um sinal contnuo e a sada do processo. convertido na forma digital num conversor
analgico-digital (A/D). A converso comandada por um relgio e feita nos instantes de
amostragem tk. O computador interpreta o sinal convertido como uma sequncia de nmeros {y(tk)},
compara-a com a referncia {r(tk)} e calcula uma sequncia (u(tk)) atravs de um algoritmo de
controlo apropriado. O conversor digital-analgico (D/A) transforma a sequncia {u(tk)} num sinal
analgico u(t) que comanda o processo. Esta converso tambm sincronizada e, normalmente, u(t)
mantm-se constante entre dois instantes de amostragem [1]. Como os algoritmos de controlo s
precisam de descrever o processo nos instantes de amostragem, este deve ser modelizado como um
sistema discreto. Os sistemas discretos processam sequncias de nmeros e, por isso podem ser
representados por equaes s diferenas.
Se uma equao s diferenas relacionar a sada do sistema com as entradas e as sadas, em instantes
anteriores, diz-se que o sistema descrito por um modelo de entrada-sada. Estes modelo so do tipo

y(tk) = f(y(t k-1), y(t k-2),,u(t k),u(t k-1),,t k) (1.1)

P
y(tk) e  - sadas do sistema

S
u(tk) e  - entradas do sistema

-4-
Como foram eliminadas todas as variveis internas do sistema, considera-se que a equao um
modelo externo. Se as equaes s diferenas forem formuladas nos espaos dos estados, obtm-se o
seguinte modelo

x(t k+1) = a(x(tk),u(tk),tk) (1.2)


y(t k) = c(x(tk),u(tk),tk)

n
x(tk)  - vector de variveis de estado
y(tk) P - sadas do sistema
u(tk) S - entradas do sistema

Como vector x(tk) um vector de variveis internas do sistema, as equaes (1.2) constituem um
modelo interno.
Infelizmente, na maioria dos casos as funes f(.), a(.) e c(.) no so lineares. Isto pode tornar os
algoritmos de controlo de tal forma complexos, que a sua implementao prtica seja invivel. Para
fugir a este problema, costuma-se linearizar o sistema volta do seu ponto (ou da sua trajectria) de
funcionamento. Normalmente isto no levanta problemas, pois sendo o objectivo do controlo manter
o sistema num ponto (numa trajectria) de funcionamento predeterminado(a), interessa descrever o
seu comportamento na vizinhana deste(a) ponto (trajectria). Na maioria dos casos, isto pode ser
feito atravs de modelos lineares [4].
Sendo T o perodo de amostragem, para se simplificar a notao refere-se o sinal y(t) no instante de
tempo t = k*T = tk , y(tk), simplesmente como y(k).

1.2 Modelos deterministicos

1.2.1 Modelos de entrada-sada

Nos sistemas lineares discretos com uma entrada e uma sada, o modelo (1.1) toma o seguinte aspecto

na nb
y(k) = - ai (k) y (k-i) + bi (k) u(k-i) (1.3)
i=1 i=0

Se o sistema for invariavelmente no tempo

-5-
na nb
y(k) = - ai y (k-i) + bi u(k-i) (1 .4)
i=1 i=0

Definindo-se q1 como operador de atraso

q-1u(k) = u(k-1) (1.5)

a equao (1.4) pode-se colocar na forma:

A(q-1) y(k) = B(q-1) u(k) (1.6)


com
A(q-1 ) =1 +a1q-1++anaq-na
B(q-1) = b0+b1q-1++bnbqnb

Se y(k) = 0, k = -1,,-na e u(k) = 0, k = 0, -1,,-nb, as transformadas Z das sequncias {u(k)} e


{y(k)} so relacionadas por:

z(nb-na) A*(z) y(z) = B*(z) U(z) (1.7)

Y(z) B*(z) B(z-1)


U(z) A*(z)z-(nb-na) A(z-1) = H(z)
= = (1.8)

A*(z) = z-na A(z-1) e B* (z) = z nb B(z-1)

H(z) ser a funo de transferncia do sistema. O comportamento dinmico do sistema determinado


pela localizao dos plos e dos zeros de H(z).
Ao compararem-se as equaes (1.6) e (1.8), conclui-se que as relaes entre Y(z) e U(z) e entre
{y(k)} e {u(k)} utilizando o operador q-1, so idnticas . Com base neste facto, utiliza-se por vezes o
operador q-1 quando seria mais correcto utilizar-se z-1 ou vice-versa. No entanto fcil tirar-se do
contexto se
-1
q deve ser interpretado como operador de atraso unitrio ou como inverso da varivel da
transformada z.

-6-
1.2.2 Modelos de estado

A representao dum sistema discreto com uma entrada e uma sada no espao dos estados e feita a
partir das seguintes equaes:

x(k+1) = x(k) + u(k) (1 .9)


y(k) = C X(k) + D u(k)
com
y(k) e u(k) escalares
n
x(k) 

A utilizao do operador q-1 permite calcular um modelo de entrada-sada

x(k) = q-1 x(k) + q-1 u (k) (1.10)

( I q-1) x(k) = q-1 u(k)

se (I- q-1 ) for invertivel

x(k) = (I- q-1)-1 q-1 u(k) (1.11)


e
y(k) = [C(I- q-1)-1 q-1 + D] u(k) (1.12)

A funo de transferncia ser:

Y(z)
H(z) = U(z) = C(I- z-1)-1 z-1 + D = C(z I- )-1 + D (1.13)

1.3 Modelos estocsticos

Os modelos que at agora foram apresentados, pressupem que os sistemas so unicamente excitados
por sinais gerados por um controlador. Esses sinais devem ser calculados por forma a garantirem um
determinado comportamento. Na prtica, verifica-se que a resposta dos sistemas no completamente
coincidente com a dos modelos. 0s desvios podem ser devidos a erros de modelizao, imprecises

-7-
nos sensores e nos conversores, variaes na carga e interaces com o meio ambiente. Nos modelos
lineares este fenmenos podem ser representados como um sinal perturbador na sada do sistema.

y(k) = y (k) + (k) (1.14)


(k) - perturbaes
y (k) - sada sem perturbaes

Na teoria de controlo estocstico, considera-se que as perturbaes so processos estocsticos com


mdia nula e covarincia estacionria. O Teorema da densidade espectral [1,3] permite que sejam
modelizadas como sinais de sada de sistemas lineares de fase mnima [3] excitados por rudo branco.
Para descrever esses sistemas, podem-se utilizar modelos de entrada-sada ou modelos de estado.

1.3.1 Modelos de entrada-sada

Define-se Densidade Espectral (ejw) de um processo estocstico com varincia estacionria, como
sendo a transformada de Fourier da sua funo de covarincia [3]. O Teorema de Densidade Espectral
diz que uma densidade espectral (ejw) pode ser factorizada da seguinte forma

(ejw) = H(ejw) 2 H(e-jw) (1.15)


(q) = H(q) 2 H(q)
desde que:
i) H(q) tenha todos os plos e zeros no interior do circulo unitrio (funo de transferncia de
um sistema de fase mnima [3])

ii) lim H(q) = 1


q

Se na equao (1.14) (k) for um processo estocstico com mdia nula, covarincia estacionria e

densidade espectral H2(ejw)2 H2(e-jw), pode-se considerar que (k) o sinal de sada de um sistema
1inear com funo de transferncia:

*
(ng2-nf2) G(q) G(q-1)
H2(q)=q * = -1 (1.16)
F(q) F(q )
em que:
G(q-1) = 1 + g1q-1 + +gng2 q-ng2

-8-
F(q-1) = 1 + f1q-1++fnf2q-nf2

*
G(q) = q-ng2 G(q-1)

*
F(q) = q-nf2 F(q-1)

excitado por uma sequncia de variveis aleatrias no correlacionadas com mdia nula e varincia 2
(rudo branco).

Sendo y(t) gerado por um sistema determinstico com funo de transferncia:

*
Gu(q) Gu(q-1)
H1(q) = q (ng1-nf1) * = -1 (1.17)
Fu(q) Fu (q )
em que:
Gu(q-1) = g0(u) + g1(u)q 1++g ng1(u) q-ng1

Fu(q-1) = 1 + f1(u)q-1++f(u) nf1 q-nf1

*
Gu(q) = q-ng1 Gu(q-1)

*
Fu(q) = q-nf1 Fu(q-1)

chegam-se aos seguintes modelos de entrada-sada:

B(q-1) C(q-1)
i) y(k) = F(q-1) u(k) + D(q-1) (k) (1.18)

em que:
u(k) - sinal de entrada
(k) - rudo branco

B(q-1) = Gu(q-1)

F(q-1) = Fu (q-1)

-9-
C(q-1) = G(q-1)

D(q-1) = F(q-1)

ii) A(q-1) y(k) = B(q-1) u(k) + C(q-1) (k) (1.19)

em que:
Fu(q-1)F(q-1)
A(q-1) = 1 + a1q-1 ++ anaq-na = L(q-1)

L(q-1) = maior divisor comum de Fu(q-1) e F(q-1)

F(q-1)
B(q-1) = b0 + b1q-1 ++ bnbq-nb = Gu(q-1) L(q-1)

Fu(q-1)
C(q-1) = 1 + c1q-1 ++ cncq-nc = G(q-1) L(q-1)

conhecidos respectivamente por modelos de Box-Jenkins [2] e Armax.

O modelo Armax interpreta as perturbaes como um erro de equao:

A(q-1) y(k) = B(q-1) u(k) + e(k) ( 1.20 )


em que:
e(k) - erro de equao

O seu nome resulta do facto de ser uma combinao de componentes auto-regressiva (em
ingls Auto Regressive) A(q-1)y(k), mdia mvel (Moving Average) e(k) = C(q-1)(k) e de
controlo
B(q-1)u(k) (em econometria o sinal de entrada u(k) conhecido por varivel eXognea).

Se o erro de equao for descrito como um processo auto-regressivo de mdia mvel,

D(q-1)e(k) = C(q-1)(k) (1.21)


em que:
C (q-1)=1 + c1q-1 + + cncq-nc

- 10 -
D(q-1)=1 + d1q-1 + + dndq-nd

obtm-se o seguinte modelo

-1 -1 C(q-1)
A(q ) y(k) = B(q ) u(k) + D(q-1) e(k) (1.22)

em que:
A(q-1) = Fu(q-1)

B(q-1) = Gu(q-1)

Fu(q-1)G(q-1)
C(q-1) = L(q-1)

F(q-1)
D(q-1) = L(q-1)

L(q-1) = maior divisor comum de Fu(q-1) e F(q-1)

As equaes (1.18), (1.19) e (1.22) podem ser vistas como casos particulares do modelo geral.

B(q-1) C(q-1)
A(q-1) y(k) = F(q-1) u(k) + D(q-1) (k) (1.23)

Embora no seja vulgar utilizar-se todos os polinmios simultaneamente, (1.23) tem a vantagem de
permitir um tratamento unificado para os diversos modelos de entrada-sada [2].

- 11 -
1.3.2 Modelos de estado

Viu-se atrs que um sistema com perturbaes pode ser decomposto em 2 subsistemas:

- Um subsistema excitado pelo sinal de entrada


- Um subsistema excitado por rudo branco.

Se ambos forem descritos no espao dos estados, obtm-se o seguinte modelo de estado

y(k) = C1 x(1)(k) + D1u(k) + (k) (1.24)

(k) = C2 x(2)(k) + (k)

x(1)(k+1) = 1 x(1)(k) + 1u(k)

x(2)(k+1) = 2 x(2)(k) + 2(k)

em que (k) = rudo branco com varincia 2

resultando:

C1(qI-1)-11+D1 = H1(q) (1.25)


-1
C2(qI-2) 2+1= H2(q)

As equaes (1.24) podem ser reescritas na forma:

y(k) = C x(k) + D u(k) + (k) (1.26)


x(k+1) = x(t) + u(k) + K(k)

Nas equaes (1.24) e (1.26) o rudo de estado e o rudo de sada (erro de medida) so linearmente
dependentes. Em muitas situaes, sabe-se priori, que os erros de medida so independentes das
outras perturbaes que afectam o sistema. Nestas condies, uma representao mais natural do
sistema poder ser feita atravs do seguinte modelo:

x(k+1)= x(k) + u(k) + v(k) (1.27)

- 12 -
y(k) = C x(k) + D u(k) + n(k)
em que
v(t) - rudo branco com variricia Q
n(t) - rudo branco com varincia R

Este representao pode ser convertida na forma (1.26) se

K = APCT(CPCT + R) -1 (1.28)
2 = CPCT + R

em que P a nica matriz simtrica positiva definida que soluo da equao de Riccati [1]:

P = APAT APCT (CPCT + R)-1 CPAT +Q

1.3.3 Previses da sada e erros de previso em sistemas com perturbaes

Se conhecer o estado inicial dum sistema determinstico pode-se prever exactamente o valor das suas
sadas deste que a sequncia de entradas {u(k)} seja conhecida. A presena dum termo aleatrio
impede que esta previso possa ser efectuada sem erros em sistemas com perturbaes estocsticas.
Nestas situaes procura-se minimizar o erro da previso. Como este erro uma varivel aleatria a
sua minimizao tem que ser efectuada num contexto estatstico. Decompondo y(k) nas seguintes
parcelas

y(k)=y^(k/k-1)+(k/k-1) (1.29)

em que y^(k/k-1) a previso de y(k) efectuada no instante k-1 e (k/k-1) o respectivo erro de
previso, pode-se afirmar a previso ser ptima quando (k/k-1) for a parte da y(k) que no for
possvel prever no instante k-1. Nestas condies diz-se que (k/k-1) a inovao no instante k.

Para se obter uma previso deste tipo a partir de modelos de entrada-sada recorde-se que,
neste tipo de modelos, y(k) pode ser decrito por

y(k) = H1(q) u(k) + H2(q) (k) (1.31)

- 13 -
sendo H1(q) e H2(q) duas funes de transferncia racionais e (k) rudo branco. Para que a
perturbao H2(q)(k) seja estacionria, H2(q) tem que ser uma funo de transferncia estvel e o
teorema da densidade espectral impe que:

i) [H2(q)] 1 seja estvel


ii) lim H2(q) = 1
q

Nestas condies, pode-se rescrever (1.31) na forma:

y(k) H1(q)
H2(q) H2(q) u(k) + (k)
= (1.32)

y(k) H1(q)
y(k) [y(k) - H (q) ] = H (q) u(k) + (k)
2 2

1 H1(q)
y(k) [1- H (q) ] y(k) = H (q) u(k) + (k)
2 2

1 H1(q)
y(k) = [1- H (q) ] y(k) + H (q) u(k) + (k)
2 2

Como lim H2(q) = 1, ento, se, sem perda de generalidade, se considerar ng2=ng1=n2, ter-se-
q

1+g1q-1++gn2q-n2 1 (f1-g1)q-1++(fn2-gn2)q-n2
H2(q)= -1 -n2 [1- ] y(k) = y(k)= (1.33)
1+f1q ++fn2q H2(q) 1+f1q-1++fn2q-n2
(f1-g1)++(fn2-gn2)q-n2+1
= y(k-1)
1+f1q-1++fn2q-n2

1
Pode-se ento concluir que [1- H (q) ] y(k) s depende dos instantes anteriores a k e que,
2

consequentemente,

1 H1(q)
y^(k/k-1)= [1- H (q) ] y(k) + H (q) u(k) (1.34)
2 2

pode ser considerado como uma previso de y(k) efectuada no instante k-1 com erro

- 14 -
(k/k-1)= y^(k/k-1)-y(k)= (k) (1.35)

Como (k) rudo branco no est correlacionado com y(k-j), j=1,,, e u(k-i), i=0, ,. Nestas
condies pode-se afirmar que o erro de previso a inovao no instante k sendo y^(k/k-1) a melhor
previso de y(k).

Nos modelos de estado

x(k+1) = x(t) + u(k) + K(k) (1.36)


y(k) = C x(k) + D u(k) + (k)

a previso ptima pode ser calculada atravs do filtro de kalman em regime estacionrio

x^(k+1/k)= x^(k/k-1) + u(k)+K[y(k)-Cx^(k/k-1)-Du(k)] (1.37)


y^ (k/k-1)=Cx^(k/k-1)+Du(k)

Pode-se verificar facilmente que

x(k+1)-x^(k+1/k)=[-KC][x(k)-x^(k/k-1)] (1.38)

o que significa que lim x^(k+1/k)=x(k), pois o facto da perturbao ser estacionria assegura que
k
todos os valores prprios de -KC estejam no interior do crculo unitrio. Nestas condies o erro da
previso tender para (k) e, consequentemente, esta ser ptima

1.4 - Resumo

Neste captulo apresentam-se modelos lineares de sistemas discretos.

Principiou-se com o caso determinstico. Mencionaram-se modelos de entrada-sada e modelos de


estado:

i) A(q-1) y(k) = B(q-1) u(k)


ii) y(k) =Cx(k) + Du(k) com x(k+1) = x(k) + u(k)

- 15 -
A funo de transferncia racional e dada por

B(q-1)
H(q) = A(q-1) = C(qI - )-1 + D

A localizao dos plos e dos zeros de H(q) determina a dinmica do sistema. Existe uma infinidade
de modelos que conduzem mesma funo de transferncia. Se num modelo de estado no for
possvel diminuir o nmero de variveis de estado, mantendo-se a funo de transferncia, diz-se que
uma representao mnima. As representaes mnimas so acessveis e completamente observveis.
Uma mudana de coordenadas permite obter um novo modelo no mesmo espao de estados. Muitas
vezes as variveis de estado so escolhidas tendo em conta a simplicidade das equaes do modelo.
As formas cannicas controlvel e observvel podem-se obter facilmente a partir dos modelos de
entrada-sada.
Como normalmente os sistemas so perturbados por sinais desconhecidos, nem sempre os modelos
determinsticos so descries adequadas do seu comportamento. Na teoria estocstica, considera-se
que as perturbaes so processos estocsticos com mdia nula e covarincia estacionria. O teorema
da densidade espectral permite descrev-las como a sada de um sistema linear com funo de
transferncia H2(q) e excitado por rudo branco (k). Nestas condies, os sistemas com perturbaes

podem ser descritos pelo modelo:

y(k) = H1(q) u(k) + H2(q) (k)

A partir das funes de transferncia H1 (q) e H2(q) fcil obter outros modelos de entrada-sada e
modelos de estado.

A previso da sada y(k) dum sistema estocstico efectuada no instante k-1 no pode ser efectuada
sem erro. Esta ser ptima quando o erro for a parte da sada que no se pode prever no instante k-1.
Nestas condies diz-se que o erro a inovao no instante k. Nos sistemas descritos por modelos de
entrada-sada a previso ptima ser

1 H1(q)
y^(k/k-1)= [1- H (q) ] y(k) + H (q) u(k)
2 2

e tem um erro

(k/k-1)= y^(k/k-1)-y(k)= (k)

- 16 -
que sendo uma sequncia de rudo branco impossvel de prever no instante k.
Nos sistemas descritos por modelos de estado a previso ptima ser dada pela sada do sistema

x^(k+1/k)= x^(k/k-1) + u(k)+K[y(k)-Cx^(k/k-1)-Du(k)]


y^ (k/k-1)=Cx^(k/k-1)+Du(k)

que no mais do que o filtro de Kalman em regime estacionrio. Tal como no caso anterior o erro de
previso ser uma sequncia de rudo branco.

- 17 -
2 - MNIMOS QUADRADOS

2.1 - Formulao

Considere-se que um determinado fenmeno descrito pelo seguinte modelo:

p
y= xjj = xT (2.1)
j=1

em que xT = [x1 . . . xp] um vector de variveis controladas e = [1p]T um vector de parmetros.

Se for desconhecido, pode ser obtido a partir da observao de y para p valores distintos de x e da
resoluo do sistema de equaes resultante. O valor de obtido por este mtodo seria estritamente
preciso se, por um lado, as observaes de y e os valores de x utilizados fossem absolutamente
correctos, e se, por outro lado, o fenmeno pudesse ser exactamente descrito pela equao (2.1).
Sabe-se que no mundo real, quer as observaes, quer os modelos matemticos no so mais o que
aproximaes da verdade e, por isso, o mtodo descrito nunca poderia conduzir a valores exactos para
os parmetros.

Um modelo matemtico mais realista para o fenmeno considerado ser ento

ym = xT + m (2.2)

em que m uma varivel aleatria que representa o erro de modelizao.

Qualquer observao y poderia ser descrita da seguinte forma:

y = xT + m + o (2.3)

sendo o, uma varivel aleatria que representa os erros de observao (de y e x).

Se se definir uma nova varivel aleatria:

- 18 -
= m +o (2.4)

representando os erros de modelizao e de observao, pode-se rescrever (2.3) com o seguinte


aspecto:

y = xT +

A natureza aleatria de no permite um clculo exacto de baseado em observaes de y.

No entanto, uma atitude razovel e optimista, de supor que o conjunto de N observaes y1,
yi, ,yN tenta dar uma informao sobre , e que os erros 1, , i, , N so pequenos
nalgum sentido. Neste contexto, os parmetros podem ser calculados (estimados)
minimizando a seguinte funo:

N
S= (yi-xiT)2 (2.6)
i=1

isto , procurando minimizar a soma dos quadrados dos erros.

Em notao matricial ter-se-:

S = (Y X )T (Y X ) (2.7)

onde

Y = [y1,..., yN]T

x11 x12 x1p x1T



=
. . .
X= . . .
. . .
xN1 xNp xNT
Donde

Y=X+E (2.8)

sendo

- 19 -
E = [1, , N]T

Derivando S relativamente a

dS
= -2 XTY+2XTX (2.9)
d

Igualando a zero para = ^

dS
= 0 XTX ^ = XTY (2.10)
d

este sistema conhecido por equaes normais [1 , 3].

Se XTX for invertvel, obtm-se uma estimativa nica:

^ = (XTX)1 XTY (2.11)

De notar que N p condio necessria para que XTX seja invertvel.

Quando a matriz XTX singular a estimativa no nica .

2.2 Interpretao geomtrica

O estimador dos mnimos quadrados pode ser objecto duma interpretao geomtrica. Segundo esta

interpretao, y^=X^ pertence a um espao S gerado pelas colunas de X. Se se definir um vector

R ^ ^
= Y-Y=Y-X (2.12)

pode-se verificar que este perpendicular a S:

RTX = (Y-X^ )TX = YTX-^ TXTX = XTY-XTX^ = 0 (2.13)

A estimao pelo mtodo dos mnimos quadrados , portanto, equivalente projeco do vector das
observaes no espao gerado pelas colunas de X

- 20 -
2.3 Interpretao estatstica

2.3.1 Teoria geral

At agora, o mtodo dos mnimos quadrados foi discutido em bases puramente intuitivas.
Podem, contudo, ser levantadas vrias questes:

- Haver algum mtodo que nalgum sentido seja melhor do que este?
- O nmero de parmetros includos no modelo ser suficiente?
- Ser possvel atribuir alguma "preciso" s estimativas obtidas?
Para se responder parcialmente a estas questes, ser necessrio situar o problema em termos
estatsticos.

Considere-se ento o modelo

Y = X + E (2.14)

em que
Y = [y1, , yN] T o vector aleatrio das observaes
e
E = [1, , N]T o vector aleatrio que representa os erros.

Seja ^ o estimador de mnimos quadrados de :

Como ^ uma funo das observaes, tambm um vector aleatrio.

Suponha-se agora que E tem um valor esperado nulo e uma matriz covarincia 2I, isto , E um
vector de variveis aleatrias no correlacionadas com mdia nula e varincia idntica.

- 21 -
Teorema 2.1

Nas condies acima mencionadas, o estimador de mnimos quadrados ^ tem as seguintes


propriedades :

i) uma funo linear das observaes.

ii) Ey(^ ) = (isto , ^ no enviesado)

iii) cov (^ ) = (XTX)-12


iv) o melhor estimador linear no enviesado no sentido em que qualquer outro estimador
~ ~
linear no enviesado ter uma matriz covarincia "maior", isto , cov() cov(^ )
~
cov() - cov(^ ) uma matriz definida positiva.

Demonstrao: ver [1].

O teorema 2.1 coloca o mtodo dos mnimos quadrados na classe dos estimadores no enviesados.
Ora, consegue-se provar que dentro desta classe existe um limite inferior para a varincia dos
estimadores [1,5]. Esse limite igual ao inverso da Matriz de informao de Fisher, definida da
seguinte forma:

dlog p(y,) T dlog p(y,)


M = Ey{[ ] [ ]} (2.15)
d d

em que p(Y,) a funo de densidade de probabilidade do vector aleatrio Y.


O conhecimento de famlia de funes p(Y,) numa dada observao, permite ajuizar at que
ponto que o estimador dos mnimos quadrados "bom", por simples comparado da sua matriz
covarincia com M-1.
Outra indicao valiosa que se pode obter do Teorema 2.1 de que quanto maiores forem os
elementos da matriz X, menor ser a varincia do estimador e portanto maior a "preciso".
As propriedades enunciadas atrs, foram deduzidas na hiptese de os componentes de E
serem no correlacionados e de varincia idntica. Quando tal no acontece, a matriz E(EET) deixa de
ser diagonal e toma a forma , em que semidefinida positiva e, portanto factorizvel na forma

= QQT (2.16)


A mudana de variavel Y = Q-1 Y transforma este problema no anterior pois sendo,

- 22 -
Y = X + E (2.17)
cov (E) =

e sabendo-se que,

cov(Y) = cov (X + E) = cov (E) =

ter-se-,


cov (Y ) = cov(Q-1Y) = Q-1cov(Y)Q-T =

= Q-1 cov (E) Q-T = Q-1 QT

= Q-l Q QTQ-T = IN

O operador Q-1 tambm conhecido como fi1tro branqueador pois transforma o vector correlacionado
E noutro no correlacionado.

Este resultado est resumido no seguinte corolrio

Corolrio 2.1

Seja o modelo Y = X + E, cov(E) = .

O melhor estimador linear de

^ = (XT-1X)-1 XT-1Y (2.18)

Demonstraao: ver [1]

O estimador definido na equao (2.18) costuma-se designar por mnimos quadrados pesados.
A razo deste nome pode ser ilustrada pelo seguinte exemplo:

- 23 -

Considere-se que no modelo Y = X + E, os componentes do vector E so no correlacionados e
tm varincias diferentes.

12

0 0


0 . 0
. . .
cov E = = (2.19)
. . .
. . .
0 N2
A expresso a minimizar a seguinte:


V = (Y - X )T (Y - X ) = (2.20)
= (Y X )T - 1 (Y - X) =

1
12
0 0

0 . 0
=(Y-X)
T
. . . (Y-X)
. . .

. . .

0
1
N2

N
=
(yi-xiT)2
i2
i=1

Esta equao mostra que cada quadrado de soma pesado pelo inverso de varincia do erro
correspondente, dando-se mais peso aos erros que provavelmente" sero mais pequenos.

- 24 -
Em muitas observaes lcito supor-se que E(EET) = 2IN. O problema que quase sempre se
desconhece o valor de 2

Teorema 2.2
Se E(EET) = 2IN,

^ = 1 (Y- X^)T(Y-X^)
V (2.21)
N-p
um estimador no enviesado da varincia 2 dos erros onde N o nmero de observaes e p o
nmero de parmetros a estimar.

Demonstrao: ver [1]

Corolrio 2.2

^ um estimador no enviesado da covarincia da estimativa de mnimos quadrados


(XTX)1V

^ =(XTX)-1 XTY, em que E(EET) = 2IN.

Demonstrao: ver [1]

2.3.2 Teoria normal

Como resultado do Teorema do limite Central, lcito admitir-se uma distribuio normal para os

erros na maioria das aplicaes.

Considere-se ento o modelo:

Y=X+E (2.22)

onde os erros so normalmente distribuidor com matriz covarincia 2I.

Teorema 2.3

O estimador de varincia mnima para (2.22) o dos mnimos quadrados

- 25 -
Demonstrao: ver [1]

Este teorema assegura que, em condies que no so demasiadamente restritivas, o estimador dos

mnimos quadrados o melhor dentro de classe dos estimadores no enviesados.

Outro resultado importante para o caso de erros com distribuio normal enunciado pelo seguinte

teorema:

Teorema 2.4

Nas condies do teorema 2.3

^ = (XTX) -1XTY um vector aleatrio Gaussiano com distribuio:

^ ~ N(, ( XTX) -12) (2.23)

Demonstrao: ver [1]

Este resultado e o conhecimento da varincia 2 dos erros permitem definir um intervalo de

confiana para as estimativas ^, dando-se assim uma resposta pergunta que foi formulada sobre a
sua preciso. Infelizmente, tal como foi dito atrs, s raramente se sabe o valor de 2. Este problema
pode ser ultrapassado se houver um estimador de 2 e se a sua distribuio for conhecida. Ora, atravs
do teorema 2.2, j se conhece esse estimador. Resta, portanto, calcular a sua distribuio.

Teorema 2.5

Nas condies do teorema 2.3, o vector

R = (Y - X^) (2.24)

tem uma distribuio normal e independente de ^.

Demonstrao: ver [1]

- 26 -
Teorema 2.6

Nas condies do teorema 2.3 a soma normalizada dos quadrados dos resduos

S(^) /2 = RTR/2 (2.25)

tem uma distribuio 2(N-p) (qui quadrado com N-p graus de liberdade) em que N o nmero de
observaes e p o nmero de parmetros do modelo.

Demonstrao: ver [1]

De (2.21) e (2.25) pode-se concluir que

^ = S(^) /(N-p)
V (2.26)

Finalmente, o seguinte teorema permite a construo de intervalos de confiana quando no se

conhece 2.

Teorema 2.7

Sejam ^i, e Pii, i = 1, ... p, respectivamente elementos de ^ e da diagonal principal de (XTX)-1 dum
estimador de mnimos quadrados calculado nas condies do teorema 2.3.

z = (i - ^i)/ PiiV
^ (2.27)

tem uma distribuio t de Student com N-p graus de liberdade.

Demonstrao: ver [1].

Pare se construir um intervalo de confiana [ ^i min, ^i mx ] para i aps uma estimao de parmetros

feita nas condies do teorema 2.3, deve-se, em primeiro lugar, escolher a confiana do intervalo,

isto , a probabilidade de [ ^i min, ^i mx ].

Seja

p(^i min , ^i ^i mx) = 1- ,0<<1 (2.28)

Sabe-se do teorema 2.7 que z ~ t(N-p), logo possvel calcular-se t , tal que,

- 27 -
p (-t z t) = 1- (2.29)

Substituindo z pelo seu valor tem-se

p(-t (i - ^i)/ PiiV


^ t )=1-
(2.30)
^ ^ + t P V
p(^i - t PiiV i i ii
^ )

De (2.28) e (2.29) pode-se concluir que os limites do intervalo de confiana t so:

^i min = ^i - t PiiV
^ (2.31)

^i mx = ^i + t PiiV
^

Para se saber qual o nmero de parmetros necessrios descrio de uma dada observao, pode-se
recorrer ao seguinte teorema.

Teorema 2.8

Seja o modelo Y = X + E em que os erros so normalmente distribudos com matriz covarincia 2I.
Se os parmetros P estiverem sujeitos a q constries lineares do tipo:

H = 0 , H qxp e q < p (2.32)

~
O estimador de varincia mnima sujeito s constries

~
H = 0 (2.33)
ser
~ ^
= - (XTX)-1 HT(H(XTX)-1XT)-1H^ (2.34)

em que ^ o estimador de mnimos quadrados sem constries de .

Se se definirem
~ ~
V1 = (Y - X )T(Y - X ) (2.35)

- 28 -
V2 = (Y - X^)T(Y - X^)
V =V1 - V2
ento

V
i) ~ 2 (q)
2
ii) V e V2 so independentes
V (N-P)
iii) t= V q ~ F(q, N-p)
2

sendo F(q, N-p) a distribuio de Fischer q e n-q graus de liberdade e N o nmero de observaes

Demonstrao: ver [1]

Corolrio 2.3

Sejam o modelo Y = X + E, onde E ~ N(0, 2I), ^ (i) o estimador dos mnimos quadrados baseado
num modelo com pi parmetros e Vi a correspondente soma dos quadrados dos resduos.

Vi = (Y - X(i) ^ (i))T(Y - X(i) ^ (i)).

Considere-se a hiptese nula Ho : p2 > p1 p onde p a verdadeira ordem do modelo. Se a


hiptese nula for verdadeira ento

V1- V2
i) ~ 2 (p2-p1)
2
ii) V e V2 so independentes
V1-V2 n- p2
iii) t= V p2-p1 ~ F (p2- p1, N-p2)
2

Demonstrao: ver [1]

O clculo sucessivo de estimadores de mnimos quadrados para diferentes nmeros de parmetros e o


corolrio 2.3, permitem saber qual a dimenso mnima do vector de parmetros para que um modelo
possa descrever adequadamente uma dada observao.

- 29 -
A quantidade de teste t pode ser interpretada como uma medida de reduo da soma dos quadrados
dos resduos quando o nmero de parmetros aumentado. Quando essa reduo no for significativa
o aumento do nmero de parmetros no traz qualquer benefcio ao modelo

2.4 - Resumo

O mtodo dos mnimos quadrados permite obter estimativas dos parmetros dum modelo linear
atravs da minimizaao da soma dos quadrados dos erros. Para que as estimativas sejam nicas, XTX
deve ser uma matriz invertivel. Neste caso, sero dadas por

^ = ( XTX )-1 XTY

A estimao pelo mtodo dos mnimos quadrados equivalente projeco do vector das observaes
Y no espao gerado pelas colunas de X.

Se os erros da observao tiverem mdia nula e matriz covarincia 2 IN o estimador de mnimos


quadrados tem as seguintes propriedades:

i) uma funo linear das observaes


ii) no enviesado

iii) cov(^) = (XTX)-12


iv) o melhor estimador no enviesado

Quando os erros tm varincias diferentes ou forem correlacionados, o estimador enviesado. No


entanto, se for a matriz covarincia dos erros, o estimador de mnimos quadrados pesados

^ = (XT-lX)-1 XT-lY

mantm as propriedades enunciadas.

Se a matriz covarincia dos erros for 2IN,

^ = 1 (Y-X^)T(Y-X^)
V N-p

- 30 -
um estimador no enviesado de 2.

Para erros normalmente distribudos com covarincia 2IN, o estimador de mnimos quadrados o de

varincia mnima. Nestas condies, ^ tem uma distribuio N (, (XTX)-12) e como

z = (i - ^i)/ PiiV
^ ~ t(N-p)

em que i, ^i, e Pii, i = 1, ... p, so, respectivamente, elementos de , ^ e da diagonal principal de


(XTX)-1, possvel construir intervalos de confiana para as estimativas.

Finalmente, como

V1-V2 n- p2
t= V p2-p1 ~ F (p2- p1, N-p2) ,p2 > p1
2

em que V1 e V2 so as somas dos quadrados dos resduos de estimadores com p1 e p2 parmetros,


respectivamente, com p1>p2, pode-se determinar o nmero de parmetros que so necessrios ao
modelo, aumentando-se o seu nmero e verificando-se se a reduo da soma dos quadrados dos
resduos significativa, atravs dum teste varivel t.

- 31 -
3. MNIMOS QUADRADOS NA IDENTIFICAO DE SISTEMAS DINMICOS

3.1 Mnimos quadrados ordinrios

Considere-se um sistema discreto estocstico do tipo

y(k) = B(q-1) u(k) + (k) (3.1)

em que { u(k) } e { y(k) } so, respectivamente, as sequncias de entrada e de sada, (k) rudo branco
com varincia 2 e

B(q-1) = bo + b1q-1++ bnbq-nb (3.2)

Se se tomar

x(k) = [u(k) u(k-1) ... u(k-nb)]T nb+ 1 (3.3)

= [b0 bnb]T nb+ 1

ter-se-, para uma observao da sada no instante k,

y(k) = xT(k) + (k) (3.4)

e para N observaes

Y = X + E (3.5)

Y = [ y(1) ... y(N)]T N

X = [x(l) ... x(N)]T N x (nb+1)

E = [ 1) (N)]T N

Como (3.5) a equao dos mnimos quadrados, o estimador

- 32 -
^ = (XTX)-1 XTY (3.6)

mantm todas as propriedades enunciadas no captulo anterior.

Veja-se agora o que acontece quando o sistema possui uma dinmica prpria. Para isso,
considere-se, em primeiro lugar, o modelo

A(q-1) y(k) = B(q-1) u(k) + (k) (3.7)

com

A(q-1 ) y(t) = 1 + a1 q-1 + + anaq-na (3.8)

Qualquer observao no instante k dada pela equao

y(k) = xT(k) + (k) (3.9)

com

x(k) = [ -y(k-1) ... -y(k-na) u(k) ... u(k-nb) ]T na+ nb+1

= [a1 ... ana bo bnb] na+ nb+ 1

Para N observaes, a equao (3.9) pode ser expressa na forma matricial

Y = X + E (3.10)

onde as definies de X, Y e E so idnticas s da equao ( 3.5).

Esta expresso sugere a aplicao do mtodo dos mnimos quadrados, sendo

^ = (XTX)-1 XTY (3.11)

o estimador de . Porm, neste caso, como X depende das observaes, as propriedades vo ser
diferentes.

- 33 -
Teorema 3.1

Se no sistema (3.7) so satisfeitas as seguintes condies

i) o modelo uma descrio adequada do sistema

1 N 1 N
ii) lim N u(k) e lim N u(k) u(k+) N existem
N N
k=1 k=1

iii) {y(k)} uma sequncia limitada

iv) (k) rudo branco

v) {u(k)} e {(k)} independentes

vi) XTX uma matriz no singular

ento o estimador de mnimos quadrados

^ = (XTX)-l XTY (3.12)

fracamente consistente, isto , ^ prob


, em que prob
significa "converge em probabilidade".

Demonstrao:

^ = (XTX)-1XTY
= + (XTX)-1 XTE (3.13)
1 1
= +(N XTX)-1 N XTE

sendo

1 T 1 N
N x(k) x (k)
T
N X X = (3.14)
k=1
e

- 34 -
1 T 1 N
N X E = N x(k)(k)
k=1

Nas condies do teorema 3.1 , as quantidades da equao (3.14) convergem em probabilidade para o
seu valor esperado [1], ou seja

1 T prob T
N X X E{x(k)x (k)} (3.15)

1 T prob
N X E E{x(k) (k)}

logo, pelo teorema de Frecht [1]

1
^ = + (N XTX)-1XT E prob
+ E {x(k)xT(k)}E{x(k) (k)} (3.16)

Como por hiptese {(k)} uma sequncia de variveis aleatrias no correlacionadas, x(k) s

depende dos componentes de anteriores a k, podendo-se concluir que E{x(k) (k)} = 0.

Se (k) no for rudo branco, x(k) e (k) passam a ser correlacionados e o teorema 3.1 deixa de ser
vlido. Isto significa que a estimativas produzidas pelo mtodo dos mnimos quadrados s so
consistentes se o erro de equao for rudo branco.

Teorema 3.2

Nas condies enunciadas no teorema 3.1 , o estimador de mnimos quadrados fortemente

, em que c.p.1
consistente, isto , ^ c.p.1 significa "com probabilidade 1.

Demonstrao: ver [1]


Note-se que o teorema 3.1 est contido no enunciado do teorema 3.2, uma vez que o conceito de
convergncia com probabi1idade 1 implica o de convergncia em probabi1idade. Por outro lado,
pode-se demonstrar que o teorema 3.2 continua vlido mesmo quando u(k) for gerado por
realimentao [1].

- 35 -
Teorema 3.3

Nas condies do teorema 3.1, as estimativas produzidas pelo mtodo dos mnimos quadrados so
assimptoticamente gaussianas, isto

^ As N(,(XTX)-1 2)

Demonstrao: ver [1]

Com este resultado fica-se habi1itado a construir intervalos de confiana independentemente da


distribuio do rudo branco (k). Quando (k) for gaussiano, pode-se avaliar a qualidade do
estimador de mnimos quadrados pelo seguinte teorema.

Teorema 3.4

Nas condies do teorema 3.1, se (k) for gaussiano, o estimador de mnimos quadrados

assimptoticamente eficiente, isto quando N , ^ o estimador no enviesado de varincia


mnima.

Demonstrao: ver [1]

3.2- Variveis instrumentais

Considere-se o seguinte sistema

A(q-1) y(k) = B (q-1) u(k) + e(k) (3.17)

Na seco anterior, viu-se que o estimador de mnimos quadrados

^ =(XTX)-l XTY (3.18)

- 36 -
Y = [y(1) ... y(N)]

x(k) = [-y(k-1) ...-y(k-na) u(k) ... u(k-nb)]T

X = [x(1) ... x(N)]T

s consistente se o erro de equao e(k) for rudo branco.

Substitua-se agora ^ pelo seguinte estimador


=(ZTX)-l ZTY (3.19)

Z = [z(1) ...z(N)]T

z(k) na+ nb+ 1

em que z(k) suficientemente correlacionado com x(k) por forma a que

1 T 1 N
N z(k) x (k) E[z(k)x (k)]
T prob T
N Z X = (3.20)
k=1

sendo

det [E(z(k)xT(k)] 0 (3.21)

1 T 1 N
N z(k) e(k) E[z(k)e(k)] = 0
prob
N Z = (3.22)
k=1

com
= [e(1)e(N)]T

isto , z(k) e e(k) no so correlacionados.

Nestas condies

- 37 -

= (ZTX)-1ZTY = (ZTX)-1 ZT (X + ) = (3.23)

= + (ZTX)-1 ZT =
1 1
= + (N ZTX) N ZT

Pelo teorema de Frecht [1]

prob
+ [E(z(k)xT(k))]-1 E[z(k) e(k)] (3.24)

De (3.22) tem-se ento que

prob
(3.25)


ou seja, fracamente consistente. Qualquer estimador definido nestas condies um estimador de
variveis instrumentais. O maior problema na aplicao deste mtodo a escolha das variveis
instrumentais. Muitas vezes utiliza-se


z(k) = [-y (k-1) ... -y (k-na) u(k) ... u(k-nb)]T (3.26)


em que {u(k)} a sequncia de entradas do sistema e {y (k)} a sequncia de sadas dum modelo
auxiliar estvel


A (q-1) y (k) = B (q-1) u(k) (3.27)


0s valores ideais para A (q-1) e B (q-1) seriam os valores verdadeiros de A(q-1) e B(q-1) [2]. evidente
que na prtica tal escolha seria impossvel. No entanto, sempre possve1 obter-se uma aproximao
destes polinmios atravs dum ajuste prvio do modelo pelo mtodo dos mnimos quadrados numa
primeira iterao e depois utiliza-se o estimador dado por (3.19) em que z(k) calculado conforme
indicado em (3.26) e (3.27). Na iterao seguinte utiliza-se o resultado da estimativa anterior para
recalcular z(k) e assim sucessivamente. Geralmente o algoritmo converge rapidamente para uma
soluo.

- 38 -
3.3- Mnimos quadrados generalizados

Teorema 3.6

Seja o modelo

A(q-1) y(k) = B(q-1) u(k) + e(k) (3.28)

em que {u(k)} ,{y(k)} so, respectivamente, sequncias de entrada e sada e {e(k)} uma sequncia de
variveis aleatrias correlacionadas de mdia nula e varincia idntica. Se a funo de autocorrelao
de {e(k)} for conhecida, sempre possvel obterem-se estimativas consistentes dos polinmios, A(q-1)
e B(q-1).

Demonstrao: pelo teorema da factorizao espectral e(k) pode ser modelizado da seguinte forma

e(k) = H(q-1)(t) (3.29)

sendo {(k)} uma sequncia de variveis aleatrias no correlacionadas de mdia nula e varincia
idntica e

C(q-1)
H(q-1) = D(q-1) (3.30)

em que os polinmios qncC(q-1) e qndD(q-1) s tm zeros no interior do crculo unitrio.

Substituindo-se e(k) pelo seu valor em (3.29) resulta

A(q-1) y(k) = B(q-1) u(k) + H(q-1) (k) (3.31)

A(q-1) H-1(q-1 ) y(k) = B(q-1 )H-1(q-1)-1u(k) + (k)

Se se fizer

y*(k) = H-1(q-1) y(k) (3.32)


-1 -1
u*(k) = H (q ) u(k)

a equao ficar

- 39 -
A(q-1) y*(k) = B(q-1) u*(k) + (k)

Sendo H(q-1) conhecido, as sequncias {u*(k)} e {y*(k)} podem ser calculadas, o modelo fica
idntico ao da equao (3.7) e, pelo teorema 3.2, o estimador de mnimos quadrados fortemente
consistente.

No entanto, o teorema 3.6 de pouco interesse prtico pois raramente se conhece a autocorrelaao da
1
sequncia {e(k)}. Contudo, quando H (q-1) = D(q-1) resulta que

D(q-1)e(k) = (k) (3.33)

Se os valores da sequncia {e(k)} forem conhecidos, a equao (3.33) ter a forma do modelo (3.7)
com uma sequencial de entradas nulas. claro que nunca possvel calcular-se {e(k)} mas, esta
sequncia pode ser substituda por uma estimativa em que os seus membros so calculados por

^
(k) = (q-1)y(k) B(q-1) u(k) (3.34)

^
Sendo (q-1) e B(q-1) polinmios obtidos pelo mtodo dos mnimos quadrados aplicado ao modelo

A(q-1) y*(k) = B(q-1) u*(k) + (k) (3.35)


^
y*(k) = D(q-1) y(k)
^
u*(k) = D(q-1) u(k)

^
onde D(q-1) uma estimativa anterior de D(q-1). Este mtodo pode ser sumariado pelo seguinte
algoritmo:

- 40 -
Algortmo 3.1

^
1- D(q-1) = 1

^ ^
2- y*(k) = D(q-1) y(k), u*(k) = D(q-1)u(k)

^
3- Calcular (q-1) e B(q-1) do modelo

A (q-1) y*(k) = B*(q-1) u*(k) + (k)

^
4- (k) = (q-1) y(k) B (q-1) u(k) , k = 1,,N

^
5- Calcular as estimativas de mnimos quadrados D(q-1) do modelo

D(q-1) (k) = (k)

6- Se convergir termina seno vai para 2.

Este algoritmo conhecido por mnimos quadrados generalizados.

3.4 - Resumo

Os parmetro dum sistema descrito pela equao

y(k) = B(q-1) u(t) + (k)

(k) - rudo branco

podem ser calculados pelo mtodo dos mnimos quadrados. Nestas condies, as estimativas mantm
todas as propriedades anteriormente enunciadas.

Se o sistema dinmico

A(q-1) y(k) = B(q-1) u(k) + e(k)

- 41 -
a matriz X depende das observaes e, por isso, as propriedades de

^
= (XTX)-1 XTY

so diferentes. Se o erro de equao e(k) for rudo branco, o estimador de mnimos quadrados
fortemente consistente sob determinadas condies que no so difceis de se verificar. Nestas
^
condies, tem uma distribuio assimpttica N(,(XTX)-12) e assimptoticamente eficiente se o
rudo for gaussiano.
Quando o erro de equao no rudo branco, o mtodo no produz estimativas consistentes. Nessas
situaes podem-se utilizar os mtodos de variveis instrumentais ou de mnimos quadrados
generalizados. Ambos resultam de alteraes dos mnimos quadrados.

As estimativas de variveis instrumentais so dadas por


= (ZTX)-1ZTY

Z = [z(1) ... Z(N)]T


onde z(k) um vector de variveis instrumentais. Para que seja consistente, o vector de variveis
instrumentais deve verificar as seguintes condies

i) z(k) e x(k) suficientemente correlacionados por forma a que

det[E(z(k)XT(k)] 0

ii) z(k) e e(k) no correlacionados

A grande dificuldade da utilizao dos mtodos de variveis instrumentais reside no facto de estas
condies serem difceis de se confirmar a partir de clculos simples.

Os mnimos quadrados generalizados s se podem aplicar quando o erro da equao for modelizado
por um processo auto-regressivo.

D(q-1)e(k) = (k)

- 42 -
(k) - rudo branco

Embora o mtodo nem sempre convirja para o valor verdadeiro dos parmetros, na prtica na
maioria dos casos tem dado bons resultados.

- 43 -
4- PLANEAMENTO DE EXPERINCIAS DE IDENTIFICAO

4.1 Condies mnimas para o sinal de excitao

As estimativas dos parmetros dum sistema descrito pelo modelo

A(q-1) y(k) = B(q-1) u(k) + D(q-1) (k) (4.1)

calculadas atravs da minimizao do critrio

1 N
VN = 2 2 (k,) (4.2)
k=1

^ ^
D(q-1) (k,) = (q-1)y(k) B(q-1) u(k)

so nicas e fortemente consistentes se, entre outras condies, VN for uma funo estritamente
convexa. Quando isto acontece, diz-se que o sistema completamente identificvel pelo sinal u(k) e o
modelo (4.1). Se uma entrada no for capaz de excitar persistentemente a dinmica do sistema durante
o perodo de identificao, o sistema no completamente identificvel. Surge assim, o conceito de
sinais com excitao persistente [6,8].

Diz-se que um sinal tem excitao persistente de ordem m se

1 N
i) U = lim N u (k) existe
N
k=1

1 N
ii) ruu() = lim N u (k) u(k+) , = 0 ,1 ,..., existe
N
k=1

- 44 -
ruu(0) ruu(1) . . . ruu(m)


ruu(1) ruu(0) . . . ruu(m-1)
.
iii) R=
.
.
ruu(m) ruu(m-1) . . . ruu(0)

for definida positiva [3,10]. (4.3)

Exemplo 4.1

Considere-se que u(k) rudo branco com varincia 2. Nestas condies R = 2Im> 0. Conclui-se
ento, que o rudo branco tem excitao persistente para qualquer ordem.

Exemplo 4.2

Seja u(k) uma sequncia binria pseudo-aleatria com perodo M e amplitude V. As suas
caractersticas so

1 M
i) U = M u (k) = 0
k=1

ii) ruu () = V2 , = kM, k = 0,1 , ...

V2
iii) ruu () = - M ,kM +1 < < (k+1) M-1, k = 0,1,... [7]

Pode-se provar que as sequncias binrias pseudo-aleatorias tm excitao persistente para qualquer
ordem m < M. [7]

Para que a dinmica do sistema (4.1) seja continuamente excitada durante o perodo de identificao,
u(k) deve ter excitao persistente de ordem na + nb [3].
4.2 Sequncias binrias pseudo-aleatrias

- 45 -
Embora como se referiu na seco anterior o rudo branco seja muito rico em frequncias e
portanto tenha excitao persistente de qualquer ordem por vezes poder no ser fcil de gerar quando
por exemplo estamos a trabalhar com um micro controlador de baixo poder de clculo. Nesse caso
uma alternativa ser a utilizao de sequncias binrias pseudo-aleatrias (SBPA). Estas sequncias
binrias permitem a comutao do sinal de excitao entre dois nveis em torno do ponto de
funcionamento, de uma forma aparentemente aleatria, tendo o sinal gerado uma densidade espectral
aproximadamente constante at cerca de 0,3 vezes a frequncia de amostragem (Fs) do sistema [9].
Para uma correcta excitao do sistema todos os plos e zeros devem ter uma frequncia (mdulo)
inferior a este valor. Como partida no se conhecem os valores dos plos e zeros a escola do perodo
de amostragem apropriado poder ser um processo iterativo. A amplitude do sinal de excitao dever
ser o mais pequena possvel pois geralmente estamos a tentar encontrar uma aproximao linear em
torno de um ponto de funcionamento de um sistema que no linear. No entanto essa amplitude
dever tambm ser suficientemente elevada de modo a que a relao sinal / rudo sada do sistema
seja conveniente, ou seja, que se consiga distinguir perfeitamente a resposta ao sinal de excitao de
eventuais rudos ou perturbaes existentes.

As SBPA so geradas a partir de registos de deslocamento (shift registers) com


realimentao que podem ser implementados quer por hardware quer por software. O perodo da
sequncia gerada de 2N-1 em que N o nmero de bits do registo e inicialmente pelo menos um dos
bits do registo deve ser diferente de zero. A tabela 4.1 indica quais os bits que devem ser somados em
funo do nmero de bits do registo.

B1 B2 BN-2 BN-1 BN


Figura 4.1 Registo gerador de uma Sequncia Binria Pseudo-aleatria

- 46 -
n de bits N bits a somar
2 1e2
3 1e3
4 3e4
5 3e5
6 5e6
7 4e7
8 4e8
9 5e9
10 7 e 10

Tabela 4.1 Bits a somar para se gerar uma SBPA

Para se ter uma correcta identificao do ganho a baixas frequncias do processo a identificar
devemos ter o impulso de maior durao maior do que o tempo de subida do referido processo (tR).
Como com N bits o pulso mais longo ser N vezes o periodo de amostragem do sistema (Ts), resulta:

N.Ts > tR (4.4)

Por vezes a condio (4.4) pode resultar num valor de N demasiado elevado. Nessa situao
deve-se utilizar uma frequncia de deslocamento do registo inferior p vezes frequncia de
amostragem, resultando a condio:

p.N.Ts > tR (4.5)

No entanto no se deve utilizar valores de p demasiado elevados pois dessa forma estamos a
reduzir a componente de altas frequncias. Conforme j anteriormente se referiu a SBPA tem um
espectro de frequncia aproximadamente constante at frequncia dada por:

fsup = 0,3*Fs/p (4.6)

- 47 -
4.3 Testes de ordem do modelo

Uma das condies para que as estimativas produzidas pelo mtodos de identificao sejam
consistentes, de que os modelos sejam capazes de descrever o funcionamento do sistema. A
determinao da ordem do modelo pode ser feita a partir do conhecimento da estrutura do sistema e
respectivas equaes diferenciais. Como na maior parte das situaes esse conhecimento no existe,
foi necessrio desenvolver-se mtodos que permitam testar a adaptao dum modelo ao sistema.
O objectivo dos testes de ordem de modelo o de determinar qual o menor nmero de
parmetros necessrios descrio do sistema. Basicamente consistem em processos iterativos, nos
quais se comparam modelos com ordens diferentes, testando-se se vale a pena utilizar os de maior
nmero de parmetros. Existe uma grande variedade de testes de ordem de modelo [10, 11] nem
sempre quantificados em termos estatsticos. Em todos h uma probabilidade de erro e, por isso,
aconselhvel utilizar-se testes diferentes sobre o mesmo conjunto de dados. Por outro lado o resultado
da estimativa dos parmetros pode dar uma excelente resultado mas apenas para o conjunto de dados
utilizados no clculo dessa mesma estimativa. Por isso sempre conveniente repetir os testes com
outros conjuntos de dados no utilizados no clculo da estimativa.

4.3.1 Mtodos baseados na anlise dos resduos

Se w(k,^), k=1, , N forem os resduos do modelo

A(q-1) y(k) = B(q-1) u(k) + C(q-1) (k) (4.7)

ou seja,

(q-1) y(k) = B (q-1) u(k) + C(q-1) w(k,^)


^ ^
(4.8)

Se os parmetros do modelo estiverem correctamente estimados os resduos tendem para


rudo branco. Pode-se ento concluir que, do ponto de vista estatistico, a anlise dos resduos pode
construir um bom teste da adaptao do modelo ao sistema. Obviamente que este teste no pode ser
aplicado com um estimador que no estime o polinmio C(q-1).

4.3.1.1 Grfico de evoluo dos resduos

- 48 -
A brancura dos resduos gerados por um algoritmo de identificao pode ser avaliada atravs
de grficos que traduzem a sua evoluo com o tempo. Nesses grficos, pode-se detectar se existe
algum padro de variao. Se isso acontecer, conclui-se que os resduos so correlacionados e o
modelo deve ser rejeitado. O grande inconveniente deste teste de que o seu resultado depende muito
do observador e, por isso, deve funcionar como complemento a outros com significado estatstico
mais preciso.

4.3.1.2 Teste de brancura de resduos

A brancura dos resduos pode-se verificar atravs da sua funo de autocorrelao normalizada:

N
1
R() =
R(0).(N - max)
w(k,^) w(k-,^) (4.9)
k=1+max

Prova-se que a funo de autocorrelao uma varvel aleatria com mdia nula para 0, donde para
um nmero N suficientemente elevado se os resduos forem brancos o clculo da funo de
autocorrelao deve dar valores prximos de zero para 0.

4.3.2 Diagrama de plos e zeros

Quando se pretende descrever um sistema com um modelo sobreparametrizado, pode


acontecer que existam vrios vectores de parmetros que conduzam mesmas funes de
transferncia:

^ ^
^ B(z-1) ^ C(z-1)
H u(z) = (q-1) e H e(z) = (z-1) (4.10)

que traduzem respectivamente as dinmicas do processo e do rudo. Se existir um plo que seja
^ ^
(quase) cancelado em H u(z) e He(z), a ordem dos polinmios pode ser reduzida de uma unidade. Caso
se utilize um estimador que no estime o polinmio C(q-1), podemos fazer o teste apenas com a
^
funo de transferncia H u(z).

A dificuldade deste teste reside em saber-se quando que um plo e zero esto
suficientemente prximos para se considerar que se cancelam.

- 49 -
4.3.3 Simulao com outro conjunto de dados

Um teste bastante genrico e fivel consiste um obter-se pelo menos um segundo conjunto de
dados, no utilizados na estimao dos parmetros, e comprar a resposta do modelo identificado com
a resposta do sistema nesse segunda amostra. Somando-se o quadrado da diferena entre essas duas
respostas verificamos que esta soma decresce inicialmente com o aumento da ordem do modelo
voltando depois a crescer assim que comeamos a sobredimensionar o modelo.

4.4 Consideraes gerais

Para uma correcta identificao do modelo, alm do cuidado a ter-se na escolha do estimador
devemos ter bastante cuidado tambm na recolha de dados, no tipo de sinal de excitao aplicado e no
perodo de amostragem utilizado. O processo de identificao muitas vezes um processo iterativo
obrigando a repetir-se experincias quando os modelos no se ajustam logo na primeira iterao. Um
dos cuidados frequentemente descurados o facto de geralmente estarmos a identificar um modelo
que traduz o comportamento do sistema em torno de um ponto de funcionamento e s valido em torno
desse ponto. Deve-se portanto, antes que aplicar o sinal de excitao deixar o sistema estabilizar nesse
ponto. Sendo o sistema aproximadamente linear, aplicando-se um sinal de excitao (sobreposto ao
sinal referente ao ponto de funcionamento) de valor mdio nulo, devemos ter tambm uma resposta de
valor mdio nulo (depois de retirado o valor referente ao ponto de funcionamento). Tal por vezes no
acontece quer porque o valor mdio do sinal de excitao no nulo quer porque o sistema no estava
perfeitamente estabilizado antes do sinal aplicado quer devido a perturbaes. Por exemplo o rudo
branco gerado por um computador pode, principalmente se tivermos poucos pontos, no dar valor
mdio nulo. Por estes motivos antes de utilizar os sinais para identificar o modelo deve-se retirar o
valor mdio quer ao sinal de excitao quer s respostas lidas.

Resumidamente o processo divide-se nos seguintes passos:

1 Inicialmente deve-se ter uma ideia do ganho e do tempo de estabelecimento do sistema. Se


tal no acontecer deve-se aplicar um degrau em torno do ponto de funcionamento e da resposta retirar
esses dados.
2 Recolher alguns pontos com o sistema estabilizado no ponto de funcionamento para se
estimar o amplitude do rudo existente nas medidas. A amplitude do sinal de excitao deve ser tal

- 50 -
que amplitude da resposta do sistema, pelo menos a baixas frequncias, seja substancialmente maior
do que o rudo. Tal depende obviamente do ganho referido no ponto anterior.
3 Ter uma estimativa inicial das constantes de tempo envolvidas. Este valor permitir a
escolha do perodo de amostragem que deve ser tal que tenhamos entre algumas dezenas a algumas
centenas pontos na resposta transitria a um degrau.
4 Escolher o tipo de sinal de excitao a aplicar, a amplitude do mesmo e o nmero de
pontos a adquirir.
5 Escolher o algoritmo a utilizar em funo do rudo presente nas leitura, a estrutura do
modelo e a ordem inicial do mesmo que deve ser a mais baixa que tenha alguma hiptese de se ajustar
ao sistema. Se o rudo for muito baixo pode-se tentar os mnimos quadrados ordinrios.
6 Calculada a estimativa dos parmetros do modelo deve-se proceder sua validade por um
dos mtodos anteriormente expostos preferencialmente utilizando-se um conjunto de dados que no
entrou no clculo da estimativa dos parmetros. Caso o modelo no se ajuste deve-se repetir o
processo a partir do ponto 4 ou 5, aumentado-se a ordem do modelo ou melhorando-se o sinal de
excitao (mais amplitude, mais pontos, ...).Existe sempre a hiptese do processo ser bastante no
linear no ser aproximveis por um modelo linear ou existirem demasiadas perturbaes que
inviabilizam o processo de identificao.

- 51 -
5. EXEMPLO 1: Modelizao e identificao de um robot mvel (INCAL)

Ao construirmos um modelo para descrever um dado fenmeno, procuramos que esse modelo
capture as caractersticas que consideramos essenciais e que, ao mesmo tempo, mantenha um grau de
simplicidade que permita a sua tratabilidade tanto terica como numrica. A maior parte das vezes o
modelo escolhido pela disponibilidade de ferramentas tericas e prticas e no tanto pela sua sntese
a partir de consideraes fsicas. Na construo do modelo que vamos apresentar podemos ver o
recurso simultneo a estas duas metodologias. Trabalhando dessa forma conseguimos um modelo que
nos pareceu adequado.
Podemos ver na figura seguinte as grandezas em jogo no caso do INCAL:

Figura 5.1 - Representao grfica do estado associado ao INCAL

Consideremos que no h escorregamento lateral, ou seja, que a velocidade das rodas, no ponto de
contacto com o cho, sempre perpendicular ao seu eixo.
Consequentemente, o estado do INCAL, em termos de posicionamento, pode ser dado por:

[
X ( t ) = x( t ) y( t ) ( t ) v( t ) ( t ) ]T (5.1)

Em que x(t) e y(t) representam a posio do ponto C no plano, (t) a atitude do INCAL, v(t) a
velocidade tangencial do ponto C e (t) a velocidade angular, isto , a velocidade de rotao do
INCAL segundo o eixo vertical que passa por C.

Uma outra possibilidade para a escolha das variveis de estado a seguinte:

- 52 -
[
X ( t ) = x( t ) y( t ) ( t ) v1( t ) v2 ( t ) ]T (5.2)

Neste caso v1(t) e v2(t) so as velocidades medidas no ponto de contacto entre o cho e as rodas.
Porqu o destaque desta variante, em particular? Essencialmente porque recorrendo hodometria
podemos, praticamente, medir v1(t) e v2(t) directamente. De qualquer modo relativamente fcil
passar de uma representao para a outra pois temos:

v1( t ) + v2 ( t )
v( t ) = (5.3)
2

v1( t ) v2 ( t )
( t ) = (5.4)
b

sendo b a distncia entre os dois pontos de contacto. Este valor pode ser aproximado pelo da
distncia entre as rodas.

5.1 Cinemtica

Nesta seco tratamos o problema de obter a posio e atitude do veculo a partir do conhecimento
das velocidades. Ou seja partiremos do princpio que conhecemos v1(t) e v2(t) e queremos conhecer
como o resto do estado evoluir ao longo do tempo.
Considerando a condio de no escorregamento teremos:

d
x( t ) v( t ) cos ( t )

( )
dt ( )
y( t ) = v( t ) sin ( t ) (5.5)
( t ) ( t )

x( 0) x( t )

Conhecendo y( 0) podemos integrar a equao anterior para obter y( t ) .
( 0) ( t )

Como referimos estas equaes so apenas vlidas considerando a ausencia de deslizamento. Se


houver deslizamento, uma das muitas maneiras de o modelizar perturbando algumas destas
componentes com rudo. claro que para determinar quais as componentes a perturbar, assim como o
tipo de perturbao, seria necessrio comparar o modelo com realizaes onde se tivesse medido esse
fenmeno. Nos testes efectuados, a maior parte das vezes no se verificava deslizamento de qualquer

- 53 -
espcie. Para o tipo de rodas utilizado, o material constituinte do cho e as aceleraes a que o INCAL
est sujeito verificmos que praticamente no existe esse problema.

5.2 - Equaes Cinemticas em Tempo Discreto

O modelo apresentado anteriormente um modelo de tempo contnuo e ns s dispomos de medies


em instantes discretos. Temos, a cada 50 ms, a medida da distancia percorrida por cada uma das rodas
motrizes. Fizemos uma aproximao de ordem zero ou seja consideramos que a velocidade, durante o
perodo de amostragem se mantm constante.
Sejam d1(i) e d2(i) as medidas do deslocamento de cada roda no instante i. Temos:
d ( i ) + d2 ( i )
v$(i ) = 1 (5.6)
2T

d ( i) d2 ( i)
(i) = 1 (5.7)
b

sendo b a distancia entre os pontos de contacto entre as rodas e o solo e T o perodo de amostragem.
Embora j tenha sido referido, convm realar que este parmetro b pode ser uma fonte de impreciso.
Se os pneus apresentarem uma superfcie plana, o ponto de contacto pode variar entre o interior e o
exterior da roda. Esta , para certos tipos de veculo, uma fonte muito importante de erro na
hodometria. No nosso veculo, como as rodas so relativamente estreitas este problema tem uma
influencia mnima nos resultados.
A passagem de uma equao diferencial para a respectiva equao s diferenas pode trazer
problemas inesperados, principalmente se a equao for no linear. Normalmente necessrio o
recurso a uma srie de aproximaes para obter um expresso aproximada. Teremos portanto
diferentes verses das equaes discretas conforme a aproximao escolhida.

5.2.1 - Discretizao Por Diferenas Avanadas

Numa primeira aproximao construmos o seguinte modelo em tempo discreto:

( )
x(i + 1) = x(i ) + v(i ) sin (i ) (5.8)

( )
y(i + 1) = y(i ) + v(i ) cos (i ) (5.9)

(i + 1) = (i ) + (i ) (5.10)

Estamos, basicamente, a fazer uma aproximao de primeira ordem da equao (5.5) . Os resultados
obtidos por esta aproximao equivalem-se ao de uma integrao pelo mtodo de Euler com passo

- 54 -
igual ao perodo de amostragem. Evidentemente haver um certo erro introduzido por esta tcnica. Na
figura seguinte ilustramos este problema:

Figura 5.2 - Discretizao por diferenas avanadas

claro que na realidade no vamos obter uma estimativa to afastada da posio real quanto a figura
pode fazer crer. Mantendo uma das rodas velocidade mxima e a outra parada (este um dos piores
casos) verificamos que, entre duas medidas consecutivas, temos no mximo um deslocamento de 5
mm. Como a distancia entre as rodas de 168 mm teremos uma variao no ngulo de 1.7. Para um
ngulo desta magnitude a aproximao de sen(x) por x d origem a um erro inferior a 5 partes por
milho. Na figura o ngulo muito mais elevado o que exagera o erro cometido.

5.2.2 Discretizao Por Diferenas Centradas

Se, por algum motivo, tivermos uma frequncia de amostragem mais baixa, ento o erro introduzido
pela aproximao apresentada poderia crescer significativamente. Por esse motivo recorremos a uma
outra variante para a discretizao a que chamamos uma aproximao por diferenas centradas. A sua
formulao apresentada a seguir:

(i )
x(i + 1) = x(i ) + v(i ) sin (i ) + (5.11)
2

(i )
y(i + 1) = y(i ) + v(i ) cos (i ) + (5.12)
2

- 55 -
(i + 1) = (i ) + (i ) (5.13)

Nesta aproximao consideramos que existe um ponto, a meio da trajectria descrita, onde a variao
em corresponde a metade da sua variao total. Na figura a seguir podemos ver como a estimativa
ter tendncia a ser muito melhor do que a obtida usando a aproximao anterior.

Figura 5.3 - Discretizao por diferenas centradas

Apesar de tudo, poderemos ver a seguir que os resultados apresentados pelos dois modelos no
diferem de um modo to perceptvel. Como este modelo de diferenas centradas no praticamente
mais pesado do que o de diferenas avanadas e igualmente robusto, foi esse o adoptado.

5.2.3 Discretizao Exacta

Seria possvel construir um modelo mais exacto da aproximao discreta, mas mantendo os
pressupostos de velocidade constante ao longo do intervalo de amostragem e de que o ponto de
contacto com o cho se situa no meio das rodas. Ora estes pressupostos influiro muito mais os
resultados finais do que o erro introduzido pelo mtodo de discretizao, pelo que no foi procurado
um modelo discreto mais refinado.

5.3 Estimao dos Parmetros das Equaes Cinemticas

- 56 -
Para a correcta utilizao destas equaes necessrio conhecer uma alguns de parmetros. Um deles
b, que ser aproximado pela distancia entre as rodas. Os outros so K1 de K2 que correspondem aos
factores de converso para distancias dos impulsos da hodometria. Como estes parmetros esto
directamente ligados com caractersticas fsicas do INCAL, que podem ser facilmente medidas com
uma preciso aceitvel, estimamos o seu valor por esse meio. Basicamente estes factores podem ser
calculado conhecendo o nmero de impulsos gerado em cada volta das rodas e medindo o dimetro
das mesmas. Do resultado das experincias efectuadas, que sero apresentados a seguir, conclumos
que as estimativas eram perfeitamente aceitveis.

5.4 Cinemtica em Aco

Para comparar a discretizao por diferenas avanadas e por diferenas centradas verificamos os
resultados obtidos para uma misso realizada pelo INCAL. Neste exemplo controlamos a sua
trajectria de modo a que ele passasse pela vizinhana de uma srie de pontos. No final verificamos a
posio onde parou e comparamos com o valor estimado pela odometria. Verificamos tambm a
diferena entre a estimao oferecida por cada um das discretizaes.

Na figura apresentada a seguir podemos ver o percurso estimado pelos dois mtodos. Podemos
verificar que praticamente so indistinguveis os resultados de um e de outro. A vizinhana dos pontos
que procuramos sucessivamente atingir est representada recorrendo a circunferncias.
(m)

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

-0.1

-0.2

-0.2 0 0.2 0.4 0.6 0.8 1


(m)

Figura 5.4 - Um passeio do INCAL

- 57 -
rad 1
0.5
0
-0.5
-1
-/2
-1.5
-2
-2.5
-3

-3.5
0 10 20 30 40 50 60
t (s)

Figura 5.5 - Evoluo da orientao do INCAL

Apesar dos resultados obtidos recorrendo s duas tcnicas serem muito semelhantes h ainda ligeira
diferenas. Essas diferenas so evidenciadas no grfico seguinte

x 1E-4 (m)
1

-1

-2

-3

-4

-5

-6

-7

-8

-9
-1 0 1 2 3 4 5 6
x 1E-4 (m)

Figura 5.6 - Diferena entre as duas discretizaes no plano xy (xc-xa,yc-ya)

Um outro problema dever ser levantado, qual a preciso que se pode esperar da hodometria. Na
realidade pode haver escorregamentos, a velocidade varia durante o tempo entre amostras e o
arredondamento introduzido durante a medida introduz erros. Por tudo isso, queremos saber at que
ponto podemos confiar na hodometria. Para tal, vamos comparar a posio final conforme a
hodometria com o que aconteceu realmente. Na tabela seguinte podemos ver os valores obtidos por
medio directa e os obtidos pela hodometria.

- 58 -
x (m) y (m) ngulo ()
Estimado 0.2076 -0.0053 -180.1786
Medido 0.2200 -0.0250 -177.1376
Erro 0.0124 0.0197 3.0410

Para obter a posio a partir das medidas da hodometria necessria, basicamente, uma integrao.
Consequentemente estaremos a integrar o erro cometido, isso faz com que at pequenos erros se
tornem considerveis desde que passe algum tempo. Atendendo a que foi percorrido um trajecto com
cerca de 2.45 m, que equivale a cerca de 15 vezes a distancia entre as rodas, verificamos que a
hodometria apresenta um erro muito baixo para a preciso dos sensores usados. Neste caso o bom
desempenho na estimao da atitude crucial pois esse erro propaga-se severamente para x e y.

5.5 Dinmica

At agora tratamos do problema de relacionar as velocidades com a posio. Iremos agora ver o
problema de relacionar as foras e aceleraes com as velocidades. Para comear analisaremos os
elementos que usamos para aplicar foras no nosso veculo: os motores.
Os motores usados, sendo motores de corrente continua com iman permanente, esto vocacionados
para o funcionamento a velocidades considerveis, s quais apresentam binrios no muito elevados.
Tornou-se necessrio recorrer implementao de redutores que nos permitem velocidades baixas
combinadas com binrios mais interessantes. Normalmente os redutores introduzem dois factores de
perturbao: folgas e atrito. Estes dois problemas aparecem de um forma balanceada, podemos
diminuir as folgas custa de introduzir mas atrito e vice versa. No nosso caso o atrito relativamente
grave e como veremos contribui para piorar a no linearidade do sistema.

5.6 Modelo Terico dos Motores

Em geral, um motor de corrente contnua com iman permanente pode ser aproximado, em torno de um
ponto de funcionamento prximo do seu regime nominal, pelo seguinte modelo:

- 59 -
ii

Ri Li
ui
+
e=M
-

Figura 5.7

A que corresponde:

di (t )
u(t ) = Ri (t ) + L + M (5.14)
dt

d ( t )
m = Ki (t ) B (5.15)
dt

em que:
R - Resistncia interna do motor
L - Indutncia interna do motor
M - coeficiente da fora contra-electromotriz
m - Momento de inrcia do motor + carga
K - Relao binrio-corrente
B - Atrito viscoso

Recorrendo Transformada de Laplace e eliminando i(s) teremos:


( s) K
= (5.16)
u( s) Lms + ( Rm + LB) s + RB + KM
2

Esta uma funo de transferncia de um sistema de segunda ordem. Normalmente um dos plos
mais rpido que o outro, pois deve-se presena da bobine enquanto o outro tem a ver com a inrcia
mecnica do motor e da carga. Por isso podemos construir um modelo de primeira ordem em que
consideramos L nulo.
( s) K
= (5.17)
u( s) Rms + RB + KM

Para a frequncia de amostragem e com os motores que usados verificamos que esta aproximao
perfeitamente aceitvel. No s a frequncia relativamente baixa como os motores so dominados

- 60 -
pelo plo associado inercia mecnica. Isso ir simplificar consideravelmente o nosso modelo da
dinmica pois, como temos dois motores, ao baixar a ordem de dois para um estamos a poupar dois
estados.

5.7 A No Linearidade dos Motores

O modelo apresentado, sendo perfeitamente vlido para tratar a dinmica de um motor em torno de
um dado ponto de funcionamento, no adequado quando queremos inverter o sentido de rotao do
motor. Isto porque, principalmente para os motores que usamos, existe uma zona morta de uma
largura considervel. Podemos ver esse problema no seguinte grfico onde se apresenta a velocidade
atingida pelo veculo em funo da tenso aplicada aos motores.
Velocidade
10

-5

-10

-1 -0.5 0 0.5 1

u1, u2

Figura 5.8 - Relao Velocidade/Tenso aplicada

O grfico apresenta-se algo ruidoso pois os sensores usados para medir a velocidade quantizam o
sinal em poucos nveis. Essa uma das fonte de rudo mais graves, no nosso sistema. Para tentar
obviar esse problema foram efectuadas vrias experincias e tomamos a mdia de todas elas. Podemos
agora ver o mesmo grfico com a mdia de 4 medidas.

- 61 -
Velocidade
10

-5

-10

-1 -0.5 0 0.5 1
u1, u2

Figura 5.9 - Relao Velocidade/Tenso aplicada

Note-se ainda a diferena de inclinao da recta que d a relao velocidade/tenso para os dois
sentidos de rotao. Mais um factor que inviabiliza o recurso a um modelo linear vlido para toda a
gama de funcionamento.
Podemos agora delimitar as zonas onde ser possvel usar um modelo linear. Mesmo dentro dessas
zonas no temos a certeza da sua validade, pois o facto de as caractersticas em regime permanente
parecerem lineares no implica que a dinmica seja linear. Porm pelas experincias efectuadas
verificamos que o modelo linear, quando usado nessas zonas, apresentava resultados bastante
aceitveis. Os resultados dessa tcnica podem ser apreciados no captulo 6.

5.8 Equaes da Dinmica

Para sintetizar as equaes dinmicas do veculo seria necessrio entrar com as equaes dinmicas
dos motores, tal como foram apresentada anteriormente, com as equaes da dinmica de um corpo
rgido em 2D e ainda com as restries ao movimento que aparecem devido ausncia de movimento
relativo entre o ponto de contacto entre as rodas e o cho. Se considerarmos a possibilidade de
escorregamento, provavelmente uma funo no linear da fora exercida pela roda no solo, o
problema torna-se ainda mais complexo. Esta tcnica abordada em [Steer89] e [Zhao92] tanto em
casos com escorregamento como sem ele.

Naturalmente comeamos pelo modelo mais simples possvel que parecesse capaz de explicar a
dinmica do INCAL. Era tambm importante dispor de um modelo que fosse usvel em termos do
projecto de um controlador. Assim, consideramos um modelo linear para os atritos e para o
acoplamento dinmico entre as duas rodas da plataforma. Obtivemos ento o seguinte modelo:

- 62 -
v&1( t ) a11 a12 v1( t ) b11 b12 u1( t )
= . + . (5.18)
v&2 ( t ) a21 a22 v2 ( t ) b21 b22 u2 ( t )

ou seja um modelo na forma:

x&( t ) = A. x( t ) + B . u( t )
(5.19)
y( t ) = C . x( t )

com

a11 a12 b b 1 0
A= B = 11 12 C = (5.20)
a21 a22 b21 b22 0 1

A que equivale, segundo o que foi apresentado no captulo 1, o seguinte modelo discreto:
x(i + 1) = A. x(i) + B. u(i)
(5.21)
y(i) = C. x(i)

com

a11 a12 b11 b12 1 0


A= B= C = 0 1 (5.22)
a21 a22 b b
21 22

Embora alguns elementos de A e B estejam directamente relacionados com algumas caractersticas


fsicas do INCAL (massa, momento de inrcia), tornar-se-ia muito difcil e potencialmente falvel
estimar esses valores por um processo de sntese. Em vez disso recorremos aos mtodos apresentados
no captulo 3 para a estimao.

5.9 Estimao dos Parmetros das Equaes da Dinmica

Para identificar este modelo recorremos s tcnicas apresentadas anteriormente.


Inicialmente consideramos um ponto de funcionamento semelhante ao que seria usado durante uma
misso normal. Em torno desse ponto perturbamos o sistema com diferentes tipos de sinais de teste.
Queremos estimar os valores da matriz A e B conforme o modelo apresentado em (5.21).
Consideremos que temos N medidas consecutivas, i = 1,..., N . O erro cometido em estimar y(i+1)
conhecendo y(i) :
e(i + 1) = y(i + 1) A. y(i ) B. u(i ) (5.23)

Estabelecendo uma funo de ponderao do erro:


N
E = eT (i). e(i) (5.24)
i =1

- 63 -
Estaremos a penalizar a soma dos quadrados do erros cometidos quando calculamos a prxima sada
usando os valores da sada anterior e a nossa estimativa da dinmica.
Este um estimador de mnimos quadrados. Fazendo:

=[A B]
T
(5.25)

[
Y = y ( 2) K y ( N ) ]T (5.26)

y( i )
w(i) = (5.27)
u(i)

[
X = w(1) w( 2) K w( N 1) ]T (5.28)

bastar agora empregar (3.6) para obter a estimativa procurada.

Como j foi mostrado no captulo 3, desde que esteja presente rudo na observao e neste caso existe,
a estimativa ser inevitavelmente enviesada.

5.9.1 Outros Estimadores

Como foi j salientado podemos construir outros estimadores que esperamos demonstrem
propriedades mais favorveis. Iremos construir duas variantes de um estimador de Mnimos
Quadrados (LS): um estimador com Varivel Instrumental (IV) e um estimador de Mnimos
Quadrados Repetidos (RE).
De aqui em diante designaremos cada um dos estimadores pela siglas apresentadas.

5.10 Resultados da Estimao

Vamos agora apreciar o desempenho dos estimadores atrs referidos perante um conjunto de dados
gerados por uma srie de testes efectuados sobre o INCAL. Iremos observar os resultados
apresentados por cada um dos estimadores, compar-los entre si e com dados proveniente de outras
experincias.
Os sinais em questo so:

Entradas. As tenses u1(t) e u2(t) aplicadas aos respectivos motores e dadas no intervalo [ -
1,1 ]. O valor de ux(t) corresponde fraco da tenso mxima (12 V).

- 64 -
Sadas. As velocidades v1(t) e v2(t) medidas para cada uma das rodas. O valor apresentado
exactamente aquele que lido pelos sensores em cada intervalo de amostragem. Para termos a

leitura em m/s deveramos multiplicar o valor pela constante Kv = 20 . Mantivemos os
6000
valores de vi(t) sem tratamento pois torna-se mais evidente a quantizao das leituras.

Erro. As diferenas e1(t) e e2(t) entre as velocidades medidas e as estimadas pelo modelo. Este
erro foi encontrado pela diferena entre o sinal medido e a simulao, com o mesmo sinal de
entrada, para cada um do modelos estimados. Realce para o facto de que este erro diferente
daquele definido para a estimao. Enquanto a tnhamos o erro como a diferena entre o valor
previsto pelo modelo e o valor medido no instante t, dado o valor medido no instante t-1. J
neste caso apenas dado o valor inicial e toda a simulao se apoia nos valores gerados. este
erro que apresentados nas tabelas de comparao entre os mtodos.

5.10.1 Experincia I

Nesta primeira srie de medidas temos:


u1(t) = .78 + N( 0, 0.2)

u2(t) = .78 + N( 0, 0.2)

Ou seja, estamos a considerar um ponto de funcionamento em torno do 78% do regime mximo e


perturbamos esse ponto com rudo gaussiano com desvio padro de 0.2. Nos casos em que de u(t)
tomou valores fora do intervalo [ -1, 1 ] ele foi arredondado para o extremo mais prximo. Esse efeito
visvel na figura apresentada.
Para os estimadores fornecemos os sinais subtrados do seu valor mdio.

Nas figuras seguintes podemos ver os sinais de entrada e de sada:

- 65 -
1

0.9

0.8

0.7

0.6

0.5

0.4
u1(t)
0.3
u2(t)
0.2
0 2 4 6 8 10 12 14
t (s)

Figura 5.10 - Sinal de Controlo aplicado

Estamos perante duas realizaes de rudo branco com um efeito de saturao exercido sobre o sinal
de entrada. Ressalve-se que se no se v valores acima de um isso deve-se ao facto do sinal de entrada
no ultrapassar esse valor.

v(t) 10
v2(t) v1(t)
9

2
0 2 4 6 8 10 12 14
t (s)

Figura 5.11 - Velocidades Medidas

- 66 -
Podemos ver claramente a discretizao dos valores de sada, os quais s tomam valores inteiros.
Apresentamos agora um quadro com os resultados de obtidos por cada um dos estimadores.
LS IV RE
A 0.2227 0.1300 0.3367 0.2403 0.3567 0.2265
0.2136 0.0308 0.3322 0.1612 0.3492 0.1541
B 5.8279 0.6191 5.8709 0.6906 5.6404 0.7737
0.6089 5.6019 0.6525 5.6855 0.3881 5.7507

Nas figuras a seguir podemos ver a comparao grfica entre as respostas, ao sinal de entrada usado
para a estimao dos vrios modelos.

v1(t) 4
v(t)
vls(t)
3 viv(t)
vels(t)
2

-1

-2

-3

-4
0 2 4 6 8 10 12 14
t (s)

Figura 5.12 - Comparao entre a velocidade medida e prevista pelos modelos

4
v2(t) v(t)
vls(t)
3 viv(t)
vels(t)
2

-1

-2

-3

-4
0 2 4 6 8 10 12 14
t (s)

Figura 5.13 - Comparao entre a velocidade medida e prevista pelos modelos

- 67 -
Embora o tipo de sinal no permita uma comparao visual das respostas muito precisa podemos
verificar que os resultados dos mtodos IV e RE so extremamente parecidos. Tal tambm se verifica
nos valores obtidos para as matrizes A e B.
Mas ainda temos diferenas significativas entre os diferentes mtodos e podemos por a questo: Qual
o que melhor representa o nosso sistema? Seria tentador tentar responder a essa questo calculando o
erro entre os valores previstos pelo modelo e os obtidos na experincia que usamos para calcular o
modelo. Isso pode levar-nos a concluses errneas pois na realidade estamos a medir quo o nosso
modelo est ajustado aos dados e no o seu ajuste ao sistema que gerou os dados. Esse problema
evidenciado no quadro a seguir:

LS IV RE
e( t ) 154.3654 147.5391 147.4314
1

e( t ) 13.1058 11.9305 11.9524


2

e( t ) 2.9887 2.7455 2.7335


Segundo estes resultados a estimativa por mnimos quadrados ligeiramente pior, mas a diferena no
significativa! No nos esqueamos que estas estimativas so realizaes de varveis aleatrias.
Embora se considere o estimador LS enviesado ao contrrio do IV e do RE, as varincias associadas
podem permitir resultados que disfarcem esse problema. claro que isso improvvel e no nos
podemos esconder nessa possibilidade. A resposta a este problema passa por comparar os modelos
com dados provenientes de experincias independentes. Sendo o conceito de independncia usado no
sentido em que a informao contida nessas experincia no foi de forma alguma usado na estimativa
do modelo.
Os sinais de teste usados foram ento:

a) Uma rampa de variao muito lenta, tomando valores entre 0 e 1. Este sinal semelhante quele
que foi usado para extrair a resposta em regime permanente do motores. Servir essencialmente para
comparar as caractersticas em regime permanente dos nossos modelos.

b) Uma combinao seno-coseno de varrimento que excita um boa gama de frequncias do sistema.
Com este sinal podemos observar o ajuste do nosso modelo para uma srie de frequncias.

- 68 -
Comparao do regime permanente

Conforme j referimos introduzimos uma rampa lenta, tomando valores no intervalo [0 , 1], em ambas
as entradas do sistema real e em cada um dos modelos estimados. Os resultado esto sumariados nas
figuras seguintes.
LS IV
10 10

8
INCAL

6 5
LS

2 0 IV
INCAL
0

-2 -5
0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1

RE Todos
10 10

Ponto de
Funcionamento

5
INCAL
5 LS

0 RE 0
IV
RE

-5 -5
0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1

Figura 5.14 - Comparao entre o regime permanente medido e previsto pelos modelos

Podemos ver nos grficos anteriores o desajuste do modelo construdo pela estimativa LS. Agora sim
aparece evidente o problema do enviesamento. Pode primeira vista parecer que a estimativa LS nem
est muito m pois ajusta-se zona morta, s que isso no passa de uma coincidncia. Podemos ver
no grfico onde temos o sinal usado para a identificao, que raramente temos velocidades abaixo de
3 e nunca abaixo de 2. Desta forma no h pontos na zona morta que justificassem o desvio da

- 69 -
estimativa LS. Verificamos j, em outros casos, que o desvio da inclinao se apresentava no sentido
contrrio, fruto apenas do enviesamento inerente ao mtodo.
Os mtodos IV e RE apresentam resultados extremamente interessantes pois, em torno do ponto de
funcionamento escolhido, apresentam uma resposta que se confunde com a do sistema real. No s
nos fornecem um modelo melhor do que a mera aplicao dos mnimos quadrados, como sugerem um
modelo que parece capturar perfeitamente a resposta em regime permanente.

Comparao das Respostas em Frequncia

Desta vez introduzimos uma combinao seno-coseno de varrimento, em ambas as entradas INCAL e
em cada um dos modelos estimados.
Os resultado esto sumariados nas figuras seguintes.

1
u(t) u2(t) u1(t)
0.9

0.8

0.7

0.6

0.5

0.4

0.3
0 2 4 6 8 10 12 14
t (s)

Figura 5.15 - Sinais de Entrada (Tenses aplicadas aos motores)

- 70 -
9
v(t) v2(t) v1(t)
8
7
6
5
4
3
2
1
0
0 2 4 6 8 10 12 14
t (s)

Figura 5.16 - Sadas (Velocidades)

A seguir apresentamos uma srie de figuras onde se comparam as velocidades medidas com aquelas
previstas pelos diferentes estimadores quando lhes aplicado o mesmo sinal na entrada. Podemos ver
claramente que o modelo estimado por mnimos quadrados d origem a uma estimativa da velocidade
inferior quela que conseguida pelos outros mtodos.

5
v(t) Medido
4 IV, RE
3
2
1
LS
0
-1
-2
-3
-4
-5
0 2 4 6 8 10 12 14
t (s)

Figura 5.17 - Comparao entre a velocidade v1 medida e prevista pelos modelos

Para melhor verificarmos as diferenas entre os diferentes modelos seleccionamos a parte inicial da
resposta temporal. As figuras seguintes so uma ampliao dos instantes iniciais da figura anterior.

- 71 -
4
v(t) IV, RE
3
Medido
2

1
LS
0

-1

-2

-3

-4
0 0.5 1 1.5 2 2.5 3
t (s)

Figura 5.18 - Comparao entre a velocidade medida e prevista pelos modelos (Pormenor)

Podemos ver aqui como o modelo construdo a partir da estimativa LS prev uma velocidade algo
aqum da medida. As velocidades previstas pelos modelo IV e RRE tm tendncia a exceder
ligeiramente a velocidade medida mas apresentam um ajuste realidade muito melhor. Nota-se ainda
que os dois modelos so praticamente indistinguveis na sua resposta temporal.

4
v(t) IV, RE
3
Medido
2
LS
1

-1

-2

-3

-4
2.5 3 3.5 4 4.5 5 5.5
t (s)

Figura 5.19 - Comparao entre a velocidade medida e prevista pelos modelos (Pormenor)

Agora repetimos a mesma srie de figuras, onde se compara as velocidades medidas com aquelas
previstas pelos diferentes estimadores quando lhes aplicado o mesmo sinal na entrada, para a outra
sada. Neste caso o a diferena de qualidade do modelo LS em relao aos outros mtodos mais
vincada.

- 72 -
4
v(t)
Medido
3
IV, RE
2
LS
1

-1

-2

-3

-4
0 2 4 6 8 10 12 14
t (s)

Figura 5.20 - Comparao entre a velocidade v2 medida e prevista pelos modelos

Novamente, seleccionamos a parte inicial da resposta temporal. As figuras seguintes so uma


ampliao dos instantes iniciais da figura anterior.

4
v(t)
Medido
3
IV, RE
2
LS
1

-1

-2

-3

-4
0 0.5 1 1.5 2 2.5 3
t (s)

Figura 5.21 - Comparao entre a velocidade medida e prevista pelos modelos (Pormenor)

- 73 -
3
v(t)
Medido
2

1 IV, RE

0 LS

-1

-2

-3

-4
2.5 3 3.5 4 4.5 5 5.5
t (s)

Figura 5.22 - Comparao entre a velocidade medida e prevista pelos modelos (Pormenor)

Podemos ver aqui como o modelo construdo a partir da estimativa LS para alm de prever uma
velocidade algo aqum da medida tem tendncia a apresentar a velocidade estimada um pouco
desfasada no tempo. Provavelmente isso deve-se a um mau balanceamento entre os dois canais. Como
temos um seno num canal e um coseno no outro, se as interdependncias estiverem inadequadamente
modelizadas para alm de obtermos erro na amplitude verificamos erro na fase.

Apresentamos a seguir vrias medidas do erro entre as velocidades estimados por cada modelo e as
velocidades medidas.

LS IV RE
e( t ) 197.4935 150.6700 156.2594
1

e( t ) 18.0813 13.0173 13.5542


2

e( t ) 3.8953 3.5151 3.6458


O exame dos resultados evidencia agora o melhor desempenho dos mtodos IV e RE sobre o LS. Isso
pode ser observado tanto graficamente como recorrendo s normas do erro entre a simulaes a
realidade. Apesar do modelo LS no apresentar resultados desastrosos os outros dois modelos
apresentam caractersticas muito mais interessantes.

- 74 -
5.10.2 Experincia II

Repetimos a experincia anterior mais duas vezes e construmos um vector de observaes que era a
mdia das trs experincias. Procuramos deste modo baixar o rudo presente no sinal assim como
dispor de mais realizaes para os estimadores. A seguir apresentamos os resultados obtidos.

LS IV RE
A 0.2693 0.1587 0.3098 0.2720 0.3430 0.2595
0.2115 0.1522 0.3113 0.2172 0.3234 0.2022
B 5.9239 0.6127 5.9247 0.6571 5.6418 0.7559
0.5378 5.6678 0.5923 5.7040 0.2537 5.8322

Comparao do regime permanente

De novo comparamos as resposta em regime permanente. Desta vez como temos um nvel de rudo
mais baixo verifica-se que a estimativa LS no est to enviesada.

LS LS - IV
10 10

8
8

6
6 INCAL
LS 4
4

2
IV
0

0
INCAL
-2

-2
-4

-4 -6
0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1

- 75 -
RE Todos
10 10

8 8
Ponto de
6 6
Funcionamento
INCAL
4 4 LS

2 2
IV
RE RE
0 0

-2 -2

-4 -4

-6 -6
0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1

Figura 5.23 - Comparao entre o regime permanente medido e previsto pelos modelos

Eventualmente, se dispusssemos de medidas perfeitamente livres de rudo as vrias estimativas


convergiriam para resultados muito semelhantes.

Comparao das Respostas em Frequncia

Apresentamos agora um detalhe da resposta destes novos modelos ao seno-coseno de varrimento j


apresentado. Seleccionamos apenas a parte inicial da resposta.

4
v(t) IV, RE
3
Medido
2

1
LS
0

-1

-2

-3

-4
0 0.5 1 1.5 2 2.5 3
t (s)

Figura 5.24 - Comparao entre a velocidade medida e prevista pelos modelos (Pormenor)

- 76 -
4
v(t)
Medido
3
IV, RE
2 LS
1

-1

-2

-3

-4
0 0.5 1 1.5 2 2.5 3
t (s)

Figura 5.25 - Comparao entre a velocidade medida e prevista pelos modelos (Pormenor)

O quadro das normas do erro para este caso mostra melhorias em todos os estimadores. O que de
esperar pois se usamos um sinal com um nvel de rudo inferior natural que as estimativas
apresentem melhores caractersticas.

LS IV RE
e( t ) 169.9090 144.3537 149.5427
1

e( t ) 15.2209 12.2180 12.8177


2

e( t ) 3.5435 3.3367 3.4880


Como podemos observar o estimador de mnimos quadrados j apresentou um enviesamento menos


grave. Os outros estimadores melhoraram ligeiramente mas no to significativamente. Para
conseguirmos este resultado tivemos de ponderar trs sries de medidas o que neste caso no algo
extremamente custoso. claro que em situaes em que os testes so caros e/ou morosos as
caractersticas dos estimadores IV e RRE tornam-se muito atraentes.
Fizemos ainda uma outra comparao entre os estimadores observando o espectro em frequncia de
v(t) medido e estimado.

- 77 -
-3
x 10
1
|u()|

0.8 u2()

0.6

0.4

0.2 u1()

0
.1 1 f (Hz) 10

Figura 5.26- Espectro do sinal seno-coseno de varrimento

0.08

0.06 v1()

0.04

0.02

0
.1 1 f (Hz) 10

Figura 5.27 - Espectro de v1(t) para a entrada seno-coseno de varrimento

- 78 -
0.1

0.08 v2()

0.06

0.04

0.02

0
.1 1 f (Hz) 10

Figura 5.28 - Espectro de v2(t) para a entrada seno-coseno de varrimento

-4
x 10
3
|v1()|
2.5
vIV()

2
vRE()
v1()
1.5

1 vLS()

0.5

0
.1 1 f (Hz) 10

Figura 5.29 - Comparao dos espectros medidos e estimados de v1(t)

- 79 -
-4
x 10
4
|v2()| v1()

vIV()
2 vRE()

1 vLS()

0
.1 1 f (Hz) 10

Figura 5.30 - Comparao dos espectros medidos e estimados de v2(t)

Neste captulo verificamos, na prtica, algo que j tinha sido apresentado teoricamente no captulo 4:
quando identificamos um sistema linear contaminado por rudo, a estimativa de mnimos quadrados
enviesada e esse problema s pode ser contornado recorrendo a esquemas que eliminem ou
branqueiem o rudo de estimao. Graas aos estimadores IV e RE pudemos identificar um modelo
para o movimento do INCAL que demonstrou um ajuste excelente com os resultados prticos. Ser
baseados neste modelo que partiremos para o problema seguinte: o controlo do movimento do
INCAL.

5.11 A Incerteza da Estimativa

Como j referimos anteriormente, as estimativas que obtivemos so realizaes de uma varivel


aleatria e est associada a elas a incerteza associada covarincia do estimador. Para certos casos, a
partir de uma caracterizao dos rudos presentes e da funo implementada pelo estimador, podemos
obter, teoricamente, a fdp do estimador propriamente dito. Para estimadores mais elaborados e rudos
no gaussianos esse processo praticamente impossvel. No nosso caso, verificamos que o rudo
apresenta caractersticas que no so propriamente gaussianas. Um mtodo que nos pode oferecer uma
boa estimativa da fdp do estimador, permitindo-nos ao mesmo tempo modelizar o rudo da forma que
nos parecer mais eficiente, um simulao de Monte Carlo. Para isso vamos simular a resposta de um
sistema dinmico, semelhante ao que estimamos, para uma entrada tal como a que usamos durante os
testes. Em seguida simulamos a resposta dos sensores hodometricos ao sinal obtido de modo a
conseguirmos uma contaminao por rudo semelhante que acontece na realidade. Aplicando os
estimadores que implementamos aos dados assim obtidos conseguimos uma realizao da VA que

- 80 -
procuramos conhecer. Repetindo este processo um nmero elevado de vezes obtemos uma amostra
cuja distribuio tender para a distribuio do estimador empregue.
Simulamos o processo de teste do sistema dinmico, e do clculo da estimativa para cada um dos
estimadores, um nmero relativamente elevado de vezes (1000) e apresentamos a seguir os resultados
obtidos:

Mdia dos desvios


LS IV RE LS IV RE
a11 0.0246 -0.0019 -0.0021 b11 0.0235 0.0234 0.0030
a12 0.0259 0.0010 0.0009 b12 0.0222 0.0208 -0.0008
a21 0.0105 -0.0076 -0.0074 b21 0.0479 0.0311 0.0313
a22 0.0109 -0.0016 -0.0013 b22 0.0142 0.0012 0.0009

Mdia percentual dos desvios


LS IV RE LS IV RE
a11 7.1676 -0.5663 -0.6171 b11 0.4164 0.4140 0.0524
a12 8.0141 0.3245 0.2751 b12 8.7534 8.1854 -0.3244
a21 4.0271 -2.9145 -2.8368 b21 6.3392 4.1179 4.1382
a22 5.3864 -0.7910 -0.6324 b22 0.2436 0.0200 0.0151

Normas dos vectores de desvio


LS IV RE LS IV RE
norma1 0.0718 0.0122 0.0116 0.1078 0.0764 0.0359
norma2 0.0388 0.0080 0.0078 0.0595 0.0441 0.0314
norma 0.0259 0.0076 0.0074 0.0479 0.0311 0.0313

As trs tabelas anteriores evidenciam, segundo diferentes mtricas, a magnitude do desvio das mdias
dos diferentes estimadores. Torna-se evidente a melhoria introduzida pelo recurso aos estimadore IV e
RE, principalmente no que se refere estimativa da matriz A.

- 81 -
Varincias
LS IV RE LS IV RE
a11 0.0198 0.0211 0.0213 b11 0.1306 0.1318 0.1206
a12 0.0175 0.0192 0.0193 b12 0.1323 0.1336 0.1241
a21 0.0212 0.0235 0.0235 b21 0.1425 0.1440 0.1300
a22 0.0218 0.0229 0.0230 b22 0.1309 0.1318 0.1218

As varincias praticamente no variam para os diferentes estimadores. Notando-se apenas uma ligeira
vantagem do estimador RE em alguns casos.
LS IV
12 12

M d ia d a V a lo r R a l
10 E s tim a tiva 10

8 8

6 6

4 4

2 2

0 0
0 .2 5 0 .3 0 .3 5 0 .3 0 .3 5 0 .4

RE To d o s
12 12

10 10

8 8

6 6

4 4

2 2

0 0
0 .3 0 .3 5 0 .4 0 .2 5 0 .3 0 .3 5 0 .4

Figura 5.31 - Comparao das distribuies da estimativa do elemento a11

- 82 -
LS IV
12 12
M d ia d a
E s tim a tiva
V a lo r R a l
10 10

8 8

6 6

4 4

2 2

0 0
0 .2 5 0 .3 0 .3 5 0 .3 0 .3 5 0 .4

RE To d o s
12 12

10 10

8 8

6 6

4 4

2 2

0 0
0 .3 0 .3 5 0 .4 0 .2 0 .3 0 .4

Figura 5.32 - Comparao das distribuies da estimativa do elemento a12


LS IV
10 10

9 9

8 8

7 7

6 6

5 5

4 4

3 3

2 2

1 1

0 0
0 .1 5 0 .2 0 .2 5 0 .3 0 .3 5 0 .1 5 0 .2 0 .2 5 0 .3 0 .3 5

RE To d o s
10 10

9 9

8 8

7 7

6 6

5 5

4 4

3 3

2 2

1 1

0 0
0 .1 5 0 .2 0 .2 5 0 .3 0 .3 5 0 .1 5 0 .2 0 .2 5 0 .3 0 .3 5

Figura 5.33 - Comparao das distribuies da estimativa do elemento a21

- 83 -
LS IV
12 12

10 10

8 8

6 6

4 4

2 2

0 0
0 .1 0 .1 5 0 .2 0 .2 5 0 .3 0 .1 0 .1 5 0 .2 0 .2 5 0 .3

RE To d o s
12 12

10 10

8 8

6 6

4 4

2 2

0 0
0 .1 0 .1 5 0 .2 0 .2 5 0 .3 0 .1 0 .1 5 0 .2 0 .2 5 0 .3

Figura 5.34 - Comparao das distribuies da estimativa do elemento a22


LS IV
1 .6 1 .6

1 .4 1 .4

1 .2 1 .2

1 1

0 .8 0 .8

0 .6 0 .6

0 .4 0 .4

0 .2 0 .2

0 0
5 .2 5 .4 5 .6 5 .8 6 5 .2 5 .4 5 .6 5 .8 6

RE To d o s
1 .8 1 .8

1 .6 1 .6

1 .4 1 .4

1 .2 1 .2

1 1

0 .8 0 .8

0 .6 0 .6

0 .4 0 .4

0 .2 0 .2

0 0
5 .2 5 .4 5 .6 5 .8 6 5 .2 5 .4 5 .6 5 .8 6

Figura 5.35 - Comparao das distribuies da estimativa do elemento b11

- 84 -
LS IV
1 .6 1 .8

1 .4 1 .6

1 .4
1 .2

1 .2
1
1
0 .8
0 .8
0 .6
0 .6

0 .4
0 .4

0 .2 0 .2

0 0
-0 .2 0 0 .2 0 .4 0 .6 0 .8 -0 .2 0 0 .2 0 .4 0 .6 0 .8

RE To d o s
1 .8 1 .8

1 .6 1 .6

1 .4 1 .4

1 .2 1 .2

1 1

0 .8 0 .8

0 .6 0 .6

0 .4 0 .4

0 .2 0 .2

0 0
-0 .2 0 0 .2 0 .4 0 .6 0 .8 -0 .2 0 0 .2 0 .4 0 .6 0 .8

Figura 5.36 - Comparao das distribuies da estimativa do elemento b12


LS IV
1 .5 1 .5

1 1

0 .5 0 .5

0 0
0 .2 0 .4 0 .6 0 .8 1 1 .2 0 .2 0 .4 0 .6 0 .8 1 1 .2

RE To d o s
1 .8 1 .8

1 .6 1 .6

1 .4 1 .4

1 .2 1 .2

1 1

0 .8 0 .8

0 .6 0 .6

0 .4 0 .4

0 .2 0 .2

0 0
0 .2 0 .4 0 .6 0 .8 1 1 .2 0 .2 0 .4 0 .6 0 .8 1 1 .2

Figura 5.37 - Comparao das distribuies da estimativa do elemento b21

- 85 -
LS IV
1 .6 1 .6

1 .4 1 .4

1 .2 1 .2

1 1

0 .8 0 .8

0 .6 0 .6

0 .4 0 .4

0 .2 0 .2

0 0
5 .2 5 .4 5 .6 5 .8 6 6 .2 6 .4 5 .2 5 .4 5 .6 5 .8 6 6 .2 6 .4

RE To d o s
1 .8 1 .8

1 .6 1 .6

1 .4 1 .4

1 .2 1 .2

1 1

0 .8 0 .8

0 .6 0 .6

0 .4 0 .4

0 .2 0 .2

0 0
5 .4 5 .6 5 .8 6 6 .2 5 .2 5 .4 5 .6 5 .8 6 6 .2 6 .4

Figura 5.38 - Comparao das distribuies da estimativa do elemento b22

Estes resultados confirmam e reforam a nossa maior confiana nos estimadores IV e RE em


detrimento do estimador LS. Com base neles seria fcil delimitar as gamas de variao mxima dos
parmetros dos elementos do nosso modelo, devido incerteza na estimao. Essa possibilidade seria
interessante caso necessitssemos de uma caracterizao da robustez associada s estimativas.

5.12 Estimao dos Parmetros da No linearidade Associada aos Motores


Como j referimos os motores apresentam uma no linearidade, perto das zonas de funcionamento a
baixa velocidade. Essa no linearidade poder ser modelizada recorrendo a um modelo de
Hammerstein. Assim teremos:

u(t) f(u(t)) y(t)


Sistema Linear
Zona Morta Dinmico

Figura 5.39 - Modelo de Hammerstein para os motores

- 86 -
Recolhendo os dados que nos permitiram estabelecer a resposta dos motores em regime permanente,
identificamos um modelo, linear por segmentos que o aproximasse. O modelo constitudo por quatro
segmentos. Como dois deles passam no ponto (0,0) bastaram seis parmetros: dois declives para os
segmentos exteriores e quatro parmetros para os dois pontos de quebra que restam. Foi escolhido um
modelo deste tipo e no uma zona morta pura, que poderia ser parametrizada recorrendo apenas a
quatro constantes, porque desta maneira obtemos uma funo f invertvel.
Os referidos parmetros foram encontrados minimizando o quadrado do erro entre o modelo
aproximado e os dados de que dispnhamos.

10

m2
5

u 1 ,v 1 u 2 ,v 2
0
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1

-5

m1
Medies
-10
Modelo

-15

Figura 5.40 - No linearidade dos motores e respectivo modelo

A seguir apresentamos os valores encontrados para os parmetros:

u1 -0.204706276
v1 -0.016868822
m1 13.78564787
u2 0.317674435
v2 0.141495941
m2 13.36693002

Desta maneira , at certo ponto possvel identificar a no linearidade da dinmica do motor. No nos
esqueamos que este modelo aproximado, na medida em que no perfeitamente garantido que
podemos construir um modelo de Hammerstein para o motor e eliminar por completo a no

- 87 -
linearidade da sua dinmica. De qualquer maneira conseguimos um modelo muito mais preciso. Outra
das vantagens desta tcnica que elimina a diferena das caractersticas em regime permanente que se
verificavam entre os dois sentidos de rotao.
Conhecendo f, temos maneira de prever os efeitos da no linearidade, ou seja, dado u(t), podemos
conhecer u ( t ) = f (u( t )) . Mas seria mais interessante poder escolher u ( t ) . Isso ser possvel se

pudermos inverter f, fazendo u( t ) = f 1(u ( t )) estaremos como que a trabalhar com um sistema linear

pois a pr-compensao que fazemos anula a no linearidade entrada. Esta tcnica deve ser
empregue com uma srie de precaues: o nosso modelo da no linearidade deve ser extremamente
preciso sob o perigo de obtermos resultados ainda piores, devemos ainda assegurarmo-nos que a pr-
filtragem no d origem a sinais que podem exibir problemas de saturao ou esforos excessivos.
Foi pela possibilidade de implementar a pr-compensao que procuramos modelizar a no
linearidade recorrendo a uma funo invertvel.

Podemos ver a seguir resposta dos motores em regime permanente, quando pr-compensamos a no
linearidade:

15

10

-5

-10

-15
-1 -0.5 0 0.5 1

Figura 5.41 - Regime Permanente com Pr-compensao da no linearidade dos motores

Graas a esta tcnica pudemos, em termos de regime permanente, eliminar a no linearidade. Isto no
nos garante que a dinmica tenha sido tambm linearizada. O problema da validade deste modelo
ainda pode ser posto. Mesmo assim bom que tenhamos conseguido eliminar os efeitos nefastos de
uma parte da no linearidade envolvida.
Uma palavra acerca da robustez desta tcnica: seria uma situao potencialmente instvel se por
alguma razo os motores demonstrassem tendncia para apresentar um zona morta mais apertada.
Nesse caso o efeito da pr-filtragem criaria uma descontinuidade na origem. Sob essas condies

- 88 -
poderia ser difcil parar: teramos oscilaes em torno da velocidade zero pois essa zona exibia um
ganho elevado. Se verificssemos a possibilidade de se verificarem tais variaes na amplitude da
zona morta seria aconselhvel escolher os pontos (u1, v1) e (u2, v2) para a situao em que a zona
morta mais apertada. Perderamos algum do efeito linearizador mas nunca nos sujeitaramos a
possveis instabilidades.

- 89 -
6 EXEMPLO 2: Modelo trmico de uma cuba de fermentao

Embora o comportamento trmico de uma cuba de fermentao de vinho envolva fenmenos


no lineares como por exemplo correntes de conveco formadas principalmente durante a fase de
arrefecimento ou aquecimento, veremos de seguida que possvel adoptar-se um modelo linear com
uma aproximao bastante aceitvel. O tipo de cubas actualmente mais utilizadas so de ao inox com
uma construo cilndrica com dois cones na base e no topo e uma manga, em cujo interior circula
gua fria ou quente, que envolve a cuba na sua zona central, como se pode observar na figura 6.1. Os
dados experimentais recolhidos e utilizados para a determinao do modelo trmico so provenientes
de uma cuba deste tipo com uma capacidade de 25.000 litros.

Figura 6.1 - Cuba em ao inox vulgarmente utilizada.

6.1 - Modelos deterministicos

A variao da temperatura do mosto depende basicamente do calor gerado pela fermentao,


da temperatura ambiente, da temperatura da gua de refrigerao ou aquecimento e da densidade do
mosto segundo o seguinte modelo:

dT(t) KH dS(t) UA
= - . - [T(t)-Tamb(t)] (6.1)
dt (t)Cp dt (t)CpV

- 90 -
onde:

KH - calor gerado na fermentao por unidade de massa do mosto (cal/g)

S(t) - concentrao de acares (g/l)

(t) - massa especfica (g/l)

Cp - capacidade calorfica do mosto (cal/g.K)

V - volume de mosto (l)

A - rea de transferncia de calor (m2)

U - coeficiente de transferncia de calor (cal/m2.K.min.)

T(t) - temperatura do mosto (K)

Tamb(t) - temperatura ambiente (K)

Modelos mais completos ainda podem ter em conta a transferncia de calor devida a outros
fenmenos, cuja importncia se verificou ser vulgarmente desprezvel. O modelo anterior
equivalente ao seguinte modelo discreto:

(Qp-Qr-Qv-Qc-Qf)(t(k+1)-t(k))
T(k+1) = T(k) + (6.2)
CpV

onde:

T(k) e T(k+1) - temperatura do mosto nos instantes de tempo t(k) e t(k+1) (K)

Qp - taxa de calor gerado na fermentao (cal/min)

Qr - perdas trmicas por radiao (cal/min)

Qv - perdas trmicas por evaporao (cal/min)

Qc - perdas trmicas por conduo (cal/min)

Qf - perdas trmicas por refrigerao (cal/min)

- 91 -
Conjugando os dois modelos anteriores e tendo em conta que a densidade sofre uma variao
pequena, cerca de 10%, durante a fermentao, teremos o seguinte modelo discreto aproximado:

T(k+1) = T(k) + Pc(k) - K[T(k)-Tamb(k)] (6.3)

em que Pc(k) incremento de temperatura relacionado com a taxa de calor gerado pela fermentao e

K uma constante que depende basicamente da forma e dimenses da cuba.

6.1.1 - Modelo de estrutura variante

No entanto se quisermos maior preciso em termos de transferncias trmicas com o exterior,


teremos que dividir a cuba em duas zonas: a zona da manga onde circula gua fria ou quente sempre
que a respectiva vlvula de controlo est aberta e a zona no coberta pela manga que est sempre em
contacto com ar temperatura ambiente. Podemos dizer que a resistncia trmica da zona da manga
varia conforme esta est com ou sem gua a circular, ou seja com a vlvula de controlo aberta ou
fechada. Assim teremos o seguinte modelo trmico correspondente situao em que a vlvula est
aberta:

T(k+1) = T(k) + Pc(k) - Ka[T(k)-Tamb(k)] - Km[T(k)-Tf(k)] (6.4)

em que Tf(k) corresponde temperatura da gua fria ou quente, e o seguinte modelo quando a vlvula

de controlo est fechada e portanto no circula gua na manga:

T(k+1) = T(k) + Pc(k) - Kt[T(k)-Tamb(k)] (6.5)

Foram recolhidos dados num adega situada no Alentejo, mais precisamente na zona de
Portalegre. Nesta regio as temperaturas registadas durante a poca das vindimas so relativamente
elevadas. Este facto leva a que as adegas geralmente s tenham necessidade de arrefecer o mosto pois
o arranque da fermentao e o seu aquecimento d-se naturalmente.
O arrefecimento forado recorrendo-se manga anteriormente referida. Neste contexto quando
a vlvula de controlo da gua fria est fechada corresponde geralmente a um perodo de

- 92 -
aquecimento do mosto descrito pela equao (6.5) e quando a vlvula est aberta corresponde a um
perodo de arrefecimento do mosto descrito pela equao (6.4).

Com este conjunto de dados procedeu-se identificao do sistema atravs da minimizao da


funo custo:
N-1
F(Ka, Km, Kt , Pc0) = ( T(k+1) - T^ (k+1) )2 (6.6)
k=1

onde T(k+1) a variao de temperatura no mosto entre os instantes k e k+1 (valores medidas na
adega) e

P^ c(k,Ka,Km,Kt,Pco) - Kt[T(k)-Tamb(k)] , com a vlvula fechada


^ (k+1) =
T
P^ c(k,Ka,Km,Kt,Pco) - Ka[T(k)-Tamb(k)] - Km[T(k)-Tf(k)] , com a vlvula aberta

^ (k,K ,K ,K ,P ) } a sequncia de estimativas de mnimos quadrados recursivos,


em que { P c a m t co k
calculados com um factor de esquecimento e valor inicial Pco, uma vez fixados os valores de Ka,

Km, Kt e Pco. A seleco do factor de esquecimento resultou do compromisso entre imunidade ao

^ (k,K ,K ,K ,P ). O valor utilizado para o factor


rudo e capacidade de adaptao das estimativas P c a m t co
de esquecimento foi de 0.992. Repare-se que temos aqui uma estimao dos parmetros Ka,Km,Kt

^ (k,K ,K ,K ,P ), k=0, 1, o que pode


que Pco dependem de outra estimativa, a sequncia P c a m t co
colocar problemas de convergncia no abordado aqui.
Os resultados obtidos para os parmetros identificados figuram na Tabela 6.1, enquanto na
Tabela 6.2 podemos ver a caracterizao da aproximao obtida em termos de valor mdio do erro
quadrtico, valor mdio, varincia e valor absoluto mximo do erro de predio em cada ponto:

e(k) = T(k) - T^ (k) (6.7)

Ka 0.001446

Km 0.01298

- 93 -
Kt 0.002054

Pc0 0.009140

Tabela 6.1 - Resultados obtidos para o modelo dado pelas expresses (6.4) e (6.5), minimizando-
se (6.6)

valor mdio de ( e(k) )2 0.000204


valor mdio de e(k) -0.00168
varincia de e(k) 0.000202
valor absoluto mximo de e(k) 0.120
Tabela 6.2 - Caracterizao da aproximao obtida para o modelo dado pelas expresses (6.4) e
(6.5), minimizando-se (6.6)

Verifica-se um ligeiro enviesamento nas estimativas, idealmente o valor mdio do erro

e(k) = T(k) - T^ (k) deveria ser nulo. A varincia do erro toma valores aceitveis: 0.000202 para
uma varincia do sinal T(k) de 0.00145. Verifica-se tambm um valor relativamente elevado do
valor absoluto mximo do erro e(k).

Como podemos observar na figura 6.2 o referido erro toma valores muito acima da mdia nos
instantes de comutao da vlvula (de arrefecimento neste caso). Este facto deve-se possivelmente a
fenmenos no modelizados como a formao de correntes de convexo no interior da cuba e a
dinmica trmica do prprio metal que compe as paredes e manga de arrefecimento da cuba.

- 94 -
0.15

0.1 comutaes da vlvula

0.05

-0.05

-0.1

-0.15

Figura 6.2 - Evoluo do erro (6.7) e do estado da vlvula de arrefecimento.

Inicialmente, quando a vlvula se abre, a gua fria comea por arrefecer o metal e depois de a
vlvula se fechar o metal contnua frio por algum tempo antes de se aproximar novamente da
temperatura do mosto. Como podemos observar na figura 6.3 este fenmeno evidenciado pelo facto
de quando a vlvula aberta o arrefecimento inicial do mosto ser mais lento e depois da vlvula se
fechar o mosto continuar a arrefecer durante algum tempo. Exactamente os mesmo fenmenos se
devem passar no modo de aquecimento. Infelizmente a adega onde se recolheram os dados s tinha o
modo de arrefecimento.

- 95 -
18.2
18
17.8
17.6
17.4
17.2
17
16.8
16.6 aberta

16.4
fechada
16.2

Figura 6.3 - Evoluo tpica da temperatura do mosto quando a vlvula de arrefecimento fica
aberta durante alguns perodos de amostragem.

Para tentar modelizar estes fenmenos alterou-se a expresso (6.4) da seguinte forma:

T(k+1) = T(k) + Pc(k) - Ka[T(k)-Tamb(k)] - Km[T(k)-Tm(k)] (6.8)

sendo,

Tm(k) = Pf Tm(k-1) + (1-Pf) T*f (k) (6.9)

em que T*f (k) toma o valor da temperatura da gua fria/quente quando a vlvula abre e o valor da

temperatura do mosto T(k) quando a vlvula fecha.

Ou seja introduziu-se uma dinmica adicional de primeira ordem entre a temperatura da gua
fria/quente e uma nova temperatura intermdia Tm(k). Esta temperatura intermdia tenta representar

a temperatura da zona da parede da cuba correspondente manga de arrefecimento/aquecimento que


obviamente no varia instantaneamente quando a vlvula de arrefecimento/aquecimento abre ou
fecha. A expresso (6.8) passa a ser utilizada no s quando a vlvula est aberta, como se fez com a
expresso, mas tambm durante algum tempo depois de esta ter fechado. Aps o ensaio de vrios

- 96 -
valores chegou-se concluso que o melhor resultado obtido utilizando-se (6.8) durante apenas mais
um instante de amostragem (neste caso 10 minutos) depois de a vlvula ter fechado. A equao (6.9)
est sempre a ser actualizada.

A expresso (6.9) corresponde a uma simplificao da equao de equilbrio energtico na


manga de refrigerao. Para sermos mais exactos teramos que considerar a temperatura de entrada e a
temperatura de sada da manga da gua fria/quente e ainda as transferncias de calor entre a manga e o
ambiente. Embora se possa conhecer a temperatura de entrada na manga, nas adegas geralmente no
se mede a temperatura de sada pois tornaria o sistema muito dispendioso. Como veremos em seguida,
mesmo utilizando esta simplificao, consegue-se boas aproximaes.

Os resultados obtidos quando se minimiza a funo (6.6) que agora depende de mais um
parmetro, Pf da expresso (6.9) esto ilustrados na tabela 6.3. Na tabela 6.4 apresenta-se a

caracterizao desta nova aproximao.

Ka 0.002319

Km 0.01446

Kt 0.002191

Pc0 0.01046

Pf 0.3888

Tabela 6.3 - Resultados obtidos para o modelo dado pelas expresses (6.8), (6.9) e (6.5),
minimizando-se (6.6)

valor mdio de ( e(k) )2 0.000140

valor mdio de e(k) -0.00192

varincia de e(k) 0.000142

valor absoluto mximo de e(k) 0.0716

Tabela 6.4 - Caracterizao da aproximao obtida para o modelo pelas expresses (6.8), (6.9) e
(6.5), minimizando-se (6.6)

- 97 -
Verifica-se uma melhor aproximao em termos de erro quadrtico cuja mdia baixou de
0.000204 para 0.000140, em termos de varincia do erro e(k) que baixou tambm de 0.000202 para
0.000142, descendo portanto abaixo dos 10% da varincia do sinal, e principalmente em termos de
valor absoluto mximo que baixou de 0.120 para 0.0716. Somente o valor mdio do erro deu um
resultado ligeiramente pior.

6.1.2 - Modelo de estrutura fixa

A determinao da estrutura, e respectivos parmetros, do modelo anterior tinha como


objectivo uma boa preciso e que cada parmetro tivesse significado fsico. No entanto para efeitos de
controlo e estimativa da evoluo da temperatura num horizonte de predio poder ser til outro tipo
de modelo que embora sem significado fsico e com uma ligeira perda de preciso tenha a vantagem
de ser mais simples e linear, no sendo necessrio andar-se a comutar entre dois modelos conforme se
esteja no modo de arrefecimento/aquecimento ou no.

Assim o prximo modelo que se ir abordar consiste na utilizao sempre das expresses
(6.8) e (6.9), i.e. um modelo de estrutura fixa, quer se esteja ou no na fase de
arrefecimento/aquecimento. Anteriormente este modelo s era utilizado na fase de
arrefecimento/aquecimento e durante mais um instante de amostragem apenas. Como fora da fase de
arrefecimento/aquecimento a varivel Tm(k) tende rapidamente para T(k), isto provoca a anulao do

termo correspondente ficando-se com uma expresso anloga (6.5). A diferena principal que
agora temos menos um parmetro e no temos necessidade de andar a comutar entre dois modelos.
Como os parmetros Ka de (6.8) e Kt de (6.5) tomam valores semelhantes e como durante o

arrefecimento verificou-se que o termo correspondente a Tm(k) toma valores bastante superiores ao

termo correspondente a Tamb o erro cometido no ser muito elevado.

Minimizando-se uma funo custo anloga j anteriormente utilizada os resultados obtidos


foram os ilustrados nas tabelas 6.5 e 6.6.

- 98 -
Ka 0.002237

Km 0.01428

Pc0 0.01077

Pf 0.3431

Tabela 6.5 - Resultados obtidos para o modelo dado pelas expresses (6.8) e (6.9)

valor mdio de (e(k) )2 0.000146

valor mdio de e(k) -0.00188

varincia de e(k) 0.000143

valor absoluto mximo de e(k) 0.0739

Tabela 6.6 - Caracterizao da aproximao obtida para o modelo dado pelas expresses (6.8) e
(6.9)

Como se pode observar a degradao dos resultados foi mnima. A mdia do erro quadrtico
subiu 4.3% (de 0.000140 para 0.000146), a varincia do erro subiu 0.7% (de 0.000142 para 0.000143)
e o valor absoluto mximo subiu 3.2% (de 0.0716 para 0.0739). Por outro lado o valor mdio do erro
melhorou mesmo 2% (de -0.00192 para -0.00188).

Seguidamente iremos analisar um outro modelo ainda mais simples. Como j se referiu,
durante o arrefecimento verificou-se que o termo correspondente s trocas de energia com a gua
fria/quente muito mais elevado do que o termo correspondente s trocas de energia relacionadas
com a zona da cuba sob a influncia da temperatura ambiente. Assim durante o arrefecimento
despreza-se a influncia da temperatura ambiente e podemos simplificar a expresso (2.31),
resultando:

T(k+1) = T(k) + Pc(k) - Kt[T(k)-Tm(k)] (6.10)

sendo,

Tm(k) = Pf Tm(k-1) + (1-Pf) T*f (k) (6.11)

- 99 -
onde T*f (k) durante o arrefecimento/aquecimento toma um valor Teq, que origina termos da mesma

ordem de grandeza dos anteriores, e o valor da temperatura ambiente Tamb(k) quando a vlvula de

arrefecimento/aquecimento fecha. Quando a vlvula est aberta podemos referir Teq como o valor a

que deveria estar a temperatura ambiente para que, sem manga de arrefecimento, tivssemos a mesma
transferncia de calor.

Minimizando-se uma funo custo anloga a (6.6) mas que agora depende dos parmetros Kt,

Teq, Pf e Pc0 :

N-1
F(Kt, Teq, Pf , Pc0) = ( T(k+1) - T^ (k+1) )2 (6.12)
k=1

obteve-se os resultados ilustrados nas tabelas 6.7 e 6.8

Kt 0.002207

Teq -52.09

Pc0 0.01037

Pf 0.3181

Tabela 6.7 - Resultados obtidos para o modelo dado pelas expresses (6.10) e (6.11)

valor mdio de (e(k) )2 0.000152

valor mdio de e(k) -0.00182

varincia de e(k) 0.000149

valor absoluto mximo de e(k) 0.0716

Tabela 6.8 - Caracterizao da aproximao obtida para o modelo dado pelas expresses (6.10) e
(6.11)

- 100 -
Como se pode observar a degradao dos resultados foi mnima. A mdia do erro quadrtico
subiu 4.1% (de 0.000146 para 0.000152) e a varincia do erro subiu de 4.2% (de 0.000143 para
0.000149). Por outro lado o valor mdio do erro melhorou mesmo de -0.00188 para -0.00182 e o
valor absoluto mximo de 0.0739 para 0.0716.

6.2 - Modelos estocsticos

Observando-se a figura 6.2 evidente que o erro correlacionado pois existe um certo padro
na evoluo do mesmo. Analisaremos de seguida um dos modelos anteriormente abordados mas agora
tendo em conta o rudo e verificaremos os eventuais benefcios em relao aos modelos
determinsticos. Embora no se tenha um puro problema de mnimos quadrados iremos adoptar uma
abordagem similar dos mnimos quadrados generalizados com o objectivo de se branquear o rudo.
Sabemos que para um modelo do tipo:

A(q-1) y(k) = B(q-1) u(k) + e(k)


(6.13)

a estimativa dos coeficientes dos polinmios A(q-1) e B(q-1) atravs dos mnimos quadrados
ordinrios s consistente se e(k) for rudo branco. No caso de {e(k)} ser uma sequncia de variveis
aleatrias correlacionadas de mdia nula e varincia idntica s possvel
obter-se estimativas consistentes se a funo de autocorrelao de {e(k)} for conhecida. Na realidade
raramente se conhece a autocorrelao da sequncia {e(k)}. No entanto se o rudo for caracterizado
por:

1
e(k) = (k) (6.14)
D(q-1)

onde {(k)} uma sequncia de variveis aleatrias no correlacionadas de mdia nula e varincia
idntica, ento, nesta situao, a equao (6.13) pode ser colocada na seguinte forma:

A(q-1) y*(k) = B(q-1) u*(k) + (k) (6.15)

- 101 -
em que

y*(k) = D(q-1) y(k)

u*(k) = D(q-1) u(k)

sendo desta forma as estimativas, calculadas pelos mnimos quadrados ordinrios, consistentes. O

polinmio D(q-1) e as estimativas da sequncia {e(k)} podem ser calculadas iterativamente resultando
no seguinte algoritmo conhecido por mnimos quadrados generalizados:

Algoritmo dos mnimos quadrados generalizados:

1 - Iniciar o algoritmo com uma estimativa de D(q-1) igual a 1.

2 - Calcular y*(k) = ^D(q-1)y(k) e u*(k) = ^D(q-1)u(k).

^ (q-1) e B
3 - Calcular A ^ (q-1) atravs dos mnimos quadrados ordinrios com o

seguinte modelo:

A(q-1) y*(k) = B(q-1) u*(k) + (k)

4 - Calcular a estimativa da sequncia {e(k)}:

^e (k) = A
^ (q-1) y(k) - B
^ (q-1) u(k), k=1, ..., N

5 - Calcular, atravs dos mnimos quadrados ordinrios, ^D(q-1) do modelo:

D(q-1) ^e (k) = (k)

6 - Se convergir termina o algoritmo. Se no recomea em 2.

Embora os modelos trmicos apresentados anteriormente no se possam colocar exactamente


na forma dada por (6.13), devido ao termo relacionado com o calor gerado pela fermentao, aplicou-
se um algoritmo idntico com o modelo dado pelas expresses (6.5), (6.8) e (6.9). Em cada uma das
equaes correspondentes vlvula aberta e vlvula fechada adicionou-se um termo idntico a
(6.14). No passo 3 do algoritmo descrito os parmetros do modelo so determinados pela minimizao
de:

N-1
F(Ka, Km, Kt , Pc0,Pf) = ( ^D(q-1) T(k+1) - ^D(q-1)T^ (k+1) )2 (6.16)
k=1

- 102 -
Na tabela 6.9 podemos observar os resultados obtidos para os parmetros do modelo para

diferentes graus do polinmio D(q-1) = 1 + d1q-1 + d2q-2 + . . . + dndq-nd. Na mesma tabela temos o

valor absoluto mximo da funo de autocorrelao Rj do erro (k) tomada nos primeiros 20 valores.

Nos valores testados fora desta gama a funo de autocorrelao tomou valores desprezveis.
Podemos concluir que os resultados so muitos satisfatrios para nd = 7. Obtm-se um decremento no
valor absoluto mximo de R(j) de 0.21 para 0.045. Para valores de nd superiores a variao nos
resultados no significativa.

nd 1 2 3 4 5 6 7
Kt 0.002188 0.002221 0.002246 0.002256 0.002244 0.002198 0.002166
Ka 0.002344 0.002098 0.001887 0.001877 0.001874 0.002232 0.002421
Km 0.01448 0.01444 0.01440 0.01441 0.014291 0.01435 0.01443
Pc0 0.01050 0.01050 0.01050 0.01050 0.01071 0.01112 0.01126
Pf 0.3890 0.3890 0.3890 0.3890 0.3681 0.3567 0.3558
d1 0.01695 0.01689 0.01742 0.01565 0.05414 0.08405 0.09821
d2 0 -0.1448 -0.1493 -0.1341 -0.1200 -0.1058 -0.08229
d3 0 0 -0.09144 -0.08215 -0.07581 -0.06479 -0.05545
d4 0 0 0 -0.1136 -0.1109 -0.09080 -0.08611
d5 0 0 0 0 -0.1407 -0.1525 -0.1379
d6 0 0 0 0 0 -0.1926 -0.2145
d7 0 0 0 0 0 0 -0.08594
max(abs(R(j))) 0.2148 0.1899 0.1798 0.1626 0.1881 0.08558 0.04457

Tabela 6.9 - Resultados obtidos para o modelo estocstico

Na Figura 6.4 podemos comparar a funo de autocorrelao com nd = 0 ( D(q-1) = 1 ) e com


nd = 7. Pela simples observao do grfico podemos verificar que o erro agora bastante menos
correlacionado.

- 103 -
1

0.8

0.6

0.4

0.2

-0.2

Figura 6.4 - Funo de autocorrelao R(j) (normalizada) do erro (k) com nd = 0, barras mais
claras, e com nd = 7, barras mais escuras.

Para uma completa validao do modelo deveria-se testar os modelos encontrados com outros
conjuntos de dados no utilizados no processo de identificao dos parmetros. Infelizmente no foi
possvel a aquisio de mais dados na referida Adega.

- 104 -
Apndice A - Estimadores

Encaremos o problema de estimao segundo uma perspectiva estocstica. Consideremos uma


varivel aleatria (VA) Y . Desconhecendo a Funo Densidade de Probabilidade que caracteriza esta
VA queremos construir um esquema que nos permita estimar essa funo.
Consideremos que essa funo P pode ser parametrizada em e denotaremos um elemento dessa
p
famlia por P em que e IR .
Dispomos tambm dados medidos que denotaremos por Y e que correspondem a uma realizao de Y.
Definiremos um estimador como uma funo g( Y ) da VA Y. Para um dado Y, g( Y) ser uma

estimativa.
Interessa-nos que g( Y) seja uma boa estimativa do valor de . Isto que nos indique P que

corresponde ao verdadeiro P. Isto equivale a dizer que , uma VA j que uma funo de uma VA,
dever apresentar uma distribuio o mais favorvel possvel. Mais concretamente o seu valor
esperado dever ser o do verdadeiro e caractersticas como a varincia e eventualmente outros
momentos de ordens mais elevadas devem ser o mais baixos possvel.
Como se define e verifica a qualidade de um estimador ser exposto a seguir.

Propriedades de um estimador

No enviesamento

Um estimador g( Y ) para ser no enviesado caso o valor esperado de g( Y ) dado P for igual a ,

para qualquer . Ou seja:

( )
EY| g( Y ) = (A.1)

A ideia subjacente de que, com um nmero suficiente de observaes a estimativa obtida se


aproxime do verdadeiro valor dos parmetros. Caso o estimador seja enviesado, por mais medies
que faamos, nunca chegaremos ao verdadeiro valor de .
Seja gN o estimador baseado em N amostras. Esta sequncia pode ser constituda por estimadores
enviesados mas que quando N gN tende para um estimador no enviesado. Neste caso diz-se

que temos uma sequncia assimptoticamente no enviesada.

Eficincia

- 105 -
Um estimador no enviesado considera-se eficiente se a sua covariancia for inferior covariancia de
qualquer outro estimador no enviesado.

Estimador No Enviesado de Mnima Varincia

Um estimador g(Y ) ser um estimador no enviesado de mnima varincia (MVUE - minimum


variance unbiased estimator) se a sua covariancia for mnima, uniformemente em , para toda classe
dos estimadores no enviesados.

Como referimos anteriormente um estimador uma VA que queremos que apresente uma distribuio
o mais favorvel possvel. Tendo garantido que o estimador no enviesado, ou seja que o seu valor
esperado corresponde ao verdadeiro valor dos parmetros, interessa-nos ainda que a sua varincia seja
o mais baixa possvel. Isso porque diferentes estimadores podem aproveitar melhor ou pior a
informao fornecida pela realizao que detivermos. Como j foi salientado no possvel diminuir
arbitrariamente a varincia do estimador.

Melhor Estimador Linear No Enviesado

Um estimador g(Y ) ser o melhor estimador linear no enviesado (BLUE - best linear unbiased
estimator) se a sua covariancia for mnima, uniformemente em , para toda classe dos estimadores no
enviesados que sejam uma funo linear dos dados.
Esta categoria tem o seu interesse pois os estimadores lineares so tipicamente mais fceis de
implementar e portanto muito comuns.

Para a classe dos estimadores no enviesados que podemos definir, no geralmente fcil estabelecer
a existncia de estimadores MVUE ou BLUE. Numa perspectiva prtica ser por vezes suficiente
mostrar que o estimador usado se aproxima do limite inferior da varincia de qualquer estimador no
enviesado. Apresentamos a seguir uma maneira de definir esse limite inferior.

Desigualdade de Cramer-Rao

- 106 -
p
Sendo { P: } uma famlia de distribuies num espao amostral , IR , e supondo que, para

cada , P est definido por uma densidade PY| ( | ) . ento debaixo de certas condies de

regularidade, a covariancia de qualquer estimador no enviesado g( Y ) de satisfaz a desigualdade:

cov g M1 (A.2)

onde

cov g = EY| ( g( Y ) )( g(Y ) )


T
(A.3)

e M ( conhecida pela matriz de informao de Fisher ) est definida como

T

M = EY| log p( Y| ) log p(Y| )

A prova deste teorema pode ser encontrada em [Goodwin77].


Esta desigualdade limita a mnima varincia que pode ser atingida por um estimador no enviesado.
Se um dado estimador, no enviesado, tiver uma covarincia igual inversa da matriz de informao
de Fisher, ento estamos perante um estimador MVUE.

Podemos dizer que um estimador g, no enviesado, ser eficiente se a sua covarincia iguala o limite
inferior de Cramer-Rao( ou seja o inverso da matriz de informao de Fisher ).

Consistncia

Seja gN o estimador baseado em N amostras. A sequncia {gN , N = 1,K , } ser uma sequncia

consistente de estimadores de se gN tende para quase certamente, quando N . Uma outra


propriedade semelhante a consistncia fraca que ocorre se gN tende para em probabilidade,
quando N .

Existe uma certa semelhana entre as propriedades da consistncia e o no enviesamento assimpttico


j que foi demonstrado que um estimador consistente cuja esperana matemtica for finita ser
tambm assimptoticamente no enviesado.

Observaes

Estas propriedades so importantes na medida em que nos daro garantias da qualidade do estimador.
Um estimador no enviesado ou pelo menos assimptoticamente no enviesado d-nos imediatamente

- 107 -
a esperana de conseguirmos um resultado sem erro sistemtico. Um estimador eficiente indica-nos
um aproveitamento mximo da informao contida na amostra. Obteremos nesse caso, um resultado
para a covarincia to baixo quanto seria possvel para as condies em que a amostra foi conseguida.
Uma outra caracterstica ainda no referida a robustez do estimador. Esta caracterstica relaciona-se
com a manuteno de todas as outras qualidades do estimador debaixo de variaes, numa certa gama,
das pr-condies impostas na anlise das outras caractersticas referidas.
Normalmente o no enviesamento uma das propriedades mais interessantes, sem a qual o estimador
arrisca-se ser de pouca utilidade. Porm, por vezes to importante o no enviesamento como a
eficincia do estimador. Em certos casos um estimador ligeiramente enviesado pode ser prefervel
caso a sua eficincia seja nitidamente superior. No adianta obter uma estimativa que se sabe no
enviesada se ela contiver no entanto um grau de incerteza alto, pois provavelmente teremos um valor
excessivamente desviado do seu valor real.
Note-se pois que normalmente no temos uma descrio explcita de P mas sim uma representao
implcita base de um modelo com caractersticas estocsticas.

Recurso a Conceitos Estocsticos na Construo de Estimadores

possvel conseguir informao extra que nos guie na escolha da funo g introduzindo uma
formulao estocstica. Podemos assim construir uma srie de estimadores. De um modo geral
aqueles que requerem uma maior informao priori apresentam as melhores caractersticas.
Apresentam no entanto a desvantagem de levarem a formulaes mais complexas. Mais ainda, o
gnero de informao que requerem muitas vezes no est disponvel. Veremos assim que os
estimadores mais simples, requerem pouca informao prvia e no do garantias to extensas, mas
apesar disso, so os preferidos na maioria das aplicaes.

Estimador de Bayes

Este estimador aquele que requer a maior quantidade de informao priori. Mais concretamente
requer:
A distribuio do rudo
A distribuio dos parmetros

Consideremos um Processo Estocstico {Yt , t = 1 K N } parametrizado de alguma forma em e a

distribuio p( | Y ) que a distribuio dos parmetros dado um conjunto de medidas Y que

correspondem a uma realizao de {Yt , t = 1 K N } . Seleccionamos ento a melhor estimativa de de

- 108 -
modo a minimizar uma dada funo de risco. Define-se essa funo como C(| ) que corresponde ao

custo de escolher sendo o verdadeiro valor para a estimativa.

Escolhendo C(| ) = .Obtemos para o valor esperado de p( | Y ) .


2

Escolhendo C(| ) = . Obtemos para a mediana de p( | Y ) .

Podemos estabelecer um outro critrio que corresponde a escolher para o valor que maximiza
p( | Y ) . Este valor a moda de p( | Y ) e dizemos ento que temos um estimador de Bayes.

este critrio que apresentaremos, a seguir, com mais detalhe:


J que queremos

$ = arg max p( |Y ) (A.4)


e podemos escrever
p( | Y ) = p(Y | ). p( ) / p(Y ) (A.5)

como p(Y ) independente de

teremos

$ = arg max p(Y | ). p( ) (A.6)


O principal problema deste estimador a grande quantidade de informao priori que requer. Como
essa informao no est disponvel na maioria dos casos torna-se muitas vezes impossvel usar este
estimador. No entanto, de um modo, intuitivo ele muito usado nos raciocnios normalmente
efectuamos. No nosso caso, como no dispomos de informao prvia acerca da distribuio do
parmetros nem uma caracterizao adequada para o rudo evidente que no conseguiremos
implementar explicitamente um estimador deste gnero.

Estimador de Mxima Verosimilhana

Muitas vezes no dispomos de informao acerca da distribuio dos parmetros . Nesse caso a
melhor opo ser assumir que ela constante. Acontece que se queremos

$ = arg max p( | y) (A.7)


e podemos escrever:
p( | Y ) = p( Y| ). p( ) / p( Y ) (A.8)

Como p( y ) independente de e p( ) = constante


vem:

- 109 -
$ = arg max p( y| ) (A.9)

Ou seja a estimativa de mxima verosimilhana ser o valor de que maximiza p( y| ).


Podemos chamar a p( y|) a funo de mxima verosimilhana.
Frequentemente: medida que o nmero de observaes aumenta o estimador de Bayes aproxima-se
de um estimador de mxima verosimilhana. A grande dificuldade na aplicao deste estimador a
descrio da funo de mxima verosimilhana. Muitas vezes ele no construdo directamente da
anlise das propriedades do sistema mas sim aplicando tcnicas que, para certos sistemas, nos levam
construo de um estimador de mxima verosimilhana

Propriedades do Estimador de Mxima Verosimilhana

Referimos a seguir as propriedades de um estimador de mxima verosimilhana:


Unicidade
Consistncia
No enviesamento assimpttico
Eficincia assimpttica
Ou seja a matriz de covarincia deste estimador aproxima-se do inverso da matriz de informao de
Fisher quando o nmero de medidas tende para infinito.
Princpio da invarincia

Se $ a estimativa de mxima verosimilhana de um vector de dimenso K ento f $ a ()


estimativa de mxima verosimilhana do vector f ( ) , sendo f uma funo vectorial de IRK em IRL, com

L K. Este princpio permite-nos fazer a estimativa de parmetros recorrendo a outros com eles
relacionados que facilitem o calculo da estimativa.

De um modo geral o estimador de mxima verosimilhana possui, assimptoticamente as


caractersticas de um estimador ideal. Esta a razo da sua popularidade. Atendendo a que sob certas
condies ele se confunde com um estimador de mnimos quadrticos, haver casos em que ser
extremamente fcil a sua implementao.

Estimador de Markov

Anteriormente realamos que o estimador de mxima verosimilhana podia ser considerado um


estimador de Bayes onde impusemos que a distribuio, priori, dos parmetros era constante.
Impondo restries mais severas no modelo que usamos podemos simplificar o estimador de mxima

- 110 -
verosimilhana. Se considerarmos que o rudo presente aditivo, a sua distribuio normal, de mdia
nula e varincia conhecida obtemos um estimador de Markov. A expresso deste estimador pode ser
considerada um caso particular de mnimos quadrado pesados. Assim a construo de um estimador
de Markov ser fcil, pois pode ser efectuada de um forma quase automtica sem requerer a anlise
necessria construo dos outros estimadores j vistos anteriormente.
Consideremos Z uma realizao de {Zt } para t = 1 ... N , ou seja, t indexa uma srie de medidas.

considerando que podemos, a partir de Z e t, construir Y e X tal que o modelo:


Y = G( , X ) + V (A.10)

poder descrever o sistema a ser identificado.


Apresentando V uma distribuio normal com:
E {V } = 0

{( )(
E yt xt T ys xsT = R IR N N)}
(A.11)

a funo de verosimilhana vir


V T R 1V (G (, X ) Y ) T R 1 (G (, X ) Y )
1 1
p(Y | ) = e 2 = e 2 (A.12)
(2) N | R| (2) N | R|

logo

$ = arg max p( y| ) = arg max (G( , X ) Y ) R 1(G( , X ) Y )


T

(A.13)

ou seja

( )
1
$ = X T R 1 X X T R 1Y (A.14)

Que corresponde a um estimador de mnimos quadrados pesados com matriz de peso igual a R-1. Ou
seja debaixo das condies de (A.11) juntamos as propriedades dum estimador de mxima
verosimilhana facilidade de aplicao de um estimador de mnimos quadrados. Muitas vezes, na
prtica, no dispomos de informao suficiente para garantir as propriedades requeridas ao rudo.
Nesses casos poderemos no gozar das garantias que tnhamos para um estimador de mxima
verosimilhana. Porm temos a garantia que um estimador de Markov aplicado a um modelo linear
nos parmetros ser no enviesado desde que o valor mdio do rudo seja nulo [Goodwin77]. Esta
propriedade extremamente importante e as condies em que ela se verifica so relativamente gerais
e fceis de verificar.

Estimador de Mnimos Quadrados

- 111 -
Caso possamos garantir que num processo tal como (A.10) temos o rudo com:
E {V } = 0

{( )(
E yt xt T ys xsT = )}
2 se t = s
0 nos outros casos
= 2 I
(A.15)

O estimador de mnimos quadrticos dado por

( )
1
$ = X T X X TY (A.16)

goza das seguinte propriedades:

{}
E $ = (A.17)

{} ( )
1 2
cov $ = X T X (A.18)

Este estimador o BLUE.

A demonstrao destas propriedades pode ser encontrada em [Goodwin77].

- 112 -
Relaes entre os Estimadores

Nesta figura sumariam-se as condies sob as quais se pode considerar um estimador como um caso
particular de outro, assim como herda as propriedades do estimador que lhe mais geral. Isto no
invalida que possamos, por exemplo usar um estimador de Markov para um processo cujo rudo no
seja gaussiano, somente que nesse caso no h a garantia de que apresente as propriedades de um
estimados de mxima verosimilhana.

Estimador de Bayes
p.d.f. dos parmetros
uniforme
Estimador de Mxima Verosimilhana
rudo aditivo
com mdia nula
Estimador de Markov e covarincia R

ruido branco
Estimador de Mnimos Quadrados

Figura A.1 - Relaes entre estimadores

Um caso evidente do problema de usar um estimador fora das condies que lhe garantem as suas
propriedades acontece quando estamos a usar um estimador de mnimos quadrados com rudo
gaussiano colorido. Surge frequentemente durante a estimao de sistema dinmicos.

- 113 -
REFERNCIAS BIBLIOGRAFICAS

[1] G. C. GOODWIN e R. L. PAYNE, Dinamic System Identification, Academic Press, 1997.

[2] L. LJUNG e T. SODERSTROM, Theory and Pratice of Recursive Identification, The M.I.T.
Press, 1983.

[3] K.J. ASTROM e B. WITTENMARK, Computer Controlled System Theory and Desing,
Prentice-Hall, Information and System Sciences Series, 1984.

[4] K. H. FASOL e H.P. JRGL, Principles of Model Buiding and Identification, Automatica,
vol. 16, pp 505-518.

[5] S. D. SILVEY, Statistical Inference, Chapman and Hall, 1975.

[6] K. J. ASTROM, T. BOHLIN e S. WENSMARK: Automatic Construction of Linear Stochastic


Dynamic Models for Station Processes with Random Disturbances using Operation Records, TP
18.150 IBM Nordic laboratory, Sweden 1965

[7] K.R. GODFREY: Correlation Methods, Automatica, vol. 16 pp.527-534

[8] R. ISERMANN: Practical Aspects of Process Identification, Automatica vol. 16 pp. 575-587

[9] I. D. LANDAU, System Identification and Control Design, Prentice Hall Englewood Cliffs,
New Jersey, 1990

[10] K. J. ASTROM, Maximum Likelyhood and Prediction Error Methods, Automatica, vol. 16
pp. 551-574.

[11] T. SODERSTROM, On Model Structure Testing in System Identification, International


Journal of Control, 1977 vol. 26 N 1, pp. 1-18

- 114 -

Potrebbero piacerti anche