Sei sulla pagina 1di 229

UNIVERSIDADE NOVA DE LISBOA

Faculdade de Cincias e Tecnologia


Departamento de Engenharia Mecnica e Industrial

Implementao integrada de SPC e EPC na melhoria contnua do processo


Por

Octvio Ferreira Ramalho

Dissertao apresentada na faculdade de Cincias e Tecnologia da Universidade Nova de Lisboa para obteno do grau de Mestre em Engenharia Industrial

Orientador: Doutor Jos Fernando Gomes Requeijo

Lisboa 2009

Sumrio Durante os ltimos anos tem havido nos meios acadmicos, por parte de um sector da engenharia industrial um esforo no sentido de integrar duas metodologias de controlo que, em muitas situaes reais, esto implementadas de forma autnoma. A primeira, mais ligada engenharia da qualidade, consiste na monitorizao dos processos com recurso a cartas de controlo, ou controlo estatstico do processo (SPC - Statistical Process Control). A segunda abordagem est baseada no ajustamento dos processos recorrendo informao sobre os nveis actuais das respostas ou desvios em relao aos valores de referncia e constitui a engenharia de controlo do processo (EPC). Ambas as metodologias tm por base a identificao e modelao do processo. O presente trabalho apresenta metodologias abrangentes para a identificao e modelao dos processos, baseadas em estimativas dos mnimos quadrados e de mxima verosimilhana, com o objectivo de se captar as dinmicas internas dos processos e assim obter os modelos necessrios implementao integrada, ou no, do controlo estatstico (SPC) e engenharia de controlo (EPC - Engineering Process Control). Pretendendo-se ser o mais abrangente possvel, toda a abordagem foi feita para lidar com sistemas de mltiplas entradas e mltiplas sadas (MIMO Multi-Input/Multi-Output), considerando-se os outros modelos (SISO ou MISO) como casos particulares deste. A metodologia de identificao implementada foi posteriormente utilizada com dados reais provenientes de um processo MISO, obtendo-se assim o modelo que serviu de base para simular o sistema de integrado SPC/EPC. Com base nos resultados obtidos por simulao, pode-se concluir que o sistema integrado permite simultaneamente um melhor ajustamento do processo em relao aos valores de referncia, reduzir a sua variabilidade, detectar alteraes verificadas no processo e, caso seja possvel, alterar o algoritmo de controlo de forma a responder s alteraes verificadas.

Abstract During the last years it has been having in the academic means, on the part of the industrial engineering an effort in the sense of integrating two control methodologies that, in many real situations, are implemented in independent way. The first of these, defended by the quality engineers, is statistical process monitoring by control charts, or statistical process control (SPC). The second approach is based on adjusting the process using information about its current level or deviation from the desired target. Both methodologies are based on model specification and model building of the process. This work presents a comprehensive methodologies for both the model specification and model building of processes, based on least squares estimation and maximum likelihood estimation in order to capture the internal processes dynamics and thus to get the necessary models to be used on the integrated, whether or not, implementation of the statistical process control (SPC) and engineering process control (EPC). Intending to be so comprehensive as possible, the whole approach was made to lead systems of multiple input, multiple output (MIMO), considering the other models (SISO or MISO) as special cases of this. The methods of model specification and model building implemented were later used with real data from a MISO process, thus obtaining the model that formed the basis for simulating the system of integrated SPC / EPC. Based on the results of the simulation, we conclude that the integrated system allows both a better adjustment process in relation to reference values (target), reduce their variability, detecting changes in process and, if possible, to change the algorithm control to respond to process shifts.

Indice

Indice
1 Enquadramento ................................................................................................................ 9 1.1 2 3 Aspectos de controlo do processo .......................................................................... 10 Monitorizao do processo e ajustamento do processo .................................. 10 1.1.1

Objectivos ....................................................................................................................... 13 Introduo....................................................................................................................... 15 3.1.1 3.1.2 3.2 3.2.1 3.2.2 3.3 Controlo do processo em indstrias de processo e produto ............................ 15 Controlo do processo lote a lote (run-to-run) ................................................... 20 Notao ............................................................................................................ 25 Conceitos e definies ..................................................................................... 26

Termos e definies ................................................................................................ 25

Estrutura .................................................................................................................. 28 Introduo ............................................................................................................... 31 Sistemas de controlo contnuo ......................................................................... 31 Sistemas discretos ........................................................................................... 43 Modelos Autoregressivos ................................................................................. 60 Modelos Mdia Mvel ...................................................................................... 67 Modelos ARMA ................................................................................................ 70 Processos no estacionrios: ARIMA .............................................................. 73 Utilizao de modelos ARIMA em previso ..................................................... 76 Identificao de Modelos ARIMA(p,d,q)........................................................... 78 Estimao dos Parmetros do Modelo ............................................................ 84 Teste de validao em modelos de series temporais ...................................... 88 Modelos de funo de transferncia ................................................................ 89 Identificao de funes de transferncia de processos ................................. 92 Estimao recursiva ....................................................................................... 103

Modelos Matemticos de Processos .............................................................................. 31 4.1 4.1.1 4.1.2 4.2 4.2.1 4.2.2 4.2.3 4.2.4 4.2.5 4.2.6 4.2.7 4.2.8 4.3 4.3.1 4.3.2 4.3.3

Modelos de Series Temporais................................................................................. 59

Funes de transferncia ........................................................................................ 89

Sistemas de Controlo ................................................................................................... 109 5.1 Controlo ptimo ..................................................................................................... 111 Controladores de varincia mnima (MMSE) ................................................. 112 Controlador de Varincia mnima generalizado ............................................. 120 5.1.1 5.1.2

Indice

Anlise Multivariada ...................................................................................................... 123 6.1 Sries temporais Multivariadas ............................................................................. 123 Series temporais multivariadas estacionrias ................................................ 123 Representao de modelos lineares para processos vectoriais estacionrios 126 6.1.1 6.1.2

6.1.3 Construo do modelo inicial e estimativa dos mnimos quadrados para modelos vectoriais ARMA ............................................................................................. 139 6.1.4 6.1.5 6.2 6.2.1 6.2.2 6.2.3 6.2.4 7 7.1 7.2 7.3 8 Estimativa de mxima verosimilhana e validao do modelo ...................... 148 Modelos de cointegrao e de rank reduzido ................................................ 157 Tipos de Representao ................................................................................ 159 Previso com modelos vectoriais ARMAX ..................................................... 161 Controlo ptimo .............................................................................................. 165 Especificao e validao do modelo ARMAX .............................................. 167

Modelos lineares com variveis exgenas ............................................................ 159

Combinao SPC e EPC .............................................................................................. 169 Controlo econmico ............................................................................................... 170 Controlo de custo mnimo com custos fixos de ajustamento e monitorizao171 Monitorizao dos parmetros e estratgias de ajustamento por realimentao . 174 Controlo Adaptativo multivariado ........................................................................... 177 Modelo base de estratgia de controlo adaptativo multi-input multi-output ... 178 7.1.1

7.3.1 8.1

Desenvolvimentos Prticos .......................................................................................... 183 Descrio e caracterizao do processo ............................................................... 183 Processo base ................................................................................................ 183 Processo de estudo ........................................................................................ 185 Anlise de correlao e coeficientes de Yule-Walker .................................... 187 Determinao das ordens do modelo ............................................................ 189 Modelo ARMA(1.2.3, 4) .................................................................................. 193 Modelo ARMA(0.1.2.3.4, 4) ............................................................................ 195 Estratgia de Controlo .................................................................................... 200 Estratgia de integrao ................................................................................ 205 Concluses ..................................................................................................... 217 8.1.1 8.1.2 8.1.3 8.2 8.3 8.2.1 8.3.1 8.3.2 8.4 8.4.1 8.4.2 8.4.3

Identificao do processo ...................................................................................... 189 Determinao do modelo final ............................................................................... 193

Integrao do controlo estatstico com engenharia de controlo ............................ 200

Concluses, recomendaes e trabalho futuro ............................................................ 219

Indice

Referencias.......................................................................................................................... 225 ANEXOS .............................................................................................................................. 229

1. Enquadramento

1 Enquadramento
O desempenho de um produto, um sistema ou um servio normalmente julgado em termos de confiana (que pode ser definido como um agregado de qualidade, fiabilidade, manutibilidade etc.) e segurana, no negligenciando o custo de alcanar estes atributos. O controlo eficiente dos processos um elemento chave na manuteno e melhoria da qualidade e produtividade. Tradicionalmente, duas diferentes vertentes tcnicas tm contribudo significativamente para o desenvolvimento do controlo dos processos na indstria As tcnicas de ajustamento do processo baseadas em princpios de controlo por realimentao ou feedback tornaram-se um importante recurso do kit de ferramentas utilizado pelos Engenheiros da Qualidade (ver (Box & Luceo, 1997), (Montgomery, 2001), (Del Castillo E. , 2002) , (Box, Jenkins, & Reinsel, 2008)). Uma variedade de tcnicas para o ajustamento dos processos tem sido propostas e estudadas devido ao recente interesse na integrao do controlo estatstico do processo (SPC Statistical Process Control) e controlo da engenharia do processo (EPC Engineering Process Control). Este tema envolve a abordagem de quatro grandes reas de estudo: identificao e modelao de sistemas ou processos, controlo estatstico, engenharia de controlo e a integrao do controlo estatstico com a engenharia de controlo.

Identificao e modelao de processos

Controlo Estatstico SPC

Engenharia de Controlo EPC

Integrao EPC/SPC

A parte fulcral da agregao destas quatro reas, e qual foi dedicado a maioria do tempo durante este trabalho, a parte de identificao e modelao sistemas. A obteno de um bom modelo meio caminho andado para a obteno de bons resultados na aplicao desta metodologia.

10

1. Enquadramento

A engenharia de controlo tem por base o modelo do processo. Apesar de a maioria das metodologias de controlo, P, PI, PID, utilizarem o modelo off-line como uma ferramenta de anlise e projecto, no controlo preditivo, o modelo a parte integrante do algoritmo de controlo e os nveis resultantes so aplicados directamente no processo. No controlo estatstico, na utilizao das cartas de controlo assume-se que, se o processo est sob controlo, o processo tem mdia constante e os dados so completamente no correlacionados. Em engenharia de processo defende-se que quase todos os processos produtivos exibem autocorrelao (Del Castillo E. , 2002), pelo que a obteno de um bom modelo para o processo pressupe que os resduos provenientes do modelo sejam constitudos unicamente por rudo branco, alcanando-se assim as condies ideais para a implementao do controlo estatstico.

1.1 Aspectos de controlo do processo


O termo controlo do processo utilizado de diferentes modos. As cartas de Shewhart e outras cartas controlo da qualidade so frequentemente empregues na indstria, maioritariamente de produo discreta, recorrendo a medidas parciais da produo no que chamado controlo estatstico do processo (SPC). Por contraste, particularmente na indstria de processo e qumica, utilizam-se vrias formas de ajustamento por feedback ou feedfoward no que chamado controlo de engenharia do processo (EPC). Como os ajustamentos feitos so normalmente calculados por computador e aplicados automaticamente, este tipo de controlo tambm conhecido como controlo automtico do processo (APC).

1.1.1 Monitorizao do processo e ajustamento do processo


O controlo do processo no menos que tentar cancelar/remover os efeitos de uma lei fundamental da fsica, a segunda lei da termodinmica, que diz que, se no houver interveno externa, a entropia ou desorganizao de qualquer sistema nunca diminui e normalmente aumenta (Box, Jenkins, & Reinsel, 2008). O SPC e o EPC so duas abordagens complementares para combater esta lei. O SPC tenta remover os distrbios atravs da monitorizao do processo enquanto que o EPC tenta compens-los atravs do ajustamento do processo.

1.1.1.1 Monitorizao do processo


A estratgia do SPC para estabilizao dos processos consiste em estandardizar procedimentos e matrias-primas e utilizar dispositivos geradores de hipteses (tais com grficos, listas de comprovao, cartas de Pareto, diagramas causa-efeito, etc.) para seguir e eliminar causas de problemas. Uma vez que a procura de causas atribudas caro e tedioso, normalmente opta-se por esperar at que ocorram desvios estatisticamente significantes para se instituir essa procura. Para implementar este processo recorre-se a cartas de monitorizao do processo tais como cartas de Shewhart, cartas Cusum, cartas EWMA etc.

1.1.1.2 Ajustamento do processo


Apesar do grande empenho dedicado em remover as causas de variao, tais como mtodos de testes no satisfatrios, diferenas na matria-prima, diferenas de operador

1. Enquadramento

11

etc., em muitos dos processos no possvel estabiliz-los num estado satisfatrio apenas recorrendo a estas tcnicas. Apesar dos esforos, o processo continua a exibir a tendncia de se afastar dos nveis pretendidos. Estas situaes podem verificar-se devido a fenmenos conhecidos mas incontrolveis como a variao da temperatura ambiente, humidade, etc. ou correntemente no conhecidas. Nestas circunstncias, ser necessrio recorrer a sistemas de ajustamento ou regulao onde a manipulao de determinadas variveis de entrada do processo tem o efeito de compensar as perturbaes que afectam as caractersticas da qualidade do processo.

2. Objectivos

13

2 Objectivos
Sem haver um objectivo previamente definido na abordagem deste tema, tentou-se, dentro das restries impostas ao desenvolvimento deste trabalho, ir o mais longe possvel no estabelecimento, organizao e implementao de ferramentas que permitissem construir uma metodologia mais ou menos abrangente para o desenvolvimento de tcnicas para a implementao de sistemas integrados EPC/SPC em ambiente industrial. Com o andar do tempo foi-se tendo a sensibilidade da dimenso da matria a abordar e a ficar com a sensao de que seria difcil sair dos fundamentos sem queimar etapas, optando-se por alargar as bases em vez de se avanar para modelos de controlo mais elaborado e especficos. Sendo um dos objectivos do trabalho a estruturao da metodologia, tentou-se abdicar das ferramentas que por vezes se utilizam sem se saber ao certo o que se est a fazer, pelo que, na modelao de sistemas dinmicos, e noutros desenvolvimentos usados ao longo deste trabalho, evitou-se ao mximo utilizar software existente, como por exemplo MATLABS SYSTEMS ID TOOLBOX ou SAS PROC STATE SPACE, uma vez que ao recorrer-se a este tipo de ferramentas, a metodologia proposta passa a depender de ferramentas externas no generalizadas, para alm de se perder a teoria que est por subjacente a esta metodologia, perdendo-se assim tambm a sensibilidade de anlise de dos resultados. Devido grande extenso da matria envolvida neste tema, e s restries em termos de tempo, houve muitos conceitos e metodologias que foram deliberadamente postos de parte ou abordadas de forma muito ligeira, como o caso da metodologia de espao de estados, controladores PID, controladores PID com modelo interno, controlo preditivo, forma cannica do modelo VARMA ou mesmo os modelos no estacionrios e de rank reduzido, sendo que alguns assuntos foram mesmo utilizados na prtica, nas no esto devidamente documentados. Devido ao seu inquestionvel interesse, esses temas devero ser desenvolvidos posteriormente no seguimento deste trabalho. O suporte base de programao e implementao das frmulas e algoritmos apresentados ao longo da parte terica foi basicamente o MATLAB, verso 7.0.0.19920 Da Math Soft Inc. Em certos casos recorreu-se ao Microsoft Visual C++, verso 6, principalmente quando se pretendeu criar ferramentas para utilizao futura como foi o caso dos programas para a determinao de custos mnimo como os apresentados nos anexos I e II. Estas ferramentas foram desenvolvidas numa altura em que os objectivos e processos de estudo ainda no estavam definidos com a intuio de que deveriam ser necessrias numa altura mais avanada.

3. Introduo

15

Introduo

3.1.1 Controlo do processo em indstrias de processo e produto


Nas industrias de base de produto o objectivo manter as caractersticas da qualidade to prximas quanto possveis dos valores de referncia ou target. A conformidade exacta com os valores de referncia s poder ser atingvel em termos tericos uma vez que existem uma grande variedade de factores que afectam os processos de produo causando desvios em relao aos valores desejados. O objectivo pode ser atingido por processos estatsticos de controlo (SPC- Statiatical Process Control), cuja ferramenta principal passa pelos registos e interpretao das cartas de controlo. As caractersticas do processo tais como a mdia, e respectivos desvios, de um processo contnuo, no conformidades ou percentagem de no conformidade so monitorizadas numa carta de amostragens do processo ao longo do tempo. Enquanto os registos carem dentro dos limites de controlo e no violarem certas regras, entretanto impostas para melhorar o desempenho das cartas, no haver qualquer interferncia no processo. Sempre que os registos caiam fora dos limites de controlo ou se verifique a violao de uma das regras impostas, ento procuram-se as causas que provocaram a alterao do processo. A esse tipo de causas atribuiu-se o nome de causas atribudas, ou causas designveis. O controlo estatstico tem assim uma viso binria das condies do processo, est a correr em condies satisfatrias ou no. O objectivo bsico diferenciar entre causas aleatrias inevitveis, chamadas causas comuns, e causas atribudas no processo e a fronteira entre ambas est basicamente nos limites de controlo. Se apenas se verificarem causas comuns, o processo continua. Se for detectada uma causa atribuda, o processo pra para se detectar e eliminar a causa. Ferramentas do controlo estatstico (SPC) tais como as cartas de controlo de Shewart, cartas de mdia mvel exponencialmente amortecidas (EWMA Exponential Weighted Moving Average) e cartas de somas acumuladas so normalmente utilizadas com estes objectivos. A engenharia de controlo do processo (EPC - Engineering Process Control) tem sido utilizado em processos de produo continua. O EPC constitudo por uma coleco de tcnicas para manipular as variveis ajustveis do processo com o objectivo de manter e/ou conduzir a sada do processo o mais prximo possvel dos valores desejveis. O objectivo do EPC providenciar uma resposta instantnea, contrabalanando as alteraes no balano do processo e aplicar aces correctivas para trazer a sada para os valores alvo. A abordagem consiste em prever os desvios da sada que possam ocorrer caso no exista aces de controlo e actuar de modo a cancelar os desvios previstos. Para atingir os objectivos EPC recorre-se a apropriados algoritmos de controlo por realimentao (feedback) ou controlo em avano (feedforward) que indicam quando e por quanto que o processo deve de ser ajustado para atingir os objectivos. O primeiro passo no ajustamento por feedback construir um modelo preditivo para o processo, determinando como que as sadas e as entradas esto relacionadas. Esta tarefa das mais importantes e a base para uma boa estratgia de ajustamento. Para a obteno do modelo, inicialmente recorria-se a metodologias como desenho de experiencias e resposta em superfcie, essa tarefa era normalmente executada off-line.

16

3. Introduo

Estas ferramentas revelaram-se bastante teis na presena de processos responsivos, nos quais o comportamento dinmico das variveis de sada apenas devido dinmica dos distrbios e o controlo exercido tem seu efeito completo imediatamente. Na produo discreta, o factor de controlo ser o ponto de operao da mquina (set point). s alteraes na sada no estado estacionrio que se obtm devido a uma alterao unitria na entrada d-se o nome de ganho do sistema. O valor do ganho determinado off-line com recurso a desenho de experincias e a tcnicas de regresso. A literatura disponvel em processos de ajustamento pode ser amplamente classificada de acordo com os problemas a que se destinam: 1. Feedback adjustment for machine tool problems 2. Setup adjustment problems 3. Run-to-run process control in application to semiconductor industry

3.1.1.1 A necessidade do complemento EPC-SPC


Apesar do SPC e EPC terem sido desenvolvidos em campos diferentes para os respectivos objectivos, estas metodologias podem se complementar na obteno do objectivo comum de reduo da variabilidade. Os seguintes pontos destacam a necessidade de ajustamento dos processos na indstria: 1. Os ambientes produtivos so no estacionrios e os processos esto sujeitos a alteraes ocasionais. Apesar das causas das alteraes serem conhecidas, estas podem ser impossveis ou economicamente inviveis. Alguns exemplos so a variabilidade da matria-prima, alteraes nos processos devido manuteno, variaes na temperatura ambiente e humidade, etc. Tais fontes de variabilidade so inevitveis e geralmente no podem ser eliminadas apenas pela monitorizao do processo. Deve-se ento recorrer ao ajustamento do processo para compensar e minimizar a variabilidade em tais circunstncias. 2. O processo pode sofrer deriva lenta. A deriva pode dever-se a causas conhecidas tais como a acumulao de resduos dentro de um reactor, o envelhecimento de componentes, etc. que podem no ser identificadas com preciso. A utilizao apenas do SPC no ser bem apropriada para controlo de processos com deriva lenta. Sem interferncia no controlo do processo, o processo pode atingir determinados desvios antes que qualquer aco de controlo seja tomada como resposta a um alarme. Se o custo devido ao produto fora de especificao elevado ou os custos de ajustamento baixos, no h necessidade de esperar um longo perodo para se observar um ponto fora dos limites e disparar uma aco de controlo. 3. Existem processos em que o estado de controlo estatstico pode tratar-se de um caso ideal e portanto difcil de atingir ou dizer que o processo est sob controlo estatstico. Nesses casos seria benfico ter um controlo moderado com ajustamento do processo. 4. O ajustamento do processo por si s, no apropriado para eliminar causas especiais que podem afectar o processo. Quando acontecem causas especiais, tais como alteraes sbitas das condies ambientais ou erros de leitura, entre outras, o ajustamento do processo por si s no lidar com tais situaes. Estas causas provocaro situaes de desvios em relao ao

3. Introduo

17

target e o aumento da variabilidade da sada. Estas causas devem ser detectadas com recurso monitorizao do processo.

3.1.1.2 Argumentos contra o ajustamento do processo


Num passado recente, os Estatsticos e os Engenheiros de processo aderiram noo de no interferir no processo se ele est sob controlo estatstico. Evitou-se a ideia do ajustamento do processo. Esta noo, ento defendida por Deming atravs da experincia popularmente conhecida do funil de Deming. Deming estudou os efeitos de no ajustamento e ajustamento na varincia do processo. Ele conclui que a estratgia de no ajustamento produzia melhores resultados e o processo mantinha-se nos valores alvos. Procedendo-se a uma anlise mais profunda da experincia compreende-se os pressupostos da experincia que conduziram a essa concluso: 1. O processo fonte dos desvios est sob controlo estatstico. 2. O processo est inicialmente no alvo. 3. possvel apontar o funil ao alvo. A mesma experincia foi mais tarde analisada e tiraram-se algumas concluses teis. Quando o processo est fixo no alvo e sob controlo estatstico no precisa de ajustamento. Contudo, se um processo no controlado exibe autocorrelao, o recurso a regras de controlo poder melhorar significativamente o seu desempenho. Se o processo for no estacionrio, a prpria mdia move-se, pelo que se o processo no for controlado, a mdia afastar-se- dos valores alvo e consequentemente necessitar de ser ajustado. A engenharia de controlo do processo recorre normalmente a controladores por realimentao; os desvios das respostas em relao aos valores alvo esto normalmente autocorrelacionados e essa informao normalmente utilizada para prever desvio futuros. A partir dos valores medidos das sadas autocorrelacionadas constroem-se modelos de sries temporais e estimam-se os respectivos parmetros. Estes modelos so utilizados para obter previses de erro quadrtico mnimo de distrbios futuros e o algoritmo de controlo implementado de forma a cancelar os desvios previstos. Contudo, uma estratgia eficiente do processo de ajustamento deve ter em conta os aspectos econmicos.

3.1.1.3 Modelo estocstico


Box e Jenkins propuseram um processo iterativo de trs estgios para construo de um modelo a partir dos dados, identificao, estimao e diagnstico de validao do modelo. A identificao do modelo consiste em determinar as ordens p,d,q de um possvel modelo autoregressivo integrativo mdia mvel ARIMA(p,d,q) a partir de funes de autocorrelao e autocorrelao parcial. Uma vez identificadas as ordens do modelo, os respectivos parmetros tem que ser estimados. Se a estimativa feita com dados histricos, a estimativa diz-se off-line. Os parmetros so estimados com recurso a ferramentas como estimativas dos mnimos quadrados e estimativas da mxima verosimilhana.

18

3. Introduo

Se o modelo obtido apropriado, os resduos no devem conter qualquer informao. Se a autocorrelao foi completamente capturada, os resduos devero ser rudo branco. No diagnstico de validao a funo de autocorrelao dos resduos analisada e validada com recurso a testes estatsticos. Se os resduos mostrarem autocorrelao significativa, ento o modelo deve ser refeito e todos os trs estgios devem ser repetidos at se encontrar um modelo satisfatrio. Modelo Integrativo Mdia Mvel ARIMA(0,1,1) O modelo IMA(1,1) um caso especial dos modelos ARIMA(p,d,q). Este modelo tem servido para representar uma larga gama de sries temporais utilizadas na prtica, tais como procuras de mercado, preos, stocks, caractersticas de processos qumicos e fsicos (temperaturas, viscosidades, concentraes) etc. Este modelo tem-se mostrado tambm bastante apropriado para modelar distrbios que ocorrem nos processos. Com o parmetro AR igual a zero e os parmetros I e MA iguais a um, o modelo pode ser representado pela forma = O modelo caracterizado por dois parmetros e . Este modelo pode igualmente ser reescrito numa forma mais conveniente = = + +

+ +
=

Intuitivamente, uma mistura de shocks aleatrios correntes com a soma de shocks aleatrios. Este modelo bastante utilizado na previso de distrbios e caracterizao da funo de transferncia de processos dinmicos.

3.1.1.4 Aspectos econmicos relacionados com EPC


O objectivo do EPC ajustar o processo e manter as caractersticas da qualidade o mais prximo possvel dos valores alvo. Na prtica contudo, existem vrios custos envolvidos. Esses custos devero ser tidos em conta para se tomar uma deciso racional. Os principais custos envolvidos so os custos de no conformidade (Off-target costs), custos de ajustamento e custos de amostragem (Box & Luceo, 1997). Os custos de no conformidade so custos que incorrem quando as caractersticas da qualidade se desviam dos valores pretendidos e so normalmente definidos de forma linear, proporcionalmente aos desvios em relao aos valores alvo. O ajustamento do processo pode incorrer em custos significantes na vida real dos processos. Para alm de custos de manipulao e operao dos actuadores, os ajustamentos podem requerer a paragem dos processos. Consequentemente, os ajustamentos frequentes podem ser uma situao a evitar. Em EPC, normalmente os

3. Introduo

19

custos de ajustamento assumem-se fixos e independentes da magnitude do ajustamento. Os custos de amostragem so aqueles que incorrem na obteno dos valores numricos finais das caractersticas da qualidade. Estes incluem os custos incorridos na amostragem do processo e do processamento de anlises fsicas ou qumicas para se determinar leituras precisas e objectivas das medidas efectuadas. Quando os custos de amostragem so significativos, poder ser indesejvel uma frequncia elevada de amostragem. Estes custos variam fortemente de situao para situao. Enquanto que numa produo os custos de no conformidade podem ser dominantes, noutros processos, os custos de amostragem podem ser bastante elevados, enquanto noutros ainda, os custos de ajustamento podem ser bastante altos, envolvendo a paragem do processo ou custos relacionados com reparaes.

3.1.1.5 Ajustamento por feedback com zona morta


Se no existirem custos de ajustamento nem custos de amostragem, ser conveniente ajustar o processo em todos os perodos. Nesses casos, os controladores de varincia mnima sero apropriados e eficientes mantendo o processo nos valores ptimos pretendidos. Em muitos casos prticos no desejvel ajustar o processo to frequentemente devido aos custos envolvidos. Um controlador que apenas minimize as caractersticas da qualidade, negligenciando os outros custos, poder no ter de grande utilidade prtica. Para gerir os custos globais do controlo por realimentao, foi ento proposto um controlador com frequncia de ajustamento limitada. No ajustamento por feedback condicionado, colocada uma zona morta em redor dos valores objectivo. O processo apenas ajustado se os desvios previstos carem fora da zona morta. A espessura da zona morta funo dos custos de no conformidade do produto, dos custos de ajustamento e dos custos de amostragem.

3.1.1.6 Problema do ajustamento de setup


Nos processos produtivos crucial a preciso do ajustamento das mquinas no inicio da produo de um lote. Um setup incorrecto pode resultar em severas consequncias para o lote produzido. O efeito do erro de setup induzir uma alterao na sada. Ser necessrio ajustar e corrigir, se possvel, o processo que teve um erro de setup induzido no inicio do lote. Considere-se um processo cujo setup foi ajustado antes da produo do lote e este setup est sujeito a erros. O erro de entrada originar um desvio em degrau na sada do processo. O objectivo ento ajustar o processo para eliminar o offset induzido na sada. Suponha-se que se tem acesso varivel de controlo e que esta tem um efeito direto na sada e que o efeito do controlo exercido instantneo. No ajustamento do setup, o objectivo trazer rapidamente o processo para os valores pretendidos recorrendo estimativa do offset com preciso. A amplitude do offset estimada a partir dos dados observados. As observaes esto sujeitas a variaes inerentes ao processo e erros medidos. A preciso das estimativas do offset pode ser melhorada

20

3. Introduo

com o incremento das observaes disponveis. A espera pela colecta de uma quantidade significativa de dados entra em conflito com o objectivo de trazer rapidamente o processo para os valores desejados. Uma estratgia ptima para esta situao passa por estimar sequencialmente o offset e ajustar o processo em conformidade. Grubbs props uma elegante regra de ajustamento sequencial para resolver o problema de ajustamento do erro de setup, conhecida como regra harmnica de Grubb (Grubb, 1954/1983). A estratgia de ajustamento proposta consiste em ajustar o processo de acordo com a seguinte equao + = = , , ,

A regra de ajustamento implica que, aps a produo da primeira parte, o processo ajustado em funo do desvio observado. Aps a produo da segunda parte, o processo ajustado em funo de metade do desvio observado e assim por diante. O ajustamento segue a serie harmnica 1, , , , sendo por isso conhecida como a
2 3 1 1

serie harmnica de Grubb. Foram feitos os seguintes pressupostos: 1. O processo estvel sem autocorrelao (sem dinmica) ou alterao na mdia. 2. Os ajustamentos alteram a mdia do processo. 3. Os ajustamentos so exactos e implementados em todas as partes. Os problemas de ajustamento e de setup tem tido recentes desenvolvimentos atravs de estudos de Pan e Del Castillo (Pan & Del Castillo, 2003) e Sulo e Vandevan (Sulo & Vandevan, 1999).

3.1.2 Controlo do processo lote a lote (run-to-run)


O controlo run-to-run tambm uma forma discreta de controlo por realimentao no qual as aces de controlo so exercidas entre lotes com o objectivo de minimizar os desvios em relao aos valores alvo e a variabilidade dos processos. Este tipo de controlo tem tido as principais aplicaes no contexto de produo de semicondutores. Neste contexto, tem-se verificado bastantes pesquisas envolvendo tipos de controlo de entradas e sadas mltiplas (sistema MIMO), (Moyne, del Castillo, & Hurwitz, 2001) embora a maioria das publicaes se refiram a resultados simulados. Controladores EWMA Os controladores EWMA so os mais amplamente utilizados na indstria de produo de semicondutores. Estes controladores so simples e ainda bastante eficazes na manuteno do processo nos nveis desejados e reduo da variabilidade. O procedimento no ajustamento do processo com controladores EWMA o seguinte: Considere-se um processo, que embora no linear, pode ser linearizado num determinado ponto de operao. Esse processo na vizinhana de ponto pode ser descrito pela seguinte equao:

3. Introduo

21

= + + Onde o valor da caracterstica da qualidade do processo (sada) para o lote ; a varivel de controlo (entrada) determinada no fim do processamento do lote 1; a perturbao do processo; o offset do processo (ordenada na origem) e o declive ou ganho. Assume-se que e so constantes ao longo do tempo. Estes valores so desconhecidos e tem que ser estimados a partir dos dados disponiveis. O ganho do processo similar a um coeficiente de regresso que relaciona a alterao da sada com a correspondente alterao na entrada. O ganho do processo estimado atravs de desenho de experincias, anlise de regresso e metodologia de resposta em superfcie (Box & Draper, 2007). Seja 0 e as estimativas iniciais de e . 0 e so tipicamente estimados pela metodologia dos mnimos quadrados a partir dos dados histricos. Tal como como em qualquer outro controlador nestas circunstncias, a varivel de controlo ajustada para invalidar o desvio da resposta, ou seja =

onde o valor de Target. No controlador EWMA proposto, o parmetro desconhecido recursivamente estimado e actualizado e a varivel de entrada determinada ao fim de cada lote. A equao de estimao a seguinte = + onde 0 1 o chamado factor de desconto. O valor de offset estimado substitudo na equao seguinte para determinar o valor da varivel de controlo =

Como notrio, a ideia chave no controlador EWMA que para um predeterminado ganho do processo, o offset e variveis de entrada so actualizadas recursivamente. O valor esperado convergir ento assimptoticamente para o desejado valor de target. Se as perturbaes do processo seguirem o modelo no estacionrio IMA(1,1) = + ~ ,

22

3. Introduo

e o vis do ganho estimado pode ser representado como = sob a condio de que 0 < < 2, o ganho estimado est enviesado no mais que duas vezes o valor estimado, o factor ptimo de desconto dado por =

Contudo, uma estimativa imprecisa dos parmetros desconhecidos e conduz a valores elevados do vis inicial + e dever demorar alguns lotes para o controlador EWMA levar o processo de volta ao target. Controladores de duplo EWMA Os processos de produo podem estar sujeitos a deriva determinstica com o tempo e tender a afastar-se da referncia. Estes fenmenos podem estar relacionados com o envelhecimento das mquinas ou deteriorao das condies ideais de produo com o tempo. O objectivo do controlo por realimentao ajustar as variveis de controlo tal que a sada esteja to prxima quanto possvel da referncia. A utilizao de uma single-EWMA neste caso poder no ser ptima porque no pode compensar a tendncia determinstica. Considere-se um processo que est compensado e sujeito a distrbios e deriva com o nmero de processamentos. O processo pode ser descrito pela seguinte expresso = + + + Como definido anteriormente , , , , correspondem respectivamente sada, ao offset, ao declive, aos distrbios e entrada. a taxa de deriva determinstica. Os seguintes controladores de dupla EWMA aplicam-se a processos produtivos com deriva linear (Moyne, del Castillo, & Hurwitz, 2001) + = + = = +

< < 1 < < 1

O controlador de duplo EWMA consiste num filtro para estimar a verdadeira sada do processo e num filtro para estimar a tendncia. A previso igual soma das duas componentes. Duplo EWMA avanado Em (Moyne, del Castillo, & Hurwitz, 2001), Ruey-Shan Guo, Argon Chen e Jing-Jung Chen apresentam o denominado Enhanced EWMA Controller que um controlador baseado em filtros EWMA composto por dois mdulos denominados por Dynamic-

3. Introduo

23

Tunning Loop module e Run-by-Run Feedback Control module. O modulo DynamicTunning Loop utiliza primeiro uma carta de controlo EWMA para determinar a existncia de alteraes mdias ou grandes no processo. Se existir uma alterao mdia ou grande no processo, e o erro controlvel, ento parmetro de controlo (factor de desconto ) alterado para valores altos e inicia o mdulo Dynamic-Tunning Loop de modo a trazer o processo rapidamente aos valores de referncia. No modulo Run-byRun Feedback Control o parmetro de controlo sintonizado baseado no estado corrente do Dynamic-Tunning Loop. Durante a execuo do Dynamic-Tunning Loop, o parmetro de controlo vai diminuindo at atingir o valor predeterminado 0 a partir do qual Run-by-Run Feedback volta s condies iniciais. Se o erro no controlvel, o processo pra disparando assim uma aco de controlo externa. Controlo Run-to-Run para pequenas produes Nos controladores de base EWMA apresentados at aqui pressupunha-se que os processos atingissem o estado estacionrio com um apropriado factor de desconto, mas para atingir o estado estacionrio poder ter que se processar alguns lotes at que o processo atinja os valores de referncia. Este tempo de resposta poder ter consequncias severas nas pequenas produes, frequentemente encontradas at na indstria de semicondutores, onde esta matria tem tido os desenvolvimentos mais recentes. O objectivo dos controladores IIIA (Internal Intercept Iteratively Adjusted) e controladores de EWMA varivel superar esta negligncia e reduzir a alta taxa de retrabalho nas produes iniciais (Krishna B. Misra, 2008).

3.1.2.1 EPC e SPC como ferramentas complementares


O SPC e o EPC podem trazer grandes benefcios quando utilizados como ferramentas complementares. Com esta combinao consegue-se verificar a adequao dos ajustamentos e simultaneamente identificar causas atribudas de alteraes no desempenho. Existem crticas argumentando que a implementao do EPC impede de detectar oportunidades de melhorar os processos pela identificao de causas especiais e consequente remoo. O EPC tem sido descrito como uma banda par cobrir a ferida e no para a curar. A implementao de EPC e controlo por feedback pode cancelar a verdadeira natureza dos distrbios que afectam o processo. Essa situao pode ser evitada pela monitorizao das variveis de controlo e dos desvios das respostas em relao s referncias. Qualquer ponto fora de controlo nas variveis de controlo poder corresponder a uma compensao excessiva para uma perturbao que poder desencadear um alarme correspondente a uma causa especial no sistema. De modo similar, qualquer erro fora do normal ser visto atravs das cartas de monitorizao dos desvios em relao s referncias. Outra crtica que a implementao do EPC resultar numa compensao sub-ptima. Isso verificar-se- se os modelos dos distrbios esto errados ou os parmetros estimados sem preciso. Na maior parte dos casos, assume-se que os distrbios so modelados por um modelo IMA e ento utilizase uma EWMA para prever os distrbios. Normalmente a constante de amortecimento inferior a 0.3, consequentemente a inflao da varincia do processo devido aos erros de modelao no ser severa. Adicionalmente, o modelo EWMA fornece uma boa estimativa mesmo que o modelo no seja precisamente um IMA (Krishna B. Misra, 2008).

24

3. Introduo

A convenincia de utilizao de EPC e SPC num processo depende dos seguintes factores: 1. Quando os custos de ajustamento e/ou erros de ajustamento so elevados, melhor no implementar o EPC. 2. Quando os erros medidos so elevados no aconselhvel utilizar o EPC. 3. Quando a amostragem lenta relativamente dinmica do processo, o processo observado no exibe autocorrelao e controlo estatstico ser suficiente. De notar que a reduo da frequncia de amostragem para propsitos de SPC ser til apenas se o processo original estacionrio. A reduo da frequncia de amostragem de um processo no estacionrio ainda produz processos no estacionrios. Uma estratgia de ajustamento baseada no EPC ser aconselhvel em tais casos (Krishna B. Misra, 2008). As cartas de controlo podem ter um papel efectivo na reduo da variao do processo quando existem causas especiais em processos controlados por EPC. O denominado ASPC (Algoritmic Statistical Process Control) uma estrutura que unifica o SPC e o EPC. um sistema que utiliza o EPC para regular o processo e SPC para monitorizar o processo controlado com a finalidade de detectar qualquer alterao do processo em relao ao modelo assumido e rev-lo se necessrio. Existem pelo menos dois mtodos utilizados na integrao do SPC com EPC, o primeiro consiste em monitorizar a sada do processo controlado por EPC, a segunda consiste em monitorizar as aces de controlo do EPC. Um dos problemas com a monitorizao das respostas que quando existem causas especiais, as respostas esto contaminadas pelas aces de controlo, o que resultar numa janela mais pequena para as oportunidades de deteco. No entanto as sadas esto correlacionadas com as entradas, pelo que atravs da monitorizao das aces de controlo, estas situaes podem perfeitamente ser detectadas. A performance da monitorizao de um processo controlado por EPC pode depender da monitorizao das respostas ou aces de controlo, da estratgia de controlo empregue (MMSE ou PID) e da estrutura de autocorrelao subjacente. SPC Algoritmico (Vander Weil, 1992) props um algoritmo de controlo baseado no MMSE (Minimum Mean Square Error) e um esquema de monitorizao da sada por uma carta CUSUM, a que se chamou Algorithmic SPC ou ASPC. (Montgomery D. C., 1994) Investigou dois tipos de causas especiais, uma alterao contnua e uma tendncia linear, e demonstrou que os procedimentos combinados melhoram a performance em relao ao procedimento apenas do EPC (ver tambm: (MacGregor, 1987), (MacGregor J. F., 1990), (Box G. E., 1992), (Capilla, Ferrer, Romero, & Hualda, 1999), (Montgomery D. C., 2001), (Chen, 2002) ). Adicionalmente, a monitorizao de sries autocorrelacionadas tem semelhana visvel com o ajustamento do processo. A performance das vrias cartas de monitorizao tem sido investigada para casos especiais de nvel de alterao ( (Alwan, 1988), (Wardell, 1994), (Vander Weil S. , 1996), (Atienza, 1998)

3. Introduo

25

3.2 Termos e definies


3.2.1 Notao
AAI AIC ARIMA(p,d,q) Intervalo mdio entre ajustes Critrio de Informao de Akaike Modelo autorregressivo de ordem p, diferenciao de ordem d e de mdias mveis de ordem q Nmero mdio ao fim do qual se detecta Modelo autorregressivo, de mdias mveis com varivel Exgena Modelo autorregressivo com varivel Exgena Modelo autorregressivo de ordem p Modelo de Box e Jenkins Carta de Somas Acumuladas Carta de Mdia Mvel Exponencialmente Amortecida Engenharia de controlo de processo Funo de Autocorrelao Funo de Autocorrelao Parcial Funo de Correlaco-Cruzada Funo densidade de probabilidade Funo de Transferncia-Rudo Linha Central Limite Inferior de Controlo Limite Superior de Controlo Percentagem de inflao no desvio padro Erro mdio quadrtico CL Center line LCL Lower Control Limit UCL Upper Control Limit Increase of the Standard Deviation Mean Squared Error Average Ajustment Interval Akaike Information Criterion Autorregressive Moving Average Model uma situao fora de controlo Average Run Length Autorregressive Moving Average Model with Exogene Variable Autorregressive Model with Exogene Variable Autorregressive Model Box Jenkins Model Cumulative Sums Chart Exponential Weight Moving Range Chart Engeneering Process Control ACF Autocorrelation Function PACF - Partial Autocorrelation CCF Cross-Correlation Function

ARL ARMAX ARX AR(p) BJ Carta CUSUM Carta EWMA EPC FAC FACP Function FCC fdp FT-R LC LIC LSC ISD MSE MIMO MISO MR PCA

Vrias variveis de sada e vrias variveis Multiple Input Multiple Output de entrada Uma varivel de sada e vrias variveis de entrada Amplitudes Mveis Anlise em Componentes Principais Multiple Input Single Output Moving Range Principal Component Analysis

26

3. Introduo

SISO SPC SPE VM

Uma varivel de sada e uma variveis de entrada Engenharia de controlo do processo Erro de previso quadrtico Varincia Mnima

Single Input Single Output Statistical Process Control Squared Prediction Error

3.2.2 Conceitos e definies


Processo estacionrio Um processo estacionrio se os seus primeiro e segundo momentos so invariantes no tempo. Por outras palavras, um processo estocstico () estacionrio se se verificar simultaneamente = = =

Para todo Para todo e = , , ,

A primeira condio significa que todo o tem o mesmo vector mdia e a segunda condio requer que a autocovarincia do processo no dependa de mas apenas do perodo de tempo de que os dois vectores e esto separados (Ltkepohl, 2007). Autocovarincia e Autocorrelao O prefixo auto significa uma aco reflectiva nele prprio, assim a autocovarincia a covarincia que o processo tem com ele prprio. A funo autocovarincia, denominada por , d a medida da dependncia linear (associao linear) entre duas variveis do mesmo processo e + , que esto separadas por perodos ou lags, como funo de k. para qualquer processo discreto, define-se , = , + = + = 0, 1, 2

Se o processo estritamente estacionrio, a mdia constante e a autocovarincia reduz-se a , = , + = + = 0, 1, 2

Pelo que a funo autocovarincia depende apenas da lag , sendo que, para = 0 tem-se = = = . Normalmente torna-se mais simples trabalhar com a autocovarincia normalizada que se obtm dividindo a autocovarincia do processo pela prpria varincia do processo, neste caso , obtendo-se assim a funo denominada autocorrelao. Para um processo estacionrio define-se a funo autocorrelao dada por

3. Introduo

27

= 0, 1, 2

Onde 1 1. Dado que = o que implica que = , estas funes normalmente esto definidas apenas para lags positivas. Tanto a autocorrelao como a autocovarincia na lag do o grau de associao linear entre duas variveis do mesmo processo, e , separadas que esto separadas perodos. Nas relaes entre variveis aleatrias conveniente relembrar as seguintes implicaes: 1. Se e so independente ento so no correlacionadas, isto , = qualquer que seja . 2. Se e so correlacionados isto , para algum , ento e so dependentes. O desvio padro da mdia de um processo autocorrelao. (Bartlett, 1946) mostrou que +

fortemente afectado pela

Para grandes amostragens, / , pode-se fazer a seguinte aproximao: +

(3.1)

Deste modo, se um processo completamente no correlacionado, ou seja, = 0 para todo o , o desvio padro da mdia do processo ser dado pelo usual . A estimativa da funo autocovarincia pode ser obtida atravs da funo autocovarincia amostral dada por (Del Castillo, 2002) = =

+
=

= , , ,

(3.2)

De forma similar, a funo de autocorrelao dada por = =

= , , ,

Rudo branco vectorial (Multivariado) O processo vectorial rudo branco definido como uma sequncia de vectores aleatrios independentes, , 1 , , , em que = 1 , , , tal que

28

3. Introduo

= 0, = , onde a matriz de covarincia assumida positiva definida, e + = 0 para 0 devido independncia. Consequentemente as suas matrizes de covarincia so dadas por

= + =

Operador vec e produto de Kroneker de Matrizes Define-se o operador vec que transforma uma matriz num vector coluna colocando (ou empilhando) as colunas da matriz uma por baixo das outras. Ou seja, se uma matriz de dimenso definida por = 1 , , onde a i-sima coluna de , definese o vector coluna de dimenso 1 dado pela expresso = = , ,

(3.3)

O produto de Kroneker de duas matrizes definido como se segue. Seja = uma matriz de dimenso e = uma matriz de dimenso . Ento o produto de Kroneker de A e C, cuja notao , a matriz da forma =
(3.4)

Uma propriedade bastante til relacionada com o operador vec que se Z=ABC, ento = = ()
(3.5)

De notar ainda que = = , consequentemente, utilizando (3.5), tem-se que = .

3.3 Estrutura
Em linhas gerais, a presente dissertao constituda por quatro partes mais Anexos. A primeira parte, de reduzida dimenso e de natureza predominantemente informativa, inclui os ndices, o enquadramento do tema do trabalho, uma introduo ao tema e os trabalhos mais relevantes nesta rea e ainda algumas abreviaturas, termos e definies utilizadas ao longo este trabalho. A segunda parte que constitui a estrutura principal deste trabalho, constituda pelos captulos 3 a 8, e est dividida em dois grandes blocos. O bloco 1, que vai do captulo 4 ao captulo 7, apresenta os fundamentos tericos onde assenta toda a parte experimental e investigao realizada. O bloco 2 composto pelo captulo 8 e descreve o trabalho efectuado em termos prticos. O bloco 1 por sua vez est dividido em 3 sub-blocos. O sub-bloco 1 composto pelos captulos 4 e 5 e aborda temas relativos a modelos matemticos de processos e sistemas de controlo no domnio escalar, ou seja, trata-se de modelos que apenas usam uma varivel, ou, quanto muito trata-se de modelao de sistemas com uma varivel de entrada e uma varivel de sada. No sub-bloco 2 faz-se a anlise do mesmo tipo de

3. Introduo

29

sistemas mas extrapolando para o plano multivariado. No sub-bloco 3 apresenta-se vrias metodologias de abordagem ao tema objectivo deste trabalho que a integrao do controlo estatstico com engenharia de controlo. O bloco 2 descreve-se e caracteriza-se o processo que serviu de base ao estudo efectuado, apresenta-se os desenvolvimentos prticos efectuados e as concluses preliminares. Bloco 1 O bloco 1 composto pelos captulos 4, 5, 6 e 7. No capitulo 4 introduz-se o conceito de modelao de sistemas dinmicos, faz-se uma abordagem transformada de Laplace e modelao de sistemas dinmicos no espao das fazes (domnio s). A partir desta abordagem passa-se para a modelao discreta com a introduo da transformada z e faz-se a ponte para a modelao no domnio do tempo introduzindo-se os modelos de sries temporais. O subcaptulo 4.2 apresenta os principais conceitos subjacentes teoria das sries temporais e as metodologias de identificao, estimao de parmetros, teste e validao de modelos autoregressivos (AR), mdia mvel (MA), e modelos mistos ARMA e ARIMA. O subcaptulo 4.3 introduz o conceito de funo de transferncia e a sua relao com a resposta ao impulso. Introduz os modelos de varivel exgena ARX e ARMAX e a metodologia de identificao de funes de transferncia de sistemas dinmicos. O ponto 4.3.3 apresenta metodologias de estimao recursiva (on-line) de modelos ARMA e ARMAX. Embora esta metodologia se situe na seco referente a sistemas univariveis, ela tambm aplicvel a sistemas multivarivais. O captulo 5 aborda um dos problemas principais deste trabalho: como ajustar um processo com a garantia de que os ajustamentos efectuados so os mais indicados (ptimos). Este captulo alm de introduzir o conceito de controlo por realimentao (feedback), faz a abordagem a algumas das metodologias de controlo aplicveis aos modelos estudados at este ponto como sejam os controladores tericos de varincia mnima ou o modelo de controlo de Clarke e Gawthrop. O sub-bloco 2 do bloco 1 composto exclusivamente pelo captulo 6 e talvez o captulo core deste trabalho. A seco 6.1 comea por apresentar as sries temporais multivariadas, aborda-se algumas das dificuldades inerentes identificao e representao de forma nica dos modelos mistos ARMA e estabelece-se a metodologia para a construo dos modelos preliminares passando depois estimao dos modelos finais com recurso a estimativas da mxima verosimilhana. A exemplo do que foi apresentado para o caso univariado, a seco 6.2 aborda a introduo das variveis exgenas nos modelos VARMA (uma das designaes aplicadas aos modelos ARMA multivariados - Vector ARMA) passando a denominar-se por modelos VARMAX. Esta seco faz ainda uma abordagem aos sistemas de controlo aplicveis este tipo de processos e finaliza com a apresentao de tcnicas de especificao e validao de modelos VARMAX. O sub-bloco 3 do bloco 1 composto exclusivamente pelo captulo 7. Este captulo apresenta algumas metodologias bsicas de integrao do controlo estatstico com

30

3. Introduo

engenharia de controlo. O subcaptulo 7.1 faz uma abordagem aos custos envolvidos nas estratgias de controlo e apresenta solues para determinar os parmetros de controlo que minimizam os custos envolvidos. No subcaptulo 7.2 faz-se uma ligeira abordagem s cartas de monitorizao Cuscore com nfase na sua vocao para detectar alteraes nos parmetros dos modelos de sries temporais ARMA. No subcaptulo 7.3 apresenta-se o conceito de controlo adaptativo que ser uma das reas onde a integrao EPC/SPC pode ter particularmente sucesso. Nessa mesma seco apresenta-se ainda o caso mais estudado nesta rea nos ltimos anos (Del Castillo & Yeh, An adaptive run-to-run optimizing controller for linear and nonlinear semiconductor processes, 1998) e que constitui uma das maiores referncias deste trabalho. Bloco 2 Neste bloco apresenta-se alguns resultados do trabalho prtico efectuado. A base do trabalho prtico efectuado assenta basicamente nos fundamentos tericos apresentados na seco 6. No ponto 8.1 faz-se uma anlise do processo de estudo e estabelecem-se as indicaes preliminares sobre a estrutura do modelo. Nos pontos 8.2 e 8.3 procedese modelao e validao do modelo que ser utilizado como o modelo representativo do processo nas simulaes a efectuar. No ponto 8.4 apresentam-se os resultados e concluses preliminares resultantes de algumas das simulaes efectuadas. A terceira parte composta pelo captulo 9, designado como Concluses, Recomendaes e Trabalho Futuro. Nesta parte apresenta as concluses gerais do trabalho realizado e das limitaes verificadas. Apresenta-se ainda algumas situaes que se pretendia abordar mas que no foi possvel devido s condicionantes existentes. Finalmente especula-se um pouco sobre o que se poder fazer em sequncia deste trabalho e respectivas potencialidades. A quarta parte composta pelas referncias bibliogrficas.

4. Modelos Matemticos de Processos

31

4 Modelos Matemticos de Processos


4.1 Introduo
Um modelo matemtico de um sistema dinmico pode ser definido como um conjunto de equaes que represente com preciso a dinmica do sistema, ou no mnimo, com relativa preciso. Um modelo no nico para um determinado sistema. Um sistema pode ser representado nas mais diversas formas e, portanto, em diversos modelos matemticos, dependendo da perspectiva. possvel melhorar a preciso de um modelo matemtico incrementando a sua complexidade, incluindo, em alguns casos, centenas de equaes para descrever um sistema completo. Na construo de um modelo matemtico, h que ter o compromisso entre a simplicidade do modelo e a preciso dos resultados da anlise. Se no for necessrio uma preciso extrema prefervel a obteno de um modelo matemtico que se adeqe ao problema em considerao.

Sistemas lineares
Um sistema considerado sistema linear se se aplica o princpio da sobreposio. O princpio da sobreposio estabelece que a resposta produzida pela utilizao simultnea de duas diferentes funes a soma das duas respostas individuais. Uma equao diferencial linear se os coeficientes so constantes ou funes apenas das variveis independentes. Sistemas dinmicos compostos por componentes lineares invariantes no tempo podem ser descritos por equaes diferencias invariantes no tempo (coeficientes lineares constantes). A esses sistemas atribui-se o nome de sistemas lineares invariantes no tempo. Aos sistemas dinmicos representados por equaes diferenciais cujos coeficientes so funes do tempo atribui-se o nome de sistemas lineares variantes no tempo, por exemplo um sistema em movimento em que a massa total vai variando com o tempo devido ao consumo de combustvel. Um sistema no linear se o princpio da sobreposio no se aplica. Para um sistema no linear, a resposta de duas entradas no podem ser calculadas pelo tratamento das entradas individuais e somando o resultado. Em engenharia de controlo, a operao normal de um sistema no linear pode ser volta de um ponto de equilbrio, e os sinais podem ser considerados pequenos sinais volta do equilbrio. Nestes casos pode ser possvel o sistema no linear num sistema linear. Nesses caos, o sistema linear equivalente ao sistema no linear dentro dos limites da regio de operao.

4.1.1 Sistemas de controlo contnuo


A dinmica dos diversos sistemas, sejam mecnicos, elctricos, trmicos, econmicos, biolgicos, etc. pode ser descrita em termos de equaes diferenciais que podero ser derivadas a partir das leis da fsica que descrevem determinado sistema, por exemplo, leis de Newton para sistemas mecnicos e leis de Kirchhoff's para sistemas elctricos. H, no

32

4. Modelos Matemticos de Processos

entanto, que ter sempre em mente que a obteno de um razovel modelo matemtico a parte mais importante de toda a anlise. Os modelos matemticos podem assumir as mais diversas formas dependendo da particularidade do sistema e das circunstancias, um determinado modelo pode ser mais apropriado que outro.

4.1.1.1 Transformada de Laplace


A transformada de Laplace um mtodo operacional com imensas vantagens na soluo de equaes diferenciais lineares. Atravs da transformada de Laplace pode-se converter qualquer funo comum, tais como funes sinusoidais, funes exponenciais, etc. em funes algbricas de uma varivel complexa s. Operaes como diferenciao e integrao, podem substitudas por operaes algbricas no plano complexo. Deste modo, uma equao diferencial linear pode ser transformada numa funo algbrica de varivel complexa s. Em sentido contrario, se uma equao algbrica para a varivel dependente, a soluo da equao diferencial correspondente (a transformada inversa de Laplace da varivel dependente) pode ser encontrada com recurso a uma tabela de transformadas de Laplace ou com recurso a tcnicas de expanso de fraces parciais (Ogata, 1997). Uma vantagem do mtodo da transformada de Laplace o uso de tcnicas grficas para a previso do desempenho do sistema sem a necessidade de obteno da soluo das equaes diferenciais. Outra das vantagens que, uma vez resolvida a equao diferencial, tanto a componente transiente como a componente estacionria da soluo podem ser obtidas simultaneamente. Definindo-se:

f(t) s L

Uma funo do tempo t tal que f(t) = 0 para t < 0 Uma varivel complexa Um smbolo operacional que indica que indica que a quantidade que lhe sucede para ser transformada pelo integral de Laplace 0 A transformada de Laplace de f(t)

F(s)

A transformada de Laplace de f(t) ser dada por:

= =

) =

Ao processo inverso de determinar a funo no domnio do tempo f(t) partir da transformada de Laplace d-se o nome de transformada inversa de Laplace, indicado pelo smbolo operacional L-1 e pode ser determinado pelo seguinte integral de inverso: = =
+

> 0

4. Modelos Matemticos de Processos

33

A transformada de Laplace de uma funo () existe se o integral de Laplace converge. O integral convergir se () seccionalmente continua num intervalo finito no domnio > 0 e se de ordem exponencial quando t tende para infinito. Uma funo () diz-se ser de ordem exponencial se uma constante real, positiva existe tal que a funo () Tende para zero quando t tende para infinito. Funo degrau Considere-se a seguinte funo degrau:

f(t) = 0 f(t) = A

para t < 0 para t > 0


-t

onde A uma constante. De notar que este caso um caso especial da funo At , onde

= 0. A funo degrau definida em t = 0. A respectiva transformada de Laplace dada


por

=
0

No desenvolvimento deste integral, assume-se que a parte real de s maior que zero o que implica que zero. Esta funo vlida em todo o plano s excepto no plo s = 0. funo degrau com amplitude unitria (A=1) d-se o nome de degrau unitrio. A funo degrau unitrio que ocorre no ponto t = t0 frequentemente descrita como 1(t - t0). Seguindo a mesma notao, uma funo degrau de amplitude A que ocorre em t = 0 pode ser descrita como f(t) = A1(t). A transformada de Laplace da funo degrau unitrio, que nesta notao poder ser definida como

1(t) = 0 1(t) = 1
1/s ou

para t < 0 para t > 0

1() =

Fisicamente, uma funo degrau que ocorre em t = 0 corresponde a um sinal constante aplicado ao sistema instantaneamente no instante t igual a zero. Funo transladada Especial importncia tem a funo transladada dada por f(t - )1(t - ), onde 0. Esta funo zero para t < . Por definio, a transformada de Laplace de f(t - )1(t - )

34

4. Modelos Matemticos de Processos

=
0

Fazendo a mudana da varivel independente t para , onde = t , obtm-se


0

1 =

Assumindo-se que f(t) = 0 para t < 0, f()1() = 0 para < 0. Ento pode-se mudar o limite inferior de integrao de - para 0

=
0

=
0

= onde

= ()

= () =
0

Concluindo-se que 1 = , 0

Esta equao estabelece que translao da funo de tempo f(t)1(t) por (onde 0) corresponde multiplicao da transformada de F(s) por e-s. Funo pulso Considere-se a funo pulso = , 0 = 0, 0 < < 0 < 0, 0 <

Onde A e t0 so constantes. A funo pulso aqui descrita deve ser vista como uma funo degrau de amplitude A/t0 que comea em t = 0, e que sobreposta por outra funo degrau negativa, com a mesma amplitude em t = t0, isto () = 1() 1( 0 ) 0 0

A respectiva transformada de Laplace ser dada por

4. Modelos Matemticos de Processos

35 1 0 1 0 0

= = =

0 0 0
0

1 0

(4.1)

Funo impulso A funo impulso um caso limite especial da funo pulso. Considere-se a funo: () = lim 0 0 ,
0

0 < < 0 < 0, 0 <

= 0,

Se a amplitude da funo impulso for A/t0 e a durao t0, a rea abaixo do impulso ser igual a A. Como a durao t0 tende para zero, a altura for A/t0 tende para infinito, mas a rea mantm-se igual a A. A transformada de Laplace da Equao (4.1) para esta funo impulso ser dada por: 1 0 0 1 0 0 = lim 0 0 0 0 =

= lim

0 0

Assim, a transformada de Laplace da funo impulso ser igual rea subjacente funo. funo impulso cuja rea igual a um, d-se o nome funo impulso unitria ou funo delta de Dirac. A funo impulso unitria que ocorre em t = t0 denomina-se por (t t0), e satisfaz as seguintes condies: 0 = 0, 0 = ,

0 = 0

0 = 1

De salientar que tal funo com amplitude infinita e durao zero fico matemtica que no ocorre em sistemas fsicos. Se, contudo, tivermos um pulso na entrada de sistema com uma amplitude bastante grande, com uma durao bastante pequena comparada com a constante de tempo do sistema, ento pode-se aproximar o pulso de entrada a uma funo impulso.

36

4. Modelos Matemticos de Processos

O conceito de impulso bastante til na diferenciao de funes descontnuas, podendo inclusive considerar-se a funo impulso como a derivada da funo degrau unitrio 1(t - t0) no ponto de descontinuidade t = t0 ou seja 0 = 1 0

Inversamente, se a funo impulso unitrio (t t0) integrada, o resultado ser a funo degrau unitrio 1(t t0). Teorema da diferenciao real A transformada de Laplace da derivada duma funo f(t) dada por:

= ()

(4.2)

Onde f(0) o valor de f(t) em t = 0. Se todos os valores iniciais e as suas derivadas so iguais a zero, ento a transformada de Laplace da n-sima derivada de f(t) ser dada por snF(s). As demonstraes deste teorema e seguintes podem ser consultadas em (Ogata, 1997) entre outros. Teorema do valor final Se f(t) e df(t)/dt so Laplace transformveis, se F(s) a transformada de Laplace de f(t) e se lim () existe, ento:

lim = lim ()
0

Este teorema relaciona o comportamento no estado estacionrio de f(t) com o comportamento de sF(s) na vizinhana de s = 0. Este teorema aplica-se apenas se e s se lim () existe. Se todos os plos de sF(s) se situam no lado esquerdo (real(s) menor que zero) do plano complexo, o lim () existe. Se sF(s) tiver no eixo imaginrio ou direita do eixo imaginrio, sF(s) exibir, respectivamente, comportamento oscilatrio ou exponencial no domnio do tempo (t), e o lim () no existe. O teorema do valor final no se aplicar em tais casos. Suponha-se que f(t) uma funo sinusoidal, sin(t), a funo sF(s) ter plos em s = j e lim () no existe. Neste caso, este teorema no se aplica. Teorema do valor inicial Este teorema a contraparte do teorema do valor final. Atravs deste teorema pode-se obter o valor de f(t) em t = 0+. Este teorema no nos d exactamente o valor em t = 0, mas num tempo ligeiramente superior a zero. O teorema pode ser enunciado da seguinte forma. Se f(t) e df(t)/dt so ambas transformveis por Laplace e se lim () existe, ento 0 + = lim ()

4. Modelos Matemticos de Processos

37

Teorema da integrao real Se f(t) for de ordem exponencial, ento a transformada de Laplace de por () = calculado em t = 0.

() existe e dado

(4.3)

Onde F(s) = L [f(t)] e 1 0 =

Neste teorema pode concluir-se que a integrao no domnio do tempo converte-se em diviso no domnio s. Se o valor inicial do integral for zero, a transformada de Laplace do integral de f(t) dado por F(s)/s. Este teorema pode ser ligeiramente modificado para lidar com o integral definido de f(t). Se f(t) for de ordem exponencial, a transformada de Laplace do integral definido dado por: =
(4.4)
0

Onde F(s) = L[f(t)]. Teorema da diferenciao complexa Se f(t) transformvel por Laplace, ento, excepto nos plos de F(s) = ()

Onde F(s) = L [f(t)]. Este teorema conhecido teorema da diferenciao complexa. Alm disso, Em geral, = () = () ()

4.1.1.2 Funo de Transferncia


Em teoria de controlo, as chamadas funes de transferncia so normalmente utilizadas para descrever a relao entre entradas e sadas (input-output) de processos/sistemas que podem ser descritas por equaes diferenciais lineares invariantes no tempo. A funo de transferncia de um sistema de equaes diferenciais lineares invariantes no tempo definida como a razo entre a transformada de Laplace da funo de sada (funo resposta) e a transformada de Laplace da funo da entrada (funo excitao) sob a hiptese de que todas as condies iniciais so nulas. Considere-se o sistema linear invariante no tempo descrito pela seguinte equao diferencial:

38

4. Modelos Matemticos de Processos

1 + 1 1 + + 1 + 1 = 0 + 1 1 + + 1 +

(4.5)

Em que y a sada do sistema (output) e x a entrada (input). A funo de transferncia do sistema obtm-se tomando-se as transformadas de Laplace de ambos os membros da equao (4.5), sob a hiptese de que todas as condies iniciais so nulas, ou seja = = [] []

() 0 + 1 1 + + 1 + = () 0 + 1 1 + + 1 +

Com recurso ao conceito de funo de transferncia possvel representar a dinmica de um sistema por equaes algbricas no domnio s. Se a mais alta potncia de s no denominador da funo de transferncia for igual a n, o sistema diz-se de n-sima ordem. Como exemplo, considere-se o exemplo tpico usado em teoria de controlo, o sistema mecnico linear massa-mola-amortecedor (Figura 4-1). A fora externa u(t) a entrada do sistema e o deslocamento x(t) da massa, medido a partir da posio de equilbrio na ausncia da fora externa, a sada. Este um sistema de entrada simples e sada simples, de segunda ordem. Para se obter a funo de transferncia, executa-se os seguintes passos: 1. Escrever a equao diferencial para o sistema 2. Tomar a transformada de Laplace da equao diferencial, assumindo todas as condies iniciais nulas 3. Tomar a razo da sada X(s) para a entrada U(s).

Figura 4-1 -Sistema massa-mola-amortecedror

A equao diferencial do sistema + + =

4. Modelos Matemticos de Processos

39

Tomando a transformada de Laplace de ambos os membros desta equao, admitindo todas as condies iniciais nulas, obtm-se 2 + + = () Onde X(s) = L [x(t)] e U(s) = L[u(t)]. A funo de transferncia ser ento dada por () 1 = () 2 + +

4.1.1.3 Funo Resposta ao Impulso


Suponha-se que, para um sistema linear, invariante no tempo, a funo de transferncia dada por =

Onde e so respectivamente as transformadas de Laplace da entrada e da sada do sistema. Ento a sada pode ser formulada como o produto de com =
(4.6)

Integral de Convulso A multiplicao no domnio complexo equivalente convulso no domnio do tempo, e portanto a transformada inversa de Laplace da equao (4.6) dada pelo integral de convulso

=
0

=
0

Onde = para < 0. Se 1 () e 2 () so funes bem comportadas continuas e de ordem exponencial, ento

= 1 2

(4.7)

onde 1 = 2 = (Ogata, 1997)

= =

40

4. Modelos Matemticos de Processos

Resposta ao impulso Como a transformada de Laplace da funo impulso unitrio a unidade, a transformada de Laplace da resposta ao impulso unitrio de um sistema, quando as condies unitrias so nulas ser simplesmente = () A respectiva transformada inversa de Laplace a funo resposta ao impulso, que tambm a funo de transferncia do respectivo sistema = () = () Esta funo tambm chamada a funo peso do sistema. Assim, a funo de transferncia e a funo resposta ao impulso unitrio de um sistema linear invariante no tempo contm a mesma informao sobre a dinmica do sistema. possvel assim obter a informao completa sobre as caractersticas dinmicas do sistema. Suponha-se que um sistema, cuja resposta ao impulso unitrio (), tem uma entrada descrita por uma funo (). Suponha-se ainda que a entrada se inicia em = 0 e dura at 1 . A entrada () pode ser aproximada por uma sequncia de N funes pulso cuja durao 1 = 1 . Se 1 suficiente pequeno quando comparado com a menor constante de tempo do sistema, ento 0 k-simo pulso pode ser considerado como um impulso cuja magnitude a rea 1 1 . A resposta ao k-simo pulso no instante t ser dada pelo produto da rea do impulso e a funo resposta ao impulso atrasada de 1 1 1 ( 1 ) Como o sistema linear, aplica-se o princpio da sobreposio, pelo que a resposta (), do sistema no instante t, sequncia das N funes pulso ser dada pela soma de convulso
1

=
0

1 ( 1 ) 1

(4.8)

onde = 0 para < 0. Se tirarmos o limite, 1 0 (ou ), ento a resposta do sistema ser dada pelo integral de convulso

=
0

( )

(4.9)

4.1.1.4 Representao em espao de estados


Uma representao em funo de transferncia (representao externa) permite encontrar uma expresso analtica que relaciona as duas variveis do sistema, mas no descreve o que se passa em termos das outras variveis externas. A teoria de controlo moderno contrasta com a teoria convencional no sentido de que a primeira aplicvel a sistemas MIMO caracterizados por entradas mltiplas e sadas mltiplas (multi-input/multi-output), que podem ser lineares ou no-lineares, invariantes ou variantes no tempo. Esta nova abordagem (representao interna) baseada no conceito de estado.

4. Modelos Matemticos de Processos

41

A ideia chave que dever ser possvel encontrar um conjunto mnimo de variveis que caracteriza o estado de um sistema dinmico num determinado instante t. A evoluo no tempo desses estados dever ser suficiente para determinar completamente o comportamento do sistema (Botto, Controlo ptimo, 2007). Estado O estado de um sistema o menor conjunto de variveis (chamadas variveis de estado) tal que, o conhecimento destas variveis no instante t = t0, juntamente com o conhecimento das variveis de entradas nos instantes t t0, determina completamente o comportamento do sistema em qualquer instante t t0. Assim, o estado de um sistema dinmico no instante t univocamente determinado pelo estado no instante t0 e pela entrada para t t0, e independente do estado e da entrada antes de t0 (Ogata, 1997). O conceito de estado aplicvel no s a sistemas fsicos, mas a qualquer outro tipo de sistema, nomeadamente, a sistemas biolgicos, econmicos, sociais etc. Variveis de estado As variveis de estado de um sistema dinmico so as variveis constituintes do conjunto mnimo de variveis que determinam o estado do sistema dinmico. As variveis de estado, por definio, no necessitam de ser mensurveis ou observareis, e esta liberdade de escolha uma vantagem do mtodo do espao de estados. No entanto, de todo conveniente escolher, se possvel, grandezas facilmente mensurveis para variveis de estado porque a estratgia de controlo ptimo requer a realimentao de todas as variveis de estado. Vector de estado o conjunto das n variveis de estado necessrias para descrever completamente o comportamento de um dado sistema dispostas na forma vectorial. Um vector de estado portanto um vector que determina univocamente o estado x(t) para qualquer instante t t0, uma vez conhecido o estado no instante t = t0 e a entrada u(t) para t t0. Espao de estados Espao n-dimensional constitudo pelos eixos x1, x2, , xn onde podem ser representados os vectores de estados. Qualquer estado pode ser representado por um ponto no espao de estados. Equaes do espao de estados No espao de estados temos trs tipos de variveis: 1. Variveis de entrada 2. Variveis de sada 3. Variveis de estado A representao por espao de estados para um determinado sistema no nica, mas o nmero de variveis de estado o mesmo para qualquer das diferentes representaes do mesmo sistema.

42

4. Modelos Matemticos de Processos

A dinmica do sistema deve envolver elementos que memorizem os valores de entrada para t t1, em sistemas de controlo contnuo, os integradores funcionam com dispositivos de memria, sendo que a sada de tais integradores podem ser consideradas como as variveis que definem o estado interno da dinmica do sistema. Nesta perspectiva, as sadas dos integradores comportam-se como variveis de estado. O nmero total de variveis que definem completamente a dinmica do sistema igual ao nmero de integradores que definem o sistema. Considere-se um sistema MIMO com n integradores, contendo r entradas, u1(t), u2(t) ,, ur(t), e m sadas y1(t), y2(t) ,, ym(t). Definindo-se as n sadas dos integradores como variveis de estado: x1(t), x2(t) ,, xn(t). Ento o sistema pode ser descrito por 1 = 1 1 , 2 , , , 1, 2 , , 2 = 2 1 , 2 , , , 1, 2 , , = 1 , 2 , , , 1, 2 , , As sadas do sistema y1(t), y2(t) ,, ym(t) podem ser descritas na forma 1 = 1 1 , 2 , , , 1, 2 , , 2 = 2 1 , 2 , , , 1, 2 , , = 1 , 2 , , , 1, 2 , , Definindo-se () () = , () () () = , () 1 1 , 2 , , , 1, 2 , , , , , = 2 1 , 2 , , , 1, 2 , , 1 , 2 , , , 1, 2 , , 1 1 , 2 , , , 1, 2 , , , , , = 2 1 , 2 , , , 1, 2 , , , 1 , 2 , , , 1, 2 , , = () ()

(4.10)

(4.11)

()

Ento as equaes (4.10) e (4.11) podem ser escritas na forma compacta = , , = (, , )


(4.12) (4.13)

Onde a equao (4.12) a equao de estado e a equao (4.13) a equao de sada (resposta). Se a funo vector e/ou envolvem explicitamente o tempo, ento o sistema dito um sistema variante com o tempo. Se as equaes (4.12) e (4.13) forem linearizadas numa vizinhana do estado operativo, tem-se as equaes de sada e de estado linearizadas

4. Modelos Matemticos de Processos

43
(4.14) (4.15)

= + () = () + ()u(t)

Onde A() a matriz de estado, B() a matriz de entradas, C(), a matriz de sada e D() a matriz de transmisso directa. Um diagrama de blocos das equaes (4.14) e (4.15) est representado na Figura 4-2. Se as funes e no envolvem explicitamente o tempo, diz-se que o sistema um sistema invariante no tempo. Neste caso, as equaes (4.14) e (4.15) adquirem a forma = + () = () + u(t)
(4.16) (4.17)

D(t)

u(t)

B(t)

()
+ +

x(t)

C(t)

y(t)

A(t)
Figura 4-2 Diagrama de blocos de um sistema linear contnuo representado em espao de estados

4.1.2 Sistemas discretos


Uma funo temporal discreta xT(t) gerada a partir de uma funo continua x(t) por amostragem peridica com um perodo de amostragem T0 pode definir-se por

= 0 = 0

= < < +

= , , ,

(4.18)

Vrios mtodos de gerar funes discretas so apresentados nos exemplos que se seguem. Considere-se a x(t) = e-t. Se se retirarem valores desta funo em intervalos de tempo constantes, t = kT0, esta converte-se numa funo discreta 0 = 0 = , , ,

Integrao O integral de uma funo (no elementar)

44

4. Modelos Matemticos de Processos

1 1

Pode ser calculado numericamente por aproximao a uma funo em escada: 1 = 1


1

0 0
=0

Neste caso, a rea do rectngulo k calculada multiplicando o valor (constante) do perodo de amostragem T0, pelo valor da funo no instante k-1, ou seja, Ak = w(k-1)T0 (funo escada e atraso). Calculando este integral um passo frente, obtm-se: 1 = 1

+ 1 0

0 0
=0

Subtraindo as duas equaes resulta na relao recursiva

+ =

Se substituirmos kT0, se definirmos a1 = -1 e b1 = T0/T1, retardando um perodo, obtm-se: + = Que uma equao s diferenas de primeira ordem. Se funes de tempo discreto, que dependem de outras funes de tempo discreto, podem ser escritas de forma recursiva, ento obtm-se equaes s diferenas. Uma equao s diferenas de ordem m dada por + + + = + + + O valor corrente da sada no instante t pode ser determinado recursivamente = + + + +

(4.19)

(4.20)

se forem conhecidos os valores das entradas (inputs) actuais e passados, e os valores das sadas (outputs) passadas.

4. Modelos Matemticos de Processos

45

4.1.2.1 Equaes s diferenas de equaes diferenciais


As equaes s diferenas tambm podem ser obtidas pela discretizao de equaes diferenciais. Neste caso, um diferencial de primeira ordem aproximado pela diferena de primeira ordem, um diferencial de segunda ordem pela diferena de segunda ordem, etc. Para discretear equaes diferenciais sero utilizadas as seguintes aproximaes + + +

(4.21)

Discretizao de um diferencial Uma equao diferencial de primeira ordem dada por 1 + = 1 w t

Aplicando (4.21) obtm-se 0 x(k) + 1 k 1 = b0 w k Com 0 = 1 + 1; T0 = ; =

A equao (4.19) a forma normalizada de uma equao s diferenas. A forma correspondente para uma equao diferencial resulta a partir da introduo das diferenas de ordem n + 1 1 + + 1 + = + + 1 + 0 ()

4.1.2.2 Trem de impulsos


Um expediente matemtico para tratamento de funes em tempo discreto obtm-se se o trem de pulsos xp(t) aproximado por trem de impulsos -dirac (Isermann, 1989), onde a funo -dirac definido (ver acima Funo impulso) por

46

4. Modelos Matemticos de Processos

0, ,

0 = 0

(4.22)

Deste modo, um sinal amostrado pode ser definido por um trem de impulsos = 0 + 0 0 + 20 20 + ou

=
=0

0 0

(4.23)

4.1.2.3 Transformada de Laplace de funes temporais discretas


A transformada de Laplace aplicada funo -dirac resulta (ver 4.1.1.1)

=
0

= 1

(4.24)

Se aplicado a impulsos deslocados 0 = 0 1


(4.25)

Se aplicado a um trem de impulsos (4.23) (relembrar que para uma funo transladada no tempo:

= () (Funo transladada, acima))

= =
=0

0 0 1

(4.26)

De notar que esta transformada de Laplace contm a dimenso s. A transformada de Laplace duma funo discreta 0 surge ento peridica com frequncia 0 = 2 0 (Isermann, 1989) Teorema da amostragem de Shannon Para cobrir um sinal continuo, de banda limitada, com uma frequncia mxima max com um sinal discreto, a frequncia de amostragem ter que ser tal que (Isermann, 1989) 0 > 2 0 <
(4.27)

Deve ser mencionado que sinais contnuos de banda limitada, na realidade, no surgem apenas para sistemas de controlo. Contudo, em sistema de controlo a frequncia de amostragem tem um papel fundamental, de modo a cobrir a dinmica do sistema. Se, por exemplo, o perodo de amostragem for superior constante de tempo do processo, o sinal

4. Modelos Matemticos de Processos

47

amostrado no evidencia a dinmica do sistema, ou seja, no existe correlao entre sucessivos valores amostrados (Montgomery, 2001). Elementos de reteno Um amostrador definido pela equao (4.18). Se um amostrador seguindo por um retentor de ordem zero (ZOH - zero order hold), que retm o sinal amostrado (0 durante um perodo de amostragem, ento resultar um sinal em escada (Figura 4-3).

x*

ZOH

x*

t
Figura 4-3 - Amostrador com zero-order hold

A funo de transferncia de um retentor de ordem zero dada por (Isermann, 1989) = () 1 = 1 0 ()


(4.28)

O ZOH pode ser modelado como integrador que tem apenas efeito durante um perodo. A sua resposta ao impulso corresponder a um pulso de altura 1 e durao T0.

4.1.2.4 Transformada Z
A transformada a ferramenta ideal para lidar com sistemas discretos. A transformada da necessidade de eliminar o termo irracional 0 na equao (4.26), que resulta sempre que se aplica a Transformada de Laplace a um sinal descrito por um trem de impulsos. Se definirmos = 0 = 0 = 0
+

= 0 0 + 0 1 ln () 0

(4.29)

Inserindo em (4.26), obtm-se a transformada de x(t)

48

4. Modelos Matemticos de Processos

= 0

=
=0

0 1

= 0 + 0 1 + 20 2 + 1 Resultando a definio geral de Transformada de um sinal:

=
=0

0 1

(4.30)

De notar que, tal como a transformada de Laplace, a transformada tambm contm a dimenso s. A definio (4.30), apenas faz sentido se () converge. Se 0 uma funo limitada, () converge para = 0 > 1. Por vezes denomina-se z de operador de avano e z-1 o operador de atraso, devido associao: 1 0 , 2 20 , . Geralmente, Y(z) uma srie infinita. Muitas funes podem contudo, ser representadas de forma fechada se usarmos as propriedades das series de potencias. Funo degrau Suponha-se a funo degrau: = , 0, = 0,1,2, = 1, 2,

= + 0 + 2 20 + A transformada Z desta funo resulta 2 3 = 1 + + 2 + 3 + =


=0

Sendo esta ultima expresso uma srie geomtrica de razo , pode ser descrita de acordo com a forma fechada = 1 = 1 1

Neste caso, se = 1, y* corresponde ao degrau unitrio amostrado com periodo T0, e portanto possvel escrever directamente da tabela de transformadas Z (Isermann, 1989): 1 = 1

4.1.2.5 Teoremas da Transformada


Seguidamente enumeram-se alguns teoremas da transformada . As respectivas demonstraes podem ser consultadas em (Isermann, 1989) entre outros.

4. Modelos Matemticos de Processos

49

Linearidade 1 + 2 = 1 + 2
(4.31)

Mudana (shifting) Mudana para a direita perodos de amostragem 0 (mudana no passado) = 0


(4.32)

Mudana para a esquerda perodos de amostragem 0 (mudana no futuro)


1


=0

(4.33)

Na mudana para a esquerda os valores da funo original no mudada () desaparecem para = 0,1, , 1 porque a transformada apenas est definida para > 0. Exemplo (funo degrau) 1 + 3 Amortecimento 0 = 0 0
(4.34)

= 3

1 + 1 + 2 1

Valor inicial (0) = lim (0 ) = lim ()


0

Valor final

lim (0 ) = lim

1 () = lim 1 () 1 1

Apenas vlido se o valor final existe.

4.1.2.6 A transformada inversa


Ao contrrio da transformada de Laplace, a transformada inversa no nica. A transformada inversa aplicada a resulta em
1

0 ()

Pelo que apenas os valores mltiplos dos instantes de amostragem so coincidentes com os valores de () (Botto, Controlo de Sistemas, 2007) Para derivar a transformada inversa, recorre-se ao facto de () e consequentemente ser peridica com 0 = 2 0 e ainda simtrica em relao ao eixo real do plano s. Esta a

50

4. Modelos Matemticos de Processos

razo pela qual () tem de ter a operao transformada inversa aplicada apenas ao domnio 0 + 0 . Existem vrios mtodos de aplicar a transformada inversa: 1. Mtodo da expanso em fraces parciais 2. Mtodo da diviso polinomial 3. Mtodo da frmula inversa Os dois ltimos so bastante trabalhosos. O mtodo da expanso em fraces consiste na seguinte sequncia de operaes: 1. Dividir () por z: . 2. Expandir em fraces parciais. 3. Multiplicar por as fraces obtidas no ponto anterior. 4. Consultar a tabela de transformadas e aplicar a transformada inversa.

4.1.2.7 Funo de transferncia discreta


Para controlar os processos recorrer-se a medies peridicas s respectivas entrada e sada, o que implica a necessidade de introduo dos respectivos amostradores (samplers), como esquematizado na Figura 4-4. T0 u(t) u(k)
G(s) g(t)
y

T0 y(t) u(k)

Figura 4-4 - Processo linear com amostradores de entrada e sada

Um amostrador entrada de um sistema linear opera com funo de transferncia () ou resposta ao impulso (). A entrada do sistema ento descrita pelo trem de impulsos

=
=0

0 0

(4.35)

Com a resposta ao impulso (), a sada () ser dada pelo somatrio de convulso (ver Resposta ao impulso)

=
=0

0 0

(4.36)

Se os amostradores de entrada e sada esto sincronizados, ento, para = 0 resulta

4. Modelos Matemticos de Processos

51

=
=0

0 0 0
=0

(4.37)

Tal como o integral de convulso para sistemas contnuos, a sada do sistema no instante 0 dada pelo somatrio de convulso de 0 e 0 . Introduzindo a transformada de Laplace (4.26), sada do sistema, 0 (4.37), resulta

descrita por

=
=0

0 0

=
=0 =0

0 0 0

(4.38)

E substituindo = = +

=
= =0

0 0 0 0

=
=0

0 =0

0 0

(4.39)

Considerando que 0 = 0 para < 0. Consequentemente, a transformada de Laplace () da entrada pode ser expresso como um factor separado e, tal como nos sistemas contnuos, a funo de transferncia ser dada por = =

0 0
=0

(4.40)

Substituindo = 0 conduz-nos funo de transferncia no domnio z = =

0 =
=0

(4.41)

Consequentemente, a funo de transferncia no domnio z a relao entre a transformada z da sada amostrada e a transformada z da entrada amostrada que coincide com a transformada z da funo resposta ao impulso. Se o amostrador seguido por um retentor (Figura 4-5), ento tem-se que

52

4. Modelos Matemticos de Processos

= () Para um retentor de ordem zero (ver Elementos de reteno) 1 0 () () () = 0 () 1 () =

(4.42)

() =

= 1 1

(4.43)

T0 u(t) u(k) H(s)


u

T0 m(t)
G(s) g(t)
y

y(t)

u(k)

Figura 4-5 - Processo linear com retentor e amostradores de entrada e sada

Se a descrio de um sistema linear est na forma de equao s diferenas (equao (4.19)), ento poder ser escrita na forma + + + = + + +

(4.44)

Aplicando directamente a propriedade de mudana (shifting) para o lado direito atraso, tem-se + + + = + + + () Conduzindo-nos directamente para a funo de transferncia no domnio z = () + + + = = () + + + (4.45)

4.1.2.8 Determinao da equao s diferenas a partir de G(z)


Por outro lado, de acordo com as tabelas da transformada z, a funo de transferncia genrica dada na forma (Isermann, 1989): () + + + = () + + + + Desenvolvendo, possvel obter a equao s diferenas correspondente =

4. Modelos Matemticos de Processos

53

+ + + = () + + + + Dividindo ambos os membros por + + + + = () + () + + () Aplicando a propriedade de mudana (shifiting), 0 = ()

+ + + ( ) = () + + + ( ) Onde = 0 , com = , 1,2, correspondente aos instantes de amostragem. Se por outro lado considerar-se 0 como um instante unitrio 0 = 1 ento tem-se + + + + ( ) = () + + + ( ) Ou seja, a equao s diferenas genrica dada por = + () + + + ( ) Introduzindo o operador de atraso definido como: resulta = , ou =

= + + + + + + + () + + + () = + + + + ()

4.1.2.9 Propriedades da funo de transferncia z e equaes s diferenas


Comportamento Proporcional Para processos com comportamento proporcional, o ganho obtm-se recorrendo ao teorema do valor final lim 1 () () = 1 = lim 1 () lim 1 ()
1

= lim =
1

0 + 1 + + 1 + 1 + +

(4.46)

54

4. Modelos Matemticos de Processos

Comportamento Integral No domnio s, o comportamento integral descrito por = 1 1 , directamente da tabela da transformada z verifica-se que =
1 1

1 1 1

1 1 1 1

. Ou seja,

processos com comportamento integral tm um plo em = 1 = () + + + = () + + +


(4.47

O gradiente estado estacionrio aps uma entrada em degrau de altura 0 ser descrito por

lim () = lim ( 1)

= lim
1


(4.48)

0 + 1 + + 1 + 1 + + 0

Se 0 0 ento o sistema tem um salto descontinuo em = 0. Contudo, na maioria dos processos reais 0 = 0 (Isermann, 1989). Realizabilidade Um sistema descrito por uma funo de transferncia discreta realizvel se o principio da causalidade satisfeito, ou seja, se a varivel de sada () no depende de valores futuros da entrada + , = 1,2, . Assim, necessrio que a sada do sistema no instante , (), seja funo apenas de valores passados da sada e de valores passados e/ou actuais da entrada, ou seja, a ordem do numerador de () tem que ser maior ou igual ordem do denominador de ().

4.1.2.10

Estabilidade

Considere-se o processo linear continuo descrito por = () + + + + = = () + + + + (4.49)

Para o correspondente processo amostrado, de acordo com 3.4 de (Isermann, 1989), com ou sem ZOH, a funo de transferncia em z na forma racional ser dada por = () + + + = = () + + + (4.50)

E aps re-arranjo >

4. Modelos Matemticos de Processos

55

= =

+ + + + + + (4.51)

As razes , = 1, 2, , do polinmio do denominador = 0, so os plos e as razes 0 , = 1, 2, , do polinmio do numerador = 0 so os zeros da funo de transferncia z. Deste modo os plos descrevem o comportamento modal do processo e dependem dos seus acoplamentos internos, pelo que so relevantes para a estabilidade. Os zeros indicam como que a varivel de entrada afecta as variveis internas e como estas, por seu lado, influenciam a varivel de sada (Isermann, 1989). (Botto, Suplemento de Sebenta de Controlo de Sistemas, 2007) e (Isermann, 1989) mostram detalhadamente que um sistema discreto estvel se todos os plos pertencerem ao interior do circulo unitrio, isto , se o modulo de todos os plos de ( for inferior a 1 < 1, = 1, , Se existir pelo menos um plo sobre o circulo unitrio com multiplicidade unitria, isto , = 1, e no existirem plos instveis, o sistema est no limite de estabilidade. O sistema instvel se existir pelo menos um plo fora do circulo unitrio, ou seja, se existir um plo com modulo superior a 1 > 1 ou se existirem plos sobre o circulo unitrio com multiplicidade superior a 1.

4.1.2.11

Representao em espao de estados

Para processos com comportamentos complicados e para processos multivariados, os modelos de espao de estados so normalmente mais adequados. Ao contrrio da representao por funo de transferncia, a representao por variveis de estado, para alm da relao entre a entrada e sada, descreve o comportamento e inter-relao das variveis internas, funcionando como variveis de memria do sistema. Existem vrios mtodos possveis para determinar as variveis de estado. Um dos mtodos consiste na transformao do sistema continuo descrito por (4.16)(4.16) e (4.17) recorrendo introduo de ZOH entrada e amostradores entrada e sada (Isermann, 1989). Seguidamente apresenta-se um mtodo por substituio directa na equao s diferenas. Se um modelo descrito por equaes s diferenas existe para um determinado processo, ento a representao de estados pode derivar-se pela introduo das variveis de estado. A partir da equao s diferenas (4.44) e substituindo k por k+n obtm-se + + + + + = + + + + +

(4.52)

Para simplificar faz-se = . O caso para pode sempre ser tido em conta pondo ao parmetros a zero.

56

4. Modelos Matemticos de Processos

Baseado nos seguintes pressupostos 1. No presente instante , as sadas + 1 , , ( + 1) so utilizadas como variveis de estado. 2. Com o incremento do instante para + 1, + 1 para + 2 , ou seja () assume o valor de ( + 1), ( + 1) o valor de ( + 2), etc. Conduzindo-nos a que 1 + 1 = 2 () e 2 + 1 = 3 () Pode Introduzir-se as seguintes variveis de estado () = () = () = () = () = ( + ) = ( + ) = ( + ) = ( + )
(4.54) (4.53)

+ + + ( + )

Substituindo (4.54) em (4.52) e fazendo = 1 e 0 = 1 = = 1 = 0 obtem-se + = + = + ()


(4.55)

A partir de (4.54) e (4.55) tira-se a equao vectorial s diferenas que consiste na representao de estado da equao s diferenas + + + + = + ()

(4.56)

E a respectiva equao de sada

() =

(4.57)

Com a introduo de um vector de estado , uma matriz sistema em tempo discreto, um vector de controlo e um vector de sada ( + ) () = + () = ()
(4.58) (4.59)

4. Modelos Matemticos de Processos

57

Se as duas ltimas equaes so resolvidas de forma sequencial, a equao (4.59) poder ser reescrita numa forma mais expedita ( + ) = ( + )
(4.60)

Estes resultados forma determinados com os pressupostos de que = 1 e 0 = 1 = = 1 = 0, o que corresponde funo de transferncia = + + + = ()
(4.61)

Se, contudo, na equao (4.52), 1 e 0 , 1 , , 1 0, a equao (4.61) toma a forma = + + + + + +

= + () + + () ou = + ( + ) + + ( + ) Da equao (4.54) resulta = + () + + () + ( + ) Substituindo o termo ( + ) dado pela equao (4.55) obtm-se finalmente = + () + + () + + () = + + + + () ou em notao vectorial
(4.64) (4.63) (4.62)

+ ()

(4.65)

= + () Para o caso em que 0 = 0 esta equao toma a forma

58

4. Modelos Matemticos de Processos

Esta escolha de variveis de estado referida como Forma cannica de controlabilidade. possvel obter diversas representaes em espao de estado equivalentes, da forma ( + ) = + () () = + () Considerando a transformao linear e no singular, , tal que = (), resulta ( + ) = + () () = + () onde = = = =

As formas cannicas possveis so casos particulares de transformaes lineares a que correspondem estruturas especficas para as matrizes , e (Botto, Controlo ptimo, 2007), (Isermann, 1989), salientando-se 1. Forma cannica de controlabilidade. 2. Forma cannica de observabilidade. 3. Forma cannica do controlador. 4. Forma cannica do observador. 5. Forma cannica de Jordan (ou modal).

4.1.2.12

Determinao do modelo do processo

Os modelos matemticos do processo podem ser determinados com recurso a anlises tericas ou experimentais. Na anlise terica os modelos so determinados pelas equaes de balano, equaes de estado e leis fenomenolgicas. Uma vez determinadas, em geral um sistema de equaes diferenciais que conduzem a modelos tericos de processos que estrutura e parmetros determinados, podem ento ser resolvidas explicitamente.

4. Modelos Matemticos de Processos

59

No caso da anlise experimental dos processos o modelo matemtico determinado com recurso a medies. Os valores de entrada e sada so avaliados de modo a que se estabelea um modelo matemtico entre eles. O modelo pode ser no paramtrico, por exemplo uma funo transiente da resposta em frequncia na forma tabular, ou paramtrico, por exemplo uma equao diferencial ou equao s diferenas. Para os modelos no paramtricos recorre-se avaliao das medies com recurso a anlise de Fourier ou anlise de correlao, ao passo que para os modelos paramtricos utilizam-se mtodos de identificao tais resposta ao degrau ou resposta em frequncia ou por estimao de parmetros. Para identificao de modelos paramtricos discretos, os mtodos de estimao de parmetros so especialmente adequados. Para processos invariantes no tempo, assumemse modelos da forma =

()

(4.66)

Em que os parmetros desconhecidos do processo e possivelmente tambm dos distrbios so estimados baseado nas medidas de () e () (Isermann, 1989). Para estimar os parmetros usam-se mtodos tais como mnimos quadrados, variveis instrumentais, mxima verosimilhana, na forma no recursiva ou recursiva.

4.2 Modelos de Series Temporais


No ponto 4.1 acima foi possvel conclui-se que a dinmica de processo pode ser modelada atravs de equaes s diferenas. Pde ainda concluir-se que os processos, quando amostrados com uma periodicidade adequada, reflectem a sua dinmica atravs de dados autocorrelacionados, que por sua vez podem ser modelados com recurso a equaes s diferenas. (Box & Jenkins, Time Series Analysis: Forecasting and Control, 1970) props a uma classificao para modelos estocsticos de equaes s diferenas chamado ARIMA (autoregressive integrated moving average) composto por trs componentes que correspondem s siglas AR, I e MA. Nesta classificao, a estrutura do modelo identificada pela sigla ARIMA(p,d,q) onde p a ordem da componente auto-regressiva, AR, do modelo, q ordem da componente mdia mvel, MA, do modelo e d o grau de diferenciao necessrio para se obter a estacionaridade do processo. Um modelo ARIMA pode ser ento descrito pela seguinte estrutura de equao s diferenas + + +

+ + +

(4.67)

Em que considerado rudo branco ()~(0, ^2 ) . De notar que esta apenas uma variante, uma vez que a notao, a localizao e consequentemente o sinal dos coeficientes podem mudar conforme os autores e/ou objectivos do desenvolvimento.

60

4. Modelos Matemticos de Processos

A designao MA resulta de se considerar neste modelo o rudo branco ponderado pelos coeficientes do polinmio . Esta ponderao entendida como uma mdia pesada de ao longo do tempo, e portanto no nula, justificando assim a designao de mdia mvel. Se o modelo no contiver uma ou duas das trs componentes do modelo, o nome do termo e a correspondente ordem desaparecem do modelo. Por exemplo, um processo com uma estrutura ARIMA(0,1,1) pode designar-se por processo IMA(1,1). Estes modelos mostramse bastante teis para construir modelos de funes de transferncia de sistemas que se pretendem controlar ou ajustar na presena de rudo correlacionado, possivelmente no correlacionado (Del Castillo, 2002).

4.2.1 Modelos Autoregressivos


Um modelo autoregressivo puro, ARIMA(p,0,0) ou AR(p), representado na forma (4.67), depois de retiradas as componentes I e MA apresenta a forma + + + =

Rearranjando os termos e adaptando a notao (Del Castillo, 2002) e (Box, Jenkins, & Reinsel, 2008) em que e = + + + + + Onde os so os parmetros e uma sequncia de rudo branco, ou seja, um processo estocstico. Este modelo pode tambm ser descrito na forma matricial

= + A diferena deste modelo para um modelo de regresso linear, em que aparece no papel do parmetro de intercepo, que os regressores so variveis desfasadas no tempo (lagged) do mesmo processo, da o nome de modelo autoregressivo. Se os parmetros so de forma tal a que o processo tenha comportamento estacionrio (sem tendncia) ento o valor de coincide com a mdia do processo, ou seja, definindo = , pode escrever-se = + + + + = + Definindo-se = 1 1 2 2 , (4.69) pode ser escrita na forma
(4.68)

4. Modelos Matemticos de Processos

61

(4.69)

De acordo com o ponto 4.1.2.10, fazendo a equivalncia entre no domnio e o operador no domnio do tempo, um processo AR(p) estacionrio se e s se estacionrio, o que significa que todas as suas razes se encontram estritamente fora do ciclo unitrio no domnio plano complexo . Os critrios de estacionaridade esto directamente indexados ao posicionamento das razes do polinmio caracterstico no plano , ou como est muito bem documentado em (Ogata, 1997), (Isermann, 1989) ou (Botto, Suplemento de Sebenta de Controlo de Sistemas, 2007). Para se ter uma ideia intuitiva sobre esta matria tome-se como exemplo o processo descrito por (4.66). Se se fizer = 0, = 0, = 1 e = 1 obtm-se o processo AR(p) ( ) =

()

(4.70)

Multiplicando ambos os membros por ( ) =


()

De acordo com o ponto 4.1.2.10, o processo estacionrio se as razes de = 0 ou se encontram dentro do ciclo unitrio, ou seja se 0. Passando (4.70) para o domnio o mesmo processo passa a ser descrito na forma = = =
(4.71)

Com = e o nico zero de dado = = /. Ou seja, de acordo com o ponto 4.1.2.10, tem que estar no ciclo unitrio, pelo que / tem que ser maior que zero. Este critrio pode ser facilmente visionado do seguinte modo: expandindo (4.71) tem-se sucessivamente = + = + = + = + Substituindo (4.73) em (4.72) sucessivamente = + + = + +
(4.72) (4.73)

62

4. Modelos Matemticos de Processos

= + + + = + + +

= +

+ + + = +
=

Fazendo-se tender para infinito e condies iniciais nulas 0 = 0


=
=

=
=

Ou seja, est-se perante uma srie geomtrica que convergente apenas se e s se < 1.

4.2.1.1 Momentos de um processo AR(p)


O valor esperado de um processo AR(p) estacionrio dado por = = + + + + + Sendo rudo branco, o seu valor esperado nulo. Se = , qualquer que seja , e sendo uma constante, ento tem-se que

= + + + + = +
=

Resolvendo em ordem a , obtem-se


=

Autocovarincia e Autocorrelao de um processo AR(p) Para determinar a autocovarincia tira-se o valor esperado do produto de cada elemento do processo (4.68) por = = + + + + = + + + +

4. Modelos Matemticos de Processos

63

Como o ultimo termo da direita nulo, uma vez que se trata duma sequncia de termos independentes e identicamente distribudos (IID). Desta ultima equao e da definio de autocovarincia (Autocovarincia e Autocorrelao, pag.26) obtm-se a funo de autocovarincia = + + + Dividindo por 0 obtm-se a funo autocorrelao = = + + + = 0, 1, 2, 3,
(4.75)

= 0, 1, 2, 3,

(4.74)

Verifica-se que tanto a funo autocorrelao como a funo autocovarincia obedecem mesma estrutura de equao s diferenas. Para um processo estacionrio, isto significa que a autocorrelao ser eventualmente zero para valores de relativamente elevados. Digamos que para processos estacionrios AR(p), a funo autocorrelao decai exponencialmente (tails off). De facto, o decaimento depende da soluo da equao s diferenas para o processo AR(p), onde se pode frequentemente verificar um comportamento oscilatrio, mas o decaimento de ser contudo exponencial (Del Castillo, 2002). As equaes (4.75) para = 1, 2, 3, , so conhecidas como equaes de Yule-Walker. Estas equaes so utilizadas para estimar os coeficientes recorrendo a estimativas dos valores de autocorrelao = . Reescrevendo todas as equaes (4.75), substituindo os valores da autocorrelao pelas estimativas e tendo em conta que = , tem-se 1 2 = + + + + = + + + +

1 = + + + + = + + + +

Que pode ser escrito na forma compacta

Relembrando que 0 = 1 resulta

64

4. Modelos Matemticos de Processos

ou de forma sucinta =
(4.76)

Note-se que se trata de sistema bem comportado com a matriz R dos coeficientes quadrada e vector das incgnitas de rank completo. Mais ainda, R uma matriz simtrica e de rank completo, de modo que a invertibilidade est garantida. Tem-se ento que uma estimativa dos coeficientes pode ser determinada atravs do clculo = Varincia de um processo AR(p) A varincia de um processo AR(p) obtm-se atravs da equao (4.74) fazendo = 0 = + + + + Onde, neste caso, o ultimo termo contm o valor esperado do produto de duas variveis aleatrias que tem uma varivel de erro comum , pelo que ser diferente de zero:

(4.77)

= = + + + + =
=

Dividindo ambos os membros por 0 = 2 obtm-se aps manipulao = =

(4.78)

4.2.1.2 Funo Autocorrelao Parcial


Quando se tenta identificar um processo a partir de uma srie temporal, numa primeira fase, ser necessrio estimar a ordem p do processo autoregressivo. A funo de autocorrelao parcial um dispositivo que explora o facto de, apesar de um processo AR(p) ter uma funo autocorrelao infinita, poder ser descrita em termos de p funes de autocorrelao. Definindo-se como o j-simo coeficiente numa representao autoregressiva de ordem k, tal que o ultimo coeficiente. A partir da equao (4.75), para uma representao de ordem k, os coeficientes satisfazem o conjunto de equaes

4. Modelos Matemticos de Processos

65 = 1, 2, ,

= + + + + + Conduzindo-nos s equaes de Yule-Walker

(4.79)

(4.80)

Resolvendo estas equaes para = , , , sucessivamente para , obtm-se = = = = =

Ou seja, em geral, para o determinante do numerador tem os mesmos elementos que o determinante do denominador, , mas em que a ultima coluna de foi substituda por , ver a equao (4.80): =

(4.81)

A quantidade vistas como funes da lag k, denomina-se como Funo Autocorrelao Parcial. Para um processo autoregressivo de ordem p, a funo autocorrelao parcial ser diferente de zero para k menor ou igual a p e zero para k maior que p. Por outras palavras, a funo autocorrelao parcial de um processo autoregressivo de ordem p corta ( igual a zero) aps a lag p. Os so interpretados como a medida de correlao entre e +1 aps descontar o efeito das variveis intermdias2 , 2 , , +1 (Del Castillo, 2002). A funo autocorrelao parcial dada atravs de (4.80) est definida para qualquer processo estacionrio como uma funo da autocorrelao do processo, mas a caracterstica

66

4. Modelos Matemticos de Processos

distintiva de que = para > num processo AR(p) serve para caracterizar a ordem p do processo. A partir da teoria dos mnimos quadrados, pode estabelecer-se que os valores 1 , 1 , , , soluo de (4.80), so os coeficientes de regresso numa regresso linear de em 2 , 2 , , , isto , so os valores dos coeficientes 1 , , que minimizam 0
2 =1

. Assim, assumindo por convenincia que o processo

tem mdia zero, o melhor predictor linear, no sentido dos mnimos desvios quadrados, de baseado em 2 , 2 , , ser (Box, Jenkins, & Reinsel, 2008) = , + + , + + + , seja o processo AR ou no. Estimativa da Funo Autocorrelao Parcial A estimativa da autocorrelao parcial (PACF Parcial Autocorrelation Function) pode ser obtida pela substituio dos valores tericos da autocorrelao pelas respectivas estimativas . A partir da equao (4.76) pode-se construir um mtodo recursivo para clculo das PACF. O primeiro passo consiste no clculo das ACF (funo autocorrelao, ver Autocovarincia e Autocorrelao) at a uma razovel ordem de corte (cutoff), por exemplo 4. Seguidamente, seja o vector da equao (4.76) para o caso de = . De forma similar, seja a matriz dos coeficientes para o mesmo caso. Ento, para determinar () como funo de i, implementar o seguinte algoritmo: 1. Ciclo para = 1 at = , incrementando uma unidade: 2. Calcular 3. Inverter 4.
i

1 2

5. Ignorar todos os para 1 1 6. Reter 7. = 8. Fim de ciclo em Desvio Padro da estimativa da Autocorrelao Parcial Na hiptese de que um processo autoregressivo de ordem p, as autocorrelaes parciais (PACF) estimadas de ordem + 1, e acima, so aproximadamente independentes e normalmente distribudas com mdia zero, ento +

4. Modelos Matemticos de Processos

67

Onde n o numero de observaes da srie que serviu de base para o ajustamento (Box, Jenkins, & Reinsel, 2008). Assim, e de acordo com o ponto (Autocovarincia e Autocorrelao), o desvio padro (DP) da autocorrelao parcial estimada ser dado por = +
(4.82)

4.2.2 Modelos Mdia Mvel


Se um processo pode ser representado por uma mdia movel ponderada de choques aleatrios IID (ruido branco), ento est-se perante um Processo Mdia Movel designado pela abreviatura MA. Um modelo Mdia Movel puro, ARIMA(0,0,q) ou MA(q), representado na forma (4.67), depois de retiradas as componentes AR e I apresenta a forma = + + +

Rearranjando os termos e adaptando a notao (Del Castillo, 2002) em que e , tem-se que um processo MA(q) pode ser descrito por = + Utilizando novamente a definio = , um processo MA pode ser descrito por =
(4.84) (4.83)

Comparando um processo MA(q) puro com um AR(p) puro, verifica-se que o processo MA(q) tem um polinmio igual a 1 e um processo AR(p) tem um polinmio igual a 1. Deste modo, um processo MA ser sempre estacionrio uma vez que o polinmio no depende de pelo que no ter qualquer raiz nem dentro nem fora do ciclo unitrio. Invertibilidade Invertibilidade uma condio matematicamente similar estacionaridade relativamente ao polinmio de um processo MA. A condio de invertibilidade diferente da condio de estacionaridade e tanto se aplica a modelos estacionrios como a modelos no estacionrios. Um processo ARIMA invertvel se este pode ser descrito como um processo AR da forma (Del Castillo, 2002) + + + +
(4.85)

Onde a soma finita ou infinita mas tem que convergir para um valor finito. A invertibilidade significa que a influncia das observaes prvias em decrescem com a idade. Para ilustrar a ideia, considere-se o seguinte modelo MA(1)

68

4. Modelos Matemticos de Processos

(4.86)

Invertendo, ou seja, resolvendo para em termos das observaes passadas e presente de = Ou seja = + + + Se < 1, fazendo k tender para infinito, obtm-se a srie infinita = + E as ponderaes do modelo na forma (4.85) so = , pelo que, se
(4.88) (4.87)

= + + + + + +

1 os

desvios presentes dependem de 1 , 2 , . . . , com ponderaes que incrementa com k. Para evitar esta situao requer-se que < 1. Dir-se- ento que a srie invertvel. Esta condio equivalente a que < tal que a srie =0 =0

=
=

Converge para todo o 1, ou seja, encontra-se dentro ou na fronteira do circulo unitrio (Box, Jenkins, & Reinsel, 2008). A condio de invertibilidade para um processo de ordem superior pode obter-se escrevendo (4.85) na forma = Assim, se

=
=

onde 1 1 , , 1 so as razes de = 0, ento, recorrendo ao mtodo de expanso em fraces parciais, obtm-se

= =
=

4. Modelos Matemticos de Processos

69

Que converge se < 1, para = 1, 2, , . Tem-se ento que a condio de invertibilidade para um processo MA(q) que as razes da equao caracterstica = Caem fora do ciclo unitrio (Box, Jenkins, & Reinsel, 2008).
(4.89)

4.2.2.1 Momentos de um processo MA(q)


Desde que um processo MA(q) seja estacionrio, a sua mdia dada pelo termo constante definido na equao s diferenas (4.83) = A varincia obtm-se de forma imediata pela aplicao do operador de varincia equao
(4.83)

= = + + + + A funo autocovarincia obtm-se a partir de = Apenas os produtos cruzados contemporneos (para o mesmo instante) dos s so diferentes de zero, pelo que a equao anterior fica na forma + + + + + + > = , , ,

A funo autocorrelao surge assim de forma automtica atravs da diviso de por = + + + + + + + + + + >
(4.90)

= , , ,

Verifica-se que a funo de autocorrelao de um processo MA(q) zero aps a ordem q do processo. Por outras palavras, a funo de autocorrelao de um processo mdia mvel corta a partir da lag q. Se os valores de 1 , 2 , , so conhecidos, as q equaes (4.90) podem ser resolvidas para os parmetros 1 , 2 , , , No entanto, ao contrrio das equaes de Yule-Walker para um processo autoregressivo, estas equaes so no lineares, pelo que, excepto para o caso em que q igual a um, estas equaes tem de ser resolvidas iterativamente como descrito no apndice A6.2 de (Box, Jenkins, & Reinsel, 2008). De igual modo, tambm, ao contrrio das estimativas para o modelo autoregressivo, as estimativas resultantes podem

70

4. Modelos Matemticos de Processos

no ter grande eficincia estatstica, no entanto podem fornecer uma estimativa grosseira bastante til para a identificao do modelo. Funo Autocorrelao Parcial para MA(1) Substituindo = 1 em (4.90) obtm-se a funo autocorrelao para um processo MA(1) = + = =

Substituindo esta equao na equao (4.81), obtm-se aps alguma lgebra (Box, Jenkins, & Reinsel, 2008) =
+

Verifica-se assim que < , e que a funo autocorrelao parcial dominada por um decaimento exponencial. Se positivo, ento negativo e a funo autocorrelao parcial alterna no sinal. Se negativo, ento positivo e a funo autocorrelao parcial negativa. Dualidade entre processos autoregressivos e mdia mvel Os resultados anteriores mostram alguns aspectos da dualidade os processos autoregressivos e mdia novel. Essa dualidade tem algumas consequncias resumidas na Tabela 4.1 retirada de (Box, Jenkins, & Reinsel, 2008)

4.2.3 Modelos ARMA


J se verificou que um processo mdia mvel finito, p.ex. (4.86), pode ser escrito na forma de um processo autoregressivo infinito (4.88). Neste caso, se o processo era realmente um MA(1), foi possvel obter uma representao no parcimnia (Box, Jenkins, & Reinsel, 2008, p. 16) em termos de um modelo autoregressivo. Inversamente, um processo AR(1) no poderia ser representado parcimoniosamente atravs de um modelo mdia mvel . Na prtica, para obter parametrizaes parcimnias, ser por vezes necessrio incluir no modelo uma combinao de termos autoregressivos e mdia mvel no mesmo modelo. Um modelo misto autoregressivo mdia mvel, ARIMA(p,0,q) ou ARMA(p,q), representado na forma (4.67), depois de retiradas a componente I apresenta a forma + + + = + + +

Rearranjando os termos e adaptando a notao (Del Castillo, 2002) / (Box, Jenkins, & Reinsel, 2008), tem-se que um processo ARMA(p,q) pode ser descrito por = + + + + Utilizando novamente a notao = , um processo ARMA pode ser descrito na forma

4. Modelos Matemticos de Processos

71

= + + + Que tambm pode ter a forma = Ou = Onde e so operadores polinomiais em de grau p e q respectivamente.

(4.91)

Um modelo ARMA(p,q) estacionrio se a componente AR estacionria, isto , se o polinmio tem todas as razes fora do circulo unitrio no plano . Similarmente, o processo invertvel se a parte MA invertvel, isto , se o polinmio tem todas as razes fora do circulo unitrio.

4.2.3.1 Momentos de um processo ARMA(p,q)


Valor esperado O valor esperado (mdia) de um processo ARMA dada por (Del Castillo, 2002) = =
=

Autocovarincia A autocovarincia obtm-se tirando o valor esperado do produto de (4.91) por (Del Castillo, 2002), (Box, Jenkins, & Reinsel, 2008) = + + + Onde = = a covarincia (cruzada) entre e , ser nula se > 0. Como depende apenas dos shocks que ocorreram acima de numa representao mdia mvel infinita = , segue-se que =0 =

>

Deste modo a equao anterior pode ser expressa por = + + + + + + Com a conveno de que 0 = 1. Verifica-se que a equao anterior implica que = + + + +
(4.92)

72

4. Modelos Matemticos de Processos

E consequentemente = + + + ou = + +
(4.93)

Verifica-se que (4.92) no tem soluo nica, pelo que, para um processo ARMA(p,q) existiro q coeficientes de autocorrelao , , , cujos valores dependem directamente da escolha dos q parmetros mdia mvel , bem como nos p parmetros autoregressivos . Alm disso, os p valores , , , + fornecem os necessrios valores de partida para a equao s diferenas = 0, onde + 1, os quais, ento determinam inteiramente a autocorrelao das lags mais altas. Varincia Fazendo = 0 tem-se = + + + que tem que ser resolvida juntamente com as p equaes (4.92) para k= 1, 2, , para se obter 0 , 1 , , .
Tabela 4.1 Resumo das propriedades dos modelos ARMA

Processo AR
Modelo em termos de s Modelo em termos de Pesos Pesos Estacionaridade Invertibilidade ACF

Processo MA
1

Processo ARMA
1 = = 1

= 1

Srie finita Srie infinita Razes de = 0 fora do crculo unitrio Sempre invertivel Infinita (decaimento exponencial e/ou decaimento sinosoidal Acaba em cauda (Tails off)

Srie infinita Srie finita Sempre estacionrio Razes de = 0 fora do crculo unitrio Finita

Srie infinita Srie infinita Razes de = 0 fora do crculo unitrio Razes de = 0 fora do crculo unitrio Infinita (decaimento exponencial e/ou decaimento sinosoidal Acaba em cauda (Tails off) Infinita (dominada por decaimento exponencial e/ou decaimento sinosoidal Acaba em cauda (Tails off)

Corta aps a lag q Infinita (dominada por decaimento exponencial e/ou decaimento sinosoidal Acaba em cauda (Tails off)

PACF

Finita

Corta aps a lag p

4. Modelos Matemticos de Processos

73

4.2.4 Processos no estacionrios: ARIMA


Muitos processos industriais so no estacionrios, no sentido de que, saem por eles prprios, sem interferncia externa (controlo), de uma situao de descontrolo, ou seja, o processo vagueia ou oscila fora dos valores pretendidos ou objectivo (Target). Contudo, um processo no estacionrio ARIMA exibe comportamento explosivo para razes estritamente dentro do ciclo unitrio. (Box, Jenkins, & Reinsel, 2008) prope o uso de processos autoregressivos (AR) que apesar de no estacionrios, no sentido no tem mdia ou varincia constante, no tem comportamento explosivo. Viu-se que um processo ARMA estacionrio se as razes de = 0 se situam fora do ciclo unitrio, por outro lado, exibem comportamento explosivo se alguma raiz se situa estritamente dentro do ciclo unitrio. Existe uma terceira hiptese que quando as razes de = 0 se situam na fronteira, ou seja quando tem exactamente o valor 1. (Box, Jenkins, & Reinsel, 2008) refere-se a estes modelos como modelos no estacionrios homogneos (homogeneous nonstacionary models). Estes modelos no tem comportamento explosivo, uma vez que a sua mdia, ou valor esperado constante, contudo, momentos de maior ordem podem ser no constantes. Estes processos autoregressivos tem normalmente d razes iguais a 1, na fronteira do circulo unitrio, e as restantes maiores que, portanto fora do circulo unitrio. Considere-se por exemplo o processo = Onde operador autoregressivo no estacionrio com d razes iguais a um e as restantes maiores que um. De acordo com (4.67), este modelo pode ser rescrito na seguinte forma =

Onde um operador autoregressivo estacionrio. Introduzindo a notao d = d para 1 onde = o operador diferencial, o modelo pode ser escrito na forma = De forma equivalente, o processo pode ser definido com recurso a duas equaes = = Deste modo, verifica-se que diferenciando a srie d vezes, esta pode ser representada por um modelo ARMA estacionrio e invertvel. A forma geral de um processo ARMA no estacionrio homogneo

74

4. Modelos Matemticos de Processos

(4.94)

Que normalmente referido com sendo um processo ARIMA(p,d,q). Para analisar um processo ARIMA(p,d,q), normalmente comea-se por diferenciar a srie sucessivamente at esta aparentar um processo estacionrio, determinando-se assim o grau de diferenciao d. O modelo obtido aps a diferenciao ser tratado como um modelo ARMA estacionrio. Expresso geral para as ponderaes (Pesos) Um modelo ARIMA = onde = 1 pode ser representado de vrias formas. Uma das formas consiste numa soma ponderada infinita dos shocks passados e presente = + + +

= +
=

=
=


(4.95)

Em que 0 = 1 e, para simplificao e sem perda de generalidade, se fez = 0. Se em ambos os lados da equao (4.95) se aplicar um operador autoregressivo generalizado dado por =

= + + Obtm-se =

(4.96)

Comparando o membro direito da equao anterior com o membro direito do modelo geral de um processo ARIMA (4.95), tem-se que = Segue-se ento que =
(4.98) (4.97)

Deste modo, as ponderaes podem ser determinadas igualando os coeficientes de na expanso da equao anterior, ou seja, de (4.96) tem-se que

4. Modelos Matemticos de Processos

75

+ +

+ + + =

(4.99)

Assim, pode conclui-se que as ponderaes de um processo ARIMA podem ser determinadas recursivamente atravs das equaes (Box, Jenkins, & Reinsel, 2008) = + + + + + Com 0 = 1, = 0 para < 0, e = 0 para > . Forma invertida No ponto 4.2.2 verificou-se que o modelo = Tambm pode ser escrito de forma invertida = ou

> 0

(4.100)

Ou seja, est-se perante uma soma ponderada infinita dos valores observados de adicionada a um shocks aleatrio = + + + Onde, devido condio de invertibilidade, os pesos tem de consistir numa srie convergente. Substituindo dado por (4.100) na equao (4.97), obtm-se = = Ou seja, as ponderaes podem ser determinadas explicitamente igualando os coeficientes de na expanso da equao anterior: = Isto :

76

4. Modelos Matemticos de Processos

+ + =

(4.101)

Verifica-se que os pesos de um processo ARIMA podem ser determinados recursivamente atravs da expresso = + + + + > 0

Com a conveno 0 = 1, = 0 para < 0 e = para > + .

4.2.5 Utilizao de modelos ARIMA em previso


Seja + a previso do valor da varivel aleatria para o instante + , + estimado no instante . O critrio mais comum para calcular estimativas o critrio dos desvios quadrticos mdios (mean square error MSE). Se uma previso for determinada tal que esta minimize o erro quadrtico mdio, esta ser chamada de estimativa da mdia mnima do quadrado dos desvios (minimum mean square error MMSE) tambm apelidada de estimativa dos mnimos quadrados. Para determinar a estimativa dos mnimos quadrados de + que determinar + =
+ +

+ +

Em que o smbolo significa o valor esperado calculado no instante . Por outras palavras, qualquer varivel aleatria com ndice > , representa um instante situado no futuro, desfasado de perodos em relao ao instante actual denominado por instante . Assume-se que no actual instante , o valor real da varivel , referente ao perodo , j conhecido. Uma observao gerada pelo processo no instante + poder ser expressa a partir do modelo (4.95), tomando a forma (Box, Jenkins, & Reinsel, 2008)

+ =
=

(4.102)

Onde 0 = 1 e, tal como em (4.99), as ponderaes podem ser determinadas igualando os coeficientes de na igualdade + + + = Equivalentemente, para positivo, com referncia a < , o modelo pode ser escrito de forma truncada + = + + + + + + + + + + + + + = + + + + + + +

4. Modelos Matemticos de Processos

77

Onde + a funo complementar relativa origem finita do processo

=
=

Suponha-se que, na origem t, se pretende fazer uma estimativa + do valor da varivel + , que uma funo linear dos valores observados no passado e presente da prpria varivel, , 1 , 2 , . Ento esta ser tambm uma funo linear dos shocks passados e presente , , , Suponha-se que a melhor estimativa (Box, Jenkins, & Reinsel, 2008)
+ = + + + + + Onde os termos , +1 , +2 , so a determinar. Ento, usando (4.102), o mnimo erro mdio quadrtico, MSE, da estimativa ser

+ +

= +

+ +

+
=

+ +

O qual ser minimizado se + = + . Tem-se ento

+ = + + + + + + + + + +
+

Ou seja + = + + Onde o erro da previso + a uma distncia de perodos. Verifica-se que o que se pode fazer para minimizar o MSE escolher + igual ao valor esperado + , o que d precisamente a formula geral de uma previso MMSE (minimum mean square error) + = +

(Box, Jenkins, & Reinsel, 2008) apresenta vrias forma de estimar valores futuros para uma srie temporal. Uma forma proposta por (Del Castillo, 2002) para se obter o valor esperado de + no instante , + , a partir da equao s diferenas, passa por se escrever a respectiva equao para o instante + e calcular-se o valor esperado no instante . Ou seja, na respectiva equao s diferenas 1. Substituir os valores 0 pelos valores observados

78

4. Modelos Matemticos de Processos

2. Substituir os valores + 1 pelos valores esperados no instante , + 3. Substituir os valores de 0 por = = + +1 4. Substituir os valores de + 1 por + = 0

4.2.6 Identificao de Modelos ARIMA(p,d,q)


Na perspectiva de se estar perante um modelo ARIMA, o objectivo em modelao passa por determinar os valores p, d e q e respectivos parmetros. A metodologia proposta por Box e Jenkins consiste numa abordagem iterativa para a construo do modelo na qual so testadas empiricamente conjecturas sobre o modelo baseadas nos dados da srie temporal : O primeiro passo para a identificao de um modelo ARIMA a partir de uma dada serie temporal , consiste em determinar de forma aproximada da estrutura do modelo. Ou seja, o principal objectivo nesta fase obter alguma ideia dos valores p, d e q necessrios para estabelecer a estrutura do modelo ARIMA e simultaneamente obter uma estimativa para os parmetros. O modelo preliminar ento obtido servir de ponto de partida para a aplicao de mtodos de estimao mais formais e eficientes. Nesta etapa pretende-se ento identificar uma apropriada subestrutura a partir da estrutura geral de um modelo ARIMA = + Que possa representar uma determinada srie temporal. A abordagem ser a seguinte: 1. Avaliar a estacionaridade do processo e, se necessrio, diferenciar tantas vezes quantas as necessrias para se produzir um processo estacionrio, desejavelmente reduzindo o processo a um modelo ARMA: = 0 + Onde = 1

O nmero de vezes que o processo for diferenciado constituir uma estimativa para o grau de diferenciao d. 2. Identificar o modelo ARMA resultante para A principal ferramenta estatstica utilizada nestes dois passos ser a funo autocorrelao amostral (SACF Sample Autocorrelation Function) e a funo autocorrelao parcial amostral (SPACF Sample Parcila Autocorrelation Function). O seu uso permite no s ter uma ideia da estrutura do modelo mas tambm obter uma estimativa preliminar dos prprios parmetros.

4. Modelos Matemticos de Processos

79

4.2.6.1 Tcnicas de Identificao


Identificao do grau de diferenciao Na seco Modelos Autoregressivos4.2.3 viu-se que para um modelo estacionrio misto autoregressivo - mdia mvel ARMA(p,q), ou ARIMA(p,0,q), dado pela expresso = , a funo autocorrelao satisfaz a equao s diferenas =

>

Alm disso, se = =1 1 , a soluo da equao s diferenas para a k-sima autocorrelao , assumindo razes distintas, da forma = + + + >
(4.103)

A condio de estacionaridade requer que os zeros de caiam fora do circulo unitrio, o que implica que as razes 1 , 2 , , caiam dentro do circulo unitrio. A equao anterior mostra que nos casos de modelos estacionrios em que nenhumas das razes se situam perto da fronteira do crculo unitrio, a funo autocorrelao extinguir-se- rapidamente para valores grandes ou moderados de k. Suponha-se que se est perante o a existncia de uma nica raiz real prxima de um, tal que 1 = 1 onde representa uma quantidade bastante pequena. Ento, para k grande tem-se que 1 1 e a funo autocorrelao decair lentamente e muito prximo da linearidade. O mesmo argumento pode ser aplicado se mais do que uma raiz se aproxima da unidade. Assim, a tendncia para a funo autocorrelao no se extinguir tida como uma indicao da possvel existncia de uma raiz prxima da unidade. A funo autocorrelao estimada tende a seguir o comportamento da funo autocorrelao terica (Box, Jenkins, & Reinsel, 2008). Nesses casos deve-se estar perante processos estocsticos no estacionrios, mas em que, possivelmente, o processo = ser estacionrio. Normalmente, atravs de um simples plot da srie de dados , consegue-se verificar quando que o processo estacionrio ou no. Se o processo apresenta indcios de no estacionaridade, procede-se diferenciao da srie, obtendo-se uma nova srie = = 1 . Se a srie resultante continuar a apresentar indcios de no estacionaridade, esta ser diferenciada novamente at se obter uma srie estacionria, determinando-se deste modo o grau de diferenciao d. Uma vez obtido um processo estacionrio por diferenciaes sucessivas, procede-se identificao de p e q, e estimativa dos parmetros do modelo. Por vezes pode existir o perigo da diferenciao excessiva introduzindo-se assim um termo mdia mvel no invertvel. Adicionalmente a varincia do modelo sobre diferenciado ser inflacionado artificialmente, e isso pode desvirtuar a actual estrutura dos dados. Para ilustra o problema, considere-se por exemplo o seguinte modelo = +

80

4. Modelos Matemticos de Processos

Diferenciando-se este processo obtm-se um processo constitudo por rudo branco , mas, se por alguma razo se decidir diferenciar novamente, obtm-se = = Ou seja introduziu-se um termo MA no invertvel com a consequncia lgica de que ser dado mais peso s observaes passadas do que s actuais. Consequentemente, a varincia da srie sobre diferenciada ser inflacionada. Neste exemplo, a varincia de 2 o dobro da varincia de . Tem sido proposta vrias alternativas para detectar a diferenciao excessiva e assim determinar o valor correcto de d. Uma simples abordagem consiste em calcular sucessivamente , , , n e escolher d tal que a varincia seja mnima. Identificao do processo ARMA resultante Aps a obteno do grau de diferenciao d. o prximo passo passa pelo estudo da aparncia das funes de autocorrelao e autocorrelao parcial da srie diferenciada = d , para se procurar pistas sobre a escolha das ordens p e q para os operadores autoregressivo e mdia mvel. Como se viu nas seces anteriores, enquanto que a funo autocorrelao de um processo autoregressivo de ordem p acaba em cauda (decaimento exponencial), a sua funo autocorrelao parcial corta aps a lag p. Contrariamente, a funo autocorrelao de um processo mdia mvel de ordem q corta aps a lag q, enquanto a sua funo autocorrelao parcial acaba em cauda. Se ambas as funes PACF e ACF acabam em cauda, provavelmente est-se perante um processo misto. A Tabela 4.2, extrada de (Del Castillo, 2002), fornece alguns elementos teis para identificao de processos autoregressivos e mdia mvel
Tabela 4.2 Resultados uteis para identificao de processos AR e MA

Processo MA(p)
ACF = 0 para > 1 1+2
=1

Processo AR(q)
acaba em cauda (tails off)

Ruido branco
= 0 para todo o 1

Para > PACF acaba em cauda (tails off) = para >

Para todo o = para todo o

= para >

Para todo o

A funo auto correlao de um processo misto, contendo uma componente autoregressiva de ordem p e uma componente mdia mvel de ordem q uma mistura de decaimento

4. Modelos Matemticos de Processos

81

exponencial e ondas sinusoidais amortecidas aps as primeiras (q p) lags. Em sentido inverso, a funo auto correlao parcial de um processo misto dominada por uma mistura de decaimento exponencial e ondas sinusoidais amortecidas aps as primeiras (p q) lags Em geral, o comportamento da funo de autocorrelao de um modelo autoregressivo (mdia mvel) tende a imitar o comportamento da funo autocorrelao parcial de um modelo mdia mvel (autoregressivo) (Box, Jenkins, & Reinsel, 2008). Desvio padro para estimativas de autocorrelao e autocorrelao parcial Quando se faz uma estimativa sempre importante saber qual o nvel de significncia dessa estimativa. sempre importante ter algum indicador que nos d alguma informao sobre a coerncia da estimativa. Neste caso particular, necessita-se de alguma informao que nos permita decidir quando que a autocorrelao e autocorrelao parcial efectivamente zero aps determinada lag p ou q. Para um nmero de lag elevado, na hiptese de que se est perante um processo mdia mvel de ordem q, pode-se determinar o desvio padro da autocorrelao estimada a partir da forma simplificada da frmula de Bartlett (3.1), substituindo os valores tericos pelos valores estimados = + + + +
/

>

Para a autocorrelao parcial utiliza-se o resultado (4.82) que, na hiptese de que se trata de um processo autoregressivo de ordem p, o desvio padro para a autocorrelao parcial de ordem p+1 e superior (Box, Jenkins, & Reinsel, 2008) = >
(4.104)

4.2.6.2 Ferramentas adicionais de identificao


Na seco anterior verificou-se que as funes de autocorrelao e autocorrelao parcial so ferramentas extremamente teis para identificao de modelos ARIMA a partir de sries temporais, no entanto podero existirem casos envolvendo modelos mistos em que esta ferramentas apresentem resultados ambguos. Uma das ferramentas propostas por (Box, Jenkins, & Reinsel, 2008), entre outras, a anlise da correlao cannica. Mtodo das correlaes cannicas Em geral, para dois conjuntos de variveis, 1 = 11 , 12 , , 1 e 2 = 21 , 22 , , 2 , de dimenses k e l respectivamente (assume-se que > ), a anlise de
correlao cannica consiste em determinar combinaes lineares = 1 e = 2 , = 1, , e as correspondentes correlaes = , com 1 2 0, tal que tal que os e os esto mutuamente no correlacionados para . 1 e 1 tem a mxima correlao possvel 1 entre todas as combinaes lineares de 1 e 2 , 2 e 2 tem a mxima correlao possvel 2 entre todas as combinaes lineares de 1 e 2 que no esto correlacionadas com 1 e 1 , e assim sucessivamente. s correlaes resultantes d-se o nome de correlaes cannicas entre 1 e 2 , e as variveis e so as correspondentes variveis cannicas. Se = for a matriz de covarincia de = 1 , 2 , com ij = , , ento sabido que os valores 2 so os valores prprios

82

4. Modelos Matemticos de Processos

1 ordenados da matriz 11 12 1 21 e os vectores , tal que = , so os 22 correspondentes vectores prprios normalizados; ou seja, os 2 e os satisfazem a condio

= , ,

(4.105)

Com 2 1 2 12 2 0. De forma similar, pode-se definir a noo de Correlao Cannica Parcial entre 1 e 2 , dado outro conjunto de variveis 3 como a correlao cannica entre 1 e 2 , aps estas terem sido ajustadas para o efeito de 3 por 1 regresso linear sobre 3 . Especificamente, seja ij .m = ij im mm mj = . , . para , = 1, 2 e = 3, onde . = im 1 ajustado por regresso linear sobre mm . Assim, ij.m representa a matriz de covarincia entre e aps ajustamento destas variveis para os efeitos de linearidade de outro conjunto de variveis No contexto de modelos de sries temporais ARMA, esta ferramenta poder ser de extrema utilidade seguindo como documenta (Box, Jenkins, & Reinsel, 2008) e (Reinsel, 1997). Neste trabalho apenas se aborda dois casos especiais destas correlaes cannicas: 1. Primeiro, quando = 0, simplesmente se examina a correlao cannica (autocorrelao +1 ) entre e 1 , e esta ser sempre igual a zero num processo MA(q) para . 2. Segundo, quando j=0, examina-se a correlao cannica parcial (autocorrelao parcial +1, +1 ) entre e 1 , dado 1 , , , e esta ser sempre igual a zero num processo AR(p) para . Deste modo, a anlise das correlaes cannicas pode ser vista como uma extenso da anlise das funes de autocorrelao e autocorrelao parcial do processo. Na prtica, baseado em (4.105), est-se a considerar a correlaes cannicas amostrais , que so determinadas a partir dos valores prprios da matriz , ,

, , , ,

(4.106)

, ,

Para vrios valores de lag = 0, 1, e = 0, 1, Critrio de seleco de modelo Outra abordagem para a seleco do modelo o uso de critrios tais como AIC proposto por (Akaike, 1974) ou o Bayesian Information Criteria (BIC) proposto por (Schwarz, 1978). Na implementao desta abordagem, uma gama de potenciais modelos ARMA so estimados por mtodos de mxima verosimilhana, e cada um dos modelos avaliado com recurso a critrios tais como AIC (normalizado pela dimenso da amostra n) dado por , = 2 ln + 2 2 2 ln + +

Ou pelo critrio relacionado

4. Modelos Matemticos de Processos

83

, = +

2 2 onde um estimador de mxima verosimilhana de , e = + + 1 o numero de parmetros estimados no modelo, incluindo os temos constantes. Nestes critrios, o segundo termo corresponde a um factor penalizador pela incluso de parmetros adicionais no modelo. Nesta abordagem, so preferidos os modelos que resultem num menor valor do critrio, em que os valores de AIC e BIC so comparados entre os vrios modelos como base de seleco do modelo. Como o critrio BIC impe uma maior penalizao para o numero de parmetros estimados que o AIC, o uso do critrio BIC para seleco do modelo deve conduzir a modelo cujo numero de parmetros no deve ser superior do que o seleccionado pelo critrio AIC.

Uma desvantagem desta abordagem que vrios modelos podem ter que ser estimados por mxima verosimilhana, os quais so bastante pesados em termos informticos, embora essa questo se coloque cada vez menos. Por essa razo, (Hannan & Rissanen, 1982) props o seguinte procedimento de seleco de modelo 1. Num primeiro estgio do procedimento obtm-se uma estimativa da srie de shocks aleatrios pela aproximao do modelo ARMA desconhecido por um modelo AR (de ordem suficiente alta) de ordem . Esta ordem pode tambm ela ser escolhida com recurso ao critrio AIC. A partir do modelo AR( ) obtm se os resduos = =1 2. Num segundo estgio estima-se os parmetros e atravs de regresso linear de em 1 , , e 1 , , , para vrios valores de p e q. Isto , estima-se modelos aproximados da forma (4.107) com recurso a mtodos de regresso dos mnimos quadrados ordinrios, e estimar a varincia dos erros 2 , .

=
=1


=1

(4.107)

3. Pela aplicao do critrio AIC ou BIC escolhe-se a ordem (p,q) do modelo ARMA 2 que minimize ln , + + ln

4.2.6.3 Abordagem Box-Jenkins para a modelao de um processo ARIMA


O ajustamento de um modelo a uma srie temporal um processo iterativo. A Figura 4-6, adaptada de (Del Castillo, 2002), mostra a abordagem geral proposta por Box-Jenkins. Se um hipottico modelo ARIMA no demonstrar um bom ajustamento, ou hipteses alternativas parecerem mais viveis, estas devero ser tentadas de forma iterativa. Esta iterao est indicada atravs da linha tracejada. Alternativamente, se os resduos continuarem a revelar alguma autocorrelao em vez de conterem apenas rudo branco, essa deve ser retirada com recurso a um novo modelo ARIMA para os resduos, ou seja, separar a dinmica dos resduos da dinmica do processo. Esta dinmica ser posteriormente integrada no modelo. Esta iterao est indicada atravs da linha contnua paralela linha tracejada.

84

4. Modelos Matemticos de Processos

Srie inicial Yt Calcular rk para vrias lags Fazer =

Srie estacionria? No Diferenciar sie Fazer +

Sim

Srie estacionria = Estimar ACF e PACF Seleccionar por tentativa um modelo ARIMA(p,d,q)

Calcular e os resduos = Fazer = E construir um modelo para os resduos

No

Rudo branco? Sim Adoptar o modelo ARIMA(p,d,q) e combin-lo com o modelo para os resduos

Figura 4-6 Metodologia Box-Jenkins para identificao de processos ARIMA(p,d,q)

4.2.7 Estimao dos Parmetros do Modelo


Uma vez determinada a estrutura do modelo, o prximo passo ser encontrar estimativas eficientes para os parmetros do modelo. Aps a estimao dos parmetros, o modelo ajustado deve ser sujeito a diagnostico de comprovao e testes da qualidade do ajustamento. Nesta seco apenas se aborda mtodos de estimao offline. Quer isto dizer

4. Modelos Matemticos de Processos

85

que a estimativa dos parmetros obtm-se numa s vez aps um conjunto de N observaes serem colectadas. Isto em contraste com os mtodos de estimao online, que apesar de no fazerem parte deste trabalho, sero abordados de forma ligeira mais frente.

4.2.7.1 Estimativa dos mnimos quadrados e mxima verosimilhana


Aps a obteno de uma srie temporal contendo N observaes, geradas por um processo ARIMA, e determinada a estrutura do modelo, a etapa seguinte passa por determinar a melhor estimativa dos parmetros do modelo. Aps a diferenciao d vezes da srie gerada, obtm-se uma nova srie estacionria de dimenso = , onde cada elemento ser dado por = d . O objectivo nesta seco determinar, a partir da nova srie, os parmetros e (na notao de (Del Castillo, 2002) entre outros) do modelo ARMA(p,q) resultante: = + Que tambm pode ser escrito na forma = + + + +
(4.108)

Onde = e = . Para > 0 poder por vezes ser apropriado assumir = 0, ver discusso em (Box, Jenkins, & Reinsel, 2008) . Quando no for apropriado assumir = 0, ento assume-se que = . Para dimenses amostrais normalmente =1 consideradas na anlise de sries temporais, esta aproximao ser adequada. No entanto, poder ser includo como um parmetro adicional a ser estimado. Os valores no podem ser substitudos directamente na equao anterior para calcular os devido ao problema dos valores iniciais para iniciar a equao s diferenas. Suponha-se que os p valores dos e que os q valores anteriores ao inicio da srie so eram dados, ento os valores 1 , 2 , , poderiam ser calculados com recurso equao (4.108) condicionados escolha dos valores iniciais. Deste modo, para qualquer escolha de parmetros , e dos valores iniciais , , pode-se sempre calcular sucessivamente um conjunto de valores , , , w , = 1, 2, , . Assumindo-se que os so normalmente distribudos, o que normalmente um dos pressupostos para a validao do modelo, ento a sua densidade probabilidade ser pela funo verosimilhana
/

, , ,

Onde = 1 , 2 , , , = 1 , 2 , , e , traduz o somatrio dos erros quadrticos como funo dos parmetros , . Maximizando-se a funo verosimilhana com respeito aos parmetros encontrar-se- os parmetros to compatveis quanto possvel com a evidncia da amostra. Neste contexto, o smbolo tem o significado de ser

86

4. Modelos Matemticos de Processos

proporcional a, onde a constante de proporcionalidade desconhecida. Tomando o logaritmo da equao anterior, obtm-se a funo verosimilhana logaritmica (loglikelihood) que ter a forma ,

, , = ,

Onde , uma funo de e , sem interesse nesta altura. Os parmetros que maximizem esta funo (verosimilhana logaritmica, ou log-likelihood) so os mesmos que maximizam a funo de verosimilhana, pelo que se torna mais simples trabalhar com ela para obter os parmetros pretendidos. Os erros so estimados a partir dos resduos obtidos com recurso equao (4.108) a partir de escolhas dadas de e . A soma dos quadrados dos erros (resduos)

, =
=

, , ,

A esta forma de clculo chama-se soma dos quadrados condicional porque os seus valores dependem da escolha dos valores iniciais como comentado acima. Para se obter estimativas da mxima verosimilhana (MLE Maximum Likelihood Estimate) de e maximiza-se , , . Para amostras de grande dimenso, o termo , torna-se geralmente desprezvel, pelo que a maximizao de , , implica apenas a minimizao da soma dos quadrados , . Deste modo, para n grande tem-se que a estimativa da mxima verosimilhana (MLE) identifica-se com a estimativa dos mnimos quadrados (OLS Ordinary Least Square), ou seja , = ,

Se o modelo for um modelo estatstico linear, a estimativa dos mnimos quadrados pode-se obter atravs de uma frmula fechada. Os modelos ARIMA so modelos estocsticos, modelos de equaes s diferenas mas nem sempre so modelos lineares nos parmetros. Para os modelos ARIMA, um modelo linear nos parmetros se as derivadas dos resduos, ou seja, as derivadas da equao (4.108) em ordem aos parmetros e , no so funo de qualquer parmetro desconhecido. Estimao de modelos AR(p) fcil verificar que todos os modelos do autoregressivos puros AR(p) so lineares. Um modelo AR(p) pode ser escrito na forma = + + + + Pelo que os resduos a sero da forma

4. Modelos Matemticos de Processos

87

= As derivadas em ordem aos parmetros sero


= , , ,

Que, portanto, ser um modelo estatstico linear que poder ser ajustado com recurso s normais tcnicas de regresso linear. Para amostras de grande dimenso, os valores iniciais vo ter um efeito muito reduzido, pelo que uma sequncia de variveis aleatrias definidas por um processo AR(p) pode ser escrito na forma + + = +

+ +

Ou, em notao vectorial = + Portanto, o estimador dos mnimos quadrados para os parmetros ser =

(4.109)

Estimao de modelos mistos Os modelos ARIMA(p,d,q) onde > 0 no podem ser estimados pela minimos quadeados ordinrios (formula anterior) porque so no lineares nos parmetros. (Del Castillo, 2002) demonstra este facto com recurso ao exemplo mais simples, ou seja, um processo MA(1) = + = Resolvendo para e assumindo invertibilidade = < 1 , tem-se

Derivado em ordem ao parmetro


Que funo do parmetro desconhecido , pelo que no ser um modelo estatstico linear e, consequentemente, no existir uma formula fechada para um estimador dos mnimos

88

4. Modelos Matemticos de Processos

quadrados. A soluo passar pela obteno com recurso ao calculo numrico da minimizao da funo da soma dos quadrados. (Box, Jenkins, & Reinsel, 2008) prope um algoritmo iterativo a partir do modelo ARMA, em que para vrios valores de e , igualmente espaados compreendidos no intervalo ] 1, 1[, se determine os respectivos valores da soma dos quadrados dos resduos , obtidos por (4.108), seleccionando-se posteriormente a combinao do conjunto de valores ; ; = 1, , ; = 1, , , que apresente o resultado mais baixo.

4.2.8 Teste de validao em modelos de series temporais


O objectivo na identificao/modelao retirar de uma determinada srie dados gerados por um determinado processo, toda a autocorrelao existente entre os vrios instantes de amostragem, at que os respectivos resduos apresentem uma sequncia de rudo branco. Se o ajustamento do modelo o adequado, a srie resultante dos resduos = dever ser rudo branco. Ou seja, o modelo estimado capturou toda a estrutura de autocorrelao da srie, peo que no dever existir qualquer autocorrelao nos resduos. Assim, ao determinar-se a ACF dos resduos, esta no dever ter qualquer componente significante. Uma estatstica bastante til a estatstica Ljung-Box-Pierce, definida por

= +
=

Esta estatstica utilizada no teste de Portmanteau, cuja hiptese nula dada por : = , = , ,

Em que, evidentemente, grande valores de Q so devido a grandes autocorrelaes. A hiptese nula rejeitada se > , . Utilizao dos resduos para modificar um modelo ARIMA(p,d,q) Se a ACF da srie dos resduos demonstrarem uma estrutura diferente de rudo branco, ou seja, se houver alguma lag que indique alguma autocorrelao, o modelo inicial dever ser alterado de modo a mover essa autocorrelao. Alternativamente ver Figura 4-6, podese ajustar um modelo ARMA(pe, qe) aos resduos (Del Castillo, 2002) =
(4.110)

O qual, aps captura de toda a correlao remanescente dever produzir uma srie contendo apenas rudo branco. O modelo resultante (4.110) dever ento ser combinado com o modelo original ARIMA(p,d,q) resultando o modelo = Que exactamente um processo ARIMA(p+pe, d, q+qe).
(4.111)

4. Modelos Matemticos de Processos

89

4.3 Funes de transferncia


Na seco 4.1 descreveu-se a funo de transferncia como sendo uma relao dinmica entre a entrada e a sada do processo. As variveis de entrada so as variveis controlveis, ou pelo menos, parte delas devero ser controlveis. Como neste ponto apenas se trata de sistemas SISO (Single-input/Single-output), ou seja, sistemas univarivel, supe-se que se est perante processos que tem apenas uma varivel de entrada, a que se chama varivel controlvel e uma varivel de sada que ter a designao de resposta do processo. Tambm se concluiu no ponto 4.1, e que ser de extrema importncia nesta seco, que a funo de transferncia de um processo coincide com a resposta do processo a uma entrada em forma de impulso unitrio.

4.3.1 Modelos de funo de transferncia


Nesta seco olha-se para a dinmica de um sistema como uma caixa preta ( Figura 4-7), em que se relaciona a entrada com a sada sem qualquer preocupao com o que se passa no interior da caixa (em contraponto com os modelos de representao em espao de estados). Nesta seco, as funes de transferncia sero essencialmente descritas em termos de equaes s diferenas que sero representadas como funes do operador de atraso .
Xt Entrada (input)

Processo dinmico

Yt Sada (output)

Figura 4-7 Processo dinmico

O objectivo determinar relao dinmica entre as sries e , em que os pares , so sequncias de observaes disponveis em pontos equidistantes no tempo colectadas de forma sincronizada. Voltando novamente resposta ao degrau; assumindo-se que o processo estvel e que a varivel de entrada se mantm no nvel zero para todo o < 0; se a partir do instante = 0 se fixar o valor da varivel de entrada no nvel um, ento, aps um perodo de transio, a varivel de sada ter atingido a um valor estacionrio num nvel = . Assumindo-se que o processo linear, ento, para qualquer nvel da varivel de entrada, obter-se- a resposta no estado estacionrio dada por = Onde g o ganho estacionrio. A ideia por detrs do modelo de resposta ao degrau, que se pode aplicar uma entrada em degrau unitrio entrada do processo (varivel manipulada) e medir a resposta (varivel de sada) em anel aberto at esta atingir um valor estacionrio. Devido ao facto de se assumir que o processo linear, o conhecimento da resposta ao degrau unitrio permite deduzir a resposta para qualquer outro sinal de entrada. O ganho molda as alteraes do estado estacionrio da sada que eventualmente seria

90

4. Modelos Matemticos de Processos

obtido devido a uma alterao unitria na entrada. Evidentemente que este um modelo esttico do tipo do modelo obtido atravs de desenho de experincias com recurso a tcnicas de regresso. Por exemplo, quando se implementa um programa de desenho de experincias (DOE) num processo qumico, est-se apenas interessado no resultado final, quando o estado estacionrio atingido, descartando-se a fase transiente do processo. Nos projectos de controlo, o objectivo fazer com que a sada do processo se mantenha ou regresse rapidamente aos valores desejados/objectivo (target), o que implica que a resposta dinmica evidenciada na fase transiente, seja modelada. Para se modelar a dinmica do processo, necessita-se de conhecer o comportamento da sada do processo, sempre a que alterada a entrada do processo. Se o processo for linear, ento ter-se- para resposta do processo uma combinao linear dos valores passados, e possivelmente do valor presente, da entrada do processo:

= + + =
=

(4.112)

Onde o polinmio de ordem infinita e definida como a funo de transferncia do sistema que, como demonstrado na seco 4.1, coincide com a resposta do sistema ao impulso unitrio. Para se ter uma ideia mais intuitiva da funo de transferncia, considere-se novamente a funo impulso unitrio (Figura 4-8 direita) = =

A resposta do sistema ao impulso unitrio , ser dada pelos pesos 0 , 1 , (Figura 4-8 esquerda), que coincide com a funo de transferncia porque se a entrada, num determinado instante, corresponder a um impulso de magnitude , a resposta ser a resposta ao impulso unitrio multiplicada pela magnitune do impulso de entrada .

Figura 4-8 Funo impulso (a) e resposta ao impulso gt (b)

Considerando-se um sinal de entrada como uma sequncia de impulso de magnitude , a resposta a esse sinal ser dado pelo somatrio de convulso das respostas individuais de cada impulso, ou pelo integral de convulso (ver seco 4.1.1.3) no caso da anlise continua. Suponha-se que ao sistema descrito pela funo de transferncia da Figura 4-8 que lhe impostos um nvel de entrada nulo para < 0, e que nos trs instantes seguintes, o sinal de entrada discretizado (em forma de impulso) tem a forma representada na Figura 4-9 (lado esquerdo input). No lado direito da Figura 4-9 esto representadas as respostas a cada um dos impulsos sequenciais juntamente com a resposta global do sistema. fcil

4. Modelos Matemticos de Processos

91

verificar que a resposta global do sistema (Figura 4-9 a preto) ser dada pela soma acumulada de cada uma das respostas para o mesmo instante, ou seja, por exemplo para = 2, tem-se 2 = = 0 2 + 1 1 + 2 0 . =0

Resposta

Figura 4-9 Sinal de entrada (esquerda) e respectiva resposta

Forma incremental Definindo-se = = = e = = = os incrementos em X e Y. Diferenciando (4.112) obtm-se = Ou seja, a forma incremental satisfaz o mesmo modelo de funo de transferncia. Estabilidade Se uma srie infinita 0 + 01 + 1 2 + converge para 1, ou equivalentemente, se os so absolutamente somveis, tal que < ento o diz-se que o sistema =0 estvel. A estabilidade implica que um incremento finito na entrada resulta num incremento finito na sada. A condio de estabilidade significa que os pesos devero tender para zero, ou serem iguais a zero, para grandes valores de , o que implica que o efeito de entradas passadas em respostas futuras desprezvel ou eventualmente nulo a partir de determinado tempo. Funo de transferncia na forma de diviso de polinmios A funo de transferncia escrita na forma (4.112) composta por uma srie infinita, o que no prtico. H toda a convenincia em escrever a funo de transferncia numa forma fechada, ou seja, uma representao mais parcimnia representada pela forma geral de equao s diferenas = + + + + ou

92

4. Modelos Matemticos de Processos

= = Onde um polinmio em de ordem e um polinmio de ordem . Ao desfasamento k d-se o nome de atraso entrada resposta (input-output delay) e corresponde ao tempo que o sistema demora a responder a uma determinada entrada. Comparando as duas representaes da funo de transferncia, chega-se chamada representao (r,s,k) da funo de transferncia =
(4.113)

O modelo ARIMA = usado para representar sries temporais relaciona com atravs do filtro linear = onde rudo branco. Verifica-se assim que um modelo ARIMA pode ser utilizado para representar a sada de um sistema dinmico cuja entrada rudo branco e em que a funo de transferncia pode parcimoniosamente expressa como razo de dois operadores polinomiais em . Devido ao paralelismo entre a funo de transferncia discreta e o modelo ARMA, as condies de estabilidade para a funo de transferncia discreta coincidem com as condies impostas ao modelo ARMA, ou seja, que as razes do polinmio = 0 se situem estritamente fora do circulo unitrio. Para um sistema estvel, o ganho estacionrio pode ser determinado a partir da funo de transferncia na forma racional aplicando uma entrada = 1 para todo o , obtendo-se

= =

Este resultado est directamente relacionado com o teorema do Valor final (Teorema do valor final - ver seco 4.1.2.5) da transformada (Del Castillo, 2002).

4.3.2 Identificao de funes de transferncia de processos


Na identificao da funo de transferncia de um processo, a primeira etapa consiste em determinar valores referentes s ordens e e ao atraso entrada-sada do modelo racional, que determinam a sua estrutura. Uma das ferramentas proposta por (Box, Jenkins, & Reinsel, 2008), entre outros, para alcanar este objectivo, a resposta ao degrau. Se as duas representaes da funo de transferncia, resposta ao impulso (4.112), e racional (4.113), ento elas so equivalentes, ou seja, verifica-se a igualdade + + + =

4. Modelos Matemticos de Processos

93

Que pode ser reescrita na forma + + + =


(4.114)

A anlise desta relao poder ser bastante util para a identificao de r, s e k. Igualando os coeficientes de , chega-se relao (Box, Jenkins, & Reinsel, 2008) = + + + + + + + + + + < = = + , + , , + > +
(4.115)

Os pesos + , +1 , , +1 fornecem os valores de partida da equao s diferenas = > +

A soluo = , , desta equao s diferenas aplica-se a todos os valores para os quais + + 1. Em geral, os pesos da resposta ao impulso consistem em 1. valores iguais a zero, 0 , 1 , , 1 2. + 1 valores adicionais, , +1 , , + , que no seguem um padro fixo (se < estes valores no existem) 3. Valores com + + 1 seguindo um padro de acordo com a ordem da equao s diferenas, os quais incluem os valores de partida + , +1 , , +1 . Os valores de partida para < sero nulos. Resposta ao degrau A funo resposta ao impulso () pode obter-se atravs da diferenciao da corresponde resposta ao degrau () = () Em que = + + + = + + + + + + + Substituindo (4.116) em (4.114) obtm-se a identidade + + + + = com
(4.118) (4.117) (4.116)

94

4. Modelos Matemticos de Processos

+ =

(4.119)

Verifica-se que identidade (4.118) para os pesos da resposta ao degrau paralela identidade (4.114) para os pesos da resposta ao impulso, excepto que o operador do lado direito de ordem + 1 em vez de (Box, Jenkins, & Reinsel, 2008) Utilizando o resultado (4.115), conclui-se que a funo resposta ao degrau definida por: 1. valores iguais a zero, 0 , 1 , , 1 2. valores adicionais, , +1 , , +1 , que no seguem um padro fixo (se < estes valores no existem) 3. Valores com + seguindo um padro de acordo com a ordem + 1 da equao s diferenas = 0, os quais incluem os + 1 valores de partida + , +1 , , + . Os valores de partida para < sero nulos. Conhecendo-se o comportamento tpico das respostas ao impulso e/ou respostas ao degrau , possvel identificar , e de um determinado sistema a partir das respectivas observaes. (Del Castillo, 2002, pp. 140-141) e (Box, Jenkins, & Reinsel, 2008, pp. 451-453) entre outros, contm tabelas que ilustram os comportamentos tpicos das funes de resposta ao impulso e resposta ao degrau para diferentes valores de , e .

4.3.2.1 Identificao de funes de transferncia na presena de rudo


Na seco anterior introduziu-se o estudo de funes de transferncia discretas do tipo =

Neste modelo e so desvios relativamente ao equilbrio das entradas e sadas dos sistemas. Na prtica, os sistemas esto sempre infectados por distrbios ou rudo cujos efeitos prticos se traduzem na corrupo dos valores esperados para das sadas dos sistemas por uma quantidade , pelo que a identificao em tais condies apenas possvel se o nvel de rudo moderado em comparao com o nvel do sinal que se pretende identificar. Quando o nvel dos distrbios significativo comparativamente ao sinal, este normalmente entra no processo como um parmetro no controlvel, em contraste com . Para modelar os distrbios, (Box, Jenkins, & Reinsel, 2008) prope a modelao de por um processo ARIMA(p,d,q) e a sua incluso no modelo anterior = Onde = +

em que pode ter uma ou mais razes unitrias. Este modelo conhecido na literatura de engenharia de controlo como modelo Box-Jenkins, ou modelo BJ (Figura 4-10):

4. Modelos Matemticos de Processos

95

(4.120)

Figura 4-10 Funo de transferncia-ruido Box-Jenkins

As ferramentas utilizadas em engenharia de controlo para identificao das funes de transferncia so normalmente baseadas em determinadas escolhas de entradas do sistema, como por exemplo impulsos, degraus ou ondas sinusoidais. Estas metodologias so extremamente teis quando os distrbios so relativamente reduzidos em relao aos sinais de entrada e sada. Quando os distrbios so significantes torna-se necessrio o uso de tcnicas estatsticas para estimar a funo de transferncia. Para efeitos de modelao, (Box, Jenkins, & Reinsel, 2008) prope que a entrada do sistema seja assumida como um processo estocstico e no como uma varivel controlada. Pretende-se com isto dizer que, quando o sistema est a correr com objectivos de identificao/modelao, a varivel de entrada deve comportar-se como uma varivel aleatria percorrendo o mximo de valores admissveis de modo a avaliar a resposta do sistema nos mais diversos nveis e transies, pelo que no deve existir qualquer aco de controlo em que a varivel de entrada seja manipulada. Abordagem a sistemas multivariados Do mesmo modo que a funo de autocorrelao utilizada para identificar modelos estocsticos, uma das ferramentas utilizadas para modelao de funes de transferncia de processos a funo de correlao cruzada entre a entrada e sada. Suponha-se que se pretende descrever uma srie temporal da entrada de um sistema fsico, e a correspondente resposta . Ento este par de sries temporais pode ser visto como uma nica srie temporal em que cada observao constituda por vector bidimensional qual se pode chamar processo estocstico bivariado , . Deve-se assumir que os dados so lidos simultaneamente e em intervalos equidistantes resultando um par de valores de uma srie temporal discreta, gerado por um processo bivariado, em que os valores da srie nos instantes 0 + , 0 + 2, , 0 + so descritos por 1 , 1 , 2 , 2 , , , . Funes de covarincia cruzada e correlao cruzada Em geral, um processo estocstico bivariado , no necessita de ser estacionrio. Contudo, como anteriormente, assume-se que um apropriado grau de diferenciao conduz a um processo , , onde = d x e = d y so estacionrios. Como anteriormente, o conceito de estacionaridade implica que os processos constituintes e tem mdia 2 2 constante e e varincias constantes e . Se adicionalmente assumir-se que o processo bivariado normal, ou Gaussiano, ele ser caracterizado unicamente pelo vector das suas mdias , e a sua matriz das covarincias.

96

4. Modelos Matemticos de Processos

Os coeficientes de covarincia de cada uma das sries constituintes na lag k so definidos pela frmula usual: = + = + = =

Onde se utiliza a notao () e para a autocovarincia das sries e que constituem a diagonal da matriz das covarincias. Os restantes coeficientes da matriz de covarincia so as covarincias cruzadas entre as sries e na lag +k: = + = , , ,
(4.121)

e as covarincias cruzadas entre as sries e na lag +k: = +


= , , ,
+

(4.122)

= Figura 4-11 - Autocovarincia e covarincia cruzada de um processo estocstico bivariado

De forma similar ao caso univariado, em condies de estacionariridade (bivariada), a covarincia cruzada deve ser a mesma para todo o , pelo que deve ser funo apenas da lag k. Generalizando-se para srie multivariadas, pode dizer-se que a matriz de covarincia composta por = ,+ = , , ,

Em termos de covarincia cruzada, verifica-se que no igual a . Mas como (ver Figura 4-11): = = =

Apenas se necessita de definir uma funo para = 0, 1, 2, . Tal como j foi dito acima, a funo = , + , como definida em (4.121) chama-se funo de correlao cruzada de um processo bivariado estacionrio, a qual pode tambm ser representada de forma matricial, como se ver mais adiante =

4. Modelos Matemticos de Processos

97

De forma similar, correlao entre e + que dada pela quantidade adimensional definida por =

= , , ,

(4.123)

d-se o nome de coeficiente de correlao cruzada da lag k, sendo atribudo o nome de funo de correlao cruzada de um processo bivariado estacionrio funo , definida para = 0, 1, 2, (Box, Jenkins, & Reinsel, 2008). Em contraste com a funo de autocorrelao, geralmente a funo de autocorrelao cruzada no simtrica. Estimao das funes de autocorrelao e autocovarincia cruzadas Aps a diferenciao d vezes das sries originais de entrada e sada, at que estas mostrem comportamento estacionrio, obter-se- = pares de valores 1 , 1 , 2 , 2 , , , disponveis para anlise. A partir desses valores ser ento possvel obter uma estimativa dos coeficientes da covarincia cruzada da lag k dada por

+
= +

= , , ,
(4.124)

= =

= , , ,

Onde e so as mdias amostrais de das sries e respectivamente. De forma similar, as estimativas dos coeficientes de correlao cruzada para a lag k podem obter-se atravs da substituio em (4.123) de pelas respectivas estimativas , por = = 0 e por =

0 :
(4.125)

= , , ,

Um teste primitivo para verificar se certos valores da funo de correlao cruzada , sero efectivamente zero pode ser efectuado atravs da comparao das correspondentes estimativas com os respectivos desvios padro a partir da formula de Bartlett. Bartlett mostrou que, se as sries e no esto correlacionadas, ento (Del Castillo, 2002):

= , , ,

Da que, se duas sries so no correlacionadas e uma rudo branco ( = 0, qualquer que seja ), ento verifica-se que

98

4. Modelos Matemticos de Processos

Assim, se as sries e so no correlacionadas e uma rudo branco, a correlao cruzada varia em torno de zero com desvio padro aproximadamente igual a 1 2 . Identificao de modelos de funes de transferncia Suponha-se que o modelo da funo de transferncia = + Pode ser parametrizado de forma parcimoniosa na forma = + O procedimento de identificao composto pelas seguintes etapas: 1. Determinar estimativas preliminares dos pesos da funo resposta ao impulso no para o formato (4.126). 2. Utilizar as estimativas obtidas no ponto anterior para tentar estimar as ordens e dos operadores do denominador e numerador na equao (4.127) e o parmetro de atraso . 3. Substituir os valores estimados na equao (4.115), de acordo com os valores , e obtidos no ponto anterior para estimar os parmetros e da equao (4.127). Uma vez estimados os valores , possvel ter uma ideia das ordens e dos operadores do denominador e numerador na equao (4.127) e do parmetro de atraso comparando o andamento de , com as diversas respostas ao impulso tabeladas em (Del Castillo, 2002, pp. 140-141) e (Box, Jenkins, & Reinsel, 2008, pp. 451-453). Uma vez estimados os valores de , e ento possvel determinar os coeficientes atravs das equaes (4.115). Identificao de funes de transferncia pelo branqueamento da entrada Pelo que foi dito acima, torna-se claro que a correlao dentro de cada uma das sries pode esconder a correlao entre elas, pelo que a identificao dos processos pode ser facilitada se a entrada do sistema na fase de identificao for constitudo unicamente por rudo branco. De facto, sempre que se pode escolher a entrada do sistema a identificar, de todo recomendvel que se opte por rudo branco. Quando tal no possvel, e a entrada seguir outro processo estocstico, uma hiptese a ter em conta ser recorrer ao branqueamento da srie de entrada, conseguindo-se assim uma srie composta por rudo branco. Suponha-se que um processo de entrada , adequadamente diferenciado, estacionrio e pode ser adequadamente representado por um modelo ARMA(p,q) genrico. Ento, a partir de um conjunto de dados, possvel construir o modelo do processo =
(4.127) (4.126)

4. Modelos Matemticos de Processos

99

onde rudo branco. Resolvendo em ordem a obtm-se o filtro que ir permitir branquear a srie = Aplicando o mesmo filtro serie de sada obtm-se = Onde no necessariamente rudo branco. Substituindo em (4.120), a funo de transferncia-rudo BJ pode ser reescrita na forma = +

ou
= + 1 Onde = rudo colorido. Multiplicando-se ambos os lados por e tomando-se o valor esperado obtm-se

= + ou seja = + Onde = a covarincia cruzada para a lag k entre as sries e . Desta equao tira-se que: 1. Os valores da srie esto relacionados com valores passados da srie , ou seja, a sada do processo depende dos valores passados, e talvez presente, da entrada, pelo que o membro direito ser diferente de zero; 2. No primeiro termo do membro direito, como rudo branco, tem-se que 2 = = ;
3. O segundo termo do membro direito zero, porque no funo de , e e no esto correlacionados.

Das equaes anteriores resulta ento que = =

100

4. Modelos Matemticos de Processos

Ou em termos de correlao cruzada = = , , ,

(4.128)

Verifica-se assim que, aps o branqueamento da entrada, a funo de correlao cruzada entre as duas sries transformadas directamente proporcional funo resposta ao impulso. Na prtica, no necessrio conhecer a funo de correlao cruzada terica , porque a estimativa da funo resposta ao impulso dada directamente atravs dos valores estimados das variveis envolvidas na equao anterior, ou seja = = , , ,

(4.129)

Esta a funo resposta ao impulso estimada, a partir da qual se podem identificar os valores referentes a (r,s,k). Nota 1: Se existir qualquer tipo de controlo por feedback, o que vai acontecer que os valores de entrada vo ser determinados a partir dos valores da sada , pelo que existir sempre alguma correlao entre a srie de entrada a srie de sada . Por outro lado, se a srie de entrada estiver correlacionada com a srie de sada, torna-se difcil determinar se a correlao dentro da srie de sada se deve prpria dinmica do processo ou ao facto de a srie de entrada estar correlacionada com a srie de sada. Nota 2: H no entanto um problema que se levanta com o branqueamento. Nos sistemas fsicos reais, os valores das sries de entrada so referentes aos valores retirados dos actuadores, que normalmente tm tambm alguma dinmica. O que se pretende normalmente que a constante de tempo referente aos actuadores seja insignificante comparativamente com a constante de tempo da dinmica do processo. Ao proceder-se ao branqueamento da srie de entrada, est-se simultaneamente a branquear a dinmica dos actuadores Identificao do modelo do rudo Voltando ao caso geral, suponha-se que o modelo pode ser escrito na forma = + Onde = d . Aps a obteno da funo de transferncia, a serie dos resduos pode obter-se a partir da equao = Alternativamente, o operador pode ser substitudo pelo modelo de funo de transferncia estimado 1 determinado a partir da identificao preliminar

4. Modelos Matemticos de Processos

101

= A srie temporal dos resduos obtida poder ento ser ajustada a um modelo ARIMA(p,d,q) com recurso a tcnicas com as funes de autocorrelao e autocorrelao parcial discutidas em pontos anteriores. Modelo ARMAX O modelo de funo de transferncia Box-Jenkins considera dinmicas distintas para o modelo do sistema e das perturbaes. Suponha-se que um particular sistema representado pelo modelo = +

Ento este poder ser igualmente representado na forma = +

onde pode ser um qualquer factor comum, e portanto ser redundante. Se o factor for igual a ento obter-se- = + Que tambm poder ser escrito na forma = +
(4.130)

Este modelo referido como modelo ARMAX, cujo nome vem da estrutura ARMA mais a varivel exgena. Neste modelo, a varivel exgena e a varivel endgena . Esta forma torna-se mais simples de manipular quando os objectivos do modelo esto relacionados com projecto de controladores como se ver em captulos posteriores.

4.3.2.2 Ajustamento e validao de modelos de funes de transferncia


At aqui tratou-se de fazer uma estimativa grosseira da funo de transferncia-ruido BoxJernkins a um conjunto sequencial de pares de observaes , retiradas de um determinado processo de forma sncrona e em instantes equidistantes (Deve-se utilizar no mnimo 100 pares (Del Castillo, 2002)). O prximo passo ser tentar estimar simultaneamente e eficientemente os parmetros , = 1 , 2 , , , = 1 , 2 , , , = 1 , 2 , , e = 1 , 2 , , do modelo = +

Onde = d , = d , = d so processos estacionrios e =


(4.131)

102

4. Modelos Matemticos de Processos

Assume-se que esto disponveis = d pares para anlise e que e ( e se > 0) constituem os desvios em relao aos valores esperados. Se os valores iniciais 0 , 0 e 0 anteriores ao inicio da srie so conhecidos, ento, a partir dos dados possvel determinar, para qualquer escolha dos parmetros , , , , , os valores de = , , , , , , para = 1, 2, , . Na suposio da normalidade dos resduos , possvel obter uma aproximao estimativa da mxima verosimilhana minimizando a funo da soma dos quadrados condicional

, , , , =
=

, , , , , ,

(4.132)

Dados os valores iniciais apropriados, o clculo dos podem ser calculados para qualquer escolha dos valores dos parmetros usando um procedimento em trs estgios: 1. Calcular as sadas do modelo da funo de transferncia a partir da equao = 1 ou outro. 2. Calcular os resduos = 3. Os valores podem ser calculados a partir de (4.131) escrito na forma =

A funo da soma dos quadrados tipicamente no linear nos parmetros, pelo que dever ser resolvida recorrendo a metodologias de clculo numrico, ou de forma iterativa, como discutido anteriormente para os modelos ARIMA. Validao do modelo Neste ponto pretende-se encontrar um procedimento que permita inferir sobre a qualidade do modelo que se obteve, ou seja, se o modelo ou no adequado situao onde ser aplicado. O modelo do sistema foi bem identificado se conseguir captar correctamente, e em simultneo, as caractersticas dinmicas e estacionrias do sistema fsico, com base no conjunto de dados de estimao. aconselhvel que se proceda, quando possvel, a uma validao cruzada do modelo, isto , um teste sobre a capacidade do modelo reproduzir um conjunto de dados diferente do utilizado durante o processo de estimao dos parmetros, designado por conjunto de dados de teste. Validao por anlise de resduos Por um lado, para que o modelo possa ser considerado bom, necessrio garantir a total independncia entre a entrada do sistema , e os resduos do modelo , ou seja, um bom

4. Modelos Matemticos de Processos

103

modelo deve conseguir distinguir o que na sada depende da entrada, e o que da sada provm das perturbaes. Por outro lado, por construo do modelo, os resduos , devem constituir uma srie de rudo branco, pelo que no deve existir qualquer autocorrelao para as diversas lags 0. Pode ento concluir-se que para um modelo ideal, os valores dos coeficientes de correlao referidos devero ser baixos, ou seja, devem estar dentro de um intervalo de confiana, tipicamente 2 ou 3 desvios padro. Esta anlise poder ser melhor interpretada com recurso matriz dos coeficientes de correlao entre a entrada e os resduos =

ou, tendo em conta que se procedeu ao branqueamento das sries, =


(4.133)

ou seja, pelo que foi dito acima, pode concluir-se que os valores referentes ultima linha da matriz (4.133) devem ser estatisticamente no significativos. Um teste global para a validao do modelo nos primeiros coeficientes de correlao dos resduos dado pela estatstica qui-quadrado (Del Castillo, 2002):

= +
=

(4.134)

onde = , + . Esta estatstica, em que a hiptese nula 0 : = 0, 2 para = 1, 2, , , segue uma distribuio . Evidentemente, a zona de rejeio o lado direito da cauda da distribuio, pelo que valores elevados significaro elevadas autocorrelaes. De forma similar, um teste global para a estatstica de teste para 0 : = 0, para = 1, 2, , , ser dada por

= +
=

(4.135)

2 que segue tambm uma distribuio +1 ++1 .

4.3.3 Estimao recursiva


Em certas aplicaes prticas torna-se necessrio estimar os parmetros do modelo on-line com recurso a algoritmos de estimao recursiva ou sequencial, como so os casos em que no existem dados disponveis, ou estes so escassos, como por exemplo as pequenas

104

4. Modelos Matemticos de Processos

sries ou short-run. Este tipo de estimao recursiva dos parmetros assume um papel de grande relevo no controlo adaptativo, onde os preditores e so calculados on-line.

4.3.3.1 Algoritmo recursivo dos mnimos quadrados


O objectivo passa por reescrever a soluo da minimizao do erro de predio quadrtico (LSE Least Square Estimator) de uma forma recursiva, ou seja, encontrar uma expresso genrica para a actualizao do vector dos parmetros do modelo estatstico linear = + sob a forma: = +
(4.136)

onde um vector (1) que contem as ultima observaes, o vector (1) dos parmetros, a matriz () dos regressores, 1 o vector dos parmetros calculado no instante anterior, o valor da nova medida do erro, ou erro de predio, ou inovao e o termo de correco, ou ganho, que pesa o valor do erro de predio actual na estimao do novo vector de parmetros. No que se segue, matriz tem a seguinte estrutura =

Onde cada vector contm o s valores dos regressores utilizados a quando da observao . O critrio dos mnimos quadrados consiste da minimizao da soma dos quadrados dos erros

O minimizador off-line desta funo dado pelo estimador dos mnimos quadrados: =

(4.137)

Para a obteno da verso recursiva desta frmula comea-se por definir a matriz

=
=

(4.138)

4. Modelos Matemticos de Processos

105

Em que o factor de esquecimento, que se considera normalmente variante no tempo, 0 < 1, pesando menos o erro de predio obtido com base nas observaes individuais, relativamente s observaes mais recentes. Para o caso de se considerar constante e igual a 1, a equao anterior fica na forma (Del Castillo, 2002)

=
=

(4.139)

A soluo genrica da minimizao do erro de predio quadrtico dado por (Botto, Controlo ptimo, 2007)

(4.140)

Da expresso anterior pode tirar-se respectivamente para 1 e :

=
=

=
=

=
=

Ou seja =

(4.141)

De forma similar, da expresso (4.138) pode tirar-se respectivamente para 1 e :

=
=

=
=

+
=

ou seja = + =

Substituindo esta ultima expresso em (4.141) resulta finalmente: = =


+ +

106

4. Modelos Matemticos de Processos

Conseguindo-se assim uma expresso na forma (4.136), ou seja, os parmetros recursivos dos estimadores dos mnimos quadrados podem ser determinados atravs do algoritmo: = +

(4.142)

= + Para a implementao deste algoritmo recursivo necessrio inverter a matriz em cada instante. A soluo para este problema dada pelo lema de inverso de matrizes (Del Castillo, 2002): +

= +

Onde A e C so matrizes no singulares. Adaptando este lema matriz na forma = + Resulta ento:
A C B D

= +

Definindo-se uma nova matriz = , denominada matriz de covarincia, resulta: = + = +

Por outro lado, do termo de correco (ou ganho) da primeira expresso (4.142) vem =

+ +

= +

4. Modelos Matemticos de Processos

107

Com isto pode-se finalmente estabelecer o algoritmo recursivo dos mnimos quadrados (RLS- Recursive Least Square). Para = 1, 2, 3, , calcular sequencialmente = + =
(4.143)

= As condies iniciais do algoritmo tm de ser definidas. (Botto, Controlo ptimo, 2007) prope como condies iniciais: 1. O vector dos parmetros 0 considera-se normalmente igual a zero. 2. O valor inicial da matriz de covarincia, 0 considera-se normalmente 0 = , > 0 onde o valor a adoptar para a constante influencia simultaneamente, a rapidez de convergncia dos parmetros do modelo, e a estabilidade dessa convergncia (Del Castillo, 2002) prope valores na ordem de 100 ou 1000. 3. O factor de esquecimento considera-se normalmente variante no tempo, 0 < 1, com lim = 1, pesando o erro de predio obtido com base nas observaes iniciais, relativamente s observaes mais recentes.

4.3.3.2 Algoritmo recursivo estendido dos mnimos quadrados


Quando se pretende estimar os parmetros de um modelo com a estrutura = + Em que no constitudo por rudo branco, o algoritmo dos mnimos quadrados recursivo fornece estimativas enviesadas. Uma situao importante em que tal acontece nos modelos de sries temporais onde o termo mdia mvel (MA) aparece. Considere-se por exemplo o modelo ARMAX = + Onde uma sequncia de rudo branco. A expresso anterior tambm pode ser escrita na forma = + +

Onde evidentemente no rudo branco se . Como se viu anteriormente, os modelos, tais como ARIMA ou ARMAX, em que o termo MA est presente, so no lineares nos parmetros, pelo que o mtodo dos mnimos quadrados ordinrio no aplicvel, pelo que ser necessrio recorrer minimizao da soma dos mnimos quadrados ou funo da mxima verosimilhana. Na estimao recursiva, um modo de resolver este dilema passa pelo recurso ao algoritmo dos mnimos quadrados estendido.

108

4. Modelos Matemticos de Processos

O algoritmo recursivo estendido dos mnimos quadrados, ou RELS (Recursive Extended Least Squares) corresponde extenso do algoritmo RLS para os modelos de regresso pseudo-linear: = = Onde o vector regressor foi construdo com base em = =

Dado o carcter iterativo da estimao do vector de parmetros, no possvel conhecer com exactido, num determinado instante , o vector de parmetros do modelo, . Para ultrapassar este problema, considera-se sempre o valor de 1 nas aproximaes dos termos 1 , , presentes no vector regressor:

O algoritmo recursivo estendido dos mnimos quadrados, ou algoritmo RELS (Recursive Extended Least Square) vem dado por = + = +

(4.144)

= = , = 1, ,

5. Sistemas de Controlo

109

5 Sistemas de Controlo
Os sistemas de controlo comuns podem ser classificados sistemas de controlo de referncia ou sistemas de controlo terminal. Nos sistemas de controlo de referncia, a varivel controlada () tem de seguir uma referncia varivel () to prximo quanto possvel, resultando em erros de controlo = () que devem ser to pequenos quanto possvel, 0. Se a varivel de referncia muda com o tempo est-se perante um sistema de controlo de referncia varivel. Se a varivel de referncia constante, ento este denomina-se como um regulador. Para sistemas de controlo terminal, o objectivo atingir-se e manter-se um estado final do processo ao fim de um determinado instante (predito ou livre). Tanto para os sistemas de controlo de referncia como para os sistemas de controlo terminal, os valores iniciais ou as perturbaes dos processos tm de ser compensadas o mximo possvel. Alm disso, o problema de controlo passa por tornar processos instveis em sistemas globais estveis conseguidos atravs de controlo por realimentao ou feedback. Estes problemas podem ser resolvidos, em geral pela aplicao de controladores que utilizam a informao retirada das sadas ou estados dos processos para realimentar o prprio processo. O efeito de feedback pode frequentemente ser melhorado com a introduo de elementos controlo de compensao em avano (feedforward).

v xv Gr
Controlador Por feedback

C/D x n B/A
Processo

Figura 5-1 Diagrama de blocos de controlo em anel fechado

A Figura 5-1 mostra um anel de controlo simples. Se as perturbaes v so mensurveis, pode-se utilizar a compensao em avano (feedforward) como na Figura 5-2, em combinao com o anel de realimentao (feddback loop) para controlo dos distrbios que no podem ser compensados pelo controlo em avano. O projecto de controlo de sistemas desenvolvido de acordo com o grfico da Figura 5-3.Dependendo do mtodo de projecto e da aplicao, so utilizados como base de projecto os modelos matemticos dos processos e dos sinais (distrbios, variveis de referencia, valores iniciais). Frequentemente, os modelos dos sinais apenas se conseguem estimar de forma aproximada. Por simplicidade, assume-se frequentemente alteraes em degrau, apesar de serem raras na prtica. Contudo, com recurso capacidade actual de

110

5. Sistemas de Controlo

computao, possvel obter-se modelos mais exactos de sinais determinsticos e estocsticos sem grandes esforos.

v
Gs
Controlador feedforward

C/D

n
B/A
Processo

Figura 5-2 Diagrama de blocos de sistema de controlo de alimentao em avano (feedforward)

No projecto de controladores lineares h que distinguir dois tipos de sistemas de controlo: sistemas de controlo de parmetros optimizados e sistemas de controlo de estrutura optimizada.
n Processo

Modelo do Processo

Modelo do Sinal

Mtodo de Projecto

Algoritmo de controlo
Figura 5-3 Metodologia de projecto de algoritmos de controlo (Isermann, 1989)

No caso de sistemas de controlo de parmetros optimizados, a estrutura do controlador , isto , a forma e a ordem da equao do controlador, dada e os parmetros livres do controlador so adaptados ao processo controlado atravs de critrios de optimizao ou regras de sintonizao. Sistemas de controlo de estrutura optimizada so sistema em que a estrutura e os parmetros do controlador so adaptados e optimizados estrutura e parmetros do modelo do processo. No primeiro caso tem-se os controladores tipo PID, enquanto que no segundo caso pode enunciar-se os controladores de estado e os controladores de cancelamento (Isermann, 1989). Para projecto, pode recorrer-se a regras de sintonizao, critrios de performance e colocao de plos. A escolha dos critrios de performance tem um papel central no projecto de controladores. Para controlo de sistemas contnuos, o critrio integral tem sido dos mais utilizados, pela integrao dos erros, erros quadrticos, amplitude absoluta, etc., cada um podendo ser

5. Sistemas de Controlo

111

ponderados no tempo. Para sinais discretos, os critrios utilizados tem sido os seguintes (Isermann, 1989):

=
=

Soma do erro

Soma do quadrado do erro

=
=

Soma da amplitude absoluta do erro

=
=

Soma de tempo multiplicado pela amplitude absoluta do erro

A utilizao de no aconselhvel se mudar de sinal, pelo que utilizado mais frequentemente. Contudo, conduz a um comportamento fortemente oscilatrio ao passo que, com e obtm-se um comportamento mais amortecido das variveis de controlo. No projecto analtico prefere-se os critrios de performance quadrticos devido s suas vantagens matemticas. Isso deve-se ao facto de que quando se procura valores extremos, uma simples derivada resulta em relaes que so lineares em . Se aos desvios quadrticos das variveis controladas se adicionar os desvios quadrticos das variveis manipuladas, ponderadas com um factor , obtm-se um acrescento dos graus de liberdade e a possibilidade de uma mais directa infuencia no amortecimento do comportamentodo sistema de controlo. Pelo que, um critrio de performance quadrtica mais geral ser dado pela expresso:

=
=

Que, para sistema de controlo de estado conduz forma

=
=

Estes critrios quadrticos so adequados tanto para sinais determinsticos como estocsticos (Isermann, 1989).

5.1 Controlo ptimo


Nesta seco pretende-se resolver o seguinte problema: como ajustar o processo com a garantia de que os ajustamentos efectuados so os mais adequados para que o erro da sada do processo seja o mnimo possvel. Para isso apresenta-se uma derivao geral de, como se obter um controlador de varincia mnima ou MMSE (Minimum Mean Square Error). Apesar de utpicos, ou seja, geralmente (fisicamente) impraticveis, os controladores MMSE fornecem uma intuio considervel e so facilmente modificveis a fim de se obterem alternativas robustas mais realisticamente implementveis.

112

5. Sistemas de Controlo

5.1.1 Controladores de varincia mnima (MMSE)


Estratgias de controlo que envolvam apenas a minimizao da varivel de sada, ignorando todos os outros custos envolvidos, tornam-se normalmente ineficazes, devido no s aos esforos envolvidos nas variveis manipuladas, como tambm dificuldade da sua implementao fsica. No entanto, o modelo obtido atravs desta estratgia poder conduzir a estratgias de controlo bastante eficazes tanto no campo da implementao fsica como econmica, devido introduo de funes de custo que envolvam para alm da minimizao da varincia da varivel de sada, outros factores a ter em conta, como sejam os custos e as condies operacionais das variveis de entrada: variabilidade, amplitude, tempo de resposta etc. Adicionalmente, a derivao da estratgia de controlo de varincia mnima fornece muita informao sobre os problemas de ajustamento inerentes ao processo. Para se ter uma ideia mais clara sobre este assunto tome-se como exemplo o processo ARX descrito por (Del Castillo, 2002): = + + Onde o a mdia do processo se no existir qualquer ajustamento na varivel manipulada, ou seja, se = . Se o objectivo obter-se o mnimo desvio quadrtico da varivel de sada e simultaneamente que esta mantenha o valor desejado, ou seja, o valor de referncia ou target , ento o objectivo ser = , que se consegue fazendo + + = =

Substituindo este resultado na expresso acima obtm que = + pelo que o erro mnimo ser cuja varincia corresponder varincia mnima . Isto implica que os ajustamentos sero sempre iguais a zero. Se _0 ( )/, ser necessrio apenas um ajustamento. Se = , no ser necessrio qualquer ajustamento. Este resultado est de acordo com os pressupostos da experincia do funil de Demming, onde apenas se o funil est fora do alvo (target), este apenas necessita de ser ajustado ao alvo, aps o que no ser necessrio mais nenhum ajustamento. Este modelo de processos apenas necessitam de ser monitorizados para se garantir que no h qualquer alterao, pelo que a utilizao de tcnicas de controlo estatstico sero suficientes para os objectivos pretendidos.

5.1.1.1 Predio atravs da funo de transferncia


Suponha-se que a funo de transferncia de um determinado processo dada pelo modelo geral =

Que tambm pode ser escrito na forma = + + +


(5.1)

Se o grau dos dois polinmios no for o mesmo, sempre possvel substituir os coeficientes inexistentes por zero. Pode-se ento utilizar este modelo para a base para predio, se

5. Sistemas de Controlo

113

1. Aqui assume-se que o valor de no ainda conhecido quando se faz a predio da varivel de sada instantes frente + . A maneira bvia de se obter a predio da sada como se segue

+ =
=

+ +
=

+ = +
=

+ +
=

ou, em geral

+ =
=

+ +
=

ou + = onde = e = < <


(5.2)

Desde que a predio + depende de outras sadas preditas, as quais elas prprias foram preditas em funo de medidas provenientes de sadas passadas, possvel encontrar uma expresso para + que dependa apenas das medidas das sadas medidas , 1 , (Maciejowski, 2002). Suponha-se que se tem um polinmio , de grau menor ou igual a 1, e um polinmio , de grau 1, tal que: = + ou = Multiplicando (5.2) por obtm-se
(5.3)

114

5. Sistemas de Controlo

+ = ou + = + + Deste modo conseguiu-se construir uma expresso em predio instantes frente da sada do processo + apenas depende dos valores conhecidos (presente e passados) da sada do mesmo processo (o ultimo valor possvel envolvido poder ser no mximo + = = ). Poder ento escrever-se a predio para a sada do processo instantes frente na forma + = + a qual apenas envolve sadas do processo conhecidas no lado direito da expresso. Claro que tudo isto depende da existncia das solues e para a equao (5.3). Esta metodologia um exemplo de aplicao de uma equao de Diophantine (Maciejowski, 2002, p. 126). Identidade de Diophantine Na presena de uma expresso do tipo =

em que os polinmios e so ambos de grau . Se no for o caso, os respectivos coeficientes sero iguais a zero. A identidade de Diophantine (ou equao de Diophantine) representa a longa diviso de por , que resulta num quociente e um resto = +

onde um polinmio de grau menor ou igual a 1, e um polinmio de grau no superior a 1.

5.1.1.2 Predio com modelo de distrbios


Neste ponto assume-se que o processo modulado por funo de transferncia-ruido BoxJenkins que poder ser escrita na forma: = = +
(5.4)

(5.5)

Na qual assume-se, como anteriormente que os polinmios e so do mesmo grau: = + + + = + + +

5. Sistemas de Controlo

115

Onde, como anteriormente, uma modulado como sendo rudo branco. Quando o modelo dos distrbios da forma (5.5) est presente, pode-se recorrer novamente soluo de uma equao de Diophantine para se determinar a predio da sada do processo. Nesta situao assume-se que se tem polinmios e que resolvem a equao = + em que o grau do polinmio no mximo 1 e o grau do polinmio no mximo 1. Ou seja, estes polinmios resolvem a equao de Diophantine = Note-se que, neste caso, o primeiro termo do lado direito o polinmio , ao contrrio do caso anterior que era 1. Esta diferena surge devido ao facto de a entrada do processo ser conhecida, ao contrrio do distrbio que deconhecido. Dividindo ambos os membros da equao anterior por tem-se que = + Usando este resultado e (5.5), obtm-se + = + = + +

(5.6)

A diferena entre a situao anterior e esta na utilizao da equao de Diophantine, que, apesar de se ter dividido a predio entre termos passados e termos futuros, neste caso no se conhece o termo presente dos distrbios . Esse termo ter que ser estimado de alguma forma. Uma das formas possveis passa por pegar no sistema formado pelas equaes (5.4) e (5.5) e resolv-lo em ordem a : =
(5.7)

116

5. Sistemas de Controlo

onde a predio da sada obtida pela filtragem da entrada pelo modelo do processo. O diagrama de blocos da Figura 5-4 mostra uma interpretao da expresso anterior (Maciejowski, 2002).

Figura 5-4 Gerao de - uma interpretao (Maciejowski, 2002)

A partir da expresses (5.4) e (5.6) pode-se ento construir uma expresso para a predio para a sada do processo -instantes frente: + + + +

+ =

Inserindo (5.7) na expresso anterior obtm-se + = + + + +

Tal como em (5.6), esta predio inclui o termo + , que contm apenas predies de valores futuros dos distrbios . A melhor maneira de fazer essas previses seria supor uma determinada natureza de distrbios. No entanto, no seria de bom senso assumir que seja um sinal predizvel de alguma forma porque, se fosse o caso, essa situao deveria reflectir-se nos polinmios C e D. Como o modelo assume que se trata de rudo branco, ento os so independentes e identicamente distribudos com valor esperado nulo, pelo que, nesta situao, faz todo o sentido fazer + = 0. Deste modo obtm-se finalmente o preditor de varincia mnima: + = + +

(5.8)

Para utilizar esta expresso numa estratgia de controlo preditivo, h ainda a necessidade de separar a parte de resposta livre, a resposta predita que ocorre se no houver alterao na entrada do processo (+ = 0), da parte da resposta forada, nomeadamente que depende de (+ . Por outras palavras, necessrio separar a parte que depende das entradas passadas da parte que depende de entradas futuras. Para se atingir esse objectivo, recorre-se a outra equao de Diophantine. Da expresso (5.8), verifica-se que o nico sinal que atravessa a fronteira passado/futuro , que filtrado pela funo de transferncia ()/() ^, pelo que se torna necessrio extrair os primeiros + 1 termos da resposta ao impulso de ()/(). Pelo que se necessita de determinar o par soluo , da equao de Diophantine

5. Sistemas de Controlo

117

= + Em que o grau de no superior a . Substituindo esta expresso em (5.8), obtm-se finalmente (Maciejowski, 2002) + + +

+ = +

= + + +

= + +

(5.9)

5.1.1.3 Soluo geral para o problema de controlo de varincia mnima (MMSE)


Fazendo algumas simplificaes na metodologia apresentada no ponto anterior (5.1.1.1), (Del Castillo, 2002) apresenta a soluo para o problema de controlo de varincia mnima. Uma das simplificaes consiste em utilizar-se um modelo ARMAX em vez do modelo BoxJenkins. Pode-se no entanto considerar que no se trata de uma simplificao, uma vez que possvel passar-se facilmente de um modelo BJ para um modelo ARMAX: = +

= +

Outra das simplificaes foi fazer o horizonte de predio coincidir com o atraso da resposta do sistema. Considere-se ento uma funo de transferncia ARMAX / BJ, e suponha-se que no instante tem que se tomar uma deciso sobre o valor do ajustamento a fazer da varivel de entrada: + = + +
(5.10)

onde k o atraso da resposta do sistema. O segundo termo do lado composto por desvios futuros desconhecidos, +1 , , + , e desvios passados que podem ser estimados a partir dos resduos , 1 , . Para fazer a separao entre desvios passados e futuros, recorre-se novamente equao de Diophantine, fazendo:

118

5. Sistemas de Controlo

= + pelo que a expresso (5.10) ficar ento na forma + = + + +

(5.11)

(5.12)

onde, como anteriormente, de ordem 1 e de ordem 1, em que = , , , onde os coeficientes inexistentes so substitudos por zero. Para estimar os desvios passados e presente, recorre-se novamente ao modelo original (ARMAX/BJ) resolvendo em ordem a para o instante =

Substituindo em (5.12), obtm-se + + + + + + +

+ =

= + +

Da equao (5.11) pode tirar-se ainda que (() () ^)/() = () . Introduzindo este resultado no ultimo termo do lado direito da ultima expresso obtm-se + = + + () +
(5.13)

Omitindo o operador de retardo por simplicidade de notao, a expresso anterior fica na forma + = + + +

Suponha-se que seja o valor de referncia ou alvo, que normalmente zero, uma vez que normalmente significa o desvio em relao referncia. Para se obter o controlador de varincia mnima, tem que se minimizar o valor esperado dos desvios quadrticos +
2

, ou seja minimizar:

5. Sistemas de Controlo

119

= + +
+

Onde o ultimo termo corresponde ao erro estacionrio ou offset da sada do processo. A partir da expresso (5.13) simplificada, e substituindo os desvios futuros por zero (valor esperado de rudo branco) tem-se ento que + = +

Onde o primeiro termo do lado direito o valor espectvel em para a varivel de sada + no instante + quando o valor da varivel de entrada nulo no instante t, ou seja, se o processo no for controlado. Ento, fazendo = 0 po, r questes de simplicidade,

= +

= + +

+ +

= +

+ +

+ + +

Onde se obtm a igualdade se se ajustar a varivel de entrada de modo a que + = , ou seja, o valor de tem que ser tal que + = + =

= De onde se obtm a lei de controlo de varincia mnima ou MMSE: = ()


(5.14)

Substituindo a lei de controlo (5.14) na expresso do modelo do processo (5.13), obtm-se a equao de sada em malha fechada representada pelo diagrama de blocos da: + = + + () + = + ()

120

5. Sistemas de Controlo



Processo (BJ)


Controlador

= +

Da expresso anterior conclui-se que a sada de um sistema constitudo por um processo BJ e um controlador MMSE em malha fechada, segue um processo MA(k-1). Isso implica que a sada ser estacionria, mas no ser rudo branco puro, uma vez que em geral ser no correlacionada. Pode ainda concluir-se que, em malha fechada, o desvio mdio quadrtico ser dado por (Del Castillo, 2002):

+ = =
=

5.1.2 Controlador de Varincia mnima generalizado


A grande variabilidade a que os factores manipulveis (entradas) ficam sujeitos sob as leis de controlo de varincia mnima, tornam-se geralmente impraticveis economicamente e/ou mesmo fisicamente. Esse facto deve-se, geralmente, transferncia da variabilidade das sadas (outputs) para as entradas (inputs). O problema na prtica que uma manipulao excessiva dos factores manipulveis, na maioria dos casos, tornam-se indesejveis, no s porque exigem grandes esforos, mas tambm porque, normalmente, os sistemas so linearizados na vizinhana de um ponto de actuao, e ao afastar-se dele, ter que haver uma adaptao dos prprios parmetros. Estas limitaes podem ser traduzidas custos proporcionais s amplitudes das aces de controlo . Ou podero ser impostas restries na gama de valores que os factores manipulveis podem tomar; normalmente escalados no intervalo 1, 1 como usual em desenho de experincias, que muitas das vezes so utilizados como meio de identificao dos processos. Uma forma indirecta de atingir estes objectivos restringir a varincia dos factores manipulveis: . Pode assim concluir-se que existe a necessidade de um controlador que minimize a varincia das variveis de sada mas sujeito a restries nas variveis dos factores manipulveis. Uma tcnica relativamente simples que resolve este problema entre outros foi proposto por Clarke e Gawthrop, pelo que ficou conhecido como o controlador Clarke-Gawthrop . Os controladores MMSE concentram o seu critrio de desempenho na minimizao da varincia de sada =

5. Sistemas de Controlo

121

Que ser minimizado seleccionando tal que + = 0 para todos os instantes t. Uma extenso natural deste critrio, e de acordo com o que foi dito no inicio desta seco, ser estend-lo tambm s variveis de entrada = + + A constante pode ser vista como o multiplicador de Lagrange de 2 que a restrio do MSE do factor manipulvel. Se est escalado de forma centrada em zero, e se o sistema no estado livre (no controlado) no flutua, ento = . Para minimizar , Clarke e Gawthrop props a decomposio de + em + = + + + Em que o ultimo termo o erro de previso, que independente de , e que portanto apenas funo de erros futuros em relao ao instante t. Introduzindo esta ultima expresso, ser dado por (Del Castillo, 2002): + = + + + + + + + + Como os termos cruzados so nulos e = , a expresso anterior reduz+ + se a + = + + + + + Como no funo de , para se minimizar torna-se suficiente minimizar + apenas o ultimo termo da expresso anterior = + = +

+ +

Onde a funo densidade probabilidade de . Assim esta expresso reconhece o facto de que o factor de controlo uma varivel aleatria que depende de que por seu lado depende dos erros . Como se pode verificar, surge uma dificuldade: A densidade de depende da lei de controlo por realimentao (feedback) que se pretende determinar em primeiro lugar. Por outro lado, Clarke e Gawthrop props minimizar o valor esperado condicional: = + , , = + = + + + +
(5.15)

Onde a ultima igualdade surge de se ter tomado o valor esperado condicionada s observaes presentes e passadas. Se as observaes so conhecidas, ento deixa de ser uma varivel aleatria, pelo que e o valor esperado condicional de pode + ser ento determinado usando o critrio da mnima media dos erros quadrticos MMSE (5.13):

122

5. Sistemas de Controlo

+ = + =

() +

Inserindo este resultado em (5.15) obtm-se = +

onde, por uma questo de simplicidade, se omitiu o operador de atraso. Para minimizar procura-se o mnimo da funo recorrendo aos zeros da derivada: + = + = + + + Como os nicos coeficientes dos polinmios B, F e C que esto envolvidos no termo derivativo + so os coeficientes de ordem zero, tem-se + () = = () Deste modo, tem-se finalmente que = + + = Resolvendo em ordem a obtm-se finalmente o controlador de varincia mnima generalizada de Clarke-Gawthrop: = +
(5.16)

6. Anlise Multivariada

123

6 Anlise Multivariada
6.1 Sries temporais Multivariadas
A anlise multivariada de sries temporais o estudo de modelos estatsticos e mtodos de anlise que descrevem a relao entre vrias sries temporais. Ou seja passa-se de uma varivel usada para quantificar a sada de um determinado processo num determinado instante no caso univariado para uma varivel vectorial = 1 , 2 , que quantifica as diversas variveis mensurveis envolvidas no processo. Os processos multivariveis tm interesse nas mais variadas reas tais com engenharia, fsica, cincias da Terra tais como meteorologia ou geofsica, economia e finanas. Por exemplo, em engenharia, pode-se estar interessado em estudar comportamentos simultneos de corrente e tenso, temperatura, presso e volume, ao passo que em economia pode-se estar interessado simultaneamente em taxas de juro, disponibilidade financeira, desemprego etc. No estudo de processos multi-variados, torna-se necessrio a existncia de uma estrutura que descreva no apenas as propriedades das sries individuais mas tambm a possibilidade de relaes cruzadas entre as sries. Estas relaes so frequentemente estudadas e detectadas da considerao das estruturas de correlao entre as vrias componentes da srie. Os objectivos da anlise e modelao das sries em conjunto so compreender a relao dinmica ao longo do tempo entre as sries e melhorar a preciso da previso para as sries individuais recorrendo informao adicional proveniente da relao entre as sries. A maioria fundamental dos conceitos tericos descritos nas seces anteriores para as sries temporais univariadas estendem-se aos sistemas multivariados, mas surgiro novos problemas e desafios na modelao e anlise das sries temporais multivariadas devido grande complexidade dos modelos e parametrizaes na situao vectorial.

6.1.1 Series temporais multivariadas estacionrias


Seja ento = 1 , , , = 0, 1, 2, um vector srie temporal de dimenso k, a escolha de uma determinada serie componente incluida em , depender do assunto e compreenso do sistema em estudo, mas est implcito que a serie componente estar inter-relacionada tanto contemporaneamente, ao longo das sries componentes, com ao longo do tempo (das lags de tempo). O principal interesse da anlise das series temporais multivariadas ser a representao e modelao das relaes dinmicas entre as diversas series componentes. Tal como no caso univariado, um conceito importante na anlise, e representao dos modelos de sries temporais a estacionaridade. O processo estacionrio se a distribuio de probabilidade dos vectores 1 , 2 , , e 1 + , 2 + , , + a mesma para tempos arbitrrios 1 , 2 , , qualquer que seja ou , ou seja, a distribuio de probabilidade das observaes de um processo vectorial estacionrio invariante no tempo. Consequentemente, assumindo-se que os primeiro e segundo momentos existem, para um processo estacionrio ter-se- = constante, qualquer que seja , em que = , , , o vector da mdia do

124

6. Anlise Multivariada

processo. Adicionalmente, o vector dever ter uma matriz de covarincia constante definida por = = . Ver (3.2.2-Processo estacionrio). 0

6.1.1.1 Covarincia e correlao de um processo vectorial estacionrio


Para um processo estacionrio , a covarincia entre , e ,+ tem de depender apenas de da lag e no do tempo . Para os componentes = 1, , , = 1, , , de um processo estacionrio vectorial de dimenso , e para as lags = 0, 1, 2, , a covarincia cruzada entre o componente e o componente na lag definida pela expresso: = , ,+ = , ,+ e a matriz de dimenso de covarincia cruzada da lag definida por =


(6.1)

para = 0, 1, 2, . As correspondentes correlaes cruzadas da lag so definidas por = , ,+ =


Com 0 = obviamente. Da mesma forma, a matriz de correlao cruzada da lag definida por =


(6.2)

para = 0, 1, 2, , onde 1 2 = 11 0 1 2 , , 0 1 2 . Deste modo, para = , = a funo autocorrelao da i-sima srie , e para , = a funo de correlao cruzada entre as sries e . De notar que = e = , uma vez que = (Reinsel, 1997), ver Figura 4-11 para o caso bivariado. Adicionalmente, as matrizes de correlao cruzada e de covarincia cruzada tem a propriedade de serem no negativas definidas, uma vez que

=
= =

6. Anlise Multivariada

125

Para qualquer inteiro positivo n e qualquer vector constante de dimenso k 1 , , (Reinsel, 1997)

6.1.1.2 Desvios Normais Multivariados


Processo rudo branco vectorial O exemplo base de um processo estacionrio vectorial ou multivariado, o processo rudo branco multivariado, que funciona como unidade base estrutural para processos vectoriais (multivariados). O processo vectorial rudo branco definido como uma sequncia de vectores aleatrios independentes, , 1 , , , em que = 1 , , , tal que = 0, = , onde a matriz de covarincia assumida positiva definida, e + = 0 para 0 devido independncia. Consequentemente as suas matrizes de covarincia so dadas por = + = =

De notar que, apesar dos vectores rudo branco serem independentes e identicamente distribudos (IID) entre eles, os elementos componentes de cada vector no gozam da mesma propriedade. Desvios normais multivariados Um desvio aleatrio vectorial de dimenso um ponto num espao de dimenso . As suas coordenadas so um vector em que cada uma das suas componentes aleatria, mas que, em geral, no so independentes ou identicamente distribudas. O caso especial de desvios normais multivariados definido funo densidade probabilidade Gaussiana multidimensional , =

Onde o parmetro um vector que, como normalmente, a mdia da distribuio, e o parmetro uma matriz simtrica, positiva definida, que, como normalmente, a covarincia da distribuio. Existe um modo bastante geral para construir um vector de desvios com parmetros e , partindo de um vector de desvios aleatrios independentes de mdia zero e varincia unitria: primeiro utilizar a decomposio de Cholesky para factorizar numa matriz triangular multiplicada pela sua transposta =
(6.3)

Este passo sempre possvel porque uma matriz positiva definida, e apenas se necessita de executar este passo para cada matriz distinta. A seguir, sempre que se necessitar um novo desvio , construir um vector com desvios normais independentes de mdia zero e varincia unitria, e ento construir (Teukolsky, Vetterling, & Flannery, 2007)

126

6. Anlise Multivariada

= + Retirar a componente de correlao de variveis aleatrias multivariadas

(6.4)

De modo similar, mas em sentido contrrio, dada a decomposio (6.3) e um vector , constitudo por rudo branco multivariado, cujas componentes tem covarincia e mdia conhecidas, tem-se que o vector dado por = tem componentes no correlacionadas com varincia unitria.
(6.5)

6.1.1.3 Filtros lineares


Um filtro linear (invariante no tempo) que relacione uma srie de entrada , de dimenso , com uma serie de sada , de dimenso dado pela forma

=
=

onde uma matriz . O filtro fisicamente realizvel ou causal quando = para < 0, tal que = = se pode expressar apenas em termos de valores passados e presente do processo de entrada . O filtro diz-se estvel se
=

< onde

significa a norma da matriz definida por 2 = . Quando o filtro estvel e a serie de entrada estacionria com matriz de covarincia cruzada xx , a sada um processo estacionrio. A matriz de covarincia cruzada do processo estacionrio ento dada por

= , + =
= =

xx +

6.1.2 Representao de modelos lineares para processos vectoriais estacionrios


Um processo vectorial pode ser representado como um processo mdia mvel (MA) infinito

= +
=

= + ,

(6.6)

6. Anlise Multivariada

127 uma matriz do operador de atraso, e os coeficientes da


=

onde =

matriz satisfazem a condio o vector rudo branco.

< . Na expresso (6.6), = , , forma

6.1.2.1 Representaes de modelos VARMA (Vector Autoregressive-Moving Average)


Suponha-se que a matriz pode ser representada (pelo menos de forma aproximada) pelo produto de duas matrizes na forma , onde = e = so polinmios em de matrizes de ordem finita, e e so matrizes . Pode-se ento considerar uma classe de modelos lineares para series temporais vectoriais definidas pela relao = , ou seja

=
=

(6.7)

onde um vector ruido branco com mdia zero e matriz de covarincia = . Este modelo um generalizao natural dos modelos univariados ARMA(p,q) que ser de grande utilidade na modelao de srie temporais vectoriais.

Um processo vectorial estacionrio ARMA(p,q) definido pela relao (6.7) diz-se causal se puder ser representado na forma (6.6) para qualquer = 0, 1, 2, , com < . = Um processo vectorial ARMA(p,q) diz-se invertvel se puder ser representado na forma

=
=

(6.8)

ou = onde = Estacionaridade

com

< .

Um processo vectorial descrito por um modelo ARMA(p,q) na forma (6.7), estacionrio se todas as razes de = so maiores que um em valor absoluto. Nesse caso, o processo , pode ser representado na forma de mdia mvel (MA) infinita como em (6.6), com = representando a serie matricial convergente para . Invertibilidade De forma similar, um processo vectorial descrito por um modelo ARMA(p,q) na forma (6.7), diz-se invertvel se todas as razes de = so maiores que um em valor absoluto (Reinsel, 1997). Nesse caso, o processo invertvel com

=
=

Representando a srie matricial convergente para e possui uma representao autoregressiva infinita como em (6.8).

128

6. Anlise Multivariada

Segue-se ento que para um processo estacionrio ARMA(, ), os coeficientes matriciais da representao MA infinita (6.6) so determinados a partir da relao = , e consequentemente, igualando os coeficientes com o mesmo expoente, satisfazem a relao = + + + onde = , = para < 0, e = para > . Reciprocamente, nas condies de invertibilidade, os coeficientes de ponderao na representao infinita AR (6.8) so determinados a partir da relao = , e consequentemente, igualando os coeficientes com o mesmo expoente, satisfazem a relao = + + + onde = , = para < 0, e = para > . Matrizes de covarincia de processos vectoriais ARMA Um processo estacionrio ARMA(p,q) dado por (6.7) pode ter uma representao MA infinita dada por (6.6). Ento, a partir de (6.6), fcil de verificar que (Box, Jenkins, & Reinsel, 2008) = < = , , = , ,

Deste modo, torna-se fcil determinar, a partir de (6.7) que as matrizes de covarincia = do processo satisfazem a relao

, =
=

+ ,
=

e, consequentemente,

=
=

= , , ,
=

(6.9)

Com a conveno de que = , e que =

para > . Deste modo, as

matrizes de covarincia , podem ser desenvolvidas em termos dos parmetros matriciais AR e MA, e , e , atravs desta forma recursiva. Modelo vectorial autoregressivo Se num modelo vectorial ARMA(p,q), a ordem da componente mdia mvel for zero ento ter-se- um modelo vectorial autoregressivo puro vector ARMA(p,0) ou vector AR(p) ou ainda VAR(q) dado pela expresso

6. Anlise Multivariada

129

Tal como nos processos univariados, as condies de estacionaridade de um processo vectorial AR(p) so as mesmas que para um processo ARMA(p,q), ou seja estacionrio se todas as razes de = so maiores que um em valor absoluto. Nesse caso, o processo tem uma representao MA infinita = = . = , em que = Para um modelo vectorial autoregressivo puro VAR(p), a expresso das matrizes de covarincia (6.9) reduz-se matriz das equaes de Yule-Walker dadas por

=
=

= , ,

(6.10)

Com =

+ . Estas equaes podem ser de grande utilidade para

determinar , = , , , , , em termos dos parmetros matriciais AR, e . Reciprocamente, conhecida ou estimada a ordem , as matrizes , , e podem ser determinadas a partir de , , , resolvendo o sistema de equaes matriciais de Yule-Walker

=
=

= , , ,

(6.11)

Estas equaes podem serem escritas na forma matricial como = com soluo =
(6.12)

onde = , , , uma matriz , = , , , uma matriz e uma matriz bloco em que a matriz elementar ndice (, ) composta pela matriz de covarincia . Uma vez determinado a matriz coeficiente a partir de (6.11), a matriz de covarincia pode ser determinada a partir da expresso (Reinsel, 1997)

=
=

= = =

Modelo vectorial mdia mvel Se num modelo vectorial ARMA(p,q), a ordem da componente autoregressiva for zero ento ter-se- um modelo mdia mvel puro vector ARMA(0,q) ou vector MA(q) ou ainda VMA(q) dado pela expresso

130

6. Anlise Multivariada

= + = +
=

Tal como nos processos univariados, as condies de invertibilidade de um processo vectorial MA(q) so as mesmas que para um processo ARMA(p,q), ou seja invertvel se todas as razes de = so maiores que um em valor absoluto. Nesse caso, o processo tem uma representao AR infinita = ou . = = , com = Para um modelo vectorial mdia novel puro VMA(q), a expresso das matrizes de covarincia (6.9) reduz-se a

=
=

(6.13)

Para = 0, 1, , , com = , = e = para > (Reinsel, 1997). Verifica-se assim que para um processo MQ(q), todas as correlaes cruzadas so nulas para lags maiores que q. Reciprocamente, a expresso (6.13) pode ser utilizada para obteno das matrizes coeficiente a partir dos coeficientes de correlao cruzada s de um processo MA(q). Representao de um processo VARMA na forma VAR(1) (Ltkepohl, 2007) prope de modelo VARMA numa representao na forma VAR(1), que poder ser bastante til para predio ou, fundamentalmente, para representao em espao de estados. Suponha-se que tem uma representao VARMA(p, q) standard (6.7)

=
=

Ou, na notao utilizada por (Ltkepohl, 2007) cujas equivalncias so obvias


= +
=

+
=

Por simplicidade, assume-se mdia nula e consequentemente, = . Defina-se + : = +


+

: =

6. Anlise Multivariada

131

e onde

+ +

Com esta notao, obtm-se a representao VAR(1) de um processo VARMA(p,q) = +

6.1.2.2 Aspectos da no unicidade para os modelos vectoriais ARMA


Para um modelo misto vector ARMA(p,q) dado por (6.7) com > 0 e > 0 especificamente, so necessrias certas condies nos operadores matriciais e para se garantir uma representao nica do modelo ARMA e a identificabilidade de parmetros. De notar que esta situao no se verifica nos modelos puros AR(p) e MA(q), mas ao evitar-se o uso de modelos mistos ARMA(p,q), pode por vezes ser-se conduzido utilizao de modelos puros no muito parcimoniosos no numero de parmetros necessrio representao do processo. Especificamente na situao multivariada, possvel que para duas representaes ARMA(p, q), = e = com diferentes coeficientes matriciais, dem os mesmos coeficientes na representao MA infinita = = do processo, ou seja = =

Consequentemente, representaes diferentes do origem mesma estrutura matricial de covarincia do processo. Duas representaes de um modelo ARMA(p, q) com estas

132

6. Anlise Multivariada

propriedades dizem-se observacionalmente equivalentes. (Box, Jenkins, & Reinsel, 2008) d o exemplo de um modelo ARMA(1,1) bivariado = com a forma = =

Que observavelmente equivalente a um modelo AR(1) = e a um modelo MA(1) = com =

Este problema similar, mas mais complexo, que o problema da sobreparametrizao e redundncia de parmetros que existe no caso ARMA univariado. Os parmetros de um modelo ARMA(p, q) so identificveis se os parmetros e so unicamente determinados pelas matrizes da resposta ao impulso do operador da representao MA infinita (nica) do processo, ou seja, se no existe outro par de operadores ARMA(p,q) , que seja observacionalmente equivalente a , (Reinsel, 1997).

Para alm das condies de invertibilidade e estacionaridade, i. Todas a s razes de = 0 e todas as razes de ser maiores que zero em valor absoluto = 0 tm de

As duas condies seguintes so suficientes para a identificabilidade dos parmetros num modelo ARMA(p,q) (Reinsel, 1997) ii. As matrizes e no tem factores comuns, a no ser factores unimodulares, isto , se = e = , ento o factor comum tem de ser unimodular, isto uma constante (diferente de zero), e

iii. Com q menor possvel p menor possvel para este q, a matriz , tem que ter rank completo Quando se verifica a propriedade (ii), os operadores e dizem-se left-coprime, e a representao = diz-se ser irredutvel. Uma abordagem particular para identificao, representar o modelo ARMA numa certa forma cannica a partir da qual existe um nico modelo representativo dessa forma para cada classe de modelos ARMA observacionalmente equivalentes. Essa abordagem ser discutida na seco 6.1.2.3 em relao forma cannica escalo (echelon). Modelos vectoriais ARMA no estacionrios Na prtica, muitos processos tm comportamento no estacionrio, frequentemente de natureza homognea, como deriva ou tendncia a nvel local, mas que no global apresentam um padro homogneo. Frequentemente, por exemplo num modelo ARIMA univariado, a no estacionaridade pode ser retirada diferenciando as sries.

6. Anlise Multivariada

133

Para os modelos vectoriais ARMA, as condies para a estacionaridade exigem que todas as razes de = 0 sejam maiores que um em valor absoluto. Generalizando para processos no estacionrios, mas no explosivos, pode-se considerar uma forma geral de modelos vectoriais ARMA, =, , onde alguns valores de = 0 podem ter o valor absoluto igual a um. Mais especificamente, devido ao papel proeminente do operador 1 nos modelos univariados, pode-se permitir apenas algumas razes unitrias, sendo as restantes superiores a um em valor absoluto. Considere-se primeiramente modelos da forma =
(6.14)

Onde = , , , uma matriz diagonal, 1 , 2 , , so inteiros positivos, e = tem todas a razes maiores que um em valor absoluto. Este modelo que referido como modelo vectorial ARIMA, apenas estabelece que aps a diferenciao individualmente de cada srie de um apropriado numero de vezes para a reduzir a uma srie estacionria, a srie vectorial resultante = ser um processo vectorial ARMA(p,q) estacionrio. Como se ver seguidamente, este modelo quase no to geral como o modelo = , onde so permitidas algumas razes de = com valor absoluto igual a um. A utilizao destes modelos em situaes no apropriadas poder conduzir a sobre diferenciao e consequentemente no invertibilidade do operador MA. O aspecto da no estacionaridade (razes unitrias) de um processo vectorial torna-se assim mais complicado comparativamente ao caso univariado, devido em parte possibilidade de cointegrao entre as sries componentes de um processo vectorial no estacionrio. Por exemplo, existe a possibilidade de uma srie componente ser no estacionria, com a srie das suas primeiras diferenas 1 estacionria (neste caso dir-se- cointegrada de ordem um), mas tal que ceras combinaes lineares = sero estacionrias. Nestes casos o processo diz-se cointegrado com vector de cointegrao . Uma interpretao de cointegrao, particularmente relacionada com modelos econmicos, que as sries componentes individuais partilham algumas componentes no estacionaria comuns ou tendncias comuns, e consequentemente, tem tendncia a ter alguns movimentos similares no seu comportamento a longo prazo. Uma estrutura especifica de modelo ARMA no estacionrio em que ocorre cointegrao o modelo = , onde = tem < razes unitrias e todas as restantes maiores que um em valor absoluto, e em que a matriz tem rank igual a = . Deste modo, pode estabelecer-se que existem vectores linearmente independentes tal que tem comportamento estacionrio. Diz-se ento que tem cointegrao rank .

6.1.2.3 Forma cannica escalo do modelo VARMA


No campo da modelao, o objectivo principal deste trabalho determinar uma funo de transferncia para um processo na forma VARMA estandardizada (6.7) para ser utilizada no algoritmo de predio e/ou controlo. Contudo, o esforo de modelao, no sentido de se obter o modelo mais prximo possvel do comportamento do processo, poder ter objectivos diferentes como a filtragem do processo com o objectivo de se aplicar controlo estatstico

134

6. Anlise Multivariada

multivariado, ou apenas para previso do comportamento futuro do processo. Neste sentido, e tambm porque o objectivo do trabalho passa por obter um modelo do processo que apresente o melhor desempenho possvel, apresenta-se uma abordagem muito ligeira a outras formas representativas que podero revelar-se mais teis para especificao dos modelos dos processos que a forma estandardizada. Um vector ARMA(p,q) pode ser escrito na seguinte forma equivalente
#

(6.15)

# # # # onde uma matriz no singular arbitrria, com # = , # = , e # = . Para

se obter uma identificabilidade nica dos parmetros do modelo na forma (6.15), torna-se # necessrio restringir (normalizar) a forma da matriz , que dever ser, no mnimo, triangular inferior com uns (1s) na diagonal. Para especificar a forma cannica, para alm dos habituais indicies p e q, necessrio determinar outro conjunto de ndices, chamados ndices de Kronecker 1 , 2 , , , que iro corresponder ordem dos polinmios em de cada uma das variveis que compem o vector . A forma cannica de um modelo ARMA determinada como sendo a representao (6.15) tal que # , # tem o menor grau de linha possvel, em que o grau da linha de # , # , para i= 1, , , em que o grau do modelo (p, q) vai ser determinado por = = 1 , 2 , , . A especificao destes ndices, conhecidos como ndices de Kronecker, que so nicos para qualquer classe equivalente de modelos ARMA, e determinam o modelo (6.15) de forma nica, no qual os parmetros desconhecidos so identificados de forma nica. Grau McMillan de um processo vectorial ARMA Para qualquer processo vectorial com matrizes de covarincia , define-se a matriz bloco de dimenso infinita, denominada como Matriz de Hankel de covarincia por =

O grau de McMillam M do processo definido pelo rank da matriz H. O processo segue um modelo ARMA finito se e s se o rank da matriz H finito. Para um processo ARMA(p,q), a relao de momentos (6.7) resulta em

para > . A partir daqui pode-se verificar que o rank de H (o grau de McMillan) satisfar a relao , onde = {, }, consequentemente verificar-se- por exemplo a seguinte relao

6. Anlise Multivariada

135

, , , , , , , = com = para > . Consequentemente, todas a linhas constitudas por blocos de H para alm do s-simo bloco linha sero linearmente dependentes das linhas bloco precedentes. Contudo, o grau de McMillan de um vector ARMA(p,q), = = , , = , , poder ser consideravelmente inferior a devido s deficincias de rank nos coeficientes matriciais MA e AR. O grau de McMillan M interpretado como o nmero de combinaes lineares linearmente independentes dos vectores passados e presente , , que so para uma predio ptima para todos os vectores futuros dentro da estrutura ARMA (Reinsel, 1997). Forma cannica implcita pelos ndices de Kronecker A exemplo do que foi feito para a expresso (6.6), as matrizes de covarincia cruzada do processo definido por (6.15), sero dadas por
# =

# =
=

Se () for a i-sima linha de # , ento o i-simo ndice de Kronecker que ser implica a dependncia linear nas linhas da matriz de Hankel da forma

0 ()
=

() =

+ 1

(6.16)

Que pode ser na forma = 0 com = , , 1 , 0 , 0 , . De notar que, por definio do i-simo ndice de Kronecker , o vector 0 na expresso anterior deve ser construdo de modo que a componente ndice i seja 1 e que as componentes com ndice superior a i sejam nulas. Consequentemente, o ndice de Kronecker igual a , implica, em particular, que a representao do modelo ARMA da forma (6.15) deve ser construda de forma a que i-sima linha das matrizes # e # sejam zero para > . Adicionalmente, a expresso (6.16) implica que certos elementos da linha i das matrizes # , para sejam nulos. Especificamente, o l-simo elemento da i-sima linha de 0 deve ser zero sempre que + , porque para as linhas + + , = 0, , , da matriz de Hankel so todas linearmente independentes das linhas anteriores. Consequentemente, o elemento ndice (, ) do operador AR

em (6.15) pode ser especificado para ter coeficientes diferentes de zero apenas para as lags = + 1, , , com coeficientes iguais a zero para qualquer lag abaixo de j (quando ), onde se define

136

6. Anlise Multivariada

+ 1, ,

>

(tal que sempre que se tenha = ). Deste modo, o correspondente numero de parmetros de AR desconhecidos no elemento (, ) de # igual a . Assim, o operador AR # no modelo (6.15) pode ser especificado de forma a que o numero total de parmetros desconhecidos de # igual a =1 =1 = + , enquanto # que o numero de parmetros desconhecidos no operador MA em (6.15), excluindo os # parmetros referentes a # = igual a = (Reinsel, 1997). =1 Forma de rank reduzido do modelo VARMA implcita pelos ndices de Kronecker
# Multiplicando o modelo ARMA na forma cannica (6.15) por vectorial ARMA na forma standard # # =

, obtm-se o modelo

+
=

#
(6.17)

+
=

Nesta forma standard do modelo VARMA, as matrizes coeficiente AR e MA,


# respectivamente = # # e =

# , podem adquirir uma forma especial de rank


# # ,

# reduzido. Seja , com = 1, , , o rank das matrizes , =

# . Tem

se ento que o rank igual ao numero de ndices de Kronecker que so iguais ou maiores que a lag j, ou seja, se no conjunto dos ndices de Kronecker existirem n ndices com valor igual ou superior a j, ento o valor de coincidir com o valor n. Consequentemente, as matrizes # , # tero uma linha s com zeros para cada ndice de Kronecker em que > . Deste modo, o rank vai decrescendo medida que j aumenta. Denotando como sendo a submatriz da matriz identidade que selecciona as linhas no nulas de # , # , tal que , # , # so composta apenas pelas linhas no nulas de # , # . Ento tem-se que
# , = # onde =

, ,

uma matriz . Com esta expresso obtm-se uma factorizao de

rank reduzido das matrizes coeficiente , na forma standard (6.17). Assim, o modelo vectorial ARMA na forma standard pode ser escrito como

=
=

+
=

(6.18)

O modelo vectorial ARMA desta forma pode ser referido como representao de rank reduzido encadeado do modelo ARMA (nested reduzed-rank ARMA model representation) (Reinsel, 1997).

6. Anlise Multivariada

137

6.1.2.4 Estrutura de Correlao Cannica para sries temporais ARMA


Como descrito na seco 4.2.6.2 - Mtodo das correlaes cannicas, a anlise de correlao cannica consiste em determinar, para dois conjuntos de variveis, 1 = 11 , 12 , , 1 1 e 2 = 21 , 22 , , 2 2 , de dimenses 1 e 2 respectivamente (assume-se que 1 2 ), combinaes lineares = 1 e = 2 , = 1, , e as correspondentes correlaes = , com 1 2 1 0, tal que tal que os e os esto mutuamente no correlacionados para . 1 e 1 tem a mxima correlao possvel 1 entre todas as combinaes lineares de 1 e 2 , 2 e 2 tem a mxima correlao possvel 2 entre todas as combinaes lineares de 1 e 2 que no esto correlacionadas com 1 e 1 , e assim sucessivamente. As estimativas amostrais de correlaes cannicas de populaes so construdas de forma bvia. Suponha-se que 1 = 1 , 2 , = 1, , , uma amostra aleatria de observaes vectoriais da distribuio = 1 , 2 . Ento, a matriz de covarincia amostral dada por = 1 , onde = 1 obviamente o vector da =1 =1 mdia amostral, e seja particionada de obvia com ij = 1 para =1 = 1, 2. Ento as correlaes cannicas amostrais so os valores 1 > 2 > > 1 > 0 tal
1 que 2 so os valores prprios ordenados da matriz 11 12 1 21 , tal que os 2 satisfazem 22 a relao

= ,

= , ,

(6.19)

onde os so os respectivos vectores prprios. As correlaes cannicas parciais amostrais entre 1 e 2 , dado 3 so definidas de forma similar baseado na amostra = 1 , 2 , 3 , = 1, , , seguindo o procedimento descrito na seco 4.2.6.2 Mtodo das correlaes cannicas. Na anlise de correlao cannica, est-se frequentemente interessado nas combinaes lineares de 1 e 2 que possuam uma forte correlao e, talvez ainda mais importante, quando que algumas das correlaes cannicas entre 1 e 2 so (essencialmente) nulas, uma vez que esse facto pode conduzir a uma reduo substancial da dimenso do estudo das relaes entre os dois conjuntos de variveis. Uma propriedade importante que se existirem (no mnimo) 1 combinaes lineares linearmente independentes de 1 que so completamente no correlacionadas com 2 , seja por exemplo = 1 tal que 1 , = 21 A = 0, ento existem no mnimo correlaes cannicas entre 1 e 2 que so nulas. O facto de se ter 21 A = 0 implica as colunas linearmente independentes de A 1 satisfazem a relao (4.105), 2 11 12 1 21 = 0, para = 0, e consequentemente 22 existem (no mnimo) valores prprios em (6.19). Com efeito, o numero de correlaes cannicas nulas igual a 1 = 1 , onde = 21 . Baseado na amostra de observaes vectoriais, o teste de hiptese de que as ultimas 1 correlaes cannicas populacionais entre 1 e 2 so nulas dado por =
=+

(6.20)

Este teste segue uma distribuio com 1 1997).

graus de liberdade (Reinsel,

138

6. Anlise Multivariada

6.1.2.5 Modelo vectorial autoregressivo e matrizes de autoregresso parcial


Para um processo vectorial estacionrio com matriz de covarincia , poder ser por vezes conveniente, especialmente na fase de determinao da ordem do processo, ou para propsitos de predio, aproximar o modelo do processo a um modelo vectorial autoregressivo, sendo o processo um AR puro ou no. Assumindo-se um processo com media nula, para uma determinada ordem m, pode-se determinar os coeficientes matriciais 1m , 2m , , mm numa aproximao a um modelo autoregressivo que minimize a quantidade

O valor esperado envolvido na expresso acima pode ser expresso como (Reinsel, 1997)
() , () , = () () () + () ()

Onde
, = , ,

= , , = , = , , , () = , , , , A minimizao deste critrio um problema de regresso linear dos mnimos quadrados, multivariada normal. A matriz dos coeficientes que minimizam o critrio sero a soluo da equao vectorial de Yule-Walker de ordem m, () = , ,
, =

(6.21)

Tal como no caso univariado, para = 1, 2, , pode-se definir uma sequncia de matrizes , a que se deu o nome de matriz de autoregresso parcial (partial autoregression matrix) de ordem (ou lag) m, como a soluo para das equaes de Yule-Walker de ordem m, que resultam do ajustamento de um modelo AR de ordem m a uma srie (Reinsel, 1997). De forma similar ao caso univariado, segue-se que a sequncia de matrizes autoregressivas parciais , de ordem = 1, 2, , tem a importante qualidade caracterstica de que, se o processo de ordem p, ento = e = 0 para > . Consequentemente, as matrizes tem a propriedade de corte (cutoff) para um modelo AR(p), pelo esta propriedade pode verificar-se bastante til na identificao e especificao de uma estrutura AR pura para um processo multivariado. Contudo, ao contrrio do caso, os elementos das matrizes no so correlaes parciais como a funo de autocorrelao parcial (PACF) no caso univariado.

6. Anlise Multivariada

139

6.1.3 Construo do modelo inicial e estimativa dos mnimos quadrados para modelos vectoriais ARMA
Nesta seco discute-se algumas tcnicas para a especificao preliminar do modelo baseadas em estatsticas amostrais. So abordadas tcnicas como estimativa dos mnimos quadrados e respectivos testes de hiptese associados. So ainda explorados alguns mtodos adicionais para a especificao inicial e seleco de uma estrutura ARMA apropriada, tais como a utilizao do mtodo das correlaes cannicas e critrios de seleco de modelos tais como AIC e BIC.

6.1.3.1 Estimativa do vector mdia e das matrizes de covarincia e correlao


Dada uma amostra de uma serie temporal vectorial , , , de dimenso T, possivelmente, originada de um processo estacionrio multivariado, com vector mdia = e matrizes de autocovarincia = e matrizes de autocorrelao , uma das ferramentas fundamentais para a determinao preliminar do modelo do processo obter estimativas amostrais do vector e especialmente das matrizes e . A estimativa preliminar de dada pelo vector mdia amostral = =

A estimativa amostral das matriz de covarincia cruzada da lag , , dada pela matriz de covarincia amostral da lag , definida por = =

,
=

= , , ,

(6.22)

com = (ver seco 6.1.1.1). No caso particular da lag zero, tem-se que a matriz de covarincia cruzada = = corresponde matriz de = covarincia amostral de . Assim, o elemento (, ) da matriz dado por

= =

As correlaes cruzadas amostrais so definidas como = =


, = , ,

(6.23)

Para uma serie estacionria, os so estimativas amostrais dos valores tericos de ; que so particularmente teis na especificao do modelo para um processo vectorial mdia mvel de baixa ordem, uma vez que um processo MA(q) tem a propriedade de que = para > .

140

6. Anlise Multivariada

Em termos de propriedades assimptticas de correlaes amostrais, salientas o seguinte caso que estrema importncia na anlise dos resduos: suponha-se que um processo vectorial rudo branco, com matriz de covarincia e matriz de correlao 0 , tal que = para 0, ento tem-se (Reinsel, 1997)

6.1.3.2 Matrizes de autoregresso parcial amostral e propriedades


Dado uma amostra de uma srie temporal multivariada , , , de dimenso , as estimativas das matrizes de autoregresso parcial sero bastante teis na especificao da ordem de um modelo AR, uma vez que as matrizes tem a propriedade de serem nulas para > num processo AR(p). Para uma dada lag m, seja a estimativa natural de definido na seco 6.1.2.5, por exemplo por (6.21). Estas estimativas podem ser obtidas de forma bvia substituindo os valores tericos das matrizes de covarincia pelas respectivas matrizes de covarincia amostral definidas na seco anterior. Teste para a ordem de um modelo AR No pressuposto de que o processo um AR(p), ento, para qualquer > , os elementos de tem uma distribuio assimptoticamente normal com mdia zero, tal que

= tem matriz de covarincia aproximada dada por onde = e = Onde = , , .. Consequentemente, substituindo pela respectiva

estimativa amostral, a estatstica de Wald dada por


=

Segue assimptoticamente uma distribuio 2 com 2 graus de liberdade para > na codio de um modelo AR(p) (Reinsel, 1997). Esta estatstica pode ser utilizada como estatstica de teste para testar um modelo AR(p), ou seja, para testar se = num modelo de ordem > . Um teste equivalente o chamado LR teste (likelihood ratio test) para : = . Esta estatstica LR formulada em termos da razo = 1 como log , com uma verso mais precisa para amostras finitas dada por = , Onde =
= +1 .

6. Anlise Multivariada

141

6.1.3.3 Estimativa dos mnimos quadrados condicional de modelos autoregressivos


O modelo AR(m) geral estacionrio pode ser expresso na forma

=
=

+ = () +

Onde se definiu =

, , e () = , , .

De forma equivalente, poder-se-ia escrever o modelo na forma

= +
=

+ = +

Com = , , , e = , , , .

Definindo-se 1. Uma matriz de dados = + , + , , = 2. = + , + , , 3. Uma matriz de dimenso + 1 , , , , = + 1, , cujas linhas tpicas so , = de dimenso com

Ento tem-se = + , que tem a forma geral de um modelo linear multivariado com = observaes. Segue-se que o estimador dos mnimos quadrados (LS Least Square, ou LSE - Least Square Estimator) dos parmetros AR so dados por = () = , ,

(6.24)

onde as matrizes e , respectivamente, tem linhas tpicas (0) e 1 com


, ,

= + 1, ,

= 1

= +1

e = . A estimativa de dada por

= + 1 onde =
= +1

a matriz da soma dos quadrados dos resduos, com

142

6. Anlise Multivariada

o vector dos resduos. Este estimador dos mnimos quadrados tambm um estimador de mxima verosimilhana (ML Maximum Likelihood), no pressuposto de uma distribuio normal. Para um modelo AR de ordem genrica, o estimador dos mnimos quadrados (LSE) tem aproximadamente tem aproximadamente as mesmas propriedades distributivas que o estimador dos mnimos quadrados para um modelo linear multivariado normal. Consequentemente, para um modelo estacionrio AR(m), a distribuio de () aproximadamente normal multivariada com vector mdia () e matriz de covarincia que consistentemente estimada por

. Ou seja, a inferncia sobre os elementos

individuais de = () pode ser baseada na distribuio aproximada ~ ,

em que = () (Reinsel, 1997). A determinao da ordem p apropriada do modelo autoregressivo (AR) pode ser baseada na utilizao aproximada do teste LR (Likelihood Ratio Test) descrito atrs. Por exemplo, quando se pretende testar a significncia da matriz AR de m-sima ordem, a hiptese nula 0 : m = 0 contra a hiptese alternativa 0 : 0. A estatstica de teste ser dada pela estatstica LR = , =
(6.25)

onde a matriz de soma dos quadrados dos resduos obtida do ajustamento de um modelo AR de ordem 1 para o mesmo conjunto de N observaes utilizadas no ajustamento do modelo AR(m) (Box, Jenkins, & Reinsel, 2008) (Reinsel, 1997). Para valores elevados de N, quando m = 0 verdadeiro, tem-se que segue aproximadamente uma distribuio , e rejeita-se a hiptese nula para valores elevados de . Consequentemente, o procedimento consiste em ajustar sucessivamente modelos AR de ordens superiores srie, e para cada ordem, testar sucessivamente a significncia da ltima matriz coeficiente includa no modelo.

6.1.3.4 Tcnicas adicionais para especificao de modelos VARMA


Aps o ajustamento a um modelo AR dee cada uma das ordens = 1, 2, , pelos mnimos quadrados, pode-se (deve-se) avaliar a qualidade do ajustamento de um modelo AR(m) considerando a sequncia da estatstica LM. Contudo este diagnstico deve ser complementado pela anlise dos resduos, nomeadamente considerando os elementos da diagonal da matriz de covarincia do rudo branco estimado m , que d a indicao de como o aumento da ordem pode melhorar o ajustamento, uma vez que m corresponde varincia do erro de previso um passo frente . Complementarmente, aps cada ajustamento AR(m), = 1, 2, , , pode-se (deve-se) examinar as matrizes de correlao cruzada dos resduos que daro informao adicional sobre a qualidade do ajustamento.

6. Anlise Multivariada

143

O processo Estas matrizes devero ter um comportamento semelhante a um processo rudo branco. De notar que para qualquer processo misto VARMA, pode ter que se recorrer a ajustamento autoregressivos de ordem bastante elevada antes de se conseguir um modelo que se parea apropriado. Contudo, apesar dos actuais recursos computacionais, no sero desejveis modelos finais de ordem muito elevada. Nesses casos, deve-se inspeccionar o modelo de correlao dos resduos aps ajustamentos AR de baixa ordem, com a possibilidade de detectar modelos mistos ARMA de baixa ordem que se verifiquem apropriados e simultaneamente reduzam o numero de parmetros relativamente a um modelo AR puro. Critrios de seleco de ordem para especificao de modelos Das abordagens estudadas pode-se concluir que o teste LR associado anlise da correlao cannica parcial podero ser bastante teis para a determinao global da ordem AR nos casos em que um modelo de baixa ordem se verifique apropriado ao processo. Em situaes mais complicadas, deve-se considerar modelos mistos ARMA que devero posteriormente ser estimados recorrendo estimativa de mxima verosimilhana. H contudo a necessidade da determinao preliminar de uma adequada ordem (baixa) do modelo misto ARMA que se adeqe s sries. Tal como no caso univariado, existem vrios critrios, tais como AIC,BIC e FPE que normalmente podem ser teis para a determinao das estruras de modelos mais apropriadas. O critrio AIC (normalizado po ) dado por (Ltkepohl, 2007), (Reinsel, 1997) , = + + +
(6.26)

onde o numero de parmetros estimados por mxima verosimilhana para um modelo VARMA, e a correspondente matriz de covarincia estimada dos resduos. O critrio BIC tem uma forma similar = +
(6.27)

O critrio BIC penaliza mais o numero de parmetros utilizado no modelo que o critrio AIC. Um critrio similar que est entre os dois anteriores dado por = +
(6.28)

O critrio FPE (Final Prediction Error) para seleco do modelo VAR(m) dado por = + onde =
(6.29)

a estimativa de ajustada para os graus de liberade.

144

6. Anlise Multivariada

Estes critrios de seleco de modelo so utilizados para comparar vrios modelos ajustados por mxima verosimilhana srie de dados, de modo a que se escolha o modelo que apresente valores mnimos para cada critrio (Reinsel, 1997).

6.1.3.5 Modelos de regresso linear multivariada


Considere-se um sistema multivariado com r entradas e k sadas. Seja = 1 , 2 , , um vector aleatrio de dimenso k das variveis das respostas no instante t, e seja = 1 , 2 , , um vector de dimenso r das variveis de entrada para o mesmo instante t. Considere-se um modelo linear multivariado da forma = i + it , com = 1, , , ou, na notao matricial = + , = , ,

Onde = 1 , , k , e o = 1t , , kt so independentes e tem distribuio normal 0, , tal que = . Dadas observaes , , e , , , define-se a matriz de dados = , , de dimenso , a matriz = , , de dimenso , e a matriz = , , de dimenso . Neste caso, o estimador de mxima verosimilhana (MLE Maximum Lilekihood Estimator) de o mesmo que o estimador dos mnimos quadrados (LS), e que dado por = Ou seja =

(6.30)

= , ,

Onde = 1 , , a i-sima coluna de . O estimador para a matriz de covarincia do erro dado por =

De notar que a funo de verosimilhana dada por , ; =


(6.31)

Que ser maximizada para igual a em (6.30) e igual a = 1997).

(Reinsel,

Um modo bastante conveniente de lidar com regresso linear multivariada principalmente quando se impem restries nos parmetros, transformar o modelo linear multivariado na forma de modelo univariado. Partindo da matriz = , , definida acima, define-se = = , , e = = , , onde a i-sima coluna de . Relembrando as propriedades relacionadas com o operador vec, tem-se que se = , ento = = (), e tambm que = .

6. Anlise Multivariada

145

Da expresso linear = + , tem-se que = = + = + onde obviamente = . De notar que = = ou seja , = , onde o elemento (i,j) de . O modelo assim definido tem a forma do modelo de regresso linear univariado geral, ento o estimador de mxima verosimilhana de (MLE) o mesmo que o estimador dos mnimos quadrados generalizado (Reinsel, 1997) =

Tem-se ento que = , = , , um estimador dos mnimos quadrados para cada i. a estimativa de obtida por este mtodo tem distribuio normal multivariada com mdia = e covarincia = =

ou seja, i = e , =

. Como a matriz de covarincia, na prtica,

desconhecida, a matriz de covarincia de estimada por = (Reinsel, 1997). Restries lineares

Na estimao de parmetros, normalmente torna-se necessrio restringir alguns parmetros, ou porque o valor deles conhecido, por exemplo em modelos mistos determinstico/estocstico, ou porque os seus valores no so significativos, e portanto sero nulos. Consequentemente, aos estimar-se os valores dos parmetros do modelo a ajustar, essas restries tem de ser impostas. Considere-se o modelo linear, seguindo a notao de (Ltkepohl, 2007) = + , , + que pode ser escrito na forma compacta = + onde
(6.32)

146

6. Anlise Multivariada

= , , = , , = , , , = , , Em que cada coluna de composta por + Define-se ento uma restrio linear para na forma = = +
(6.33)

Onde = um vector de dimenso + 1 1, uma matriz conhecida de dimenso + 1 de rank , um vector no restrito de dimenso 1 dos parmetros desconhecidos e r um vector de dimenso + 1 1 de constantes conhecidas. Todas as restries lineares de interesse podem ser escritas nesta forma. Por exemplo, a restrio = 0 pode ser escrita na forma (6.33) escolhendo = 2 1 + , = , = , , ,

e = 0. Mais genericamente, concluindo-se que o i-simo elemento do vector no significativo, e portanto nulo, para construir esta restrio, procede-se do seguinte modo: 1. Define-se a matriz a partir de uma matriz identidade + 1 + 1 , em que a i-sima coluna foi retirada,
+

de dimenso

2. Define-se o vector a partir do vector em que o i-simo elemento foi retirado 3. Define-se = 0. A representao (6.33) permite impor as restries pela simples reparametrizao do modelo original. Aplicando o operador a (6.32) e substituindo por + tem-se = = + () = + + ou = +
(6.34)

onde = e = (). Esta forma de modelo permite derivar permite derivar estimadores e respectivas propriedades tal como nos modelos originais no restitos (Ltkepohl, 2007).

6. Anlise Multivariada

147

Estimativa GLS (generalized LS) e EGLS (estimated GLS) Denotando por a matriz de covarincia de , o vector de parmetros que minimiza
= =

(6.35)

com respeito a dado por (Ltkepohl, 2007) =


+

= +

(6.36)

Este estimador conhecido como estimador dos mnimos quadrados generalizados (GLS Generalized Seast Square) porque minimiza a soma dos erros quadrados generalizados em vez da soma dos erros quadrados , e geralmente assimptoticamente mais que o estimador dos mnimos quadrados multivariado. Sob o pressuposto da normalidade dos dados o estimador GLS equivalente ao estimador da mxima verosimilhana. Segundo (Ltkepohl, 2007, p. 196), nas condies de que um processo de dimenso estvel VAR(p), estacionrio, e rudo branco independente com quartos momentos limitados. Se = = + como em (6.33) com rank de igual a , ento o vector dada por (6.36) um estimador consistente de e
,

(6.37)

onde significa que converge em distribuio para e = igual ao limite de probabilidade . A determinao do estimador requer o conhecimento de matriz de covarincia que normalmente desconhecia, pelo ter que ser substituda por uma estimativa. Recorrendose a um estimador consistente de para substituir em (6.36) um estimador EGLS (Estimated GLS) =

Que tem as mesmas propriedades assimptticas que o estimador Um estimador consistente de pode ser determinado atravs da expresso (Ltkepohl, 2007) = =

(6.38)

148

6. Anlise Multivariada

Onde se utilizou a igualdade = que o estimador dos mnimos quadrados (LS) multivariado no restrito das matrizes coeficiente . Uma hiptese alternativa consiste em determinar num primeiro passo um estimador dos mnimos quadrados (LS) que minimize com respeito a , que obviamanete ser dado por =

6.1.4 Estimativa de mxima verosimilhana e validao do modelo


Como se verificou em seces anteriores, a estimao de mxima verosimilhana para os parmetros de modelos ARMA, tanto univariados como multivariados conduz a equaes no lineares. Nesta seco apresenta-se o procedimento para estimao de mxima verosimilhana condicional dos parmetros para o modelo ARMA e respectivas propriedades. Examina-se a computao explicita da estimativa de mxima verosimilhana condicional atravs do desenvolvimento explicito de um procedimento Newton-Raphson (Gauss-Newton) modificado.

6.1.4.1 Funo condicional de mxima verosimilhana para o modelo VARMA


Considere-se a estimao de parmetros da mxima verosimilhana condicional para o modelo VARMA(p,q) (assumindo mdia zero por convenincia),

=
=

(6.39)

Baseada numa amostra de observaes vectoriais , = 1, 2, , . A abordagem de mxima verosimilhana condicional baseia-se na suposio de que as observaes iniciais , , . .. , + esto tambm disponveis (por convenincia de notao) e so consideradas como fixas, utiliza-se ainda a aproximao para os distrbios iniciais 0 = 1 = = +1 = 0, pelo que ser o numero efectivo de observaes. Assume-se, como costume, que os so independentes e normalmente distribudos com mdia zero e matriz de covarincia no singular . Define-se as matrizes = , , e = , , , com a notao = , , e = , , . Deste modo, o modelo pode ser expresso na forma

=
=

(6.40)

Recorrendo novamente ao operador vec e relao = (), o modelo poder ser expresso em forma de vector. Defina-se os vectores = = , ,

6. Anlise Multivariada

149

= = , , = = = = O modelo pode ento ser expresso na forma


= 1, , = 1, ,

=
=

(6.41)

ou na forma

=
=

(6.42)

Introduz-se a matriz de atraso ou desfasagem , que composta por uns na subdiagonal imediatamente a seguir diagonal principal e zeros nos restantes stios. Considerando os valores iniciais de iguais a zero, o parmetro do segundo membro de (6.42) pode ser substitudo por = , , , , , e consequentemente, o termo e em (6.41) fica na forma = , , , , , . Das formas (6.42) e (6.41) obtm-se a relao

=
=

=
= =

(6.43)

Onde se definiu =

. No pressuposto da normalidade dos

resduos , ou seja, ~ , , a funo de mxima verosimilhana (condicional) pode ser escrita na forma (Reinsel, 1997) (ver expresso (6.31), tomando-se o logaritmo) =

= = Onde, a partir de (6.43) se definiu w = z e =


= . =1

(6.44)

= e, com = , ,

150

6. Anlise Multivariada

Para se determinar as equaes de mxima verosimilhana tem que se maximizar a funo de mxima verosimilhana (6.44) com respeito aos parmetros , e . Para , fixos, a maximizao com respeito a dada por =

=
=

onde = = . As derivadas parciais de com respeito a e a so dadas por = 1 e (6.43) se tem (Reinsel, 1997) =

1 , pelo que, de

= Para = 1, , , e = Para = 1, , . Definindo-se o vector da forma = , , , , , E a matriz =

, , , , ,

Deste modo, estas derivadas podem ser expressas conjuntamente, numa forma mais conveniente = =

(6.45)

=
=

No caso de se ter q=0, ou seja, no caso de se ter um processo autoregressivo AR(p) puro com = , tem-se que = () na notao de 6.1.3 com () = , , e = , onde = , , . Ento a funo de mxima verosimilhana simplificase ganhando a forma

6. Anlise Multivariada

151

= = = Que conduz estimativa de mxima verosimilhana condicional de um modelo AR(p) dada por =

Que o mesmo estimador que o estimador dos mnimos quadrados. Como j foi referido diversas vezes, inclusive na abordagem a sistemas univariados, para > 0, as equaes de mxima verosimilhana, neste caso as equaes (6.45), so altamente no lineares nos parmetros , pelo que tem de ser resolvidas com recurso a procedimentos numricos iterativos tais como o mtodo Newton-Raphson cujas equaes para um estimador de mxima verosimilhana (aproximado) para so (Reinsel, 1997) =

(6.46)

onde uma estimativa inicial de e a estimativa de , necessria em (6.45) pode-se obter a partir da iterao anterior por = . Determinao iterativa da estimativa condicional MLE Para implementar o mtodo iterativo Newton-Raphson (6.46), seria til encontrar uma expresso conveniente para a matriz Hessiana de segundas derivadas parciais. Desprezando os termos de menor ordem que dividem por , uma vez que tendem para zero quando tende para infinito, obtm-se uma aproximao para a Hessiana =


(6.47)

Esta aproximao implica a negligncia de termos que tem a forma de produto interno do vector com as linhas das matrizes das derivadas de com respeito ao parmetro . Esses termos tem a forma de soma termos cruzados de e t s, multiplicados por combinaes desfasadas de e t s que convergem para zero em probabilidade quando divididos por T, devido ao facto de os termos desfasados de e t s serem independentes do valor corrente de t (Reinsel, 1997). O mtodo numrico iterativo pode ser implementado a partir da expresso (6.46) = +

Em que a estimativa obtida na iterao anterior.

152

6. Anlise Multivariada

A estimativa inicial pode ser obtida, por exemplo, recorrendo estimativa dos mnimos quadrados = , , , , ,

= , , , , ,

Uma vez obtida a estimativa inicial, de (6.43) tem-se

=
=

= 1
=

Recorrendo s equaes (6.45) e (6.47), as equaes modificadas de Newton-Raphson para tem uma soluo da forma = +

Definindo-se = 1 Y = Y1 , Y2 , , YT , com Zt = anterior tem-se finalmente (Reinsel, 1997) = + = +


=

0 ,

e substituindo na expresso

(6.48)

Com 0 = 1 = = +1 = 0. Na prtica, o procedimento iterativo (6-4) pode ter que ser modificado em certas alturas, por exemplo, pela introduo de um factor de ajustamento de escala do vector de incremento no membro direito de (6.48) para evitar a sada da zona de convergncia e garantir o incremento da funo, ou seja, que decresa em cada iterao. Ou seja, na j-sima iterao, a estimativa dever ser
= +

onde o factor de escala. Outro problema que pode ocorrer que o operador MA estimado pode no ser invertvel em determinadas iteraes, ou seja = 0 pode ter algumas razes menores ou iguais a um em valor absoluto, pelo que este operador poder te que ser ajustado (Reinsel, 1997).

6. Anlise Multivariada

153

Quanto distribuio assimpttica do estimador MLE de , de acordo com (Reinsel, 1997), verifica-se que

quando

(6.49)

onde a notao significa que converge em probabilidade e


=

quando

(6.50)

No caso de existirem restries lineares, o estimador ML pode ser determinado atravs de iteraes pelo mtodo Newton-Raphson modificado similar a (6.48) dado por = +

(6.51)

onde = 1 Y e 0 a estimativa de da iterao anterior. Igualmente de forma similar, as propriedade assimptticas so dadas por = =
(6.52)

6.1.4.2 Determinao da ordem do modelo


Antes de se tentar determinar os parmetros de um modelo ARMA(p,q), tem que se determinar a ordem dos respectivos operadores. Para o caso multivariado, um grande nmero de estratgias tem sido propostas, sem que nenhuma se tenha transformado em standard tal como aconteceu com a abordagem de Box-Jenkis para o caso univariado (Ltkepohl, 2007). Algumas estratgias so baseadas principalmente em subjectivas avaliaes de certas caractersticas dos processos tais como a autocorrelao e autocorrelao parcial. A deciso das ordens especficas e restries nos coeficientes das matrizes eram ento baseadas nestas quantidades. Outros mtodos utilizam uma mistura de testes estatsticos, o uso de critrios de seleco de modelo e a avaliao do analista. Outros ainda so baseados predominantemente em critrios estatsticos de seleco e, em princpio, podem ser determinados automaticamente por um computador. Os procedimentos automticos tm a vantagem de as suas propriedades estatsticas podem ser determinadas rigorosamente. Nas aplicaes actuais, so utilizadas frequentemente algumas de diferentes abordagens. Por outras palavras, a percia e o conhecimento antecipado de um analista no deve ser preterido em favor dos procedimentos puramente estatsticos. Sugere-se que os modelos propostos por vrios tipos de critrios e procedimentos sejam avaliados e desenvolvidos por peritos antes de se determinar o modelo final. O modelo aqui proposto, e que foi utilizado ao longo deste trabalho a generalizao para modelos multivariados de uma tcnica explorada por (Hannan & Rissanen, 1982) para modelos ARMA univariados. No procedimento proposto, primeiro obtm-se uma estimativa da srie dos resduos (inovaes) de um potencial modelo vectorial ARMA(p,q) pela aproximao do modelo a

154

6. Anlise Multivariada

um modelo autoregressivo puro de ordem suficientemente alta . A ordem do modelo autoregressivo aproximado pode ser escolhida recorrendo a critrios de seleco tais como o AIC, por exemplo, que sugere um valor de m para o qual o valor da funo + minimizado. Com base no modelo seleccionado, AR( ) determinam-se os resduos =
=

, com = + , , . Num

segundo estdio do procedimento faz-se a regresso linear de em , , e , , para vrios valores de e . Ou seja, estimam-se modelos da forma

=
=

+
=

(6.53)

por regresso linear dos mnimos quadrados e determina-se a estimativa da matriz de covarincia dos erros com base nos resduos obtidos atravs da expresso anterior. Ento, pela aplicao do critrio BIC, a ordem (p,q) do modelo VARMA determinada com base na no resultado que minimiza a funo , + + . O modelo obtido servir de base para a primeira iterao do procedimento iterativo da estimativa de mxima verosimilhana descrito acima. O modelo pode subsequentemente ser validado recorrendo anlise de resduos. A vantagem do procedimento que a determinao da estimativa de mxima verosimilhana bastante pesada em termos computacionais para se experimentar uma larga gama se valores de p e q por esse mtodo. Adicionalmente, os parmetros obtidos pelo mtodo dos mnimos quadrados so geralmente excelentes valores de partida para as iteraes de mxima verosimilhana.

6.1.4.3 Validao global da adequao do modelo


Normalidade dos resduos Um dos objectivos da modelao de processos poder estar relacionado com o controlo estatstico multivariado, recorrendo ao controlo dos dados de sada do processo aps filtragem pelo modelo ento obtido, no pressuposto subjacente ao modelo, que se trata de dados normalmente distribudo (Figura 6-1). A no normalidade dos resduos indica geralmente que o modelo no uma boa representao dos dados gerados pelo processo. Consequentemente, torna-se desejvel que se teste a normalidade dos resduos.

?
Out

In

Figura 6-1 Aplicao de cartas de controlo com dados correlacionados multivariados

Os testes de normalidade multivariada utilizados neste trabalho so baseados nos terceiros e quartos momentos centrados da distribuio normal. Se uma varivel aleatria univariada com distribuio normal estandardizada, (0,1), os seus terceiro e quarto

6. Anlise Multivariada

155

momento so dados por 3 = 0 e 4 = 3. Seja um processo rudo branco de dimenso com , e seja uma matriz que satisfaz a relao = . pode ser obtida por exemplo por uma decomposio de Choleski de . Ento = , , = , Ou seja, os componentes de so variveis aleatrias independentes que seguem uma distribuio normal estandardizada. Consequentemente tem-se que

= =
(6.54)

Este resultado ser utilizado na validao da normalidade de processos rudo branco. Para construir o teste, assume-se de que se dispe das observaes 1 , , , a partir das quais se define =

e uma matriz para a qual = e tal que o limite de probabilidade de zero. Define-se ainda = , , = , ,

= ,

= , ,

= , ,

(6.55)

= , ,

= , ,

(6.56)

Deste modo, 1 e so estimadores dos vectores (6.54). Aps estas definies, se rudo branco Gaussiano com matriz de covarincia no singular e valor esperado , , , ento verifica-se que (Ltkepohl, 2007) ,

(6.57)

ou seja, 1 e so assimptoticamente independentes e normalmente distribudos, (6.57) implica que

156

6. Anlise Multivariada

= e =

(6.58)

(6.59)

Para a primeira estatstica pode definir-se o teste de hiptese

(6.60)

Para a segunda estatstica pode definir-se o teste de hiptese

(6.61)

Adicionalmente tem-se = +

(6.62)

Que pode ser utilizada para um teste conjunto de (6.60) e (6.61). Matrizes de correlao dos resduos Um teste global para determinar a adequao do modelo obtido, por MLE ou LSE, pode ser feito com recurso anlise das matrizes de autocorrelao dos resduos. Uma vez estimados os parmetros de um modelo ARMA(p,q), os resduos podem ser determinados atravs da expresso

=
=

+
=

= , ,

Os elementos individuais das matrizes de correlao e possveis padres devero ser avaliados no sentido em que os resduos devem ter um comportamento de acordo com um processo rudo branco. Os limites de dois desvios padro, 2 podero ser utilizados para garantir a significncia dos das correlaes residuais individuais. Adicionalmente, pode-se aplicar um teste global de ajustamento a uma sequncia de matrizes de correlao residual, teste de portmanteau dado por (Isermann, 1989)
= = =

=
=

(6.63)

6. Anlise Multivariada

157

ou equivalentemente por

(6.64)

De acordo com a hiptese nula em que o processo segue um processo VARMA(p,q), a estatstica de teste tem distribuio aproximada 2 com 2 graus de liberdade. Consequentemente, o modelo rejeitado para grandes valores de s . A distribuio aproximada valida no pressuposto de que suficientemente grande de modo a que as matrizes da representao MA infinita para o modelo ARMA so insignificantes para > .

6.1.5 Modelos de cointegrao e de rank reduzido 6.1.5.1 Modelos de rank reduzido e anlise de correlao cannica parcial
Nesta seco considera-se modelos autoregressivos multivariados AR(p), que podero ser representados por uma estrutura de rank reduzido nos seus coeficientes matriciais j . Mais especificamente, considera-se modelos AR(p) do tipo

=
=

+ +

(6.65)

Neste modelo assume-se que as matrizes tm uma estrutura particular de rank reduzido tal que = +1 = +1 com = 1, 2, , 1. Deste modo, os podem ser representados na forma = , onde e so matrizes de dimenso e respectivamente. Assim a equao anterior pode ser escrita na forma

=
=

+ +

Estes modelos podem resultar em parametrizaes mais parcimoniosas, estruturas mais detalhadas e possivelmente simplificadas, e possivelmente em interpretaes mais teis e interessantes no que diz respeito s inter-relaes entre as sries temporais. Para se obter a informao sobre o rank das matrizes nestes modelos, recorre-se normalmente anlise das correlaes cannicas parciais. Uma das consequncias fundamentais destes modelos que existiro no mnimo correlaes cannicas parciais nulas entre e , dado 1 , , +1 . Ou seja, pode-se determinar uma matriz de dimenso cujas linhas so linearmente independentes tal que = e, consequentemente, = para > . Assim, recorrendo-se anlise das correlaes cannicas parciais para vrios valores de = 1, 2, pode-se identificar a estrutura do rank para o modelo, bem como a ordem global p do modelo AR(p).

158

6. Anlise Multivariada

A estatstica de teste que pode ser utilizada para (por tentativa) especificar o rank dada por

, =
= +

(6.66)

Para = 1, 2, , , onde 1 1 2 0 so as estimativas amostrais das correlaes cannicas parciais entre e , dado 1 , , +1 (ver seco 6.1.2.4). Nas condies de hiptese nula de que dentro da estrutura de modelo de rank reduzido encadeado, a estatstica , tem distribuio assimpttica 2 com 2 graus de liberdade (Reinsel, 1997). Assim, se o valor da estatstica de teste no demasiado grande no se deve rejeitar a hiptese nula.

6.1.5.2 Modelos autoregressivos multivariados no estacionrios


Como se viu anteriormente, na modelao de sries temporais univariadas, prtica comum diferenciar as sries quando estas apresentam algumas caractersticas de no estacionaridade. A deciso no que diz respeito necessidade de diferenciao por vezes baseada, de forma informal, nas caractersticas da representao grfica das sries e nas suas funes de autocorrelao parcial amostral. Esta situao tem conduzido a um interesse em estabelecer procedimentos de inferncia mais formal na determinao da ordem de diferenciao apropriada das sries. Para um simples processo univariado de primeira ordem AR(1) dado por = 1 + , tem-se que o estimador dos mnimos quadrados de dado por

=
=

= +
=

Perante um processo AR(p), descrito por = , ao colocar-se a hiptese de que o processo no estacionrio e que ter de ser diferenciado a fim de se obter um processo estacionrio, corresponde a colocar-se a hiptese de que = 1 , em que um operador autoregressivo estacionrio de ordem 1. Nesse caso ter-se-

= =
=

Fazer o teste de que tem uma raiz unitria equivalente a colocar a hiptese de que = 1 para o modelo = 1 = 0 para o modelo
=

+ , ou fazer o teste de que

=
=

De facto, definindo = 1 , fcil de verificar que qualquer modelo AR(p) = + pode ser expresso na forma equivalente =1

6. Anlise Multivariada

159

= +
=

+ = +1 ,

onde 1 = 1 =

=1

1 e =

pelo que, dizer que existe uma raiz


=1

unitria no operador AR(p) equivalente a afirmar que =

= 1. Deste modo, seja

, 1 , , p1 os coeficientes estimados do modelo por regresso linear dos mnimos

quadrados obtidos pela regresso de em 1 , 1 , , +1 . Ento, sob a hiptese de um modelo de raiz unitria onde = 1 e de que o processo = 1 estacionrio, tem-se que 1 dada pela expresso
1 =1

2 =+1 1

1 2

tem distribuio limite da estatstica

onde movimento Browniano padro ou processo de Wiener no intervalo 0, 1 .

6.2 Modelos lineares com variveis exgenas


Este ser talvez a seco fulcral deste trabalho. Ao longo das seces anteriores do ponto 6, assumiu-se que todas variveis do sistema dinmico so determinadas conjuntamente dentro do sistema e de que todas tinham o mesmo status no modelo multivariado. Na prtica, as variveis de sada de um sistema dinmico, denominada por exemplo por = 1 , , , podem ser influenciadas por outras variveis, denominadas como variveis de entrada = 1 , , , que podem ser determinadas independentemente do sistema. Essas variveis, denominadas como variveis exgenas, podem ter tipos e origens diversas, sendo umas consideradas manipulveis, uma vez que as podemos ajustar de modo a controlar as variveis de sada, e outras restritivas, uma vez que no as podemos manipular mas influenciam igualmente as variveis de sada.
Xt Entrada (input)

Processo dinmico

Yt Sada (output)

Figura 6-2 Processo dinmico Multivariado

Em contraste, s variveis determinadas dentro do sistema d-se o nome de variveis endgenas.

6.2.1 Tipos de Representao


Existem vrios tipos de modelos para representar a influncia das variveis exgenas de entrada nas variveis de sada , tais como funo de transferncia mltipla, modelos de equaes dinmicas simultneas, modelos ARMAX vectoriais. O modelo de funo de transferncia mltipla dado pela forma

160

6. Anlise Multivariada

=
=

(6.67)

Onde so as matrizes coeficiente de dimenso correspondentes resposta ao impulso e um vector de rudo de dimenso . Para se ter uma ideia mais intuitiva da natureza das matrizes , suponha-se que o processo se encontra no estado estacionrio com todas as entradas e sadas inicialmente a zero. Aplicando-se um pulso unitrio no instante zero na varivel de entrada : () = () = > 0

Seja a sequncia de respostas da sada dadas por , , , Tal que o vector das respostas de todas as sadas no instante , , ,

Pode-se ento construir uma matriz que, no instante , mostre como cada varivel de sada responde a cada impulso unitrio de cada varivel de entrada =

A matriz um vector de rudo de dimenso que se assume poder ser representado por um processo ARMA, = . A varivel exgena pode ser constituda por variveis estocsticas e/ou determinsticas ou mesmo incluir variveis com padro sazonal. De notar que a expresso (6.67) pode ser vista como generalizao para a anlise multivariada da funo de transferncia Box-Jenkis. Outro modelo, com maior relevncia neste trabalho, com variveis de entrada exgenas o denominado modelo vectorial ARMAX, ou modelo VARMAX. Esta forma pode ser determinada a partir d a expresso (6.67) assumindo que o operador da funo de transferncia = pode ser representado na forma racional = =

onde =

de ordem s e

de dimenso . Por convenincia assume-se que o factor em o mesmo que o factor autoregressivo no modelo para as perturbaes , ou seja, considera-se dinmicas idnticas para o sistema e para as perturbaes. Deste modo, o modelo ARMAX pode ser expresso na forma

so matrizes

=
=

+
=

(6.68)

6. Anlise Multivariada

161

Esta expresso tambm pode ser escrita noutra forma em que envolve uma matriz coeficiente (triangular inferior) para ou na lag zero, reflectindo assim ligaes instantneas entre as variveis endgena. Estas formas so normalmente referidas como modelo de equaes dinmicas simultneas (dynamic simultaneous equations model). De forma similar aos modelos vectoriais (ou multivariados) ARMA, o modelo ARMAX (6.68) diz-se estvel se todas as razes de = 0 so todas maiores que um em valor absoluto. Nessas condies, se a srie de entrada um processo estacionrio, bem como , ento a sada ser estacionria. O processo ter ento uma representao convergente dada por

= + =
=

+
=

(6.69)

onde =

= .

Como j foi referido, as matrizes coeficiente

representam os efeitos que as alteraes nas variveis de entrada provocam nas variveis de sada nas vrias lags de tempo e so conhecidas como matrizes resposta ao impulso. O ganho total do sistema dinmico, ou ganho estacionrio, dado pelos elementos da matriz resposta ao degrau unitrio = 1 = . =0

6.2.2 Previso com modelos vectoriais ARMAX


Como j foi referido anteriormente, as variveis exgenas no tem todas as mesmas caractersticas. A caracterstica comum que todas elas entram no processo, e influenciam as variveis de sada ou resposta. Podem existir variveis de entrada que no so manipulveis, apesar de ser conhecido o seu nveis nos diversos instantes de tempo. Podero existir outras que, apesar de serem manipulveis, tem alguma dinmica, pelo que o resultado das manipulaes efectuadas no instante , ou o efeito que as alteraes noutras variveis exgenas no instante tm nessa varivel, s se verificar alguns instantes mais tarde. Existem ainda as variveis exgenas manipulveis, no sentido em que o nvel da varivel pode ser alterado instantaneamente, ou que a sua constante de tempo insignificante em relao constante de tempo do sistema.

6.2.2.1 Previso com variveis exgenas estocsticas com dinmica


Quando a srie exgena , no modelo ARMAX (6.68) estocstica e os valores futuros so desconhecidos, ento esses valores tero que ser tambm eles previstos para prever os valores das respostas futuras . Nesta situao assume-se que gerado por um processo multivariado ARMA de ordem p e q

=
=

(6.70)

onde, por convenincia, se assume que e so processos rudo brando independentes. Nestas condies, a melhor previso (matriz MSE mnima) perodos frente de + , com base na informao disponvel no instante t ser

162

6. Anlise Multivariada

() = + , , , , , A previso ptima perodos frente pode ser expressa atravs da expresso recursiva (Reinsel, 1997)

=
=

+
=

(6.71)

Para = 1, , e

=
=

+
=

>

Em que obviamente + e + para , e em que, tambm obviamente, dado pela expresso


=
=

Uma propriedade que conveniente verificar na fase de modelao = + , , , , , , + , , ,


(6.72)

Quando esta propriedade se verifica diz-se que no causa ou que no existe feedback de para . Outra forma de obter previses para o modelo ARMAX combinar as variveis exgenas com as variveis endgenas numa nica varivel vectorial = , e a partir dela definir um processo ARMA. De (6.68) e (6.70) verifica-se que satisfaz o modelo ARMA =
(6.73)

Multiplicando tudo pela matriz inversa da lag zero, obtm-se um processo ARMA multivariado na forma standard. A caracterstica bsica deste modelo que ambos os operadores MA e AR so compostos por matrizes bloco - triangulares inferiores. Este facto reflecte a caracterstica exgena das variveis e a no causalidade de para . Se = 0 em (6.68) e (6.70), e consequentemente em (6.73), as variveis e dizem-se 0 instantaneamente no causal, e ento tem-se + , + , , , , , , + , , , , , ,

6. Anlise Multivariada

163

6.2.2.2 Matriz do erro quadrtico mdio (MSE) de previso ptima


Os erros de previso cometidos pelo recurso expresso (6.71) podero ser determinados atravs da expresso = + () De (6.69) e (6.70) tem-se que o processo tambm pode adquirir a forma (MA infinita)

(6.74)

=
=

+
=

(6.75)

Em que se definiu

=
=

com = e x = pode ser determinado a partir da expresso


. Consequentemente tem-se que ()

() =
=

+ +
=

Pelo que = + ()

=
=

+ +
=

+
=

+ +
=

=
=

+ +
=

Relembrando que = = , = = e que = 0 tem-se que a matriz MSE dos erros de previso perodos frente ser dada por

=
=

+
=

(6.76)

6.2.2.3 Previso com variveis exgenas especificadas


A previso para futuros valores de na seco anterior baseada na situao de que os valores futuros da varivel exgena so estocsticos e tem de ser tambm eles previstos.

164

6. Anlise Multivariada

Noutras ocasies, ou mesmo dentro do mesmo processo, futuros valores de podem ser previamente conhecidos, por exemplo, variveis manipulveis em que o nvel da varivel pode-se altera de forma determinstica e instantnea, ou outra variveis, que apesar de no serem manipulveis, ou seu valor de alguma forma conhecido. Nesses casos pode-se estar interessados em prever futuros valores de condicional aos valores futuros da varivel exgena e na matriz MSE dos erros de previso. Do modelo ARMAX (6.68) conclui-se facilmente que a previso ptima () de + , condicionada s informaes passadas e tambm ao conhecimento futuro dos valores + , , + satisfaz a relao

=
=

+
=

+
=

(6.77)

Para = 1, , e

=
=

+
=

>

Em que obviamente + para . Da representao MA de ordem infinita (6.69) tem-se que a previso associada expresso (6.77) pode tambm ser determinada a partir da expresso

() =
=

+
=

pelo que o erro de previso

= + =
=

tem-se ento que a matriz MSE dos erros de previso condicional perodos frente de ser dada por

=
=

(6.78)

Comparando as duas expresses, (6.76) e (6.78), verifica-se que dado por esta ultima expresso igual ao segundo termo da expresso (6.76). Este termo corresponde aos erros de previso devido componente MA do modelo ARMAX, ao passo que primeiro termo do segundo membros de (6.76) correspondente ao erro na previso de valores futuros da varivel exgena.

6. Anlise Multivariada

165

6.2.3 Controlo ptimo


Em sistemas econmicos, fsicos, biolgicos, processos industriais etc., alguma variveis exgenas, nomeadamente as chamadas variveis manipulveis, podem ser utilizadas para manter ou conduzir os sistemas aos objectivos desejados ou perto deles. Sabendo-se quais os valores objectivo das variveis endgenas, pode-se ento ajustar as variveis manipuladas para que as previses alguns passos frente, obtidas com recurso ao modelo do processo, estejam de acordo com os objectivos definidos. Normalmente no ser de todo possvel atingir os objectivos para todas as variveis endgenas, at porque normalmente esto correlacionadas entre si, ou porque as variveis exgenas tem uma gama de operao limitada. Consequentemente haver a necessidade de se recorrer a uma funo de custo para se conciliar os interesses envolvidos e a disponibilidade de manipulao.

6.2.3.1 Controlo ptimo em modelos ARMAX


Os modelos ARMAX podero assim revelar-se como uma ferramenta bastante til para optimizar o controlo dos sistemas. Especificamente, assume-se que algumas variveis exgenas so manipulveis (as variveis exgenas conhecidas mas no manipuladas, nesta seco, sero referidas por ). Obtida a informao ao longo do tempo, pode-se determinar o valor ptimo das variveis manipulveis no instante + 1 de forma a que + as variveis endgenas + estejam prximas dos valores pretendidos (Target) no + instante + 1. Pode tambm pretender-se que o valor de + oscile pouco em relao a um determinado valor alvo pretendido para as variveis exgenas, ou que no varie excessivamente em relao ao nvel anterior. Desta forma, o problema de controlo ptimo um passo frente pode ser formulado como a determinao do valor que minimize a + funo de custo, ou ndice de performance
= + + + + + + + + + + +

(6.79)

onde significa o valor esperado condicionado informao obtida at ao instante t, e + e + so matrizes no negativas definidas que aplicam as ponderaes relativas aos desvios + 0 + e + + em relao aos valores alvo das respostas e das variveis manipuladas, respectivamente. Para determinar a leis de controlo, conveniente separar os dados conhecidos no instante dos dados desconhecidos. Pelo que o modelo ARMAX (6.68) pode ser simplesmente como + = + + + + +
=1 =1

(6.80)

Onde = , =

+1 =

=1 +1

+1 so as componentes de

+1 que contm as variveis j determinadas no instante t e +1 um termo adicional que contm alguns aspectos de futuras variveis exgenas no manipuladas, cujos valores se assumem conhecidos. Substituindo a expresso anterior na funo de custo, tem-se, aps substituio de +1 do respectivo valor esperado

166

6. Anlise Multivariada

+ + + + + + + + +

+ + +

+ + +

(6.81)

Para minimizar a funo de custo, procede-se sua diferenciao em ordem a +1 e iguala-se a zero, obtendo-se (Reinsel, 1997) = + + + + + + + + + + Que resulta no valor ptimo das variveis de controlo = + + + +

+ + + + + +

(6.82)

Este resultado pode ser generalizado para os casos em que a resposta do sistema no instantnea como no caso estudado, ou seja, quando h um atraso > 0 na resposta em relao aco de controlo . Isto , assume-se que o modelo ARMAX (6.68) pode ser dado por

=
=

+ +
=

+
=

O valor de +1 no influencia a sada antes do instante + + 1, de modo a que no instante , o problema de controlo determinar o valor de de +1 que minimize +
= ++ ++ ++ + + + + + + + +

Neste caso, considera-se a previso ( + 1) perodos frente de ++ condicional informao existente no instante . Pelo que, seguindo o mesmo raciocnio descrito atrs, a equao de controlo ptimo dada por (Reinsel, 1997) = ++ + + +
++ ++ + + + +

(6.83)

A expresso (6.79), com ligeiras alteraes, mas sem perca de objectividade poder ser escrita numa forma mais intuitiva = + + +
(6.84)

Olhando para as duas expresses, verifica-se que no ltimo caso, as ponderaes so constantes (invariantes no tempo) e que o processo pressupe-se instantaneamente no causal. Em termos de implementao, no existem grandes dificuldades em passar de uma expresso para a outra. Contudo, olhando para a ltima expresso e para a expresso (5.15), verifica-se que as semelhanas so evidentes, pelo que esta expresso conhecida como a verso multivariada do ndice de performance de Clarke e Gawthrop (Del Castillo, An adaptative run-to-run optimizing controller for linear and nonlinear semicndutor processes, 1998).

6. Anlise Multivariada

167

Decompondo as variveis exgenas nos trs tipos admissveis, denominando 1 como as variveis exgenas cujos nveis so conhecidos mas que no so passveis de alterao ou manipulao; X2 como as variveis exgenas que se podem manipular com a finalidade de controlar as respostas do sistema; e como X3 as variveis exgenas cujos valores futuros tem que ser previstos, ou seja, variveis exgenas com dinmica; tem-se ento que pode ser definido pelo vector = 1 , 2 , 3 . Com estes pressupostos, um diagrama de blocos de uma possvel implementao do controlador Clarke e Gawthrop multivariado pode dado pela Figura 4-1

G Controlador

Processo

Figura 6-3 Possvel implementao de um sistema de controlo baseado no modelo ARMAX multivariado

6.2.4 Especificao e validao do modelo ARMAX


Definindo o vector das variveis exgenas = 1 , 2 , 3 como descrito acima, o modelo ARMAX pode ser representado numa forma especial, e particularmente til, de um vector ARMA para o processo combinado = , = 1 , 2 , 3 , . Ou seja, o vector tem a seguinte estrutura = , , , , , , , , , , , , ,
,

, , ,

em que + + = o numero total de variveis exgenas. Admitindo que 3 representado por um processo ARMA dado pela expresso (6.70), ou mesmo por um sistema ARMAX em que as variveis 1 e 2 fazem o papel de variveis exgenas com a restrio de no apresentarem dinmica, ou seja, neste caso seria um sistema ARMAX apenas com variveis determinsticas ou previamente conhecidas. Ou seja, 3 dado por

=
=

+
=

Admitindo ainda, por questes de simplificao mas sem perda de generalidade, que o sistema (6.68) instantaneamente no causal, ou seja = 0. Nestas condies o sistema 0 ARMAX pode ser representado pelo modelo ARMA para a varivel dado por

168

6. Anlise Multivariada

=
=

(6.85)

onde = = =

Deste modo, os mtodos para especificao do modelo ARMAX so bastantes similares aos descritos previamente para o modelo ARMA, com a imposio das devidas restries. A anlise dos resduos til para validar a adequao do modelo especificado. A examinao da autocorrelao, em particular, bastante importante para validar o pressuposto do modelo de que um processo rudo branco. Outra verificao que importante fazer examinar a correlao cruzada entre valores do rudo do modelo ARMAX e os valores do rudo do modelo ARMA da varivel exgena . A existncia substancial de correlao cruzada entre e valores desfasados (lagged) de 0 , podero indiciar alguma inadequao na especificao da estrutura de desfasamentos para a varivel exgena no modelo ARMAX, que dever ser corrigida.

7. Combinao SPC e EPC

169

7 Combinao SPC e EPC


Existe alguma confuso sobre o ajustamento ou regulao do processo e o papel importante que desempenha na reduo da variabilidade. Por exemplo, a metodologia das cartas de controlo no o melhor mtodo para reduzir a variabilidade na vizinhana dos valores de referncia. Na indstria de processo e qumica, a utilizao de tcnicas, tais como simples regras de controlo integral tm sido efectivamente utilizadas para esse fim. A monitorizao do processo e o ajustamento do processo so duas abordagens complementares para controlo do processo. Estes procedimentos partilham o objectivo comum que a reduo da variabilidade do processo (Montgomery, 2001); (Box, Jenkins, & Reinsel, 2008). A monitorizao do processo, que parte do controlo estatstico do processo (SPC), foca os seus objectivos em identificar causas especiais e ento eliminar as fontes das causas, conseguindo assim reduzir a variabilidade do processo e melhorar o seu desempenho. Paralelamente, o ajustamento do processo (EPC) foca o seu objectivo em manter a sada do processo prxima dos valores de referncia recorrendo manipulao de das variveis de entrada. Em geral, a teoria de controlo de engenharia est baseada na ideia de que, verificando-se os seguintes pressupostos: 1. possvel prever a prxima observao do processo; 2. Existem outras variveis que podem ser manipuladas de modo a afectar a sada do processo; 3. Conhece-se o efeito das variveis manipuladas tal que se consegue determinar qual a aco de controlo a aplicar; Ento pode-se fazer o ajustamento nas variveis manipuladas no instante que seja mais provvel para produzir uma sada no processo coincidente com a referncia no instante + 1. Claramente que esta ideia requer um conhecimento da relao entre a sada do processo e as variveis manipuladas, bem como compreenso das dinmicas do processo. conveniente ainda que exista alguma facilidade em manipular as variveis de entrada. De facto, se o custo de efectuar as aces de controlo desprezvel, ento tem-se que a variabilidade do output do processo minimizada procedendo ao ajustamento em todos os instantes. De notar que aqui existe uma diferena significativa em relao ao SPC, onde as aces de controlo apenas so desencadeadas quando existe uma evidncia estatstica de que o processo est fora de controlo. Essa evidncia normalmente um ponto fora dos limites da carta de controlo. Existem muitos processos onde alguns tipos de esquemas de controlo por feedback sero preferveis s cartas de controlo. Por outro lado o EPC por si s, no tenta identificar causas especiais que possam ter impacto no processo, se bem que o simples facto dos actuadores saturarem poder por si s desencadear o alerta para uma possvel causa especial. A eliminao das causas especiais podem resultar numa melhoria significativa dos processo. Em principio, o que a metodologia EPC faz reagir aos desvios do output em relao aos valores de referncia, pelo que no efectuar qualquer esforo no sentido de remover

170

7. Combinao SPC e EPC

qualquer causa especial. Consequentemente, alguns dos processos que utilizam apenas o controlo por feedback, podem ser significativamente melhorados com a implementao conjunta de cartas de controlo para a monitorizao estatstica do processo. Este tipo de implementao por vezes referido como SPC algortmico (algoritmic SPC ou ASPC Algoritmic Statistical Process Control) (Vander Weil S. T., 1992). O controlo estatstico deve ser aplicado s variveis de entrada e s variveis de sada. Pontos fora dos limites de controlo devem identificar perodos onde os erros de controlo so grandes ou onde as aces de controlo so elevadas devido a compensaes excessivas devido a causas especiais, que deste modo podem ser detectadas. Esses perodos devero provavelmente constituir boas oportunidades para se proceder procura de causas especiais. De notar que o EPC tem como pressuposto a existncia de um modelo interno em que os resduos (desvios em relao referncia) seguem uma distribuio bem definida - 0, , pelo que qualquer alterao desta distribuio poder significar uma alterao do processo em relao ao modelo que se considerava adequado. A combinao do SPC/EPC poder ser implementada de acordo com o diagrama de blocos da Figura 7-1 (Montgomery D. C., 2001)

Sim Alterar algoritmo Remover causas especiais EPC Processo STOP No


Controlvel

Sim SPC >

Figura 7-1 Integrao EPC/SPC baseado em (Montgomery D. C., 2001)

7.1 Controlo econmico


A engenharia controlo do processo (EPC) tem-se desenvolvido largamente na industria qumica e de processo, particularmente na industria qumica onde a compensao continua fundamental para cancelar os efeitos dos distrbios no controlados. Em contraste, o desenvolvimento do controlo estatstico do processo (SPC) est mais ligado indstria de produo discreta onde possvel obter-se um produto quase uniforme devido estandardizao dos procedimentos e matrias-primas e pela aplicao de um sistema de monitorizao para a deteco e remoo de fontes de problemas. Enquanto que as duas abordagens reflectem caractersticas das suas diferentes origens, em quase todas as industrias necessrio algum conhecimento de SPC e EPC para se conseguirem as melhores prticas de produo. Isto torna-se mais verdade actualmente em que produtos e processos desconhecidos so continuamente desenvolvidos. Por exemplo, a industria electrnica utiliza mtodos hbridos de produo em que num estgio lida-se com processos qumicos e noutros com produo discreta.

7. Combinao SPC e EPC

171

Quando se utiliza controlo contnuo por realimentao, normalmente assume-se a suposio tctica de que os custos envolvidos so apenas os custos de no conformidade (produto fora dos limites de especificao). No entanto, particularmente na produo discreta, tem que se contabilizar os custos adicionais inerentes aos procedimentos de amostragem e ajustamento.

7.1.1 Controlo de custo mnimo com custos fixos de ajustamento e monitorizao


Num cenrio em que se assume que apenas os custos de controlo a considerar so os custos relacionados com os desvios quadrticos em relao referncia (custos off target), um controlador MMSE sem restries implicar a minimizao de todos os custos. Suponhase, no entanto, que existem outros custos quadrticos adicionais associados por exemplo amplitude dos ajustamentos das variveis de entrada , e que uma constante de proporcionalidade que relaciona os custos de off target com os custos de ajustamento, ento 2 2 o custo global de controlo ser proporcional a + , pelo que a minimizao desta quantidade resultar no custo global mnimo. Em vez da formulao deste cenrio, que pode conduzir a valores tericos ideais mas no satisfatrios na prtica, pode-se formular outro 2 cenrio alternativo: o que que constitui uma reduo satisfatria em troca de um 2 aceitvel incremento de . O mesmo raciocnio poder ser aplicado a sistemas com custos de ajustamento e monitorizao.

7.1.1.1 Ajustamento condicionado para custos de ajustamento fixos com modelo de distrbios IMA(1,1)
A maioria dos processos na indstria de produo discreta so considerados processos responsivos, ou seja, o ajustamento efectuado tem efeito total imediato. Mas normalmente estes ajustamentos tem custos fixos inerentes, como por exemplo, ter que parar uma mquina e mudar uma ferramenta. Para estimar os custos de off target, pode recorrer-se uma funo quadrtica fcil de manipular matematicamente =

(7.1)

Onde o custo de off target e uma constante. Para esta funo de custo quadrtica, a minimizao do custo equivalente a minimizar o MMSE. A constante o custo do processo estar a uma unidade de distncia do valor de referncia para um perodo de tempo. Em geral, torna-se mais conveniente trabalhar, no com , mas com a constante normalizada = . Neste caso, o custo off target pode ser dado pela expresso

(7.2)

e o custo mdio de off target para um perodo por uma quantidade de . No pressuposto de que os distrbios podem ser modelados por um modelo IMA(1,1), o desvio padro que o processo exibe quando no existe limite para se proceder ao

172

7. Combinao SPC e EPC

ajustamento, ou seja, quando o valor de (distncia que limita a zona morta , + ) igual a zero = 0 (ver Figura 7-2) Se a funo de custo for quadrtica com um mnimo em T e assumindo-se conhecido, para se determinar a constante , apenas se necessita de um ponto adicional da curva de custo. (Taguchi, 1987) diz que para se obter um ponto adicional basta conhecer o desvio a partir do qual resulta a rejeio de todo o material produzido durante um perodo de amostragem com um custo de 0 , ou seja =

e consequentemente =

Para se construir uma carta de ajustamento limitado, necessrio conhecer-se o valor que tal que as linhas limites resultar no menor custo global (Figura 7-2). (Box & Luceo, 1997) apresenta uma tabela com valores de , do intervalo mdio entre ajustamentos (AAI) e de para vrios valores de = 2 , em que = 1 a constante de amortecimento. O erro quadrtico mdio do processo ajustado ento dado por 1 + 2 (Box & Luceo, 1997), ou seja, o incremento no desvio padro (ISD) ser dado por = 1 + 2 1 2 .

Zona de actuao
T+L

Zona de no actuao (Zona morta)


T

Zona de no actuao (Zona morta)


T-L

Zona de actuao
Figura 7-2 Limites de zona morta para cenrios de controlo de custo mnimo

7.1.1.2 Incluso dos custos de amostragem


Outros dos possveis custos envolvidos no controlo do processo so os custos de amostragem, pelo que ser de conveniente incluir estes custos na determinao do custo global mnimo. A questo passa ento a ser qual a frequncia de amostragem que reduz os custos globais. Suponha-se que o no processo em estudo, ou que durante o perodo de identificao do processo, as observaes foram recolhidas com um intervalo de amostragem especfico, ao

7. Combinao SPC e EPC

173

qual se passou a chamar de intervalo unitrio, suponha-se ainda que exista a pretenso de reduzir a frequncia de amostragem por razes econmicas ou outras. Tal como no caso anterior, admite-se que o sistema responsivo (sem dinmica) e que os distrbios so aproximadamente modelados por uma srie IMA(1,1), que o custo off target ( ) proporcional ao erro quadrtico mdio, e que existe um custo de ajustamento fixo ( ). Introduz-se agora um terceiro custo ( ), o custo de amostragem. Devido dificuldade de determinar os trs custos envolvidos, , e , (Box & Luceo, 1997) baseado nas seguintes condies 1. O intervalo expresso em funo do intervalo unitrio; 2. O intervalo entre ajustamentos (AAI) tambm expresso em termos do intervalo unitrio; 3. A resultante percentagem de incremento no desvio padro (ISD) expressa em termos de ; fornece uma srie de bacos (Box & Luceo, 1997, pp. 221-222) para valores de = 0.1, 0.2, 0.3, 0.4, 0.5, 0.6 que permitem determinar o melhor valor de L para o cenrio em causa. Para cada valor de , os bacos do o valor do incremento do desvio padro (ISD) e o correspondente intervalo mdio entre ajustamentos (AAI) para vrios valores de e . Suponha-se que uma srie temporal (denomine-se por serie 1) , modelada por uma IMA com parmetro de no estacionaridade = 1 e gerada por um processo rudo branco com desvio padro = 1 , foi amostrada com a periodicidade de intervalos unitrios (ou seja de S em S intervalos da srie original) gerando assim uma serie S. Ento pode-se demonstrar (Box, Jenkins, & Reinsel, 2008) que a srie amostrada (serie S) pode tambm ser modelada por um IMA com parmetro tambm gerado por um processo rudo branco com desvio padro , e as relaes entre os parmetros da srie original (serie 1) e a srie amostrada (srie S) so = e = =

Para valores pretendidos de , e , os bacos fornecem valores de AAI e ISD subjacentes aos pressupostos de que os distrbios seguem um modelo IMA, o sistema responsivo e a funo de custo quadrtica. Nesta condies, para um dado , pode-se determinar os valores de e necessrios para produzir qualquer combinao de valores de ISD e AAI. Quando os custos podem ser estimados, os esquemas de ajustamento por feedback podem ser caracterizados directamente em termos dos custos normalizados , e , em vez dos indicadores AAI e ISD, recorrendo a bacos desenvolvidos por (Box G. E., 1992) e reproduzidos em (Box & Luceo, 1997, pp. 228-229). Atravs destes bacos possvel determinar aproximadamente o dos limites normalizados de zona morta = e o intervalo de amostragem em funo dos valores de , = 2 e = 2 .

174

7. Combinao SPC e EPC

Clculo numrico Os bacos, apesar de fornecerem normalmente aproximaes adequadas, no so particularmente fceis de ler. Alternativamente, as quantidades e que minimizam os custos esperados, podem ser determinadas a partir de um algoritmo de clculo numrico desenvolvido por (Luceo, Gonzalez, & Puig-Pey, 1996) e que foi implementado sobre a plataforma Visual C++ no mbito deste trabalho (Anexos 1 e 2).

7.2 Monitorizao dos parmetros e estratgias de ajustamento por realimentao


Outra estratgia de integrao da engenharia de controlo com o controlo estatstico passa por monitorizar os prprios parmetros do modelo e consequentemente do controlador, atravs de cartas de controlo. Uma estratgia de aplicao de controlo estatstico a processos com dados correlacionados, passa por filtrar os dados at que os resduos exibam um comportamento modelado por um processo rudo branco (seco 6.1.4.3) (Figura 6-1), ou seja, os resduos resultantes devem ser independentes e identicamente distribudos (iid). O controlo estatstico baseado nos resduos dos mtodos estatsticos mais largamente investigados. Como tem sido referido ao longo deste texto, a ideia base por detrs das cartas de controlo dos resduos ajustar um modelo de srie temporal que represente a autocorrelao. Se o modelo adequado, os resduos so aproximadamente estatisticamente independentes, e ento cartas de Shewhart, CUSUM ou EWMA, podem ser aplicadas aos resduos.

Figura 7-3 Processo representado por um modelo ARMA

Suponha-se ento que se tem um processo representado por um modelo ARMA(p,q) com esquematizado na Figura 7-3, dado por =

(7.3)

Onde so os dados observados e so variveis normais independentes e 2 identicamente distribudas com mdia zero e varincia . O modelo (7.3) denomina-se por modelo nulo. Suponha-se que existe uma mudana determinstica, que ser referida como uma falha, no processo no instante . Ento, a partir do instante , os dados do processo a serem observados podero ser representados pelo modelo = + onde indica a natureza da falha e a amplitude. Este modelo denomina-se por modelo com discrepncia. Por exemplo, a funo para uma alterao em degrau pode ser definida por

7. Combinao SPC e EPC

175

1 0

0 < 0

Assumindo-se que o modelo (7.3) invertvel, ento os resduos podem ser obtidos filtrando com o filtro inverso ()/(), ou seja = =

(7.4)

ou seja = + onde = denomina-se como sendo assinatura da falha. Deste modo, os 2 resduos esto no correlacionados com uma mdia variante com o tempo e varincia . O valor de depende do modelo ARMA e consequentemente da estrutura de autocorrelao dos dados. A informao contida na dinmica da assinatura da falha pode ser til na deteco da prpria falha. As cartas tradicionais no fazem uso desta informao, mas a carta de resultados acumulados CuScore (Cumulative Score) podem ter essa informao em conta. O objectivo do teste CuScore detectar alteraes nos parmetros de um modelo estatstico, que uma aplicao natural das cartas de controlo. A estatstica CuScore unilateral dada por = + , = , ,
(7.5)

onde e so respectivamente o detector e o valor de referncia. Se excede o intervalo de deciso, h, ento conclui-se que ocorreu uma falha no processo.

7.2.1.1 Estatstica Cuscore


A estatstica Cuscore um procedimento projectado para detectar alteraes nos parmetros de um modelo estatstico. Considere-se um modelo estatstico escrito na forma = ,
(7.6)

onde a observao e um qualquer parmetro do modelo. A estatstica Cuscore associada com o valor = 0

=
=

(7.7)

176

7. Combinao SPC e EPC

onde os valores (modelo nulo) obtm-se fazendo = 0 na equao (7.6) e em que o detector dado por =

=0

Consequentemente, a estatstica Cuscore pode ser vista como uma soma acumulada de produtos de resduos do modelo nulo com um detector apropriado . Do modelo com discrepncia (7.4) tem-se que = . Quando no existe nenhuma alterao, assume-se que = 0, pelo que o modelo nulo ser dado por = . Quando existe uma alterao, os resduos passam a ter mdia , pelo que deixam de ser rudo branco. Detectar a alterao equivalente a detectar a alterao de em relao sua mdia anterior (que era zero), ou mais precisamente, procurando nos resduos. O detector para detectar a alterao de em relao ao valor original que era zero = =

=0

O valor de =
=0

Deste modo, a estatstica Cuscore para monitorizar a mdia de um processo normalmente distribudo e autocorrelacionado

=
=

=
=

(7.8)

Onde = . Para implementao computacional, conveniente reescrever esta estatstica na forma recursiva = + Esta estatstica, contudo, no deve ser utilizada directamente. A razo que a maioria dos sistemas comeam com um longo perodo em que o processo no est controlado, durante o qual vagueia por zonas fora de controlo. Quando uma falha ocorre, pode no se situar exactamente numa situao de controlo. Pelo que deve ser substituda pela estatstica Cuscore unilateral (Shu, Apley, & Tsung, 2002) = + ,

7. Combinao SPC e EPC

177

7.3 Controlo Adaptativo multivariado


Na maioria dos sistemas de controlo por realimentao, pequenos desvios nos valores dos parmetros projectados no causaro quaisquer problema na operao normal do sistema, uma vez que eles so linearizados para funcionar numa determinada zona que se pode considerar linear nessa vizinhana. No entanto, se os parmetros variam muito, devido por exemplo a condies ambientais ou mesmo porque o processo no linear, e portanto ao sair dessa zona actuao o processo deixa de ter um desempenho satisfatrio Se a funo de transferncia do processo puder ser identificada continuamente, ento podese compensar as variaes da funo de transferncia do processo variando os parmetros ajustveis do controlador, obtendo-se desta forma um desempenho satisfatrio do sistema continuamente nas diversas condies de operao. Esta abordagem adaptativa bastante til para lidar com problemas onde o processo normalmente exposto a condies de operao variveis, de tal forma que os parmetros do processo mudam de tempos em tempos. Um sistema de controlo adaptativo aquele que mede, de forma contnua e automtica, as caractersticas dinmicas, compara-as com as caractersticas dinmicas desejadas e usa a diferena para variar parmetros ajustveis do sistema (normalmente caractersticas do controlador) ou para gerar um sinal actuante de tal forma que o desempenho ptimo possa ser mantido independentemente das condies ambientais; alternativamente, tal sistema pode medir continuamente o seu prprio desempenho de acordo com um dado ndice de desempenho e modificar, se necessrio, os seus prprios parmetros, de tal forma a manter desempenho ptimo independentemente das mudanas ambientais (Ogata K. , 1970). A base do controlo adaptativo est na premissa de que h alguma condio de operao ou desempenho para o sistema melhor do que qualquer outra. Portanto torna-se necessrio definir o que constitui um desempenho ptimo. Em sistemas de controlo adaptativo, tal desempenho definido em termos do ndice de desempenho que normalmente est indexado minimizao do custo de operao, ou maximizao do lucro. O ndice de desempenho deve ser confivel, ou deve ser uma medida uniforme de qualidade para sistemas de todas as ordens. Deve ter selectividade, ou envolver um ptimo definido com preciso em funo dos parmetros do sistema. No devem ter ptimos locais e deve ser facilmente aplicvel para sistemas prticos e facilmente mensurvel. De notar que em geral todos os ndices de desempenho matematicamente tratveis, inclusive os quadrticos, tm a desvantagem (sria) de no darem informao sobre as caractersticas de resposta transitria do sistema, pelo que, um sistema que projectado para operar de forma ptima do ponto de vista de mximo lucro pode ter caractersticas transitrias indesejveis, ou mesmo ser instvel. Desta forma, para assegurar caractersticas de resposta transitria satisfatrias, pode-se necessitar de critrios secundrios relacionados com a caractersticas de resposta para poder influenciar na escolha dos elementos de ponderao do custo. O ndice de desempenho usado num sistema de controlo adaptativo define o desempenho ptimo para aquele sistema. Isto significa que o ndice de desempenho essencialmente d o limite superior do desempenho do sistema, pelo que a seleco de um ndice de desempenho adequado fundamental.

178

7. Combinao SPC e EPC

Um controlador adaptativo pode consistir nas seguintes funes: 1. Identificao das caractersticas dinmicas do processo 2. Deciso baseada na identificao do processo 3. Modificao ou actuao baseada na deciso tomada

7.3.1 Modelo base de estratgia de controlo adaptativo multi-input multioutput


Grande parte dos processos modernos de produo controlada por controladores automticos, normalmente tipo PID. Os controladores automticos podem gerir sistemas bastantes complexos de entradas e sadas mltiplas, no entanto, um problema comum nestes controladores a necessidade de ajustamento ou sintonizao se as condies de operao, especificaes ou algumas variveis externas se alteram. Este tema tem merecido as atenes dos mais diversos ramos da engenharia no sentido de reduzir a variabilidade e aumentar a eficcia dos processos e simultaneamente reduzir a dependncia do sempre subjacente factor humano, quer do operador quer do gestor do processo. Para atingir estes objectivos, nos ltimos anos, tem sido desenvolvidos esforos conjuntos das reas do controlo estatstico e engenharia de controlo, surgindo assim propostas de estratgias de monitorizao e controlo que simultaneamente tentam optimizar as caractersticas da qualidade inerentes a processo, compensar o efeito das perturbaes internas e externas e detectar oportunidades. Nos ltimos anos, a indstria mais pujante em termos de crescimento e performance no desenvolvimento tecnolgico dos meios de produo, tem sido a indstria de semicondutores. Consequentemente, as propostas mais recentes neste mbito tem tido como objectivo este tipo de industria, mais propriamente a rea de run-to-run (R2R), (del Castillo, 1996), (Del Castillo & Yeh, 1998). Todos os estudos subsequentes, (Jen, Jiang, & Fan, 2004), (Chang, Hao, & Baras, 2000) entre outros, seguiram mais ou menos o mesmo modelo e para os mesmos fins, introduzindo por vezes novos recursos tais como redes neuronais ou lgica fuzzy. Neste trabalho tenta-se partir do esquema base (integrao EPC/SPC soluo de controlo) apresentado (Del Castillo, 1998), e extrapol-lo para a generalidade dos processos, sejam eles discretos ou contnuos, multivariados ou univariados.

7.3.1.1 Controlo run-to-run


Recentemente, a rea de controlo run.to-run tem recebido considervel interesse literrio, principalmente no segmento de produo de semicondutores (Del Castillo, 1998). O esquema de controlo R2R tem sido tipicamente aplicado a uma etapa na produo de semicondutores, onde as variveis de entrada de um determinado equipamento so calculadas baseadas em medidas tiradas entre lotes batches de wafers de silicone. Este tipo de controlo considerado um controlador supervisor que regula o ajustamento (setpoint) entre lotes na tentativa de ajustar a sada do processo aos valores de referncia e simultaneamente reduzir a variabilidade. Os sistemas multi-input multi-output so os mais frequentemente encontrados em situaes prticas na indstria de semicondutores. Um problema comum que as aplicaes R2R mais evoludas de tcnicas de controlo adaptativo destinam-se a controlo de modelos

7. Combinao SPC e EPC

179

lineares para processos MIMO. No entanto, tm sido feitos alguns estudos em modelo no lineares. Se a superfcie da resposta real do processo for mais ou menos plana em toda a regio operacional, ento um controlador linear dever dar bons resultados. No entanto, os efeitos das no linearidades das variveis de entrada ajustveis na relao funcional e a dinmica de autocorrelao entre as sadas do processo ocorrem bastante frequentemente na produo de semicondutores. Para ultrapassar estas dificuldades, (del Castillo, 1996) apresentou um modelo de controlador auto-sintonizante derivado da filosofia dos controladores de varincia mnima para lidar com os processos de ganho puro mltiplo acoplados com complexos modelos de distrbio. Adicionalmente, implementou uma carta de controlo EWMA multivariada para monitorizar as sadas de controlo com a funo de adicionar uma zona morta ao controlador com o intuito de conjugar a variabilidade das sadas com a reduo das alteraes nas variveis de entrada. (Del Castillo & Yeh, 1998) props outro controlador MIMO R2R denominado de OAQC (Optimizing Adaptative Quality Controller) que era particularmente projectado para lidar com funes de transferncia no lineares.

7.3.1.2 Algoritmo base do controlador OAQC


A maior parte dos controladores R2R so controladores baseados no modelo. Na prtica, os modelos tm que ser estimados e inseridos no controlador, na fase de pr-produo, onde os processos so optimizados e qualificados. A qualificao determina os valores iniciais das variveis manipuladas (varveis de entrada). Se os valores de referncia so desconhecidos, ento tem que ser determinados tambm na fase de optimizao. Nesta fase recorre-se normalmente ao desenho de experincias e metodologia de resposta em superfcie. A optimizao de sistemas de controlo tem uma caracterstica distintiva bsica: na ausncia de perturbaes ou rudo, as relaes no estado estacionrio entre as entradas e as sadas uma funo que tem um mximo ou um mnimo. O objectivo do controlo ptimo encontrar esse ponto e manter o processo o mais perto possvel desse ponto, na presena de distrbios ou deriva.
T Processo

Carta SPC Multivariada

Estimador recursivo + Optimizador no linear OAQC

< no

sim

Figura 7-4 Controlador OAQC com carta SPC actuando como zona morta

180

7. Combinao SPC e EPC

O sistema de controlo OAQC assume que o comportamento do processo com entradas e sadas pode ser modelado de acordo com uma funo de segunda ordem da forma = + + +
Onde = , 2 , i j

(7.9)

<

um vector de dimenso 2 + 1 2 que contm a

expanso quadrtica do vector das variveis de entrada, um vector de dimenso das caractersticas da qualidade, um vector de dimenso que contm os valores de offset, um vector de dimenso n dos factores controlveis, o vector que contm o ndice nos seus componentes e uma sequncia de rudo branco multivariado. Este modelo suficientemente geral para permitir a modelao da maior parte dos distrbios e no linearidades aproximadas que parecem ocorrer nas aplicaes de controlo R2R para os processos de produo de semicondutores. O modelo permite ainda alguma dinmica. Os parmetros , e so estimados on-line recorrendo a algoritmos dos mnimos quadrados recursivos (ver seco 4.3.3). Optimizao no linear A optimizao dos valores das variveis de entrada efectuada com recurso ao ndice de performance (funo objectivo - Figura 7-5) da verso multivariada do controlador de Clarke e Gawthrop um passo frente (seco 6.2.3) dado por = + + +
(7.10)

Que minimizado sujeito s restries na entrada e na sada: em que os vectores , , e so os valores que limitam as zonas de operao das entradas e sadas do processo. A optimizao de em ordem aos factores controlveis realizada com recurso ao clculo numrico atravs ao mtodo Penalty-Barrier". O termo Barrier aplicado s variveis de entrada e garante uma soluo com os valores dentro dos limites. Carta EWMA multivariada Uma carta EWMA (carta de mdias moveis exponencialmente amortecidas) (Lowry, Woodall, Champ, & Rigdon, 1992) adicionada ao anel de controlo com a dupla funo de reduzir a variabilidade das variveis de entrada ou monitorizar as sadas do processo. Actuando como limitadora de zona morta (Figura 7-2) implica que os parmetros do modelo interno do controlador e as variveis de entrada apenas sofrem alteraes quando detectada uma situao em que as sadas do processo se afastam significativamente dos valores de referncia, ou seja, caem fora dos limites da carta EWMA.

7. Combinao SPC e EPC

181

Actuando como monitor do vector mdia do processo, detecta situaes de alteraes da mdia do processo que controlador no consegue compensar. Estas situaes so normalmente provocadas pela saturao dos actuadores (variveis de entrada).
Funo Objectivo x 10 3.5 3 2.5 2 1.5 1 0.5 0 -1 -0.5 0 0.5 1 Platern speed 1 0.5 0 -0.5 -1
6

back pressure down force

Figura 7-5 Exemplo de funo de custo de controlador R2R com varveis de entrada normalizadas

8. Desenvolvimentos Prticos

183

8 Desenvolvimentos Prticos
Ao contrrio de o que estava previsto na data da deciso da abordagem deste tema, no foi possvel fazer o trabalho de campo inerente a este tema. Esse facto ficou a dever-se basicamente ao prazo apertado para a elaborao deste trabalho, e dificuldade actual de identificar situaes reais com interesse de parte a parte na abordagem deste tema. Pelo que a soluo encontrada passou por executar este trabalho tendo por base dados reais, j existentes, referentes a um processo real de fluxo contnuo, disponveis num trabalho realizado anteriormente, dentro do mesmo mbito. Esse trabalho visou a integrao da metodologia do controlo estatstico do processo com engenharia de controlo no contexto de sistemas de produo de fluxo contnuo. Apesar da grande semelhana entre os dois temas, as abordagens so bastantes diferentes, com objectivos bastantes diferentes. Devido ao excelente trabalho feito no mbito do tratamento dos dados em bruto, esse tema no foi abordado neste trabalho, nem to pouco se mexeu nos dados herdados excepo de preencher alguns valores em falta na srie de dados referente sada do processo. Pelo exposto, e devido falta de contacto com o processo real, este processo foi tratado exactamente como se de uma caixa preta se tratasse, apesar de por vezes os dados indiciarem algumas caractersticas prprias que no foi possvel confirmar.

8.1 Descrio e caracterizao do processo


8.1.1 Processo base
O processo base era constitudo por sistema multi-input multi-output com nove variveis de entrada e trs variveis de sada. As variveis exgenas (de entrada eram constitudas por seis variveis controladas e trs variveis referentes s caractersticas da matria prima que, no mbito deste trabalho, se consideravam no controlveis (manipulveis), mas cujos nveis eram conhecidos, ou seja, de acordo com o ponto 6.2.4, ter-se-ia trs variveis do tipo 1 seis variveis do tipo 2 ou 3 e trs variveis de sada . Variveis de entrada As variveis de entrada so constitudas por dois tipos com caractersticas diferentes: as variveis referentes a caractersticas intrnsecas da matria-prima, e as variveis de controlo. Os nveis das variveis referentes s caractersticas intrnsecas supem-se conhecidos priori, por medio directa em cada instante, ou por amostragem, podendo para tal utilizar, por exemplo, cartas de controlo. As variveis de controlo so variveis manipuladas que se vo ajustar em cada instante de forma a compensar a dinmica do processo, a oscilao das variveis referentes s caractersticas da matria-prima e outras perturbaes inerentes ao processo. As variveis de entrada podem ento ser codificadas do seguinte modo: - Variveis referentes a caractersticas intrnsecas da matria-prima:

184

8. Desenvolvimentos Prticos

Hm Dn Gr

- Variveis de controlo: AA IS LBC4 LBC8 TemC4 TemC8

Variveis de sada As variveis de sada referem-se a trs das caractersticas da qualidade cujos nveis devem ser assegurados: - Visc - Ref - IM

Variveis referentes matria-prima

Hm Dn Gr AA IS LBC4 LBC8 TemC4 TemC5

Processo

Variveis de controlo

Visc Ref IM

Figura 8-1 Processo base

Este seria o modelo ideal de processo a implementar, porque para alm de se tratar de um sistema MIMO, as variveis de entrada poderiam abranger os tipos existentes no modelo bsico terico (seco 6.2.4). Alm disso, a integrao do controlo estatstico poderia ser bastante til para monitorizar as variveis referentes matria-prima (tipo X1), e assim evitar uma medio contnua dessas variveis. Contudo este modelo no foi possvel implementar devido falta de dados referentes s caractersticas das varveis da matriaprima e s variveis de sada Ref e IM. Consequentemente, essas variveis foram retiradas do modelo base, resultando assim o denominado modelo de estudo composto pelas seis

8. Desenvolvimentos Prticos

185

variveis de controlo e uma varivel de sada, resultando assim um modelo MISO (multiinput/single-output).

8.1.2 Processo de estudo


O processo de estudo passou ento a ser caracterizado por um modelo MISO com seis variveis de entrada: - AA - IS - LBC4 - LBC8 - TemC4 - TemC5

E uma varivel de sada - Visc

AA IS LBC4 emC4 LBC8 TemC4 TemC5

Processo

Visc

~6 horas 4 horas 4 horas

Figura 8-2 Modelo do processo de estudo

Os dados foram recolhidos com um perodo de amostragem de quatro horas, e o tempo mdio de processamento de cinco horas. As sries so constitudas por 248 observaes igualmente espaadas (ANEXO III) Dos dados disponveis verificou-se a falta de alguns valores na srie da varivel de sada, nomeadamente as observaes nmero 35, 63, 83 e 134. Essas lacunas formam preenchidas com o valor correspondente mdia entre a observao imediatamente anterior e a observao imediatamente posterior. Todo o trabalho de desenvolvimento prtico assenta nesta srie multivariada. Uma primeira anlise grosseira do comportamento do processo pode ser obtida atravs da visualizao dos grficos das sries envolvidas (ANEXO III). Pode ento verificar-se que se est perante sries estacionrias, pelo que primeira vista ser de excluir qualquer componente integrativa no modelo do processo. Para se ter uma ideia mais quantitativa das caractersticas do processo, determinaram-se

186

8. Desenvolvimentos Prticos

algumas estatsticas preliminares dos dados disponveis, que so apresentadas na Tabela 8.1.
Tabela 8.1 - Estatsticas preliminares

AA Mdia Mediana Desvio Padro Mximo Mnimo Amplitude

IS

LBC4

LBC8

TemC4

TemC5

Visc

0.00 -0.21 3.582 12.49 -12.62 25.11

0.00 -0.15 2.021 6.70 -5.10 11.80

0.00 -0.38 2.593 6.67 -5.33 12.00

0.00 0.04 0.721 3.14 -1.16 4.30

0.22 0.00 1.578 4.00 -4.00 8.00

0.17 0.00 1.994 7.00 -5.00 12.00

1074.4 1078.0 48.3 1200.0 937.0 263.0

De notar que, por questes de sigilo relativamente ao processo em causa, os valores referentes s variveis de entrada j se encontram centrados em zero, ou seja, os valores apresentados so as diferenas para a mdia. Antes de se prosseguir com a anlise de autocorrelao verificou-se a normalidade dos dados no sentido de averiguar a estabilidade do processo e a possibilidade de implementao de controlo estatstico sem ajustamento. A ferramenta utilizada nesta anlise foi o teste de Kolmogorov-Smirnov.
Tabela 8.2 - Teste Kolmogorov-Smirnov

AA

IS

LBC4

LBC8

TemC4

TemC5

Visc

P value D CV(5%) H

0,687 0,045 0,086 0

0,359 0,058 0,086 0

0,007 0,106 0,086 1

0,013 0,100 0,086 1

0,001 0,128 0,086 1

0,002 0,116 0,086 1

0,346 0,059 0,086 0

A primeira linha d o valor de percentagem correspondente ao valor da estatstica D (segunda linha) para cada uma das sries. A terceira linha apresenta os valores crticos para uma significncia de 5%. A quarta linha indica a hiptese que no se pode rejeitar, se a hiptese nula (valor 0) se a hiptese alternativa (valor 1). Da anlise da Tabela 8.2 pode ento concluir-se que as sries de entrada AA e IS no do indcios de no normalidade de dados, ao passo que as sries de entrada LBC4, LBC8 TemC4 e TemC5 indiciam claramente um comportamento no normal. Quanto serie de sada, para se ter uma ideia de aderncia dos dados a uma distribuio normal, construiu-se um grfico da distribuio emprica cumulativa (Figura 8-3). Numa anlise preliminar aos dados de sada pode ficar-se com a ideia de que se trata de um processo controlado. Para se ter uma ideia preliminar mais precisa sobre a necessidade de implementao de uma estratgia de controlo mais elaborada, no sentido de se tentar ajustar a mdia do processo e reduzir a sua variabilidade, era conveniente conhecer-se as especificaes do processo.

8. Desenvolvimentos Prticos

187
Varivel Saida: Visc

1 0.9 0.8 0.7 0.6 F(x) 0.5 0.4 0.3 0.2 0.1 0 -3 -2 -1 0 1 x 2 3 4 5

Figura 8-3 Grfico da distribuio emprica cumulativa da varivel de sada

8.1.3 Anlise de correlao e coeficientes de Yule-Walker


Como a anlise preliminar dos dados no indicia a existncia da componente integrativa, pode-se, numa primeira fase, partir do pressuposto de que a srie multivariada composta pelas sete variveis pode ser representava por um modelo ARMA multivariado. Para se ter uma ideia muito preliminar da ordem do modelo precedeu-se anlise das funes de autocorrelao e aos coeficientes de Yule-Walker de acordo com o ponto 6.1.3.2. Da anlise das funes de autocorreco, autocorrelao cruzada e coeficientes de YuleWalker, fica-se com a ideia de que todas as variveis apresentam alguma dinmica prpria, para alm de indiciarem alguma autocorrelao entre elas. Outra hiptese que se levanta a possibilidade de existncia de algum controlo por realimentao, uma vez que existem algumas variveis de entrada que denotam alguma autocorrelao com a varivel de sada. O problema est directamente indexado aquisio de dados para identificao do processos, uma vez que a prpria industria, ou os donos dos processos, evitam sacudir os processos. Ou seja, para os dados de identificao reflectirem o comportamento do processo as entradas devem ser aleatrias, independentes e oscilar o suficiente para que essas alteraes nas entradas tenham reflexo nas variveis de sada. Este problema tem sido constantemente denunciado nas mais diversas bibliografias, (Box, Jenkins, & Reinsel, 2008), (Del Castillo, 2002) entre outros, pelo que algum trabalho tem sido feito ultimamente no sentido de melhorar as metodologias de identificao em malha fechada como o caso de (Vanli & Del Castillo, 2007).

188

8. Desenvolvimentos Prticos

Outro facto que convm ser observado, que nem todas as variveis de entrada parecem ter influncia na sada, ou seja parece existirem variveis de entrada com as quais a varivel de sada no est correlacionada. Isso no quer dizer que a varivel de sada no depende dessa varivel, poder querer dizer que a varivel de sada no sensvel variao verificada nessa varivel de entrada. Este facto poder evidenciar uma boa afinao do processo. Como se pode verificar, no fcil tirar uma concluso, embora preliminar, sobre as ordens do modelo, embora evidencie a existncia da componente autoregressiva. Verifica-se assim que uma tcnica muito til para a anlise univariada torna-se pouco eficaz na anlise multivariada, pelo menos neste caso. Numa anlise puramente exploratria ajustou-se um modelo autoregressivo puro de 3 ordem sem qualquer restrio atravs do modelo de regresso linear como descrito no ponto 6.1.3.3 que se apresenta abaixo. Os valores entre parnteses correspondem aos respectivos desvios padro.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . .

8. Desenvolvimentos Prticos

189
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . .

. . . . . . . . . . . . . .

. . . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

A matriz a matriz de covarincia dos resduos aps o ajustamento por este modelo VAR(3). Uma das caractersticas que as matrizes evidenciam que as seis primeiras linhas da stima coluna no so significativas ao nvel de dois desvios padro, pelo que estes valores devero ser nulos. Esse facto sugere que, ao contrrio da hiptese levantada anteriormente, que as variveis de entrada no so influenciadas pela varivel de sada, o que indicia a no existncia de controlo por realimentao. Outro concluso que se pode tirar da observao das matrizes e , que existem poucos coeficientes significativos o que indica que os componentes destas matrizes, caso se conclua que a ordem do modelo pelo menos 3, sero maioritariamente nulos.

8.2 Identificao do processo


8.2.1 Determinao das ordens do modelo
Para determinar as ordens p e q do modelo ARMA seguiu-se a metodologia descrita no ponto 6.1.3. Inicialmente procedeu-se ao ajuste a um modelo autoregressivo puro para as ordens = 1, , 8 pelo mtodo dos mnimos quadrados, determinando-se para cada ordem o valor da estatstica de teste LR e respectiva percentagem, os valores dos critrios de seleco de modelo AIC e HQ, bem como o determinante da matriz de covarincia dos respectivos resduos (Tabela 8.3).

190

8. Desenvolvimentos Prticos

Tabela 8.3 - Sumrio de resultados de ajustamento a modelo autoregressivo para diversa ordens

(Ordem AR) Estatistica P-value

1 7680.8 9.343 9.624 1220.2 1.0000

2 5120.8 9.338 9.900 97.611 1.0000

3 3527.5 9.368 10.214 79.865 0.9965

4 2814.7 9.549 10.681 44.228 0.3334

5 1986.6 9.611 11.029 72.380 0.9834

6 1481.9 9.731 11.438 55.365 0.7529

7 1064.2 9.816 11.815 62.278 0.9036

8 703.9 9.823 12.114 66.814 0.9539

Estes resultados indicam que para um modelo AR puro, um modelo de segunda ordem ser talvez o mais indicado, embora no se excluam as hipteses de primeira e terceira ordem. Considerou-se tambm a possibilidade de um modelo misto ARMA. Recorrendo a mtodos de estimativa dos mnimos quadrados, num primeiro estgio determinaram-se os resduos de um modelo AR de ordem 8 ( = 8) e respectiva matriz de covarincia. Num segundo estgio ajustaram-se vrios modelo ARMA(p,q) para diversas combinaes de p e q, recorrendo a estimativas dos mnimos quadrados, determinando-se para cada combinao os critrios AIC (Tabela 8.4) e AQ (Tabela 8.5).
Tabela 8.4 Critrio AIC para seleco da ordem do modelo ARMA

q p 0 1 2 3 4 5 0 13.613 9.407 9.587 9.853 10.311 10.599 1 13.236 9.558 9.788 10.088 10.535 10.941 2 13.315 9.891 10.112 10.433 10.907 11.311 3 13.519 10.218 10.480 10.826 11.271 11.681 4 13.753 10.527 10.866 11.268 11.757 12.155 5 14.105 10.954 11.328 11.693 12.156 12.515

Tabela 8.5 Critrio HQ para seleco da ordem do modelo ARMA

q p 0 1 2 3 4 5 0 13.613 9.693 10.161 10.717 11.467 12.048 1 13.523 10.131 10.649 11.241 11.980 12.681 2 13.889 10.752 11.261 11.874 12.641 13.341 3 14.384 11.370 11.921 12.555 13.294 14.001 4 14.909 11.972 12.600 13.291 14.069 14.764 5 15.554 12.694 13.357 14.012 14.765 15.414

8. Desenvolvimentos Prticos

191

O critrio AIC aponta para um modelo AR de primeira ordem, no sendo de excluir a segunda ou terceira ordem, ou mesmo um modelo misto at trs parmetros. O critrio HQ aponta mais ou menos para os mesmos resultados, embora exista uma diferena mais acentuada entre modelos de dois parmetros para trs parmetros. Se a deciso fosse tomada apenas com base nestes critrios, a deciso cairia num modelo AR(1). Para se ter uma ideia mais precisa sobre a ordem da componente autoregressiva a seleccionar optou-se por determinar os trs modelos ( = 1, 2, 3) com restrio de parmetros seguindo o procedimento descrito no ponto 6.1.3.5. Para cada modelo determinou-se os indicadores AIC e HC, que privilegiam o menor numero de parmetros, bem como a estatsticas (expresses (6.63) e (6.64)). Para alm destes indicadores, determinou-se ainda o valor de 2 dado por =
= =

= =

(8.1)

que permite medir a percentagem de variao (da varivel de sada) explicada pelo modelo.
Tabela 8.6 Sumario dos resultados obtidos no ajustamento a modelos AR para ordens 1, 2 e 3

Ordem AIC HQ P-value

1 9,4981 9,7784 8967,3 180,28 1 0,36638

2 9,5713 10,1340 6467,8 198,2 1 0,40763

3 9,8228 10,6690 5556,8 195,03 1 0,41855

Os resultados obtidos esto sumarizados na Tabela 8.6. como se pode verificar, os indicadores AIC, HQ e Q s privilegiam o modelo de primeira ordem, ao passo que os indicadores e 2 apontam para o modelo de terceira ordem. Como o indicador Q s no exclui o modelo de terceira ordem e este demonstra uma melhor adaptao aos dados existentes, optou-se por seleccionar esta ordem caracterizado pelos seguintes parmetros
,

, ,

, ,

, ,

, ,

, , , ,

, ,

192
, , . . , . . . , , . . , . .

8. Desenvolvimentos Prticos

, ,

. , , , , , , ,

, , , , , , ,

, , , , , , ,

, , , , , , ,

, , , , , , ,

, , , , , , ,

, , , , , , ,

A Figura 8-4 apresenta-se um grfico das correlaes cruzadas e autocorrelao dos resduos referentes ao modelo. O grfico referente funo de autocorrelao e correlao cruzada apresenta os limites referentes significncia de 2, ou seja 2 (os grficos referentes s variveis de entrada encontram-se no ANEXO IV).
Coeficientes Yule-Walker dos residuo da Varivel Saida: Visc
AA IS DLBC4 DLBC8 TemC4 TemC5 Saida: Visc

0.2 0.1

-0.1

-0.2

-0.3

10

11

12

13

14

15

ACF Normalizada dos residuos varivel Saida: Visc


0.15 0.1 0.05 0 -0.05 -0.1 -0.15 -0.2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Figura 8-4 Coeficientes de Yule-Walker e ACF dos resduos

8. Desenvolvimentos Prticos

193

A Figura 8-4 indicia a existncia de correlao (marginal) entre a varivel de sada e a variveis TemC4 na lag 4 e IS na lag 6. Esta caracterstica poder estar relacionada com uma fraca estrutura sazonal que ainda se mantm e que poder ser provocada por alguma manuteno peridica ou a outro motivo idntico. Quanto situao verificada na lag 6, considera-se, no mbito deste trabalho, que esta est suficientemente distante para se considerar significativa; de notar que se utilizasse o limite 3 ela no seria significativa. Para colmatar a situao verificada na lag 4 pode-se incluir no modelo uma componente mdia mvel exactamente na lag 4 (Reinsel, 1997), passando o processo a representado por um modelo ARMA com a seguinte estrutura = + + +
(8.2)

Procedendo anlise matriz de covarincia dos resduos, mais precisamente ultima linha, verifica-se que existe pelo menos uma componente 73 que poder indiciar alguma correlao cruzada instantnea. conveniente relembrar que a periodicidade da amostragem de 4 horas e o tempo mdio de permanncia dentro do sistema de seis horas. Isso significa no se deve colocar a hiptese de um modelo ARMA com a seguinte estrutura: = + + +
(8.3)

Em que a matriz os elementos da matriz 0 sero nulos, excepo dos seis primeiros elementos da stima linha. Ao modelo da expresso (8.2) atribui-se a designao sugestiva de modelo ARMA(1.2.3, 4) e, seguindo o mesmo raciocnio, ao modelo da expresso (8.3) atribui-se a designao de modelo ARMA(0.1.2.3, 4)

8.3 Determinao do modelo final


8.3.1 Modelo ARMA(1.2.3, 4)
Uma vez determinada a estrutura do modelo, o prximo passo determinar os respectivos parmetros que, como foi referido na seco 6.1.4, dever ser atravs da estimativa da mxima verosimilhana. Para se utilizar o algoritmo recursivo apresentado no ponto 6.1.4.1 (Determinao iterativa da estimativa condicional MLE), necessrio determinar um modelo inicial. Para se determinar o modelo inicial procedeu-se de acordo com o ponto 6.1.4.2. Os resultados globais do ajustamento deste modelo podem ser consultados no ANEXO V.
, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,

194

8. Desenvolvimentos Prticos

Coeficientes Yule-Walker da Varivel Saida: Visc 0.2 AA IS DLBC4 DLBC8 0 TemC4 TemC5 Saida: Visc

0.1

-0.1

-0.2

-0.3

10

11

12

13

14

15

ACF Normalizada da varivel Saida: Visc 0.15 0.1 0.05 0 -0.05 -0.1 -0.15 -0.2

10

11

12

13

14

15

sada

Figura 8-5 Coeficientes de Yule-Walker e ACF dos resduos da varivel de sada para o modelo ARMA(0.1.2.3, 4)

A Figura 8-5 mostra o grfico das funes autocovarincia e covarincia cruzada da varivel de sada. excepo de uma correlao muito marginal na lag 4 com a varivel TemC4, o modelo no indicia qualquer autocorrelao (at lag 14) nem qualquer correlao cruzada (pelo menos at lag 15), o que poder partida significar um ajustamento satisfatrio. Os indicadores (Tabela 8.7) referentes ao qualidade do ajustamento, indicam uma melhoria substancial, principalmente os dois primeiros, do modelo ARMA em relao ao modelo AR puro apesar do aumento do nmero de parmetros. O indicador continua no entanto a indicar um mau ajustamento global. O peso relativo do aumento de parmetros em ralao qualidade do ajustamento poder ser maior ou menor conforme o objectivo da utilizao do modelo. Como o primeiro objectivo conseguir um modelo que represente o mais fielmente o processo, neste ponto dar-se- maior peso qualidade do ajustamento.
Tabela 8.7 Indicadores de ajustamento do modelo ARMA(0.1.2.3, 4)

4280.9

0.4328

439.88

P-value 1

AIC 9.962

HQ 11.090

Anlise ao modelo ARMA obtido No esquecendo que se est perante um modelo ARMAX, como um dos objectivos deste trabalho passa pela identificao de modelos ARMA multivariados, optou-se por fazer tambm a anlise do modelo obtido como se tratasse de um modelo ARMA (sem variveis exgenas).

8. Desenvolvimentos Prticos

195

A Tabela 8.8 apresenta os resultados do teste de no normalidade conforme descrito no ponto 6.1.4.3. Do ponto 6.1.4.3 e da Tabela 8.8 tem-se que ~ , , pelo que pode conclui-se que nem todas as variveis apresentam os respectivos resduos normalmente distribudos. No entanto verifica-se que a varivel de sada no indicia no normalidade nos seus resduos. Do ponto 6.1.4.3 e da Tabela 8.9 tem-se que ~ , , pelo que, tambm neste caso, o teste estatstico indicia a no normalidade global dos resduos.
Tabela 8.8 Teste de no normalidade (Skewness e Kurtosis)

AA

IS

DLBC4

DLBC8

TemC4

TemC5

Y - VISC

0,0018 0,0160 3,2206 0,1022 0,7047

-0,0004 0,2404 3,9301 1,5362 2,9716

-0,0007 -0,2885 3,6297 -1,8435 2,0118

0,0013 0,0158 6,9172 0,1010 12,5160

-0,0021 -0,5286 4,7492 -3,3776 5,5889

0,0000 0,0807 3,7759 0,5154 2,4790

-0,0009 -0,2015 3,2516 -1,2877 0,8040

Tabela 8.9 Teste de no normalidade global

Valor 19,11 208,05 227,16

P-value 0,99215 1 1

Apesar de este modelo satisfazer razoavelmente as pretenses, optou-se por tentar melhor-lo, aumentando a ordem AR, no intuito de reduzir a correlao residual marginal na lag 4 e simultaneamente reduzir o coeficiente (7,1) da matriz de covarincia residual.

8.3.2 Modelo ARMA(0.1.2.3.4, 4)


O modelo ARMA(1.2.3.4, 4) tem a mesma estrutura do modelo anterior mais uma componente autoregressiva na lag 4 = + + + +
(8.4)

O processo de ajustamento foi o mesmo que se utilizou no caso anterior, ou seja atravs da estimativa da mxima verosimilhana. Os resultados globais do ajustamento deste modelo podem ser consultados no ANEXO VI.

196

8. Desenvolvimentos Prticos

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . .

. . . . .

. . . .

. . .

. .

Coeficientes Yule-Walker da Varivel Saida: Visc 0.2 0.1 AA IS DLBC4 DLBC8 TemC4 TemC5 Saida: Visc

-0.1

-0.2

-0.3

10

11

12

13

14

15

ACF Normalizada da varivel Saida: Visc 0.15 0.1 0.05 0 -0.05 -0.1 -0.15 -0.2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Figura 8-6 Coeficientes de Yule-Walker e ACF dos resduos da varivel de sada para o modelo ARMA(0.1.2.3.4, 4)

A Figura 8-6 mostra o grfico das funes autocovarincia e covarincia cruzada da varivel de sada. Como se pode verificar, o modelo no indicia qualquer autocorrelao (at lag 14) nem qualquer correlao cruzada (pelo menos at lag 15), o que poder partida significar um ajustamento satisfatrio. No que se refere matriz de covarincia residual, verifica-se tambm uma ligeira melhoria. Comparativamente, os indicadores (Tabela 8.10) referentes ao qualidade do ajustamento, indicam alguma melhoria, principalmente os trs primeiros, do ltimo modelo em relao ao anterior.

8. Desenvolvimentos Prticos
Tabela 8.10 Indicadores de ajustamento dos modelos ARMA(0.1.2.3, 4) e ARMA(0.1.2.3.4, 4)

197

Modelo ARMA(0.1.2.3, 4) ARMA(0.1.2.3.4, 4)

4280.9 3567,1

0.4328 0,4464

439.88 417,41

P-value 1 1

AIC 9.962 10,188

HQ 11.090 11,602

De notar que os elementos da ltima linha do parmetro so todos nulos, ou seja, a ordem do modelo em relao varivel de sada no aumentou. Isso significa que o melhor ajustamento que se verifica em termos da resposta do processo se deve fundamentalmente melhor identificao das relaes dinmicas entre as restantes variveis do processo. Anlise ao modelo ARMA obtido A exemplo do que se fez para o modelo ARMA(0.1.2.3, 4), tambm para este modelo se procedeu anlise do modelo obtido como se tratasse de um modelo ARMA (sem variveis exgenas). A Tabela 8.11 apresenta os resultados do teste de no normalidade conforme descrito no ponto 6.1.4.3.
Tabela 8.11 Teste de no normalidade (Skewness e Kurtosis)

AA

IS

DLBC4

DLBC8

TemC4

TemC5

Y - VISC

-0.0013 0.1469 3.2490 0.9368 0.7938

-0.0013 0.1741 3.9190 1.1102 2.9301

0.0004 -0.2352 3.7200 -1.4999 2.2956

0.0038 -0.0630 6.3583 -0.4015 10.7080

0.0000 -0.5527 4.6846 -3.5246 5.3715

-0.0010 0.0878 3.7845 0.5602 2.5013

-0.0009 -0.3376 3.0659 -2.1526 0.2100

Tal como no modelo anterior, tambm para este modelo se pode concluir que nem todas as variveis apresentam os respectivos resduos normalmente distribudos, nomeadamente a varivel DLBC8 e TemC4. A varivel de sada, neste caso, tambm no indicia no normalidade nos seus resduos. Em relao ao teste global, os resultados tambm no se alteram significativamente em relao ao modelo anterior (Tabela 8.12).
Tabela 8.12 Teste de no normalidade global

Valor 19,11 208,05 227,16

P-value 0,99215 1 1

198

8. Desenvolvimentos Prticos

8.3.2.1 Concluses
Em relao ao modelo obtido, foi o modelo possvel com os dados disponveis, mas no se pode concluir que seja bom. O valor de indica um mau ajustamento e o valor de indica que o modelo apenas explica 44,6% da variabilidade. Contudo tem que se ter em conta que o modelo construdo em cima dos dados disponveis e que estes nem sempre so gerados por processos ARMA ou ARIMA. Uma das hipteses aventadas no inicio do estudo deste processo era que o modelo poderia ser simplesmente descrito por um modelo univariado, controlando apenas a varivel de sada (Viscosidade) com recurso ao controlo estatstico. Ou seja o modelo poderia ter a forma, denominada aqui como modelo zero: = + Procedeu-se ao teste de Kolmogorov-Smirnov e conclui-se que no se podia afirmar que os dados de sada eram no normais. Chegados a este ponto, pensou-se que era de todo pertinente comparar os dois modelos. Tal como se procedeu no inicio em relao ao modelo zero, verificou-se a normalidade residual do modelo ARMA(0.1.2.3.4, 4) com recurso ao teste de Kolmogorov-Smirnov.
Tabela 8.13 Teste Kolmogorov-Smirnov aplicado aos resduos do modelo ARMA(0.1.2.3.4, 4)

AA

IS

LBC4

LBC8

TemC4

TemC5

Visc

P- value D CV(5%) H

0,502 0,052 0,086 0

0,480 0,053 0,086 0

0,461 0,054 0,086 0

0,103 0,077 0,086 0

0,206 0,068 0,086 0

0,678 0,046 0,086 0

0,835 0,039 0,086 0

A primeira linha d o valor de percentagem correspondente ao valor da estatstica D (segunda linha) para cada uma das sries. A terceira linha apresenta os valores crticos para uma significncia de 5%. A quarta linha indica a hiptese que no se pode rejeitar, se a hiptese nula (valor 0) se a hiptese alternativa (valor 1). Em relao Tabela 8.2 verificase que as sries residuais que indiciavam no normalidade, depois de filtrados pelo modelo obtido, passaram a no indiciar no normalidade, que o caso das de entrada LBC4, LBC8 TemC4 e TemC5. Comparativamente, o desvio padro da srie de sada passou de 48.3 para 35.3 que poder corresponder a uma reduo da variabilidade do processo no mximo de 27%. Para se ter uma melhor percepo da melhoria em termos da normalidade dos dados construram-se os grficos da distribuio emprica cumulativa (Figura 8-7) das sries de sada do modelo zero e do modelo obtido, em que claramente visvel uma maior concordncia com a distribuio cumulativa normal para o segundo caso.

8. Desenvolvimentos Prticos

199

Varivel Saida: Visc (Modelo base) 1 1

Residuos Saida: Visc (Modelo ARMA(0.1.2.3.4, 4)

0.9

0.9

0.8

0.8

0.7

0.7

0.6 F(x) 0.5

0.6 F(x) 0.5

0.4

0.4

0.3

0.3

0.2

0.2

0.1

0.1

0 -3

-2

-1

1 x

0 -4

-3

-2

-1

0 x

Figura 8-7 Grfico da distribuio emprica cumulativa das variveis de sada do modelo zero e do modelo ARMA(0.1.2.3.4, 4)

Ainda no sentido de se avaliar qualitativamente o modelo obtido, simulou-se a resposta do modelo s sries de entrada dos dados originais (Figura 8-8).
Varivel Saida: Visc 1250 Simulao Real 1200

1150

Saida: Visc

1100

1050

1000

950

900

50

100 t

150

200

250

Figura 8-8 Resultados simulados versus resultados reais

200

8. Desenvolvimentos Prticos

8.4 Integrao do controlo estatstico com engenharia de controlo


Antes de se integrar o controlo estatstico com a engenharia de controlo conveniente que o sistema de controlo seja eficaz e robusto. Deste modo, numa primeira fase implementou-se e testou-se o algoritmo de controlo ao nvel de simulao, e s aps obter resultados satisfatrios a este que se passou para a fase de integrao do controlo estatstico. Cabe aqui dizer que a forma de sintonizao dos parmetros inerentes ao algoritmo de controlo foi feita de forma emprica por forma a queimar etapas e a obter mais rapidamente uma soluo aceitvel que demonstrasse a viabilidade da metodologia.

8.4.1 Estratgia de Controlo


A estratgia bsica de controlo passa por um sistema de controlo por realimentao, ou malha fechada ou ainda anel fechado (feedback/closed loop). A estrutura base do modelo de controlo utilizado a que desenvolvida a partir do diagrama de blocos da Figura 6-3 com alguma alteraes inerentes ao ajustamento ao modelo (Figura 8-9).

1 1
Processo

Optimizador Controlador

Figura 8-9 Diagrama de blocos base do sistema de controlo

O Processo descrito pelo modelo ARMA(0.1.2.3.4, 4) desenvolvido no ponto 8.3.2 dado pela expresso (8.4) e cujo coeficientes se apresentam no ANEXO VI. O vector de entrada constitudo pelas seis variveis de entrada (AA, IS, DLBC4, DLBC8, TemC4 e TemC5) e a varivel composta pela sada do sistema (Viscosidade) que se pretende que se mantenha a um determinado nvel .

8.4.1.1 Controlador
De acordo com o ponto 6.2.3.1, o controlador utiliza uma derivao da verso multivariada do optimizador de Clarke e Gawthrop idntica utilizada por (Del Castillo & Yeh, An adaptive run-to-run optimizing controller for linear and nonlinear semiconductor processes, 1998) e j apresentado na expresso (7.10) dado por = ++ ++ +
(8.5)

Que minimizado sujeito s restries na entrada e na sada:

8. Desenvolvimentos Prticos

201
(8.6) (8.7)

Aqui, em principio + seria a previso ( + 1) perodos frente de ++ condicional informao existente no instante . o vector das referncias das variveis de sada, uma matriz diagonal com as ponderaes (prioridades) das sadas e uma matriz diagonal com as ponderaes (custos) das entradas. O vectores , , e estabelecem o domnio e contradomnio de actuao do processo. Isto , os valores das entradas esto constrangidos zona entre e , em que o limite inferior e o limite superior; enquanto que as respostas do processo no devem ultrapassar os limites inferiores e os limites inferiores A optimizao de em ordem aos factores controlveis realizada com recurso ao clculo numrico atravs ao mtodo PenaltyBarrier" (Jen, Jiang, & Fan, 2004), (Chen & Goldfarb, 2006). Neste caso recorreu-se funo do MATLAB fmincon.

8.4.1.2 Modelo Para o controlador


Esta estratgia de controlo insere-se dentro da categoria do controlo ptimo, pelo que, para implementar esta estratgia de controlo, o controlador necessita do modelo do processo, ou seja, o controlador necessita do modelo para poder prever a sada do processo ( + 1) perodos frente (++ ). Uma vez que, neste caso, o objectivo simular o processo e a respectiva resposta do controlador, no faz sentido o processo e o controlador terem o mesmo modelo, at porque normalmente o controlador apenas uma linearizao do comportamento do processo em redor de um ponto alvo de actuao, como tem sido referido ao longo deste texto. Por estas razes e baseado no estudo feito na seco 8.3, optou-se por um modelo autoregressivo puro de segunda ordem com a seguinte estrutura = + +
(8.8)

em que, como anteriormente, = , , o que implica que, para este processo, os elementos da matriz 0 sero nulos, excepo dos seis primeiros elementos da stima linha. Seguindo a notao introduzida, este modelo foi denominado por AR(0.1.2). Os resultados globais do ajustamento deste modelo podem ser consultados no ANEXO VII. Abaixo apresentam-se alguns indicadores.
Tabela 8.14 Indicadores de ajustamento do modelo AR(0.1.2)

6513
. . . . . . .

0,4280
. . . . . . .

537,36

P-value 1
. . . . . . .

AIC 9,977
. . . . . . .

HQ 10,82
. . . . . . .

. . . . . . .

. . . . . . .

202

8. Desenvolvimentos Prticos

. . . . . . .

. . . . . .

. . . . .

. . . .

. . .

. .

Em relao ao modelo ARMA(0.1.2.3.4, 4), este modelo no consegue eliminar os indcios de correlao cruzada (marginal) existente na lag 4 (Figura 8-10) e apresenta um valor do determinante da matriz de covarincia residual muito mais elevado, mas consegue valores aproximados do desvio padro da varivel de sada e de muito semelhantes com uma reduo significativa do numero de parmetros, conseguindo-se assim baixar tambm os indicadores AIC e HQ.
Coeficientes Yule-Walker da Varivel 7 0.2 0.1 0 -0.1 -0.2 -0.3

10

11

12

13

14

15

ACF Normalizada da varivel 7 0.2

0.1

-0.1

-0.2

10

11

12

13

14

15

Figura 8-10 Coeficientes de Yule-Walker e ACF dos resduos da varivel de sada para o modelo AR(0.1.2)

8.4.1.3 Implementao do modelo


A partir do modelo determinado no ponto anterior pode-se ento retirar a funo de transferncia a introduzir no controlador que ser dada por

8. Desenvolvimentos Prticos

203

= . + . . . + . + . + . + ou

(8.9)

= . + . . . + . + . + . +

(8.10)

em que a diferena para a mdia . Ao analisar esta expresso e a expresso do controlador (8.5) surge um problema que at agora ainda no foi mencionado, talvez porque s surge nas situaes multivariadas, uma vez que temos variveis de entrada desfasadas de uma lag e variveis de entrada desfasadas de duas lags. A questo que se coloca a seguinte: Qual o valor de b na expresso (8.5)? A implementao em espao de estados ter possivelmente resposta (?) para esta pergunta, mas essa abordagem no foi feita neste trabalho. A soluo adoptada neste trabalho, que s foi possvel devido ao facto de se desenvolver a metodologia para sistema MIMO, foi a de tentar minimizar a sada do processo simultaneamente um passo frente e dois passos frente, ou seja, a varivel ++1 que at aqui era uma escalar, passa a ser tratada como uma varivel vectorial definida por +1 , +2 componentes so definidas por

em que cada uma das

+ = . + + . . . + . + . + .
(8.11)

+ = . + + . + . + . + + . + . + . + Ou seja, em cada iterao existem variveis de entrada que so estimadas simultaneamente um passo frente e dois passos frente, mas obviamente, no sistema entram apenas varveis referentes a esse instante. Outro pormenor que se verifica na expresso (8.10) a ausncia da varivel de entrada DLBC8 (ou 4 ). Como j foi referido, a ausncia dessa varivel no significa que ela no tenha influncia na resposta do processo, significa, isso sim, que a variao dessa varivel dentro dos valores admissveis, ou seja, a gama de valores utilizados para identificao do processo, no altera significativamente a resposta do processo. Embora na determinao do modelo do processo se tenha admitido a existncia de alguma dinmica nas variveis de controlo, para efeitos de controlo, na ausncia de mais informao do processo, considera-se as variveis de controlo como determinsticas e instantneas (o valor da constante de tempo insignificante relativamente constante de tempo do processo). Contudo, em relao s variveis de controlo (entrada), o modelo intrnseco do processo separa a parte proveniente da dinmica da parte proveniente do ajustamento devido presena da componente mdia mvel presente no modelo.

204

8. Desenvolvimentos Prticos

Parmetros Para implementao do sistema de controlo tem que se determinar ainda os valores dos parmetros e , os vectores referentes limites de operao , , e e ainda o valor de referncia da sada do processo . Estes parmetros, normalmente, so definidos de acordo com os gestores dos processos tendo em conta condies econmicas, operacionais e as especificaes das caractersticas da sada do processo. Um algoritmo especifico para sintonizao dos parmetros e poderia passar, por exemplo por simulao iterativa atravs de uma gama de valores possveis dos parmetros, e verificar quais os que produziam os resultados mais prximos dos pretendidos. Neste caso no se aprofundou o mtodo, pelo que os valores utilizados foram determinados atravs de simulao, mas apenas at se obterem uma combinao de valores que satisfizessem as pretenses presentes. Um mtodo mais preciso dever ser implementado posteriormente. Para efeitos de simulao, para os limites operacionais e das variveis de entradas foram utilizados os mnimos e os mximos respectivamente, de cada srie. Para o valor de referncia da varivel de sada , numa primeira fase pensou-se em utilizar a mdia do processo, mas para verificar a eficincia do controlador optou-se por utilizar um valor diferente. De notar que o controlador dever estar projectado para admitir um valor de referncia varivel ( , mas essa situao no muito vulgar neste enquadramento. Simulao do sistema de controlo Para efeitos de validao da estratgia de controlo definida simulou-se o processo durante 600 observaes com os seguintes parmetros: = = = = . Das observaes simuladas obteve-se um desvio mdio de -3.9592 em relao ao valor de referncia e um desvio padro de 38.253. A Figura 8-11 mostra o grfico da varivel de sada das 600 observaes resultante da simulao do processo com controlo integrado. Os grficos relativos s variveis de entrada podem ser consultados no ANEXO VIII. Comparativamente ao sistema sem controlo, para alm de um maior controlo sobre o valor mdio da resposta (parmetro central), verificou-se um decrscimo moderado da variabilidade do processo, ou seja passou-se de 48.3 (Tabela 8.1) para aproximadamente 38.3. O desvio mdio verificado poder dever-se diferena existente entre o modelo do processo e o modelo usado no controlador. Esse facto, de certo modo, reflecte o que se passa na realidade, uma vez que os modelos obtidos nunca conseguem captar a totalidade do comportamento dos processos que normalmente so de ordem bastante superior admitida e frequentemente tem comportamentos no lineares que so captados apenas parcialmente pelos modelos lineares. Ou seja, os modelos nunca so perfeitos. O desvio

8. Desenvolvimentos Prticos

205

mdio verificado, tambm apelidado de erro de offset, pode no entanto ser compensado com a introduo de um compensador PI ou apenas I.

Varivel Saida: Visc 1250 Simulao Real 1200

1150

Saida: Visc

1100

1050

1000

950

900

100

200

300 t

400

500

600

Figura 8-11 Grfico da varivel de sada do sistema com controlo

8.4.2 Estratgia de integrao


A integrao do controlo estatstico com engenharia de controlo pode ter vrios objectivos, mas nem sempre aplicveis. Um dos objectivos poder ser a reduo da variabilidade dos parmetros de entrada com a introduo de cartas, normalmente EWMA ou CUSUM de controlo sada do processo com a funo de delimitar (treshold) a zona morta, sendo que o controlador s actua quando a carta identifica uma situao de fora de controlo (ver Figura 7-2). Outro dos objectivos poder ser a implementao do chamado SPC algortmico ou ASPC. Neste caso o controlo estatstico tem a sua funo normal de detectar causas especiais que conduzam melhoria do processo, que no seriam possveis de detectar devido ao facto do controlador compensar possveis alteraes no processo mantendo a resposta dentro dos limites de controlo. Esta estratgia passa por implementar cartas de controlo entrada e sada do processo (Figura 8-12). Se sada for detectada uma situao fora de controlo ser porque o controlador no conseguiu compensar a alterao verificada no processo. Se o controlador conseguir compensar a alterao, ento esta dever ser detectada nas cartas

206

8. Desenvolvimentos Prticos

de controlo implementadas na entrada do processo devido compensao fora dos limites exigida devido s alteraes do processo.

STOP Remover causas especiais


no < sim

T Processo

no

SPC

<

sim

SPC

Controlador

Figura 8-12 Diagrama de blocos de possvel implementao do SPC algortmico (ASPC)

Quanto primeira abordagem (zona morta), verificou-se que, no processo em causa, a viabilidade era reduzida devido ao reduzido ratio entre o desvio padro mnimo (desvio padro com o processo ajustado em todos os instantes sem zona morta) e o desvio padro sem qualquer controlo. No que diz respeito segunda abordagem (ASPC), concluise que, devido ao sistema de controlo implementado, no era fcil detectar qualquer situao fora de controlo nas variveis de controlo (entrada) devido ao facto de estas estarem constrangidas (limitadas entre um mximo e um mnimo) pelo prprio controlador, pelo que a verificar-se qualquer situao fora de controlo, esta teria que ser nas variveis de sada.

8.4.2.1 Modelo
Uma vez postas de parte estas duas abordagens, optou-se pelo esquema mais generalista apresentado na Figura 7-1 em que o controlo estatstico tem a dupla funo de alterar os parmetros do controlador, caso seja vivel, e simultaneamente detectar causas especiais.
No modelo implementado (

Figura 8-13), utiliza-se uma carta EWMA para monitorar a mdia do processo. Sempre que detectada uma alterao da mdia do processo > , o sistema verifica se o controlador consegue compensar essa alterao, ou seja, se +1 = + estiver compreendido entre o valor mnimo e o valor mximo admissvel pelo controlador, respectivamente e . Se o controlador consegue compensar a alterao ento lanado um alerta, o controlador actualiza o parmetro que foi alterado (neste caso a mdia), o processo continua, mas espera-se que a causa seja identificada se for o caso (poder tratar-se de um processo com mdia oscilante) e removida. Caso contrrio, o processo pra para que seja identificada a causa e removida. Ou seja, perante uma alterao no processo, sempre emitido um alerta, podendo no entanto, o processo parar ou no.

8. Desenvolvimentos Prticos

207

Sim Alterar algoritmo


= +

Remover causas especiais

STOP

No

< + <

Sim EWMA >

Controlador

Processo

Figura 8-13 Integrao EPC/SPC (Monitorizao da mdia do processo)

8.4.2.2 Carta EWMA


Figura 8-13) determinado pela expresso = + E os limites de controlo dados pelas expresses assimptticas
Como o processo analisado apenas tem uma sada (sistema MISO) usou-se uma carta EWMA univariada (Montgomery D. C., 2001) para monitorizar a varivel de sada. O valor de (

= +

De notar que, se a resposta do processo fosse multivarivel, provavelmente ter-se-ia que utilizar uma carta EWMA para cada varivel, uma vez que a carta EWMA multivariada (Lowry, Woodall, Champ, & Rigdon, 1992) no informa qual a varivel que se alterou, pelo que no seria possvel detectar qual o parmetro do controlador a actualizar. Nesse caso, contudo, seria conveniente retirar a componente de correlao das variveis antes do processo de monitorizao (ver ponto 6.1.1.2). Comparativamente ao modelo da Figura 7-4 (Del Castillo & Yeh, 1998), que utiliza uma carta EWMA multivarivel a diferena que nesse caso, sempre que se verifica um situao de fora de controlo, os parmetros do modelo so todos actualizados, pelo que no existe a necessidade de verificar qual o parmetro que se alterou.

8.4.2.3 Simulao
No campo da simulao o trabalho efectuado foi relativamente reduzido, e feito apenas a ttulo exemplificativo do que poder ser o ponto de partida para trabalhos futuros na rea da integrao de EPC/SPC.

208

8. Desenvolvimentos Prticos

Com base no modelo da Figura 8-13 foram simulados trs cenrios diferentes. Em todos os casos foram usados os seguintes parmetros para o controlador: = = = = . No primeiro cenrio tentou-se simular alteraes de um (1) desvio padro na mdia do processo e verificar o comportamento da resposta da carta EWMA, do controlador e da resposta do processo. Como o objectivo no passava pela paragem do processo, os limites e foram estabelecidos de forma a no serem atingidos. Neste cenrio foram utilizados os seguintes valores para a carta EWMA (Montgomery D. C., 2001) = . = . Que para uma alterao de um (1) desvio padro na mdia do processo corresponde a um ARL (Average Run Lenght) de 10,5. Num segundo cenrio, simularam-se alteraes de meio (0.5) desvio padro na mdia do processo, sendo admissveis variaes entre 0 1.5 e 0 + 1.5 sem que o processo fosse parado devido a alarme de alterao no processo no compensada pelo controlador. Tambm aqui o objectivo no passa por parar o processo, mas sim verificar o comportamento do sistema integrado com deteco de amplitudes mais baixas na mdia. Neste cenrio foram utilizados os valores de = . e = . que corresponde a um ARL de 71.2 para 0.5 e de 14.3 para 1. Num terceiro cenrio, simularam-se alteraes de meio (0.5) desvio padro na mdia do processo, sendo admissveis variaes entre 0 1.5 e 0 + 1.5 sem que o processo fosse parado devido a alarme de alterao no processo no compensada pelo controlador. Tambm aqui o objectivo no passa por parar o processo, mas sim verificar o comportamento do sistema integrado com deteco de amplitudes mais baixas na mdia. Tambm neste cenrio foram utilizados os valores de = . e = . que correspondem a um ARL de 41.8 para 0.5 e de 10.5 para 1. Em todos os cenrios a simulao foi composta por 500 observaes e foi introduzida uma alterao de um (1) desvio padro na mdia do processo entre as observaes 100 e 300.

8.4.2.4 Resultados
Cenrio 1 Das observaes simuladas sob as condies descritas para o cenrio 1, obteve-se um desvio mdio de -1.0729 em relao ao valor de referncia e um desvio padro de 37.242. A Figura 8-14 mostra o grfico da varivel de sada das 500 observaes resultante da

8. Desenvolvimentos Prticos

209

simulao do processo com integrao SPC/EPC. Os grficos relativos s variveis de entrada podem ser consultados no ANEXO IX. Como se pode verificar, a rpida deteco da carta EWMA e a consequente alterao do modelo interno do controlador impediu que a perturbao introduzida no processo influenciasse significativamente a sada do processo. A Figura 8-15 mostra a carta EWMA, com os respectivos limites, resultante da simulao do processo nas condies estabelecidas para o cenrio 1. A Tabela 8.16 mostra alguns dos pontos mais significativos dessa carta. No processo verificou-se uma alterao na mdia de um (1) desvio padro no instante 100. Como se pode verificar, a carta detectou uma alterao na mdia logo na observao 108 (o ARL nestas condies de 10.5). Aps a deteco, o sistema alterou o parmetro da mdia adicionando-lhe 1 como est estipulado, e o modelo interno do controlador ficou de acordo com o processo alterado no instante 100. O aumento de 1 na mdia do processo retirado na observao 300. Esta alterao detectada pela carta logo na observao 306 com a consequente actualizao do respectivo parmetro no modelo interno do controlador.
Varivel Saida: Visc 1250

1200

1150

Saida: Visc

1100

1050

1000

950

50

100

150

200

250 t

300

350

400

450

500

Figura 8-14 Resposta do processo (cenrio 1)

Embora a alterao introduzida no processo no seja perceptvel na sada do processo, as suas consequncias so perfeitamente visveis no comportamento das variveis de entrada. Esta constatao vai ao encontro da teoria de suporte da metodologia ASPC (algotithmic statistical process control) que argumenta que se a perturbao no detectvel a partir da

210

8. Desenvolvimentos Prticos

resposta do processo quando este est sob controlo por realimentao, ento ela ser detectvel atravs das alteraes verificadas nas variveis de entrada.
Tabela 8.15 Alguns pontos da carta EWMA

Observao 1 2 107 108 305 306 500

LIC 60,440 60,440 60,440 60,440 60,440 60,440 60,440

LSC -9,307 -9,307 -9,307 -9,307 -9,307 -9,307 -9,307

25,567 30,234 51,222 65,048 -4,231 -12,603 23,721

0,000 0,000 0,000 35,321 35,321 0,000 0,000

70

LSC

60

50

40

30

20

10

LIC

-10

-20

50

100

150

200

250

300

350

400

450

500

Figura 8-15 Carta EWMA (cenrio 1)

De facto, na Figura 8-16 so perfeitamente visveis as consequncias das alteraes provocadas no processo, com as variveis de controlo a corresponder s solicitaes do controlador no sentido de manter a resposta prxima dos valores de referncia.

8. Desenvolvimentos Prticos

211

H a salientar contudo que, neste caso, a deteco foi efectuada na varivel de sada, e que em princpio, este facto deve despoletar uma anlise ao processo no sentido de identificar a causa da alterao e proceder sua remoo no sentido da melhoria contnua do processo. Existem no entanto processos que no tm mdia constante, ou seja a mdia oscila em torno de um valor mdio. Nesses casos, a implementao de sistema de controlo semelhante a este poder diminuir significativamente a variabilidade do processo.

8 AA IS DLBC4 DLBC8 TemC4 TemC5

-2

-4

-6

50

100

150

200

250

300

350

400

450

500

Figura 8-16 Variveis de entrada do processo (cenrio 1)

Cenrio 2 Das observaes simuladas sob as condies descritas para o cenrio 2, obteve-se um desvio mdio de -6.0364 em relao ao valor de referncia e um desvio padro de 43.974. A Figura 8-17 mostra o grfico da varivel de sada das 500 observaes resultante da simulao do processo com integrao SPC/EPC. Os grficos relativos s variveis de entrada podem ser consultados no ANEXO X. A Figura 8-18 mostra a carta EWMA, com os respectivos limites, resultante da simulao do processo e a Tabela 8.16 mostra alguns dos pontos mais significativos dessa carta. No processo verificou-se uma alterao na mdia de um (1) desvio padro no instante 100. Como se pode verificar, a carta detectou uma alterao na mdia na observao 110. Aps a deteco, o sistema alterou o parmetro da mdia adicionando-lhe 0.5 como est estipulado. No instante 143 a carta detecta outra alterao na mdia (o ARL para 0.5 de 41.8) e o sistema actualiza novamente o respectivo parmetro, ficando o parmetro da mdia do modelo interno do controlador de acordo com a perturbao sofrida.

212

8. Desenvolvimentos Prticos

Varivel Saida: Visc 1250

1200

1150

Saida: Visc

1100

1050

1000

950

50

100

150

200

250 t

300

350

400

450

500

Figura 8-17 Sada do processo (cenrio 2) Tabela 8.16 Alguns pontos da carta EWMA

Observao 1 110 142 143 148 149 226 340 341 429 430 500

LIC 79,501 79,501 79,501 79,501 79,501 79,501 79,501 79,501 79,501 79,501 79,501 79,501

LSC -28,368 -28,368 -28,368 -28,368 -28,368 -28,368 -28,368 -28,368 -28,368 -28,368 -28,368 -28,368

25,567 81,503 62,825 88,626 67,419 89,034 -40,386 11,801 -38,506 1,047 -31,908 47,450

0,000 17,660 17,660 35,321 35,321 52,981 35,321 35,321 17,660 17,660 0,000 0,000

8. Desenvolvimentos Prticos

213

100 LSC LIC EWMA Mdia

LSC

50

LIC

-50

50

100

150

200

250

300

350

400

450

500

t
Figura 8-18 Carta EWMA (cenrio 2)

Na observao 149, a carta detecta novamente um aumento da mdia do processo, mas neste caso trata-se de um falso alarme. Se fossem admissveis apenas variaes entre 0 1 e 0 + 1, o processo pararia para que fosse identificada a causa da variao. O falso alarme foi corrigido pelo prprio sistema no ponto 226, ficando o modelo interno do controlador novamente de acordo com a perturbao sofrida pelo processo. O aumento de 1 na mdia do processo retirado na observao 300. Esta alterao s detectada pela carta na observao 341 com a consequente actualizao do respectivo parmetro, mas olhando para a carta (Figura 8-18) verifica-se que esteve muito perto de ser detectada entre as observaes 319 e 322. A alterao s detectada totalmente (1) no ponto 430 passando ento o modelo interno do controlador a estar novamente de acordo com o processo. No grfico referente sada do processo (Figura 8-17) so perfeitamente identificveis as zonas em que o modelo do controlador no est de acordo com o modelo do processo. Na Figura 8-19 pode-se verificar as alteraes efectuadas nas variveis de entrada pelo controlador para compensar as perturbaes detectadas. Nessa figura so perfeitamente detectveis as restries impostas pelo algoritmo de controlo, no que diz respeito aos limites inferiores e superiores impostos nas variveis de entrada, nomeadamente nas variveis TemC4 e IS. Esta situao apelidada na literatura de controlo como saturao dos actuadores.

214

8. Desenvolvimentos Prticos

No global, salienta-se que apesar das perturbaes impostas, o desvio mdio em relao ao valor de referncia e a prpria variabilidade do processo situam-se em nveis aceitveis, comparvelmente aos resultados reais (sem controlo nem perturbaes).

8 AA IS DLBC4 DLBC8 TemC4 TemC5

-2

-4

-6

50

100

150

200

250

300

350

400

450

500

Figura 8-19 Variveis de entrada do processo (cenrio 2)

Cenrio 3 Das observaes simuladas sob as condies descritas para o cenrio 3, obteve-se um desvio mdio de -2.4004 em relao ao valor de referncia e um desvio padro de 41.113. A Figura 8-20 mostra o grfico da varivel de sada das 500 observaes resultante da simulao do processo com integrao SPC/EPC. Os grficos relativos s variveis de entrada podem ser consultados no ANEXO XI. A Figura 8-21 mostra a carta EWMA, com os respectivos limites, resultante da simulao do processo e a Tabela 8.17 mostra alguns dos pontos mais significativos dessa carta. Tal como nos casos anteriores, no processo verificou-se uma alterao na mdia de um (1) desvio padro no instante 100. Como se pode verificar, a carta detectou uma alterao na mdia na observao 105 (o ARL para 1 de 10.5). Aps a deteco, o sistema alterou o parmetro da mdia adicionando-lhe 0.5 como est estipulado. No instante 115 a carta detecta outra alterao na mdia e o sistema actualiza novamente o respectivo parmetro, ficando novamente de acordo com a perturbao sofrida.

8. Desenvolvimentos Prticos

215

Varivel Saida: Visc 1250

1200

1150

Saida: Visc

1100

1050

1000

950

900

50

100

150

200

250 t

300

350

400

450

500

Figura 8-20 Sada do processo (cenrio 3)

Tabela 8.17 Alguns pontos da carta EWMA

Observao 1 104 105 115 301 302 359 360 500

LIC 60,440 60,440 60,440 60,440 60,440 60,440 60,440 60,440 60,440

LSC -9,307 -9,307 -9,307 -9,307 -9,307 -9,307 -9,307 -9,307 -9,307

25,567 48,634 64,565 68,069 0,776 -24,990 -3,025 -9,678 18,671

0,000 0,000 17,660 35,321 35,321 17,660 17,660 0,000 0,000

216

8. Desenvolvimentos Prticos

70

LSC 60
50 40 30 20 10 0

LSC LIC EWMA Mdia

LIC -10
-20 -30

50

100

150

200

250

300

350

400

450

500

Figura 8-21 Carta EWMA (cenrio 3)

O aumento de 1 na mdia do processo retirado na observao 300. Esta alterao detectada pela carta logo na observao 302 com a consequente actualizao do respectivo parmetro. A alterao detectada totalmente (1) no ponto 360 passando ento o modelo interno do controlador a estar novamente de acordo com o processo. No grfico referente sada do processo (Figura 8-20Figura 8-17) nota-se apenas uma ligeira subida na zona compreendida entre a observao 100 e 110, pouco perceptvel, e uma ligeiro abaixamento na entre as observaes 300 e 350. No global, so pouco perceptveis as consequncias das alteraes que ocorreram. No que diz respeito s variveis de entrada, como se pode verificar na Figura 8-22, os efeitos provocados pelas aces de controlo nas variveis de entrada so bem perceptveis. No global, verifica-se que, para alm de um muito ligeiro aumento no parmetro de disperso, a resposta do processo praticamente no sentiu a perturbao imposta.

8. Desenvolvimentos Prticos

217

8 AA IS DLBC4 DLBC8 TemC4 TemC5

-2

-4

-6

50

100

150

200

250

300

350

400

450

500

Figura 8-22 Variveis de entrada do processo (cenrio 3)

8.4.3 Concluses
A primeira concluso que se pode retirar que as simulaes efectuadas apontam no sentido de esta metodologia permitir controlar o parmetro central da sada do processo, mantendo-o bastante prximo dos valores de referncia (target), e simultaneamente reduzir a sua variabilidade mesmo perante a presena de alteraes no processo. Outra das concluses que surge dos cenrios simulados, que se obtm melhores resultados com valores de lambda mais baixos. Em geral, verifica-se que valores no intervalo 0.05 0.25 conduzem a bons resultados na deteco de pequenas alteraes (Montgomery D. C., 2001) e que valores de ~3 (limites de trs sigma) funcionam razoavelmente bem para valores de > 0.1. No seguimento do que se vem defendendo ao longo deste trabalho, a obteno de um bom modelo, no sentido de representar correctamente o comportamento do processo, consiste numa ferramenta poderosssima no sentido melhorar significativamente, ou mesmo optimizar o processo. Os mtodos de simulao aqui apresentados so bastante bsicos e com reduzida inferncia estatstica. O objectivo principal dos cenrios simulados, basicamente foi demonstrar algumas das potencialidades da metodologia e exemplificar o trabalho que poder ser desenvolvido a partir daqui.

218

8. Desenvolvimentos Prticos

Aqui simulou-se um caso prtico duma estratgia de integrao do controlo estatstico com engenharia de controlo no intuito de demonstrar as potencialidades da sinergia destas duas metodologias. Outras estratgias existem e foram aqui discutidas e outras existem que no foram abordadas neste trabalho. A estratgia a adoptar na implementao desta metodologia pode variar significativamente de implementao para implementao, de empresa para empresa, de processo para processo, da que muitos autores nesta rea, (Del Castillo, 2002) entre outros, argumentem que o reduzido sucesso verificado at agora na implementao desta metodologia est directamente ligado dificuldade de a transformar num produto comercial genrico.

9. Concluses, recomendaes e trabalho futuro

219

9 Concluses, recomendaes e trabalho futuro


O objectivo original deste trabalho apontava para o estudo e desenvolvimento de uma metodologia que permitisse integrar o conceito de controlo estatstico com o conceito de controlo do processo com aplicao prtica em ambiente industrial. Esse objectivo foi sendo redefinido ao longo do prprio trabalho. Desde cedo se identificou a dificuldade de atingir esse objectivo, devido s condicionantes existentes quer em termos operacionais, existncia de um caso de estudo, quer em termos de prazo de execuo do trabalho. De salientar que, apesar de ser um tema bastante abordado recentemente nos meios acadmicos ligados engenharia industrial, no se encontram ainda grandes exemplos de aplicao e implementao desta metodologia. Os exemplos mais estudados e mais mediticos esto orientados para indstria de semicondutores e invariavelmente focados no mesmo processo. Deste modo optou-se por redefinir os objectivos no sentido de se chegar to longe quanto possvel no desenvolvimento e implementao das ferramentas base que permitissem integrar e implementar os dois conceitos. Tambm desde cedo se reconheceu que o principal pilar para a aplicao da metodologia passava pela identificao e modelao dos processos, no sentido de que quanto mais perto o modelo estiver da representao real do processo, ou seja, quanto mais fivel for o modelo, mais fcil se torna encontrar uma soluo eficaz para o processo. Deste modo, grande parte do trabalho foi dedicado identificao e modelao de processos dinmicos atravs do estudo, desenvolvimento, implementao e validao de algoritmos que actualmente podem ser utilizados a partir de dados histricos de processos, sejam eles industriais ou no. Aps atingido o objectivo principal, a disponibilidade restante foi canalizada para exemplificao do rumo a dar ao trabalho efectuado. Ou seja nos quatro grandes blocos que foram identificados como a composio das reas de estudo inerentes a esta metodologia (identificao/modelao, controlo estatstico - SPC, engenharia de controlo - EPC e integrao de EPC/SPC), optou-se por sedimentar razoavelmente a base onde assentam ou dois blocos a integrar. Apesar de este trabalho estar orientado para processos gerais de entradas mltiplas e sadas mltiplas (MIMO), verifica-se que uma grande parte deste texto est dedicada a sistemas univariados (captulos a 4 e 5). Esse facto est relacionado com a ideia que se interiorizou de que os conceitos bsicos inerentes a esta matria eram mais facilmente assimilados com modelos univariados, pelo que se optou por numa primeira fase fazer uma abordagem aos conceitos relacionados com sistemas univaridados e numa segunda fase generaliza-los para sistemas de entradas mltiplas e sadas mltipla. Ainda no campo da identificao, apesar de grande parte deste trabalho se ter efectuado nesta rea, ficou-se aqum do que se pretendia fazer, uma vez que metodologias de identificao como desenho de experincias, resposta em superfcie, identificao em malha fechada ou identificao em espao de estados, no foram abordadas ou foram abordadas de forma muito ligeira.

220

9. Concluses, recomendaes e trabalho futuro

Apesar de a abordagem de representao em espao de estados apenas se ter feito esporadicamente, cedo se concluiu que uma abordagem a sistemas multi-input multi-output (MIMO) dever passar por esse tipo de representao uma vez que praticamente toda a filosofia por detrs da engenharia de controlo moderno, como seja o controlo ptimo, controlo preditivo, controlo adaptativo, etc. assenta nessa representao dos processos. No entanto, chegar a esse tipo de representao a partir do trabalho de identificao/modelao efectuado, apenas mais um passo (Ltkepohl, 2007), ou seja, passar de uma representao com a estrutura (6.85) para uma representao do tipo (4.58)/(4.59) bvio. Nesta abordagem, contrariamente abordagem de funo de transferncia tm-se em conta no s as variveis de entrada mas tambm as chamadas variveis de estado que representam o que se passa no interior do sistema. Olhando para o sistema em estudo pode-se facilmente concluir que, por exemplo, uma temperatura no dever ser considerada uma varivel de entrada, mas antes uma varivel de estado que seria funo de uma ou mais variveis de entrada (um determinado fluxo de quantidade de calor e/ou energia, por exemplo). Nos sistemas de controlo baseados na representao de espao de estados o controlo ptimo feito atravs da realimentao das variveis de estado, pelo que a optimizao sempre feita um passo frente. Com isto pode-se concluir que, neste campo, a evoluo natural deste trabalho dever passar por uma abordagem mais profunda da representao deste processo em espao de estados e a aplicao de metodologias de controlo preditivo mais avanadas que simultaneamente permitam assegurar um melhor controlo da resposta transitria. Em relao ao segmento do controlo estatstico do processo, o desafio que se colocava era de que modo se conseguia implementar uma ou mais cartas de controlo de modo a que a informao retirada permitisse simultaneamente detectar alteraes do processo e dar a informao ao controlador sobre os parmetros a alterar. Entre as solues avaliadas, CUSUM ou EWMA, optou-se por uma testar uma carta EWMA com resultados preliminares que se consideram satisfatrios. Como o caso concreto de estudo um sistema MISO, e concluiu-se que no haveria necessidade de implementar cartas de controlo nas variveis de entrada devido ao facto delas estarem constrangidas pelo controlador, no houve a necessidade de abordar sistemas de controlo estatstico multivariado. Como toda a abordagem do tema foi feita para sistemas de entradas mltiplas e sadas mltiplas, a questo que seguidamente se colocaria para um sistema MIMO a seguinte: Para uma implementao multi-input / multi-output esquematizada pelo diagrama de blocos da Figura 8-13, qual o tipo de carta EWMA a utilizar? Na resposta dada argumentou-se que teriam que ser utilizadas cartas univariadas, tantas quantas as variveis de sada, mas as variveis a monitorizar deveriam estar no correlacionadas (ver ponto 6.1.1.2) para evitar que uma alterao detectada numa das variveis no induzisse um falso alarme noutra varivel que com ela estivesse correlacionada. Esta posio continua a ser mantida, uma vez que se necessita de saber o mais rapidamente possvel qual a varivel que sofreu a alterao. Existe no entanto outra questo que se coloca em termos de ARL, ou seja, como que detectada mais rapidamente uma situao de fora de controlo neste caso especifico, com cartas univariadas ou multivariadas?

9. Concluses, recomendaes e trabalho futuro

221

A ferramenta identificada para esclarecer estas dvidas passa pela simulao de uma srie de modelos e situaes o nmero necessrio de vezes de forma a produzir alguma inferncia estatstica que permita validar uma das hipteses formuladas. No campo do controlo estatstico (SPC), pretende-se ainda salientar que, tal como foi dito, apesar de se ter a sensao de que o tema no foi muito desenvolvido, foram desenvolvidas ferramentas que podero proporcionar a obteno de bons resultados nesta rea em trabalhos futuros tanto na vertente da integrao EPC/SPC como na vertente do controlo estatstico multivariado com dados correlacionados. Na primeira vertente defende-se a ideia de que a utilizao de modelos fiveis em processos de simulao pode ser uma ferramenta de grande potencialidade na determinao da estratgia de controlo estatstico a integrar e do tipo de cartas a utilizar. Na segunda vertente, como tambm j foi referido, quanto mais prximo os resduos do modelo estiverem de um processo rudo branco, mais eficaz ser o controlo estatstico aplicado a esses resduos e consequentemente ao processo (Figura 6-1). No campo da integrao do controlo estatstico com a engenharia de controlo, fizeram-se algumas abordagens, umas com mais hipteses de sucesso que outras. Do ponto de vista terico, a estratgia mais audaz de integrao do controlo estatstico com a engenharia de controlo, seria monitorizar os parmetros do modelo do processo atravs de um sistema de cartas Cuscore, para detectar alteraes do processo em relao ao modelo interno do controlador. Esta teoria est bem desenvolvida para os modelos ARMA univariados (Box & Luceo, 1997) embora no se detectassem situaes de aplicao real, talvez devido sua complexidade. Contudo, tentar extrapolar a ideia para sistemas multivariados dever tornarse ainda mais complexo devido grande quantidade de parmetros envolvidos. H no entanto uma abordagem que se pensou fazer, caso o processo de estudo fosse o modelo base (Figura 8-1). A ideia base passa pelo seguinte; quando se est a falar de controlo cujo perodo de amostragem da ordem das horas, trata-se de um controlo indexado superviso de processos. Com este perodo de amostragem faz todo o sentido utilizar o controlo estatstico para monitorizar variveis de entrada no manipulveis no sentido de detectar desvios em relao aos nveis esperados no sentido de ajustar as variveis manipulveis de modo a compensar esses desvios. Suponha-se que se tem um processo como o representado pelo diagrama de blocos da Figura 6-3 com duas variveis de entrada, uma que no manipulada e se supe com nvel constante , e outra que serve para controlar a sada do processo . Faz todo o sentido monitorizar a varivel , recorrendo ao controlo estatstico (uma carta CUSUM ou EWMA por exemplo) de forma a detectar alteraes nessa varivel e a ajustar a varivel no sentido de compensar essa alterao (Figura 9-1).

SPC

Controlador

Processo

Figura 9-1 Exemplo de aplicao de carta de controlo entrada do processo

222

9. Concluses, recomendaes e trabalho futuro

Para explanar melhor este ponto de vista, de certa forma especulativo, suponha-se que a Figura 9-2 representa a funo objectivo do controlador, que se pretende minimizar. Suponha-se que num determinado instante o nvel da matria-prima de 0.2, e que a varivel manipulvel se encontra no nvel 0.4, valor este determinado atravs de desenho de experincias, resposta em superfcie ou outra metodologia. Se for detectada uma alterao de, por exemplo de 0.6 no nvel da varivel da caracterstica da qualidade, faz todo o sentido alterar o nvel da varivel manipulada para zero no sentido de encontrar o ponto de funcionamento ptimo do processo, condicionado varivel de entrada . Poder sempre argumentar-se que essa caracterstica poderia ser permanentemente medida, que seria o comportamento ptimo, mas nos processos industriais, e no s, existe sempre a componente rentabilidade associada, pelo que poder ser mais econmico ter um controlo por amostragem que uma medio continua. Por outro lado, por vezes as medies so bastantes dispendiosas, ou mesmo necessrio recorrer destruio da amostra, pelo que tambm a a integrao do controlo estatstico com engenharia de controlo seria uma boa soluo.

Funo Objectivo 1 0.8

0.6

Caracteristica da matria prima

0.4

0.2

0 -0.2

-0.4

-0.6

-0.8

-1 -1

-0.8

-0.6

-0.4

-0.2 0 0.2 Varivel controladora

0.4

0.6

0.8

Figura 9-2 Exemplo de funo objectivo de um sistema de controlo com duas variveis de entrada

Quanto ao processo estudado, ficou a ideia geral de que as variveis utilizadas como variveis de controlo no eram as mais indicadas devido ao facto de tambm elas

9. Concluses, recomendaes e trabalho futuro

223

apresentarem alguma dinmica e de tambm elas dependerem de outras variveis que no foram provavelmente aqui tidas em conta. Relembrando a representao em espao de estados ( + ) = + () () = + () em que () o vector das variveis de controlo (entrada), o vector das variveis de estado e () o vector das variveis de sada, fica-se com a ideia de que faltam algumas variveis pertencentes ao vector (), e que algumas das variveis utilizadas como pertencentes ao vector () deveriam pertencer efectivamente ao vector (). Ainda em relao ao modelo obtido, pode-se concluir que grande parte da variabilidade no explicada poder dever-se ausncia no modelo desenvolvido de outras variveis que no foram tidas em conta e com as quais a varivel de sada estar fortemente correlacionada, como ser o caso das variveis referentes s caractersticas da matria-prima. H no entanto a salientar que, para os efeitos pretendidos, os dados (reais) disponibilizados serviram de forma satisfatria os objectivos. Na concluso sumria pode-se argumentar que, nos quatro grandes blocos que compem este tema, muita coisa ficou por abordar, mas o trabalho mais urgente a fazer nesta rea, validar o que est feito atravs duma implementao prtica em ambiente industrial. A integrao de lgica fuzzy nos sistemas de controlo e redes neuronais nos processo de identificao e/ou controlo so duas reas que devem merecer alguma ateno em trabalhos futuros.

Referncias

225

Referencias
Akaike, H. (1974). A new look at the statistical model identification. IEEE Trans. Automatic Control , AC-19, 716-723. Alwan, L. C. (1988). Time-series modeling for statistical process control. Journal of Business and Economic Statistics , 6, 87-95. Atienza, O. O. (1998). A SPC procedure for detecting level shifts of autocorrelated processes. Journal of Quality Technology , 30, 340-351. Bartlett, M. S. (1946). On the theoretical specification and sampling properties of the autocorrelated time-series. Journal of the Royal Statistics Society , Ser. B, 8, 27-41. Botto, M. A. (2007). Controlo de Sistemas. Suplemento da Sebenta de Controlo de Sistemas . IST - Lisboa. Botto, M. A. (Setembro de 2007). Controlo ptimo. Sebenta de Controlo ptimo . IST Lisboa. Botto, M. A. (2007). Suplemento de Sebenta de Controlo de Sistemas. IST - Lisboa. Box, G. E. (1992). Statistical process monitoring and feedback adjustment-a discussion. Technometrics , 34, 251-267. Box, G. E., & Draper, N. R. (2007). Response Surfaces, Mixtures, and Ridge Analyses. JOHN WILEY & SONS, INC. Box, G. E., & Jenkins, G. M. (1970). Time Series Analysis: Forecasting and Control. Oakland, Calif.: Holden-Day. Box, G. E., Jenkins, G. M., & Reinsel, G. C. (2008). Time Series Analysis: Forcasting snd Control, 4th ed. Hoboken, New Jersey: John Wiley & Sons, Inc. Box, G., & Luceo, A. (1997). Statistical Control By Monitoring and Feedback Adjustment. JOHN WILEY & SONS, INC. Capilla, C., Ferrer, A., Romero, R., & Hualda, A. (1999). Integration of statistical and engineering process control in a continuous polymerization process. Technometrics , 41, 1428. Chang, Z., Hao, D., & Baras, J. S. (2000). http://hdl.handle.net/1903/6136 . Obtido em 10 de Janeiro de 2009, de Institute for Systems Research Technical Reports: http://hdl.handle.net/1903/6136 Chen, A. a. (2002). Design and performance evaluation analysis of the exponentially weighted moving average mean estimates for process subject to random step changes. Technometrics , 44, 379-389.

226

Referncias

Chen, L., & Goldfarb, D. (August de 2006). Interior-point l2-penalty methods for nonlinearprogramming with global convergence properties. MAthetmatical Programming , pp. Vol. 108, 1-36. del Castillo, E. (1996). A multivariate self-tuning controller for run-to-run process control under dhift and trend sisturbances. IIE TRANSACTIONS , vol. 28, no 12, 1011-1021. Del Castillo, E. (1998). An adaptative run-to-run optimizing controller for linear and nonlinear semicndutor processes. IEEE TRANSACTIONS ON SEMICONDUTOR MANUFACTORING , pp. 285-295. Del Castillo, E. (2002). Statistical Process Adjustment for Quality Control. New York: John Wiley & Sons, Inc. Del Castillo, E., & Yeh, J.-Y. (1998). An adaptive run-to-run optimizing controller for linear and nonlinear semiconductor processes. IEEE Transactions on Semiconductor Manufacturing , Vol. 11, No. 2,pp. 285-295. Grubb, F. E. (1954/1983). An optimal procedure for setting machines or adgusting processes. Journal of Quality Technology , 1983, 15(4): 186-189. Hannan, E. J., & Rissanen, J. (1982). Recursive estimation of mixed autoregressive moving average order. Biometrika , 69, 81-94. Correction, 70, 303, 1983. Isermann, R. (1989). Digital Control Systems; Volume I; Fundamentals, Deterministic Control. Springer-Verlag. Jen, C. H., Jiang, B. C., & Fan, S.-K. S. (2004). General run-to-run (R2R) control framwork using self-tunning control for multiple-input multi-output (MIMO) process. International Journal of Production Research , 4249-4270. Krishna B. Misra. (2008). Handbook of Performability Engineering . Springer. Lowry, C. A., Woodall, W. H., Champ, C. W., & Rigdon, S. E. (1992). A Multivariate Exponentialy Weighted Moving Average Control Chart. Technometrics , Vol. 34, no 1, 46-53. Luceo, A., Gonzalez, F. J., & Puig-Pey, J. (1996). Computing optimal adjustment schemes for the general tool wear problem. Journal of Statistical Computation and Simulation , 54, 87113. Ltkepohl, H. (2007). New Introduction to Multiple Time Series Analysis. Berlin Heidelberg: Springer. MacGregor, J. F. (1990). Discussion of `EWMA control schemes : properties and enhancement' by Lucas and Saccucci . Technometrics , 32, 23-26. MacGregor, J. F. (1987). Interface between process control and on-line statistical process control. American Institute of Chemical Engineers, Cast Newsletter , 9-19. Maciejowski, J. M. (2002). Predictive Control With Constraints. Essex, England: Pearson Education Limited.

Referncias

227

Matos, A. S. (2006). Engenharia de Controlo do Processo e Controlo Estatstico da Qualidade: Metodologia de Integrao Aplicada na Indstria da Pasta de Papel. Tese de Doutoramento . FCT/UNL DEMI, Monte de Caparica. Montgomery, D. C. (1994). Integrating statistical process control and engineering process control. Journal of Quality Technology , 26, 79-87. Montgomery, D. C. (2001). Introduction to Satistical Quality Control. John Wiley & Sons, Inc. Moyne, J., del Castillo, E., & Hurwitz, A. M. (2001). Run-to-Run Control in Semicondutor Nanufacturing. CRC press. Muth, J. F. (1960). Optimal Properties of Expontially Weighted Forecasts of Time Series With Permanent and Transitory Components . Journal of the American Statistical Association , 55, 299-306. Ogata, K. (1970). Engenharia de Controle Moderno. Brasil: Prentice-Hall. Ogata, K. (1997). Modern Control Engineering. PRENTICE HALL. Pan, R., & Del Castillo, H. (2003). E. Scheduling methods for statistical setup asjustment problems. Intenational Journal of Production Research , (41): 1467-1481. Reinsel, G. C. (1997). Elements of Multivariate Time Series Analysis. New York: SpringerVerlag. Schwarz, G. (1978). Estimating the dimension of a model. Ann. Statist. , 6, 461-464. Shu, L., Apley, D. W., & Tsung, F. (2002). Autocorrelated Process Monitoring Using Triggered Cuscore Charts. Quality AND Reliablity Engeneering Interantional , pp. 18, 411 421. Sulo, P., & Vandevan, M. (1999). Optimal adjustment strategies for a process with run to run variation and 0-1 quality loss. IIE Trans. , 31:1135-1145. Taguchi, G. (1987). Systems of Experimental Design, Vol. 2. Unipub, Kraus International Publications, White Plains, NY. Teukolsky, S. A., Vetterling, W. T., & Flannery, B. P. (2007). Numerical Recipes: The Art of Scientific Computing. Cambrige, England. Vander Weil, S. (1996). Monitoring processes that wander using integrated moving average models. Technometrics , 38, 139-151. Vander Weil, S. T. (1992). Algorithmic statistical process control: concepts and an application. Technometrics , 34, 286-297. Vanli, O. A., & Del Castillo, E. (NOVEMBER de 2007). Closed-Loop System Identification for Small Samples With Constraints. TECHNOMETRICS , VOL. 49, NO. 4, 382-394. Wardell, D. G. (1994). Run-length distributions of special-cause control charts for correlated processes. Technometrics , 36, 3-17.

ANEXOS

229

ANEXOS

Potrebbero piacerti anche