Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Orientadores:
Doutor Jos Augusto da Silva Sobral
Doutora Alda Cristina Jesus Nunes de Carvalho
Jri:
Presidente: Prof. Doutora Maria Teresa Moura e Silva
Vogais:
Prof. Doutora Iola Maria Silvrio Pinto
Prof. Doutor Jos Antnio Rocha Almeida Soares
Prof. Doutor Jos Augusto da Silva Sobral
Prof. Doutora Alda Cristina Jesus N. de Carvalho
Setembro de 2013
Winston Churchill
Agradecimentos
Quero agradecer ao meu pai, a pessoa mais brilhante e ao mesmo tempo mais simples e modesta
que conheo. Foste a inspirao e motivao por detrs de cada palavra que escrevi.
Quero agradecer minha me e ao meu irmo por sempre terem estado presentes quando
necessitei.
Quero agradecer aos meus orientadores, Professora Alda que me apoiou neste desafio e a
projecta-lo para outros mbitos. De igual forma, quero agradecer ao Professor Sobral pela sua
ajuda a elaborar este documento.
Quero ainda agradecer ao meu colega Carlos Antunes pela sua preciosa ajuda a introduzir Visual
Basic na aplicao de Excel.
Apenas tu sabes o quanto custa conciliar a vida laboral com a vida acadmica e por isso quero
agradecer-te especialmente a ti, Susana, pelo apoio dirio incondicional, pelo conforto fsico e
psicolgico que nunca deixaste que me faltasse.
Finalmente, quero agradecer-te a ti, Vicente, por seres o meu beb de Ouro e por teres tido a
capacidade de perceber a ausncia do pai.
Todos temos momentos brilhantes e a maioria deles so graas ao estmulo de outra pessoa.
George Adams
II
Resumo
O presente trabalho visa mostrar a importncia das anlises estatsticas para a realizao de estudos
de fiabilidade. Nesse sentido foram descritos os princpios em que esses estudos se baseiam,
apresentadas definies e conceitos relacionados com a fiabilidade, assim como algumas
especificidades desta matria.
Posteriormente foram apresentadas as principais distribuies estatsticas frequentemente usadas em
estudos de fiabilidade, sendo descritos alguns mtodos para estimao dos seus parmetros e alguns
testes para indicar qual a distribuio que melhor se ajusta a um conjunto de elementos, neste caso
representativos dos tempos at falha de um determinado bem..
Existem diversos programas informticos, comercializados e utilizados em estudos de fiabilidade,
que incluem as potencialidades enumeradas nos pargrafos anteriores. O trabalho agora
desenvolvido tem por objectivo mostrar toda a teoria que se encontra por trs dos algoritmos usados
nos programas informticos. Como complemento, foi desenvolvida em Microsoft Excel uma
aplicao que automatiza os testes de ajuste a partir de dados amostrais, baseando-se nos modelos
tericos enunciados. Esta aplicao pode ser considerada uma mais valia do presente trabalho,
funcionando como um interface de ajuda aos utilizadores aquando de estudos de fiabilidade
baseados em anlises estatsticas.
Palavras-chave
III
Abstract
This document aims to show the relevance of statistical analysis in reliability studies. The principles
on which these studies are based were looked into, definitions and concepts related to reliability, as
well as some specifics of this matter were presented.
Subsequently were presented the main statistical distributions commonly used in reliability studies,
and described some methods for parameter estimation and some tests to indicate which distribution
best fits a set of elements, in this case representing the time to failure of a particular good.
There are several computer programs marketed and used in reliability studies, which include the
potential listed in the previous paragraphs. The work now developed is intended to show all the
theory that lies behind the algorithms used in these computer programs. As a supplement, an
application in Microsoft Excel was developed that automates the goodness of fit tests from sample
data, based on the theoretical models listed. This application can be considered an asset of this
work, functioning as an interface to help users during reliability studies based on statistical analysis.
Keywords
IV
ndice
ndice
Agradecimentos ......................................................................................................................... II
Resumo ..................................................................................................................................... III
Palavras-chave .......................................................................................................................... III
Abstract .....................................................................................................................................IV
Keywords ..................................................................................................................................IV
ndice ......................................................................................................................................... V
ndice de Tabelas ......................................................................................................................VI
ndice de Figuras .................................................................................................................... VII
Glossrio ................................................................................................................................ VIII
1 - Introduo.............................................................................................................................. 1
2 Fiabilidade ............................................................................................................................ 3
3 Distribuies Estatsticas em Fiabilidade ........................................................................... 14
3.1 - Distribuio Normal ..................................................................................................... 16
3.2 - Distribuio Lognormal................................................................................................ 21
3.3 - Distribuio Exponencial ............................................................................................. 24
3.4 - Distribuio de Weibull ................................................................................................ 26
4 Caracterizao da distribuio ............................................................................................ 31
4.1 - Mtodo dos mnimos quadrados ................................................................................... 33
4.2 - Mtodo dos momentos ................................................................................................. 39
4.3 - Mtodo da mxima verosimilhana .............................................................................. 43
5 Seleco da distribuio ..................................................................................................... 48
5.1 - Testes de ajuste Qui-Quadrado ..................................................................................... 55
5.2 - Teste de Ajuste Kolmogorov-Smirnov ......................................................................... 58
5.3 - Teste de ajuste Anderson-Darling e Cramer-Von Mises .............................................. 61
5.4 - Ordenao ..................................................................................................................... 66
6 Concluses e trabalhos futuros ........................................................................................... 72
Referncias ............................................................................................................................... 74
Definies ................................................................................................................................. 76
Apndice ................................................................................................................................... 78
ndice de Tabelas
Tabela 1 - Amostra de dados do exemplo 1 [2] ...................................................................................... 7
Tabela 2 - Amostra de dados do exemplo 2 [2]. ................................................................................... 31
Tabela 3 - Amostra de dados do exemplo 2 ordenada e numerada. ...................................................... 32
Tabela 4 - Ranks Medianos [2][14]....................................................................................................... 35
Tabela 5 - Estimadores do mtodo dos mnimos quadrados [2][14]. .................................................... 38
Tabela 6 - Estimadores do mtodo dos momentos [2] [14]................................................................... 42
Tabela 7 - Estimadores do mtodo da mxima verosimilhana [2] [14]. .............................................. 46
Tabela 8 Frequncia observada, Intervalo considerado e agrupamento de classes do exemplo 2. .... 53
Tabela 9 - Expresso da frequncia esperada para cada distribuio[2]. .............................................. 54
Tabela 10 - Frequncia esperada, Intervalo considerado e agrupamento de classes para o exemplo 2. 54
Tabela 11 Constantes crticas Qui Quadrado [2]................................................................................ 56
Tabela 12 - Constantes crticas de Anderson-Darling e Cramer-Von Mises [2]. .................................. 63
Tabela 13 - Tabela de decises baseada no mtodo de Neyman-Pearson. ............................................ 66
Tabela 14 - Tabela de decises baseada no mtodo de Neyman-Pearson e no p-value. ....................... 67
Tabela 15 Amostra de dados do exemplo 3 [2] .................................................................................. 67
Tabela 16 - Tabela de deciso baseada no p-value para o exemplo 3 ................................................... 68
VI
ndice de Figuras
Figura 1 - Exemplo de uma curva da banheira. ....................................................................................... 5
Figura 2 - Histograma do exemplo 1 ....................................................................................................... 8
Figura 3 - Output do Geogebra da amostra do exemplo 1 ...................................................................... 8
Figura 4 - Boxplot dos dados da amostra do exemplo 1 ......................................................................... 9
Figura 5 Fdp de uma distribuio exponencial. ................................................................................. 10
Figura 6 - fda da distribuio exponencial anterior. .............................................................................. 11
Figura 7 Curva da fiabilidade do modelo anterior. ............................................................................ 12
Figura 8 - Obteno da fiabilidade de um bem. .................................................................................... 13
Figura 9 - Distribuio normal com
variando . ........................................................................ 17
Figura 10 Fiabilidade provinda da distribuio normal com
variando ................................. 17
Figura 11 - Distribuio normal com
variando .................................................................... 18
Figura 12 - Fiabilidade provinda da distribuio normal com
variando .............................. 18
Figura 13 - Distribuio normal padronizada........................................................................................ 19
Figura 14 - Distribuio lognormal com
variando . ................................................................ 22
Figura 15 - Fiabilidade provinda da distribuio lognormal com
variando ........................... 22
Figura 16 - Distribuio lognormal com
variando . ................................................................. 23
Figura 17 - Fiabilidade provinda da distribuio lognormal com
variando .......................... 23
Figura 18 - Distribuio exponencial variando . ................................................................................. 25
Figura 19 - Fiabilidade provinda da distribuio exponencial variando ............................................ 25
Figura 20 - Distribuio de Weibull de trs parmetros com
variando ....................... 27
Figura 21 - Fiabilidade provinda da distribuio de Weibull com
variando . .............. 27
Figura 22 - Distribuio de Weibull de trs parmetros com
variando . .................... 28
Figura 23 - Fiabilidade provinda da distribuio de Weibull com
variando . ............ 28
Figura 24 - Distribuio de Weibull de trs parmetros com
variando . ................... 29
Figura 25 - Fiabilidade provinda da distribuio de Weibull com
variando . ........... 29
Figura 26 - Regresso linear em y. ........................................................................................................ 33
Figura 27 - Curva normal com parmetros estimados pelo mmq do exemplo 2. .................................. 37
Figura 28 - Curva normal com parmetros estimados pelo mtodo dos momentos do exemplo 2. ...... 41
Figura 29 - Curva normal com parmetros estimados pelo mmv. ........................................................ 45
Figura 30 - Histograma de dados agrupados ......................................................................................... 48
Figura 31 Exemplo de uma boa adequao da funo aos dados....................................................... 49
Figura 32 Exemplo de uma m adequao da funo aos dados. ...................................................... 49
Figura 33 - Histograma comparativo das frequncias estudadas. ......................................................... 54
Figura 34 - Teste de Qui Quadrado na aplicao de Excel ................................................................... 57
Figura 35 - Distncias de KS para o exemplo 2. ................................................................................... 59
Figura 36 - Teste de Kolmogorov Smirnov na aplicao de Excel ....................................................... 60
Figura 37 - Testes de Anderson-Darling e Cramer Von-Mises na aplicao de Excel ......................... 64
Figura 38 - Folha de entrada da aplicao de Excel .............................................................................. 65
Figura 39 - Resultados da aplicao de Excel para o exemplo 3 .......................................................... 68
Figura 40 Adequao da distribuio aos dados do exemplo 3.......................................................... 69
Figura 41 - Fda de falha do exemplo 3.................................................................................................. 69
Figura 42 - Curva da fiabilidade representativa da amostra do exemplo 3 ........................................... 70
Figura 43 - Interpretao da fiabilidade do exemplo anterior. .............................................................. 70
Figura 44 - Workflow da dissertao ..................................................................................................... 72
VII
Glossrio
IX
1 - Introduo
O presente trabalho visa abordar o tema da fiabilidade, mostrando a importncia das anlises
estatsticas para o alcanar dos objectivos delineados nesses estudos.
Atravs de exemplos, ser ilustrado o caminho a percorrer para estimar a fiabilidade de um bem.
Comear-se- por contextualizar a fiabilidade e aflorar a sua evoluo. Tendo em conta que a
fiabilidade de um bem uma probabilidade a um dado instante e esta probabilidade varia consoante
o tempo de utilizao, esta ser caracterizada por uma funo. Para chegar a esta funo h que
perceber qual a distribuio estatstica subjacente aos elementos disponveis (dados de tempo at
falha). Com base na sua funo densidade de probabilidade e na sua integrao matemtica ser
possvel chegar funo fiabilidade desejada. Para tal, sero apresentadas numa primeira fase as
distribuies e as expresses matemticas que as caracterizam. Numa segunda fase prope-se
validar quais as distribuies estatsticas viveis para descrever o comportamento desejvel atravs
de testes de ajuste. Posteriormente ser determinado qual delas melhor descreve o modelo
requerido. Finalmente, escolhida a distribuio estatstica, obter-se- a fiabilidade propriamente dita
do bem.
No segundo captulo desta tese ser apresentado o conceito de fiabilidade, comeando por fornecer
a sua definio e explicando o seu objectivo.
No terceiro captulo, sero abordadas as distribuies estatsticas mais utilizadas em anlise de
fiabilidade que segundo Edimu et al. [1] so as seguintes: distribuio normal, lognormal,
exponencial, e Weibull. As distribuies sero brevemente introduzidas com nfase nos seus
parmetros (neste documento, a palavra parmetros vai se referir s constantes presentes nas
equaes das distribuies estatsticas) e na forma que podem assumir graficamente.
A estimao de parmetros das distribuies vai ser alvo de anlise no quarto captulo com alguns
dos mtodos mais utilizados. Vo ser abordados os mtodos sugeridos por Kececioglu, Dimitri [2],
ou seja, o mtodo dos mnimos quadrados, o mtodo dos momentos e finalmente o mtodo da
mxima verosimilhana.
No quinto captulo, vo ser apresentados os testes de ajuste que vo constar na aplicao de Excel.
Vo ser abordados os testes de ajuste Qui Quadrado, de Kolmogorov-Smirnov, de AndersonDarling e de Cramer-Von Mises que segundo Abd-El Fattah, A. M. (2010) [3] so os mais
relevantes. Estes dois ltimos sero analisados em paralelo visto apresentarem semelhanas. Ainda
no quinto captulo ir ser analisada a forma de ordenar as distribuies para que seja possvel
distinguir (das que no foram rejeitadas nos testes de ajuste) a que melhor nos servir.
Acompanhando a abordagem terica, vai ser estudado um caso com a ajuda da aplicao de Excel,
demonstrando o seu funcionamento.
2 Fiabilidade
Desde sempre existiu a necessidade de tentar adivinhar o futuro, quer fosse atravs dos ventos, dos
pssaros ou movimento das rvores. Esta necessidade prendeu-se sempre com a vontade de tentar
antecipar acontecimentos, quase sempre conotados negativamente, para que se pudesse evitar as
suas consequncias.
Assim, nesse sentido foram desenvolvidas ao longo do tempo vrias metodologias e ferramentas,
tentando-se diminuir a incerteza associada a cada processo ou estudo efectuado.
Normalmente a grande dificuldade no campo da engenharia da fiabilidade partir de um conjunto
de tempos at falha de um dado bem ou conjunto de bens semelhantes, recolhidos em ambiente
laboratorial ou industrial e, com base nesses elementos, saber qual o comportamento desse bem (ou
conjunto de bens semelhantes) ao longo do tempo, nomeadamente a sua probabilidade de falha ou
de sucesso.
Esta probabilidade de sucesso que normalmente se designa por Fiabilidade, sendo complementar
da probabilidade de falha (acumulada).
A definio que mais se encontra na literatura dedicada a este tema e que Davis [4] da Ford Motor
Company subscreve : A fiabilidade a probabilidade de um sistema se encontrar no seu correto
funcionamento num determinado perodo temporal sob conhecidas condies de operao. Talvez
se possa complementar esta definio referida por Davis substituindo sistema por bem ou, de
acordo com recentes desenvolvimentos nesta matria, por activo fsico. Segundo a Norma NP EN
13306:2007 entende-se por fiabilidade a aptido de um bem para cumprir uma funo requerida
sob determinadas condies, durante um dado intervalo de tempo. Mais concretamente, em
Engenharia, a fiabilidade define-se por uma probabilidade (de sucesso).
Fazendo uma analogia ao ser humano, de senso comum que a partir de determinada idade
necessrio que sejam realizados certos exames mdicos e anlises clinicas a fim de verificar qual o
presente estado de sade do mesmo e assim tentar antecipar alguns acontecimentos indesejveis.
Esta preveno no feita ao acaso, determinou-se em tempos que a probabilidade de determinada
doena se manifestar a partir daquela idade era superior a um valor crtico e da ento ser
aconselhado um rastreio.
3
O conceito de fiabilidade data dos anos 1800 onde apareceu pela primeira vez. A revoluo social,
cultural e tecnolgica que ocorreu impulsionou a necessidade da existncia de uma estrutura
racional e de um tratamento quantitativo da fiabilidade de bens, culminando com a criao de
engenharia de fiabilidade como disciplina cientfica [5].
Os estudos relativos fiabilidade de bens tm vindo a tornar-se ao longo dos ltimos anos uma rea
bastante importante e aliciante no ambiente industrial pois permite que as organizaes comecem a
possuir um conhecimento mais profundo acerca da probabilidade de falha dos seus activos fsicos
que representam o conjunto de bens que formam o seu patrimnio. O termo avaria est definido
pela Norma NP EN 13306:2007 como: avaria a manifestao da inaptido de um dado item
realizar um determinado padro de desempenho previamente especificado. Para as empresas, o
conhecimento desta probabilidade poder suportar tomadas de deciso visando obter redues de
custos e aumento da disponibilidade de bens. Devido a este facto, em grande parte da indstria
comum a existncia de um Departamento de Manuteno cuja base para a tomada de decises
assenta em estudos e anlises de fiabilidade.
Idhammar [6] aponta os principais entraves da manuteno nas empresas e neste mbito, verifica
que o grande valor de uma empresa atribudo aos lucros directos, sendo ignorado o que se poderia
ter lucrado caso tivesse sido implementado um sistema de manuteno adequado. Para tal,
necessrio que o responsvel da manuteno apresente um conjunto de argumentos fortes gesto
de topo, convencendo estes elementos da reduo de custos que da advir. A correta quantificao
dos custos em grande parte conseguida atravs de estudos de fiabilidade dos bens, tendo
repercusses em termos da quantidade de falhas, custos, diminuio do risco, aumento da
disponibilidade dos equipamentos, etc. Grande parte destas anlises de fiabilidade tem como base
de partida os tempos at avaria registados no passado, aplicando aos mesmos mtodos de anlise
estatstica para conhecer o comportamento presente e futuro dos respectivos bens.
Isto leva ao maior constrangimento que a anlise de fiabilidade enfrenta, ou seja, a inexistncia de
dados fidedignos relativos s falhas ocorridas (tambm chamado de histrico) sendo que tambm se
verifica que existe uma deficiente aplicao de ajuste aos dados a distribuies estatsticas, assim
como uma deficiente determinao dos seus parmetros.
Quando se realizam anlises de fiabilidades aos bens em servio pretende-se prever quando um
determinado modo de falha poder ocorrer. Pretende-se saber qual a probabilidade de sucesso
(fiabilidade) ou de falha associada a uma determinada idade ou tempo de funcionamento. A maior
parte dos componentes reparveis (bem) ou sistemas (vrios bens formando um conjunto para o
desempenho de uma funo) seguem a Curva da Banheira. O comportamento desta curva o
seguinte; numa primeira fase, a taxa de avaria (que exprime o nmero de avarias por unidade de
tempo) elevada no incio de vida dos componentes ou sistemas (mortalidade infantil) devido
maioritariamente a defeitos de fabrico, montagem deficiente, etc. Esta curva decresce e estabiliza
logo de seguida no perodo de utilizao normal (vida til) e volta a aumentar no seu fim de vida
(desgaste ou envelhecimento) devido aos efeitos da idade e tempo de funcionamento.
A curva da banheira pode ser apresentada em diversos formatos, tendo em conta o tipo de bens em
estudo. A Figura 1 mostra a curva da banheira tpica, onde as trs fases anteriormente referidas se
encontram representadas. Segundo Edimu et al. [1] podem ser analisadas distribuies estatsticas
para modelar cada uma destas fases.
Na vasta bibliografia existente sobre a matria comum encontrar algumas variantes curva da
banheira tradicional mostrada na Figura 1, sendo normalmente efectuada uma tipificao de acordo
com o bem em estudo (electrnico, mecnico, etc). Naturalmente que essa tipificao baseada
em estudos e testes efectuados, devidamente provados e validados.
O incio deste estudo passa obrigatoriamente pela recolha de dados. necessrio extrair de uma
populao
estes testes. Dever levar toda a sua amostra at falha e registar o tempo que os rolamentos
levaram at sua avaria
[2].
de uma
Apresenta-se de seguida um exemplo retirado da bibliografia de Kececioglu [2] que tem como
objectivo mostrar todo o percurso necessrio para chegar fiabilidade de um bem, a partir de um
conjunto de dados.
A varivel aleatria em anlise
determinado bem.
Neste exemplo foram recolhidas
Identificao
da falha
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
Tempo at
falha
(horas)
1,2
1,5
2,8
4,9
6,8
7
12,1
13,7
15,1
15,2
23,9
24,3
25,1
35,8
38,9
47,9
48,9
49,3
53,2
55,6
62,7
72,4
73,6
76,8
83,8
95,1
97,9
99,6
102,8
108,5
128,7
133,6
144,1
147,6
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
Tempo at
falha
(horas)
150,6
151,6
152,6
164,2
166,8
178,6
185,21
187,1
203
204,3
229,5
233,1
254,1
291,7
304,4
Perante um conjunto de observaes , um primeiro passo consiste em fazer uma anlise preliminar
dos dados. Usualmente, este tipo de estudo apoiado fortemente por uma componente
computacional, que vai desde as representaes grficas ao clculo de medidas descritivas. Uma
vez que se pretende chegar expresso da fiabilidade, e esta determinada a partir de um modelo
de probabilidade, grficos como histogramas ou caule e folhas mostram como a distribuio dos
dados amostrais. O histograma no representa os valores
que eles constam no intervalo representado (frequncia acumulada). Cada barra do histograma
representa a frequncia acumulada dividida pelo tamanho da amostra
(frequncia relativa).
O resumo das estatsticas amostrais tambm importante quando se faz uma anlise preliminar de
dados. Atravs das medidas de localizao como a mdia e quartis, possvel ter uma ideia sobre a
distribuio dos dados; atravs de medidas de disperso como o desvio padro ou amplitude
interquartil. Usualmente este output est disponvel na maioria dos programas informticos do tema.
Uma vez calculados os extremos e quartis de uma amostra, possvel representar graficamente a
amostra no diagrama de extremos e quartis ou boxplot. Atravs do boxplot, possvel identificar e
classificar outliers (valores que se destacam da tendncia da amostra). Esta identificao
extremamente importante pois muitas vezes trata-se de erros e a sua permanncia na amostra pode
levar rejeio de um modelo de probabilidade adequado.
Aps a anlise dos grficos, pode ver-se h uma tendncia de decaimento na frequncia medida
que o tempo de funcionamento aumenta, sugerindo uma distribuio exponencial. Este modelo ser
apresentado de forma mais detalhada no captulo 3, neste momento servir como exemplo para a
obteno da fiabilidade de um bem.
Apresenta-se ento a expresso da fdp da distribuio exponencial:
(2.1)
Verifica-se na Figura 5 a representao grfica da funo distribuio de probabilidade de falha de
uma distribuio exponencial:
(2.2)
10
Atravs desta funo distribuio acumulada possvel prever a falha de um determinado activo
fsico ou sistema, ou seja, j existe informao para quantificar a probabilidade de falha num
determinado instante temporal.
Usualmente, este no o resultado requerido, ou seja, mais interessante saber a fiabilidade ou a
probabilidade de sucesso a um dado instante portanto, tendo em conta que estas duas funes so
complementares, pode-se aplicar a relao seguinte:
(2.3)
Ou ainda para a distribuio exponencial,
(2.4)
11
Com uma leitura directa da Figura 7 obtm-se a fiabilidade de um bem num determinado instante.
Para o efeito, basta escolher o tempo pretendido no eixo das abcissas, verificar o ponto
correspondente da curva da fiabilidade e determinar qual a sua ordenada.
Este processo encontra-se exemplificado na Figura 8; escolhido o valor temporal em A, e atravs
da interseco com a curva representativa da evoluo da fiabilidade em B, obtm-se o valor de
fiabilidade em C.
12
Foi referido todo o necessrio para chegar fiabilidade comeando pela distribuio estatstica. As
operaes matemticas so relativamente simples pelo que se verifica que o mais complexo a
escolha da distribuio per si, ou seja, verificar qual das distribuies escolhidas ir conduzir a uma
curva de fiabilidade mais fidedigna em relao ao comportamento real dos dados recolhidos e
consequentemente, da populao.
Uma vez que se pretende modelar o tempo at falha, importante conhecer as distribuies de
probabilidade mais usuais em fiabilidade pelo que sero abordadas no seguinte captulo.
13
As distribuies que iro ser alvo de anlise tm capacidades diferentes de representar um modelo,
diferindo nas suas medidas de disperso, localizao e forma. Quanto s medidas de localizao,
salienta-se a mdia (aritmtica) do tempo at falha obtida pela expresso:
(3.1)
Quanto s medidas de disperso, so normalmente representadas pelo desvio padro que fornece a
informao de quanto uma amostra est concentrada em relao mdia. Um desvio padro
diminuto transparece que os dados esto concentrados em torno da mdia e por consequente, um
desvio padro elevado refere que a amostra est dispersa relativamente a esta. Ainda relativamente
ao desvio padro, relevante referir que existe o desvio padro
(3.2)
(3.3)
A diferena de utilizao destes dois desvios padro apresentados consiste no seguinte; o desvio
padro tout court normalmente utilizado em conjuntos de dados com elevada ocorrncia e o
desvio padro corrigido deve ser utilizado quando no esto disponveis volumes elevados de
dados.
14
ainda importante referir que em estatstica, comum utilizar maisculas para a populao e
minsculas para a amostra. O desvio padro populacional
amostra atravs do estimador
(3.4)
conta que o tema desta tese precisamente a fiabilidade, ser esta nomenclatura que ir ser
adoptada. Concluindo, a expresso que ser assumida para o desvio padro corrigido (estimador) da
amostra :
(3.5)
Com o mesmo valor de mdia e desvio padro, podem obter-se distribuies completamente
distintas. Isto deve-se ao facto de existirem parmetros de forma. Existem mais medidas,
nomeadamente medidas de escala e iro ser referidas mais frente no seu devido contexto.
Vo ser apresentadas de seguida as distribuies estatsticas mais frequentemente usadas em
fiabilidade, nomeadamente a distribuio normal, lognormal, exponencial, e Weibull. Ir ser
introduzido para cada um destes modelos a influncia das medidas supra referidas, apresentar-se- a
respectiva expresso correspondente funo densidade de probabilidade, a sua representao
grfica, a fiabilidade associada e algumas outras caractersticas.
15
(3.6)
Dada a sua natureza, esta distribuio caracterstica de bens que avariam em torno de um valor,
sendo a sua disperso simtrica em relao ao mesmo. Este o caso, por exemplo, de lmpadas cuja
durao normalmente conhecida, podendo falhar algumas horas antes ou depois. Pode se ler no
site oficial da Comisso Europeia o seguinte texto:
O tempo de vida de uma lmpada corresponde ao perodo durante o qual a mesma funciona
correctamente e expresso em horas. Considera-se que, em mdia, uma lmpada utilizada 1000
horas por ano, ou seja, 3 horas por dia. Uma lmpada pode durar entre 1000 horas, no caso das
lmpadas incandescentes tradicionais, a 15 000 horas, no caso das melhores lmpadas
fluorescentes compactas e das lmpadas LED. () Uma lmpada que dura mais tambm uma
lmpada que tem de ser substituda menos vezes, um aspecto a ter em conta quando se compara o
preo das vrias alternativas. [9]
O valor de 1000 e 15000 horas provm de estimativas cuja distribuio possivelmente a
distribuio normal. fundamental a noo de compara o preo das vrias alternativas pois
como se referiu anteriormente, o que se pretende com fiabilidade precisamente a reduo de
custos.
Os dois parmetros que caracterizam a distribuio normal so a mdia e o desvio padro. Pode-se
observar nas Figuras 9 e 11 a influncia dos parmetros na funo densidade de probabilidade;
16
quanto menor for o desvio padro, ou seja, quanto menor for a variao entre os valores medidos,
mais estreita e elevada se torna a curva.
variando .
variando
17
Verifica-se que a variao do desvio padro resulta numa variao mais ou menos abrupta da
fiabilidade do bem estudado. Isto quer dizer que vai existir maior concentrao de ocorrncias de
avarias em torno da mdia. Um bem caracterizado por um desvio padro mais reduzido vai
significar que os custos de substituio de componentes avariados iro estar concentrados num
espao temporal mais curto. Observe-se agora o efeito da variao da mdia:
variando .
A distribuio mantm uma forma idntica mas desloca-se no sentido positivo das abcissas com o
aumento da mdia. Observe-se agora a variao de fiabilidade associada:
variando
18
A curva da fiabilidade tambm mantm a sua forma, sofrendo uma deslocao no sentido do eixo
das abcissas. Em termos fiabilsticos, significa que os tempos de avarias vo ocorrer mais tarde
(com o aumento da mdia) no seu intervalo temporal. Pode afirmar-se ento que em termos
fiabilsticos, desejvel obter uma mdia mais elevada.
obtida por esta mudana de varivel chama-se de distribuio normal padronizada ou reduzida.
(3.7)
Como a curva normal representa a probabilidade de um evento, a sua rea total igual a 1. A
probabilidade de um determinado evento ocorrer a rea esquerda desse valor na distribuio
normal. Concretizando no exemplo da Figura 13, a probabilidade do valor 1 ocorrer igual rea
19
Cruza-se a primeira coluna da tabela do apndice A, com a segunda coluna (que diz respeito
primeira casa decimal de
probabilidade de
ocorrer de
, ou melhor:
20
A distribuio lognormal aparece na literatura tendo sido considerada inicialmente em 1879 por
Francis Galton. Apenas em 1930 foi considerada por Gibrat como sendo um pilar para a
aleatoriedade [10]. A distribuio lognormal graficamente representada por uma curva em forma
de lomba. Sendo assimtrica, a distribuio lognormal no se adequa bem a bens que avariam em
torno de um valor (ao contrrio da distribuio normal). As caractersticas desta curva auferem-lhe
boas capacidades de modelar bens cuja taxa de avarias vai aumentando sempre ao longo do tempo
de utilizao, como por exemplo, fadiga de equipamentos mecnicos.
Esta distribuio biparamtrica e a sua funo densidade de probabilidade (de falha) descrita
por:
(3.8)
21
variando .
variando
Quanto menor for o desvio padro mais a curva se aproxima da vertical. A curva obtm maior
declive com valores mais elevados do desvio padro. No que diz respeito fiabilidade e segundo o
que foi referido, desejvel que o desvio padro seja mais diminuto (idilicamente aspira-se a que a
curva da fiabilidade seja constante e igual a 1).
22
No que diz respeito mdia, verifica-se que quanto menor o logaritmo da mdia do tempo at
falha, mais estreita e elevada se torna a curva, sendo um factor de escala.
variando .
variando
Verifica-se que a mdia no afecta a forma da curva mas sim a sua escala. Quanto maior o valor da
mdia, mais concava vai ser a curva da fiabilidade e menos interessante ser a curva da fiabilidade
(em termos de fiabilidade de bens).
23
(3.9)
(3.10)
Esta distribuio das mais aplicadas em estudos de fiabilidade, uma vez que representativa de
bens em vida til, pelo que em muitos estudos se assume este pressuposto e se ajustam os dados
cegamente a esta distribuio [1].
Esta curva representa o tempo at falha de determinados bens com uma taxa de avarias constante
ao longo do seu tempo operacional.
24
Pode observar-se na Figura 18 que a interseco da distribuio com o eixo das ordenadas ocorre no
valor de :
tempo.
25
A distribuio de Weibull foi utilizada pela primeira vez por Waloddi Weibull em 1939 nos seus
estudos de resistncia de materiais. Esta distribuio muito utilizada em anlise de fiabilidade por
ser capaz de se adaptar grande maioria das situaes prticas devido sua flexibilidade, bastando
fazer variar algum dos seus parmetros. Por isto mesmo consegue modelar uma grande diversidade
de tipos de dados para variados tempos de vida [11].
Esta distribuio triparamtrica e os seus parmetros so ,
o fator de forma, o fator de localizao e o fator de escala, tambm designado por vida
caracterstica. Esta distribuio expressa pela seguinte funo densidade de probabilidade (de
falha):
(3.11)
26
na curva da fiabilidade:
Para um
variando .
variando .
logo no incio de operao mas com tendncia a suavizar este decrscimo com o tempo.
27
O parmetro
o factor de posio ou localizao (Figura 22). Quanto maior for este parmetro,
mais a funo densidade de probabilidade se desloca para o sentido positivo do eixo das abcissas,
mantendo a sua forma inaltervel.
variando .
variando .
28
condiciona a escala da funo. Quanto maior for este parmetro, mais a funo tender
A influncia do valor de
variando .
variando .
29
fiabilidade.
Observando a consequncia dos trs parmetros da distribuio de Weibull na curva da fiabilidade,
parece seguro referir que, pelo menos isoladamente, prefervel que os trs parmetros tenham
valores elevados.
Quando na posse de dados de tempo at falha de um determinado bem, o grande desafio saber
qual das distribuies a que melhor se ajusta. Desta forma, existem alguns testes que se podem
realizar no sentido de aferir qual a distribuio que mais se adequa a um conjunto de dados de
tempos at falha.
30
4 Caracterizao da distribuio
Tempo at
falha (horas)
1880 920 260
2130 930 350
530 780 420
580 820 1050
680 840 1060
440 710 1270
480 740 1340
480 1370 1070
Designao
da falha
1
2
3
4
5
6
7
8
Tempo at
falha (horas)
260
350
420
440
480
480
530
580
Designao
da falha
9
10
11
12
13
14
15
16
Tempo at
falha (horas)
680
710
740
780
820
840
920
930
Designao
da falha
17
18
19
20
21
22
23
24
Tempo at
falha (horas)
1050
1060
1070
1270
1340
1370
1880
2130
e pela
Nas seguintes seces sero abordados os trs mtodos de estimao de parmetros propostos
inicialmente.
32
O mtodo dos mnimos quadrados (mmq) consiste em minimizar o quadrado da distncia (segundo
uma determinada direco) de uma recta aos pontos representativos da curva que se pretende
caracterizar. Esta distncia entre a recta e cada ponto chamada de resduo. Tambm apelidado de
regresso linear, este mtodo pode ser aplicada em
cada uma delas, apenas ser apresentada a regresso em . No exemplo representado na Figura 26
esto representados 4 pontos. Observando a figura, possvel verificar que quanto menor a
distncia na vertical entre a recta estimada representada e os pontos (A, B, C e D), ou melhor,
quanto menor forem os resduos em y, mais a equao da recta se ajusta ao comportamento que os
pontos descrevem. A recta que se encontra representada estimada a partir da amostra e aquela
para qual a soma dos resduos ao quadrado mnima.
33
(4.1)
Para obter os estimadores, pretende-se que a soma das distncias na vertical entre os pontos
representados e a recta seja mnima, ou seja:
(4.2)
Onde
(inclinao da recta) e
o valor estimado
(onde a
(4.3)
e a
respectivamente e igualar estas derivadas parciais ao valor nulo. Resolvendo este sistema de
equaes obtm-se os seguintes estimadores (para uma regresso em y):
(4.4)
34
(4.5)
deve
Designao na
amostra
Tamanho da
amostra: N=10
50% (median rank)
1
2
3
4
5
6
7
8
9
10
0,06697
0,16226
0,25857
0,35510
0,45169
0,54831
0,64490
0,74143
0,83774
0,93303
Para simplificar o clculo dos ranks medianos, pode-se usar a aproximao de Bernard [2]:
(4.6)
Onde
a designao da falha e
dimenses de amostra mas no exemplo 2 ir constar a equao de Bernard visto ser mais fcil de
introduzir na aplicao em Excel. Assim sendo, para o valor de
do exemplo 2,
calculado
Quando se pretende estimar os parmetros da distribuio normal atravs do mtodo dos mnimos
quadrados, o valor de
Onde
devolve o valor de
pode ser obtido atravs da seguinte expresso (expresso (3.6) aplicada ao valor do rank mediano da
falha):
(4.8)
Onde
medianos e
O valor de
do exemplo 2:
dado por:
(4.9)
Montgomery et al. [14] chegaram s seguintes expresses dos estimadores da distribuio normal
de dois parmetros:
36
(4.10)
(4.11)
Finalmente, possvel representar a distribuio normal com os parmetros estimados pelo mtodo
dos mnimos quadrados para o exemplo 2:
37
e os respetivos
Distribuio
Parmetros
Normal
Lognormal
Exponencial
Weibull
38
O mtodo dos momentos foi proposto em 1900 por Karl Pearson [20], e consiste em igualar
momentos populacionais com os respectivos momentos amostrais resolvendo o sistema de equaes
resultante. Para um determinado conjunto de dados
probabilidade :
onde
, a funo densidade de
so
estimados.
Os primeiros
(4.12)
Os primeiros
(4.13)
, obtm-se os estimadores
:
(4.14)
(4.15)
(4.16)
39
(4.17)
(4.18)
(4.19)
O resultado final :
(4.20)
(4.21)
Aplicando ao exemplo 2:
40
Figura 28 - Curva normal com parmetros estimados pelo mtodo dos momentos do exemplo 2.
(4.22)
(4.23)
No possvel obter directamente os parmetros estimados atravs destas equaes. Teimouri et al.
(1994) [11] e Gaeddert, Joseph D. (2005) [16] referem sobre esta impossibilidade que a estimao
de parmetros da distribuio de Weibull pelo mtodo dos momentos deve ser feita atravs de
anlise computacional, alm do que estes estimadores no sero eficientes.
41
Kececioglu, Dimitri, [2] refere uma possvel soluo recorrendo ao coeficiente de variao ou
(medida de disperso relativa) definido pela seguinte relao entre o desvio padro e a mdia:
(4.24)
O valor de
obtm-se o valor de
para o
(4.25)
Com
(4.26)
Os restantes parmetros das distribuies seguem o mesmo mtodo da normal e os seus parmetros
esto descritos na Tabela 6.
Tabela 6 - Estimadores do mtodo dos momentos [2] [14].
Distribuio
Estimadores
Normal
Lognormal
Exponencial
Weibull
42
Para explicar o raciocnio que est por trs do mtodo da mxima verosimilhana, foi decidido que
fosse introduzido com o seguinte exemplo: Se for pedido para escolher de um conjunto de valores
de solues
so
(4.27)
O logaritmo da funo
dada por:
(4.28)
so dadas pelas
equaes:
com
.
(4.29)
parmetro real.
Para obter os parmetros das vrias distribuies em estudo, substitui-se
pela funo
43
(4.30)
(4.31)
Retiram-se as derivadas parciais e igualam-se a zero para obter os valores estimados dos dois
parmetros:
(4.32)
Ou
(4.33)
(4.34)
Finalmente:
(4.35)
44
(4.36)
Verifica-se que o mtodo da mxima verosimilhana e o mtodo dos momentos chegam mesma
expresso para a distribuio normal e portanto, iro assumir os mesmos valores:
45
Distribuio
Estimadores
Normal
Lognormal
Exponencial
Weibull
Montgomery et al. [14] concluram que no que diz respeito ao mtodo dos mnimos quadrados,
pode ser referido que um mtodo bastante eficaz para funes que podem ser linearizadas pois os
seus clculos so simples. Por outro lado, para algumas distribuies complexas por vezes difcil
ou at mesmo impossvel de utilizar.
46
47
5 Seleco da distribuio
Depois de obter uma amostra de tempos at falha, recomendado construir um histograma com
estes dados. Verifica-se no histograma representado na figura 30, que existe uma maior tendncia
para que a frequncia seja mais elevada ao centro e mais diminuta nas laterais. Este comportamento
semelhante distribuio normal ou talvez distribuio de Weibull. Dificilmente este
histograma seria modelado por uma distribuio exponencial visto que a sua representao grfica
muito diferente.
48
Estas so opinies que se podem tecer sobre o histograma da Figura 30. importante referir que os
modelos das distribuies so tericos e tenta-se ajustar realidade mas em casos reais muito
difcil que estes dois coincidam. Pode observar-se graficamente na Figura 31 um bom ajustamento
dos dados da amostra distribuio escolhida.
Analogamente, na Figura 32 verifica-se que a a mesma distribuio no parece ser adequada para o
conjunto de dados de outra amostra. O histograma desta figura talvez pudesse ser representado por
um modelo no simtrico, como a distribuio lognormal.
49
A anlise feita anteriormente foi baseada apenas numa inspeco grfica dos dados e numa amostra
em concreto. Para poder generalizar este resultado, isto , atribuir uma confiana ao facto de decidir
se uma distribuio se adequa ou no aos nossos dados, necessrio recorrer inferncia estatstica.
Define-se inferncia estatstica como uma vertente da estatstica cujo propsito generalizar para a
populao os resultados de uma determinada amostra. , no entanto, necessrio quantificar a
incerteza associada a estas afirmaes. Tanto a estimao de parmetros como os testes de hipteses
fazem parte da inferncia estatstica [14]. Os testes de hipteses podem ser paramtricos ou no
paramtricos consoante o que se pretende testar. Os testes paramtricos so utilizados para testar
parmetros propriamente ditos, por exemplo, se quisermos testar a hiptese de um fabricante que
afirma que o seu produto dura, em mdia, mais de 5000 horas. J os testes no paramtricos
permitem testar outro tipo de hipteses que no apenas sobre parmetros populacionais, ou seja,
consideraes que se pretendem tecer sobre o comportamento de um determinado objecto alvo.
Dentro dos testes no paramtricos existem vrios testes, como por exemplo testes de aleatoriedade,
independncia, homogeneidade, ajustamento, etc. Uma vez que o objectivo deste trabalho
determinar a fiabilidade de um bem a partir de um modelo de probabilidade terico, sero estudados
os testes de ajuste, uma vez que o objectivo escolher um modelo a partir de um conjunto de dados.
Estes testes servem para testar a hiptese de que uma determinada amostra aleatria foi extrada de
uma populao que segue uma distribuio especificada. Na aplicao Excel desenvolvida foram
implementados os testes de Qui-Quadrado, Kolmogorov-Smirnov, Anderson-Darling e Cramer-Von
Mises que Abd-El Fattah [3] refere serem os mais relevantes para validar o ajustamento de
distribuies estatsticas.
Os testes esto baseados na teoria de teste de hipteses desenvolvida por Jerzy Neyman e Egon
Pearson [18] [21] e ajudam a determinar se uma hiptese, chamada nula -
ou no rejeitada. O
teste desenvolvido admitindo que a hiptese nula verdadeira e, uma vez que as hipteses so
complementares, a rejeio de
Para exemplificar, admitindo que pretendido verificar se a distribuio normal pode ser usada para
modelar tempos at falha. Seja T o tempo at falha de uma populao de transstores, formulam
se as seguintes hipteses:
50
Para construir o histograma, ainda necessrio agrupar os dados por classes da seguinte forma:
- O nmero ideal de intervalos ou classes
- A amplitude da classe
obtida por:
(5.2)
Onde
(5.3)
Assim sendo,
- Os valores de incio das classes so determinados comeando pelo valor mnimo da amostra e
somando a amplitude de classe. Os valores de fim de classe so obtidos adicionando ao valor de
incio de classe a quantidade
onde
descritas por:
;
Classe2:
Classe k:
Ou
Como se devem estender as classes ao domnio das
distribuies, iro ser necessrios acertos. Quando se verificar a frequncia esperada, por exemplo,
para a normal, o limite inferior da primeira classe deve ser igual a
e a ltima igual a
Ou seja,
Classe 1:
Classe 2:
;
;
;
Classe 6:
- Para saber a frequncia de observao por classe necessrio contar todos os valores da nossa
amostra que esto compreendidos entre o limite inferior e o limite superior de cada classe. Caso o
valor de frequncia de observao numa classe seja inferior a 5, necessrio agrupar esta classe
com a classe anterior somando os valores de frequncias de observao e por conseguinte
52
aumentando a amplitude da classe. Se ainda assim esta soma for inferior a 5, necessrio continuar
a agrupar classes at obter um valor de observaes igual ou superior a 5. Esta foi a tarefa mais
complicada de modelar na aplicao de Excel e foi necessrio recorrer a Visual Basic para a
realizar.
Intervalo
considerado
]259,5;571,5]
]571,5;883,5]
]883,5;1195,5]
]1195,5;1507,5]
]1507,5;1819,5]
]1819,5;2131,5]
- A frequncia esperada
Frequncia
observada
Oi
7
7
5
3
0
2
Frequncia
observada
Oi
] 259,5;571,5]
7
]571,5;883,5]
7
]883,5;1195,5]
5
]1195,5;2131,5]
5
Intervalo
considerado
Onde
verdadeira,
logo, depende do modelo que est na hiptese. Apresentam-se na Tabela 9 as vrias expresses de
frequncia esperada para cada distribuio:
53
Distribuio
expresso de
Normal
Lognormal
Exponencial
Weibull
Frequncia
esperada
Ei
6,07
]- ;571,5]
[571,5;883,5]
5,98
[883,5;1195,5]
5,96
5,90
[1195,5; [
Intervalo
considerado
54
Sero apresentados de seguida os testes de ajuste que iro determinar para cada distribuio (cujos
estimadores foram apresentados no captulo 4) se possvel ou no utilizar uma determinada
distribuio para modelar os tempos de vida.
O teste de ajuste Qui-Quadrado foi desenvolvido por Karl Pearson e completado por Ronald Fisher
no incio do sculo XX [20]. O teste de ajuste Qui-Quadrado serve para testar a hiptese que as
observaes seguem uma determinada distribuio, discreta ou contnua, com ou sem parmetros
conhecidos. Este teste consiste na comparao da densidade com a funo distribuio de
probabilidades.
Numa primeira fase necessrio que seja calculado um valor observado de
que seja posteriormente comparado a um valor crtico
(Qui-quadrado) para
comparao, ser permitido afirmar que a distribuio a ser testada se ajusta (ou no) aos dados da
amostra, com um determinado nvel de confiana.
Toda a informao para aplicar o teste Qui-Quadrado est agora disponvel. Este um mtodo
sequencial [2] que se apresenta de seguida, aplicado ao exemplo 2:
(5.5)
55
O valor da estatstica de teste sempre positivo ou nulo. Caso seja nulo, significa que existe um
ajuste perfeito. Analogamente, quanto maior o valor de
distribuio escolhida se adequa nossa amostra. Neste caso, deve ser estabelecer um limite de
para que seja possvel afirmar que a distribuio escolhida se adequa ou no amostra. Este valor
obtido a partir da tabela de valores crticos de Qui quadrado (Tabela 11), cujas entradas so
(nvel de risco) e o grau de liberdade , obtido por:
(5.6)
o nmero de parmetros estimados da amostra e
o nmero de classes.
n
1
2
3
4
5
0,005
7,879
10,597
12,838
14,860
16,750
0,01
6,635
9,210
11,345
13,277
15,086
0,025
5,024
7,378
9,348
11,143
12,833
0,05
3,841
5,991
7,815
9,488
11,070
0,1
2,706
4,605
6,251
7,779
9,236
0,9
0,016
0,211
0,584
1,064
1,610
0,95
0,004
0,103
0,352
0,711
1,145
0,975
0,001
0,051
0,216
0,484
0,831
0,99
0,000
0,020
0,115
0,297
0,554
0,995
0,000
0,010
0,072
0,207
0,412
Se
56
No exemplo em questo,
, logo,
O teste de Qui Quadrado um teste simples de utilizar pelo que comum ver a sua aplicao. No
recomendada a aplicao do teste Qui Quadrado para amostras inferiores a 25 testes. Isto deve-se ao
facto de que a amostra deve ser tratada em classes de pelo menos 5 observaes, caso contrrio, ir
resultar na perda de informao valiosa [3].
57
. S assim,
atravs deste teste possvel afirmar que a distribuio que est a ser testada se ajusta nossa
amostra, com o nvel de confiana requerido.
Adverte-se que necessrio ter cuidado com os outliers pois podem levar a concluses erradas. Esta
uma ressalva importante pois est a ser utilizada uma estatstica de teste que utiliza um mximo.
Ainda seguindo o exemplo 2, assumindo as mesmas hipteses formuladas
, o teste de ajuste
de Kolmogorov-Smirnov (denominado de agora em diante de teste de ajuste K-S) pode ser obtido
atravs da seguinte sequncia [2]:
- Aps cada falha, determinar o nmero de falhas
deve-se dividir essa quantidade pelo nmero de falhas
(5.7)
Onde
- Calcular a probabilidade esperada atravs da expresso da distribuio a ser testada para cada
falha:
Tabela 9:
- Determinar para cada falha a diferena absoluta entre as duas quantidades supra mencionadas:
58
(5.8)
correspondente ao mximo
(Figura 35).
e com o desejado
nvel de confiana .
- Se o valor
rejeitado
59
No exemplo 2,
, logo,
60
Existem mais testes de ajuste baseados no mesmo princpio de comparao entre valores esperados
e valores observados, como por exemplo os testes de ajuste de Anderson-Darling (AD) e CramerVon Mises (CVM). A diferena entre estes dois testes reside na expresso do teste estatstico e
consequentemente nos respectivos valores tericos de referncia. Estes dois testes apresentam
bastantes semelhanas e por este motivo, iro ser tratados em paralelo. Para o teste AD, o valor
crtico
e para o de CVM
Para aplicar os testes acima mencionados ao exemplo 2, deve-se proceder da seguinte forma [2]:
de uma amostra de
dados.
(5.9)
Onde
(5.10)
Aps calcular todos estes valores, aplica-se a equao (5.9) e obtm-se um valor observado de
.
61
(5.11)
Onde
(5.12)
Aps calcular todas estas quantidades, aplica-se a equao (5.11) obtm-se um valor observado de
.
Para colmatar o facto dos testes de AD e CVM poderem apresentar incorreces em amostras
pequenas, Stephens [21] demonstrou teoricamente e atravs de Simulao de Monte Carlo que uma
pequena alterao a estes parmetros prefervel, sendo o resultado mais fivel e renomeou os
mesmos para
. Para o teste de AD, apenas referiu que o tamanho da amostra deve ser
, portanto,
(5.13)
62
Para o exemplo 2,
Finalmente, pode ser referido que as hipteses formuladas podem ser rejeitadas ou no, aplicando o
teste de ajuste de AD e CVM:
Rejeita-se
se:
Rejeita-se
se:
15% 10%
5% 2,5% 1%
Como
no
rejeitada e portanto no existe evidncia de que a distribuio normal no se adequa a este conjunto
de dados.
Adicionalmente, como
Mises,
conjunto de dados.
63
Este raciocnio tambm se encontra na aplicao de Excel como se verifica na Figura 37:
Enquanto o teste Qui Quadrado mede a soma total do quadrado da distncia entre as duas curvas
ponderado frequncia esperada, o teste de KS analisa a distncia mxima entre as distribuies
emprica e terica. Os dois ltimos testes, de AD e CVM partem do mesmo princpio visto que
ambas integram o quadrado da distncia entre as duas funes. A diferena que o de AD difere na
ponderao desta quantidade.
interessante comparar estes testes. O teste Qui Quadrado no fivel para amostras inferiores a
25 testes tendo em conta que devem ser tratados os dados em classes de pelo menos 5 observaes.
Tirando este facto, possvel afirmar que o teste simples e fcil de aplicar e tem a vantagem de
poder ser aplicado a dados contnuos e discretos [2].
O teste de Kolmogorov-Smirnov mais eficaz que o teste Qui Quadrado. Alm de poder ser
utilizado para qualquer volume amostral (mesmo inferior a 25 amostras), as suas tabelas conseguem
ser muito precisas para determinar a validade de uma distribuio [2].
Os testes de Anderson-Darling e Cramer-Von Mises so tambm mais eficazes que o Qui
Quadrado, sendo que tambm no so influenciados negativamente por amostras reduzidas [2].
64
De um modo geral, importante referir que os testes de K-S e CVM so mais eficazes a detectar
variaes a meio da distribuio enquanto o de AD mais eficaz a salientar variaes nas
extremidades da distribuio [2].
Para no tornar a explicao dos mtodos muito densa, tem-se vindo a detalhar e explicar os testes
de ajuste com a ajuda de uma s distribuio. A aplicao de Excel realiza todos os testes de ajuste
a todas as distribuies e fornece de imediato o resultado. Para tal, basta que o utilizador coloque a
amostra que recolheu no stio marcado para o efeito, at um mximo de
por questes de
Deixa-se como nota que no est contemplada a estimao de parmetros na aplicao de Excel
mas de qualquer forma, para os clculos, esto a ser estimados pelo mtodo dos mnimos
quadrados.
65
5.4 - Ordenao
O teste de hipteses pela abordagem de Neyman-Pearson fornece uma resposta do tipo rejeita / no
rejeita hiptese
Distribuio
Testada
Resultado
do teste
Concluso
do teste
Normal
No se rejeita
Lognormal
Rejeita-se
Exponencial No se rejeita
Weibull
Rejeita-se
Analisando a Tabela 13, observa-se que, com um nvel de significncia de 5%, existem duas
distribuies que se podem utilizar. No entanto, qual dessas distribuies a que melhor se adequa?
Para responder a esta questo, til recorrer ao indicador p-value [14]. Atravs da anlise do pvalue, possvel ordenar as distribuies (admitindo que mais que uma se candidatam a vlidas)
sabendo que se ir convergir para a mais fivel.
de salientar que o p-value, ao contrrio do que alguns autores referem, no valida a rejeio ou
aceitao das hipteses. Segundo Pandis [23], o p-value a probabilidade de chegarmos
concluso do estudo realizado quando a hiptese
a probabilidade da diferena entre dois testes ter ocorrido por acaso. Para o modelo em questo,
quanto maior o p-value, maior a evidncia para a no rejeio da distribuio assumida como
verdadeira. Keriazes ainda salienta o uso incorrecto do p-value referindo que no lgica a
abordagem de utilizar o p-value para rejeitar ou aceitar uma hiptese formulada.
66
Posto isto, pretende-se chegar a uma tabela de deciso parecida com aquela que consta na Tabela
14, onde foram retiradas as distribuies que foram invalidadas pelo mtodo anterior e adicionado o
indicador p-value:
Tabela 14 - Tabela de decises baseada no mtodo de Neyman-Pearson e no p-value.
Distribuio
Testada
Concluso
do teste
p-value
No se rejeita
0,001
Exponencial No se rejeita
0,05
Normal
Resultado
do teste
Atravs desta anlise, possvel obter uma mtrica que permitir escolher o modelo mais adequado
aos dados.
Considere-se agora o exemplo 3 com a amostra presente na Tabela 15, fornecida por Kececioglu,
Dimitri [2].
67
Utilizando os dados amostrais do exemplo 3 na folha de Excel, observa-se o output que consta na
Figura 39.
Verifica-se por exemplo que para o teste Qui Quadrado existem trs distribuies que se adequam
aos dados. Aplicando o conceito de p-value (Tabela 16), sobressai a distribuio normal como
sendo a que melhor representa a nossa amostra pois possui um p-value maior.
Tabela 16 - Tabela de deciso baseada no p-value para o exemplo 3
68
69
possvel agora tecer concluses sobre esta amostra, extrapolando para a populao que originou a
mesma. possvel afirmar com
fiabilidade de
no instante
no instante
de servio:
70
Visto que a ordenao das distribuies no era parte integrante da proposta do Trabalho Final de
Mestrado, foi tomada a deciso de no explorar a fundo esta vertente. Apenas foi referida a noo
de p-value para o teste Qui Quadrado pois verificou-se de interesse para o tema e deixa-se uma
porta aberta para um estudo aprofundado deste aspecto da estatstica visto que j existe algum
estudo associado [26].
71
Existe uma necessidade crescente de rentabilizar os activos de uma empresa e minimizar custos
associados a manuteno e danos de material. Para isso, a fiabilidade tem vindo a ser cada vez mais
implementada.
Verificou-se que atravs da obteno de uma amostra e do estudo de vrias distribuies
estatsticas, possvel modelar o comportamento de falha de um activo. As distribuies que foram
analisadas so a normal, lognormal, exponencial e Weibull.
Chegou-se concluso que atravs de mtodos de estimao de parmetros, nomeadamente, o
mtodo dos mnimos quadrados, dos momentos e da mxima verosimilhana, possvel caracterizar
uma distribuio consoante a nossa amostra, obtendo assim uma fdp associada.
De seguida, validou-se se todas as distribuies propostas eram fiveis aos dados obtidos na
amostra atravs de testes no paramtricos tais como o mtodo qui quadrado, de Kolmogorov
Smirnov, de Anderson-Darling e de Cramer-Von Mises. Quando se concluiu que algumas destas
distribuies eram candidatas a modelo representativo da amostra, foram ordenadas atravs do pvalue para ditar qual ou quais seriam as distribuies mais adequadas para o objectivo enunciado.
Resume-se o supracitado no diagrama seguinte:
72
ainda importante referir que existe alguma margem na utilizao e na fiabilidade destes dados
pois usualmente utilizado um factor de correco, o factor de segurana. Mathieu [25] reitera a
importncia deste factor de segurana e aponta
valores probabilsticos em fiabilidade. claro que quanto maior o risco da falha, ou seja, quanto
mais impacto tiver a falha, maior ser a tendncia a aumentar este factor de segurana. Uma das
maiores causas que Mathieu aponta para este factor de segurana que a fiabilidade vem de outros
componentes que aquele que est a ser utilizado e no do prprio pelo que a previso exacta do
tempo da sua falha impossvel atravs deste mtodo.
O ficheiro de Excel foi elaborado para automatizar os testes de ajuste s vrias distribuies
estatsticas. Prope-se como trabalho futuro alastrar o mbito desta folha de clculo para que
tambm seja contemplada a estimao de parmetros, assim como outros modelos de probabilidade.
Adicionalmente, prope-se um estudo sobre a aplicao do p-value aos testes KS, AD e CVM onde
se poder comear pelos estudos dedicados a inserir os testes de KS em Excel com a ajuda de
Visual Basic [26].
Ainda para trabalho futuro prope-se a anlise que foi realizada para esta tese mas com substituio
de componentes. A estrutura deste trabalho poder ser idntica, sendo o detalhe diferente e
contribuir para um valor acrescentado a este documento.
73
Referncias
[1] EDIMU, M., GAUNT, C.T., HERMAN, R., Using probability distribution functions in reliability
analyses - Electric Power Systems Research 81 (2011) 915921
[2] KECECIOGLU, Dimitri B., Reliability & Life Testing Handbook, Department of Aerospace and
Mechanical Engineering, The University of Arizona, Vol. 1
[3] ABD-ELFATTAH, A. M., Goodness of fit test for the generalized Rayleigh distribution with
unknown parameters, Journal of Statistical Computation and Simulation, 2010
[4] T. P. Davis, Science, engineering, and statistics, Appl. Stochastic Models Bus. Ind., 2006
[5] E. Zio, Reliability engineering: Old problems and new challenges, Reliability Engineering and
System Safety, 2009, Vol.94(2), pp.125-141
[6] IDHAMMAR, Christer, A Culture Of Reliability, Pulp & Paper International, Feb, 2012,
Vol.54(2), p.32(3)
[7] PARSEN, Emanuel, Stochastic Processes, An unabridged , corrected republication of the work
first published by Holden-Day, Oakland, Calif., 1962
[8] LEFEBRE, Mrio, Applied Probability and Statistics, Departement de mathematiques et de genie
industriel, 2000
[9] http://ec.europa.eu/energy/lumen/overview/howtochoose/packaging/packaging_pt.htm, Comisso
Europeia, Como ler a embalagem, visto em 28-09-2013
[10]
TEIMOURI, Madhi, et al., Comparison of estimation methods for the Weibull distribution,
2011
[12]
Analysis, 2012
[13]
MORTICI, Cristinel, Some completely monotonic functions relating to the gamma function,
[14]
MONTGOMERY, Douglas C., RUNGER, George, C., Applied Statistics and Probability for
GOURDIN, ric et al., Finding Maximum Likelihood Estimators for the Three-Parameter
[17]
KUMPHON, Bungon, Maximum Entropy and Maximum Likelihood Estimation for the
BIAU, David Jean, JOLLES, Brigitte M., PORCHER, Raphael, P Value and the Theory of
EL-ADLL, Magdy E., Predicting future lifetime based on random number of three parameters
STIGLER, Stephen M., Karl Pearson and the Rule of Three, Department of Statistics,
[22]
FALISSARD, Bruno, Statistics In Brief, When to Use and When Not to Use a Threshold P
Value, 2011
[23]
PANDIS, Nikolaos, The P Value Problem, American Journal of Orthodontics and Dentofacial
Orthopedics, 2013
[24]
Pharmacotherapy, 2012
[25]
[26]
Smirnov P-Value computation in Visual Basic: implication for Microsoft Excel library
function, 2011
75
Definies
Activos: Conjunto de bens que formam o patrimnio (de uma empresa ou organizao).
Componente: Pea simples.
Covarincia: Medida da dependncia linear entre duas variveis aleatrias [2].
Desvio padro: O desvio padro fornece a informao de quanto uma amostra est concentrada em
relao mdia. Um desvio padro diminuto transparece que os dados esto concentrados em torno
da mdia e por consequente, um desvio padro refere que a amostra est dispersa relativamente
mdia. O desvio padro obtm-se pela expresso:
especificado.
Funo densidade de probabilidade: A funo densidade de probabilidade, tambm chamada de
funo densidade ou fdp ou pdf (probability density function) uma funo no negativa que
representa a distribuio de probabilidade de uma varivel aleatria contnua. Normalmente esta
representada em minsculas por
[1].
76
Funo distribuio emprica: uma funo que representa a distribuio dos valores observados
de um conjunto de dados.
Mdia: Neste documento ir ser referida a palavra mdia (assumida aritmtica) cuja expresso
matemtica :
de uma funo
77
Apndice
Apndice A Tabela da normal padronizada
z
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3
3,1
3,2
3,3
3,4
0
0,5
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
0,758
0,7881
0,8159
0,8413
0,8643
0,8849
0,9032
0,9192
0,9332
0,9452
0,9554
0,9641
0,9713
0,9772
0,9821
0,9861
0,9893
0,9918
0,9938
0,9953
0,9965
0,9974
0,9981
0,9987
0,999
0,9993
0,9995
0,9997
0,01
0,504
0,5438
0,5832
0,6217
0,6591
0,695
0,7291
0,7611
0,791
0,8186
0,8438
0,8665
0,8869
0,9049
0,9207
0,9345
0,9463
0,9564
0,9649
0,9719
0,9778
0,9826
0,9864
0,9896
0,992
0,994
0,9955
0,9966
0,9975
0,9982
0,9987
0,9991
0,9993
0,9995
0,9997
0,02
0,508
0,5478
0,5871
0,6255
0,6628
0,6985
0,7324
0,7642
0,7939
0,8212
0,8461
0,8686
0,8888
0,9066
0,9222
0,9357
0,9474
0,9573
0,9656
0,9726
0,9783
0,983
0,9868
0,9898
0,9922
0,9941
0,9956
0,9967
0,9976
0,9982
0,9987
0,9991
0,9994
0,9995
0,9997
0,03
0,512
0,5517
0,591
0,6293
0,6664
0,7019
0,7357
0,7673
0,7967
0,8238
0,8485
0,8708
0,8907
0,9082
0,9236
0,937
0,9484
0,9582
0,9664
0,9732
0,9788
0,9834
0,9871
0,9901
0,9925
0,9943
0,9957
0,9968
0,9977
0,9983
0,9988
0,9991
0,9994
0,9996
0,9997
0,04
0,516
0,5557
0,5948
0,6331
0,67
0,7054
0,7389
0,7704
0,7995
0,8264
0,8508
0,8729
0,8925
0,9099
0,9251
0,9382
0,9495
0,9591
0,9671
0,9738
0,9793
0,9838
0,9875
0,9904
0,9927
0,9945
0,9959
0,9969
0,9977
0,9984
0,9988
0,9992
0,9994
0,9996
0,9997
0,05
0,5199
0,5596
0,5987
0,6368
0,6736
0,7088
0,7422
0,7734
0,8023
0,8289
0,8531
0,8749
0,8944
0,9115
0,9265
0,9394
0,9505
0,9599
0,9678
0,9744
0,9798
0,9842
0,9878
0,9906
0,9929
0,9946
0,996
0,997
0,9978
0,9984
0,9989
0,9992
0,9994
0,9996
0,9997
0,06
0,5239
0,5636
0,6026
0,6406
0,6772
0,7123
0,7454
0,7764
0,8051
0,8315
0,8554
0,877
0,8962
0,9131
0,9279
0,9406
0,9515
0,9608
0,9686
0,975
0,9803
0,9846
0,9881
0,9909
0,9931
0,9948
0,9961
0,9971
0,9979
0,9985
0,9989
0,9992
0,9994
0,9996
0,9997
0,07
0,5279
0,5675
0,6064
0,6443
0,6808
0,7157
0,7486
0,7794
0,8078
0,834
0,8577
0,879
0,898
0,9147
0,9292
0,9418
0,9525
0,9616
0,9693
0,9756
0,9808
0,985
0,9884
0,9911
0,9932
0,9949
0,9962
0,9972
0,9979
0,9985
0,9989
0,9992
0,9995
0,9996
0,9997
0,08
0,5319
0,5714
0,6103
0,648
0,6844
0,719
0,7517
0,7823
0,8106
0,8365
0,8599
0,881
0,8997
0,9162
0,9306
0,9429
0,9535
0,9625
0,9699
0,9761
0,9812
0,9854
0,9887
0,9913
0,9934
0,9951
0,9963
0,9973
0,998
0,9986
0,999
0,9993
0,9995
0,9996
0,9997
0,09
0,5359
0,5753
0,6141
0,6517
0,6879
0,7224
0,7549
0,7852
0,8133
0,8389
0,8621
0,883
0,9015
0,9177
0,9319
0,9441
0,9545
0,9633
0,9706
0,9767
0,9817
0,9857
0,989
0,9916
0,9936
0,9952
0,9964
0,9974
0,9981
0,9986
0,999
0,9993
0,9995
0,9997
0,9998
78
COV
429,8314
47,0366
15,843
8,3066
5,4077
3,9721
3,1409
2,6064
2,2361
1,965
1,7581
1,5948
1,4624
1,3529
1,2605
1,1815
1,113
1,053
1,00
0,9527
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
0,5
0,55
0,6
0,65
0,7
0,75
0,8
0,85
0,9
0,95
1,0
1,05
[2]:
COV
0,9102
0,8718
0,8369
0,805
0,7757
0,7487
0,7238
0,7006
0,679
0,6588
0,6399
0,6222
0,6055
0,5897
0,5749
0,5608
0,5474
0,5348
0,5227
0,5112
1,1
1,15
1,2
1,25
1,3
1,35
1,4
1,45
1,5
1,55
1,6
1,65
1,7
1,75
1,8
1,85
1,9
1,95
2
2,05
COV
0,5003
0,4898
0,4798
0,4703
0,4611
0,4523
0,4438
0,4341
0,4279
0,4204
0,4131
0,4062
0,3994
0,3929
0,3866
0,3805
0,3747
0,369
0,3634
0,3581
2,1
2,15
2,2
2,25
2,3
2,35
2,4
2,45
2,5
2,55
2,6
2,65
2,7
2,75
2,8
2,85
2,9
2,95
COV
0,3529
0,3479
0,343
0,3383
0,3336
0,3292
0,3248
0,3206
0,3165
0,3124
0,3085
0,3047
0,301
0,2974
0,2938
0,2904
0,287
0,2838
3,1
3,15
3,2
3,25
3,3
3,35
3,4
3,45
3,5
3,55
3,6
3,65
3,7
3,75
3,8
3,85
3,9
3,9
79
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
5,00%
0,975
0,842
0,708
0,624
0,454
0,521
0,486
0,457
0,432
0,41
0,391
0,375
0,361
0,349
0,338
0,328
0,318
0,309
0,301
0,294
0,2892
0,2844
0,2796
0,2748
0,27
0,264
0,258
0,252
0,246
0,24
0,238
0,236
0,234
0,232
0,27761
0,27761
1,00%
0,995
0,929
0,828
0,733
0,669
0,618
0,577
0,543
0,514
0,49
0,468
0,405
0,433
0,,118
0,404
0,392
0,381
0,371
0,363
0,356
0,3488
0,3416
0,3344
0,3272
0,32
0,314
0,308
0,302
0,296
0,29
0,286
0,282
0,278
0,274
0,33272
0,33272
80
81