Sei sulla pagina 1di 91

INSTITUTO SUPERIOR DE ENGENHARIA DE LISBOA

rea Departamental de Engenharia Mecnica


ISEL

Testes de Ajuste a Distribuies Estatsticas e Mtodos para


Estimao dos Parmetros em Anlises de Fiabilidade
Filipe de Salvador Fernandes
(Engenheiro Mecnico)
Trabalho Final de Mestrado para obteno do grau de Mestre
em Engenharia Mecnica

Orientadores:
Doutor Jos Augusto da Silva Sobral
Doutora Alda Cristina Jesus Nunes de Carvalho

Jri:
Presidente: Prof. Doutora Maria Teresa Moura e Silva
Vogais:
Prof. Doutora Iola Maria Silvrio Pinto
Prof. Doutor Jos Antnio Rocha Almeida Soares
Prof. Doutor Jos Augusto da Silva Sobral
Prof. Doutora Alda Cristina Jesus N. de Carvalho
Setembro de 2013

A arte da previso consiste em antecipar o que acontecer e depois explicar o porque no


aconteceu.

Winston Churchill

Agradecimentos

Quero agradecer ao meu pai, a pessoa mais brilhante e ao mesmo tempo mais simples e modesta
que conheo. Foste a inspirao e motivao por detrs de cada palavra que escrevi.

Quero agradecer minha me e ao meu irmo por sempre terem estado presentes quando
necessitei.
Quero agradecer aos meus orientadores, Professora Alda que me apoiou neste desafio e a
projecta-lo para outros mbitos. De igual forma, quero agradecer ao Professor Sobral pela sua
ajuda a elaborar este documento.
Quero ainda agradecer ao meu colega Carlos Antunes pela sua preciosa ajuda a introduzir Visual
Basic na aplicao de Excel.

Apenas tu sabes o quanto custa conciliar a vida laboral com a vida acadmica e por isso quero
agradecer-te especialmente a ti, Susana, pelo apoio dirio incondicional, pelo conforto fsico e
psicolgico que nunca deixaste que me faltasse.
Finalmente, quero agradecer-te a ti, Vicente, por seres o meu beb de Ouro e por teres tido a
capacidade de perceber a ausncia do pai.

Todos temos momentos brilhantes e a maioria deles so graas ao estmulo de outra pessoa.
George Adams
II

Resumo

O presente trabalho visa mostrar a importncia das anlises estatsticas para a realizao de estudos
de fiabilidade. Nesse sentido foram descritos os princpios em que esses estudos se baseiam,
apresentadas definies e conceitos relacionados com a fiabilidade, assim como algumas
especificidades desta matria.
Posteriormente foram apresentadas as principais distribuies estatsticas frequentemente usadas em
estudos de fiabilidade, sendo descritos alguns mtodos para estimao dos seus parmetros e alguns
testes para indicar qual a distribuio que melhor se ajusta a um conjunto de elementos, neste caso
representativos dos tempos at falha de um determinado bem..
Existem diversos programas informticos, comercializados e utilizados em estudos de fiabilidade,
que incluem as potencialidades enumeradas nos pargrafos anteriores. O trabalho agora
desenvolvido tem por objectivo mostrar toda a teoria que se encontra por trs dos algoritmos usados
nos programas informticos. Como complemento, foi desenvolvida em Microsoft Excel uma
aplicao que automatiza os testes de ajuste a partir de dados amostrais, baseando-se nos modelos
tericos enunciados. Esta aplicao pode ser considerada uma mais valia do presente trabalho,
funcionando como um interface de ajuda aos utilizadores aquando de estudos de fiabilidade
baseados em anlises estatsticas.

Palavras-chave

Fiabilidade, distribuio estatstica, estimao de parmetros, teste de ajuste

III

Abstract

This document aims to show the relevance of statistical analysis in reliability studies. The principles
on which these studies are based were looked into, definitions and concepts related to reliability, as
well as some specifics of this matter were presented.
Subsequently were presented the main statistical distributions commonly used in reliability studies,
and described some methods for parameter estimation and some tests to indicate which distribution
best fits a set of elements, in this case representing the time to failure of a particular good.
There are several computer programs marketed and used in reliability studies, which include the
potential listed in the previous paragraphs. The work now developed is intended to show all the
theory that lies behind the algorithms used in these computer programs. As a supplement, an
application in Microsoft Excel was developed that automates the goodness of fit tests from sample
data, based on the theoretical models listed. This application can be considered an asset of this
work, functioning as an interface to help users during reliability studies based on statistical analysis.

Keywords

Reliability, statistical distributions, parameter estimation, goodness of fit

IV

ndice
ndice
Agradecimentos ......................................................................................................................... II
Resumo ..................................................................................................................................... III
Palavras-chave .......................................................................................................................... III
Abstract .....................................................................................................................................IV
Keywords ..................................................................................................................................IV
ndice ......................................................................................................................................... V
ndice de Tabelas ......................................................................................................................VI
ndice de Figuras .................................................................................................................... VII
Glossrio ................................................................................................................................ VIII
1 - Introduo.............................................................................................................................. 1
2 Fiabilidade ............................................................................................................................ 3
3 Distribuies Estatsticas em Fiabilidade ........................................................................... 14
3.1 - Distribuio Normal ..................................................................................................... 16
3.2 - Distribuio Lognormal................................................................................................ 21
3.3 - Distribuio Exponencial ............................................................................................. 24
3.4 - Distribuio de Weibull ................................................................................................ 26
4 Caracterizao da distribuio ............................................................................................ 31
4.1 - Mtodo dos mnimos quadrados ................................................................................... 33
4.2 - Mtodo dos momentos ................................................................................................. 39
4.3 - Mtodo da mxima verosimilhana .............................................................................. 43
5 Seleco da distribuio ..................................................................................................... 48
5.1 - Testes de ajuste Qui-Quadrado ..................................................................................... 55
5.2 - Teste de Ajuste Kolmogorov-Smirnov ......................................................................... 58
5.3 - Teste de ajuste Anderson-Darling e Cramer-Von Mises .............................................. 61
5.4 - Ordenao ..................................................................................................................... 66
6 Concluses e trabalhos futuros ........................................................................................... 72
Referncias ............................................................................................................................... 74
Definies ................................................................................................................................. 76
Apndice ................................................................................................................................... 78

ndice de Tabelas
Tabela 1 - Amostra de dados do exemplo 1 [2] ...................................................................................... 7
Tabela 2 - Amostra de dados do exemplo 2 [2]. ................................................................................... 31
Tabela 3 - Amostra de dados do exemplo 2 ordenada e numerada. ...................................................... 32
Tabela 4 - Ranks Medianos [2][14]....................................................................................................... 35
Tabela 5 - Estimadores do mtodo dos mnimos quadrados [2][14]. .................................................... 38
Tabela 6 - Estimadores do mtodo dos momentos [2] [14]................................................................... 42
Tabela 7 - Estimadores do mtodo da mxima verosimilhana [2] [14]. .............................................. 46
Tabela 8 Frequncia observada, Intervalo considerado e agrupamento de classes do exemplo 2. .... 53
Tabela 9 - Expresso da frequncia esperada para cada distribuio[2]. .............................................. 54
Tabela 10 - Frequncia esperada, Intervalo considerado e agrupamento de classes para o exemplo 2. 54
Tabela 11 Constantes crticas Qui Quadrado [2]................................................................................ 56
Tabela 12 - Constantes crticas de Anderson-Darling e Cramer-Von Mises [2]. .................................. 63
Tabela 13 - Tabela de decises baseada no mtodo de Neyman-Pearson. ............................................ 66
Tabela 14 - Tabela de decises baseada no mtodo de Neyman-Pearson e no p-value. ....................... 67
Tabela 15 Amostra de dados do exemplo 3 [2] .................................................................................. 67
Tabela 16 - Tabela de deciso baseada no p-value para o exemplo 3 ................................................... 68

VI

ndice de Figuras
Figura 1 - Exemplo de uma curva da banheira. ....................................................................................... 5
Figura 2 - Histograma do exemplo 1 ....................................................................................................... 8
Figura 3 - Output do Geogebra da amostra do exemplo 1 ...................................................................... 8
Figura 4 - Boxplot dos dados da amostra do exemplo 1 ......................................................................... 9
Figura 5 Fdp de uma distribuio exponencial. ................................................................................. 10
Figura 6 - fda da distribuio exponencial anterior. .............................................................................. 11
Figura 7 Curva da fiabilidade do modelo anterior. ............................................................................ 12
Figura 8 - Obteno da fiabilidade de um bem. .................................................................................... 13
Figura 9 - Distribuio normal com
variando . ........................................................................ 17
Figura 10 Fiabilidade provinda da distribuio normal com
variando ................................. 17
Figura 11 - Distribuio normal com
variando .................................................................... 18
Figura 12 - Fiabilidade provinda da distribuio normal com
variando .............................. 18
Figura 13 - Distribuio normal padronizada........................................................................................ 19
Figura 14 - Distribuio lognormal com
variando . ................................................................ 22
Figura 15 - Fiabilidade provinda da distribuio lognormal com
variando ........................... 22
Figura 16 - Distribuio lognormal com
variando . ................................................................. 23
Figura 17 - Fiabilidade provinda da distribuio lognormal com
variando .......................... 23
Figura 18 - Distribuio exponencial variando . ................................................................................. 25
Figura 19 - Fiabilidade provinda da distribuio exponencial variando ............................................ 25
Figura 20 - Distribuio de Weibull de trs parmetros com
variando ....................... 27
Figura 21 - Fiabilidade provinda da distribuio de Weibull com
variando . .............. 27
Figura 22 - Distribuio de Weibull de trs parmetros com
variando . .................... 28
Figura 23 - Fiabilidade provinda da distribuio de Weibull com
variando . ............ 28
Figura 24 - Distribuio de Weibull de trs parmetros com
variando . ................... 29
Figura 25 - Fiabilidade provinda da distribuio de Weibull com
variando . ........... 29
Figura 26 - Regresso linear em y. ........................................................................................................ 33
Figura 27 - Curva normal com parmetros estimados pelo mmq do exemplo 2. .................................. 37
Figura 28 - Curva normal com parmetros estimados pelo mtodo dos momentos do exemplo 2. ...... 41
Figura 29 - Curva normal com parmetros estimados pelo mmv. ........................................................ 45
Figura 30 - Histograma de dados agrupados ......................................................................................... 48
Figura 31 Exemplo de uma boa adequao da funo aos dados....................................................... 49
Figura 32 Exemplo de uma m adequao da funo aos dados. ...................................................... 49
Figura 33 - Histograma comparativo das frequncias estudadas. ......................................................... 54
Figura 34 - Teste de Qui Quadrado na aplicao de Excel ................................................................... 57
Figura 35 - Distncias de KS para o exemplo 2. ................................................................................... 59
Figura 36 - Teste de Kolmogorov Smirnov na aplicao de Excel ....................................................... 60
Figura 37 - Testes de Anderson-Darling e Cramer Von-Mises na aplicao de Excel ......................... 64
Figura 38 - Folha de entrada da aplicao de Excel .............................................................................. 65
Figura 39 - Resultados da aplicao de Excel para o exemplo 3 .......................................................... 68
Figura 40 Adequao da distribuio aos dados do exemplo 3.......................................................... 69
Figura 41 - Fda de falha do exemplo 3.................................................................................................. 69
Figura 42 - Curva da fiabilidade representativa da amostra do exemplo 3 ........................................... 70
Figura 43 - Interpretao da fiabilidade do exemplo anterior. .............................................................. 70
Figura 44 - Workflow da dissertao ..................................................................................................... 72

VII

Glossrio

- Valor observado no teste de ajuste Anderson-Cramer


- Valor crtico no teste de ajuste Anderson-Cramer
- Nvel de significncia para os testes de ajuste
- Parmetro de forma da distribuio de Weibull
- Valor crtico no teste de ajuste Kolmogorov-Smirnov
- Valor observado no teste de ajuste Kolmogorov-Smirnov
- Escala mnima de leitura
- Parmetro de localizao da distribuio de Weibull
- Funo Gamma obtida para um determinado valor de
- Taxa de avarias
- Tempo mdio entre falhas
- Dimenso da amostra ou nmero de testes realizados
Dimenso da populao
- Parmetro de escala da distribuio de Weibull
- Amplitude da amostra
- Desvio padro
- Desvio padro do logaritmo natural do tempo at falha
- Desvio padro estimado do tempo at falha
- Tempo at falha na amostra
- Tempo at falha na populao
- Logaritmo natural do tempo at falha
VIII

- Mdia aritmtica estimada do tempo at falha


- Mdia aritmtica do tempo at falha
- Logaritmo natural da mdia do tempo at falha
- Amplitude de classe
- Valor observado no teste de ajuste Cramer-Von Mises
- Valor crtico no teste de ajuste Cramer-Von Mises
- Valor observado no teste de ajuste Qui-Quadrado
- Valor crtico no teste de ajuste Qui-Quadrado

IX

1 - Introduo

O presente trabalho visa abordar o tema da fiabilidade, mostrando a importncia das anlises
estatsticas para o alcanar dos objectivos delineados nesses estudos.
Atravs de exemplos, ser ilustrado o caminho a percorrer para estimar a fiabilidade de um bem.
Comear-se- por contextualizar a fiabilidade e aflorar a sua evoluo. Tendo em conta que a
fiabilidade de um bem uma probabilidade a um dado instante e esta probabilidade varia consoante
o tempo de utilizao, esta ser caracterizada por uma funo. Para chegar a esta funo h que
perceber qual a distribuio estatstica subjacente aos elementos disponveis (dados de tempo at
falha). Com base na sua funo densidade de probabilidade e na sua integrao matemtica ser
possvel chegar funo fiabilidade desejada. Para tal, sero apresentadas numa primeira fase as
distribuies e as expresses matemticas que as caracterizam. Numa segunda fase prope-se
validar quais as distribuies estatsticas viveis para descrever o comportamento desejvel atravs
de testes de ajuste. Posteriormente ser determinado qual delas melhor descreve o modelo
requerido. Finalmente, escolhida a distribuio estatstica, obter-se- a fiabilidade propriamente dita
do bem.
No segundo captulo desta tese ser apresentado o conceito de fiabilidade, comeando por fornecer
a sua definio e explicando o seu objectivo.
No terceiro captulo, sero abordadas as distribuies estatsticas mais utilizadas em anlise de
fiabilidade que segundo Edimu et al. [1] so as seguintes: distribuio normal, lognormal,
exponencial, e Weibull. As distribuies sero brevemente introduzidas com nfase nos seus
parmetros (neste documento, a palavra parmetros vai se referir s constantes presentes nas
equaes das distribuies estatsticas) e na forma que podem assumir graficamente.
A estimao de parmetros das distribuies vai ser alvo de anlise no quarto captulo com alguns
dos mtodos mais utilizados. Vo ser abordados os mtodos sugeridos por Kececioglu, Dimitri [2],
ou seja, o mtodo dos mnimos quadrados, o mtodo dos momentos e finalmente o mtodo da
mxima verosimilhana.

No quinto captulo, vo ser apresentados os testes de ajuste que vo constar na aplicao de Excel.
Vo ser abordados os testes de ajuste Qui Quadrado, de Kolmogorov-Smirnov, de AndersonDarling e de Cramer-Von Mises que segundo Abd-El Fattah, A. M. (2010) [3] so os mais
relevantes. Estes dois ltimos sero analisados em paralelo visto apresentarem semelhanas. Ainda
no quinto captulo ir ser analisada a forma de ordenar as distribuies para que seja possvel
distinguir (das que no foram rejeitadas nos testes de ajuste) a que melhor nos servir.
Acompanhando a abordagem terica, vai ser estudado um caso com a ajuda da aplicao de Excel,
demonstrando o seu funcionamento.

2 Fiabilidade

Desde sempre existiu a necessidade de tentar adivinhar o futuro, quer fosse atravs dos ventos, dos
pssaros ou movimento das rvores. Esta necessidade prendeu-se sempre com a vontade de tentar
antecipar acontecimentos, quase sempre conotados negativamente, para que se pudesse evitar as
suas consequncias.
Assim, nesse sentido foram desenvolvidas ao longo do tempo vrias metodologias e ferramentas,
tentando-se diminuir a incerteza associada a cada processo ou estudo efectuado.
Normalmente a grande dificuldade no campo da engenharia da fiabilidade partir de um conjunto
de tempos at falha de um dado bem ou conjunto de bens semelhantes, recolhidos em ambiente
laboratorial ou industrial e, com base nesses elementos, saber qual o comportamento desse bem (ou
conjunto de bens semelhantes) ao longo do tempo, nomeadamente a sua probabilidade de falha ou
de sucesso.
Esta probabilidade de sucesso que normalmente se designa por Fiabilidade, sendo complementar
da probabilidade de falha (acumulada).
A definio que mais se encontra na literatura dedicada a este tema e que Davis [4] da Ford Motor
Company subscreve : A fiabilidade a probabilidade de um sistema se encontrar no seu correto
funcionamento num determinado perodo temporal sob conhecidas condies de operao. Talvez
se possa complementar esta definio referida por Davis substituindo sistema por bem ou, de
acordo com recentes desenvolvimentos nesta matria, por activo fsico. Segundo a Norma NP EN
13306:2007 entende-se por fiabilidade a aptido de um bem para cumprir uma funo requerida
sob determinadas condies, durante um dado intervalo de tempo. Mais concretamente, em
Engenharia, a fiabilidade define-se por uma probabilidade (de sucesso).
Fazendo uma analogia ao ser humano, de senso comum que a partir de determinada idade
necessrio que sejam realizados certos exames mdicos e anlises clinicas a fim de verificar qual o
presente estado de sade do mesmo e assim tentar antecipar alguns acontecimentos indesejveis.
Esta preveno no feita ao acaso, determinou-se em tempos que a probabilidade de determinada
doena se manifestar a partir daquela idade era superior a um valor crtico e da ento ser
aconselhado um rastreio.
3

O conceito de fiabilidade data dos anos 1800 onde apareceu pela primeira vez. A revoluo social,
cultural e tecnolgica que ocorreu impulsionou a necessidade da existncia de uma estrutura
racional e de um tratamento quantitativo da fiabilidade de bens, culminando com a criao de
engenharia de fiabilidade como disciplina cientfica [5].
Os estudos relativos fiabilidade de bens tm vindo a tornar-se ao longo dos ltimos anos uma rea
bastante importante e aliciante no ambiente industrial pois permite que as organizaes comecem a
possuir um conhecimento mais profundo acerca da probabilidade de falha dos seus activos fsicos
que representam o conjunto de bens que formam o seu patrimnio. O termo avaria est definido
pela Norma NP EN 13306:2007 como: avaria a manifestao da inaptido de um dado item
realizar um determinado padro de desempenho previamente especificado. Para as empresas, o
conhecimento desta probabilidade poder suportar tomadas de deciso visando obter redues de
custos e aumento da disponibilidade de bens. Devido a este facto, em grande parte da indstria
comum a existncia de um Departamento de Manuteno cuja base para a tomada de decises
assenta em estudos e anlises de fiabilidade.
Idhammar [6] aponta os principais entraves da manuteno nas empresas e neste mbito, verifica
que o grande valor de uma empresa atribudo aos lucros directos, sendo ignorado o que se poderia
ter lucrado caso tivesse sido implementado um sistema de manuteno adequado. Para tal,
necessrio que o responsvel da manuteno apresente um conjunto de argumentos fortes gesto
de topo, convencendo estes elementos da reduo de custos que da advir. A correta quantificao
dos custos em grande parte conseguida atravs de estudos de fiabilidade dos bens, tendo
repercusses em termos da quantidade de falhas, custos, diminuio do risco, aumento da
disponibilidade dos equipamentos, etc. Grande parte destas anlises de fiabilidade tem como base
de partida os tempos at avaria registados no passado, aplicando aos mesmos mtodos de anlise
estatstica para conhecer o comportamento presente e futuro dos respectivos bens.
Isto leva ao maior constrangimento que a anlise de fiabilidade enfrenta, ou seja, a inexistncia de
dados fidedignos relativos s falhas ocorridas (tambm chamado de histrico) sendo que tambm se
verifica que existe uma deficiente aplicao de ajuste aos dados a distribuies estatsticas, assim
como uma deficiente determinao dos seus parmetros.
Quando se realizam anlises de fiabilidades aos bens em servio pretende-se prever quando um
determinado modo de falha poder ocorrer. Pretende-se saber qual a probabilidade de sucesso
(fiabilidade) ou de falha associada a uma determinada idade ou tempo de funcionamento. A maior

parte dos componentes reparveis (bem) ou sistemas (vrios bens formando um conjunto para o
desempenho de uma funo) seguem a Curva da Banheira. O comportamento desta curva o
seguinte; numa primeira fase, a taxa de avaria (que exprime o nmero de avarias por unidade de
tempo) elevada no incio de vida dos componentes ou sistemas (mortalidade infantil) devido
maioritariamente a defeitos de fabrico, montagem deficiente, etc. Esta curva decresce e estabiliza
logo de seguida no perodo de utilizao normal (vida til) e volta a aumentar no seu fim de vida
(desgaste ou envelhecimento) devido aos efeitos da idade e tempo de funcionamento.
A curva da banheira pode ser apresentada em diversos formatos, tendo em conta o tipo de bens em
estudo. A Figura 1 mostra a curva da banheira tpica, onde as trs fases anteriormente referidas se
encontram representadas. Segundo Edimu et al. [1] podem ser analisadas distribuies estatsticas
para modelar cada uma destas fases.

Figura 1 - Exemplo de uma curva da banheira.

Na vasta bibliografia existente sobre a matria comum encontrar algumas variantes curva da
banheira tradicional mostrada na Figura 1, sendo normalmente efectuada uma tipificao de acordo
com o bem em estudo (electrnico, mecnico, etc). Naturalmente que essa tipificao baseada
em estudos e testes efectuados, devidamente provados e validados.

O incio deste estudo passa obrigatoriamente pela recolha de dados. necessrio extrair de uma
populao

(conjunto total de bens) uma amostra

que ir toda ser testada at falha. Por

exemplo, se um construtor de rolamentos pretender determinar a fiabilidade de um determinado tipo


de rolamento que comercializa, dever possuir um mecanismo que simule o funcionamento para o
qual o rolamento est destinado (velocidade, cargas aplicadas, etc.). De seguida, do seu volume
total de produo

, dever retirar aleatoriamente uma amostra

de rolamentos que ir submeter a

estes testes. Dever levar toda a sua amostra at falha e registar o tempo que os rolamentos
levaram at sua avaria

, neste caso, em horas. Este levantamento de dados fundamental e

ser a base de partida para a obteno da fiabilidade.


Como este um contexto no determinstico, ou seja, no se sabe qual o tempo de vida dos
componentes, so utilizadas variveis aleatrias visto que para todo o evento aleatrio, possvel
associar uma ou mais variveis ditas variveis aleatrias. A varivel aleatria ir tomar os valores
do perodo at que um bem apresente uma falha cuja unidade poder ser horas, minutos, segundos,
dias, ciclos, revolues, etc. Para cada varivel aleatria (ou conjunto de variveis aleatrias)
possvel encontrar uma funo que descreva a distribuio de probabilidades para a referida
varivel (ou conjunto de variveis), dita funo densidade de probabilidade [7]. Esta funo
densidade, fdp ou pdf (probability density function) uma funo no negativa que representa a
distribuio de probabilidade da varivel aleatria contnua. Normalmente esta representada em
minsculas por

[2].

Posteriormente, necessrio obter a funo distribuio acumulada (tambm denominada de funo


distribuio, fda ou cdf - cumulative distribution function). a funo que devolve a probabilidade
de uma varivel aleatria ser inferior ou igual varivel independente ou vi (incgnita
funo

de uma

) de uma funo [2].

Apresenta-se de seguida um exemplo retirado da bibliografia de Kececioglu [2] que tem como
objectivo mostrar todo o percurso necessrio para chegar fiabilidade de um bem, a partir de um
conjunto de dados.
A varivel aleatria em anlise

tempo, em horas, de funcionamento sem falha de um

determinado bem.
Neste exemplo foram recolhidas

observaes, que se encontram na tabela seguinte:

Tabela 1 - Amostra de dados do exemplo 1 [2]

Identificao
da falha
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

Tempo at
falha
(horas)
1,2
1,5
2,8
4,9
6,8
7
12,1
13,7
15,1
15,2
23,9
24,3
25,1
35,8
38,9
47,9
48,9

Identificao Tempo at Identificao


da falha
falha (horas)
da falha
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34

49,3
53,2
55,6
62,7
72,4
73,6
76,8
83,8
95,1
97,9
99,6
102,8
108,5
128,7
133,6
144,1
147,6

35
36
37
38
39
40
41
42
43
44
45
46
47
48
49

Tempo at
falha
(horas)
150,6
151,6
152,6
164,2
166,8
178,6
185,21
187,1
203
204,3
229,5
233,1
254,1
291,7
304,4

Perante um conjunto de observaes , um primeiro passo consiste em fazer uma anlise preliminar
dos dados. Usualmente, este tipo de estudo apoiado fortemente por uma componente
computacional, que vai desde as representaes grficas ao clculo de medidas descritivas. Uma
vez que se pretende chegar expresso da fiabilidade, e esta determinada a partir de um modelo
de probabilidade, grficos como histogramas ou caule e folhas mostram como a distribuio dos
dados amostrais. O histograma no representa os valores

per si mas sim a quantidade de vezes

que eles constam no intervalo representado (frequncia acumulada). Cada barra do histograma
representa a frequncia acumulada dividida pelo tamanho da amostra

(frequncia relativa).

Figura 2 - Histograma do exemplo 1

O resumo das estatsticas amostrais tambm importante quando se faz uma anlise preliminar de
dados. Atravs das medidas de localizao como a mdia e quartis, possvel ter uma ideia sobre a
distribuio dos dados; atravs de medidas de disperso como o desvio padro ou amplitude
interquartil. Usualmente este output est disponvel na maioria dos programas informticos do tema.

Figura 3 - Output do Geogebra da amostra do exemplo 1

Uma vez calculados os extremos e quartis de uma amostra, possvel representar graficamente a
amostra no diagrama de extremos e quartis ou boxplot. Atravs do boxplot, possvel identificar e
classificar outliers (valores que se destacam da tendncia da amostra). Esta identificao
extremamente importante pois muitas vezes trata-se de erros e a sua permanncia na amostra pode
levar rejeio de um modelo de probabilidade adequado.

Figura 4 - Boxplot dos dados da amostra do exemplo 1

Aps a anlise dos grficos, pode ver-se h uma tendncia de decaimento na frequncia medida
que o tempo de funcionamento aumenta, sugerindo uma distribuio exponencial. Este modelo ser
apresentado de forma mais detalhada no captulo 3, neste momento servir como exemplo para a
obteno da fiabilidade de um bem.
Apresenta-se ento a expresso da fdp da distribuio exponencial:
(2.1)
Verifica-se na Figura 5 a representao grfica da funo distribuio de probabilidade de falha de
uma distribuio exponencial:

Figura 5 Fdp de uma distribuio exponencial.

A expresso da funo distribuio acumulada obtm-se integrando a funo densidade de


probabilidade da distribuio escolhida:

(2.2)

A representao grfica da funo distribuio acumulada pode ser verificada na Figura 6 e


interessante referir que a assimptota em

representa no eixo das ordenadas representa o

mximo que a funo de probabilidade poder atingir (1 ou 100%):

10

Figura 6 - fda da distribuio exponencial anterior.

Atravs desta funo distribuio acumulada possvel prever a falha de um determinado activo
fsico ou sistema, ou seja, j existe informao para quantificar a probabilidade de falha num
determinado instante temporal.
Usualmente, este no o resultado requerido, ou seja, mais interessante saber a fiabilidade ou a
probabilidade de sucesso a um dado instante portanto, tendo em conta que estas duas funes so
complementares, pode-se aplicar a relao seguinte:
(2.3)
Ou ainda para a distribuio exponencial,

(2.4)

11

Esta relao de complementaridade pode ser observada na Figura 7:

Figura 7 Curva da fiabilidade do modelo anterior.

Com uma leitura directa da Figura 7 obtm-se a fiabilidade de um bem num determinado instante.
Para o efeito, basta escolher o tempo pretendido no eixo das abcissas, verificar o ponto
correspondente da curva da fiabilidade e determinar qual a sua ordenada.
Este processo encontra-se exemplificado na Figura 8; escolhido o valor temporal em A, e atravs
da interseco com a curva representativa da evoluo da fiabilidade em B, obtm-se o valor de
fiabilidade em C.

12

Figura 8 - Obteno da fiabilidade de um bem.

Foi referido todo o necessrio para chegar fiabilidade comeando pela distribuio estatstica. As
operaes matemticas so relativamente simples pelo que se verifica que o mais complexo a
escolha da distribuio per si, ou seja, verificar qual das distribuies escolhidas ir conduzir a uma
curva de fiabilidade mais fidedigna em relao ao comportamento real dos dados recolhidos e
consequentemente, da populao.
Uma vez que se pretende modelar o tempo at falha, importante conhecer as distribuies de
probabilidade mais usuais em fiabilidade pelo que sero abordadas no seguinte captulo.

13

3 Distribuies Estatsticas em Fiabilidade

As distribuies que iro ser alvo de anlise tm capacidades diferentes de representar um modelo,
diferindo nas suas medidas de disperso, localizao e forma. Quanto s medidas de localizao,
salienta-se a mdia (aritmtica) do tempo at falha obtida pela expresso:

(3.1)

Quanto s medidas de disperso, so normalmente representadas pelo desvio padro que fornece a
informao de quanto uma amostra est concentrada em relao mdia. Um desvio padro
diminuto transparece que os dados esto concentrados em torno da mdia e por consequente, um
desvio padro elevado refere que a amostra est dispersa relativamente a esta. Ainda relativamente
ao desvio padro, relevante referir que existe o desvio padro

e o desvio padro corrigido

(3.2)

(3.3)

A diferena de utilizao destes dois desvios padro apresentados consiste no seguinte; o desvio
padro tout court normalmente utilizado em conjuntos de dados com elevada ocorrncia e o
desvio padro corrigido deve ser utilizado quando no esto disponveis volumes elevados de
dados.

14

ainda importante referir que em estatstica, comum utilizar maisculas para a populao e
minsculas para a amostra. O desvio padro populacional
amostra atravs do estimador

pode ser estimado com base numa

(3.4)

Ao contrrio da nomenclatura em estatstica, quando o desvio padro referido no mbito da


fiabilidade, a notao mais frequente na literatura

para o desvio padro corrigido. Tendo em

conta que o tema desta tese precisamente a fiabilidade, ser esta nomenclatura que ir ser
adoptada. Concluindo, a expresso que ser assumida para o desvio padro corrigido (estimador) da
amostra :

(3.5)

Com o mesmo valor de mdia e desvio padro, podem obter-se distribuies completamente
distintas. Isto deve-se ao facto de existirem parmetros de forma. Existem mais medidas,
nomeadamente medidas de escala e iro ser referidas mais frente no seu devido contexto.
Vo ser apresentadas de seguida as distribuies estatsticas mais frequentemente usadas em
fiabilidade, nomeadamente a distribuio normal, lognormal, exponencial, e Weibull. Ir ser
introduzido para cada um destes modelos a influncia das medidas supra referidas, apresentar-se- a
respectiva expresso correspondente funo densidade de probabilidade, a sua representao
grfica, a fiabilidade associada e algumas outras caractersticas.

15

3.1 - Distribuio Normal

A distribuio normal ou curva de Gauss a distribuio mais utilizada em estatstica. Esta


distribuio foi apresentada por Carl Friedrich Gauss (1777-1885), considerado por muitos uma das
mentes mais brilhantes de todos os tempos [8]. A distribuio graficamente representada por uma
curva em forma Gaussiana (ou de sino) e simtrica relativamente mdia. Esta distribuio
biparamtrica e a sua funo densidade de probabilidade (de falha) descrita por:

(3.6)

Dada a sua natureza, esta distribuio caracterstica de bens que avariam em torno de um valor,
sendo a sua disperso simtrica em relao ao mesmo. Este o caso, por exemplo, de lmpadas cuja
durao normalmente conhecida, podendo falhar algumas horas antes ou depois. Pode se ler no
site oficial da Comisso Europeia o seguinte texto:
O tempo de vida de uma lmpada corresponde ao perodo durante o qual a mesma funciona
correctamente e expresso em horas. Considera-se que, em mdia, uma lmpada utilizada 1000
horas por ano, ou seja, 3 horas por dia. Uma lmpada pode durar entre 1000 horas, no caso das
lmpadas incandescentes tradicionais, a 15 000 horas, no caso das melhores lmpadas
fluorescentes compactas e das lmpadas LED. () Uma lmpada que dura mais tambm uma
lmpada que tem de ser substituda menos vezes, um aspecto a ter em conta quando se compara o
preo das vrias alternativas. [9]
O valor de 1000 e 15000 horas provm de estimativas cuja distribuio possivelmente a
distribuio normal. fundamental a noo de compara o preo das vrias alternativas pois
como se referiu anteriormente, o que se pretende com fiabilidade precisamente a reduo de
custos.
Os dois parmetros que caracterizam a distribuio normal so a mdia e o desvio padro. Pode-se
observar nas Figuras 9 e 11 a influncia dos parmetros na funo densidade de probabilidade;

16

quanto menor for o desvio padro, ou seja, quanto menor for a variao entre os valores medidos,
mais estreita e elevada se torna a curva.

Figura 9 - Distribuio normal com

variando .

Observe-se na Figura 10 o efeito da variao do desvio padro na fiabilidade associada a esta


funo distribuio de probabilidade obtida pela equao (2.4):

Figura 10 Fiabilidade provinda da distribuio normal com

variando

17

Verifica-se que a variao do desvio padro resulta numa variao mais ou menos abrupta da
fiabilidade do bem estudado. Isto quer dizer que vai existir maior concentrao de ocorrncias de
avarias em torno da mdia. Um bem caracterizado por um desvio padro mais reduzido vai
significar que os custos de substituio de componentes avariados iro estar concentrados num
espao temporal mais curto. Observe-se agora o efeito da variao da mdia:

Figura 11 - Distribuio normal com

variando .

A distribuio mantm uma forma idntica mas desloca-se no sentido positivo das abcissas com o
aumento da mdia. Observe-se agora a variao de fiabilidade associada:

Figura 12 - Fiabilidade provinda da distribuio normal com

variando

18

A curva da fiabilidade tambm mantm a sua forma, sofrendo uma deslocao no sentido do eixo
das abcissas. Em termos fiabilsticos, significa que os tempos de avarias vo ocorrer mais tarde
(com o aumento da mdia) no seu intervalo temporal. Pode afirmar-se ento que em termos
fiabilsticos, desejvel obter uma mdia mais elevada.

Existe uma simplificao da distribuio normal que facilita a obteno de probabilidades


requeridas. Aplicando uma mudana de varivel
consegue-se que a distribuio tenha mdia igual a

como se pode observar na equao (3.7),


e desvio padro igual a 1. A distribuio

obtida por esta mudana de varivel chama-se de distribuio normal padronizada ou reduzida.

(3.7)

A distribuio normal padronizada tem portanto o seguinte aspecto:

Figura 13 - Distribuio normal padronizada

Como a curva normal representa a probabilidade de um evento, a sua rea total igual a 1. A
probabilidade de um determinado evento ocorrer a rea esquerda desse valor na distribuio
normal. Concretizando no exemplo da Figura 13, a probabilidade do valor 1 ocorrer igual rea
19

sombreada representada a azul. Utilizando os valores da distribuio a vermelho tracejado do


exemplo que consta da Figura 11

Consegue-se assim obter o valor de

e aplicando a mudana de varivel, obtm-se:

para cada valor que se pretenda saber a probabilidade

associada. Foram criadas tabelas que devolvem a probabilidade de um determinado valor de


(Apndice A). Para qualquer valor de t, existe um valor de
Apndice A a probabilidade de t ocorrer. Para

associado que ir devolver na tabela do

Cruza-se a primeira coluna da tabela do apndice A, com a segunda coluna (que diz respeito
primeira casa decimal de
probabilidade de

que igual a ) obtm-se um valor de 0,8413. Isto quer dizer que a

ocorrer de

, ou melhor:

20

3.2 - Distribuio Lognormal

A distribuio lognormal aparece na literatura tendo sido considerada inicialmente em 1879 por
Francis Galton. Apenas em 1930 foi considerada por Gibrat como sendo um pilar para a
aleatoriedade [10]. A distribuio lognormal graficamente representada por uma curva em forma
de lomba. Sendo assimtrica, a distribuio lognormal no se adequa bem a bens que avariam em
torno de um valor (ao contrrio da distribuio normal). As caractersticas desta curva auferem-lhe
boas capacidades de modelar bens cuja taxa de avarias vai aumentando sempre ao longo do tempo
de utilizao, como por exemplo, fadiga de equipamentos mecnicos.

Esta distribuio biparamtrica e a sua funo densidade de probabilidade (de falha) descrita
por:

(3.8)

Pode observar-se nas Figuras 14 e 16 como a funo densidade probabilidade da distribuio


lognormal se altera com a variao destes dois parmetros; o logaritmo do desvio padro representa
a forma que a distribuio vai tomar:

21

Figura 14 - Distribuio lognormal com

variando .

Observe-se a influncia do desvio padro na curva da fiabilidade representado na Figura 15:

Figura 15 - Fiabilidade provinda da distribuio lognormal com

variando

Quanto menor for o desvio padro mais a curva se aproxima da vertical. A curva obtm maior
declive com valores mais elevados do desvio padro. No que diz respeito fiabilidade e segundo o
que foi referido, desejvel que o desvio padro seja mais diminuto (idilicamente aspira-se a que a
curva da fiabilidade seja constante e igual a 1).
22

No que diz respeito mdia, verifica-se que quanto menor o logaritmo da mdia do tempo at
falha, mais estreita e elevada se torna a curva, sendo um factor de escala.

Figura 16 - Distribuio lognormal com

variando .

Observe-se a influncia deste parmetro na curva da fiabilidade:

Figura 17 - Fiabilidade provinda da distribuio lognormal com

variando

Verifica-se que a mdia no afecta a forma da curva mas sim a sua escala. Quanto maior o valor da
mdia, mais concava vai ser a curva da fiabilidade e menos interessante ser a curva da fiabilidade
(em termos de fiabilidade de bens).

23

3.3 - Distribuio Exponencial

A distribuio exponencial considerada das mais simples em termos matemticos. A funo


densidade de probabilidade sempre decrescente, monoparamtrica e a sua funo densidade de
probabilidade (de falha) dada por:

(3.9)

(3.10)

Esta distribuio das mais aplicadas em estudos de fiabilidade, uma vez que representativa de
bens em vida til, pelo que em muitos estudos se assume este pressuposto e se ajustam os dados
cegamente a esta distribuio [1].
Esta curva representa o tempo at falha de determinados bens com uma taxa de avarias constante
ao longo do seu tempo operacional.

24

Pode observar-se na Figura 18 que a interseco da distribuio com o eixo das ordenadas ocorre no
valor de :

Figura 18 - Distribuio exponencial variando .

Quanto influncia do valor de

na fiabilidade, pode ser observado na Figura 19:

Figura 19 - Fiabilidade provinda da distribuio exponencial variando

No caso da distribuio exponencial, o valor de


que prefervel um

influncia a escala da curva da fiabilidade sendo

elevado, o que significa que a fiabilidade decresce mais lentamente com o

tempo.
25

3.4 - Distribuio de Weibull

A distribuio de Weibull foi utilizada pela primeira vez por Waloddi Weibull em 1939 nos seus
estudos de resistncia de materiais. Esta distribuio muito utilizada em anlise de fiabilidade por
ser capaz de se adaptar grande maioria das situaes prticas devido sua flexibilidade, bastando
fazer variar algum dos seus parmetros. Por isto mesmo consegue modelar uma grande diversidade
de tipos de dados para variados tempos de vida [11].
Esta distribuio triparamtrica e os seus parmetros so ,

que representam respetivamente

o fator de forma, o fator de localizao e o fator de escala, tambm designado por vida
caracterstica. Esta distribuio expressa pela seguinte funo densidade de probabilidade (de
falha):

(3.11)

Pode observar-se na Figura 20 os seguintes comportamentos do parmetro , factor de forma:


- Para
-

: A funo decrescente e no tem moda.


a distribuio transforma-se n distribuio exponencial.
: A funo cresce at sua moda e decresce at chegar ao valor nulo.

26

Figura 20 - Distribuio de Weibull de trs parmetros com

Observe-se agora a influncia da variao de

na curva da fiabilidade:

Figura 21 - Fiabilidade provinda da distribuio de Weibull com

Para um

variando .

variando .

mais elevado, a fiabilidade de um bem tem um decrscimo mais suave no incio de

operao e abrupto de seguida. Para um valor de

mais pequeno, a fiabilidade muito decrescente

logo no incio de operao mas com tendncia a suavizar este decrscimo com o tempo.

27

O parmetro

o factor de posio ou localizao (Figura 22). Quanto maior for este parmetro,

mais a funo densidade de probabilidade se desloca para o sentido positivo do eixo das abcissas,
mantendo a sua forma inaltervel.

Figura 22 - Distribuio de Weibull de trs parmetros com

variando .

Pode se observar este comportamento na curva da fiabilidade:

Figura 23 - Fiabilidade provinda da distribuio de Weibull com

variando .

28

Tambm nesta representao se observa que o parmetro


valor de

se trata de um factor de localizao. Um

mais elevado indica que at um determinado tempo de operao, a fiabilidade de um bem

no se altera e se mantm mxima.


O valor de

condiciona a escala da funo. Quanto maior for este parmetro, mais a funo tender

a planificar-se, como se pode observar na Figura 24.

Figura 24 - Distribuio de Weibull de trs parmetros com

A influncia do valor de

variando .

pode ser verificada na Figura seguinte:

Figura 25 - Fiabilidade provinda da distribuio de Weibull com

variando .

29

seguro referir que o parmetro


valores mais elevados de
fiabilidade, um

tambm se refere escala da funo fiabilidade, sendo que para

a funo toma uma forma mais alargada. No que diz respeito a

mais elevado demonstra um comportamento mais suave no decrscimo da

fiabilidade.
Observando a consequncia dos trs parmetros da distribuio de Weibull na curva da fiabilidade,
parece seguro referir que, pelo menos isoladamente, prefervel que os trs parmetros tenham
valores elevados.

Quando na posse de dados de tempo at falha de um determinado bem, o grande desafio saber
qual das distribuies a que melhor se ajusta. Desta forma, existem alguns testes que se podem
realizar no sentido de aferir qual a distribuio que mais se adequa a um conjunto de dados de
tempos at falha.

30

4 Caracterizao da distribuio

Quando se pretende verificar se uma determinada distribuio ou no adequada para estudo


requerido, necessrio saber quais os parmetros que a definem. Atravs de estimadores (funo
utilizada para estimar parmetros) sero obtidos os valores estimados para cada um dos parmetros
das distribuies. A este estudo chama-se estimao de parmetros. O objectivo deste estudo de
obter um valor numrico para os parmetros desconhecidos de tal forma que esses valores sejam
representativos dos parmetros da populao. Assim sendo, os parmetros da populao sero
estimados atravs dos estimadores amostrais.
Existem vrios mtodos para o fazer, sendo que sero estudados os trs que Kececioglu, Dimitri [2]
categoriza como mais relevantes nesta rea: o mtodo dos mnimos quadrados, o mtodo dos
momentos e o mtodo da mxima verosimilhana.
Para facilitar a visualizao da estimao de parmetros, ser utilizado um exemplo que consta na
literatura do mesmo autor e que ser ilustrado pela folha de Excel criada para o efeito cuja amostra
se representa de seguida. O exemplo 2 retrata uma amostra de 24 transstores que se testaram at
falha, sendo que o tempo at falha (em horas) vai ser a nossa varivel aleatria.

Tabela 2 - Amostra de dados do exemplo 2 [2].

Tempo at
falha (horas)
1880 920 260
2130 930 350
530 780 420
580 820 1050
680 840 1060
440 710 1270
480 740 1340
480 1370 1070

Antes da descrio dos mtodos de estimao de parmetros, apresentam-se alguns passos do


estudo descritivo.
31

Numa primeira fase, os dados so ordenados e numerados:

Tabela 3 - Amostra de dados do exemplo 2 ordenada e numerada.

Designao
da falha
1
2
3
4
5
6
7
8

Tempo at
falha (horas)
260
350
420
440
480
480
530
580

Designao
da falha
9
10
11
12
13
14
15
16

Tempo at
falha (horas)
680
710
740
780
820
840
920
930

Designao
da falha
17
18
19
20
21
22
23
24

Tempo at
falha (horas)
1050
1060
1070
1270
1340
1370
1880
2130

De seguida, sero obtidos alguns valores, comeando pelo tamanho da amostra,

e pela

mdia da amostra como indicado na equao (3.1):

tambm necessrio obter o desvio padro como referido na equao (3.5):

o valor mximo da amostra e

o valor mnimo da mesma.

Nas seguintes seces sero abordados os trs mtodos de estimao de parmetros propostos
inicialmente.

32

4.1 - Mtodo dos mnimos quadrados

O mtodo dos mnimos quadrados (mmq) consiste em minimizar o quadrado da distncia (segundo
uma determinada direco) de uma recta aos pontos representativos da curva que se pretende
caracterizar. Esta distncia entre a recta e cada ponto chamada de resduo. Tambm apelidado de
regresso linear, este mtodo pode ser aplicada em

ou em . Como o processo semelhante em

cada uma delas, apenas ser apresentada a regresso em . No exemplo representado na Figura 26
esto representados 4 pontos. Observando a figura, possvel verificar que quanto menor a
distncia na vertical entre a recta estimada representada e os pontos (A, B, C e D), ou melhor,
quanto menor forem os resduos em y, mais a equao da recta se ajusta ao comportamento que os
pontos descrevem. A recta que se encontra representada estimada a partir da amostra e aquela
para qual a soma dos resduos ao quadrado mnima.

Figura 26 - Regresso linear em y.

33

A equao da recta real (desconhecida) pode ser representada por:

(4.1)

Para obter os estimadores, pretende-se que a soma das distncias na vertical entre os pontos
representados e a recta seja mnima, ou seja:

(4.2)

Onde

corresponde ao valor estimado de

(inclinao da recta) e

o valor estimado

(onde a

recta cruza o eixo das ordenadas).


A soma a minimizar passa a ser:

(4.3)

Finalmente, para obter os estimadores basta derivar a equao (4.3) em ordem a

e a

respectivamente e igualar estas derivadas parciais ao valor nulo. Resolvendo este sistema de
equaes obtm-se os seguintes estimadores (para uma regresso em y):

(4.4)

34

(4.5)

importante introduzir o valor de

obtidos atravs dos ranks medianos. O valor do rank

mediano para a -gsima falha numa amostra de


ocorrer antes do perodo temporal
ter na altura

testes tal que a probabilidade da -gsima falha

de 50%. o valor que a probabilidade de falha

deve

com um grau de incerteza de 50% [2].

A ttulo de exemplo, para uma amostra de 10 falhas, a tabela a seguinte:

Tabela 4 - Ranks Medianos [2][14].

Designao na
amostra

Tamanho da
amostra: N=10
50% (median rank)

1
2
3
4
5
6
7
8
9
10

0,06697
0,16226
0,25857
0,35510
0,45169
0,54831
0,64490
0,74143
0,83774
0,93303

Para simplificar o clculo dos ranks medianos, pode-se usar a aproximao de Bernard [2]:

(4.6)

Onde

a designao da falha e

o tamanho da amostra. Existem vrias tabelas com vrias

dimenses de amostra mas no exemplo 2 ir constar a equao de Bernard visto ser mais fcil de
introduzir na aplicao em Excel. Assim sendo, para o valor de

do exemplo 2,

calculado

da atravs da equao (4.6):


35

Quando se pretende estimar os parmetros da distribuio normal atravs do mtodo dos mnimos
quadrados, o valor de

dado por [2]:


(4.7)

Onde

devolve o valor de

aplicando a distribuio normal padronizada. Este valor

pode ser obtido atravs da seguinte expresso (expresso (3.6) aplicada ao valor do rank mediano da
falha):

(4.8)

Onde
medianos e

o valor do rank mediano da falha ,

o desvio padro corrigido aplicado ao conjunto de ranks medianos.

Pode agora ser fornecido o valor de

O valor de

a mdia de todos os valores de ranks

do exemplo 2:

dado por:
(4.9)

Assim sendo e seguindo o exemplo 2:

Montgomery et al. [14] chegaram s seguintes expresses dos estimadores da distribuio normal
de dois parmetros:

36

(4.10)

(4.11)

Aplicando estes estimadores ao exemplo 2:

Finalmente, possvel representar a distribuio normal com os parmetros estimados pelo mtodo
dos mnimos quadrados para o exemplo 2:

Figura 27 - Curva normal com parmetros estimados pelo mmq do exemplo 2.

37

O raciocnio idntico para as restantes distribuies estudadas. O valor de

e os respetivos

estimadores esto representados na Tabela 5.

Tabela 5 - Estimadores do mtodo dos mnimos quadrados [2][14].

Distribuio

Parmetros

Normal

Lognormal

Exponencial

Weibull

38

4.2 - Mtodo dos momentos

O mtodo dos momentos foi proposto em 1900 por Karl Pearson [20], e consiste em igualar
momentos populacionais com os respectivos momentos amostrais resolvendo o sistema de equaes
resultante. Para um determinado conjunto de dados
probabilidade :

onde

, a funo densidade de
so

parmetros que necessitam de ser

estimados.
Os primeiros

momentos amostrais so dados por:

(4.12)

Os primeiros

momentos populacionais so dados por:

(4.13)

Resolvendo a equao em simultneo para

, obtm-se os estimadores

:
(4.14)

Aplicando o mtodo anterior distribuio normal, verifica-se:


- Expresso do primeiro momento populacional:

(4.15)

- Expresso do segundo momento populacional:

(4.16)

39

- Expresso do primeiro momento amostral:

(4.17)

- Expresso do segundo momento amostral:

(4.18)

Resolvendo o sistema de equaes:

(4.19)

O resultado final :
(4.20)

(4.21)

Aplicando ao exemplo 2:

40

agora possvel observar graficamente a distribuio do exemplo 2 cujos parmetros foram


estimados pelo mtodo dos momentos:

Figura 28 - Curva normal com parmetros estimados pelo mtodo dos momentos do exemplo 2.

A distribuio de Weibull, um caso particular deste raciocnio, chegar-se- aos seguintes


estimadores:

(4.22)

(4.23)

No possvel obter directamente os parmetros estimados atravs destas equaes. Teimouri et al.
(1994) [11] e Gaeddert, Joseph D. (2005) [16] referem sobre esta impossibilidade que a estimao
de parmetros da distribuio de Weibull pelo mtodo dos momentos deve ser feita atravs de
anlise computacional, alm do que estes estimadores no sero eficientes.
41

Kececioglu, Dimitri, [2] refere uma possvel soluo recorrendo ao coeficiente de variao ou
(medida de disperso relativa) definido pela seguinte relao entre o desvio padro e a mdia:

(4.24)

O valor de

j foram calculados para o exemplo 2. Atravs da tabela presente no Apndice B,

obtm-se o valor de

para o

calculado. Calcula-se facilmente o valor de :

(4.25)

Com

(4.26)

Os restantes parmetros das distribuies seguem o mesmo mtodo da normal e os seus parmetros
esto descritos na Tabela 6.
Tabela 6 - Estimadores do mtodo dos momentos [2] [14].

Distribuio

Estimadores

Normal

Lognormal

Exponencial

Weibull

42

4.3 - Mtodo da mxima verosimilhana

Para explicar o raciocnio que est por trs do mtodo da mxima verosimilhana, foi decidido que
fosse introduzido com o seguinte exemplo: Se for pedido para escolher de um conjunto de valores
de solues

o valor que mais se assemelhe com a mdia do conjunto

, a escolha reverteria para o valor

dadas as diferentes grandezas. desta forma que,

atravs de um modelo matemtico, o mtodo da mxima verosimilhana (mmv) trata de estimar os


respectivos parmetros.
Para um determinado conjunto de dados
onde

so

, a funo densidade de probabilidade :


parmetros que necessitam de ser estimados.

A funo do mtodo de mxima verosimilhana dada por:

(4.27)

O logaritmo da funo

dada por:

(4.28)

As solues dos parmetros

so dadas pelas

equaes:

com

.
(4.29)

O objectivo desta operao o de maximizar a funo

para obter a estimao mais aproximada do

parmetro real.
Para obter os parmetros das vrias distribuies em estudo, substitui-se

pela funo

densidade de probabilidade de cada uma das distribuies.

43

Aplicando o supra mencionado distribuio normal:

(4.30)

(4.31)

Retiram-se as derivadas parciais e igualam-se a zero para obter os valores estimados dos dois
parmetros:

(4.32)

Ou

(4.33)

(4.34)

Finalmente:

(4.35)

44

(4.36)

Verifica-se que o mtodo da mxima verosimilhana e o mtodo dos momentos chegam mesma
expresso para a distribuio normal e portanto, iro assumir os mesmos valores:

Figura 29 - Curva normal com parmetros estimados pelo mmv.

45

Aplicando o mtodo da mxima verosimilhana s distribuies propostas, obtm-se os estimadores


que se encontram representados na Tabela 7.

Tabela 7 - Estimadores do mtodo da mxima verosimilhana [2] [14].

Distribuio

Estimadores

Normal

Lognormal

Exponencial

Weibull

* No foi encontrada a expresso correspondente para os estimadores do mtodo de mxima


verosimilhana para a distribuio de Weibull. Gourdin et al. (1994) [15] e Gaeddert, Joseph D.
(2005) [16] referem que no possvel obter uma expresso directa para os estimadores de mxima
verosimilhana para a distribuio de Weibull. O mtodo a adoptar iterativo e consta na literatura
referida.

Montgomery et al. [14] concluram que no que diz respeito ao mtodo dos mnimos quadrados,
pode ser referido que um mtodo bastante eficaz para funes que podem ser linearizadas pois os
seus clculos so simples. Por outro lado, para algumas distribuies complexas por vezes difcil
ou at mesmo impossvel de utilizar.

46

Em relao ao mtodo dos momentos, importante referir que os estimadores so normalmente de


fcil clculo, no entanto, caso sejam pretendidos momentos mais elevados, as expresses dos
estimadores so exageradamente grandes e difceis de utilizar. Segundo Kececioglu, Dimitri [2],
este mtodo geralmente ineficiente e apenas utilizados no caso de no existirem outros
estimadores. Gaeddert, Joseph D. (2005) [16] refere que este mtodo apenas representa uma
pequena parte do total da amostra pelo que no fornece preciso no que diz respeito a distribuies
muito estreitas, ou seja, que estejam concentradas em torno de uma assimptota vertical.
Finalmente, o mtodo da mxima verosimilhana de modo geral consistente e preciso. Kumphon,
Bungon, (2012) [17] refere no seu estudo que este mtodo pode apresentar alguns problemas em
distribuies triparamtricas. Nestas ltimas, o mtodo da mxima verosimilhana no adequado
quando as variveis representativas do factor de forma assumem o valor exacto onde a forma se
altera, por exemplo,

para a distribuio de Weibull.

Aps escolher o mtodo de estimao de parmetros pretendido, as expresses das distribuies


encontram-se disponveis. J possvel realizar testes de ajuste a todas as distribuies enunciadas
para validar se de facto se ajustam aos dados da amostra. No prximo captulo apresentam-se quatro
tipos de testes de ajuste: o teste de ajuste Qui-Quadrado, o de Kolmogorov-Smirnov, o de
Anderson-Darling e finalmente o teste de ajuste de Cramer-Von Mises.

47

5 Seleco da distribuio

Depois de obter uma amostra de tempos at falha, recomendado construir um histograma com
estes dados. Verifica-se no histograma representado na figura 30, que existe uma maior tendncia
para que a frequncia seja mais elevada ao centro e mais diminuta nas laterais. Este comportamento
semelhante distribuio normal ou talvez distribuio de Weibull. Dificilmente este
histograma seria modelado por uma distribuio exponencial visto que a sua representao grfica
muito diferente.

Figura 30 - Histograma de dados agrupados

48

Estas so opinies que se podem tecer sobre o histograma da Figura 30. importante referir que os
modelos das distribuies so tericos e tenta-se ajustar realidade mas em casos reais muito
difcil que estes dois coincidam. Pode observar-se graficamente na Figura 31 um bom ajustamento
dos dados da amostra distribuio escolhida.

Figura 31 Exemplo de uma boa adequao da funo aos dados.

Analogamente, na Figura 32 verifica-se que a a mesma distribuio no parece ser adequada para o
conjunto de dados de outra amostra. O histograma desta figura talvez pudesse ser representado por
um modelo no simtrico, como a distribuio lognormal.

Figura 32 Exemplo de uma m adequao da funo aos dados.

49

A anlise feita anteriormente foi baseada apenas numa inspeco grfica dos dados e numa amostra
em concreto. Para poder generalizar este resultado, isto , atribuir uma confiana ao facto de decidir
se uma distribuio se adequa ou no aos nossos dados, necessrio recorrer inferncia estatstica.
Define-se inferncia estatstica como uma vertente da estatstica cujo propsito generalizar para a
populao os resultados de uma determinada amostra. , no entanto, necessrio quantificar a
incerteza associada a estas afirmaes. Tanto a estimao de parmetros como os testes de hipteses
fazem parte da inferncia estatstica [14]. Os testes de hipteses podem ser paramtricos ou no
paramtricos consoante o que se pretende testar. Os testes paramtricos so utilizados para testar
parmetros propriamente ditos, por exemplo, se quisermos testar a hiptese de um fabricante que
afirma que o seu produto dura, em mdia, mais de 5000 horas. J os testes no paramtricos
permitem testar outro tipo de hipteses que no apenas sobre parmetros populacionais, ou seja,
consideraes que se pretendem tecer sobre o comportamento de um determinado objecto alvo.
Dentro dos testes no paramtricos existem vrios testes, como por exemplo testes de aleatoriedade,
independncia, homogeneidade, ajustamento, etc. Uma vez que o objectivo deste trabalho
determinar a fiabilidade de um bem a partir de um modelo de probabilidade terico, sero estudados
os testes de ajuste, uma vez que o objectivo escolher um modelo a partir de um conjunto de dados.
Estes testes servem para testar a hiptese de que uma determinada amostra aleatria foi extrada de
uma populao que segue uma distribuio especificada. Na aplicao Excel desenvolvida foram
implementados os testes de Qui-Quadrado, Kolmogorov-Smirnov, Anderson-Darling e Cramer-Von
Mises que Abd-El Fattah [3] refere serem os mais relevantes para validar o ajustamento de
distribuies estatsticas.
Os testes esto baseados na teoria de teste de hipteses desenvolvida por Jerzy Neyman e Egon
Pearson [18] [21] e ajudam a determinar se uma hiptese, chamada nula -

ou no rejeitada. O

teste desenvolvido admitindo que a hiptese nula verdadeira e, uma vez que as hipteses so
complementares, a rejeio de

tem como consequncia aceitar

Para exemplificar, admitindo que pretendido verificar se a distribuio normal pode ser usada para
modelar tempos at falha. Seja T o tempo at falha de uma populao de transstores, formulam
se as seguintes hipteses:

50

T tem distribuio normal com um grau de incerteza de 5%


T no tem distribuio normal com um grau de incerteza de 5%

Para construir o histograma, ainda necessrio agrupar os dados por classes da seguinte forma:
- O nmero ideal de intervalos ou classes

dado pela regra de Sturges (existem outras, tais

como a regra do quadrado mas optou-se por detalhar a regra de Sturges):


(5.1)
Para o caso especfico do exemplo que tem vindo a ser seguido, vir:

- A amplitude da classe

obtida por:

(5.2)

Onde
(5.3)
Assim sendo,

- Os valores de incio das classes so determinados comeando pelo valor mnimo da amostra e
somando a amplitude de classe. Os valores de fim de classe so obtidos adicionando ao valor de
incio de classe a quantidade

onde

a escala mnima da nossa leitura. O limite inferior


51

de cada classe obtido subtraindo a quantidade

ao valor de incio de classe e o limite superior

de cada classe calculado somando a quantidade

ao valor de fim de classe. Esta ltima

operao serve para englobar os valores extremos.

Chegar-se- a uma quantidade de classes


Classe 1:

descritas por:
;

Classe2:

Classe k:

Ou
Como se devem estender as classes ao domnio das
distribuies, iro ser necessrios acertos. Quando se verificar a frequncia esperada, por exemplo,
para a normal, o limite inferior da primeira classe deve ser igual a

e a ltima igual a

Ou seja,
Classe 1:
Classe 2:

;
;

;
Classe 6:
- Para saber a frequncia de observao por classe necessrio contar todos os valores da nossa
amostra que esto compreendidos entre o limite inferior e o limite superior de cada classe. Caso o
valor de frequncia de observao numa classe seja inferior a 5, necessrio agrupar esta classe
com a classe anterior somando os valores de frequncias de observao e por conseguinte
52

aumentando a amplitude da classe. Se ainda assim esta soma for inferior a 5, necessrio continuar
a agrupar classes at obter um valor de observaes igual ou superior a 5. Esta foi a tarefa mais
complicada de modelar na aplicao de Excel e foi necessrio recorrer a Visual Basic para a
realizar.

Tabela 8 Frequncia observada, Intervalo considerado e agrupamento de classes do exemplo 2.

Intervalo
considerado
]259,5;571,5]
]571,5;883,5]
]883,5;1195,5]
]1195,5;1507,5]
]1507,5;1819,5]
]1819,5;2131,5]

- A frequncia esperada

Frequncia
observada
Oi
7
7

5
3
0
2

Frequncia
observada
Oi
] 259,5;571,5]
7
]571,5;883,5]
7
]883,5;1195,5]
5
]1195,5;2131,5]
5
Intervalo
considerado

, ou seja, a terica obtm-se pela expresso:


(5.4)

Onde

a probabilidade terica de cada uma das classes assumindo que

verdadeira,

logo, depende do modelo que est na hiptese. Apresentam-se na Tabela 9 as vrias expresses de
frequncia esperada para cada distribuio:

53

Tabela 9 - Expresso da frequncia esperada para cada distribuio[2].

Distribuio

expresso de

Normal
Lognormal
Exponencial
Weibull

Aplicando esta tabela ao exemplo 2:


Tabela 10 - Frequncia esperada, Intervalo considerado e agrupamento de classes para o exemplo 2.

Frequncia
esperada
Ei
6,07
]- ;571,5]
[571,5;883,5]
5,98
[883,5;1195,5]
5,96
5,90
[1195,5; [
Intervalo
considerado

Observe-se a diferena entre as duas frequncias no histograma seguinte:

Figura 33 - Histograma comparativo das frequncias estudadas.

54

Sero apresentados de seguida os testes de ajuste que iro determinar para cada distribuio (cujos
estimadores foram apresentados no captulo 4) se possvel ou no utilizar uma determinada
distribuio para modelar os tempos de vida.

5.1 - Testes de ajuste Qui-Quadrado

O teste de ajuste Qui-Quadrado foi desenvolvido por Karl Pearson e completado por Ronald Fisher
no incio do sculo XX [20]. O teste de ajuste Qui-Quadrado serve para testar a hiptese que as
observaes seguem uma determinada distribuio, discreta ou contnua, com ou sem parmetros
conhecidos. Este teste consiste na comparao da densidade com a funo distribuio de
probabilidades.
Numa primeira fase necessrio que seja calculado um valor observado de
que seja posteriormente comparado a um valor crtico

(Qui-quadrado) para

(Qui-quadrado crtico). Atravs desta

comparao, ser permitido afirmar que a distribuio a ser testada se ajusta (ou no) aos dados da
amostra, com um determinado nvel de confiana.

Toda a informao para aplicar o teste Qui-Quadrado est agora disponvel. Este um mtodo
sequencial [2] que se apresenta de seguida, aplicado ao exemplo 2:

- Deve ser obtida a estatstica de teste desta amostra atravs da expresso:

(5.5)

55

O valor da estatstica de teste sempre positivo ou nulo. Caso seja nulo, significa que existe um
ajuste perfeito. Analogamente, quanto maior o valor de

, maior ser a sua diferena e menos a

distribuio escolhida se adequa nossa amostra. Neste caso, deve ser estabelecer um limite de
para que seja possvel afirmar que a distribuio escolhida se adequa ou no amostra. Este valor
obtido a partir da tabela de valores crticos de Qui quadrado (Tabela 11), cujas entradas so
(nvel de risco) e o grau de liberdade , obtido por:
(5.6)
o nmero de parmetros estimados da amostra e

o nmero de classes.

No exemplo 2, os parmetros representados so o desvio padro e a mdia, logo,

Tabela 11 Constantes crticas Qui Quadrado [2]

n
1
2
3
4
5

0,005
7,879
10,597
12,838
14,860
16,750

0,01
6,635
9,210
11,345
13,277
15,086

0,025
5,024
7,378
9,348
11,143
12,833

Nvel de incerteza (%)

0,05
3,841
5,991
7,815
9,488
11,070

0,1
2,706
4,605
6,251
7,779
9,236

0,9
0,016
0,211
0,584
1,064
1,610

0,95
0,004
0,103
0,352
0,711
1,145

0,975
0,001
0,051
0,216
0,484
0,831

0,99
0,000
0,020
0,115
0,297
0,554

0,995
0,000
0,010
0,072
0,207
0,412

Finalmente, o valor crtico :

Se

, no se rejeita a hiptese que a distribuio escolhida se ajusta nossa amostra, com

uma percentagem de 1- de nvel de confiana.

56

No exemplo em questo,

, logo,

no rejeitada e portanto no existe

evidncia de que a distribuio normal no se adequa a este conjunto de dados.


Todo este processo est automatizado na aplicao de Excel e apresenta-se na Figura 34:

Figura 34 - Teste de Qui Quadrado na aplicao de Excel

O teste de Qui Quadrado um teste simples de utilizar pelo que comum ver a sua aplicao. No
recomendada a aplicao do teste Qui Quadrado para amostras inferiores a 25 testes. Isto deve-se ao
facto de que a amostra deve ser tratada em classes de pelo menos 5 observaes, caso contrrio, ir
resultar na perda de informao valiosa [3].

57

5.2 - Teste de Ajuste Kolmogorov-Smirnov

O teste de ajuste de Kolmogorov-Smirnov consiste em encontrar a distncia mxima entre a funo


distribuio acumulada esperada e a observada. Para tal, necessrio obter uma distncia mxima
entre as duas

. Posteriormente, ir ser confrontada com um valor terico

. S assim,

atravs deste teste possvel afirmar que a distribuio que est a ser testada se ajusta nossa
amostra, com o nvel de confiana requerido.
Adverte-se que necessrio ter cuidado com os outliers pois podem levar a concluses erradas. Esta
uma ressalva importante pois est a ser utilizada uma estatstica de teste que utiliza um mximo.
Ainda seguindo o exemplo 2, assumindo as mesmas hipteses formuladas

, o teste de ajuste

de Kolmogorov-Smirnov (denominado de agora em diante de teste de ajuste K-S) pode ser obtido
atravs da seguinte sequncia [2]:
- Aps cada falha, determinar o nmero de falhas
deve-se dividir essa quantidade pelo nmero de falhas

observadas anteriormente. Posteriormente,


. Cada um destes valores corresponde

probabilidade observada do teste de ajuste de KS:

(5.7)

Onde

o nmero total de observaes no instante .

- Calcular a probabilidade esperada atravs da expresso da distribuio a ser testada para cada
falha:

(ver subcaptulo anterior para obter as expresses matemticas correspondentes). Da

Tabela 9:

- Determinar para cada falha a diferena absoluta entre as duas quantidades supra mencionadas:

58

(5.8)

- Depois de determinar todos as distncias, determina-se o valor


valor absoluto

que no presente caso exemplificativo ser a

correspondente ao mximo
(Figura 35).

Figura 35 - Distncias de KS para o exemplo 2.

- Determinar atravs da tabela de K-S (Apndice C) qual o valor crtico

que no deve ser

ultrapassado pelo valor

e com o desejado

entrando com o valor da dimenso da amostra

nvel de confiana .
- Se o valor
rejeitado

for inferior ao valor

diz-se que segundo o teste de ajuste de K-S no

59

No exemplo 2,

, logo,

no rejeitada e portanto no existe

evidncia de que a distribuio normal no se adequa a este conjunto de dados

Figura 36 - Teste de Kolmogorov Smirnov na aplicao de Excel

60

5.3 - Teste de ajuste Anderson-Darling e Cramer-Von Mises

Existem mais testes de ajuste baseados no mesmo princpio de comparao entre valores esperados
e valores observados, como por exemplo os testes de ajuste de Anderson-Darling (AD) e CramerVon Mises (CVM). A diferena entre estes dois testes reside na expresso do teste estatstico e
consequentemente nos respectivos valores tericos de referncia. Estes dois testes apresentam
bastantes semelhanas e por este motivo, iro ser tratados em paralelo. Para o teste AD, o valor
crtico

e para o de CVM

Para aplicar os testes acima mencionados ao exemplo 2, deve-se proceder da seguinte forma [2]:

- Ordenar os dados para que

de uma amostra de

dados.

- Calcular o valor da probabilidade esperada como referido nos restantes testes.


- Calcular o valor observado para o teste de AD:

(5.9)

Onde

(5.10)

Por exemplo, para a linha que corresponde a

Aps calcular todos estes valores, aplica-se a equao (5.9) e obtm-se um valor observado de
.

61

Para o teste de CVM:


- Calcular o valor observado para o teste de CVM

(5.11)

Onde

(5.12)

Por exemplo, para a linha que corresponde a

Aps calcular todas estas quantidades, aplica-se a equao (5.11) obtm-se um valor observado de
.

Para colmatar o facto dos testes de AD e CVM poderem apresentar incorreces em amostras
pequenas, Stephens [21] demonstrou teoricamente e atravs de Simulao de Monte Carlo que uma
pequena alterao a estes parmetros prefervel, sendo o resultado mais fivel e renomeou os
mesmos para

. Para o teste de AD, apenas referiu que o tamanho da amostra deve ser

igual ou superior a 5. Assim, quando se verifica a notao

, entende-se que a forma de obteno

do valor observado a mesma mas parte-se de uma premissa diferente

, portanto,

no que diz respeito ao valor numrico.


Quanto ao valor de CVM, Stephens optou por transforma-lo da seguinte forma:

(5.13)

62

Para o exemplo 2,

Finalmente, pode ser referido que as hipteses formuladas podem ser rejeitadas ou no, aplicando o
teste de ajuste de AD e CVM:
Rejeita-se

se:

Rejeita-se

se:

As constantes crticas esto representadas na Tabela 12:

Tabela 12 - Constantes crticas de Anderson-Darling e Cramer-Von Mises [2].

15% 10%

5% 2,5% 1%

1,610 1,933 2,492 3,070 3,857


0,284 0,347 0,461 0,581 0,743

Como

, segundo o teste de ajuste de Anderson-Darling,

no

rejeitada e portanto no existe evidncia de que a distribuio normal no se adequa a este conjunto
de dados.
Adicionalmente, como
Mises,

, segundo o teste de ajuste de Cramer-Von

tambm no rejeitada, sem evidncia de que a distribuio normal no se adeqe a este

conjunto de dados.

63

Este raciocnio tambm se encontra na aplicao de Excel como se verifica na Figura 37:

Figura 37 - Testes de Anderson-Darling e Cramer Von-Mises na aplicao de Excel

Enquanto o teste Qui Quadrado mede a soma total do quadrado da distncia entre as duas curvas
ponderado frequncia esperada, o teste de KS analisa a distncia mxima entre as distribuies
emprica e terica. Os dois ltimos testes, de AD e CVM partem do mesmo princpio visto que
ambas integram o quadrado da distncia entre as duas funes. A diferena que o de AD difere na
ponderao desta quantidade.
interessante comparar estes testes. O teste Qui Quadrado no fivel para amostras inferiores a
25 testes tendo em conta que devem ser tratados os dados em classes de pelo menos 5 observaes.
Tirando este facto, possvel afirmar que o teste simples e fcil de aplicar e tem a vantagem de
poder ser aplicado a dados contnuos e discretos [2].
O teste de Kolmogorov-Smirnov mais eficaz que o teste Qui Quadrado. Alm de poder ser
utilizado para qualquer volume amostral (mesmo inferior a 25 amostras), as suas tabelas conseguem
ser muito precisas para determinar a validade de uma distribuio [2].
Os testes de Anderson-Darling e Cramer-Von Mises so tambm mais eficazes que o Qui
Quadrado, sendo que tambm no so influenciados negativamente por amostras reduzidas [2].

64

De um modo geral, importante referir que os testes de K-S e CVM so mais eficazes a detectar
variaes a meio da distribuio enquanto o de AD mais eficaz a salientar variaes nas
extremidades da distribuio [2].
Para no tornar a explicao dos mtodos muito densa, tem-se vindo a detalhar e explicar os testes
de ajuste com a ajuda de uma s distribuio. A aplicao de Excel realiza todos os testes de ajuste
a todas as distribuies e fornece de imediato o resultado. Para tal, basta que o utilizador coloque a
amostra que recolheu no stio marcado para o efeito, at um mximo de

por questes de

limites computacionais. Apresenta-se na Figura 38 a folha de entrada da aplicao, sendo que se o


utilizador no pretender observar todas as folhas intermdias, obter de imediato toda a informao
requerida. So-lhe apresentados os testes de ajuste que foram realizados e se a distribuio poder
ou no ser utilizada.

Figura 38 - Folha de entrada da aplicao de Excel

Deixa-se como nota que no est contemplada a estimao de parmetros na aplicao de Excel
mas de qualquer forma, para os clculos, esto a ser estimados pelo mtodo dos mnimos
quadrados.

65

5.4 - Ordenao

O teste de hipteses pela abordagem de Neyman-Pearson fornece uma resposta do tipo rejeita / no
rejeita hiptese

. Como refere Falissard, Bruno [22], no caso de se pretender uma confirmao

de um ajustamento, este mtodo suficiente e chegar-se- a uma concluso parecida com a


Tabela 13:

Tabela 13 - Tabela de decises baseada no mtodo de Neyman-Pearson.

Distribuio
Testada

Resultado
do teste

Concluso
do teste

Normal

No se rejeita

Pode ser utilizada

Lognormal

Rejeita-se

No pode ser utilizada

Exponencial No se rejeita
Weibull

Rejeita-se

Pode ser utilizada


No pode ser utilizada

Analisando a Tabela 13, observa-se que, com um nvel de significncia de 5%, existem duas
distribuies que se podem utilizar. No entanto, qual dessas distribuies a que melhor se adequa?
Para responder a esta questo, til recorrer ao indicador p-value [14]. Atravs da anlise do pvalue, possvel ordenar as distribuies (admitindo que mais que uma se candidatam a vlidas)
sabendo que se ir convergir para a mais fivel.
de salientar que o p-value, ao contrrio do que alguns autores referem, no valida a rejeio ou
aceitao das hipteses. Segundo Pandis [23], o p-value a probabilidade de chegarmos
concluso do estudo realizado quando a hiptese

verdadeira, ou ainda, segundo Keriazes [24],

a probabilidade da diferena entre dois testes ter ocorrido por acaso. Para o modelo em questo,
quanto maior o p-value, maior a evidncia para a no rejeio da distribuio assumida como
verdadeira. Keriazes ainda salienta o uso incorrecto do p-value referindo que no lgica a
abordagem de utilizar o p-value para rejeitar ou aceitar uma hiptese formulada.
66

Posto isto, pretende-se chegar a uma tabela de deciso parecida com aquela que consta na Tabela
14, onde foram retiradas as distribuies que foram invalidadas pelo mtodo anterior e adicionado o
indicador p-value:
Tabela 14 - Tabela de decises baseada no mtodo de Neyman-Pearson e no p-value.

Distribuio
Testada

Concluso
do teste

p-value

No se rejeita

Pode ser utilizada

0,001

Exponencial No se rejeita

Pode ser utilizada

0,05

Normal

Resultado
do teste

Atravs desta anlise, possvel obter uma mtrica que permitir escolher o modelo mais adequado
aos dados.
Considere-se agora o exemplo 3 com a amostra presente na Tabela 15, fornecida por Kececioglu,
Dimitri [2].

Tabela 15 Amostra de dados do exemplo 3 [2]

Designao Tempo at Designao Tempo at


da falha falha (horas) da falha falha (horas)
1
2,681
11
2,726
2
2,691
12
2,728
3
2,697
13
2,73
4
2,702
14
2,736
5
2,706
15
2,739
6
2,709
16
2,744
7
2,712
17
2,747
8
2,716
18
2,754
9
2,72
19
2,763
10
2,722

67

Utilizando os dados amostrais do exemplo 3 na folha de Excel, observa-se o output que consta na
Figura 39.

Figura 39 - Resultados da aplicao de Excel para o exemplo 3

Verifica-se por exemplo que para o teste Qui Quadrado existem trs distribuies que se adequam
aos dados. Aplicando o conceito de p-value (Tabela 16), sobressai a distribuio normal como
sendo a que melhor representa a nossa amostra pois possui um p-value maior.
Tabela 16 - Tabela de deciso baseada no p-value para o exemplo 3

Chi square p-value


Yes
87,30%
Normal
Yes
59,70%
Lognormal
Yes
47,20%
Weibull

68

Apresenta-se finalmente o histograma com os dados agrupados e a distribuio completamente


caracterizada:

Figura 40 Adequao da distribuio aos dados do exemplo 3.

De seguida, apresenta-se a funo distribuio acumulada de falha atravs da equao (2.2):

Figura 41 - Fda de falha do exemplo 3

69

Finalmente, aplicando a equao complementar da funo distribuio acumulada (2.3), atingido


o propsito final: a fiabilidade desta amostra que representativa da sua populao:

Figura 42 - Curva da fiabilidade representativa da amostra do exemplo 3

possvel agora tecer concluses sobre esta amostra, extrapolando para a populao que originou a
mesma. possvel afirmar com
fiabilidade de

no instante

de certeza que os bens que compem a amostra tm uma


e de

no instante

de servio:

Figura 43 - Interpretao da fiabilidade do exemplo anterior.

70

Visto que a ordenao das distribuies no era parte integrante da proposta do Trabalho Final de
Mestrado, foi tomada a deciso de no explorar a fundo esta vertente. Apenas foi referida a noo
de p-value para o teste Qui Quadrado pois verificou-se de interesse para o tema e deixa-se uma
porta aberta para um estudo aprofundado deste aspecto da estatstica visto que j existe algum
estudo associado [26].

71

6 Concluses e trabalhos futuros

Existe uma necessidade crescente de rentabilizar os activos de uma empresa e minimizar custos
associados a manuteno e danos de material. Para isso, a fiabilidade tem vindo a ser cada vez mais
implementada.
Verificou-se que atravs da obteno de uma amostra e do estudo de vrias distribuies
estatsticas, possvel modelar o comportamento de falha de um activo. As distribuies que foram
analisadas so a normal, lognormal, exponencial e Weibull.
Chegou-se concluso que atravs de mtodos de estimao de parmetros, nomeadamente, o
mtodo dos mnimos quadrados, dos momentos e da mxima verosimilhana, possvel caracterizar
uma distribuio consoante a nossa amostra, obtendo assim uma fdp associada.
De seguida, validou-se se todas as distribuies propostas eram fiveis aos dados obtidos na
amostra atravs de testes no paramtricos tais como o mtodo qui quadrado, de Kolmogorov
Smirnov, de Anderson-Darling e de Cramer-Von Mises. Quando se concluiu que algumas destas
distribuies eram candidatas a modelo representativo da amostra, foram ordenadas atravs do pvalue para ditar qual ou quais seriam as distribuies mais adequadas para o objectivo enunciado.
Resume-se o supracitado no diagrama seguinte:

Figura 44 - Workflow da dissertao

72

ainda importante referir que existe alguma margem na utilizao e na fiabilidade destes dados
pois usualmente utilizado um factor de correco, o factor de segurana. Mathieu [25] reitera a
importncia deste factor de segurana e aponta

como valor mnimo quando so referidos

valores probabilsticos em fiabilidade. claro que quanto maior o risco da falha, ou seja, quanto
mais impacto tiver a falha, maior ser a tendncia a aumentar este factor de segurana. Uma das
maiores causas que Mathieu aponta para este factor de segurana que a fiabilidade vem de outros
componentes que aquele que est a ser utilizado e no do prprio pelo que a previso exacta do
tempo da sua falha impossvel atravs deste mtodo.

O ficheiro de Excel foi elaborado para automatizar os testes de ajuste s vrias distribuies
estatsticas. Prope-se como trabalho futuro alastrar o mbito desta folha de clculo para que
tambm seja contemplada a estimao de parmetros, assim como outros modelos de probabilidade.
Adicionalmente, prope-se um estudo sobre a aplicao do p-value aos testes KS, AD e CVM onde
se poder comear pelos estudos dedicados a inserir os testes de KS em Excel com a ajuda de
Visual Basic [26].
Ainda para trabalho futuro prope-se a anlise que foi realizada para esta tese mas com substituio
de componentes. A estrutura deste trabalho poder ser idntica, sendo o detalhe diferente e
contribuir para um valor acrescentado a este documento.

73

Referncias

[1] EDIMU, M., GAUNT, C.T., HERMAN, R., Using probability distribution functions in reliability
analyses - Electric Power Systems Research 81 (2011) 915921
[2] KECECIOGLU, Dimitri B., Reliability & Life Testing Handbook, Department of Aerospace and
Mechanical Engineering, The University of Arizona, Vol. 1
[3] ABD-ELFATTAH, A. M., Goodness of fit test for the generalized Rayleigh distribution with
unknown parameters, Journal of Statistical Computation and Simulation, 2010
[4] T. P. Davis, Science, engineering, and statistics, Appl. Stochastic Models Bus. Ind., 2006
[5] E. Zio, Reliability engineering: Old problems and new challenges, Reliability Engineering and
System Safety, 2009, Vol.94(2), pp.125-141
[6] IDHAMMAR, Christer, A Culture Of Reliability, Pulp & Paper International, Feb, 2012,
Vol.54(2), p.32(3)
[7] PARSEN, Emanuel, Stochastic Processes, An unabridged , corrected republication of the work
first published by Holden-Day, Oakland, Calif., 1962
[8] LEFEBRE, Mrio, Applied Probability and Statistics, Departement de mathematiques et de genie
industriel, 2000
[9] http://ec.europa.eu/energy/lumen/overview/howtochoose/packaging/packaging_pt.htm, Comisso
Europeia, Como ler a embalagem, visto em 28-09-2013
[10]

M Rosenblatt, C Van Atta, Proceedings of a Symposium held at the University of California,

San Diego (La Jolla) July 1521, 1971.pdf


[11]

TEIMOURI, Madhi, et al., Comparison of estimation methods for the Weibull distribution,

2011
[12]

NEMES, Gergo, Generalization of Binets Gamma function formulas, Department of

Analysis, 2012
[13]

MORTICI, Cristinel, Some completely monotonic functions relating to the gamma function,

Department of Mathematics, 2011


74

[14]

MONTGOMERY, Douglas C., RUNGER, George, C., Applied Statistics and Probability for

Engineers, Third Edition, 2003


[15]

GOURDIN, ric et al., Finding Maximum Likelihood Estimators for the Three-Parameter

Weibull Distribution, 1994


[16]

GAEDDERT, Joseph D., Parametric Estimation of Stochastic Fading, 2005

[17]

KUMPHON, Bungon, Maximum Entropy and Maximum Likelihood Estimation for the

Three-Parameter Kappa Distribution, Open Journal of Statistics, 2012, 2, 415-419


[18]

BIAU, David Jean, JOLLES, Brigitte M., PORCHER, Raphael, P Value and the Theory of

Hypothesis Testing, 2009


[19]

EL-ADLL, Magdy E., Predicting future lifetime based on random number of three parameters

Weibull distribution, 2011


[20]

STIGLER, Stephen M., Karl Pearson and the Rule of Three, Department of Statistics,

University of Chicago, 2011


[21]

M. A. Stephens, Journal of the American Statistical Association, 1974, Vol.69(347)

[22]

FALISSARD, Bruno, Statistics In Brief, When to Use and When Not to Use a Threshold P

Value, 2011
[23]

PANDIS, Nikolaos, The P Value Problem, American Journal of Orthodontics and Dentofacial

Orthopedics, 2013
[24]

KERIAZES, Georgia A., Misuse of the p Value for Baseline Characteristics,

Pharmacotherapy, 2012
[25]

MATHIEU, Henry, Reliability, 1984

[26]

OKENIYI, Joshua Olusegun, OKENIYI, Elisabeth Toyin, Implementation of Kolmogorov-

Smirnov P-Value computation in Visual Basic: implication for Microsoft Excel library
function, 2011

75

Definies

Activos: Conjunto de bens que formam o patrimnio (de uma empresa ou organizao).
Componente: Pea simples.
Covarincia: Medida da dependncia linear entre duas variveis aleatrias [2].
Desvio padro: O desvio padro fornece a informao de quanto uma amostra est concentrada em
relao mdia. Um desvio padro diminuto transparece que os dados esto concentrados em torno
da mdia e por consequente, um desvio padro refere que a amostra est dispersa relativamente
mdia. O desvio padro obtm-se pela expresso:

Durabilidade: Tempo de vida til de um componente ou sistema.


Estimador: Um estimador uma funo utilizada para calcular um valor estimado.
Falha: Alterao ou trmino da capacidade de um componente ou sistema realizar uma determinada
funo. Este termo definido pela Norma NP EN 13306:2007 por: Avaria a manifestao da
inaptido de um dado item realizar um

determinado padro de desempenho previamente

especificado.
Funo densidade de probabilidade: A funo densidade de probabilidade, tambm chamada de
funo densidade ou fdp ou pdf (probability density function) uma funo no negativa que
representa a distribuio de probabilidade de uma varivel aleatria contnua. Normalmente esta
representada em minsculas por

[1].

Funo distribuio acumulada: A funo distribuio acumulada tambm denominada de funo


distribuio, fda ou cdf (cumulative distribution function) a funo que devolve a probabilidade
de uma varivel aleatria ser inferior ou igual varivel independente de uma funo [1].

76

Funo distribuio emprica: uma funo que representa a distribuio dos valores observados
de um conjunto de dados.
Mdia: Neste documento ir ser referida a palavra mdia (assumida aritmtica) cuja expresso
matemtica :

Moda: o valor que aparece mais frequentemente num conjunto de dados


Parmetros: Neste documento, a palavra parmetros vai se referir s constantes presentes nas
equaes das distribuies estatsticas.
Sistema: Vrias peas formando um conjunto.
Taxa e avarias: Exprime o nmero de avarias por unidade de utilizao.
Varivel aleatria: Para todo o evento aleatrio, possvel associar uma ou mais variveis ditas
variveis aleatrias e para cada varivel aleatria (ou conjunto de variveis aleatrias) possvel
encontrar uma funo que descreva a distribuio de probabilidades para a referida varivel (ou
conjunto de variveis), dita funo densidade de probabilidade. A varivel aleatria tambm
denominada de va [7].
Varivel independente: A varivel independente ou vi a incgnita
sendo que a qualquer

de uma funo

corresponde uma varivel dependente .

77

Apndice
Apndice A Tabela da normal padronizada
z
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3
3,1
3,2
3,3
3,4

0
0,5
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
0,758
0,7881
0,8159
0,8413
0,8643
0,8849
0,9032
0,9192
0,9332
0,9452
0,9554
0,9641
0,9713
0,9772
0,9821
0,9861
0,9893
0,9918
0,9938
0,9953
0,9965
0,9974
0,9981
0,9987
0,999
0,9993
0,9995
0,9997

0,01
0,504
0,5438
0,5832
0,6217
0,6591
0,695
0,7291
0,7611
0,791
0,8186
0,8438
0,8665
0,8869
0,9049
0,9207
0,9345
0,9463
0,9564
0,9649
0,9719
0,9778
0,9826
0,9864
0,9896
0,992
0,994
0,9955
0,9966
0,9975
0,9982
0,9987
0,9991
0,9993
0,9995
0,9997

0,02
0,508
0,5478
0,5871
0,6255
0,6628
0,6985
0,7324
0,7642
0,7939
0,8212
0,8461
0,8686
0,8888
0,9066
0,9222
0,9357
0,9474
0,9573
0,9656
0,9726
0,9783
0,983
0,9868
0,9898
0,9922
0,9941
0,9956
0,9967
0,9976
0,9982
0,9987
0,9991
0,9994
0,9995
0,9997

0,03
0,512
0,5517
0,591
0,6293
0,6664
0,7019
0,7357
0,7673
0,7967
0,8238
0,8485
0,8708
0,8907
0,9082
0,9236
0,937
0,9484
0,9582
0,9664
0,9732
0,9788
0,9834
0,9871
0,9901
0,9925
0,9943
0,9957
0,9968
0,9977
0,9983
0,9988
0,9991
0,9994
0,9996
0,9997

0,04
0,516
0,5557
0,5948
0,6331
0,67
0,7054
0,7389
0,7704
0,7995
0,8264
0,8508
0,8729
0,8925
0,9099
0,9251
0,9382
0,9495
0,9591
0,9671
0,9738
0,9793
0,9838
0,9875
0,9904
0,9927
0,9945
0,9959
0,9969
0,9977
0,9984
0,9988
0,9992
0,9994
0,9996
0,9997

0,05
0,5199
0,5596
0,5987
0,6368
0,6736
0,7088
0,7422
0,7734
0,8023
0,8289
0,8531
0,8749
0,8944
0,9115
0,9265
0,9394
0,9505
0,9599
0,9678
0,9744
0,9798
0,9842
0,9878
0,9906
0,9929
0,9946
0,996
0,997
0,9978
0,9984
0,9989
0,9992
0,9994
0,9996
0,9997

0,06
0,5239
0,5636
0,6026
0,6406
0,6772
0,7123
0,7454
0,7764
0,8051
0,8315
0,8554
0,877
0,8962
0,9131
0,9279
0,9406
0,9515
0,9608
0,9686
0,975
0,9803
0,9846
0,9881
0,9909
0,9931
0,9948
0,9961
0,9971
0,9979
0,9985
0,9989
0,9992
0,9994
0,9996
0,9997

0,07
0,5279
0,5675
0,6064
0,6443
0,6808
0,7157
0,7486
0,7794
0,8078
0,834
0,8577
0,879
0,898
0,9147
0,9292
0,9418
0,9525
0,9616
0,9693
0,9756
0,9808
0,985
0,9884
0,9911
0,9932
0,9949
0,9962
0,9972
0,9979
0,9985
0,9989
0,9992
0,9995
0,9996
0,9997

0,08
0,5319
0,5714
0,6103
0,648
0,6844
0,719
0,7517
0,7823
0,8106
0,8365
0,8599
0,881
0,8997
0,9162
0,9306
0,9429
0,9535
0,9625
0,9699
0,9761
0,9812
0,9854
0,9887
0,9913
0,9934
0,9951
0,9963
0,9973
0,998
0,9986
0,999
0,9993
0,9995
0,9996
0,9997

0,09
0,5359
0,5753
0,6141
0,6517
0,6879
0,7224
0,7549
0,7852
0,8133
0,8389
0,8621
0,883
0,9015
0,9177
0,9319
0,9441
0,9545
0,9633
0,9706
0,9767
0,9817
0,9857
0,989
0,9916
0,9936
0,9952
0,9964
0,9974
0,9981
0,9986
0,999
0,9993
0,9995
0,9997
0,9998
78

Apndice B relao entre o

COV
429,8314
47,0366
15,843
8,3066
5,4077
3,9721
3,1409
2,6064
2,2361
1,965
1,7581
1,5948
1,4624
1,3529
1,2605
1,1815
1,113
1,053
1,00
0,9527

0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
0,5
0,55
0,6
0,65
0,7
0,75
0,8
0,85
0,9
0,95
1,0
1,05

[2]:

COV
0,9102
0,8718
0,8369
0,805
0,7757
0,7487
0,7238
0,7006
0,679
0,6588
0,6399
0,6222
0,6055
0,5897
0,5749
0,5608
0,5474
0,5348
0,5227
0,5112

1,1
1,15
1,2
1,25
1,3
1,35
1,4
1,45
1,5
1,55
1,6
1,65
1,7
1,75
1,8
1,85
1,9
1,95
2
2,05

COV
0,5003
0,4898
0,4798
0,4703
0,4611
0,4523
0,4438
0,4341
0,4279
0,4204
0,4131
0,4062
0,3994
0,3929
0,3866
0,3805
0,3747
0,369
0,3634
0,3581

2,1
2,15
2,2
2,25
2,3
2,35
2,4
2,45
2,5
2,55
2,6
2,65
2,7
2,75
2,8
2,85
2,9
2,95

COV
0,3529
0,3479
0,343
0,3383
0,3336
0,3292
0,3248
0,3206
0,3165
0,3124
0,3085
0,3047
0,301
0,2974
0,2938
0,2904
0,287
0,2838

3,1
3,15
3,2
3,25
3,3
3,35
3,4
3,45
3,5
3,55
3,6
3,65
3,7
3,75
3,8
3,85
3,9
3,9

79

Apndice C Constantes crticas de Kolmogorov Smirnov [2]

n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36

20,00% 15,00% 10,00%


0,9
0,925
0,95
0,684
0,726
0,776
0,565
0,597
0,642
0,194
0,575
0,564
0,446
0,424
0,51
0,41
0,436
0,47
0,381
0,405
0,438
0,358
0,381
0,411
0,339
0,36
0,388
0,322
0,342
0,368
0,307
0,326
0,452
0,295
0,313
0,338
0,284
0,302
0,325
0,274
0,292
0,314
0,266
0,293
0,304
0,258
0,274
0,295
0,25
0,266
0,286
0,244
0,259
0,278
0,237
0,252
0,272
0,231
0,246
0,264
0,2268 0,2408 0,2592
0,2226 0,2356 0,2544
0,2184 0,2304 0,2496
0,2142 0,2252 0,2448
0,21
0,22
0,24
0,206
0,216
0,236
0,202
0,212
0,232
0,198
0,208
0,228
0,194
0,204
0,224
0,19
0,2
0,22
0,188
0,198
0,218
0,186
0,196
0,216
0,184
0,194
0,214
0,182
0,192
0,212
0,21841 0,2327 0,24903
0,21841 0,2327 0,24903

5,00%
0,975
0,842
0,708
0,624
0,454
0,521
0,486
0,457
0,432
0,41
0,391
0,375
0,361
0,349
0,338
0,328
0,318
0,309
0,301
0,294
0,2892
0,2844
0,2796
0,2748
0,27
0,264
0,258
0,252
0,246
0,24
0,238
0,236
0,234
0,232
0,27761
0,27761

1,00%
0,995
0,929
0,828
0,733
0,669
0,618
0,577
0,543
0,514
0,49
0,468
0,405
0,433
0,,118
0,404
0,392
0,381
0,371
0,363
0,356
0,3488
0,3416
0,3344
0,3272
0,32
0,314
0,308
0,302
0,296
0,29
0,286
0,282
0,278
0,274
0,33272
0,33272

80

81

Potrebbero piacerti anche