Sei sulla pagina 1di 149

Srie Monogrfica Qualidade

Estatstica Industrial
Jos Luis Duarte Ribeiro & Carla ten Caten
Editores

Universidade Federal do Rio Grande do Sul


Escola de Engenharia
Programa de Ps Graduao em Engenharia de Produo

Porto Alegre, RS

2000
Estatstica Industrial
Jos Luis Duarte Ribeiro & Carla ten Caten, editores

2000 by Jos Luis Duarte Ribeiro & Carla ten Caten

Direitos em lngua portuguesa para o Brasil adquiridos por

Universidade Federal do Rio Grande do Sul


Escola de Engenharia
Programa de Ps Graduao em Engenharia de Produo

Praa Argentina, 9 sala 404


90040-020 Porto Alegre RS Brasil

Tel. 55 51 316 3490 / 316 3948 / 316 3491


Fax: 55 51 316 4007
e-mail: ppgep@vortex.ufrgs.br

Projeto Grfico
Lia Buarque de Macedo Guimares

Editorao Eletrnica
Andria Fabiane Nahra Leal
Fabiane Ely

Ilustrao da Capa
Arcngelo Ianelli, Natureza-morta
1960 leo s/ tela 70 X 83 cm
IPHAN, Museu Nacional de Belas Artes
Estatstica Industrial

Introduo .......................................................................................................................... 1
Variabilidade ................................................................................................................................................... 1
Mtodos estatsticos ....................................................................................................................................... 2
Coleta de dados .............................................................................................................................................. 3
Funes .......................................................................................................................................................... 5
Grficos ........................................................................................................................................................... 5
Exerccios........................................................................................................................................................ 6
Distribuies de freqncia............................................................................................ 10
Intervalos de classe ......................................................................................................................................10
Regras gerais para elaborar uma distribuio de freqncia .......................................................................11
Histogramas e polgono de freqncia .........................................................................................................11
Distribuio de freqncias relativas ............................................................................................................12
Distribuio de freqncias acumuladas ......................................................................................................12
Curvas de freqncia suavizadas .................................................................................................................13
Tipos de distribuies de probabilidade (frequncia relativa) ......................................................................13
Medidas de tendncia central e variabilidade ............................................................... 16
Medidas de tendncia central .......................................................................................................................16
Medidas de variabilidade ..............................................................................................................................20
Exerccios......................................................................................................................................................22
Probabilidade ................................................................................................................... 24
Campo amostral e eventos ...........................................................................................................................24
Operaes com conjuntos ............................................................................................................................24
Definio de probabilidade ...........................................................................................................................25
Soma de probabilidades ...............................................................................................................................25
Exemplo 1: ....................................................................................................................................................26
Exemplo 2: ....................................................................................................................................................27
Produto de probabilidades ............................................................................................................................27
Eventos independentes ................................................................................................................................28
Probabilidade total ........................................................................................................................................29
Teorema de Bayes ........................................................................................................................................30
Distribuies de probabilidade ...................................................................................... 34
Distribuies discretas mais importantes .....................................................................................................35
Distribuies contnuas mais importantes ....................................................................................................38
Estimativa de parmetros ............................................................................................... 53
Estimativas pontuais .....................................................................................................................................53
Estimativas por intervalo de confiana .........................................................................................................54
Intervalo de confiana para a mdia, varincia conhecida...........................................................................55
Erro de estimao .........................................................................................................................................57
Intervalo de confiana para a mdia, varincia desconhecida .....................................................................58
Intervalo de confiana para a diferena entre duas mdias, varincia conhecida .......................................60
Intervalo de confiana para a diferena entre duas mdias, varincia desconhecida .................................61
Intervalo de confiana para a diferena entre observaes .........................................................................62
Intervalo de confiana para a varincia ........................................................................................................63
Intervalo de confiana para o quociente entre duas varincias ...................................................................65
Intervalo de confiana para o parmetro da Binomial ..................................................................................67
Testes de hiptese .......................................................................................................... 71
Comentrios iniciais ......................................................................................................................................71
Comparao de mdias, varincia conhecida ..............................................................................................72
Comparao de mdias, varincia desconhecida ........................................................................................74
Comparao de pares de observaes ....................................................................................................... 77
Comparao de varincias .......................................................................................................................... 78
Comparao dos parmetros da Binomial ................................................................................................... 80
Comparao de vrios grupos: a anlise de varincia.................................................85
Comentrios iniciais ..................................................................................................................................... 85
One-way ANOVA ......................................................................................................................................... 85
Regresso linear simples .............................................................................................103
Comentrios iniciais ................................................................................................................................... 103
Correlao .................................................................................................................................................. 103
Teste de hiptese para o coeficiente de correlao .................................................................................. 106
Regresso linear simples ........................................................................................................................... 107
Relao entre o coeficiente de correlao e a regresso ......................................................................... 108
Varincia dos estimadores ......................................................................................................................... 109
Intervalos de confiana e testes de hiptese ............................................................................................. 109
Previso de valores de Y .......................................................................................................................... 111
Anlise da validade do modelo .................................................................................................................. 112
Intervalo de variao para X ...................................................................................................................... 114
A anlise de varincia e a regresso ......................................................................................................... 114
Dados atpicos............................................................................................................................................ 116
Regresso no-linear simples.................................................................................................................... 116
Regresso linear mltipla ............................................................................................120
O modelo da regresso linear mltipla ...................................................................................................... 120
Notao matricial ....................................................................................................................................... 121
Estimativa dos coeficientes ........................................................................................................................ 121
Matriz de varincias e covarincias ........................................................................................................... 126
Testes de hiptese ..................................................................................................................................... 127
Coeficientes de determinao para o modelo de regresso mltipla ........................................................ 129
Previso de valores de Y .......................................................................................................................... 130
Anlise das suposies do modelo de regresso...................................................................................... 131
Regresso polinomial ................................................................................................................................. 131
1
Introduo
Jos Luis Duarte Ribeiro
Carla ten Caten

VARIABILIDADE Apesar de nossa formao ser basicamente determinstica, ensinando que


1 + 1 igual a 2 e 15 +5 igual a 20, vivemos em um mundo onde tudo
varia. Por exemplo, algum que tem o hbito de preparar um churrasco
no fim de semana pode ter comprado dois quilos de carne inmeras
vezes, mas ele nunca recebeu exatamente 2,00 Kg. Da mesma forma, o
seu trajeto para o trabalho pode incluir um trecho de 15 min., feito de
automvel, mais um trecho de 5 min., feito a p, mas voc nunca fez
todo o trajeto em exatamente 20:00 min.

Similarmente, os processos produtivos dependem de vrios parmetros


(presso, temperatura, velocidade, etc.); esses parmetros deveriam ser
mantidos em certos nveis, mas eles iro apresentar variabilidade.
Conseqentemente, os produtos resultantes de processos de manufatura,
ou de processos de prestao de servio, tambm iro apresentar
variabilidade. Um eixo usinado ter um dimetro final de
aproximadamente 50,0 mm. Em um restaurante, voc ser servido em
aproximadamente 20 min.

A variabilidade est sempre presente em qualquer processo onde ocorre


a produo de bens ou servios, independentemente de quo bem ele
seja projetado e operado. Se compararmos duas peas quaisquer,
produzidas pelo mesmo processo, suas medidas jamais sero exatamente
idnticas. As medidas feitas em um lote, podem estar todas dentro das
especificaes, mas mesmo assim a variabilidade estar presente.

As fontes de variabilidade podem agir de forma diferente sobre o


processo. Conforme a fonte de variabilidade, o resultado pode ser: (i)
pequenas diferenas pea-a-pea, em funo da habilidade do operador
ou diferenas de matria-prima, (ii) alterao gradual no processo, em
funo do desgaste de ferramentas ou mudana na temperatura do dia, e
(iii) alterao brusca no processo, devido a alguma mudana de
procedimento, ou queda de corrente, ou troca de setup, etc.

As fontes de variabilidade interferem nos processos de produo de bens


ou servios, fazendo com que os produtos finais no sejam exatamente
idnticos. Isso pode conduzir a produtos defeituosos, ou seja, produtos
cujas caractersticas no satisfazem a uma determinada especificao.
1. Introduo
2 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Figura 1 - Processo de fabricao Variao


Processo de fabricao
Entrada Sada
(bens ou servios)

Fontes de variabilidade

A reduo de variabilidade no processo gera itens cujas caractersticas


esto mais prximas de um valor alvo. Isso reduz o nmero de produtos
percebidos como defeituosos e, por conseguinte, os custos da m
qualidade.

Reduo de variabilidade

Resultados mais prximos dos valores alvos

Reduo de produtos defeituosos


Reduo dos custos da m qualidade

A reduo da variabilidade depende do conhecimento e anlise da


variabilidade presente no processo, para que as fontes de variabilidade
possam ser identificadas, analisadas e bloqueadas.

MTODOS ESTATSTICOS Todos os processos apresentam problemas e, por conseguinte,


oportunidades de melhoria. Algumas vezes os problemas so simples de
identificar e resolver. No entanto, outras vezes podem ser muito difceis.
Quando o problema difcil, a coleta sistemtica de dados e a
subseqente anlise estatstica podem revelar a soluo.

Assim, todo o gerente, administrador e engenheiro deveria ter o domnio


dos mtodos estatsticos. Esses mtodos contribuem em diferentes
aspectos:

 reduo do tempo da coleta dos dados;


 reduo do custo da coleta dos dados;
 melhor organizao e consolidao dos dados;
 maior agilidade no processamento dos dados;
 mxima informao extrada dos dados;
 maior preciso (confiana) na anlise;
 melhor apresentao dos resultados.

Todos esses aspectos asseguram um suporte mais qualificado tomada


Estatstica Industrial
1. Introduo 3

de deciso gerencial e auxiliam a reduzir:

 tempo de ciclo das melhorias contnuas;


 tempo de desenvolvimento do produto;
 tempo de validao de projetos;
 tempo de otimizao de processos.

As equipes que renem conhecimentos tcnicos sobre o problema em


estudo e domnio dos mtodos estatsticos tm seu potencial largamente
ampliado.

Definio de estatstica A disciplina estatstica engloba um conjunto de mtodos cientficos para


a coleta, organizao, resumo, anlise e apresentao de dados, bem
como a obteno de concluses vlidas, que dem suporte tomada de
decises baseadas em tais anlises.

Em sentido mais restrito, o termo estatstica usado para designar um


resultado extrado dos dados, como, por exemplo, a mdia ou desvio
padro.

COLETA DE DADOS Os dados so a base para a tomada de decises confiveis durante a


anlise de um problema; os dados so teis quando eles geram algum
tipo de ao. Por isso, importante ter bem claro quais so os objetivos
da coleta de dados. Em unidades de produo de bens ou servios, os
principais objetivos podem ser:

 desenvolvimento de novos produtos;


 inspeo;
 monitoramento dos processos;
 melhoria nos processos.

A coleta de dados pode se basear em dados histricos ou em


experimentos planejados. Dados histricos so dados que j esto
disponveis na empresa e, por isso, podem ser obtidos sem interferncia
no processo. Um experimento planejado envolve mudanas propositais
realizadas nos fatores do processo (causas), de modo que se possa
avaliar as possveis alteraes sofridas pelas caractersticas de qualidade
(efeitos), como tambm as razes destas alteraes.

Populao e amostra Ao coletar os dados referentes s caractersticas de um grupo de objetos


ou indivduos, como por exemplo nmero de parafusos defeituosos
produzidos em uma fbrica, muitas vezes impraticvel observar todo o
grupo.

Em vez de examinar o grupo inteiro, denominado populao,


examinamos uma pequena parte, chamada amostra.

Uma populao pode ser finita ou infinita. Por exemplo, a populao


constituda de todos os parafusos produzidos por uma fbrica em um
ms finita. Enquanto que a populao constituda de todos os
resultados (cara ou coroa) em sucessivos lances de uma moeda infinita.

Se a amostra representativa da populao, os resultados da amostra


podem ser usados para inferir sobre a populao. Essa parte chamada
1. Introduo
4 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

de Inferncia Estatstica e ser a nfase deste texto.

H uma outra parte da Estatstica que procura somente descrever e


analisar um certo grupo, sem tirar concluses ou inferncias a respeito
de um grupo maior. a chamada Estatstica Descritiva

Figura 2 - Populao x amostra


Quantos ? Amostra DADOS

Populao

INFERNCIA

Para que as inferncias sejam vlidas e suficientemente precisas,


importante que seja feita uma boa amostragem. As possveis causas de
erros nas inferncias, muitas vezes tm origem em problemas de
amostragem, por exemplo:

 falta da determinao correta da populao;


 falta de aleatoriedade na escolhas das unidades da populao,
gerando uma amostra que no representativa da populao;
 erro no dimensionamento do tamanho da amostra, gerando uma
amostra insuficiente para lidar com a variao aleatria presente no
processo em estudo.

Tipos de dados Uma varivel representada por um smbolo como X, Y, H, Z, e pode


assumir qualquer valor de um conjunto de valores. O conjunto de
valores possveis chamado de domnio da varivel. Se a varivel s
pode assumir um valor, chamada de constante.

Se uma varivel pode assumir qualquer valor entre dois limites


quaisquer, chamada de Varivel Contnua. Do contrrio, chamada de
Varivel Discreta.

Exemplo 1: O dimetro de uma pea torneada pode ser 2,50 ou 2,533


ou 2,5389, dependendo da preciso da medida; uma varivel contnua.

Exemplo 2: O nmero de unidades defeituosas em lotes de 100


unidades uma varivel discreta (0, 1, 2, etc.).

Algarismos significativos No caso de variveis contnuas, um valor 2,51 indica que o verdadeiro
valor est compreendido entre 2,505 e 2,515. Os algarismos corretos,
no contando os zeros necessrios para a localizao da vrgula,
chamam-se Algarismos Significativos.

1,668 apresentado como 1,67 tem 3 A. S.


Estatstica Industrial
1. Introduo 5

0,001803 apresentado como 0,0018 tem 2 A. S.


0,001803 apresentado como 0,00180 tem 3 A. S.
453,807 apresentado como 453,807 tem 6 A. S.
453,807 apresentado como 454 tem 3 A. S.

A noo de algarismos significativos no se aplica para o caso de


variveis discretas (que teriam uma infinidade de algarismos
significativos).

FUNES Se a cada valor que a varivel X pode assumir, corresponder um ou mais


valores da varivel Y, diz-se que Y uma funo de X e a notao :

Y = F(X)

A varivel X chama-se varivel independente, e a varivel Y chama-se


varivel dependente.

Exemplo: A fora de trao (T) em um tirante depende do peso (W)


colocado em sua extremidade.

T = F(W)

Exemplo: A resistncia (H) de uma liga metlica depende da


temperatura (T) do tratamento trmico.

H=F(T)

GRFICOS Muitos tipos de grficos so utilizados na Estatstica. Eles


complementam a anlise numrica e auxiliam nas comparaes e na
observao de tendncias. Entre os vrios tipos de grficos, cita-se:
grficos de barras, grficos circulares, grficos de disperso,
histogramas, curvas de regresso, sries temporais, etc.

Grfico de Barras Grfico Circular

Produo do modelo S.M. 93 Vendas durante o ano de 1994


2000
C D
7% 3%
1500
XYZ XYZ
1000 B A
40% B
500
30%
C
D
0
J F M A M J
A
MESES
20%
Figura 3 - Exemplos de grficos
utilizados na Estatstica.
Grfico de Disperso Curva de Regresso
1. Introduo
6 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

20 16
16 DUREZA
12
12
R 8
8
4 4
0 0
0 1 2 3 4 5 6 10 12 14 16 18
2 4 6 8
ESPAAMENTO
TEMPO DE TRAT. TRMICO

EXERCCIOS

Exerccio 1.1. Identifique se as seguintes variveis so contnuas ou discretas:

(1) nmero de livros em uma biblioteca;


(2) nmero de unidades defeituosas em um lote de produo;
(3) tempo de processamento de uma pea usinada;
(4) resistncia de uma fibra sinttica;
(5) nmero de defeitos de solda em uma carroceria;
(6) volume de um refrigerante.

Exerccio 1.2. Indique um exemplo de varivel contnua e um exemplo de varivel


discreta com as quais voc lida no seu dia a dia. Informe tambm o
domnio dessas variveis, ou seja, seu intervalo de variao possvel.

Exerccio 1.3. Arredonde os valores a seguir, apresentando-os com 2 e com 3


algarismos significativos.

X1 = 0,8078
X2 = 52,35
X3 = 6927

Exerccio 1.4. Em relao ao exerccio anterior, considere que os valores originais so


exatos e calcule o erro cometido em cada arredondamento efetuado.

Exerccio 1.5. Os dados a seguir representam a capacidade em litros dos porta-malas


dos carros populares produzidos no Brasil em 1996. Plote esses dados
usando um grfico de barras.

Corsa: 240 l
Uno: 224 l
Hobby: 325 l
Gol: 146 l

Exerccio 1.6. Os dados a seguir representam os cinco automveis mais vendidos no


Brasil no ano de 1996. Plote esses dados em um grfico circular.

Marca Volume
Gol 235.000
Estatstica Industrial
1. Introduo 7

Uno 225.000
Corsa 110.000
Tipo 107.000
Escort 97.000
Total 774.000

Exerccio 1.7. Os dados a seguir apresentam a evoluo do nmero de cursos de


mestrado e doutorado na UFRGS nos ltimos 30 anos. Plote esses
grficos como uma srie temporal.

Ano 1967 1972 1977 1982 1987 1992 1993 1994


Cursos de 9 22 28 33 39 47 48 50
Mestrado
Cursos de 3 3 5 5 12 25 26 27
Doutorado

Exerccio 1.8. Os dados a seguir foram coletados em um processo de produo de


fibras sintticas. Plote um grfico de disperso (X e Y) e conclua a
respeito.

X: Espaamento 5,1 5,5 4,8 1,2 1,8 4,2 3,5 1,0


entre rolos
Y: Resistncia 11,8 12,8 13,0 13,0 13,5 14,3 14,4 14,6

X: Espaamento 4,7 2,2 1,6 2,8 2,3 4,0 3,3 2,3


entre rolos
Y: Resistncia 15,0 15,2 15,6 16,0 17,0 17,1 17,8 18,1

Exerccio 1.9. A empresa JKL fez um levantamento das vendas, obtendo as seguintes
informaes:

Modelo \ UF RS SP RJ
AB3 532 633 587
XP9 459 501 492
ZC4 146 152 149
KW1 721 930 773

Construa um grfico de barras.

Exerccio 1.10. Construa o grfico de disperso para as notas de certa turma em


matemtica

Mat 3 5 3 2 7 9 4 8 6 5
Est 6 5 5 6 10 8 7 8 7 9

Exerccio 1.11. Na operao 3 foram verificados os defeitos encontrados na


montagem da bomba hidrulica . Construa o grfico de barras e
analise.

Tipo de defeito Freqncia


1. Introduo
8 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Compressor 7
Selo 2
Junta 12
Mangueira 6
Vedao 30
outros 3
2
Distribuies de freqncia
Jos Luis Duarte Ribeiro
Carla ten Caten

Na anlise de conjuntos de dados costume dividi-los em classes ou


categorias e verificar o nmero de indivduos pertencentes a cada classe,
ou seja, a freqncia da classe. Os dados a seguir apresentam um
conjunto de 50 observaes da principal caracterstica dimensional de
um tipo de pea usinada (dados em ordem crescente).

12,58 12,97 13,45 13,53 13,59 13,61 13,62 13,78 13,97 14,21
14,47 14,51 14,53 14,58 14,65 14,78 14,83 14,97 15,06 15,13
15,17 15,23 15,29 15,37 15,40 15,45 15,51 15,62 15,67 15,73
15,83 15,98 16,01 16,11 16,17 16,23 16,35 16,43 16,49 16,52
16,67 16,83 16,97 17,05 17,13 17,22 17,3 17,48 17,8 18,47

A Tabela 1 apresenta uma tabela de freqncia de 50 observaes de


uma caracterstica dimensional.

Intervalos de classe da Freqncia absoluta


caracterstica dimensional
12,50 a 13,50 3
13,51 a 14,50 8
14,51 a 15,50 15
15,51 a 16,50 13
Tabela 1 - Tabela de freqncia 16,51 a 17,50 9
absoluta
17,51 a 18,50 2

A tabela de freqncia apresenta dados agrupados. Nesse caso, os detalhes


originais dos dados so perdidos, mas a vantagem est em observar aspectos
globais do problema.

INTERVALOS DE Os limites tais como 12,50 a 13,50 so chamados de intervalos de classe. O


CLASSE nmero menor (12,50), o limite inferior da classe; e o maior (13,50) o
limite superior da classe. Em alguns casos, pode-se usar intervalos abertos, do
tipo 13,50 ou menor; 17,50 ou maior.

Amplitude do intervalo Quando todos os intervalos de classe tm a mesma amplitude, essa calculada
de classe fazendo-se a diferena entre dois limites inferiores ou dois limites superiores
sucessivos. Caso contrrio, teremos uma amplitude varivel.

Para o exemplo, a amplitude 13,50-12,50 = 14,50-13,50=1


Estatstica Industrial
2. Distribuies de freqncia 11

Ponto mdio de uma obtido somando-se o limite inferior ao superior e dividindo por dois. Assim,
classe o ponto mdio do intervalo 12,50 a 13,50 (12,50+13,50)/2 = 13,00

REGRAS GERAIS a) Determina-se o maior e menor valor do conjunto de dados;


PARA ELABORAR
UMA DISTRIBUIO Para o exemplo, Mn = 12,58 e Mx = 18,47
DE FREQNCIA
b) Define-se o limite inferior da primeira classe (LI), que deve ser igual ou
ligeiramente inferior ao menor valor das observaes;

Para o exemplo, LI = 12,50

c) Define-se o limite superior da ltima classe (LS), que deve ser igual ou
ligeiramente superior ao maior valor das observaes;

Para o exemplo, LS = 18,50

d) Define-se o nmero de classes (K), que pode ser calculado usando


K= n e deve estar compreendido entre 5 a 20;

Para o exemplo, K = 50 7 , mas por praticidade, foi escolhido K = 6

e) Conhecido o nmero de classes define-se a amplitude de cada classe: a =


(LS - LI) / K;

( LS LI ) (18,50 12,50)
Para o exemplo, a = = =1
K 6

f) Conhecida a amplitude das classes, define-se os limites inferior e superior


para cada classe. Por exemplo, para a 1a classe: lim. inf. = LI; lim. sup. = LI+
a;

Para o exemplo, lim inf = 12,50 e lim sup = 12,50 + 1 = 13,50

g) Calcula-se a freqncia de cada classe, ou seja, o nmero de observaes


pertencentes a cada classe, e completa-se a tabela de freqncia;

Para o exemplo, o nmero de observaes pertencentes ao intervalo 12,50 a


13,50 3.

HISTOGRAMAS E Histogramas e polgonos de freqncia so representaes grficas da tabela


POLGONO DE de freqncias. Um histograma consiste de um conjunto de retngulos que
FREQNCIA tm:

a) a base sobre um eixo horizontal com centro no ponto mdio e largura igual
a amplitude do intervalo de classes;

b) a rea proporcional s freqncias das classes.


2. Distribuies de freqncia
12 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

16 16

12 12

8 8

Figura 4 - Histograma e 4 4
polgono de freqncias
absolutas para o exemplo 0 0
12 13 14 15 16 17 18 19 12 13 14 15 16 17 18 19
anterior

Se todos os intervalos tiverem a mesma amplitude, as alturas dos retngulos


sero proporcionais s freqncias das classes, e ento costuma-se tomar as
alturas numericamente iguais a essas freqncias.

Um polgono um grfico obtido ligando-se os pontos mdios dos topos dos


retngulos de um histograma.

DISTRIBUIO DE A freqncia relativa de uma classe calculada dividindo-se a freqncia


FREQNCIAS dessa classe pelo total de todas as classes e , geralmente, expressa em
RELATIVAS percentagem.

Eq 1: freq. da classe
Freq. relativa = x100
freq. todas classes

Por exemplo, a freqncia relativa da 1a classe da Eq 1 :

Eq 2: freq. da classe 3
Freq. relativa = x 100 = x 100 = 6%
freq. todas classes 50

Se as freqncias da Tabela 2 forem substitudas pelas freqncias relativas,


teremos uma tabela de freqncias relativas e ento pode ser plotado um
histograma de freqncias relativas ou um polgono de freqncias relativas.

Intervalos de classe da Freqncia absoluta Freqncia


caracterstica
relativa
dimensional
12,50 a 13,50 3 6%
13,51 a 14,50 8 16%
14,51 a 15,50 15 30%
15,51 a 16,50 13 26%
Tabela 2 - Distribuio de 16,51 a 17,50 9 18%
freqncia relativa
17,51 a 18,50 2 4%

32% 32%

24% 24%

16% 16%

8% 8%
Figura 5 - Histograma e
0% 0%
polgono de freqncia relativa 12 13 14 15 16 17 18 19 12 13 14 15 16 17 18 19
para o exemplo anterior

DISTRIBUIO DE A freqncia total de todos os valores inferiores ao limite superior de uma


Estatstica Industrial
2. Distribuies de freqncia 13

FREQNCIAS dada classe denominada freqncia acumulada para aquele intervalo.


ACUMULADAS
Por exemplo, a freqncia acumulada at e inclusive o intervalo 13,51 a
14,50 3 + 8 = 11, o que significa que 11 das 50 peas cermicas
apresentam caracterstica dimensional inferior a 14,50.

Uma tabela que apresente essas freqncias chamada de tabela de


freqncia acumulada. Um grfico que apresente a freqncia acumulada
denominado de polgono de freqncia acumulada.

Intervalos de Freqncia Freqncia Freqncia Freqncia


classe da caract. absoluta relativa acumulada acumulada
dimensional absoluta relativa
abaixo de 12,50 0 0% 0 0%
12,50 a 13,50 3 6% 3 6%
13,51 a 14,50 8 16% 11 22%
14,51 a 15,50 15 30% 26 52%
15,51 a 16,50 13 26% 39 78%
Tabela 3 - Distribuio de 16,51 a 17,50 9 18% 48 96%
freqncia acumulada
17,51 a 18,50 2 4% 50 100%

Dividindo-se a freqncia acumulada pelo total das observaes, tem-se a


tabela de freqncias acumuladas relativas e o correspondente polgono de
freqncias acumuladas relativas.

50 100%

40 80%
30 60%
20 40%
10 20%
Figura 6 - Polgono de 0 0%
freqncias acumulada 12,5 13,5 14,5 15,5 16,5 17,5 18,5 12,5 13,5 14,5 15,5 16,5 17,5 18,5
absolutas e relativas

CURVAS DE O polgono de freqncia e o polgono de freqncia acumulado pode ser


FREQNCIA suavizado. Isso ajuda a filtrar o rudo presente em qualquer conjunto de dados.
SUAVIZADAS O polgono de freqncia suavizado a distribuio de freqncia ou
distribuio de probabilidade de uma caracterstica.

A anlise das distribuies de probabilidade indica o comportamento de uma


caracterstica que seria observado no caso de uma amostra muito grande ou
infinita.

TIPOS DE
DISTRIBUIES DE
PROBABILIDADE A Figura 7 apresenta diversos tipos de distribuies de probabilidade.
(FREQNCIA
RELATIVA)
2. Distribuies de freqncia
14 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Simtrica Assimtrica Direita Assimtrica Esquerda


Forma de Sino Assimetria Positiva Assimetria Negativa
EMBED PBrush

Figura 7 - Tipos de
distribuies de freqncia.

Uniforme Exponencial
5,1 5,3 5,3 5,6 5,8 5,9 6,0 6,1 6,2 6,2
6,3 6,3 6,3 6,4 6,4 6,4 6,5 6,5 6,6 6,7
6,7 6,8 6,8 6,9 6,9 7,0 7,1 7,1 7,2 7,2
7,3 7,4 7,5 7,5 7,6 7,6 7,6 7,7 7,7 7,8
7,8 7,9 7,9 8,0 8,0 8,1 8,2 8,3 8,3 8,4
8,5 8,5 8,6 8,7 8,8 8,8 8,9 9,0 9,1 9,2
9,4 9,4 9,5 9,5 9,6 9,8 9,9 10,0 10,2 10,2
10,4 10,6 10,8 10,9 11,2 11,5 11,8 12,3 12,7 14,9

Exerccio 2.2. Suavize o grfico de freqncias acumuladas obtido no exerccio anterior, e ento
estime o percentual das operaes onde o tempo dever ultrapassar 10 minutos.

Exerccio 2.3. Os dados a seguir representam a espessura (em mm) de uma pea mecnica.
Organize esses dados em uma tabela de freqncias relativas e depois plote o
histograma de freqncias relativas, o polgono de freqncias relativas e o grfico
de freqncias relativas acumuladas.

20,4 22,3 23,1 23,5 23,8 24,1 24,3 24,3 24,6 24,8
24,9 25,0 25,1 25,3 25,3 25,4 25,6 25,7 25,8 26,0
26,0 26,1 26,2 26,2 26,3 26,5 26,6 26,7 26,8 26,9
27,1 27,1 27,3 27,5 27,7 27,9 28,0 28,3 28,7 29,6

Exerccio 2.4. Suavize o grfico de freqncias acumuladas obtido no exerccio anterior, e


ento estime o percentual de peas que deve apresentar uma espessura inferior
a 24 mm.

Exerccio 2.5. Tendo em vista os polgonos de freqncia obtidos nos exerccios 2.1. e 2.3.
voc diria que as populaes do tempo e da espessura apresentam distribuio
de probabilidade simtrica ou assimtrica?

Exerccio 2.6. Plote os histogramas correspondentes s tabelas de freqncia a seguir e


indique o tipo de curva de freqncia em cada caso.

X1: Caracterstica dimensional de uma pea;


X2: Tempo de uso (horas/semana) de um produto;
Estatstica Industrial
2. Distribuies de freqncia 15

X3: Tempo at a falha de um produto.

X1 Freq. X2 Freq. X3 Freq.


25,52 a 25,53 6 0a4 1 0 a 100 20
25,53 a 25,54 14 4a8 2 100 a 200 16
25,54 a 25,55 20 8 a 12 9 200 a 300 11
25,55 a 25,56 18 12 a 16 24 300 a 400 7
25,56 a 25,57 15 16 a 20 48 400 a 500 4
25,57 a 25,58 7 20 a 24 6 500 a 600 2
3
Medidas de tendncia central e
variabilidade
Jos Luis Duarte Ribeiro
Carla ten Caten

MEDIDAS DE TENDNCIA H vrias medidas de tendncia central. Entre elas citamos a mdia
CENTRAL aritmtica, a mediana, a mdia harmnica, etc. Cada uma dessas
medidas apresenta vantagens e desvantagens, e a escolha depende dos
objetivos desejados. A seguir veremos como feito o clculo dessas
medidas.

Mdia aritmtica A mdia aritmtica, ou simplesmente mdia, de um conjunto de n


valores x1, ..., xn definida como:

Eq 3:
x1 +...+ x n 1 n
X = = xi
n n i =1

Exemplo: a mdia aritmtica do conjunto 7,5 7,9 8,1 8,2 8,7

Eq 4: 7,5 + 7,9 + 8,1 + 8,2 + 8,7


X = = 8,08
5

Na Estatstica, usual utilizar as letras gregas para representar


parmetros populacionais e as letras comuns para representar estimativas
amostrais. A mdia de uma amostra representada por X e a mdia da
populao representada pela letra grega .

Mdia aritmtica para Quando a informao disponvel o ponto mdio do intervalo i (Xi) e a
dados agrupados freqncia do intervalo i (fi), a mdia calculada como:

Eq 5: K
fi X i
f 1 X 1 + .... + f K X K i =1
X = =
f 1 + .... + f K K
fi
i =1

Para os dados da Tabela 2.1. resulta:

Eq 6: 3(13) + 8(14) + 15(15) + 13(16) + 9(17) + 2(18)


X = = 15,46
50

Mdia aritmtica Algumas vezes associa-se a cada observao um peso Wi, onde esse peso
ponderada representa a importncia atribuda a cada observao. Nesse caso a
Estatstica Industrial
3. Medidas de tendncia central e probabilidade 17

mdia ponderada calculada como:

Eq 7: n
wi x i
w1 x1 +....+ wn x n i =1
X = =
w1 +....+ wn n
wi
i =1

Por exemplo, um exame de seleo pode ser composto de trs provas


onde as duas primeiras tem peso 1 e a terceira tem peso 2. Um
candidato com notas 70 75 e 90 ter mdia final:

Eq 8: 1( 70) + 1( 75) + 2( 90)


X = = 81,25
4

Mediana Dado um conjunto de valores em ordem crescente, a mediana definida


como:

Se n impar, o valor central;


Se n par, a mdia simples dos dois valores centrais.

Exemplo 1: na amostra 25 26 26 28 30 a mediana ~


x = 26

Exemplo 2: (74 + 75)


na amostra 71 73 74 75 77 79 a mediana ~
x= = 74,5
2

Moda A moda o valor que ocorre com maior freqncia, ou seja, o valor
mais comum. A moda pode ser mltipla ou pode no existir.

Exemplo 1: na amostra 23 25 25 26 26 26 27 29 a moda 26.

Exemplo 2: na amostra 71 73 73 75 76 77 77 79 81 a moda 73 e 77

Relaes empricas entre Para distribuies simtricas a mdia, a mediana e a moda coincidem
mdia, moda e mediana aproximadamente. Para distribuies assimtricas observa-se a relao
que aparece na Figura 8.

B C

Figura 8 : Distribuies assimtricas

Exemplo: Para as amostras a seguir a relao entre mdia e mediana


3. Medidas de tendncia central e probabilidade
18 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

A Distribuio 10 12 14 16 18 x = 14 = ~
x = 14
simtrica
B Distribuio 10 12 14 16 23 x = 15 > ~
x = 14
assimtrica direita
C Distribuio 05 12 14 16 18 x = 13 < ~
x = 14
assimtrica
esquerda

Mdia geomtrica a raiz de ordem n do produto dos valores da amostra:

Eq 9: G = n X X .... X
1 2 n

Exemplo: a mdia geomtrica de 12 14 16 :

Eq 10: G = 3 12 14 16 = 13,90

Mdia harmnica a recproca da mdia aritmtica das recprocas das observaes:

Eq 11: 1 n
H= =
1 1 1
n
X X
i i

Exemplo: a mdia harmnica de 12 14 16 :

Eq 12: 3
H= = 13,81
1 1 1
+ +
12 14 16

Relao entre mdia A mdia geomtrica e a mdia harmnica so menores, ou no mximo


aritmtica, geomtrica e igual, mdia aritmtica (ver Eq 13). A igualdade s ocorre no caso em
harmnica: que todos os valores da amostra so idnticos. Quanto maior a
variabilidade, maior ser a diferena entre as mdias harmnica e
geomtrica e a mdia aritmtica.

Eq 13: H G X

Exemplo: para a amostra 12 14 16 tem-se:

Eq 14: H = 13,81 < G = 13,90 < X = 14,00

Quartis Se um conjunto de dados organizado em ordem crescente, o valor


central, que divide o conjunto em duas partes iguais, a mediana.

Valores que dividem o conjunto em quatro partes iguais so


representados por Q1, Q2, Q3, e denominam-se primeiro, segundo e
terceiro quartis, respectivamente.

O segundo quartil a mediana. O primeiro e o terceiro quartil so


calculados usando-se o seguinte procedimento:

(1) partindo de uma amostra de tamanho n, colocar os valores em ordem


crescente e identificar a ordem i (1, 2, 3, , n) e o percentil p(i) = (i-
0,5)/n associado a cada valor.
Estatstica Industrial
3. Medidas de tendncia central e probabilidade 19

(2) identificar os valores associados aos percentis imediatamente acima e


abaixo de 0,25; esses valores so chamados respectivamente de x(inf),
associado ao percentil p(inf), e x(sup), associado ao percentil p(sup).
(3) e ento calcular o primeiro quartil usando:

Eq 15: [ p(sup) 0,25] x(inf) + [0,25 p(inf)] x(sup)


Q1 =
p(sup) p(inf)

(4) similarmente, para o terceiro quartil, identifica-se os valores


associados aos percentis imediatamente acima e abaixo de 0,75; esses
valores so chamados respectivamente de x(inf), associado ao percentil
p(inf), e x(sup), associado ao percentil p(sup). E ento calcula-se o
terceiro quartil usando:

Eq 16: [ p(sup) 0,75] x(inf) + [0,75 p(inf)] x(sup)


Q3 =
p(sup) p(inf)

Exemplo: Para a amostra a seguir calcular o primeiro e terceiro quartis:

13,3 13,5 17,2 13,8 12,3 12,7 13,0 14,5 14,9 15,8 13,1 13,3 14,1

(1) valores em ordem crescente e clculo de p(i):

x(i) i p(i) = (i-0,5)/n


12,3 1 0,038
12,7 2 0,115
13,0 3 0,192
13,1 4 0,269
13,3 5 0,346
13,3 6 0,423
13,5 7 0,500
13,8 8 0,577
14,1 9 0,654
14,5 10 0,731
14,9 11 0,808
15,8 12 0,885
17,2 13 0,962

(2) valores imediatamente acima e abaixo de 0,25: x(inf) = 13,0 e x(sup)


= 13,1 associados com p(inf) = 0,192 e p(sup) = 0,269

(3) primeiro quartil:

Eq 17: [0,269 0,25] (13,0) + [0,25 0,192] 13,1


Q1 = = 13,08
0,269 0,192

(4) valores imediatamente acima e abaixo de 0,75: x(inf) = 14,5 e x(sup)


= 14,9 associados com p(inf) = 0,731 e p(sup) = 0,808, resultando para o
terceiro quartil:

Eq 18: [0,808 0,75] (14,5) + [0,75 0,731] 14,9


Q3 = = 14,60
0,808 0,731
3. Medidas de tendncia central e probabilidade
20 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

MEDIDAS DE Invariavelmente as observaes individuais iro apresentar alguma


VARIABILIDADE disperso em torno do valor mdio. Isso chamado de variabilidade
ou disperso dos dados. H muitas medidas de variabilidade, como por
exemplo, a amplitude total, o desvio padro ou a distncia inter-
quartlica. Essas medidas sero detalhadas na seqncia.

Amplitude total A amplitude total definida como a diferena entre o maior e o menor
valor das observaes.

Por exemplo, para a amostra: 8,5 8,7 8,9 10,1 10,5 10,7 11,5
11,9

A amplitude : R = 11,9 - 8,5 = 3,4

A amplitude fcil de calcular e fornece uma idia da magnitude da


faixa de variao dos dados. A amplitude no informa a respeito da
disperso dos valores que se encontram entre os dois extremos. Quando
n < 10, a amplitude pode resultar em uma medida de variao bastante
satisfatria.

Desvio-padro Para uma amostra de n observaes, x1, ..., xn , o desvio- -padro S


definido como:

Eq 19:
S=
( x i x )2 =
xi2 [( xi ) 2 / n]
n 1 n 1

A vantagem do desvio-padro que se trata de uma medida de


variabilidade que leva em conta toda a informao contida na amostra.
A desvantagem que seu clculo mais trabalhoso.

Para amostras pequenas (n < 30) usa-se n - 1 no denominador da


equao anterior. Quando a amostra grande (n > 30) ou quando trata-
se da populao usa-se n no denominador.

O desvio-padro de uma populao representado pela letra grega .

Exemplo: para a amostra 10 12 14 16 18

A mdia x = 14 e o desvio-padro calculado como:

Eq 20:
(10 14)2 + (12 14)2 + (14 14)2 + (16 14) 2 + (18 14)2
S= = 3,16
n 1

Varincia A varincia S2 definida como o quadrado do desvio-padro, ou seja,


9,98.

Eq 21:
2 (xi x )2 xi2 [( xi ) 2 / n]
S = =
n 1 n 1

A varincia de uma populao representada pela letra grega 2 .

Amplitude inter-quartlica definida como a amplitude do intervalo entre o primeiro e o terceiro


Estatstica Industrial
3. Medidas de tendncia central e probabilidade 21

quartis, ou seja:

Eq 22: Q = Q Q
3 1

s vezes tambm usada a semi-amplitude inter-quartlica, que a


metade da anterior.

A amplitude inter-quartlica uma medida de variabilidade bastante


robusta, que pouco afetada pela presena de dados atpicos. A
amplitude inter-quartlica guarda a seguinte relao aproximada com o
desvio-padro:

Eq 23: Q = (4/3) x desvio-padro

Coeficiente de variao definido como o quociente entre o desvio-padro e a mdia e, em


geral, expresso em percentual, conforme a equao a seguir.

S
Eq 24: CV = 100
X

O coeficiente de variao uma medida adimensional, til para


comparar resultados de amostras cujas unidades podem ser diferentes.

Uma desvantagem do coeficiente de variao que ele deixa de ser til


quando a mdia prxima de zero.

Exemplo: Dois processos, medindo itens diferentes, obtiveram os seguintes


resultados:

Folha de ao: Mdia=2,49 mm Desvio-padro=0,12 mm

Chapa de madeira: Mdia=3,75 cm Desvio Padro=0,15 cm

Qual dos dois processos relativamente mais preciso?

CV1 = 0,12 / 2,49 x 100 = 4,8%

CV2 = 0,15 / 3,75 x 100 = 4,0%

O segundo processo relativamente mais preciso.

Varivel reduzida ou XX
padronizada A varivel Z = denominada de varivel reduzida ou
S
padronizada.

Ela mede a magnitude do desvio em relao mdia, em unidades do


desvio-padro. Z = 1,5 significa uma observao desviada 1,5 desvios
padro para cima da mdia. A varivel reduzida muito til para
comparar distribuies e detectar dados atpicos. Os dados so
considerados atpicos quando o mdulo de Z maior que 2,5 ou 3.

Exemplo 1: Um engenheiro est analisando as espessuras de peas fabricadas em


duas mquinas de corte. O operador mediu uma pea da mquina A com
espessura de 90 mm e outra pea da mquina B com espessura de 100
mm. O engenheiro deve considerar esses dados coletados reais ou
3. Medidas de tendncia central e probabilidade
22 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

atpicos?

A mquina A possui mdia 51 mm e desvio-padro 12 mm.

90 51
Z= = 3,25 Como |Z| > 3 o dado pode ser considerado
12
atpico

A mquina B possui mdia 72 mm e desvio-padro 16 mm.

100 72
Z= = 1,75 Como |Z| < 3 o dado no pode ser considerado
16
atpico

Exemplo 2: Supondo que 51 fosse a mdia em uma prova de ingls, onde o desvio
padro 12, para um candidato que obtivesse 90 acertos tem-se:

X X 90 51
Z = = = 3 , 25
S 12
Conclui-se que na prova de ingls este candidato est 3,25 desvios-
padro acima da mdia.

EXERCCIOS

Exerccio3.1. Para os dados do exerccio 2.1, calcule a mdia aritmtica e a mediana e


verifique que a relao mdia > mediana, vlida para distribuies
assimtricas direita.

Exerccio 3.2. Ainda em relao aos dados do exerccio 2.1, calcule a mdia aritmtica
usando a frmula para dados agrupados e a tabela de freqncia que
voc construiu.

Exerccio 3.3. Para os dados do exerccio 2.3., calcule a mdia e a mediana e verifique
a relao mdia mediana para distribuies simtricas.

Exerccio 3.4. A partir dos dados do exerccio 2.6., use a frmula para o clculo da
mdia de dados agrupados e calcule a mdia para:

X1: Caracterstica dimensional de uma pea;


X2: Tempo de uso (horas/semana) de um produto;
X3: Tempo at a falha de um produto.

Exerccio 3.5. As amostras a seguir representam valores de tempos de fabricao de


uma pea produzidas por trs mquinas diferentes. Para cada mquina,
calcule a amplitude total, o desvio padro e a amplitude inter-quartlica.
Aps, conclua a respeito de diferenas de variabilidade entre tempos
dessas mquinas.

M A 20,2 24,7 25,7 21,7 19,2 22,3 23,0 23,1 21,3 26,8 20,7 23,6 25,4 24,6 22,5
M B 21,3 22,7 22,5 23,8 20,4 23,3 23,7 23,4 25,5 22,4 23,1 21,7 24,3 24,7 22,2
M C 22,1 24,4 24,0 21,5 23,2 22,0 25,4 27,8 23,5 23,0 20,6 23,6 22,5 22,8 21,4
Estatstica Industrial
3. Medidas de tendncia central e probabilidade 23

Exerccio 3.6. Calcule o valor da varivel reduzida Z para os pontos extremos das
amostras que aparecem no exerccio anterior. Aps indique se h
evidncia de dados atpicos em alguma dessas amostras (obs: para
n=15, um valor de Z > 2,5 j seria evidncia de dado atpico).

Exerccio 3.7. Caso haja indcios de dados atpicos, elimine esse resultado e refaa os
clculos da amplitude total, desvio padro e amplitude inter-quartlica
para a amostra correspondente. Se necessrio, revise as concluses do
exerccio 3.5.

Exerccio 3.8. Para a amostra a seguir (Tempos de uso em horas/semana de um


produto), calcule a mdia, o desvio padro e o coeficiente de variao.
Calcule tambm os valores de Z para cada observao. Analise os
valores de Z e indique se a amostra vem de uma populao com
distribuio simtrica, assimtrica direita ou assimtrica esquerda.

4,5 7,0 9,0 11 13 14 16 16 17 18


18 20 21 22 22 23 24 24 24 24
25 25 26 26 26 27 28 28 29 30

Exerccio 3.9. Idem ao anterior, Tempos de uso (horas/semana) de um produto


concorrente

0,2 0,2 0,3 0,4 0,6 0,6 0,8 1,0 1,0 1,2
1,2 1,3 1,4 1,5 1,5 1,7 1,8 2,0 2,2 2,5
2,5 2,7 3,3 3,5 3,8 4,3 5,1 12,0 12, 15,0
4
Probabilidade
Jos Luis Duarte Ribeiro
Carla ten Caten

A Teoria das Probabilidades estuda os fenmenos aleatrios.

Fenmeno Aleatrio: so os fenmenos cujo resultado no pode ser


previsto exatamente. Se o fenmeno se repetir, sob condies similares,
o resultado no ser sempre o mesmo.

Experimento Aleatrio: Qualquer fenmeno aleatrio que possa ser


executado pelo homem.

CAMPO AMOSTRAL E Os resultados de um experimento aleatrio podem ser representados em


EVENTOS um espao amostral ao qual chamaremos de S.

O espao S pode ser uni ou k-dimensional, discreto ou contnuo, finito


ou infinito. A figura a seguir apresenta um espao bidimensional onde
aparecem os eventos A e B.

Figura 9 - Campo amostral.

Como pode ser visto, os eventos A e B esto completamente contidos


em S e apresentam interseco, ou seja, a sua ocorrncia simultnea
possvel.

ESPAO AMOSTRAL E Evento: um conjunto de resultados possveis do experimento. um


EVENTOS: subconjunto de S.

Exemplo: Em uma linha de produo, peas so fabricadas em srie. Conte o n de


peas defeituosas em cada 200 peas produzidas. S = {0, 1, 2, ..., 200};

Eventos:
A: ocorrer 10 peas defeituosas. A = {10};
B: ocorrer entre 10 e 15 peas defeituosas. B = {10, 11, 12, 13, 14, 15};
OPERAES COM Usando o smbolo para unio e o smbolo para interseco,
CONJUNTOS
Estatstica Industrial
4. Probabilidade 25

podemos definir os eventos C e D:

Eq 25: C = A B

representa o conjunto de valores que pertence a A ou B ou a ambos,


enquanto que:

Eq 26 D = A B

representa o conjunto de valores que pertencem simultaneamente a A e


B.

Usaremos a letra para representar o conjunto vazio, e uma barra sobre


a letra, por exemplo A , para representar o complemento de A, isto ,
o conjunto de pontos que no pertence a A.

DEFINIO DE Um experimento ser chamado aleatrio se puder ser repetido um grande


PROBABILIDADE nmero de vezes sob condies similares e se o resultado de uma
observao no pode ser exatamente previsto. Uma varivel ser
chamada aleatria se descreve os resultados de um experimento
aleatrio.

Para um evento E em S, podemos definir a existncia de uma funo


P tal que P represente a probabilidade que x pertena a E. Isto :

Eq 27 P(E) = Pr (x E)

Essa funo P deve satisfazer algumas propriedades:

1) 0 P 1

2) Se E1 e E2 so tais que E1 E2 = 0,

tem-se que P(E1 E2) = P(E1) + P(E2)

3) A probabilidade de x pertencer a qualquer ponto do espao amostral


S deve ser igual a 1: P(S)=1

Essas propriedades so importantes para derivar vrias regras de clculo


de probabilidades.

Para determinar a probabilidade de um evento, usaremos o ponto de


vista das freqncias relativas:

Eq 28 P(E) = m(E) / m(S)

onde m(E) e m(S) representam as medidas de E e S.

SOMA DE Dois eventos so ditos mutuamente exclusivos se a sua interseco


PROBABILIDADES nula. Para eventos mutuamente exclusivos, a soma das probabilidades
dada pela generalizao da propriedade 2.

Eq 29 P(E1 E2. .... Ek) = P(Ei)

Se os eventos E1 e E2 no so mutuamente exclusivos, mas so


independentes, pode-se demonstrar que:
4. Probabilidade
26 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Eq 30 P(E1 E2) = P(E1) + P(E2) - P(E1 E2)

Para o caso de trs eventos, a generalizao anterior :

Eq 31 P(E1 E2 E3) = P(E1) + P(E2) + P(E3) - [P(E1 E2) + P(E1 E3) +


P(E2 E3)] + P(E1 E2 E3)

Figura 10 - Interseco de trs


eventos.

EXEMPLO 1: Um digestor qumico alimentado por material que vem de dois tanques
independentes. O material do tanque 1 pode ser uma concentrao de
cido que varia uniformemente entre 4 e 8, enquanto que o material do
tanque 2 pode apresentar uma concentrao de base entre 5 e 10 (ver
Figura 11). Sejam os seguintes eventos:

A: material do tanque 1 com concentrao superior a 6

B: material do tanque 2 com concentrao inferior a 6

Calcule a P(A), P( A ), P(B), P( B ), P(A B), P(A B)

Figura 11- Exemplo do digestor


qumico.

Soluo:

Usando o ponto de vista das freqncias relativas, tem-se:

P(A) = m(A) / m(S)

P(A) = 10 / 20 = 0,5
Estatstica Industrial
4. Probabilidade 27

P( A ) = 1 - P(A) = 0,5

P(B) = 4 / 20 = 0,20

P( B ) = 1 - P(B) = 0,80

P(A B) = 2/20 = 0,10

P(A B) = P(A) + P(B) - P(A B)

= 0,50 + 0,20 - 0,10 = 0,60

EXEMPLO 2: Considerando os dados do exemplo anterior, e sabendo que o processo


apresenta problemas quando a concentrao de cido supera a
concentrao de base, calcule a probabilidade disso acontecer.

Soluo:

P(E1) = m(E1) / m(S)

3 3
P(E1) = / 20 = 0,225
2
Figura 12- Exemplo do digestor
qumico.

PRODUTO DE A probabilidade de um evento A foi definida como a medida do


PROBABILIDADES conjunto A dividida pela medida de S. Poderamos, ento, escrever
P(A/S) para indicar de forma explcita que a probabilidade de A est
referida a todo o espao amostral S. Assim:

Eq 32: P(A) = P(A/S) = m(A) / m(S)

Algumas vezes, no entanto, estaremos interessados em calcular a


probabilidade de um evento E1 referida a um sub-espao de S, por
exemplo, ao espao definido por E2:

Eq 33: P(E1/E2) = m (E1 E2) / m(E2)

Dividindo-se numerador e denominador por m(S):

Eq 34: P(E1/E2) = [m (E1 E2) / m(S)] / [m(E2) / m(S)]

Eq 35: P(E1/E2) = P(E1 E2) / P(E2)


4. Probabilidade
28 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Essa expresso define a probabilidade de E1 dado E2 ou referida a E2.


A partir dessa expresso, obtm-se:

Eq 36: P(E1 E2) = P(E1/E2) . P(E2)

Da mesma forma, poderamos escrever:

Eq 37: P(E2/E1) = P(E1 E2) / P(E1)

e ento obter:

Eq 38: P(E1 E2) = P(E2/E1) . P(E1)

As equaes 36 e 38 so anlogas e definem a probabilidade do produto,


ou seja, da ocorrncia simultnea de E1 e E2.

Para trs eventos tem-se:

Eq 39: P(E1 E2 E3)= P(E1) . P(E2/E1) . P(E3/E1 E2)

ou expresses equivalentes usando P(E2) ou P(E3).

Exemplo 3: Para o exemplo do digestor qumico calcule a probabilidade da


concentrao de cido superar a concentrao de base quando sabe-se
que a concentrao de cido superior a 6,0.

Soluo: O que se pede a P(E1) dado A. Essa probabilidade :

m(E1 A)/m(S) 4/20


P(E1/A) = = = 0,40
m(A)/m(S) 10/20

EVENTOS Dois eventos, E1 e E2 so ditos independentes se:


INDEPENDENTES
Eq 40: P(E1/E2) = P(E1)

nesse caso,

Eq 41: P(E1 E2) = P(E1) . P(E2)

Para k eventos independentes, tem-se:

Eq 42: P(E1 .... Ek) = P(Ei)

Exemplo 4: Um construtor se submete a licitao para duas obras independentes, A


e B. Baseado na experincia, os engenheiros estimam que a
probabilidade de ganhar a obra A 0,25; e a probabilidade de ganhar a
obra B 0,33. Pede-se:

a) Estimar a probabilidade de ganhar ao menos uma das duas obras:

P(A B) = P(A) + P(B) - P(AB) = 0,25 + 0,33 - (0,25 . 0,33) = 0,5

b) Estimar a probabilidade de ganhar a obra A, sabendo-se que o


construtor ir ganhar ao menos uma obra:
Estatstica Industrial
4. Probabilidade 29

P(A (A B)) 0,25


P(A/A B) = = = 0,50
P(A B) 0,50

Note que P(A (A B)) obviamente o mesmo que A, j que A


est completamente contido em (A B).

c) Se o construtor submete-se a outra licitao para uma obra C, com


probabilidade de ganhar igual a 0,25, qual a probabilidade de ganhar ao
menos uma obra?

P(A B C) = 0,25 + 0,33 + 0,25 - (0,25 . 0,33 + 0,25 . 0,25 +

+ 0,33 . 0,25) + (0,25 . 0,33 . 0,25)= 0,625

Note que para o caso de eventos independentes vale tambm:

P(ABC) = 1 - P( A B C) = 1 - (0,75 . 0,67 . 0,75) = 0,625

PROBABILIDADE TOTAL Seja que no campo amostral S exista um evento B que consiste de k
componentes mutuamente exclusivos:

Eq 43: B = B1 B2 ... Bk; Bi Bj = 0

Figura 13 - Probabilidade total.

E seja que no campo do evento B exista um outro evento A que pode


ou no ocorrer simultaneamente com todos os componentes de B.
Nesse caso, podemos escrever:

Eq 44: A = (A B1) (A B2) ..... (A Bk)

Isso quer dizer que o evento A est descrito em forma total pelos
componentes B1....Bk do evento B, os quais so mutuamente
exclusivos. Ento:

Eq 45: P(A) = P(A B1) +....+ P(A Bk)

Eq 46: P(A) = P(B1) . P(A/B1) +....+ P(Bk) . P(A/Bk)

Eq 47: P(A) = P(Bi) . P(A/Bi)

Exemplo 5: Na construo de um edifcio usa-se 1000 Kg de material por dia; desse


total, 600 Kg so adquiridos do fornecedor B1 e 400 Kg do fornecedor
B2.
4. Probabilidade
30 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Assim B = B1 B2, onde B a proviso de 1000 Kg/dia

O material pode ser defeituoso e por experincia prvia sabe-se que B1


e B2 tm as probabilidades de 0,03 e 0,01, respectivamente, de serem
defeituosos.

Chamando A o evento material defeituoso tem-se:

A = (A B1) (A B2)

Isto , se o material defeituoso, pode vir de B1 ou B2. Ento A pode


ser calculado a partir de:

P(B1) = 0,6; P(B2) = 0,4

P(A/B1) = 0,03; P(A/B2) = 0,01

P(A) = P(B1) . P(A/B1) + P(B2) . P(A/B2)

P(A) = (0,6) . (0,03) + (0,4) . (0,01) = 0,018 + 0,004 = 0,022

Assim a probabilidade total de que o material seja defeituoso, vindo de


B1 ou B2, igual a 0,022.

TEOREMA DE BAYES O Teorema de Bayes permite calcular a probabilidade posterior de um


evento B j , P(Bj/A), baseada em nova informao referente ao evento
A e conhecendo-se a probabilidade anterior B j , P(Bj).

Usando o conceito de probabilidade condicional, tem-se:

Eq 48: P(Bj/A) = P(Bj A) / P(A)

Como A est descrito em termos de B1,.....,Bk, tem-se o Teorema de


Bayes:

Eq 49: P(Bj/A) = P(Bj A) / P(Bj) . P(A/Bj)

Eq 50: P(Bj/A) = P(Bj) . P(A/Bj) / [ P(Bj) . P(A/Bj)]

Nota-se que o Teorema de Bayes determina a probabilidade posterior de


um evento B j , em funo de um evento A e da probabilidade anterior
de B j .

Exemplo 6: Uma seo de pavimento de concreto aceita se sua espessura for


superior a 7,5 cm. A experincia prvia indica que 90% das sees
construdas so aceitas. A medio da espessura feita usando um
aparelho ultra-snico, cuja confiabilidade de 80%, ou seja, h uma
probabilidade de 80% que a concluso baseada neste aparelho seja
correta.

Pede-se:

a) Qual a probabilidade que a seo esteja bem construda e seja aceita


na inspeo?
Estatstica Industrial
4. Probabilidade 31

Soluo:

Seja A: seo bem construda, isto , e > 7,5 cm. P(A) = ?

Seja B: O aparelho indica que a seo est bem construda, ou seja,


indica que e > 7,5 cm. P(B)=0,90

Ainda, P(A/B) = 0,80

Assim, o que se pede a P(A B):

P(A B) = P(B) . P(A/B) = (0,90) . (0,80) = 0,72

b) A probabilidade que a seo no esteja bem construda e seja aceita:

P(A B) = P(B).P( A/B) = (0,90).(0,20) = 0,18

c) A probabilidade que a seo seja aceita quando se sabe que a seo


est bem construda.

Essa probabilidade pode ser estimada usando o Teorema de Bayes. O


que se pede a P(B/A).

Como somente podemos dizer que a seo est bem construda baseado
nas medies temos:

A = (B A) (B A)

Assim, P(A) = P(B) . P(A/B) + P( B) . P(A/ B )

P(A) = (0,90) . (0,80) + (0,10) . (0,20) = 0,74

P(B) . P(A/B) (0,90) . (0,80)


P(B/A) = = = 0,973
P(A) 0,74

Como se v, a probabilidade anterior P(B) = 0,90 agora modificada


para P(B/A) = 0,973 depois de se saber o evento: a seo est bem
construda.

Exerccios

Exerccio 4.1. Dois eventos so ditos mutuamente exclusivos se eles no tem elementos
em comum, ou seja, se eles no podem ocorrer simultaneamente. E um
grupo de eventos dito coletivamente exaustivo se eles esgotam todos os
resultados possveis para o experimento em questo. D um exemplo de
eventos mutuamente exclusivos e coletivamente exaustivo.

Exerccio 4.2. Qual a probabilidade de um candidato ao vestibular acertar o dia da


semana em que nasceu Pedro Alvarez Cabral? Que suposio voc fez
para calcular essa probabilidade?

Exerccio 4.3. Seja P(A) = 0,30 e P(B) = 0,80 e P(AB) = 0,15. Pede-se:

a) A e B so mutuamente exclusivos?
4. Probabilidade
32 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

b) Determine P(B)

c) Determine P(AB)

Exerccio 4.4. Sejam A e B mutuamente exclusivos, P(A) = 0,52 e P(B) = 0,27. Pede-
se:

a) A e B so coletivamente exaustivos?

b) Determine P(AB)

c) Determine P(AB)

Exerccio 4.5. As falhas de diferentes equipamentos so independentes uma das outras.


Se h trs equipamentos e as suas respectivas probabilidades de falha em
um determinado dia so 1%, 2% e 5%, indique:

a) a probabilidade de todos os equipamentos falharem em um mesmo dia

b) de nenhum falhar

Exerccio 4.6. Uma fbrica de azulejos tem um processo de inspeo em 3 etapas. A


probabilidade de um lote defeituoso passar sem ser detectado em uma
dessas etapas de aproximadamente 25%. Com base nessa informao,
calcule a probabilidade de um lote defeituoso passar sem ser detectado
por todas as 3 etapas.

Exerccio 4.7. H 99% de probabilidade de uma mquina fabricar uma pea sem
defeitos. Supondo que a fabricao de peas sucessivas constitua
eventos independentes, calcule as seguintes probabilidades:

a) de duas peas em seqncia serem defeituosas

b) de dez peas em seqncia sem defeitos

Exerccio 4.8. Trs mquinas A, B e C fabricam matrizes para a estamparia. O


histrico dessas mquinas revela que elas produzem respectivamente
1%, 2% e 3% de defeituosos. Um inspetor examina uma matriz e
verifica que ela est perfeita. Sabendo que cada mquina responsvel
por 1/3 da produo total, calcule a probabilidade de ela ser produzida
por cada uma das mquinas.

Exerccio 4.9. Repita o exerccio 8 para o caso em que o inspetor tivesse examinado a
matriz e verificado que ela era defeituosa.

Exerccio 4.10. Repita o exerccio 8 para o caso em que as mquinas A, B e C fossem


responsveis, respectivamente, pelos seguintes percentuais da produo
total: 20%, 40% e 40%.

Exerccio 4.11. Uma cidade tem 30 mil habitantes e trs jornais X, Y, Z. Uma pesquisa
de opinio revela que: 12 mil lem X, 8 mil Y, 7 mil X e Y, 6 mil Z,
4.500 lem X e Z, mil Y e Z e 500 lem X,Y e Z. Qual a probabilidade
de que um habitante leia:

a) pelo menos um jornal


Estatstica Industrial
4. Probabilidade 33

b) s um jornal

c) ler o jornal X sabendo que ele l o jornal Z

Exerccio 4.12. Uma empresa exploradora de petrleo perfura um poo quando acha que
h pelo menos 25% de chance de encontrar petrleo. Ela perfura 4
poos, aos quais so atribudas probabilidades de 0,3 ; 0,4 ; 0,7 e 0,8.

a) Determine a probabilidade de nenhum poo produzir petrleo, com


base nas estimativas da empresa.

b) Determine a probabilidade de os quatro poos produzirem petrleo.

c) Qual a probabilidade de s os poos com probabilidades 0,3 e 0,7


produzirem petrleo?

Exerccio 4.13. Os arquivos da polcia revelam que, das vtimas de acidente


automobilstico que utilizam cinto de segurana, apenas 10% sofrem
ferimentos graves, enquanto que a incidncia de 50% entre as vtimas
que no utilizam cinto de segurana. Estima-se que em 60% a
porcentagem dos motoristas que usam o cinto. A polcia acaba de ser
chamada para investigar um acidente em que houve um indivduo
gravemente ferido. Calcule a probabilidade de ele estar usando o cinto
no momento do acidente. A pessoa que dirigia o outro carro no sofreu
ferimentos graves. Calcule a probabilidade dela estar usando o cinto no
momento do acidente.
5
Distribuies de probabilidade
Jos Luis Duarte Ribeiro
Carla ten Caten

Conforme visto anteriormente, o histograma usado para


apresentar dados amostrais extrados de uma populao. Por
exemplo, os 50 valores de uma caracterstica dimensional
apresentados anteriormente representam uma amostra de um
processo industrial. O uso de mtodos estatsticos permite que
se analise essa amostra e se tire algumas concluses sobre o
processo de manufatura.

Uma distribuio de probabilidade um modelo matemtico


que relaciona um certo valor da varivel em estudo com a sua
probabilidade de ocorrncia. H dois tipos de distribuio de
probabilidade:

1.Distribuies Contnuas: Quando a varivel que est sendo


medida expressa em uma escala contnua, como no caso de
uma caracterstica dimensional.

2. Distribuies Discretas: Quando a varivel que est sendo


medida s pode assumir certos valores, como, por exemplo os
valores inteiros 0, 1, 2, etc.

Figura 14 - Distribuio de
probabilidade discreta e
contnua.

No caso de distribuies discretas, a probabilidade que a


varivel X assuma um valor especfico xo dados por:

Eq 51: P{X = xo} = P(xo)

No caso de variveis contnuas, as probabilidades so


especificadas em termos de intervalos, pois a probabilidade
associada a um nmero especfico zero.

b
Eq 52: P{a x b} = f ( x ) dx
a
Estatstica Industrial
Erro! Resultado no vlido para ndice. 6-35

DISTRIBUIES
DISCRETAS MAIS
IMPORTANTES

Distribuio Binomial A distribuio binomial adequada para descrever situaes em


que os resultados de uma varivel aleatria podem ser
agrupados em apenas duas classes ou categorias. As categorias
devem ser mutuamente excludentes, de forma que no haja
dvidas na classificao do resultado da varivel nas categorias
e coletivamente exaustivas, de forma que no seja possvel
nenhum outro resultado diferente das categorias.

Por exemplo, um produto manufaturado pode ser classificado


como perfeito ou defeituoso, a resposta de um questionrio pode
ser verdadeira ou falsa, as chamadas telefnicas podem ser
locais ou interurbanas.

Mesmo as variveis contnuas podem ser divididas em duas


categorias, como, por exemplo, a velocidade de um automvel
pode ser classificada como dentro ou fora do limite legal.

Geralmente, denomina-se as duas categorias como sucesso ou


falha. Como as duas categorias so mutuamente excludentes e
coletivamente exaustivas:

P ( sucesso ) + P ( falha ) = 1

Consequentemente, sabendo-se que, por exemplo, a


probabilidade de sucesso P(sucesso) = 0,6, a probabilidade de
falha P(falha) = 1 - 0,6 = 0,4.

Condies de aplicao do modelo binomial

a) so feitas n repeties do experimento, onde n uma


constante;

b) h apenas dois resultados possveis em cada repetio,


denominados sucesso e falha

c) a probabilidade p de um sucesso e (1-p) de falha permanece


constante em todas as repeties;

d) as repeties so independentes, ou seja, o resultado de uma


repetio no influenciado por outros resultados.

Seja um processo composto de uma seqncia de n observaes


independentes com probabilidade de sucesso constante igual a
p, a distribuio do nmero de sucessos seguir o modelo
Binomial:

Eq 53: ()
P( x ) = xn p x ( 1 p )n x x = 0, 1, ...., n.

onde (xn ) representa o nmero de combinaes de n objetos


6. Estimativa de parmetros
36 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

tomados x de cada vez, calculado como:

Eq 54: (xn ) = x!(nn! x)!


Os parmetros da distribuio Binomial so n e p. A mdia e
a varincia so calculadas como:

Eq 55: = np

Eq 56: 2 = np (1 p )

A distribuio Binomial usada com freqncia no controle de


qualidade. o modelo apropriado quando a amostragem feita
sobre uma populao infinita ou muito grande. Nas aplicaes
de controle da qualidade, x em geral representa o nmero de
defeituosos observados em uma amostra de n itens.

Por exemplo, se p = 0,10 e n = 15, a probabilidade de obter x


itens no conformes calculada usando a equao da binomial.
Para x=1:

Eq 57: ( 115 ) = 1!(1515! 1)! = 15


Eq 58: P( 1 ) = 15 ( ) 1
1 x 0,10 x ( 1 0 ,10 )
151
= 15 0 ,10 x 0 ,23 = 0,34

Figura 15 - Distribuio
Binomial com p = 0,10 e n =
15

Outra estatstica de interesse para o controle de qualidade a


frao de defeituosos de uma amostra:

x
Eq 59: p =
n

p(1 p )
Eq 60: 2p =
n

Distribuio de A distribuio de Poisson adequada para descrever situaes


Poisson onde existe uma probabilidade de ocorrncia em um campo ou
intervalo contnuo, geralmente tempo ou rea. Por exemplo, o
nmero de acidentes por ms, o nmero de defeitos por metro
Estatstica Industrial
Erro! Resultado no vlido para ndice. 6-37

quadrado, nmero de clientes atendidos por hora, etc.

Nota-se que a varivel aleatria discreta (nmero de


ocorrncia), no entanto, a unidade de medida contnua (tempo,
rea). Alm disso, as falhas no so contveis, pois no
possvel contar o nmero de acidentes que no ocorreram, nem
tampouco o nmero de defeitos que no ocorreram.

A distribuio de Poisson fica completamente caracterizada por


um nico parmetro que representa a taxa mdia de ocorrncia
por unidade de medida.

Condies para a aplicao do modelo de Poisson:

a) nmero de ocorrncias durante qualquer intervalo depende


somente da extenso do intervalo;

b) as ocorrncias ocorrem independentemente, ou seja, um


excesso ou falta de ocorrncias em algum intervalo no
exerce efeito sobre o nmero de ocorrncias em outro
intervalo;

c) a possibilidade de duas ou mais ocorrncias acontecerem em


um pequeno intervalo muito pequena quando comparada
de uma nica ocorrncia.

A equao para calcular a probabilidade de x ocorrncias dada


por:

e x
Eq 61: P( x ) = x = 0, 1,....
x!

A mdia e a varincia da distribuio de Poisson so:

Eq 62: =

Eq 63: =
A aplicao tpica da distribuio de Poisson no controle da
qualidade como um modelo para o nmero de defeitos (no
conformidades) que ocorre por unidade de produto (por m2, por
volume ou por tempo, etc.).

Como um exemplo, suponha que o nmero de defeitos de


pintura siga uma distribuio de Poisson com = 2. Ento, a
probabilidade que uma pea apresente mais de 4 defeitos de
pintura vir dada por:

4 e 2 2 x
Eq 64: 1 P{X 4} = 1
x =0 x!

Eq 65: 1 P{X 4} = 1 0,945 = 0,055 = 5,5%


6. Estimativa de parmetros
38 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

x P(x)

0 0,135

1 0,270

2 0,270

3 0,180

4 0,090

5 0,036
Figura 16 - Distribuio de
Poisson com = 2. 6 0,012

A distribuio de Poisson uma forma limite da distribuio


Binomial, quando n e p 0 , mas mantendo o
quociente np =

DISTRIBUIES
CONTNUAS MAIS
IMPORTANTES

Distribuio Na distribuio de Poisson, a varivel aleatria definida como


Exponencial o nmero de ocorrncias em determinado perodo, sendo a
mdia das ocorrncias no perodo definida como . Na
Distribuio Exponencial a varivel aleatria definida como o
tempo entre duas ocorrncias, sendo a mdia de tempo entre
ocorrncias de 1/.

Por exemplo, se a mdia de atendimentos no caixa bancrio de


= 6 atendimentos por minuto, ento o tempo mdio entre
atendimentos 1/ = 1/6 de minuto ou 10 segundos.

Condio de aplicao do modelo exponencial:

a) o nmero de ocorrncias deve seguir uma distribuio de


Poisson.

Se considerarmos a distribuio de Poisson como o modelo para


o nmero de ocorrncias de um evento no intervalo de [0, t]
teremos:

e t ( t ) x
Eq 66: P( x ) =
x!

E nesse caso pode ser demonstrado que a distribuio dos


intervalos entre ocorrncias ir seguir o modelo Exponencial
com parmetro . O modelo da distribuio Exponencial o
seguinte:

Eq 67: f (t ) = e t ; t0
Estatstica Industrial
Erro! Resultado no vlido para ndice. 6-39

onde > 0 uma constante.

Figura 17 - Distribuio
Exponencial.

A mdia e o desvio-padro da distribuio Exponencial so


calculados usando:

Eq 68: 1
=

1
Eq 69: =

A distribuio Exponencial acumulada vem dada por:

F (t ) = P{T t} = e x dx = 1 e t
t
Eq 70: t0
0

A distribuio Exponencial largamente utilizada no campo da


confiabilidade, como um modelo para a distribuio dos tempos
at a falha de componentes eletrnicos. Nessas aplicaes o
parmetro representa a taxa de falha para o componente, e
1/ o tempo mdio at a falha.

Por exemplo, suponha que uma mquina falhe em mdia uma


vez a cada dois anos =1/2=0,5. Calcule a probabilidade da
mquina falhar durante o prximo ano.

Eq 71: F (t ) = P{T 1} = 1 e 0,5x1 = 1 - 0,607 = 0,393

A probabilidade de falhar no prximo ano de 0,393 e de no


falhar no prximo ano de

1-0,393=0,607. Ou seja, se forem vendidos 100 mquinas


39,3% iro falhar no perodo de um ano.

Conhecendo-se os tempos at a falha de um produto possvel


definir os perodos de garantia.

Distribuio de Weibull O modelo da distribuio de Weibull :


6. Estimativa de parmetros
40 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

1
xL xL
Eq 72: f ( x) = e

x L
Eq 73: F ( x ) = 1 e

onde:

: parmetro de forma

: parmetro de escala

L: parmetro de localizao

A mdia e a varincia da distribuio de Weibull vm dadas por:

1
Eq 74: = L + 1 +

2
2 2 2 1
Eq 75: = 1 + 1 +

A distribuio de Weibull muito flexvel e pode assumir uma


variedade de formas. Ela tem sido usada extensivamente para
modelar tempos de processo ou tempos at a falha de
componentes eltricos, componentes mecnicos, elementos
estruturais e sistemas complexos.

Distribuio Normal A distribuio Normal a mais importante das distribuies


estatsticas, tanto na teoria como na prtica. Uma das razes,
que a distribuio Normal representa a distribuio de
freqncia de muitos fenmenos naturais. Outra razo que a
distribuio Normal serve como aproximao da distribuio
Binomial, quando n grande. No entanto, o motivo mais
importante que as mdias e as propores de grandes amostras
segue a distribuio Normal, como ser visto no teorema do
Limite Central.

A distribuio de freqncia do modelo Normal apresenta forma


de sino, unimodal, simtrica em relao sua mdia e tende
assintoticamente a zero medida que os valores se afastam da
mdia. Ou seja, teoricamente os valores da varivel aleatria
podem variar de a + .

Em termos de probabilidade de ocorrncia, a rea sob toda a


curva normal soma 100%. A probabilidade de uma observao
proveniente de uma varivel aleatria normal assumir um valor
entre dois pontos quaisquer igual rea compreendida entre
esses dois pontos.
Estatstica Industrial
Erro! Resultado no vlido para ndice. 6-41

rea=1

rea=0,5 rea=0,5

Figura 18 - Percentuais da
distribuio Normal.

A distribuio Normal fica complemente caracterizada por dois


parmetros: a mdia e o desvio-padro. Ou seja, diferentes
mdias e desvio-padres originam curvas normais distintas,
como se pode visualizar nos exemplos contidos na Tabela 4
onde h amostras provenientes de distribuies com mdia e
desvios-padres distintos.

Amostras Dados Localizao ( x ) Variabilidade (R)


A 10 12 14 16 x = 14 R =8
18
B 22 24 26 28 x = 26 R =8
Tabela 4 - Amostras de trs 30
distribuies distintas. C 6 10 14 18 22 x = 14 R = 16
6. Estimativa de parmetros
42 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

f(x)

A B

Figura 19 - Distribuio de
probabilidade com mdia e
desvios-padres distintos.

Na Figura 19, pode-se visualizar que:

a) da distribuio A para B muda a tendncia central, mas a


variabilidade constante;

b) da distribuio A para C muda a variabilidade, mas a


tendncia central constante;

c) da distribuio B para C muda a tendncia central e a


variabilidade.

Uma conseqncia importante do fato de uma distribuio


Normal ser completamente caracterizada por sua mdia e
desvio-padro que a rea sob a curva entre um ponto qualquer
e a mdia funo somente do nmero de desvios-padres que
o ponto est distante da mdia.

Como existem uma infinidade de distribuies normais (uma


para cada mdia e desvio-padro), transformamos a unidade
estudada seja ela qual for (peso, espessura, tempo, etc.) na
unidade Z, que indica o nmero de desvios-padro a contar da
mdia.

Dessa forma, o clculo de probabilidades (rea sob a curva)


pode ser realizado atravs de uma distribuio Normal
padronizada, onde o parmetro a varivel reduzida Z, que
representa o nmero de desvios-padres distantes da mdia.

A distribuio Normal pode ser representada por uma equao


matemtica dada por:

1 x 2

1
e 2
Eq 76:
f ( x) =
2

A distribuio Normal acumulada obtida calculando a


probabilidade de X ser menor que um dado valor xo:

x
Eq 77: P ( X xo ) = F ( xo ) = o f ( x ) dx

Essa integral no pode ser resolvida em forma fechada, mas a


soluo est apresentada em tabelas da distribuio Normal
Estatstica Industrial
Erro! Resultado no vlido para ndice. 6-43

padronizada onde se entra com a varivel reduzida Z (nmero


de desvios-padres distantes da mdia) e encontra-se F(Z) ou
vice-versa.

x
Eq 78: P{X x} = P Z = F ( Z ) Tabelado

Para sabermos o valor da probabilidade, utilizamos a tabela da


distribuio Normal. Essa tabela nos fornece a rea acumulada
at o valor de Z

rea=0,84

Figura 20 1,0

0,84

0,0
O clculo da varivel reduzida Z feito atravs da
transformao dos valores reais em valores codificados. Essa
transformao feita descontando-se a mdia para eliminar o
efeito de localizao (tendncia central) e dividindo-se pelo
desvio-padro para eliminar o efeito de escala (variabilidade).

Uma vez calculada a varivel reduzida Z, consulta-se a tabela


Normal padronizada para identificar a probabilidade acumulada
esquerda de Z, ou seja, a probabilidade de ocorrerem valores
menores ou iguais a um certo valor de Z consultado.

A seguir sero apresentados exemplos do clculo do percentual


fora de especificao.

Exemplo 1 A resistncia trao do papel usado em sacolas de super


mercado uma caracterstica de qualidade importante. Sabe-se
que essa resistncia segue um modelo Normal com mdia 40 psi
e desvio padro 2 psi. Se a especificao estabelece que a
resistncia deve ser maior que 35 psi, qual a probabilidade que
uma sacola produzida com este material satisfaa a
especificao?

P{X 35} = 1 P{X 35}

35 40
P{X 35} = P Z = P{Z 2,5}
2
6. Estimativa de parmetros
44 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Tabela da distribuio normal: F(-2,5) = 0,0062

Assim a resposta 1 - 0,0062 = 99,38%

Figura 21 - Distribuio de
valores reais e codificados.

Distribuio para X (valores reais) Distribuio para Z (valores


codificados)

Exemplo 2 O dimetro do eixo principal de um disco rgido segue uma


distribuio Normal com mdia 25,08 in e desvio-padro 0,05
in. Se as especificaes para esse eixo so 25,00 0,15 in,
determine o percentual de unidades produzidas em
conformidades com as especificaes.

Eq 79: P{24,85 x 25,15} = P{x 25,15} P{x 24,85}

25,15 25,08 24,85 25,08


= P Z P Z
0,05 0,05

= P{Z 1,40} P{Z 4,60} = 0,9192 0,0000 = 0,9192

ou seja, 91,92% (rea cinza na figura abaixo) dentro das


especificaes e 8,08% fora das especificaes.

LEI x LES

=0,05

Figura 22- Distribuio de


probabilidade do processo e os
limites de especificao 24,85 25,08 25,15

Exemplo 3 No exemplo anterior tem-se cerca de 8% de unidades no-


-conformes, e essas unidades so invariavelmente do tipo eixo
muito largo. Recalcule o percentual de unidades conformes se
o processo estivesse centrado em 25,00.

25,15 25,00 24,85 25,00


P Z P Z
0,05 0,05

P{Z 3,0} P{Z 3,0} = 0,9987 0,00135 = 0,9973


Estatstica Industrial
Erro! Resultado no vlido para ndice. 6-45

ou seja, 99,73% dentro das especificaes e 0,27% fora das


especificaes.

Exemplo 4 Suponha que X N (85; 9). Encontre um valor limite x, tal


que P{ X > x} = 0,05.

x 85
P{ X > x} = 1 P{ X x} = 1 P Z = 0,05
9

x 85
P Z = 0,95
9

Tabela da distribuio normal: Z = 1,645

x 85
Assim, 1,645 = ; x = 99,805
9

PROPRIEDADES DA A distribuio Normal tem muitas propriedades teis. Uma


DISTRIBUIO dessas propriedades que qualquer combinao linear de
NORMAL variveis normalmente distribudas tambm seguir o modelo
Normal, ou seja:

Se X1, X2,........., Xn tm distribuio normal independentes,


ento uma combinao linear dessas variveis, por exemplo,

Eq 80: Y = a1X1 + a2X2 +.....+ akXk

Tambm Seguir o modelo normal, com mdia e varincia


dados por:

Eq 81: = a11 +.......+ an n

Eq 82:
Y2 = a12 12 +........+ an2 n2

onde a1, ..., an so constantes.

Teorema do Limite O Teorema do Limite Central indica que a soma (e, por
Central conseguinte, a mdia) de n variveis independentes seguir o
modelo Normal, independentemente da distribuio das
variveis individuais.

A aproximao melhora na medida em que n aumenta. Se as


distribuies individuais no so muito diferentes da Normal,
basta n = 4 ou 5 para se obter uma boa aproximao. Se as
distribuies individuais forem radicalmente diferentes da
Normal, ento ser necessrio n = 20 ou mais.

Na Figura 23, pode ser visto um desenho esquemtico do


teorema do limite central.
6. Estimativa de parmetros
46 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Figura 23 - Teorema do limite


central. n

f(x)

x
Figura 24
LNI LCI x = LCS LNS

Os limites da distribuio dos valores individuais so chamados


de limites naturais e os limites da distribuio de probabilidade
das mdias so chamados de limites de controle.

Exemplo 5 A distribuio de probabilidade da varivel resultante do


lanamento de um dado segue a distribuio uniforme, ou seja,
qualquer valor (1, 2, 3, 4, 5, 6) tem a mesma probabilidade (1/6)
de ocorrer. No entanto, se ao invs de lanar um dado, sejam
lanados dois dados e calculada a mdia, essa mdia seguir
uma distribuio aproximadamente Normal como pode-se
visualizar no histograma abaixo. Na Tabela 5, apresenta-se as
mdias dos lanamentos de dois dados

10 20 Soma Mdia 10 20 Soma Mdia


dado dado dado dado
1 1 2 1,0 5 2 7 3,5
1 2 3 1,5 3 4 7 3,5
2 1 3 1,5 4 3 7 3,5
1 3 4 2,0 2 6 8 4,0
3 1 4 2,0 6 2 8 4,0
2 2 4 2,0 3 5 8 4,0
1 4 5 2,5 5 3 8 4,0
4 1 5 2,5 4 4 8 4,0
3 2 5 2,5 3 6 9 4,5
2 3 5 2,5 6 3 9 4,5
Tabela 5 - Tabela com as 1 5 6 3,0 4 5 9 4,5
mdias dos dois dados.
5 1 6 3,0 5 4 9 4,5
Estatstica Industrial
Erro! Resultado no vlido para ndice. 6-47

2 4 6 3,0 4 6 10 5,0
4 2 6 3,0 6 4 10 5,0
3 3 6 3,0 5 5 10 5,0
1 6 7 3,5 5 6 11 5,5
6 1 7 3,5 6 5 11 5,5
2 5 7 3,5 6 6 12 6,0

A tabela de freqncia da mdia dos dois dados resulta


conforme Tabela 6.

Mdia de dois dados Freqncia


1,0 1
1,5 2
2,0 3
2,5 4
3,0 5
3,5 6
4,0 5
4,5 4
5,0 3
Tabela 6 - Tabela de freqncia da 5,5 2
mdia dos dois dados.
6,0 1

Conforme pode ser visto na Figura 25, o histograma da mdia


dos dois dados resulta aproximadamente Normal. Alm disso,
observa-se que a aproximao da distribuio Normal melhora
na medida que se fizesse a mdia do lanamento de mais dados.

f(x)
6/36

5/36

4/36

3/36

2/36

1/36

Figura 25 - Histograma da
1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 x
mdia dos dois dados.

O teorema do limite central bsico para a maioria das


aplicaes do controle estatstico da qualidade. O controle
estatstico do processo, em geral, trabalha com a mdia das
6. Estimativa de parmetros
48 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

amostras, pois independentemente da distribuio dos valores


individuais, a mdia desses valores ir seguir aproximadamente
a distribuio Normal.

A partir do teorema do limite central, sabe-se que a distribuio


amostral das mdias apresenta os seguintes parmetros:

Eq 83: Mdia: x =

onde:

x representa a mdia das mdias amostrais;

representa a mdia dos valores individuais da populao.


Eq 84: Desvio-padro: x =
n

onde:

x representa o desvio-padro das mdias amostrais;

representa o desvio-padro dos valores individuais da


populao;

n representa o tamanho da amostra.

Exemplo 6 Um pesquisador deseja saber a mdia de idade dos alunos de ps-


-graduao. Supondo que a populao dos alunos seja:

25, 35, 24, 43, 35, 22, 49, 56, 34, 26, 35, 52, 40, 35, 35,25,

61,42, 58, 56, 45, 40, 38, 45, 33, 53, 22, 35, 23, 25, 36, 39

= x i = 25 + ... + 39 = 38,19
N 32

=
( xi ) 2
=
(25 38,19)2 + ... + (39 38,19)2 = 11,11
N 32

Exemplo 7
Supondo que no fosse possvel analisar a populao inteira, e os
dados fossem coletados por amostras de tamanho n=4.

1 2 3 4 5 6 7 8
25 35 24 43 35 22 49 56
34 26 35 52 40 35 35 25
61 42 58 56 45 40 38 45
33 53 22 35 23 25 36 39
Mdia( x ) 38,25 39 34,75 46,5 35,75 30,5 39,5 41,25
Estatstica Industrial
Erro! Resultado no vlido para ndice. 6-49

Desvio(S) 15,69 11,4 16,52 9,40 9,43 8,43 6,45 12,9

x=
xi =
38,25 + ... + 41,25
= 38,18
k 8

2
x i x
x = =
k 1

=
(38,25 38,18)2 + ... + (41,25 38,18)2 = 4,75
8 1

x = 38 ,18 = 38 ,19

11,11
x = 4,75 x = = = 5,55
n 4
Exemplo 3 Com base no exemplo 2, supomos que os dados fossem coletados por
amostras de tamanho n=8.

1 2 3 4
25 24 35 49
34 35 40 35
61 58 45 38
33 22 23 36
35 43 22 56
26 52 35 25
42 56 40 45
53 35 25 39
Mdia ( x ) 38,62 40,62 33,12 40,37
Desvio (S) 12,71 13,94 8,74 9,50

x=
xi =
38,62 + ... + 40,37
= 38,18
k 4

(x i x )
2
x = =
(38,62 38,18)2 + ... + (40,37 38,18)2 = 3,49
k 1 4 1

x = 38,18 = 38,19

11,11
x = 3,49 x = = = 3,93
n 8

Como aparece ilustrado na Figura 26, a mdia das mdias


amostrais igual a mdia dos valores individuais e o desvio-
padro das mdias menor do que o desvio-padro dos valores
individuais na razo de 1 / n .
6. Estimativa de parmetros
50 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

f(x)

Figura 26 - Distribuio de
probabilidade dos valores LNI LCI x = LCS LNS
individuais versus distribuio
de probabilidade das mdias.

Exerccios

Exerccio 5.1 Suponha que dois dados sejam lanados e seja X a soma dos
valores obtidos. Descreva o espao amostral deste experimento e
determine a distribuio de probabilidade de X.

Exerccio 5.2 Um processo industrial opera com mdia de 1% de defeituosos.


Baseado em amostras de 100 unidades, calcule as probabilidades
de uma amostra apresentar 0, 1, 2, 3 e 4 defeituosos. Plote a
distribuio de probabilidade correspondente.

Exerccio 5.3 Imagine que para o processo anterior, fossem coletadas amostras
de 50 unidades e o critrio para parar o processo e procurar causas
especiais fosse X = 1 ou mais. Calcule a percentagem de vezes
que o processo seria interrompido logo aps a amostragem.

Exerccio 5.4 Em uma indstria automotiva, defeitos superficiais de pintura


ocorrem a uma taxa de 0,15 defeitos/unidade. Encontre a
probabilidade que uma unidade escolhida ao acaso apresente 1 ou
mais defeitos superficiais.

Exerccio 5.5 O setor financeiro de uma loja de departamentos est tentando


controlar o nmero de erros cometido na emisso das notas fiscais.
Suponha que esses erros sigam o modelo de Poisson com mdia
= 0,03. Qual a probabilidade de uma nota selecionada ao acaso
conter 1 ou mais erros?

Exerccio 5.6 A resistncia trao de isoladores cermicos apresenta


distribuio Normal com mdia 95 Kg e desvio-padro 4 Kg. Se
so produzidas 10.000 unidades desses isoladores, quantos
apresentaro resistncia inferior a 85 Kg? E quantos apresentaro
resistncia superior a 90 Kg?

Exerccio 5.7 A sada de uma bateria segue o modelo Normal com mdia 12,15
V e desvio-padro 0,2 V. Encontre o percentual que ir falhar em
atender s especificaes 12 V 0,5 V.

Exerccio 5.8 Se X representa medies feitas em um processo que segue o


modelo Normal com mdia 100 e desvio padro 10, que
comportamento ir seguir a mdia de amostras de 4 unidades
retiradas desse processo? E qual ser o comportamento da mdia
de 9 unidades retiradas desse processo?
Estatstica Industrial
Erro! Resultado no vlido para ndice. 6-51

Exerccio 5.9 Os tempos at a falha de um dispositivo eletrnico seguem o


modelo Exponencial, com uma taxa de falha = 0,012 falhas/hora.
Plote a distribuio de probabilidade correspondente. Depois
indique qual a probabilidade de um dispositivo escolhido ao acaso
sobreviver a 50 horas? E a 100 horas?

Exerccio 5.10 O tempo at a venda de um certo modelo de eletrodomstico, que


regularmente abastecido em um supermercado, segue uma
distribuio Exponencial, com parmetros = 0,4 aparelhos/dia.
Indique a probabilidade de um aparelho indicado ao acaso ser
vendido logo no primeiro dia.

Exerccio 5.11 Num lote que tem 2% de defeituosos, foram retiradas 40 peas,
que ser rejeitado se forem encontradas duas ou mais peas
defeituosas. Qual a probabilidade de rejeitar o lote?

Exerccio 5.12 Os registros de uma pequena companhia indicam que 40% das
faturas por ela emitidas so pagas aps o vencimento. De 14
faturas expedidas, determine a probabilidade de:

a) nenhuma ser paga com atraso.

b) no mximo 2 serem pagas com atraso.

c) pelo menos 3 serem pagas com atraso.

d) uma ser paga em dia.

Exerccio 5.13 Uma amostra de 3 m de cabo foi retirada de uma bobina. O cabo
tem em mdia uma falha por m. Qual a probabilidade de no
encontrar falha na amostra?

Exerccio 5.14 O tempo necessrio, em uma oficina, para o conserto de


transmisso para certo carro normalmente distribudo com mdia
45 min e desvio-padro 8 min. O mecnico planeja comear o
conserto do carro 10 min aps o cliente deix-lo na oficina,
comunicando que o carro estar pronto em 1 h. Qual a
probabilidade de que o cliente tenha que esperar caso o mecnico
esteja enganado e o cliente fique esperando?

Exerccio 5.15 Uma fbrica de pneus fez um teste para medir o desgaste de seis
pneus e verificou que ele seguia o comportamento de uma curva
normal com mdia 48.000 km e desvio-padro de 2.000 km.
Calcule a probabilidade de um pneu escolhido ao acaso:

a) dure mais que 47.000 km?

b) dure entre 45.000 e 51.000 km?

c) at que quilometragem duram 90% dos pneus?

Exerccio 5.16 O consumo de gasolina por Km rodado para certo tipo de carro,
tem distribuio normal com mdia de 100 ml com desvio-padro
de 5 ml.

a) calcular a probabilidade de um carro consumir entre 92 e 106


6. Estimativa de parmetros
52 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

ml.

b) sabe-se que 73,24% dos carros consumem menos que certa


quantidade de gasolina qual essa quantidade?

c) num grupo de 5 carros qual a probabilidade de dois consumirem


mais que 107 ml?

Exerccio 5.17 Em uma indstria trabalham 1260 pessoas, cujos os salrios tem
mdia $34.600 e desvio-padro $ 8.500. Calcule a probabilidade
de ser inferior a $34.100 o valor da mdia de uma amostra
aleatria constituda por:

300 pessoas

100 pessoas
6
Estimativa de parmetros
Jos Luis Duarte Ribeiro
Carla ten Caten

Uma varivel aleatria caracterizada ou descrita pela sua distribuio


de probabilidade. Em aplicaes industriais, as distribuies de
probabilidade so usadas para modelar tempos de processo ou
caractersticas de qualidade tais como dimensionais crticos ou
percentuais de no conformes.

A distribuio de probabilidade, por sua vez, descrita pelos seus


parmetros populacionais. Por exemplo, a mdia e o desvio-padro
so os parmetros populacionais da distribuio Normal, enquanto
o parmetro da distribuio de Poisson.

Em aplicaes industriais, as distribuies so usadas para modelar


tempos de processo ou caractersticas de qualidade tais como
dimensionais crticos ou percentuais de no conformes.

Assim, existe interesse em conhecer os parmetros populacionais da


distribuio de probabilidade. Como geralmente os parmetros
populacionais da distribuio de probabilidade no so conhecidos,
preciso desenvolver procedimentos para estimar esses parmetros.

As estimativas dos parmetros populacionais da distribuio so


realizadas a partir dos resultados (dados) de uma varivel aleatria de
uma amostra representativa extrada dessa populao. Esse
procedimento chamado de estatstica inferencial, pois estima-se um
parmetro populacional desconhecido da distribuio de probabilidade
atravs de uma amostra representativa extrada dessa populao.

A estatstica inferencial compreende a estimao de parmetros


populacionais e testes de hiptese a respeito da populao. Na verdade, a
estatstica inferencial forma a base das atividades de controle da
qualidade e tambm pode auxiliar na tomada de deciso e em muitas
outras situaes.

ESTIMATIVAS PONTUAIS A estimao de parmetros populacionais pode ser por ponto (pontual)
ou por intervalo de confiana. A estimativa pontual um valor obtido a
partir dos resultados (dados) de uma varivel aleatria de uma amostra
representativa extrada da populao.

Seja a varivel aleatria X, com distribuio de probabilidade f(X), e


seja que o valor dos parmetros populacionais da mdia e da
varincia 2 so desconhecidos. Se uma amostra representativa da
varivel aleatria X extrada da populao, a mdia X e a varincia
S2 dessa amostra podem ser usadas como estimadores pontuais dos
6. Estimativa de parmetros
54 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

parmetros populacionais e 2.

Por exemplo, pode haver interesse em estimar a mdia e a varincia de


uma caracterstica dimensional de um processo. Se uma amostra de 15
unidades indica X = 5,026 cm e S = 0,0012 cm2, ento esses valores so
tomados como estimativas pontuais dos parmetros populacionais e
2.

H vrias propriedades que fazem um estimador ser um bom estimador,


entre elas citamos:

1. Um estimador deve ser no tendencioso, isto , ele no deve


subestimar ou superestimar sistematicamente o valor do parmetro que
est sendo estimado.

2. Ele deve apresentar varincia mnima, isto , sua variabilidade deve


ser menor que a variabilidade de qualquer outro estimador que possa ser
concebido.

ESTIMATIVAS POR A estimao de parmetros populacionais por intervalo de confiana


INTERVALO DE consiste em gerar um intervalo, centrado na estimativa pontual, no qual
CONFIANA se admite que esteja o parmetro populacional.

A estimativa pontual calculada a partir de uma amostra extrada da


populao. No entanto, pode-se extrair vrias amostras de uma
populao. Por exemplo, conforme Figura 27, para estimar a mdia
populacional () pode-se retirar vrias amostras diferentes que podem
gerar vrias estimativas pontuais X diferentes.

Figura 27 - Diferentes amostras


retiradas de uma populao Populao x

=? x


xk

Se a amostra for representativa da populao, ela tende a gerar valor


prximo do parmetro populacional, mas no igual. Como a estimativa
baseada em uma nica amostra, o quo prximo o valor encontrado
nessa amostra est do verdadeiro parmetro populacional?

No h como saber se a amostra coletada foi extrada da cauda superior


ou inferior da distribuio.

Logo, para se ter confiana de estimar o verdadeiro parmetro


populacional, gera-se um intervalo de possveis valores para o parmetro
populacional, a partir do valor encontrado da amostra. Quanto maior a
amplitude do intervalo, maior a confiana (probabilidade) de estimar
corretamente o verdadeiro parmetro populacional.
Estatstica Industrial
6. Estimativa de parmetros 55

Figura 28 - Intervalo de confiana Intervalo


centrado em um valor amostral
de confiana

x - z x
/2
x x + z x
/2

Conforme a amplitude do intervalo, existe uma probabilidade (1-) de


que o parmetro populacional esteja contido no intervalo. Essa
probabilidade (1-) chamada nvel de confiana, sendo a
probabilidade do erro, ou seja, a probabilidade do intervalo no conter o
verdadeiro parmetro populacional.

Um intervalo de confiana de 100(1-)% estabelecido a partir de dois


limites, tais que a probabilidade do verdadeiro valor do parmetro estar
includo dentro do intervalo 100(1-)% .

Por exemplo, para construir um intervalo de confiana de 95% para a


mdia , ns precisamos achar os limites L e U tais que:

Eq 85: P{L U } = 95%

A interpretao do intervalo de confiana a seguinte: se um grande


nmero desses intervalos fosse construdo, a partir de diversas amostras
aleatrias, ento 95% desses intervalos iria incluir o verdadeiro valor da
mdia populacional , ou seja, 5% dos intervalos de confiana
estimados baseados nas mdias amostrais no conteria o verdadeiro
parmetro populacional .

O intervalo de confiana apresentado acima um intervalo bilateral.


Tambm pode haver interesse em construir intervalos unilaterais. O
limite inferior para um intervalo unilateral de 100(1-)% definido
calculando-se o valor de L tal que:

Eq 86: P{L } = 1

O limite superior para um intervalo unilateral de 100(1-)% definido


calculando-se o valor tal que:

Eq 87: P{ U } = 1

INTERVALO DE Seja X uma varivel aleatria qualquer que siga a distribuio Normal
CONFIANA PARA A X N(, ) e seja x1, ..., xn uma amostra aleatria desse processo. A
MDIA, VARINCIA partir do teorema do limite central, sabe-se que a distribuio da mdia
CONHECIDA segue a distribuio Normal. Mais ainda, para n suficientemente grande
este resultado vlido mesmo que a distribuio de origem no seja
Normal.

Seja que uma varivel aleatria X tenha mdia desconhecida e varincia


conhecida. E seja que amostras dessa populao apresentem mdia igual
a X , conforme Figura 29.
6. Estimativa de parmetros
56 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Figura 29 - Distribuio amostral


das mdias Distribuio amostral de x

Amostra 1
x1-1,96x x1 x1+1,96x

Amostra 2
x2

Amostra 3
x3

Como pode-se observar na Figura 29, para obter-se um intervalo de


confiana de 95% (1- = 0,95, = 0,05), ou seja, 95% dos intervalos,
construdos a partir das amostras coletadas, contenham o verdadeiro
parmetro populacional, preciso gerar um intervalo cuja amplitude
contenha 95% das possveis amostras coletadas. Ou seja, um intervalo

proporcional a Z / 2 , onde Z / 2 neste caso Z 0,025 =1,96.
n

/2 /2

Figura 30 - Intervalo de confiana de


95%. -1,96 +1,96

O intervalo bilateral de confiana de 100(1-)% para :

Eq 88:
X Z / 2 X + Z / 2
n n

Observa-se que, para n suficiente grande, as mdias seguem a


( )
distribuio Normal X N , / n independentemente da
distribuio original de X. Consequentemente, a Eq 88 o intervalo de
confiana para a mdia de observaes que apresentam uma distribuio
de origem qualquer.
Estatstica Industrial
6. Estimativa de parmetros 57

Exemplo 1 A variabilidade do tempo de atendimento em um caixa bancrio


conhecida = 0,10 min. Uma amostragem com 20 pessoas indicou
tempo mdio de atendimento de X = 1,5 min . Construa um intervalo de
confiana de 95% para o tempo mdio de atendimento.


X Z / 2 X + Z / 2
n n

0,10 0,10
1,5 1,96 1,5 + 1,96
20 20

0,10 0,10
1,5 1,96 1,5 + 1,96
20 20

1,46 1,54

Um intervalo unilateral de 100(1-)% com limite superior


estabelecido a partir de:


Eq 89: X + Z
n

Um intervalo unilateral de 100(1-)% com limite inferior :


Eq 90: X Z
n

ERRO DE ESTIMAO
O intervalo de confiana bilateral tem a forma X Z / 2 .
n

Aumentando a amplitude do intervalo, aumenta-se o nvel de confiana


do intervalo, no entanto, aumenta-se o erro mximo de estimao que o
valor absoluto da diferena entre o parmetro amostral ( X ) e o
parmetro populacional , representado como = X .

Como o intervalo de confiana tem centro na mdia amostral, o erro


mximo igual a metade da amplitude do intervalo.


Como X Z / 2 , pode-se escrever X erro
n


Onde erro: e = Z / 2
n

Para determinar o tamanho da amostra mnimo para estimar um


parmetro populacional, basta isolar o valor de n na equao acima.
6. Estimativa de parmetros
58 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Eq 91: 2

n = Z / 2
e

Como pode ser visto, o tamanho da amostra depender:

- grau de confiana desejado;

- disperso na populao ;

- valor especificado para o erro tolervel.

Exemplo 2 Qual o tamanho da amostra necessrio para estimar a mdia


populacional de uma caracterstica dimensional de um processo cujo
desvio-padro = 3 cm, com 95% de confiana e preciso de 0,5 cm ?

= 0,05 ==> z/2 = 1,96; = 3,0 cm; e = 0,5 cm?

2
1,96 3,0
n= = 138,3
0,5

Logo, so necessrios n = 139 peas

INTERVALO DE Outra distribuio muito til a distribuio de Student t. Sejam X e


CONFIANA PARA A 2 variveis aleatrias independentes normal-padronizada e qui-
MDIA, VARINCIA quadrada. Ento, a varivel:
DESCONHECIDA

X
Eq 92:
tk =
k2 / k

Segue a distribuio t com k graus de liberdade. Sua funo


densidade de probabilidade :

(k +1) / 2
[(k + 1) / 2] t 2

f ( t ) = + 1
Eq 93: k (k/2) k

<t <
Estatstica Industrial
6. Estimativa de parmetros 59

Figura 31 - Distribuio de Student t.

Exemplo 3 Exemplo de uso da distribuio t:

Seja X N ( , ) ; X1, ..., Xn uma amostra aleatria. Ento:

X
Eq 94: X = / n = N (0,1)
S/ n S / n21 / (n 1)

Ou seja,

X
Eq 95: t
S/ n

De forma que a distribuio t a base para inferncias a respeito de X


quando 2 no conhecido.

Seja X uma varivel aleatria Normal com mdia e varincia


desconhecidas. Se uma amostra de n valores indica mdia X e
varincia S2, o intervalo de confiana de 100(1-)% calculado usando-
se a distribuio de Student t.

S S
Eq 96: X t / 2, n 1 X + t / 2, n 1
n n

Os intervalos unilaterais de confiana de 100(1-)% com limites


superior e inferior so respectivamente:

S
Eq 97: X + t , n 1
n

S
Eq 98: X t , n 1
n

Exemplo 2 A quantidade mensal de produtos entregues por uma empresa segue uma
6. Estimativa de parmetros
60 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

distribuio Normal com mdia e varincia desconhecidas. Analise os


dados a seguir, que representam uma amostra de 20 meses e construa um
intervalo de 95% para a mdia.

17,4 18,2 18,3 18,8 19,0 19,2 19,3 19,6 19,6 19,9
20,2 20,2 20,5 20,7 20,9 21,0 21,3 21,5 21,9 22,6

X = 20,01
S = 1,34
t0,025;19 = 2,093
1,34 1,34
20,01 2,093 20,01 + 2,093
20 20
ou
19,38 20,64

Exemplo 4 A empresa pode estar preocupada exclusivamente com a quantidade


mensal de produtos entregues muito baixa. Construa um intervalo de
confiana unilateral com 95% de confiana no limite inferior.

t 0,05;19 = 1,729
1,34
20,01 1,729 ou 19,49
20

Exemplo 5 Qual o tamanho da amostra necessrio para estimar a mdia


populacional de uma caracterstica dimensional de um processo com
95% de confiana e preciso de 0,5cm ?

Sem conhecimento da variabilidade populacional, estima-se o desvio-


padro populacional atravs de uma amostra piloto.

A partir de uma amostra de 20 peas, calculou-se o desvio-padro S.

7 11 12 11 13 8 15 8 11 16
10 12 9 6 11 10 11 10 12 9

Como a variabilidade no previamente conhecida, mas calculada a


partir da amostra, usa-se a distribuio Student t.

= 0,05 ==> t0.025,19 = 2,093 e = 0,5 cm, S=2,45

2 2
t / 2,n 1S 2,093x 2,46
n = = = 106
e 0,5

Logo necessrio coletar mais 86 (106-20) peas.

INTERVALO DE Sejam X1 e X2 duas variveis aleatrias com mdias 1 e 2


CONFIANA PARA A desconhecidas e varincias 1 e 2 conhecidas. Um intervalo de
DIFERENA ENTRE DUAS confiana 100(1-)% para a diferena entre as mdias pode ser
MDIAS, VARINCIA
Estatstica Industrial
6. Estimativa de parmetros 61

CONHECIDA construdo a partir dos resultados de amostras aleatrias de cada uma


dessas populaes.

Pode ser demonstrado que a varincia das diferenas entre as mdias


vem dada por:

12 2
Eq 99: 2 = + 2
n1 n2

Assim o intervalo de confiana bilateral de 100(1-)% ser:

Eq 100: ( X 1 X 2 ) Z / 2 ( 1 2 ) ( X 1 X 2 ) + Z / 2

E os correspondentes intervalos unilaterais sero:

Eq 101: (1 2 ) (X 1 X 2 ) + Z
(1 2 ) (X 1 X 2 ) Z
INTERVALO DE Sejam X1 e X2 duas variveis aleatrias Normais com mdias 1 e 2
CONFIANA PARA A e varincias 12 e 2 2 desconhecidas. Se for possvel assumir que as
DIFERENA ENTRE DUAS
MDIAS, VARINCIA varincias sejam iguais, ou seja, 12 = 2 2 , uma estimativa da
DESCONHECIDA varincia pode ser obtida como:

2 (n1 1)S12 + (n 2 1)S 2 2


Eq 102: Sp =
n1 + n 2 2

Uma vez encontrada a estimativa da varincia dos valores individuais,


pode ser demonstrado que a estimativa da varincia da diferena entre as
mdias ser:

S p2 S p2
Eq 103: S2 = + = S 2 1 + 1
n1 p
n2 n1 n 2

com graus de liberdade v = n1 + n2 2 . De modo que o intervalo de


confiana bilateral 100(1-)% ser:

Eq 104 ( X 1 X 2 ) t / 2, S ( 1 2 ) ( X 1 X 2 ) + t / 2, S

Os correspondentes intervalos de confiana unilaterais sero:

Eq 105 (1 2 ) (X 1 X 2 ) + t , S
(1 2 ) (X 1 X 2 ) t , S
Exemplo 6 Um eixo deve ser montado no interior de um rolamento. Uma amostra
de doze unidades indicou para o dimetro interno do rolamento
X 1 = 2,538cm e S1 = 0,008 ; e para o dimetro do eixo
X 2 = 2,520cm e S 2 = 0,006 . Calcule o intervalo de confiana de
6. Estimativa de parmetros
62 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

99% para a folga de montagem.

Soluo: Supondo varincias iguais tm-se:

S p2 =
(11)0,008 2 + (11)0,006 2 = 0,000050
12 + 12 2
1 1
S = S p 2 + = 0,00289
12 12
= 12 + 12 2 = 22
t 0,005;22 = 2,82

Assim o intervalo de confiana de 99% para a folga mdia resulta:

(2,538 2,52) 2,82(0,00289) folga (2,538- 2,52) + 2,82(0,00289)


0,00986 folga 0,026

INTERVALO DE No caso em que se deseja comparar dois sistemas possvel, e s vezes


CONFIANA PARA A necessrio, trabalhar com a diferena entre as observaes.
DIFERENA ENTRE
OBSERVAES Por exemplo, para comparar dois mtodos de tratamento contra corroso,
pode-se escolher diversos blocos de terreno, colocar dois tubos (de
marcas diferentes ) em cada bloco e observar as diferenas.

Seja

X1 os resultados do sistema 1;

X2 os resultados do sistema 2;

d = X 1 X 2 , as diferenas medidas bloco a bloco.

A partir dos resultados de n blocos, calcula-se d e Sd e usa-se a


distribuio Student t para construir o intervalo de confiana para a
mdia da diferena d :

S S
Eq 106 d t / 2 d d d + t / 2 d
n n

Se o valor zero estiver contido neste intervalo, ento, no pode ser


descartada a hiptese que o desempenho dos dois sistemas seja o
mesmo.

Exemplo 7 Uma empresa quer verificar se o conhecimento de seus alunos a respeito


de um determinado assunto melhorou aps 30 horas de treinamento.
Para isso foi realizado com os quinze alunos do treinamento um teste
antes e aps o treinamento. Os dados a seguir representam as notas
obtidas pelos alunos. Conclua a respeito da eficincia do treinamento
com 95% de confiana.

Alunos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Antes 6,5 6,7 7,0 7,0 6,5 7,3 7,8 6,9 6,7 7,2 7,5 7,5 7,2 7,0 6,8
Estatstica Industrial
6. Estimativa de parmetros 63

Depois 7,5 7,7 7,9 8,0 7,4 8,3 8,8 8,9 7,7 8,2 8,5 8,5 8,2 8,0 8,8
Difer. 1,0 1,0 0,9 1,0 0,9 1,0 1,0 2,0 1,0 1,0 1,0 1,0 1,0 1,0 2,0

d = 1,12
S d = 0,36
t0,025;14 = 2,145
0,36 0,36
1,12 2,145 1,12 + 2,145
15 15
ou
0,92 d 1,32

Como o valor zero no est includo no intervalo, rejeita-se a hiptese de


que as notas antes e depois sejam as mesmas, logo conclui-se que o
treinamento foi eficiente.

INTERVALO DE Outra distribuio importante, definida a partir da distribuio Normal


CONFIANA PARA A a distribuio do Qui-quadrado 2 .
VARINCIA
Seja X N(0, 1)

E seja x1, ..., xn uma amostra aleatria deste processo.

Ento, a varivel aleatria

Eq 107: n2 = x12 + x22 + ....... + xn2

Distribui-se de acordo com a distribuio do 2 , cuja funo densidade


de probabilidade :

1 2
f ( 2 ) = ( 2 ) ( n / 2 ) 1 e / 2 2 > 0
Eq 108: n
2 n / 2
2

uma distribuio assimtrica direita, com Mdia e Varincia dadas


por:

Eq 109: =n

Eq 110: 2 = 2n
6. Estimativa de parmetros
64 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Figura 32 - Distribuio do Qui-


2
quadrado .

Exemplo do uso da distribuio do 2 :

Seja X N ( , ) ; x1, ..., xn uma amostra aleatria. Ento:

n
(X i X )
2
Eq 111:
i =1 ( n 1) S 2
n21 ou n21
2 2

Ou seja, a distribuio 2 a base para inferncias a respeito da


varincia 2.

Suponha que X uma varivel aleatria Normal com mdia e varincia


desconhecidas. Seja que a varincia amostral S2 computada para uma
amostra de n observaes. Ento, um intervalo bilateral de confiana
100(1-)% obtido usando-se a distribuio do qui-quadrado:

Eq 112:
(n 1)S 2 2

(n 1)S 2
2 / 2,n 1 21 / 2,n 1

No caso do interesse residir em intervalos unilaterais de 100(1-)%


teremos:

Limite inferior:

Eq 113: 2
(n 1)S 2
2 , n 1

Limite superior:

2
(n 1)S 2
Eq 114:
21 , n 1

Exemplo 8 Ache o intervalo de 95% para a varincia no exemplo da quantidade


Estatstica Industrial
6. Estimativa de parmetros 65

mensal de produtos entregues.

S 2 = 1,34 2 = 1,80
X 2 0,025;19 = 32,85 ; X 2 0,975;19 = 8,91

19(1,80 ) 19(1,80 )
2
32,85 8,91
1,04 2 3,84 ou 1,02 1,96

INTERVALO DE Se u2 e v2 so duas variveis aleatrias independentes com


CONFIANA PARA O
distribuio do Qui-quadrado, a razo:
QUOCIENTE ENTRE
DUAS VARINCIAS

u2 / u
Eq 115: Fu, v =
v2 / v

ir seguir a distribuio F com u, v graus de liberdade. A funo


densidade de probabilidade para F :

u/2
u + v u

2 v F (u / 2 ) 1
Eq 116: f ( F ) = =
u v (u + v ) / 2
u
2 2 v F + 1

Exemplo de uso da distribuio F

Seja X 1 N ( 1 , 1 ) e X 2 N ( 2 , 2 ) ; Se S1 e S2 so
varincias amostrais, medidas em amostras de tamanho n1 e n2,
teremos:

S12 / 12
Eq 117: Fn1 1, n 2 1
S 22 / 22

Assim, a distribuio F pode ser usada para fazer inferncias sobre a


varincia de duas distribuies Normais
6. Estimativa de parmetros
66 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Figura 33 - Distibuio F

Para comparar duas varincias, 12 e 2 2 , oriundas de populaes


com distribuio Normal, vantajoso trabalhar com o quociente
12 / 2 2 , uma vez que este se distribui conforme a distribuio F. O
intervalo de confiana para este quociente vir dado por:

S1 2 12 S1 2
Eq 118: F1 / 2;n11;n2 1 F / 2;n11;n2 1
S22 22 S22

Onde F ,u ,v so os pontos percentuais da distribuio F com u e v


{
graus de liberdade, tais que P F F , u, v = . }
Se o valor 1 estiver contido neste intervalo, ento no pode ser
descartada a hiptese de que a varincia das duas populaes seja a
mesma. Os respectivos intervalos unilaterais sero dados por:

Limite inferior:

12S 2
Eq 119: 1 F1 ; n1 1; n 2 1
22 S22

Limite superior:

12 S1 2
Eq 120: F ;n11;n2 1
22 S2 2

As tabelas da distribuio F costumam fornecer apenas os valores de


F , mas F1 pode ser obtido a partir da seguinte relao:

1
Eq 121: F1 , u, v =
F , v, u

Exemplo 9 Os valores a seguir representam os tempos de produo de duas


mquinas. Analise os dados e conclua a respeito da variabilidade das
Estatstica Industrial
6. Estimativa de parmetros 67

mquinas A e B:

A 91,0 90,3 90,2 92,1 91,8 91,3 89,3 91,0 91,2 89,6
B 91,8 91,2 89,4 89,2 90,7 92,6 91,3 91,2

2
Mquina A: S1 = 0,8307

2
Mquina B: S 2 = 1,316

F0,025;9,7 = 4,82

1 1
F0,975;9,7 = = = 0,238
F0,025;7,9 4,20

0,8307 12 0,8307
(0,238) 2 (4,82 )
1,316 2 1,316
2

0,1502 1 3,0425
22

O intervalo inclui o valor 1, assim no pode ser descartada a hiptese de


que a variabilidade das duas mquinas seja a mesma.

Alm de servir para a comparao direta de duas varincias, a


distribuio F a chave para a comparao de vrios grupos, o que
feito usando o procedimento conhecido como Anlise de Varincia.
Esse assunto ser abordado em um captulo posterior.

INTERVALO DE A varivel aleatria X com funo de probabilidade:


CONFIANA PARA O
PARMETRO DA p x =1
P( x ) =
BINOMIAL (1 p ) = q x=0

chamada uma varivel do tipo Bernoulli. Cada observao dessa


varivel chamada uma observao de Bernoulli. Uma seqncia de
observaes chamada um processo de Bernoulli.

Seja que uma amostra de n observaes, x1,...xn , extrada de um


processo de Bernoulli, com probabilidade de sucesso constante igual a
p. Ento, a soma das observaes seguir o modelo Binomial com
parmetros n e p. Alm disso, como cada xi pode ser 0 ou 1, a mdia

1 n
Eq 122: X = x i
n i =1

ser uma varivel discreta contida no espao {0, 1/n, 2/n,...,1}. A


distribuio de X pode ser obtida a partir da Binomial, uma vez que:
6. Estimativa de parmetros
68 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

[an ]
Eq 123: P{X a} = P{X na} = (nk )p k (1 p )n k
k =0

onde [an] o maior inteiro menor que an. A mdia e a varincia de X


so:

Eq 124: X = p

p (1 p )
Eq 125: 2 =
X n

Intervalos de confiana para propores, por exemplo, frao de no


conformes em um processo, podem ser estabelecidos utilizando-se a
distribuio Binomial.

Se n grande (n 30) e p 0,1, ento a aproximao Normal para a


Binomial pode ser usada, resultando no seguinte intervalo de confiana
de 100(1-)%:

p (1 p ) p (1 p )
Eq 126: p z / 2 p + z / 2
n n

Se n pequeno, o problema deve ser resolvido usando tabelas da


distribuio Binomial. Se p pequeno, possvel usar a distribuio de
Poisson.

Exemplo 10 Um empresrio deseja conhecer a satisfao de seus clientes em relao


aos servios prestados por sua empresa. Em uma amostra aleatria de
n=100 clientes entrevistados, 4 pessoas demonstraram insatisfao com
os servios prestados. Construa um intervalo de 95% de confiana para a
proporo de clientes insatisfeitos.

p (1 p ) p (1 p )
p z / 2 p + z / 2
n n

0,04(1 0,04 ) 0,04(1 0,04 )


0,04 1,96 0,04 + 1,96
100 100

0,03 0,05

Exemplo 11 O fornecedor alega que entrega 10% de produtos defeituosos. Qual o


tamanho de amostra suficiente para estimar a proporo de produtos
defeituosos entregues por este fornecedor com preciso de 0,03 e 95%
de confiana?

Soluo:

= 0,05 ==> z0,025 = 1,96; p = 0,10; e = 0,03

Como deseja-se estimar uma varivel do tipo percentual, utiliza-se a


Estatstica Industrial
6. Estimativa de parmetros 69

distribuio Binomial.

Z2 2 p (1 p ) 1,96 2 0,10 (1 0,10)


n= n= = 384,16
e2 0,032

Logo, necessrio uma amostra de 385 produtos.

Quando no se conhece o percentual p, usa-se p=0,5, pois requer o


maior tamanho da amostra.

Exerccios

Exerccio 6.1 O tempo de atendimento em um restaurante apresenta varincia


2 = 0,0015 . Uma amostra aleatria de 12 mesas indicou tempo
mdio de atendimento de X = 12,258min . Construa um intervalo de
95% de confiana para o tempo mdio de atendimento no restaurante.

Exerccio 6.2 Recalcule o intervalo de confiana para o exerccio 6.1, supondo que a
varincia no fosse conhecida e o valor S 2 = 0,0015 tivesse sido
medido diretamente na amostra.

Exerccio 6.3 O peso de frangos apresenta varincia conhecida igual a 2=900g. Uma
amostra aleatria de 20 unidades indica X = 508g . Construa um
intervalo com 90% de confiana para o peso mdio desses frangos.

Exerccio 6.4 Em um processo, as caractersticas dimensionais do produto resultante


segue o modelo normal. A partir da amostra apresentada a seguir, defina
o limite inferior de um intervalo unilateral de 95% de confiana para a
caracterstica dimensional mdia.

35.2 36.7 37.5 38.2 38.7 39.5


36.3 37.3 37.8 38.3 39.3 40.1

Exerccio 6.5 Uma mquina usada para encher pacotes de leite. O volume segue
aproximadamente o modelo normal. Uma amostra de 16 potes indicou:

1021 1016 1012 1011 1014 1018 1022 1027


1008 1015 1013 1013 1017 1019 1007 1003

a) construa um intervalo unilateral de 99% com limite inferior para a


mdia;

b) construa um intervalo de 95% para a mdia;

Exerccio 6.6 Considere os dados do exerccio 6.4. Construa um intervalo de 90%


para a varincia da caracterstica dimensional. Depois converta esse
intervalo e apresente-o em termos de desvio-padro.

Exerccio 6.7 Considere os dados do exerccio 6.5. Construa um intervalo de 95%


para o desvio-padro do volume dos pacotes de leite.
6. Estimativa de parmetros
70 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Exerccio 6.8 Ainda em relao ao problema 6.5. Imagine que h uma segunda
mquina de enchimento para a qual uma amostra de 16 pacotes indicou:

1011 1015 1017 1015 1021 1021 1010 1007


1022 1018 1016 1015 1020 1022 1025 1030

Construa um intervalo de 95% para a diferena entre as duas mdias das


mquinas. Baseado nos resultado desses clculos voc concluiria que as
duas mquinas fornecem mesmo volume mdio?

Exerccio 6.9 Em uma indstria qumica, os engenheiros desejam saber se o


alongamento de um composto de borracha permanece inalterado ao
passar por uma mquina extrusora. Como o alongamento do composto
depende do lote de matria prima usado na sua confeco, os dados
foram coletados aos pares. Construa um intervalo de confiana para a
diferena entre os pares de observaes:

Lote 1 2 3 4 5 6 7 8 9 10
Antes 360 370 380 345 365 380 390 395 385 410
Depois 360 365 355 340 350 370 390 375 375 395

Exerccio 6.10 Em relao ao problema anterior, calcule o quociente entre as varincias


dos alongamentos medidos antes e depois do composto passar pela
extrusora. Depois construa um intervalo de confiana para esse
quociente.

Exerccio 6.11 Uma amostra aleatria de 250 dispositivos eletrnicos apresentou 27


unidades defeituosas. Estime a frao de no conformes e construa um
intervalo de 95% de confiana para o verdadeiro valor da frao de no
conformes.

Exerccio 6.12 Qual o tamanho da amostra necessrio para estimar o tempo mdio de
atendimento de um servio com desvio-padro conhecido de =3 min
com 95% de confiana e preciso de 0,2 min?

Exerccio 6.13 Qual o tamanho da amostra necessrio para estimar o tempo mdio de
atendimento de um servio com 95% de confiana e preciso de 0,2
min? Uma amostra de 20 tempos foi coletada para estimar o desvio-
padro S.

8 10 12 11 13 8 15 8 11 14
12 12 9 7 12 10 11 10 12 8

Exerccio 6.14 Em uma pesquisa eleitoral, 60 das 180 pessoas entrevistadas


responderam que votariam no candidato da oposio. Essa amostra
suficiente para estimar a verdadeira proporo de eleitores desse
candidato, com uma preciso de 0,04 e confiana 95%?
7
Testes de hiptese
Jos Luis Duarte Ribeiro
Carla ten Caten

COMENTRIOS INICIAIS Uma hiptese estatstica uma afirmativa a respeito de um parmetro de


uma distribuio de probabilidade. Por exemplo, podemos formular a
hiptese que a produtividade 2,5 peas/hora. Formalmente isso escrito
como:

H 0 : = 2,5 peas/hora
H1 : 2,5 peas/hora

Ho chamada de hiptese nula e H1 de hiptese alternativa. Nesse


caso, a alternativa formulada bilateral, mas tambm podem ser
estabelecidas alternativas unilaterais, tais como:

H 0 : = 2,5 peas / hora


H1 : < 2,5 peas/hora

Os testes de hiptese so uma das aplicaes da estatstica mais usadas.


Via de regra, a hiptese nula feita com base no comportamento
passado do produto/processo/servio, enquanto a alternativa formulada
em funo de alteraes/inovaes recentes. No ambiente atual de
melhoria contnua, fcil entender a importncia dos testes de hiptese,
eles permitem confirmar a eficcia das medidas de melhoria adotadas.

Ao testar a hiptese, toma-se uma amostra aleatria do sistema em


estudo e se calcula a estimativa desejada. Conforme o valor da
estimativa, a hiptese nula ser aceita ou rejeitada, a partir de
procedimentos estatsticos.

Ao testar uma hiptese, h dois tipos de erros que podemos cometer:

= P {rejeitar Ho/Ho verdadeira} = erro do tipo I

= P {aceitar Ho/Ho falsa} = erro do tipo II

O procedimento usual fixar o valor de e verificar o valor de . O


risco uma funo do tamanho da amostra, e controlado
indiretamente. Quanto maior o tamanho da amostra, menor ser o risco
.

Na seqncia os seguintes pontos sero cobertos:

- Comparao de mdias, varincia conhecida;


8. Comparao de vrios grupos: a alise de varincia
72 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

- Comparao de mdias, varincia desconhecida;


- Comparao de pares de observaes;
- Comparao de varincias;
- Comparao dos parmetros da Binomial.

COMPARAO DE Suponha que X uma varivel aleatria com mdia desconhecida e


MDIAS, VARINCIA 2
varincia conhecida. E queremos testar a hiptese que a mdia
CONHECIDA
igual a um certo valor especificado 0. O teste de hiptese pode ser
formulado como segue:

H o : = 0
Eq 127:
H1 : 0

Para testar a hiptese, toma-se uma amostra aleatria de n observaes


e se calcula a estatstica

X o
Eq 128: Zo =
/ n

Note que o teste feito usando-se / n no denominador, uma vez


que esse o desvio padro da mdia.

A hiptese Ho rejeitada se Z 0 > Z / 2 onde Z / 2 um valor


limite da distribuio normal reduzida tal que a probabilidade de se obter
valores externos a Z / 2 . Ou seja, a probabilidade do valor Zo
acontecer segundo a hiptese nula menor do que , logo rejeita-se a
hiptese nula Ho.

Assim, se X resultar prximo de o , ou seja, Z o Z a / 2 , a


hiptese Ho aceita; caso contrrio, se X resultar longe de o , ou
seja, Z o > Z a / 2 , a hiptese Ho rejeitada.

Exemplo 1 Um processo deveria produzir mesas com 0,85 m de altura. O


engenheiro desconfia que as mesas que esto sendo produzidas so
diferentes que o especificado. Uma amostra de 8 mesas foi coletada e
indicou X = 0,84 m . Sabendo que o desvio padro = 0,010 m,
teste a hiptese do engenheiro usando um nvel de significncia =0,05.

Soluo:

H o : = 0,850
H1 : 0,850

0,847 0,850
Zo = = 0,85
0,010 / 8

Z o = 0,85 > Z 0,025 = 1,96 ou Z o = 0,85 < Z 0,025 = 1,96


Estatstica Industrial
7. Testes de hiptese 73

Ho no pode ser rejeitada

/2 /2

=0,850
Z / 2 = -1,96 Z / 2 = +1,96
Z 0 > Z / 2 Z 0 Z / 2 Z 0 > Z / 2
Figura 34 - Teste de hiptese para o
exemplo 7.1 Rejeita Ho Aceita Ho Rejeita Ho

Em alguns casos, o objetivo pode ser rejeitar Ho somente se a verdadeira


mdia for maior que o. Assim, a hiptese alternativa unilateral ser
H 1 : > o , e a hiptese nula ser rejeitada somente se Z o > Z .

Se o objetivo for rejeitar Ho somente quando a verdadeira mdia for


menor que o, a hiptese alternativa ser H 1 : < o , e a hiptese
nula ser rejeitada somente se Z o < Z ou Z o > Z .

Quando h duas populaes com mdias desconhecidas, digamos


o e 1 e varincias conhecidas, 12 e 22 , o teste para verificar a
hiptese que as mdias sejam iguais o seguinte:

H o : 1 = 2
Eq 129:
H 1 : 1 2

Nesse caso, a partir de uma amostra aleatria de n1 observaes da


populao 1 e n2 observaes da populao 2, calcula-se:

X1 X 2
Zo =
Eq 130 12 22
+
n1 n2

E Ho rejeitada se Z 0 > Z / 2 , ou seja, a probabilidade do valor Zo


acontecer segundo a hiptese nula menor do que , logo rejeita-se a
hiptese nula Ho.

No caso da alternativa unilateral H 1 : 1 > 2 , a hiptese nula Ho ser


rejeitada quando Z o > Z . E se a alternativa unilateral for
H1 : 1 < 2 , a hiptese Ho ser rejeitada quando resultar Z o < Z
ou Z o > Z .

Hiptese Estatstica Critrio para


Tabela 7 - Teste de mdias, varincia rejeitar Ho
8. Comparao de vrios grupos: a alise de varincia
74 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

conhecida H o : = 0
H1 : o Z 0 > Z / 2

X o
H o : = 0 Zo = Z o > Z
/ n
H1 : > o

H o : = 0 Z o < Z ou
H1 : < o Z o > Z

H o : 1 = 2
H 1 : 1 2 Z 0 > Z / 2

X1 X 2
H o : 1 = 2 Zo =
H 1 : 1 > 2 12
2
Z o > Z
+ 2
n1 n 2
H o : 1 = 2
H 1 : 1 < 2 Z o < Z ou
Z o > Z

COMPARAO DE Suponha que X uma varivel aleatria Normal com mdia e


MDIAS, VARINCIA varincia 2 desconhecidas. Para testar a hiptese que a mdia igual
DESCONHECIDA a um valor especificado o, formulamos:

H o : = 0
H1 : o

Esse problema idntico aquele da seo anterior, exceto que agora a


varincia desconhecida. Como a varincia desconhecida,
necessrio fazer a suposio adicional que a varivel tenha distribuio
Normal. Essa suposio necessria para poder desenvolver a
estatstica do teste; contudo, os resultados ainda sero vlidos se o
afastamento da normalidade no for forte.

Como 2 no conhecido, usa-se a distribuio de Student-t para


construir a estatstica do teste:

X o
Eq 131: to =
S/ n

E a hiptese nula H o : = 0 rejeitada se t 0 > t / 2,n 1 onde t


/2 um valor limite da distribuio de Student-t tal que a
probabilidade de se obter valores externos a t / 2 .

A Tabela 8 mostra os testes apropriados para os casos de hipteses


Estatstica Industrial
7. Testes de hiptese 75

unilaterais.

Exemplo 2 Um empresrio desconfia que o tempo mdio de espera para


atendimento de seus clientes superior a 20 minutos. Para testar essa
hiptese ele entrevistou 20 pessoas e questionou quanto tempo demorou
para ser atendido. O resultado dessa pesquisa aparece a seguir:

22 20 21 23 22 20 23 22 20 24
21 20 21 24 22 22 23 22 20 24

Soluo:

H o : = 20 min
H1 : > 20 min

X = 21,8 min

S = 1,40 min

X o 21,8 20
to = = = 5,75
S/ n 1,40 / 20

t0 = 5,75 > t0,05,19 = 1,729 Rejeita-se Ho

Quando h duas populaes normais com mdias 1 2 e varincias


12 22 desconhecidas, as hipteses para testar se as mdias so iguais
so as seguintes:

H o : 1 = 2
H 1 : 1 2

O procedimento do teste ir depender se 12 = 22 . Se essa suposio


for razovel, ento calcula-se a varincia combinada:

Eq 132: S 2p =
(n1 1)S12 + (n2 1)S22
n1 + n 2 2

E a seguir calcula-se a estatstica

x1 x 2
t0 =
Eq 133: 1 1
Sp +
n1 n 2

Ho ser rejeitada se t 0 > t / 2,n + n 2 . Os testes unilaterais


1 2
correspondentes aparecem na Tabela 8.
8. Comparao de vrios grupos: a alise de varincia
76 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Exemplo 3 Um engenheiro desconfia que a qualidade de um material pode depender


da matria-prima utilizada. H dois fornecedores de matria-prima
sendo usados. Testes com 10 observaes de cada fornecedor
indicaram: X 1 = 39 , S1 = 7 , X 2 = 43 , S 2 = 9 . Use um nvel de
significncia = 0,05 e teste a hiptese do engenheiro.

Soluo:

H o : 1 = 2
H 1 : 1 2

Supondo 12 = 22 temos:

S 2p =
(9 )7 2 + (9)9 2
= 65 S p = 8,06
10 + 10 2

39 43
t0 = = 1,11
1 1
8,06 +
10 10

t 0 = 1,11 < t 0,025;18 = 2,101 Ho no pode ser rejeitada

Se houver evidncias que 12 22 , ento a estatstica a ser usada :

x1 x 2
t0 =
Eq 134: S12 S 22
+
n1 n 2

e o nmero de graus de liberdade para t calculado de forma


aproximada:

=
[( S12 / n1 ) + ( S 22 / n 2 )]
2
2
Eq 135: ( S12 / n1 ) 2 ( S 22 / n 2 ) 2
+
n1 + 1 n2 + 1

Ho ser rejeitada se t0 > t / 2, . Os testes unilaterais correspondentes


aparecem na Tabela 8.

Critrio para rejeitar


Hiptese Estatstica
Tabela 8 - Teste de mdias, varincia Ho
Estatstica Industrial
7. Testes de hiptese 77

desconhecida
H o : = 0
H1 : o t0 > t / 2,n 1

H o : = 0
X o
to =
H1 : > o S/ n
t o > t ,n 1

H o : = 0
H1 : < o t o < t ,n 1 ou
to > t , n 1

x1 x 2
t0 =
H o : 1 = 2 1 1
Sp +
H 1 : 1 2 n1 n 2 t 0 > t / 2,
= n1 + n 2 2

H o : 1 = 2
X1 X 2
H 1 : 1 > 2 to = t o > t ,
S12 S 22
+
n1 n 2

H o : 1 = 2
=
[( S12 / n1 ) + ( S 22 / n
H 1 : 1 < 2 ( S12 / n1 ) 2 ( S 22 / to < t , ou
+
n1 + 1 n2 to > t ,

COMPARAO DE Em algumas situaes os dados de duas populaes so coletados e


PARES DE comparados em pares. Isso feito para impedir que fatores no
OBSERVAES controlveis inflacionem as estimativas das varincias. A hiptese
testada se existe diferenas significativas entre pares de observaes.

H o : d = 0
H1 : d 0

O teste baseia-se na estatstica:

d
Eq 136: t=
Sd / n

onde:

d a diferena entre os pares de observaes.

Sd o desvio-padro das diferenas entre os pares de observaes


8. Comparao de vrios grupos: a alise de varincia
78 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

n o nmero de pares de observaes

Ho ser rejeitada se t0 > t / 2, n 1 .

Exemplo 7.4 Duas espcies de um certo tipo de cereal esto sendo testadas quanto ao
seu crescimento. O experimento foi feito escolhendo 10 blocos de
terreno e plantando em cada bloco mudas de ambas as espcies. Os
resultados a seguir so as alturas medidas ao final do primeiro ms.
Usando-se = 0,05

Terreno 1 2 3 4 5 6 7 8 9 10
Espcie 1 22 27 18 33 25 21 15 33 21 24
Espcie 2 21 31 24 32 29 23 19 37 22 27

Os dados deste experimento foram coletados aos pares para impedir que
as diferenas de fertilidade entre os blocos de terreno (que podem ser
grandes) mascarem os resultados.

Soluo:

H o : d = 0
H1 : d 0

A anlise feita computando a mdia e o desvio-padro da diferena:

d = (1 4 6 + 1 4 2 4 4 1 3) / 10 = 2,6

S d = 2,32

2,6
t= = 3,54
2,32 10

como t = 3,54 > t 0,025;9 = 2,262 , a hiptese nula H 0 : d = 0


rejeitada.

COMPARAO DE Os testes descritos a seguir assumem que as distribuies das variveis


VARINCIAS aleatrias sigam o modelo Normal. Se essa suposio violada, o teste
deixa de ser exato.

Uma hiptese testada com freqncia que a varincia tenha um valor


especificado 20 :

H 0 : 2 = 02
H 1 : 2 02

A estatstica para o teste :


Estatstica Industrial
7. Testes de hiptese 79

02 =
(n 1)S 2
Eq 137:
02

onde S2 o valor da varincia medida para uma mostra aleatria de n


observaes.

A hiptese nula rejeitada se 02 ultrapassar os limites inferior e


superior da distribuio do Qui-quadrado, mais especificamente, se

02 > 2 ou se 02 < 2 .
/ 2;n 1 1 / 2;n 1

Testes unilaterais tambm podem ser formulados. A Tabela 9 mostra os


limites correspondentes.

No caso em que se deseja testar se a varincia de duas populaes com


distribuio Normal so idnticas, as hipteses so formuladas como:

H 0 : 12 = 22
H 1 : 12 22

Esse teste tem larga aplicao no controle da qualidade, uma vez que o
monitoramento da variabilidade essencial para a garantia de qualidade.
Pode-se, por exemplo, comparar a variabilidade antes e aps a
implantao do controle estatstico de processo.

A comparao de varincias feita usando-se a distribuio F:

S12
Eq 138: F0 =
S 22

H0 rejeitada se F0 > F / 2,n 1,n 1 ou se F0 < F1 / 2,n 1,n 1 .


1 2 1 2

A Tabela 9 indica os limites apropriados para os testes unilaterais.

Exemplo 7.5 Para o exemplo da qualidade do material (dois tipos de fornecedores, 10


observaes de cada fornecedor S1 = 7 microns e S2 = 9 microns),
testar a hiptese de que as varincias sejam as mesmas, usando = 5%.

Soluo:

H 0 : 12 = 22
H 1 : 12 22

72
F0 = = 0,605
92
8. Comparao de vrios grupos: a alise de varincia
80 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

F0,025;9,9 = 4,03
F0,975;9,9 = 1 / 4,03 = 0,248

A hiptese H0 no pode ser rejeitada, uma vez que o valor calculado F0


= 0,605 est dentro dos limites de deciso [0,248 ; 4,03].

Tabela 9 - Comparao de Hiptese Estatstica Critrio para rejeitar


varincias H0

H 0 : 2 = 02 0 > 2
2
ou
/ 2;n 1
H 1 : 2 02 02 < 2
1 / 2;n 1

H 0 : 2 = 02 02 =
(n 1)S 2

02
H 1 : 2 > 02 02 > 2
;n 1

H 0 : 2 = 02
H 1 : 2 < 02 02 < 2
1 ;n 1

H 0 : 12 = 22 S2 F0 > F / 2,n1 1,n2 1


F0 = 1 ou
H 1 : 12 22 S 22
F0 < F1 / 2,n1 1,n2 1

H 0 : 12 = 22 S2
F0 = 1
S 22
H 1 : 12 > 22
F0 > F ,n11,n2 1
S2
H 0 : 12 = 22 F0 = 2
S12
H 1 : 12 < 22 F0 < F1 ,n11,n2 1

o
COMPARAO DOS Seja que queremos testar a hiptese que o parmetro da Binomial
PARMETROS DA igual a um certo valor o . O teste que ser descrito se baseia na
BINOMIAL aproximao Binomial atravs da distribuio Normal.

Se uma amostra aleatria de n observaes coletada e se observam x


itens que pertencem a classe associada com p, ento para testar:

H0 : = o
H1 : o

Usa-se a estatstica
Estatstica Industrial
7. Testes de hiptese 81

p o
Z0 =
Eq 139: o (1 o )
n

A hiptese nula rejeitada se resultar Z 0 > Z / 2 . No caso de


alternativas unilaterais usa-se o mesmo raciocnio.

Exemplo 7.6 Um engenheiro deseja testar a hiptese de que seu fornecedor entrega
lotes com 10% de no conformes. Um lote de 180 unidades revelou 14
no conformes. Use = 5% e conclua a respeito.

Soluo:

H 0 : = 0,1
H1 : 0,1
p = 14 / 180 = 0,078
0,078 0,1
Z0 = = 0,98
0,1(1 0,1)
180

Z 0 = 0,98 < Z 0,025 = 1,96 H0 no pode se rejeitada

A aproximao Normal tambm pode ser usada para testar a hiptese


que dois parmetros de Binomiais sejam iguais, ou seja, para testar:

H 0 : 1 = 2
H1 : 1 2

Nesse caso, amostras de tamanho n1 e n2 so retiradas de cada


populao gerando x1 e x2 itens pertencentes a classe associada com
p. Ento p1 = x1 / n1 e p2 = x2 / n2 so os estimadores de para
cada populao.

A estatstica para o teste :

p1 p2
Z0 =
Eq 140: 1 1
p(1 p ) +
n1 n2

onde:

n p n p
Eq 141: p = 1 1+ 2 2
n1 + n2

E a hiptese nula rejeitada quando Z 0 > Z / 2

Exemplo 7.7 Um empresrio deseja saber se o percentual de satisfao de seus


clientes em relao a dois produtos oferecidos por sua empresa so
8. Comparao de vrios grupos: a alise de varincia
82 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

similares. Para isso entrevistou 150 pessoas, das quais 80 disseram estar
satisfeitas com o produto A e 100 com o produto B. Use = 5% e
conclua a respeito.

H 0 : 1 = 2
H1 : 1 2

80
p1 = = 0,53
150

100
p2 = = 0,67
150

n p n p 150 x 0,53 + 150 x 0,67


p = 1 1+ 2 2 = = 0,60
n1 + n2 150 + 150

p1 p2 0,53 0,67 0,14


Z0 = = = = 2,47
1 1 1 1 0,0567
p (1 p ) + 0,60 x (1 0,60)x +
n1 n2 150 150
Z o = 2,47 > Z / 2 = 1,96 Rejeita-se Ho

Exerccios

Exerccio 7.1 Estabelea a hiptese nula e a hiptese alternativa para as seguintes


situaes:

a) Um fornecedor afirma que o tempo de vida de um produto que ele


comercializa maior que 3 meses.

B) Um engenheiro desconfia que uma mquina est fora do ajuste,


produzindo peas com dimetro diferente do especificado que de =
2,54.

c) Um fabricante atesta que o consumo de um certo modelo de


eletrodomstico inferior a 20 watts.

Exerccio 7.2 Uma amostra de vinte observaes de um produto indicou um tempo de


vida mdia de 217 ciclos. Sabendo que o desvio padro de 20 ciclos,
teste a hiptese de que o tempo de vida inferior a 250 ciclos, conforme
atestam alguns engenheiros. Use = 0,05.

Exerccio 7.3 Dois tipos de combustveis esto sendo testados. A hiptese que eles
tenham o mesmo desempenho. Teste essa hiptese, sabendo que o
desvio-padro conhecido

= 0,7 Km/l e os resultados de testes feitos com 10 automveis usando


cada tipo combustvel indicaram
X1 = 13,3Km / l e X 2 = 13,9 Km / l. Use = 0,05.

Exerccio 7.4 Os dados a seguir representam a produtividade de um processo. Use


= 0,05 e teste a hiptese de que nas condies atuais a produtividade
seja superior a 1,5.

1,50 1,55 1,59 1,42 1,53 1,58 1,48 1,52


Estatstica Industrial
7. Testes de hiptese 83

1,53 1,62 1,46 1,56 1,63 1,54 1,58 1,68

Exerccio 7.5 Repita o exerccio 7.3 supondo que o desvio-padro no fosse


conhecido, mas que tivesse sido medido nas duas amostras de 10
valores, resultando em S1 = 0,6 Km/l e S2 = 0,8 Km/l. (Suponha
12 = 22 e use = 0,05).

Exerccio 7.6 Um mdico est estudando o crescimento de dois tipos de bactrias.


Essas bactrias foram cultivadas em diferentes substratos. Como pode
haver um efeito significativo do substrato, os dois tipos de bactrias
foram cultivados em cada substrato. Use = 0,01 e teste a hiptese de
que a bactria 1 cresce mais que a bactria 2.

Substrato 1 2 3 4 5 6 7 8
B1 3,0 3,2 2,7 2,5 3,8 4,3 3,5 4,8
B2 3,2 3,1 2,4 2,1 3,2 3,7 3,2 4,0

Exerccio 7.7 Um fabricante atesta que as mquinas de enchimento que ele produz
apresentam um coeficiente de variao inferior a 2%. Um experimento
aleatrio realizado com garrafas de 2 litros indicou S2=0,0024 litros2
para uma amostra de 15 garrafas. Teste a hiptese do fabricante para um
nvel de significncia = 0,05.

Exerccio 7.8 Uma nova unidade de desalinizao foi instalada em uma indstria
qumica. Uma amostra com n = 10, coletada antes da instalao da
nova unidade indicou concentrao de sal X 1 = 19,55 e S12 = 15,35 .
Enquanto que, aps a instalao, uma amostra com n = 16 indicou
X 2 = 17,85 e S22 = 8,65 . Baseado nesses dados, pede-se:

a) Teste a hiptese que as duas varincias sejam iguais?

b) Teste a hiptese que a nova unidade reduziu a concentrao mdia de


sal?

Exerccio 7.9 Um engenheiro deseja testar a hiptese que o percentual de peas


defeituosas inferior a 10%. Uma amostra aleatria com 75 peas
revelou 6 peas defeituosas. Use = 0,05 e conclua a respeito.

Exerccio 7.10 Um engenheiro desconfia que o percentual de produtos defeituosos


reduziu depois da implantao do controle estatstico de processo. Em
uma amostragem de 500 produtos realizada antes da implantao do
CEP, identificou-se 5 produtos defeituosos. Aps a implantao do
CEP, coletou-se uma amostra de 700 produtos e identificou-se 1
defeituoso. Teste a hiptese do engenheiro usando 2,5% de significncia.

Exerccio 7.11 Num estudo do tempo mdio de adaptao para uma amostra aleatria de
50 homens num grande complexo industrial, surgiram as seguintes
estatsticas: mdia da amostra = 3,2 anos e desvio padro da amostra =
0,8 anos. Pode-se concluir, ao nvel de 1% de significncia que os
homens tenham um tempo de adaptao menor que as mulheres que de
3,7 anos?
8. Comparao de vrios grupos: a alise de varincia
84 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Exerccio 7.12 Um fabricante alega que apenas 2% das peas que ele fornece esto
abaixo das condies de utilizao. Em 200 peas escolhidas
aleatoriamente de uma remessa de 5.000 encontraram-se 10 falhas. A
alegao do fabricante parece aceitvel ao nvel de 5% de significncia?

Exerccio 7.13 Os dados abaixo do os acertos obtidos por 8 soldados num experimento
destinado a determinar se a preciso do tiro afetada pela maneira de
dispor os olhos.

(a) com o olho direito aberto


(b) com o olho esquerdo aberto
Que tipo de concluso voc poderia tirar?

Soldado 1 2 3 4 5 6 7 8
Direito 44 39 33 56 43 56 47 58
Esquerdo 40 37 28 53 48 51 45 60

Exerccio 7.14 Para verificar o grau de adeso de uma nova cola para vidros, preparam-
se dois tipos de montagem; Cruzado (A) onde a cola posta em forma
de X e Quadrado (B), onde a frmula posta nas 4 bordas. O resultado
para a resistncia das duas amostras de 10 cada esto abaixo. Para um
nvel de 5% de significncia que tipo de concluso poderia ser tirada?

Mtodo A 16 14 19 18 19 20 15 18 17 18
Mtodo B 13 19 14 17 21 24 10 14 13 15

Exerccio 7.15 A fim de comparar a eficcia de dois operrios, foram tomadas, para
cada um, oito medidas do tempo gasto, em segundos, para realizar certa
operao. Os resultados obtidos so dados a seguir. Pergunta-se se, ao
nvel de 5% de significncia, os operrios devem ser considerados
igualmente eficazes ou no.

Operrio 1 35 32 40 36 35 32 33
Operrio 2 29 35 36 34 30 33 31

Exerccio 7.16 Uma pesquisa nacional indica que aproximadamente 25% das contas de
grandes magazines incorrem em penalidade por atraso nos pagamentos.
Se um magazine local constata 40 atrasos numa amostra de 200 clientes,
pode necessariamente admitir que seus clientes sejam melhores que os
clientes de todo pas? Adote 5% de significncia.
8
Comparao de vrios grupos: a
anlise de varincia
Jos Luis Duarte Ribeiro
Carla ten Caten

COMENTRIOS INICIAIS Os testes de hiptese apresentados at aqui limitaram-se comparao


de duas mdias ou duas varincias.

H situaes onde se deseja comparar vrias mdias, cada uma oriunda


de um grupo diferente. Esses grupos poderiam ser: a performace em
Km/l de carros consumindo 4 marcas de combustveis, a eficincia de 3
mtodos de treinamento, comparao da produtividade entre 5 mquinas
ou 3 postos de trabalho ou 2 layouts.

ONE-WAY ANOVA Experimentos que envolvem:

1 Varivel de resposta

1 Fator controlvel a vrios nveis (grupos)

Os ensaios feitos em cada nvel do fator controlvel configuram um


grupo. O objetivo identificar se os valores da varivel de resposta
medidos nos diversos nveis do fator controlvel diferem entre si.

Exemplo Um profissional deseja estudar se a temperatura ambiente influencia na


produtividade dos funcionrios. Para isso realizou trs medidas de
produtividade (peas/hora) em trs temperaturas diferentes.

Fator controlvel: temperatura


Nveis do fator controlvel: 15, 25, 35
Varivel de resposta: produtividade
Repeties: 3 valores para cada nvel

Existem dois tipos de - Fatores controlveis a nveis fixos: quando o efeito de cada nvel fixo,
experimentos: como no caso em que os tratamentos so 4 presses de operaes, ou 4
layouts fixados pelo engenheiro; Por ex., 5 valores de temperatura.

- Fatores controlveis a nveis aleatrios: quando o efeito de cada nvel


8. Comparao de vrios grupos: a anlise de varincia
86 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

aleatrio, como no caso em que os nveis so k lotes de produo, ou k


operadores escolhidos aleatoriamente; Por ex., 3 fbricas escolhidas ao
acaso.

Disposio dos dados: Os dados so dispostos da seguinte forma:

Fator A A1 A2 ... Ak
y11 y21 ... yk1

y12 y22 ... yk2

: : : :
: : yij :

: : : :
y1,n1 y2,n2 ... yk,nk
Totais Ti. T1. T2. ... Tk. T.. =
No.Obs. ni n1 n2 ... nk N =

Y1. Y2. ... Yk.


Mdias Yi. Y.. =

Modelo estatstico: Os resultados poderiam ser representados por um modelo aditivo:

Yij = + i. + ij ; i = 1,....., k
Eq 142
j = 1, ..., n j

onde:

Yij a observao j medida no tratamento i;

mdia geral de todas as observaes;

i.efeito do tratamento i;

ij erro aleatrio;

Hipteses Ho: no h diferenas significativas entre os grupos: 1 = 2 = .... = k

H1: h diferenas significativas entre os grupos: 1 2 .... k

A Anlise de Varincia se baseia na decomposio da variabilidade total.


Mais especificamente, os desvios das observaes individuais em relao
a mdia global podem ser escritos como:

Eq 143: (Yij Y.. ) = (Y i. Y.. ) + (Yij Y i. )


onde:

(Y i. Y.. ) o desvio da mdia do tratamento i em relao mdia


global;
Estatstica Industrial
87
8. Comparao de vrios grupos: a anlise de varincia

(Yij Y i. ) o desvio da observao individual em relao a mdia do


tratamento i correspondente;

Para o exemplo anterior:

Temperatura
15 25 35
12 20 17
13 19 16
11 18 18

Ti .= 36 57 51 T.. = 144

ni . = 3 3 3 N =9

Yi. = 12 19 17
Y.. = 16

Modelo Estatstico, Yij = + i. + ij

20 = 16 + 3 +1

Podemos ver esses dados no grfico abaixo:

Y2. = 19
Y=20
ij (Y ij Y i. )=2019=1
(Y i. Y ..)=1916=3
(Yij Y )
.. =2016=4
Y3 . = 17

Y.. = 16

Y1. = 12

Figura 35 - Decomposio dos


resduos 15 25 35

Elevando ao quadrado ambos os termos da Eq 143 e efetuando o


somatrio, resulta:

(Y ) ( )
Y.. = ni Y. Y.. + (Yij Yi. )
2 2 2
Eq 144: ij
ij i

Desde que fcil demonstrar que (Y i. )( )


Y .. Yij Y i. = 0

Na Eq 144, identificamos as seguintes somas quadradas:


8. Comparao de vrios grupos: a anlise de varincia
88 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Eq 145: SQT = SQG + SQR

onde:

SQT soma dos quadrados totais, decomposta em:

SQG soma dos quadrados dos grupos (tratamentos), associada


exclusivamente a um efeito dos grupos;

SQR soma dos quadrados dos resduos, devida exclusivamente ao erro


aleatrio, medida dentro dos grupos.

Teste F Voltando a Eq 144 observamos que a soma quadrada dos resduos


dividida pelos seus graus de liberdade fornecer uma estimativa da
varincia dentro dos grupos:

(Y )
2
ij Yi.
Eq 146: SQR i, j
MQR = = =2
N k N k

Da mesma forma, se no houver efeito dos grupos, a diviso da SGQ


pelos respectivos graus de liberdade tambm fornecer uma estimativa
da varincia dentro dos grupos:

Eq 147: MQG =
SQG Y i. Y ..
= n
( ) = n( / n ) =
2
2 2

k 1 k 1

Notem que, se no h efeito dos grupos, a quantidade entre colchetes a


varincia das mdias, a qual sabe-se que igual a 2/n.

As grandezas apresentadas acima so chamadas de mdias quadradas.


Observa-se que as Mdias Quadradas so simplesmente uma outra
notao para Varincia.

MQG = SQG/(k-1) a Mdia Quadrada dos Grupos;

MQR = SQR/(N-k) a Mdia Quadrada dos Resduos;

Observa-se que para as somas quadradas vale a aditividade:

Eq 148: SQT = SQG + SQR

Eq 149: N-1 = (k-1) + (N-k)

Mas o mesmo no vale para as Mdias Quadradas, ou seja, MQT MQG


+ MQR.

Se no h diferena significativa entre os grupos: E(MQG) = E (MQR)

Para testar a hiptese referente ao efeito dos grupos, usamos a


distribuio F :

MQG
Eq 150 Fcalc =
MQR
Estatstica Industrial
89
8. Comparao de vrios grupos: a anlise de varincia

que o modelo adequado para a distribuio do quociente de duas


varincias.

A partir das Eq 150 verifica-se que, se no h efeito dos grupos, esse


quociente deve ser prximo de 1 (um).

Caso contrrio, se h efeito dos grupos, esse quociente ser


significativamente maior que 1. O limite de deciso estabelecido
usando os valores tabelados da distribuio F, ou seja, usando:

F ,k 1,N k

onde:

nvel de significncia
k-1 graus de liberdade do numerador:
N-k graus de liberdade do denominador:

Figura 36 - Exemplo da distribuio


F de Snedecor

A hiptese nula 1 = 2 = ... = k ser rejeitada sempre que F


calculado for maior que o valor tabelado F ,k 1,N k . Logo, h
diferena significativa entre os grupos. Caso contrrio, no h diferenas
significativas entre os grupos.

Formulrio para os Para o clculo das Somas Quadradas recomendado o uso do seguinte
clculos formulrio:

Eq 151: TC = ( T ..)2 N (Termo de Correo)

Eq 152: ( )
SQT = Yij2 TC

Eq 153: SQG = (Ti2. ni ) TC

Eq 154: SQR = (Yij2 ) (Ti2. ni ) = SQT SQG

onde:

T.. a soma de todas as observaes

Ti. a soma das observaes no grupo i


8. Comparao de vrios grupos: a anlise de varincia
90 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Tabela ANOVA Os clculos associados Anlise de Varincia so apresentados em uma


tabela, chamada de Tabela de Anlise de Varincia ou Tabela ANOVA
(Analysis of Variance):

Tabela 10 - Tabela ANOVA Fonte de SQ GDL MQ Teste F


Variao
Entre Grupos SQG k-1 MQG MQG/MQR
Dentro SQR N-k MQR
Grupos
Total SQT N-1

Exemplo de um Os dados a seguir representam o alongamento (maior melhor) medido


experimento a nveis fixos sobre um composto de borracha, em funo da quantidade de agente de
processo adicionado durante a mistura.

Agente 0 5 10 15 20
43 47 55 50 52
47 53 50 54 49
46 52 54 54 54
45 50 55 55 55
45 49 52 56 55
46 51 53 52 56
47 55 55 57 56
44 48 56 57 53
42 49 59 55 57
48 50 56 60 60
49 47 57 56 57
44 49 54 58 55
Totais 546 600 656 664 659 T..= 3125
No. obs. 12 12 12 12 12 N = 60
Mdias 45,5 50,0 54,7 55,3 54,9 Y.. = 52,08

Clculos iniciais: TC = T..2 / N = (3125)2 / 60 = 162.760,42

SQT = (Yij)2 - TC = 163.971,00 - 162.760,42 = 1210,58

SQG = (Ti.2 / ni) - TC = [(546)2 / 12] + ... + [(659)2 / 12] -


162.760,42 = 875,33

SQR = SQT - SQG = 1210,58 - 875,33 = 335,25

Tabela Anova: Fonte SQ GDL MQ Teste F


Entre Grupos 875,33 4 218,83 35,9
(Agente)
Estatstica Industrial
91
8. Comparao de vrios grupos: a anlise de varincia

Dentro 335,25 55 6,09


Grupos
(Residual)
Total 1210,58 59

F calculado > F tabelado = F 0,05,4,55


35,9 > 2,55

Como F calculado maior do que F tabelado conclui-se que h


diferenas significativas entre os grupos,ou seja,a quantidade de agente
na mistura influencia significativamente o alongamento

Qual a melhor quantidade considerando qualidade e economia?

Comparao mltipla de 1. Calcular o desvio-padro das mdias


mdias
s x = MQR / nc = 2,47 / 3,46 = 0,71

onde nc = (n1 + n2 + ... + nk) / k

2. Calcular o limite de deciso

Ld = 3 s = 3 x 0,71 = 2,13

3. Escrever as mdias em ordem crescente ou decrescente e compar-las


duas a duas.

Y(1)= 45,5 Y(2) = 50,0 Y(3) =54,7 Y(4) 54,9 Y(5) =55,3

4. A diferena ser significativa se for maior que o Ld

Y(2) Y(1) = 50,0 - 45,5 = 4,5 > Ld = 2,13 Dif. Signif.

Y(3) Y(2) = 54,7 - 50,0 = 4,7 > Ld = 2,13 Dif.Signif.

Y(5) Y(3) = 54,9 - 54,7 = 0,2 < Ld = 2,13 Dif. No Signif.

Y(4) Y(5) = 55,3 - 54,9 = 0,4 < Ld = 2,13 Dif. No Signif.

5. Usar barras contnuas sobre as mdias que no diferem entre si

___ ___ _________

Y(1) Y(2) Y(3) Y(5) Y(4)

Otimizao: A anlise tcnica deve acompanhar e completar a anlise estatstica.

Para isso recomendvel representar graficamente os dados. Para os


dados do experimento anterior, poderia se usar, por exemplo, um
boxplot:
8. Comparao de vrios grupos: a anlise de varincia
92 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Boxplot
65

Alongamento
55

45

35
G1 G2 G3 G4 G5

Figura 37 - Grfico Boxplot Agente de processo

Na otimizao devemos considerar o binmio qualidade e custo. Os


resultados estatsticos, em conjunto com a anlise grfica do suporte
tomada de deciso a respeito do processo. Via de regra, o experimento
revela opes para a reduo de custos e melhoria da qualidade,
simultaneamente.

Como no existe diferena significativa entre as quantidades de agente


10, 15 e 20, a quantidade tima de agente 10 (dez) pois otimiza
simultaneamente qualidade e custos.

Exemplo de um Uma fbrica de embalagens de papel recebe a matria prima (papel) em


experimento a nveis rolos. desejvel que as caractersticas dos rolos sejam homogneas, de
aleatrios modo a fornecerem papel com a mesma resistncia trao. O
engenheiro suspeita que alm da variabilidade usual (dentro dos rolos)
tambm possa haver uma variao significativa entre os rolos. Medies
de resistncia feitas em embalagens produzidas com material
proveniente de cinco rolos aleatoriamente indicaram:

Ho: no h diferenas significativas entre os rolos = 0


H1: h diferenas significativas entre os rolos > 0

Rolo Resistncia
1 72 73 70 74 74 75 78 77 80 76
2 63 70 69 65 66 66 62 65 67 63
3 78 74 82 76 76 73 75
4 75 74 73 78 75 71 67 73
5 85 82 80 86 83 92 89 86

Clculos iniciais: Totais e mdias:

Rolo Ti. ni Yi .
1 749 10 74,90
2 656 10 65,60
3 534 7 76,29
4 586 8 73,25
5 603 8 85,38
T.. = 3128 N = 43 Y .. = 74,60
Estatstica Industrial
93
8. Comparao de vrios grupos: a anlise de varincia

Clculo das Somas Quadrada

TC = (T..)2 / N = (3208)2/43 = 239331,7

SQT = ( Yij2 ) - TC = 241476,0 - 239331,7 = 2144,28

SQG = ( Ti2. /ni) - TC = [(749)2/10] + ... + [(683)2/8] - 239331,7

= 1774,18

SQR = SQT - SQG = 2144,28 - 1774,18 = 370,10

Tabela ANOVA Fonte SQ GLD MQ Teste F


Rolos 1774,18 4 443,54 45,54
Resduos 370,10 38 9,74
Total 2144,28 42

Fcalculado = 45,54 > F0,05,4,38 = 2,856

H diferenas significativas entre os rolos.

Estimativa dos Pode ser demonstrado que o valor esperado das mdias quadradas vale:
componentes de variao:
Eq 155: E (MQG) = 2 + nc 2

Eq 156: E (MQR) = 2

A partir das Eq 155 e Eq 156, podemos obter as estimativas para os


componentes de variao 2 e 2 :

Eq 157: 2 = MQR

MQG 2 MQG MQR


Eq 158: 2 = =
nc nc

Conhecidos os componentes de variao, podemos calcular a


contribuio percentual de cada termo na composio da variabilidade
total:

Eq 159: ( ) 2
Var Yij = TOTAL = 2 + 2

Percentual correspondente aos 2


100 x
tratamentos: 2
TOTAL
8. Comparao de vrios grupos: a anlise de varincia
94 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Percentual correspondente ao erro 2


100 x
aleatrio: 2
TOTAL

Estimativa dos componentes de variao para o exemplo:

2 = MQR = 9,74

MQG MQR 443 ,54 9 ,74


2 = = = 50 ,44
nc 8 ,6

2
TOTAL = 2 + 2 = 50 ,44 + 9 ,74 = 60 ,18

Os resultados indicam que 50,44 / 60,18 = 83,81 % da variabilidade total


se deve a diferenas entre rolos. As causas dessas diferenas deveriam
ser investigadas e, na medida do possvel, eliminadas.

Otimizao A anlise tcnica deve acompanhar e completar a anlise estatstica.

Para isso recomendvel representar graficamente os dados. Para os


dados do experimento anterior, poderia se usar, por exemplo, um grfico
de disperso:

100

90
Re 80

70

60
0 1 2 3 4 5 6
Rolo
Figura 38 - Grfico de disperso

Via de regra, a variabilidade devida aos grupos se deve a causas


especiais que podem (e devem) ser eliminadas.

Por exemplo, diferenas entre mquinas podem ser devidas a falta de


manuteno apropriada ou diferenas de setup. Essas causas especiais
devem ser corrigidas.

Similarmente, diferenas entre lotes de produo podem ser devidas a


qualidade da matria prima usada na produo de cada lote. Nesse caso,
deveriam ser investigados os fornecedores, ou as condies de
estocagem, etc.

Por outro lado, a variabilidade devida ao erro aleatrio deve-se, via de


regra, a causas comuns, inerentes ao sistema em estudo. Para eliminar as
causas comuns preciso modificar o sistema como um todo, o que pode
Estatstica Industrial
95
8. Comparao de vrios grupos: a anlise de varincia

no se justificar economicamente.

Exerccios

Exerccio 8.1 Quatro concentraes de catalisadores que podem afetar o tempo de


processo de uma mistura qumica esto sendo investigados. Os seguintes
tempos de misturas foram obtidos:

Catalisadores
1 2 3 4
56,7 56,3 53,0 54,4
58,2 55,9 51,2 53,0
57,2 54,5 54,2 51,4
58,4 57,0 53,2 51,5
55,8 55,3 53,3
54,9
Totais T.. =
n N =
Mdias
Y. . =

Pede-se:

Fazer a anlise de Varincia e concluir a respeito do efeito dos


catalisadores.

Fazer uma comparao mltipla de mdias se for o caso.

Fazer um grfico de barras, indicando a concentrao mdia obtida para


cada catalisador e concluir a respeito do que deve ser feito para (i)
assegurar qualidade e (ii) assegurar economia.

Clculos iniciais:

2
TC = T.. / N =

2
(Yij ) =

2
SQT = (Yij ) - TC =

2
SQG = (Ti. / ni) - TC =

SQR = SQT - SQG =

Tabela Anova:
8. Comparao de vrios grupos: a anlise de varincia
96 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Fonte SQ GDL MQ Teste F


Entre Grupos
(Catalis)
Dentro
Grupos
(Residual)
Total

F calculado =

F tabelado =

Efeito dos catalisadores significativo ?

Comparao mltipla de mdias

(1) Calcular o desvio padro das mdias

s x = MQR / nc =

onde nc = (n1 + n2 + ... + nk) / k

(2) Calcular o limite de deciso

Ld = 3 x S X =

(3) Escrever as mdias em ordem crescente ou decrescente e compar-las


duas a duas. A diferena ser significativa se for maior que o Ld

Y(1) Y(2) =

Y(1) - Y(3) =

Y(1) Y(4) =

Y(2) Y(3) =

Y(2) Y(4) =

Y(3) Y(4) =

(4) Usar barras contnuas sobre as mdias que no diferem entre si

Exerccio 8.2 Um jogo de oito pneus das marcas M1, M2 e M3 foram testados quanto
durabilidade. Os resultados obtidos (em milhares de Km) foram os que
seguem:
Estatstica Industrial
97
8. Comparao de vrios grupos: a anlise de varincia

Marca: M1 M2 M3
45 40 42 44 40 35
48 44 44 47 41 39
44 46 41 40 31 36
43 41 43 45 33 38
Totais
Mdia

Qual a varivel de resposta e qual o fator controlvel ?

Quantos nveis possui o fator controlvel ?

Faa a tabela de anlise de varincia e conclua a respeito do fator em


estudo;

Caso necessrio, faa uma comparao mltipla de mdias;

Plote um grfico relacionando o fator controlvel com a resposta


medida;

Indique o que deve ser feito para assegurar qualidade;

Indique o que deve ser feito para obter economia;

Exerccio 8.3 Um grupo de engenheiros est estudando o efeito do ngulo de uma


ferramenta de corte sobre o acabamento superficial resultante aps a
operao. As medies de rugosidade (menor melhor) efetuadas
revelaram:

ngulo: 0o 5o 10o 15o


10 12 12 8 7 9 4 6 4 5 7 6
11 12 14 10 7 7 5 5 7 6 8 10
12 12 9 6 8 8 3 6 4 6 10 6
Totais
Mdia

Qual a varivel de resposta e qual o fator controlvel ?

Quantos nveis possui o fator controlvel ?

Faa a tabela de anlise de varincia e conclua a respeito do fator em


estudo;

Plote um grfico de ngulo da ferramenta x rugosidade;

Indique o que deve ser feito para assegurar qualidade;

Indique o que deve ser feito para obter economia;


8. Comparao de vrios grupos: a anlise de varincia
98 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Exerccio 8.4 Uma indstria txtil tem um grande nmero de teares mecnicos.
Supem-se que a velocidade desses teares seja a mesma. Para verificar
essa hiptese, foram escolhidos aleatoriamente cinco teares e a produo
medida em um perodo de uma hora foi anotada:

Tear Produo (Kg)


1 23,8 24,0 23,8 23,6 23,9
2 23,9 23,7 23,6 23,8 24,0
3 24,0 23,9 24,1 24,2 24,1
4 24,0 24,0 23,9 23,8 23,9
5 24,0 24,1 24,0 24,1 24,2

a) Indique se esse um experimento a nveis fixos ou aleatrios.

b) Faa a anlise de varincia e conclua a respeito do efeito dos teares.

c) Estime os componentes de variao.

Exerccio 8.5 Resultados de corpos de prova de concreto com adio de Microsslica


indicaram os seguintes resultados de resistncia compresso:

Adio Resistncia (MPa)


0% 28,1 26,5 24,3
5% 35,3 34,3 37,5
10% 39,8 44,1 42,3
15% 39,1 40,8 43,0

a) Indique se esse um experimento a nveis fixos ou aleatrios.

b) Faa a anlise da varincia e conclua a respeito do efeito da adio de


microsslica.

c) Se for o caso, faa uma comparao mltipla de mdias.

d) Plote um grfico de linha para a mediana.

Exerccio 8.6 Um engenheiro deseja que os azulejos produzidos em uma indstria


cermica apresentem a menor absoro de gua possvel. Os resultados
de um experimento feito com trs tipos diferentes de argila indicaram o
seguinte:

Tipo de Absoro (gramas)


Argila
A1 141 112 128 122 102
A2 132 115 98 121 108 139 126
A3 135 122 158 143 155
Estatstica Industrial
99
8. Comparao de vrios grupos: a anlise de varincia

a) Indique se esse um experimento a nveis fixos ou aleatrios.

b) Faa a anlise da varincia e conclua a respeito do efeito do tipo de


argila.

c) Se for o caso, faa uma comparao mltipla de mdias.

d) Plote um grfico de barras para as mdias.

Exerccio 8.7 Uma metalrgica tem um grande nmero de fornos usados para fundio
de metais. A temperatura desses fornos deveria ser a mesma. Para testar
essa hiptese foram feitas medies em 4 fornos escolhidos
aleatoriamente. Analise os resultados e conclua a respeito de possveis
diferenas entre os fornos.

Forno Temperatura
1 824 821 829 808 815
2 817 830 819 809 825
3 822 810 831 824 818
4 826 828 810 820 815

Exerccio 8.8 Um engenheiro industrial desenvolveu um modelo estocstico de


simulao que prev a produtividade mensal em funo do intervalo de
tempo entre manutenes preventivas. Se esse intervalo for muito curto,
as mquinas estaro constantemente em manuteno e a produtividade
ser baixa. Se o intervalo for muito longo, haver quebras, exigindo
manuteno corretiva, mais demorada, novamente prejudicando a
produtividade. Os resultados da simulao aparecem a seguir.

Intervalo Produtividade
4 136 137 135 140 136
6 145 146 147 147 148
8 146 144 148 145 145
10 134 131 136 134 133
12 117 119 117 115 116

a) Faa a anlise da varincia, plote um grfico de barras para a


produtividade mdia e conclua a respeito do intervalo timo para as
intervenes da manuteno produtiva.

Exerccio 8.9 Em uma indstria qumica um catalisador utilizado para acelerar um


processo de deposio metlica. Foi feito um experimento variando-se a
concentrao desse catalisador e anotando-se o tempo necessrio para
completar o processo. Analise os dados usando a Tabela Anova. Depois
faa uma comparao mltipla de mdias, plote um grfico de linhas e
conclua a respeito da concentrao ideal.
8. Comparao de vrios grupos: a anlise de varincia
100 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Concentrao Tempos
10 11,2 10,4 10,1 10,6
15 10,6 11,1 10,8 11,7
20 12,5 12,0 13,2 12,6
25 18,8 19,0 18,4 19,6

Exerccio 8.10 Um profissional da rea de ergonomia realizou um estudo para verificar


qual posto de trabalho gerava um melhor bem estar para o funcionrio.
Para isso foram projetados trs postos de trabalho e durante um ms 10
funcionrios testaram os novos postos. Ao final de um ms os
funcionrios responderam um questionrio gerando uma nota para o bem
estar do funcionrio. Analise os dados e conclua a respeito do melhor
posto de trabalho.

Postos
Func. 1 2 3
1 7 5 8
2 8 6 9
3 7 7 8
4 8 6 9
5 9 5 8
6 7 6 8
7 8 7 9
8 6 5 10
9 7 6 8
10 6 6 9

Exerccio 8.11 Para analisar a variabilidade na qualidade de um tipo de tijolo de


cimento fornecido por uma fbrica, selecionou-se aleatoriamente 5 sacos
de cimento durante um certo perodo de produo e para cada saco
foram tomadas trs amostras aleatrias. Estime o percentual da
variabilidade dentro dos sacos e entre os sacos de cimento.

Saco cimento 1 2 3 4 5
74 68 75 72 79
Resistncias 76 71 77 74 81
75 72 77 73 79

Exerccio 8.12 Trs layout esto sendo testado em relao a produtividade. Para isso 12
operadores foram avaliados em relao a produtividade medida em
peas/ hora. Os valores de produtividade esto apresentados na tabela
abaixo. Analise os dados e conclua a respeito do melhor layout.
Estatstica Industrial
101
8. Comparao de vrios grupos: a anlise de varincia

Layout
Func 1 2 3
1 120 125 130
2 122 126 129
3 124 127 131
4 118 125 128
5 116 128 128
6 120 126 127
7 119 129 126
8 117 128 125
9 121 129 128
10 122 130 129
11 117 127 127
12 120 128 128

Exerccio 8.13 Um grupo de engenheiros acredita que a resistncia mecnica (maior


melhor) de um certo componente cermico afetada pela presso e
temperatura de cozimento. Foi realizado um experimento que revelou os
seguintes dados:

Presso
Temperatura 30 35 40
o
200 C 44 42 47 46 42 44
225 oC 41 43 45 46 39 41
o
250 C 45 47 48 49 44 41

Qual a varivel de resposta e quais os fatores controlveis ?

Observe os dados e indique qual o valor mnimo e qual o valor mximo


medido para a varivel de resposta

Faa a anlise de varincia e conclua a respeito dos fatores e interaes


significativos

Plote um grfico de dois fatores

Qual o ajuste que voc recomendaria para este processo ?

Exerccio 8.14 A montagem de um cabo de ao revestido est apresentando problemas


devido excessiva retrao do ncleo. Os engenheiros desconfiam de
dois fatores: Fornecedor do ncleo e temperatura do ncleo na
montagem. Foi feito um experimento e as medidas de retrao (menor
melhor) foram:
8. Comparao de vrios grupos: a anlise de varincia
102 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Fornecedor do Ncleo
Temperatura 1 2 3 4
o
75 C 21 24 26 12 13 15 12 11 14 13 13 11
85 oC 26 26 30 16 14 17 15 13 19 18 17 13

Faa a anlise de varincia e conclua a respeito dos fatores e interaes


significativos;

Plote um grfico de dois fatores;

O que fazer para assegurar qualidade ?

O que fazer para obter economia ?

Caso as investigaes fossem continuar, quais os ensaios voc


recomendaria ?
9
Regresso linear simples
Jos Luis Duarte Ribeiro
Carla ten Caten

COMENTRIOS INICIAIS Em muitos problemas h duas ou mais variveis que so relacionadas e


pode ser importante modelar essa relao. Por exemplo, a resistncia
abraso de um composto de borracha pode depender da quantidade de
leo adicionada mistura. Assim, possvel construir um modelo
relacionando resistncia abraso com quantidade de leo, e ento pode-
se usar esse modelo para fins de otimizao e controle de processo.

Outro exemplo, as vendas de um produto podem estar relacionadas ao


valor gasto em marketing com esse produto. Assim, possvel construir
um modelo relacionando vendas gastos com marketing, e ento pode-
se usar esse modelo para fins previso de vendas.

Em geral vamos supor que h uma varivel dependente (ou varivel de


resposta) Y que depende de k variveis independentes (ou variveis
regressoras) X1, ..., Xk. A relao entre essas variveis ser descrita por
um modelo matemtico, chamado modelo de regresso, o qual definido
(ajustado) a um conjunto de dados.

Algumas vezes a relao funcional entre Y e X1, ..., Xk conhecida


exatamente. Outras vezes o pesquisador dever buscar o modelo
apropriado testando diferentes funes. Modelos polinomiais so
largamente utilizados como uma funo aproximada da verdadeira
relao entre Y e X, e por isso sero descritos no captulo 10.

Modelos de regresso so usados com freqncia na anlise de dados


provenientes de experimentos no planejados (observaes de um
fenmeno no controlado ou dados histricos).

Mas a anlise de regresso tambm muito til no caso de experimentos


planejados que incluem fatores a nveis contnuos. Nesse caso a anlise
de varincia usada para identificar os fatores significativos, e a seguir a
anlise de regresso usada para construir um modelo que incorpore
esses fatores.

CORRELAO Para uma amostra de n pares de valores (x,y) o coeficiente de


correlao r fornece uma medida da relao linear que existe entre duas
variveis aleatrias X e Y.
104 Regresso linear simples 9. Regresso linear simples
Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Figura 39 - Grfico de disperso

O valor de r calculado como:

S XY
Eq 160: r=
S XX SYY

Desvio-padro de X

S XX = x i2 ( xi )
Eq 161: 2
n

Desvio-padro de Y

SYY = y i2 ( y i )
Eq 162: 2
n

Covarincia de X,Y:

Eq 163: S XY = xi yi ( xi )( yi ) n
Para uma interpretao adequada do coeficiente de correlao, X e Y
deveriam ser variveis aleatrias, ao contrrio do que acontece nos
problemas de regresso, onde Y aleatria, mas X considerada uma
varivel fixa.

Mesmo assim, prtica comum calcular r em quase todos os casos, isto , com
X aleatria ou no. O coeficiente de correlao linear r mede a
intensidade da relao linear entre duas variveis

Pode ser demonstrado que -1 r 1, onde r = +1 ou r = -1


correspondem ao caso de uma relao linear perfeita entre X e Y,
enquanto que r = 0 indica nenhuma relao, ou seja:

valores de r prximos de +1 indicam uma forte correlao positiva


entre x e y

valores de r prximos de -1 indicam uma forte correlao negativa


entre x e y

valores de r prximos de 0 indicam uma fraca correlao entre x e y

Deve-se ter em conta que r uma medida da relao linear entre as


duas variveis e no tem sentido quando a relao no linear. Alm
disso, o pesquisador deve ter em mente que a existncia de uma
correlao entre duas variveis no implica necessariamente na
Estatstica Industrial
9. Regresso linear simples 105

existncia de um relacionamento de causa e efeito entre elas.

Exemplo 9.1 Aps uma regulagem eletrnica um veculo apresenta um rendimento


ideal no que tange a rendimento de combustvel. Contudo, com o passar
do tempo esse rendimento vai se degradando. Os dados que aparecem
na Tabela 11 representam o rendimento medido ms a ms aps a
regulagem. Calcule o coeficiente de correlao.

X: meses aps a 1 2 3 4 5 6
regulagem
Y: rendimento 10,7 10,9 10,8 9,3 9,5 10,4
X: meses aps a 7 8 9 10 11 12
Tabela 11 - Valores de rendimento de regulagem
combustvel
Y: rendimento 9,0 9,3 7,6 7,6 7,9 7,7

12
11
10
Co
9
8
7
Figura 40 - Valores observados do 0 2 4 6 8 10 12
rendimento em funo do tempo aps
a regulagem.
Tempo aps a regulagem

Para o exemplo do rendimento de combustvel, teramos:

Clculos iniciais
106 Regresso linear simples 9. Regresso linear simples
Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Meses(X) Rendimento(Y) X^2 Y^2 X*Y


1 10,7 1 114,49 10,7
2 10,9 4 118,81 21,8
3 10,8 9 116,64 32,4
4 9,3 16 86,49 37,2
5 9,5 25 90,25 47,5
6 10,4 36 108,16 62,4
7 9 49 81 63
8 9,3 64 86,49 74,4
9 7,6 81 57,76 68,4
10 7,6 100 57,76 76
11 7,9 121 62,41 86,9
12 7,7 144 59,29 92,4
78 110,7 650 1039,55 673,1
6,5 9,225

xi = 78,00;xi2 = 650,00; X = 6,50

yi = 110,70;yi2 = 1039,55; Y = 9,225

Desvio-padro de X

S XX = xi2 ( xi ) n = 650 (78)2 / 12 = 143,00


2

Desvio-padro de Y

SYY = yi2 ( yi ) n = 1039,55 (110,70 )2 / 12 = 18,34


2

Covarincia de X,Y:

S XY = x i y i ( x i )( y i ) n = 673,1 (78 110,70) / 12 = 46,45


Coeficiente de correlao

S xy 46,45
r= = = 0,907
S xx S yy 143,00 x 18,34

Interpretao:

Existe uma correlao linear inversa na amostra entre meses aps a


regulagem e rendimento. A intensidade desta correlao forte.

TESTE DE HIPTESE A hiptese da existncia de uma relao entre X e Y, pode ser


PARA O COEFICIENTE DE formulada usando-se:
CORRELAO
H0 : = 0

H1 : 0

onde a letra usada para representar o valor populacional do


coeficiente de correlao. Pode ser demonstrado que o valor de t pode
Estatstica Industrial
9. Regresso linear simples 107

ser calculado usando:

r n2
Eq 164: t=
1 r2

Assim a hiptese da existncia de uma relao entre X e Y pode ser


verificada diretamente a partir do valor amostral do coeficiente de
correlao. Como sempre a hiptese nula ser rejeitada se o valor
calculado for maior que o tabelado, ou seja, se:

Eq 165: t > t / 2,n 2

Para o exemplo em estudo tem-se:

0,907 12 2
t= = 6,82 > t0,025;10 = 2,228 rejeita - se H 0,
1 ( 0,907) 2

ou seja, descarta-se a hiptese nula e conclui-se que existe correlao


entre as variveis estudadas.

REGRESSO LINEAR A regresso linear simples estima uma equao matemtica (ou modelo)
SIMPLES que dado o valor de X (varivel independente), prev o valor de Y
(varivel dependente). dito relao linear simples, pois supe-se
tendncia linear entre as variveis e simples por ser uma nica varivel
independente

Seja que existam dados coletados (pares de valores) associando uma


varivel de resposta Y (varivel dependente) com uma varivel
regressora X (varivel independente). E suponha que a relao entre Y
e X seja aproximadamente linear. Ento o valor esperado de Y para
cada valor de X vir dado por:

Eq 166: E (Y/X) = 0 + 1 X

onde os parmetros da relao linear, 0 e 1, so desconhecidos.


Vamos supor que cada observao Y possa ser descrita pelo modelo:

Eq 167 Y = 0 + 1 X +

onde o erro aleatrio, com mdia 0 e varincia 2. A Eq 167


chamada de modelo de regresso linear simples. Nesta equao, o
coeficiente 0 a interseo (valor de Y para X = 0) enquanto que 1
a inclinao da reta, que pode ser positiva, negativa ou nula. A
inclinao da reta representa o quanto Y varia para cada unidade da
varivel X.

Se h n pares de dados (y1, x1), ..., (yn, xn) possvel estimar os


parmetros 0 e 1 usando o mtodo dos Mnimos Quadrados, o qual
busca minimizar:

Eq 168: L = (yi - b0 - b1 xi)2

onde b0 e b1 so estimativas amostrais de 0 e 1. O uso do mtodo


108 Regresso linear simples 9. Regresso linear simples
Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

conduz as seguintes estimativas:

Eq 169: b1 = SXY / SXX

Eq 170: b0 = Y b1 X

Exemplo 9.2 Usando os dados do problema do rendimento de combustvel, obtenha as


estimativas para os parmetros b0 e b1 e a equao da reta de regresso.

Clculos iniciais

xi = 78,00xi2 = 650,00 X = 6,50

yi = 110,70yi2 = 1039,55 Y = 9,225

S XX = x i2 ( xi )
2
n = 143,00

SYY = y i2 ( y i )
2
n = 18,34

S XY = x i y i ( x i )( y i ) n = 46,45

Estimativa dos parmetros:

b1 = SXY / SXX = -46,45 / 143,00 = -0,325

b0 = Y b1 X = 9,225 - (-0,325) 6,50 = 11,34

Equao de regresso

Y = 11,34 - 0,325 X

RELAO ENTRE O O valor de r um valor sem dimenso, que apenas fornece uma idia
COEFICIENTE DE da relao linear entre duas variveis. No caso de regresso, alm de se
CORRELAO E A ter uma idia da relao entre as duas variveis, tambm se encontra uma
REGRESSO equao que pode ser usada para fornecer estimativas.

Pode ser demonstrado que existe a seguinte relao:

Eq 171: S2 =
n 1
n2
( )
1 r 2 S 2y

onde S2 a varincia dos desvios em relao ao modelo, e S y2 a


varincia dos valores de Y. Se n grande, temos:

Eq 172: ( )
S 2 1 r 2 S 2y
Estatstica Industrial
9. Regresso linear simples 109

Yi Y= bo+b1 X
(Yi Y$i )
(Yi Y )
(Y$i Y )
Y

Figura 41 - Decomposio dos Xi


resduos X

Nessa forma observamos que r2 equivale a proporo da variabilidade


dos valores de Y que pode ser atribuda regresso com a varivel X.

r2 conhecido como coeficiente de Determinao. Para o exemplo


analisado resultou r =(-0,907)2 = 0,82, ou seja, 82% da variabilidade
nos resultados de rendimento de combustvel pode ser devida ao tempo
decorrido aps a regulagem e 18% da variabilidade total devido a
outros fatores que no foram investigados.

Tambm pode ser demonstrado que:

Eq 173: r = b1 SX / SY

Assim, dado um conjunto de pares (x,y), conhecida a inclinao b1,


possvel calcular o coeficiente de correlao r, ou vice-versa.

VARINCIA DOS Para verificar a preciso das estimativas, determinar intervalos de


ESTIMADORES confiana e testar hipteses importante conhecer a varincia dos
estimadores. Pode ser demonstrado que uma estimativa da varincia
residual, 2, vem dada por

Eq 174: S2 = SQR / (n-2)

onde:

2
Eq 175: SQR = [ yi (b0 + b1xi )] = SYY b1S XY

E a partir de 2 obtm-se as estimativas das varincias de b1 e b0:

Eq 176: Sb21 = S 2 S XX

1 X 2
Eq 177: Sb2 0 = S 2 +
n S XX

INTERVALOS DE Como os resduos de Y supostamente seguem a distribuio Normal, e


110 Regresso linear simples 9. Regresso linear simples
Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

CONFIANA E TESTES como os valores de b0 e b1 so funes lineares de Y, possvel


DE HIPTESE demonstrar que:

(
b0 N 0 , b2 0)
b1 N (1, b21 )

Esses resultados podem ser usados em testes de hiptese. Por exemplo,


se a hiptese :

H 0 : 1 = 10
H 1 : 1 10

ento calcula-se:

Eq 178: Z = (b1 - 10) / b1

e, para um nvel de probabilidade , H0 ser rejeitada se resultar


Z > Z / 2 . Como em geral a varincia S2 no conhecida, usa-se:

Eq 179: t = (b1 - 10) / Sb1

e nesse caso H0 rejeitada se t > t / 2,n 2 . O intervalo de confiana


para 1 vir dado por

Eq 180: b1 t / 2 S b 1 < 1 < b1 + t / 2 S b 1

Uma hiptese testada com freqncia :

H 0 : 1 = 0
H 1 : 1 0

Isto , testa-se se a inclinao igual a zero, o que equivale a testar se


existe uma relao entre Y e X. Usando a eq. (2) tem-se:

Eq 181: t = b1 / Sb1

o qual deve ser comparado com o valor tabelado t / 2,n 2 . Como


sempre, H0 ser rejeitado se t > t / 2,n 2 .

Exemplo 9.3 Usando os dados do problema do rendimento de combustvel, obtenha as


estimativas para a varincia residual e para a varincia dos parmetros
b0 e b1. Construa um intervalo de confiana para a inclinao b1 e
verifique a hiptese H 0 : 1 = 0 .

Estimativa das varincias

SQR = SYY b1 S XY = 3,24


Estatstica Industrial
9. Regresso linear simples 111

S 2 = SQR /( n 2) = 0,324 ; S = 0,569


S b21 = S 2 / S XX = 0,00227 ; S b 1 = 0,0476

2 2 1 X2
= 0,123 ;
Sb 0 = S + S b 0 = 0,351
n S XX

Intervalo de confiana para b1

t0,025;10 = 2,228

- 0,325 - 2,228 (0,0476)< 1 <- 0,325 + 2,228 (0,0476)

- 0,431< 1 <- 0,219

Como esse intervalo no inclui o zero, a hiptese 1 = 0 rejeitada, ou


seja, existe uma relao entre o rendimento de combustvel e o tempo
decorrido aps a regulagem.

PREVISO DE VALORES A anlise de regresso produz uma relao entre as variveis


DE Y consideradas, a qual pode ser usada para prever valores de Y.

Dado um certo valor de X = x0, h dois tipos de previso: previso de


um valor mdio de Y e previso de um valor individual de Y. Nos dois
casos a estimativa pontual de Y a mesma, mas a amplitude do
intervalo de confiana diferente. O intervalo de confiana mais
amplo para o caso de previses de valores individuais.

Previso de um valor A varincia dos valores preditos ir depender no somente de S2, mas
mdio de Y tambm do valor de x0. Isso acontece porque as previses so mais
precisas quando x0 X e menos precisas quando x0 aproxima-se dos
extremos investigados.

Pode ser demonstrado que a varincia da previso de um valor mdio de


Y vem dada por:

Eq 182: S
2
1 x X
= S2 + 0
( )2
Yp
n S XX

Como pode ser visto, a varincia da previso mnima quando x0 = X


e aumenta quando x0 afasta-se de X . Assim, o intervalo de confiana
para a previso de um valor mdio vir dado por:

Eq 183: Y = (b0 + b1 X0) t/2 ; n-2 S


Y p

Previso de um valor A varincia da previso de valores individuais de Y segue o mesmo


individual de Y comportamento observado para os valores mdios. Contudo, a varincia
maior no caso de valores individuais.

Pode ser demonstrado que a varincia da previso de um valor individual


de Y vem dada por:
112 Regresso linear simples 9. Regresso linear simples
Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

2 2
1 x X
Eq 184: SYp = S 1 + +
0 ( )2
n S XX

De modo que o intervalo de confiana para a previso de um valor


individual de Y :

Eq 185: Y = (b0 + b1 X0) t/2 ; n-2 (S )Yp

Exemplo 9.4 Usando os dados do problema do rendimento de combustvel, obtenha os


intervalos de confiana de 95% para a previso de um valor mdio e um
valor individual de Y para um tempo x0 = 8 meses.

(b0 + b1 x0) = 8,74;


(x0 X )2 = 0,0157
S XX

1
S2 = 0,324 + 0,0157 = 0,0321 ; S = 0,179
Y p 12 Y p

1
SY2 p = 0,324 1 + + 0,0157 = 0,356 ; SY p = 0,597
12

Valor mdio para x0 = 8

Y = 8,74 2,228 . (0,179)

Y = 8,74 0,399

Valor individual para x0 = 8

Y = 8,74 2,228 . (0,597)

Y = 8,74 1,33

12
11
10
Co
9
8
7
0 2 4 6 8 10 12
Figura 42 - Intervalo de Confiana
de 95%
Tempo aps a regulagem

ANLISE DA VALIDADE A adequao do ajuste e as suposies do modelo podem ser verificadas


Estatstica Industrial
9. Regresso linear simples 113

DO MODELO atravs de uma anlise dos resduos. Os resduos padronizados so


calculados como:

y i (b0 + b1 x i )
Eq 186: R =
i
S
SQR = SYY b1SXY
S2 = SQR / n 2

Adequao do ajuste A adequao do ajuste testada plotando os resduos em funo de X.


Se o ajuste for bom, os resduos seguiro um padro aleatrio. Caso
contrrio, alguma tendncia curvilneo ser observada.

Na Figura 43, (a) representa uma situao onde o ajuste adequado,


enquanto que (b) representa uma situao onde o modelo linear no se
ajusta bem aos dados.

2 2

1 1

Re 0 Re 0

-1 -1

-2 -2
0 4 8 12 16 20 0 4 8 12 16 20
Figura 43 - Anlise de resduos. X X

(a) (b)

Se o modelo linear no fornece um bom ajuste, as vezes o problema


pode ser contornado trabalhando-se com valores transformados de X ou
Y, por exemplo,

Y = b0 + b1 X
Eq 187:
Y = b0 + b1 X onde X = X

Homogeneidade da A suposio de homogeneidade da varincia 2 ao longo de todo o


varincia intervalo de X tambm pode ser verificada analisando o grfico de
Resduos X.

A Figura 44 apresenta duas situaes: (a) onde verifica-se a suposio de


homogeneidade, e (b) onde essa suposio violada.
114 Regresso linear simples 9. Regresso linear simples
Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

2 3
2
1
1
Re 0 Re 0
-1
-1
-2
-2 -3
Figura 44 - Verificao da 0 4 8 12 16 20 0 4 8 12 16 20
homogeneidade da varincia. X X
(a) (b)

Se a suposio de homogeneidade da varincia rejeitada, pode-se usar


o mtodo da regresso linear ponderada, onde se busca os valores de 0
e 1 que minimizam

Eq 188: L = wi (yi - (b0 + b1 xi))2

Nesse caso, os pesos wi so inversamente proporcionais varincia.

Normalidade dos O teste da normalidade da distribuio dos resduos pode ser feito
Resduos plotando-se os resduos em papel de probabilidade ou utilizando testes
analticos de normalidade, como o teste do Chi-quadrado ou o teste de
Kolmorov-Smirnov.

Se a suposio de normalidade rejeitada, muitas vezes uma


transformao matemtica nos valores de X e Y (logaritmo, inverso,
raiz quadrada) ir gerar valores transformados com resduos
normalmente distribudos.

Ento o problema analisado no espao das variveis transformadas e ao


final retorna-se ao espao original.

INTERVALO DE A varincia da inclinao b1 aumenta quando se reduz o intervalo de


VARIAO PARA X variao de X. Se o intervalo pequeno, Sb1 ser grande e nesse caso
ser difcil rejeitar a hiptese H0 : b1 = 0. Em outras palavras, se a
relao entre X e Y medida em um intervalo reduzido de X, os
parmetros estimados no tero muito significado estatstico.

Se o objetivo construir um modelo de regresso, deve-se coletar dados


nos extremos do intervalo de X, ou seja, nos limites do interesse e
viabilidade prticos ou nos limites em que se supem vlida a relao
linear.

A ANLISE DE A anlise de varincia tambm aplicvel aos problemas de regresso.


VARINCIA E A Na regresso simples, podemos decompor os resduos da seguinte
REGRESSO maneira:

Eq 189: (Yi Y ) = [ y i (b0 + b1 X i )] + [(b0 + b1 X i ) Y ]

Elevando ao quadrado e somando, obtm-se:

(Yi Y ) 2 = [ y i (b0 + b1 X i )]2 + [(b0 + b1 X i ) Y ]


Eq 190: 2
Estatstica Industrial
9. Regresso linear simples 115

Uma vez que ;o produto cruzado resulta nulo. Essa equao tambm
pode ser escrita como:

SYY = SQR + SQReg

Cujos graus de liberdade valem respectivamente:

(n - 1) = (n - 2) + 1

Assim, a mdia quadrada associada com o modelo de regresso e a


mdia quadrada dos resduos resultam:

MQReg = SQReg / 1

MQR = SQR / (n - 2)

E o teste F feito comparando MQReg, com MQR, ou seja,

F = MQReg / MQR

A hiptese nula, H0 : 1 = 0, ser rejeitada sempre que

F > F, 1, n-2

A Tabela 12 apresenta a tabela ANOVA, contendo o formulrio prtico


para o clculo das Somas Quadradas e os demais desenvolvimentos at o
teste F.

Fonte de SQ GDL MQ F
Variao
Regresso SQReg = b1 1 MQReg MQReg/MQR
SXY
Residual SQR=SYY - n-2 MQR
Tabela 12 - Tabela ANOVA para a b1SXY
anlise de regresso.
Total SYY n-1

Exemplo 9.5 Faa a anlise de varincia para o problema do rendimento de


combustvel e confirme a significncia do modelo de regresso linear.

Soluo:

J tnhamos calculado as Somas Quadradas SYY e SQR como:

SYY = 18,34;SXY = - 46,45;b1 = - 0,325

SQR = 3,24;

Assim

SQReg = b1 SXY = - 0,325 (- 46,45) = 15,10

De modo que a ANOVA resulta conforme aparece na Tabela 13.


116 Regresso linear simples 9. Regresso linear simples
Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Fonte de SQ GDL MQ F
Variao
Regresso 15,10 1 15,10 46,6

Residual 3,24 10 0,324


Tabela 13 - Tabela ANOVA para o
exemplo do combustvel. Total 18,34 11

O valor de F calculado (46,6) muito maior que o tabelado (4,96) e


assim confirma-se a significncia do modelo.

Nota: o coeficiente de determinao r2 tambm pode ser calculado


usando:

SQ Re g 15,10
r2 = = = 0,82 ou 82%
SYY 18,34

DADOS ATPICOS Algumas vezes, o conjunto de dados pode estar contaminado com alguns
dados atpicos. Esses dados atpicos podem ser o resultado do efeito de
algum fator externo ao estudo, ou podem ser simplesmente um erro de
leitura e registro.

Existe um procedimento para testar a significncia de um dado atpico.


Este procedimento (ver Snedcor (1982)) est baseado na determinao
de uma nova equao, com o dado atpico eliminado, seguido de um
teste de hiptese comparando os valores preditos pela equao original
com aqueles preditos pela nova equao.

Se o conjunto pode estar contaminado por vrios dados atpicos, a


soluo ser usar tcnicas de regresso robusta. Neste tipo de anlise,
dado um peso menor aqueles dados que se afastam do conjunto. Por
exemplo, uma alternativa minimizar

Eq 191: L = wi [yi - (b0 + b1 xi)]2

onde os pesos wi so proporcionais ao inverso do resduo Ri, e a


soluo obtida aps algumas iteraes.

REGRESSO NO Se o ajuste linear deficiente, muitas vezes possvel encontrar uma


LINEAR SIMPLES soluo aproximada, e em geral satisfatria, utilizando uma
transformao em X e/ou em Y.

Em forma genrica, teramos:

Eq 192: f(y) = b0 + b1 g(X) +

Eq 193: Y* = b0 + b1 X* +

Os possveis valores de Y* = f(y) seriam y, 1/y, y2, ln y, etc.


Igualmente, para X* = g(x) poderamos usar x, 1/x, x2, ln x, etc.

Uma vez definida a transformao, e confirmada em um grfico de


Estatstica Industrial
9. Regresso linear simples 117

disperso a relao aproximadamente linear entre Y* e X*, poderia se


usar o mtodo apresentado anteriormente para obter-se as estimativas de
0 e 1.

Note-se que o mtodo dos mnimos quadrados aplicado aos valores


transformados, isto , minimizando:

L = [ f (yi) - (b0 + bi g (xi))]2

no vai fornecer os mesmos resultados que seriam obtidos minimizando:

L = [ yi - h (xi)]2

onde h (x) uma funo no linear de x. Contudo, as diferenas em


geral so pequenas e no comprometem a anlise.

Exerccios

Exerccio 9.1 Em um processo qumico a quantidade de slidos depositada pode


depender da concentrao de um componente A que adicionado
mistura. Ajuste um modelo de regresso linear aos dados que aparecem
a seguir. Depois plote a reta de regresso e os valores observados

Conc. 0 0 0 2 2 2 4 4 4 6 6 6 8 8 8
Depos. 13,3 11,5 12,9 14,1 13,3 16,1 14,9 15,9 18,1 17,5 16,5 18,9 20,3 18,5 20,2

Exerccio 9.2 Para os dados do exerccio 9.1, calcule a varincia residual e a varincia
dos parmetros b0 e b1. Aps construa um intervalo de confiana de
95% para a inclinao b1 e verifique a hiptese H0 : 1 = 0

Exerccio 9.3 Calcule os resduos padronizados Ri = [Yi - (b0 + b1 Xi)] / S para os


dados do exerccio 9.1. Em seguida, plote um grfico de Resduos X
e verifique se h evidncias de falta de ajuste do modelo linear ou falta
de homogeneidade da varincia.

Exerccio 9.4 Ainda em relao aos dados do exerccio 9.1, calcule os intervalos de
confiana para um valor mdio e para um valor individual de Y usando
x0 = 0 e x0 = 8.

Exerccio 9.5 Um torno mecnico pode ser operado a diversas velocidades. Contudo,
a qualidade do acabamento, ou seja, a rugosidade superficial, pode
piorar com o aumento da velocidade de operao. Ajuste um modelo de
regresso linear aos dados que aparecem a seguir e depois plote a reta de
regresso e os valores observados.

Velocidade 3 3 3 6 6 6 9 9 9 12 12 12
Rugosidade 26,0 21,5 33,5 36,0 27,5 37,0 41,5 28,0 39,5 43,0 37,0 50,5

Exerccio 9.6 Para os dados do exerccio 9.5, calcule a varincia residual e a varincia
dos parmetros b0 e b1. Aps construa um intervalo de confiana de
95% para a inclinao b1 e verifique a hiptese da existncia de uma
relao entre velocidade e rugosidade superficial.
118 Regresso linear simples 9. Regresso linear simples
Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Exerccio 9.7 Faa a anlise de varincia para os dados do exerccio 9.5 e confirme
a significncia do modelo de regresso linear. Em seguida calcule o
valor do coeficiente de determinao e indique qual o significado tcnico
desse coeficiente para o problema em questo.

Exerccio 9.8 O gerente de uma indstria localizada em um pas tropical suspeita que
h uma correlao entre a temperatura do dia e produtividade. Dados
coletados aleatoriamente ao longo de um perodo de seis meses
revelaram o seguinte.

Temperatura 21,2 20,3 22,7 22,0 22,3 23,5 24,8 24,2 25,5 25,2 25,5 25,8

Produtividade 142 148 131 132 145 138 144 136 141 124 133 128

Temperatura 27,5 26,3 28,2 28,6 29,0 29,7 30,7 30,3 30,2 31,4 32,5 32,7

Produtividade 132 137 124 117 122 131 124 111 119 129 123 116

Calcule o valor do coeficiente de correlao entre a Temperatura e a


produtividade e verifique a hiptese H0 : = 0. Depois plote um grfico
de disperso e visualize a natureza da correlao entre Temperatura e
Produtividade.

Exerccio 9.9 A anlise de 20 pares de valores indicou que a resistncia trao (Y)
de uma fibra sinttica usada na indstria txtil guarda uma relao linear
com a percentagem de algodo (X) presente na fibra. A equao obtida
foi Y = 35,7 + 0,85X (X fornecido em percentagem, equao vlida
para o intervalo de X entre 20 e 35%). Conhecidos os valores das Somas
Quadradas SXY=43,68 e SYY=79,43 pede-se:

a) Faa a anlise de Varincia e conclua a respeito da significncia do


modelo.

b) Calcule o valor do coeficiente de determinao r2 e indique qual


o seu significado tcnico.

Exerccio 9.10 Um sofisticado simulador estocstico de trfego fornece a velocidade


mdia em avenidas de uma metrpole em funo do volume de
automveis. O resultado de 14 simulaes revelou o seguinte:

Vol. de Trfego 3 3 5 5 10 10 15 15 20 20 25 25 30 30
Velocid. Mdia 95,6 93,8 74,4 74,8 50,5 51,5 44,6 42,4 35,8 38,7 32,0 3,2 30,1 29,1

Ajuste um modelo linear a esses dados e ache a equao de regresso Y


= b 0+ b 1 X

Exerccio 9.11 Calcule os resduos padronizados para os dados do exerccio 9.10. Aps,
plote um grfico de Resduos X e verifique se h evidncias de falta de
ajuste do modelo linear.

Exerccio 9.12 Utilize o seguinte modelo para ajustar os dados do exerccio 9.10 Y=b0 +
Estatstica Industrial
9. Regresso linear simples 119

b1 (1 / X). Estime o valor dos coeficientes b0 e b1 para esse modelo


no linear e depois repita a anlise de resduos pedida em 9.11
verificando se para o presente modelo h evidncias de falta de ajuste.
10
Regresso linear mltipla
Jos Luis Duarte Ribeiro
Carla ten Caten

Muitos problemas de regresso envolvem mais de uma varivel


regressora. Por exemplo, a qualidade de um processo qumico pode
depender da temperatura, presso e taxa de agitao. Nesse caso h
trs variveis regressoras.

O MODELO DA O modelo geral da regresso linear mltipla :


REGRESSO LINEAR
MLTIPLA

Eq 194 : Y = 0 + 1 X 1 + 2 X 2 + ... + k X k +

O problema ento estimar o valor dos coeficientes i a partir de um


conjunto de dados, conforme o esquema apresentado na Tabela 14.

Y X2 X1 .... Xk
y1 x12 x11 .... x1k
y2 x22 x21 .... x2k
. . . . .
. . . . .
Tabela 14 - Apresentao de um . . . . .
conjunto de dados.
yn xn2 xn1 .... xnk

Novamente, o mtodo dos mnimos quadrados usado para minimizar:

Eq 195: [ (
L = y j b0 + b1 x1 j + ... + bk x kj )]2
Observa-se que a aplicao do mtodo dos mnimos quadrados fica
simplificada se o modelo da Eq 194 escrito como:

Eq 196: Y = 0, + 1 ( X 1 x1 ) + ... + k ( X k xk ) +

nesse caso fcil demostrar que:

Eq 197: 0, = 0 + 1 x1 + ... + k x k

enquanto que os demais coeficientes 1,...,k ficam inalterados. O que


est sendo feito simplesmente eliminar o valor mdio das variveis
regressoras. Alm de simplificar a estimativa dos coeficientes, o uso do
Estatstica Industrial
10. Regresso linear mltipla 121

modelo da Eq 196 tambm facilita outras tarefas associadas a


inferncias.

Usando a Eq 196 , a funo a ser minimizada :

Eq 198: [ ( ( ) (
L = yi b0, + b1 x1 j x1 + ... + bk x kj x k ))]2
NOTAO MATRICIAL Para lidar com o problema de regresso linear mltipla, mais
conveniente usar notao matricial, pois assim tem-se uma apresentao
muito compacta dos dados, do modelo e dos resultados.

Em notao matricial o modelo da Eq 196 aparece representado como:

Eq 199: Y = X +

onde:

Y1 1 (x11 x1 ) ... ( x k1 x k ) , 1
. . 0 .
. . .

Eq 200: Y = . ; X = . . . ; = . ; = .

.
. . . . .
Yn 1 (x1n x1 ) ... (x kn x k ) n
k

Genericamente, tem-se que Y o vetor n x 1 das observaes, X a


matriz n x p com os nveis das variveis regressoras, o vetor p x 1
com os coeficientes da regresso e o vetor n x 1 com os erros
aleatrios. (Sendo p = k + 1).

ESTIMATIVA DOS Pode ser demonstrado que a aplicao do mtodo dos mnimos
COEFICIENTES quadrados conduz a seguinte soluo:

Eq 201: b = ( X ' X )1 X ' Y

onde b o vetor p x 1 com as estimativas dos coeficientes . A


soluo da Eq 199 ir existir sempre que as variveis regressoras forem
linearmente independentes.

(Nota: as variveis regressoras no sero independentes quando uma


coluna da matriz X for uma combinao linear de outras colunas).

Exemplo 10.1 ver (Montgomery (1984)) Um distribuidor de cerveja est analisando


seu sistema de distribuio. Especificamente ele est interessado em
prever o tempo requerido para atender um ponto de venda. O
engenheiro industrial acredita que os dois fatores mais importantes so o
nmero de caixas de cerveja fornecidas e a distncia do depsito ao
posto de venda. Os dados coletados aparecem na Tabela 15.
10. Regresso linear mltipla
122 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

X1: No de caixas X2: Distncia Y: Tempo


10 30 24
15 25 27
10 40 29
20 18 31
25 22 25
18 31 33
12 26 26
14 34 28
16 29 31
22 37 39
24 20 33
17 25 30
13 27 25
30 23 42

Tabela 15 - Exemplo do distribuidor 24 33 40


de cervejas.

Soluo:

Escolhemos ajustar o seguinte modelo a esses dados:

Eq 202: ( ) (
Y = 0, + 1 X 1 x + 2 X 2 x + )
Desde que x1 = 18 e x 2 = 28 , esse modelo em notao matricial :
Estatstica Industrial
10. Regresso linear mltipla 123

24 1 - 8 2 1
27 1 - 3 - 3
2
29 1 - 8 12 3

31 1 2 - 10 4
25 1 7 - 6 5

33 1 0 3 6
,

26 1 - 6 - 2
0 7
28 = 1 - 4 6 1 + 8
31 1 - 2 1
2 9
39 1 4 9 10
33 1 6 - 8
11
30 1 - 1 - 3 12
25 1 - 5 - 1
13
42 1 12 - 5 14

40 1 6 5 15

E usando as regras para produto e inverso de matriz, obtemos:

15 0 0 463
X X = 0 504 - 213 ;
, X Y = 345
,

0 - 213 548 63

0,06667 0 0
(X ' X )1
= 0 0,002374 0,0009228

0 0,0009228 0,002183

De forma que o vetor das estimativas dos coeficientes resulta:

b, 30,87
0
b = b1 = ( X ' X ) X ' Y = 0,8772
1

b 0, 4559
2

E o modelo de regresso :

Y = 30,87 + 0,8772( X 1 18) + 0,4559( X 2 28)


ou
Y = 2,315 + 0,8772 X 1 + 0,4559 X 2

A tabela a seguir apresenta os valores observados, os valores previstos


pelo modelo e os respectivos resduos r j = Y j Y j .
10. Regresso linear mltipla
124 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Yj
Y$j rj = Yj Y$j
24 24,76 -0,76
27 26,87 0,13
29 29,32 -0,32
31 28,06 2,94
25 34,27 -9,27
33 32,23 0,77
26 24,69 1,31
28 30,09 -2,09
31 29,57 1,43
39 38,48 0,52
38 32,48 0,52
30 28,62 1,38
25 26,02 -1,02
Tabela 16 - Valores observados, 42 39,11 2,89
valores previstos e resduos.
40 38,41 1,59

Para testar se o ajuste adequado, os resduos poderiam ser plotados em


funo de Y$ , em funo de X1 ou em funo de X2 . Os resduos
tambm poderiam ser plotados em papel de probabilidade, para testar a
suposio de normalidade.

Resduos x X1 Resduos x X2

10 10
6 6
2 2
Re Re
-2 -2
-6 -6
<=

<=

( ) ( )
-10 -10
10 14 18 22 26 30 18 22 26 30 34 38 42
X1 X2

Papel de Probabilidade
Resduos x Y$
10 99.9
6 99
95
2 80
Re 50
-2 20
<=

-6 5 ( )
Figura 45 - Grficos do distribuidor
<=

( )
1
-10 0.1
de cervejas. 24 27 30 33 36 39 42 -10 -7 -4 -1 2 5
Valor predito de Y Resduos

Qualquer um desses grficos iria evidenciar que a observao da linha 5


, sem dvida, um dado atpico.
Estatstica Industrial
10. Regresso linear mltipla 125

Se houver registro de alguma causa especial que tenha afetado esta


entrega em particular, essa observao poderia ser eliminada do conjunto
e a anlise poderia ser refeita, possivelmente fornecendo um modelo
mais preciso.

Exemplo 10.2 (ver Montgomery (1984)) Esse exemplo ilustra o uso da Anlise de
Regresso em conjunto com Projeto de Experimentos.

O ganho em um processo qumico est sendo estudado. O engenheiro


escolheu 3 fatores (temperatura, presso e concentrao) e rodou um
experimento fixando cada um desses fatores a dois nveis.

Os dados aparecem a seguir. Vejam que os nveis dos fatores foram


codificados como -1 (nvel baixo) e +1 (nvel alto).

Ganho % X1 (Temp.) X2 Presso) X3 (Concent.)


32 -1 -1 -1
36 -1 -1 1
57 -1 1 -1
46 1 -1 -1
65 1 1 -1
57 -1 1 1
Tabela 17 - Valores observados em 48 1 -1 1
um processo qumico.
68 1 1 1

Soluo:

Escolhemos ajustar o seguinte modelo ( X i = 0 )

Y = 0 + 1X1 + 2X2 + 3X3 +

As matrizes XX e XY resultam:

8 0 0 0 409
0 8 0 0 45
'
X X = = 8 I4 ; X 'Y =
0 0 8 0 85

0 0 0 8 9

E como XX diagonal, a sua inversa (XX)-1=(1/8)I4 . Assim as


estimativas dos coeficientes resultam:

b0 51,125
b 5,625
b= 1=
b2 10,625

b3 1,125

E o modelo de regresso :
10. Regresso linear mltipla
126 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Y = 51,125 + 5,625 X 1 + 10,625 X 2 + 1,125 X 3

Nesse exemplo a matriz inversa fcil de obter porque XX diagonal.


H vrias vantagens quando XX diagonal. Os clculos so mais
fceis e a estimativa dos coeficientes est livre de qualquer correlao [
Cov (bi,bj) = 0 ].

Se ns podemos escolher os nveis de Xi vantajoso fazer essa escolha


de modo a obter XX diagonal. Projetos de Experimentos que
apresentam essa propriedade so chamados de projetos ortogonais. Um
exemplo de projetos desse tipo a classe dos projetos 2k. Esses projetos
tm sido usados com freqncia crescente no meio industrial.

MATRIZ DE VARINCIAS A matriz (XX)-1 chamada de matriz de varincias e covarincias.


E COVARINCIAS uma matriz simtrica de ordem p x p e seus elementos so usados na
determinao das varincias Sij2.

Usando a notao:

C 00 C 01 ... C 0k
C C11 ... C1k
10
-1 . . .
Eq 203: (X' X) =
. . .
. . .

C k0 C k1 ... C kk

possvel demonstrar que:

Eq 204: Var(bi) = Cii S2 i = 0,...,k

Eq 205: Covar(bi,bj) = Cij S2 i,j = 0,...,k

onde S2 a varincia residual, associada com os desvios em relao ao


hiperplano do modelo de regresso:

Eq 206: (
S 2 = Y j Y j
2
)
(n k 1) ;j = 1,n
A partir da matriz de varincias e covarincias tambm possvel
encontrar a matriz de correlao, uma vez que tm-se:

Eq 207: rij = Cij Cii C jj ;i,j = 0,...,k

onde, naturalmente, para i = j tem-se rii = 1 .

A matriz de correlaes tambm simtrica, de ordem p x p :


Estatstica Industrial
10. Regresso linear mltipla 127

1 r01 ... r0k


r 1 ... r1k
10
. . .
Eq 208: K =
. . .
. . .

rk 0 rk1 ... 1

A matriz de correlaes R til para detectar problemas de


multicolinearidade. Se um coeficiente rij qualquer fora da diagonal
tiver mdulo 1,0 teremos uma dependncia entre as variveis
independentes i e j.

Nesse caso, a estimativa dos coeficientes associados s variveis i e j


estar comprometida. (No possvel distinguir se o efeito sobre a
varivel de resposta se deve a varivel regressora i ou j, uma vez que
elas esto variando sempre no mesmo sentido).

O ideal que a matriz de correlaes seja diagonal, com zeros ou valores


prximos de zeros nas posies fora da diagonal. Isso assegura
estimativas no-confundidas dos diversos coeficientes i .

TESTES DE HIPTESE Para construir os testes de hiptese relativos a regresso mltipla, vamos
supor que os resduos j sigam o modelo normal com mdia 0 e
varincia S2 .

H dois tipos de teste que podem ser feitos: testes individuais sobre a
significncia de cada parmetro bj e um teste global para o modelo.

Significncia de cada Se os resduos seguem o modelo normal, os parmetros bj tambm iro


parmetro seguir esse modelo, ou seja:

Eq 209: ( 2
b j N j , bj )
De modo que para testar as hipteses

H0: j = 0

H1: j 0

Usamos a distribuio de Student, calculando

Eq 210: tj = bj / Sbj

Como sempre, a hiptese nula ser rejeitada se

Eq 211: t j > t / 2 , n k 1

Significncia do modelo Para testar a significncia do modelo de regresso mltipla, usaremos o


de regresso (
teste F. Os desvios Y j Y ) podem ser escritos na forma:
10. Regresso linear mltipla
128 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Eq 212: (Y j Y ) = (Y j Y j ) + (Y j Y )
elevando ao quadrado e somando, obtemos:

(Y j Y ) ( ) ( )
2 2 2
Eq 213: = Y j Y j + Y j Y

uma vez que pode ser demonstrado que o produto cruzado nulo. Dessa
forma temos:

Eq 214: SYY = SQR + SQReg

onde os correspondentes GDL valem:

Eq 215: (n-1) = (n-k-1) + (k)

de forma que as mdias quadradas resultam:

Eq 216: MQR = SQR / (n-k-1)

Eq 217: MQReg = SQReg / k

e usamos,

Eq 218: F = MQR / MQReg

para testar a significncia do modelo. A hiptese (inexistncia de


relao entre X e Y ) deve ser rejeitada se resultar,

F > F/2, k, n-k-1

para o clculo das somas quadradas as seguintes frmulas prticas


podem ser usadas:

2
n n
Eq 219: SYY = y 2j j
y n
j =1

j =1

k
Eq 220: SQR = SYY bi Siy
i =1

k
Eq 221: SQReg = bi Siy
i =1

Eq 222: onde os valores Siy aparecem no vetor XY , ou seja,


Estatstica Industrial
10. Regresso linear mltipla 129

Y j

S1 y
.
Eq 223: X ' Y =
.

.
S ky

COEFICIENTES DE A frmula para o clculo do coeficiente de determinao r2 a mesma


DETERMINAO PARA O apresentada ao final do captulo 9, ou seja:
MODELO DE
REGRESSO MLTIPLA

SQReg
Eq 224: r2 =
SYY

O coeficiente r2 indica a percentagem da variabilidade total que


explicada pelo modelo de regresso. Se r2 =1, todas as observaes
estaro sobre o hiperplano definido pelo modelo. Se r2 = 0 , no h
nenhuma relao entre a varivel de resposta e as variveis regressoras.

Exemplo 10.3 Para o problema da distribuio das caixas de cerveja, pede-se:

Apresente a matriz de varincias e covarincias e a matriz de correlao;

Calcule a varincia residual S2 e a varincia de b1, Sb12;

Teste de significncia de b1;

Teste a significncia do modelo;

Calcule o coeficiente de determinao;

Soluo:

A matriz de varincias e covarincias a matriz (XX)-1 , enquanto que a


matriz de correlaes obtida dividindo os termos da matriz XX pelos
correspondentes termos da diagonal. Assim,

0,06667 0 0
(X ' X )1
= 0 0,002374 0,0009228

0 0,0009228 0,002183

1 0 0

r= 0 1 0,405

0 0,405 1

Para calcular S2 e Sb12 , usamos:


10. Regresso linear mltipla
130 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

( 2
)
S 2 = Yi Y (n k 1) = 118,37 12 = 9,86
S b21 = S 2C11 = 9,86(0,002374 ) = 0,0234 ; S b1 = 0,153

o teste de significncia para b1 :

t1 = b1 / Sb1 = 0,8772 / 0,153 = 5,73

t1 = 5,73 > t0,025;12 = 2,179rejeita-se a hiptese nula

O teste de significncia para o modelo feito usando a tabela ANOVA.

SYY = yj2 - (yj)2 / n = 449,73

SQReg = b1S1y + b2S2y = 331,36

SQR = SYY - SQReg = 118,37

Fonte SQ GDL MQ F

Modelo 331,36 2 165,58 16,80

Residual 118,37 12 9,86

Tabela 18 - Tabela ANOVA Total 449,73 14

F = 16,80 > F0,05;2;12 = 3,89; rejeita-se a hiptese nula

E nesse exemplo o coeficiente de determinao vale SQReg/SYY = 0,737;


ou seja 73,7% da variabilidade total no tempo de entrega explicada
pela relao que essa varivel mantm com o nmero de caixas e a
distncia do posto de vendas.

PREVISO DE VALORES Assim como o caso da regresso simples, a relao encontrada pode ser
DE Y usada para a previso de um valor mdio ou individual de Y. Seja:

X 10
X
20
.
Eq 225: X 0 =
.
.

X k0

Eq 226: Y0 = b0 + b1 X10 + ... + bk X k 0

Pode ser demonstrado o intervalo de confiana de 100(1-)% para um


valor mdio e individual de Y so, respectivamente:

Valor mdio:
Estatstica Industrial
10. Regresso linear mltipla 131

Eq 227: ( )1
Y0 t / 2,n k 1 S 2 X 0, ( X ' X )1 2

Valor individual.:

Eq 228: ( )1
Y0 t / 2,n k 1 S 2 1 + X 0, ( X ' X ) 1 X 0 2

O fator que multiplica t/2 nas frmulas acima corresponde ao erro de


previso. A diviso desse fator por Y0 produz o coeficiente de
variao da previso.

ANLISE DAS Nas sees anteriores foi feita a suposio N(0,2) , ou seja, supe-
SUPOSIES DO se normalidade na distribuio dos resduos e homogeneidade da
MODELO DE varincia residual. A suposio de normalidade dos resduos pode ser
REGRESSO testada por testes grficos (papel de probabilidade) ou analticos (teste
do Chi-quadrado, Kolmogorov-Smirnov, etc.).

Para o teste de normalidade, usa-se os resduos padronizados:

Eq 229: [ ]
R j = Y j Y j S 2

onde:

Eq 230: j = b0 + b1 X 1 j + ... + bk X kj
Y

Para examinar se o erro padro da estimativa constante, analisa-se os


grficos R j Y j e R j X i .

Se a suposio de normalidade ou de homogeneidade no forem


satisfeitas, muitas vezes possvel contornar o problema aplicando
certas transformaes matemticas aos dados. Os resduos tambm
podem ser analisados para verificar a existncia de dados atpicos.

REGRESSO O modelo aditivo Y = X + um modelo geral e pode ser usado para


POLINOMIAL ajustar qualquer relao que seja linear com referncia aos parmetros
desconhecidos . Veja que a exigncia de linearidade refere-se a e
no a X. Assim, o modelo pode ser usado para ajustar um polinmio de
ordem k em uma varivel:

Eq 231: Y = 0 + 1x + 2x2 + ... + kxk +

ou ento para ajustar um polinmio de segundo grau em duas variveis:

Eq 232: Y = 0 + 1 x1 + 2 x2 + 3 x12 + 4 x22 + 5 x1 x2 +

O uso do modelo Y = X + para ajustar um polinmio ilustrado a


seguir.

Exemplo 10.4 (ver Montgomery (1984)) Pede-se para ajustar o modelo Y = 0 + 1 x


+ 2 x2 + aos dados que aparecem a seguir:
10. Regresso linear mltipla
132 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

x 1,0 1,2 1,4 1,6 1,8 2

Tabela 19 - Valores observados do y 6,15 7,90 9,40 10,50 11,00 14,00


exemplo

Em notao matricial, usando X X , tem-se:

6,15 1 - 0,5 0,25


7,90 1 - 0,3 0,09
0
9,40 1 - 0,1 0,01
Eq 233: Y = X= = 1
10,50 1 0,1 0,01
11,00 1 0,3 0,09 2

14,00 1 0,5 0,25

As matrizes XX e XY resultam:

6,0 0,0 0,7 58,95



Eq 234: X ' X = 0,0 0,7 0,0 ; X' Y = 4,965

0,7 0,0 0,1414 6,938

De modo que as estimativas de so:

0,3945 - 1,9527 58,95 9,70


Eq 235: b = (X ' X ) 1
X 'Y = 1,4286 4,965 = 7,08

1,9527 16,737 6,938 1,00

Assim o modelo de regresso:

Eq 236: ( )
Y = 9,70 + 7,08 X X + 1,00 X X (
2
)
ou

Eq 237: Y = 1,33 + 4,08 X + 1,00 X 2

Esse mtodo geral pode ser usado para ajustar dados que tenham um
formato qualquer. No entanto, se os nveis das variveis regressoras
forem eqidistantes, ento o uso de polinmios ortogonais simplifica
bastante o esforo de clculo. O uso de polinmios ortogonais aparece
descrito em Montgomery & PecK (1991) e Nanni & Ribeiro (1991).

Comentrios em relao (1) Os polinmios so muito teis para fornecer uma aproximao para
aos modelos polinomiais: relaes no lineares complexas e desconhecidas. Esse tipo de aplicao
aparece com freqncia na prtica.

(2) importante manter a ordem do polinmio to baixa quanto


possvel. Polinmios de ordem mais alta (k > 2) devem ser evitados, a
menos que hajam justificativas tcnicas para o seu uso.

(3) Um modelo de ordem mais baixa usando variveis transformadas


Estatstica Industrial
10. Regresso linear mltipla 133

sempre prefervel modelos de ordem mais alta na mtrica original.

(4) Vale lembrar que sempre pode ser obtido um polinmio de ordem n-
1 que ajusta-se perfeitamente aos dados. Tal modelo no ajudaria em
nada para a compreenso do fenmeno em estudo e nem tampouco seria
um bom estimador.

(5) Extrapolaes com polinmios devem ser feitas com muito cuidado.
Alm do intervalo investigado, os polinmios podem apresentar um
comportamento estranho, girando na direo oposta do esperado.

(6) Na medida que cresce a ordem do polinmio, a matriz XX torna-se


mal condicionada e a preciso das estimativas diminui. Esse problema
aliviado quando se centra as variveis regressoras, isto , quando se usa
(X ij X i ) .
(7) A matriz XX tambm tende a tornar-se mal condicionada quando os
valores de X esto limitados a um intervalo muito estreito. De forma
geral, ampliando o intervalo de investigao, melhoram as estimativas
dos coeficientes.

Exerccios

Exerccio 10.1 A resistncia de uma cera depende da quantidade de Etil-Vinil-Acetato


(EVA) e da quantidade de Parafina adicionados cera. Ajuste um
modelo do tipo Y = 0 + 1 X1 + 2 X2 aos dados que aparecem a
seguir

X1: EVA 4 4 6 6 8 8 4 4 6 6 8 8
X2: Paraf. 8 8 8 8 8 8 12 12 12 12 12 12
Y: Resist. 28,5 26,4 33,0 32,1 35,3 36,7 36,6 34,2 37,9 39,9 42,6 44,2

Exerccio 10.2 Calcule o valor dos resduos R j = Y j Y$j para os dados do exerccio
anterior e a seguir analise esses resduos plotando os grficos:

R j Y$j , R j X 1 , R j X 2 .

Exerccio 10.3 Ainda em relao aos dados do exerccio 10.1, pede-se:

Apresente a matriz de varincias e covarincias e a matriz de


correlaes. Analise a matriz de correlaes e indique se h indcios de
mal condicionamento;

Calcule a varincia residual S2 e a varincia de b1 e b2 ;

Teste de significncia de b1 e b2 ;

Teste de significncia do modelo;

Calcule o coeficiente de determinao e indique o seu significado


tcnico;

Exerccio 10.4 Considere os dados do exerccio 8.2 e use um modelo do tipo Y = 0 +


10. Regresso linear mltipla
134 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

1 X + 2 X2 para ajustar a resistncia compresso em funo da


adio de microsslica.

Adio Resistncia (MPa)


0% 28,1 26,5 24,3
5% 35,3 34,3 37,5
10% 39,8 44,1 42,3
15% 39,1 40,8 43,0

Exerccio 10.5 Considere os dados do exerccio 8.5 e use o modelo do tipo Y = 0 + 1X


+ 2X2 para ajustar a produtividade mensal em funo do intervalo entre
manutenes preventivas.

Intervalo Produtividade
4 136 137 135 140 136
6 145 146 147 147 148
8 146 144 148 145 145
10 134 131 136 134 133
12 117 119 117 115 116

Exerccio 10.6 Os dados a seguir mostram os valores da distribuio normal acumulada


para diferentes valores da varivel reduzida Z . Ajuste um modelo do
tipo Y = 0 + i Xi a esses dados. Aps, calcule o valor da varincia
residual (que no caso deve-se exclusivamente falta de ajuste) e indique
se o ajuste satisfatrio para a maioria das aplicaes prticas. Por fim,
use o modelo para extrapolaes, ou seja, calcule por exemplo F(-4) e
F(+4) e indique se o modelo pode ser usado para extrapolaes.

Z -3 -2,5 -2,0 -1,5 -1,0 -0,5 0 0,5 1,0


F(Z) ,0013 ,0062 ,0228 ,0668 ,1587 ,3085 ,5000 ,6915 ,8413

Z 1,5 2,0 2,5 3,0


F(Z) ,9332 ,9772 ,9938 ,9987

Exerccio 10.7 Repita o exerccio 10.1 acrescentando um termo 3 X1 X2 ao modelo.


Teste a significncia deste termo e conclua se h razes para mant-lo no
modelo.
Bibliografia

Bibliografia (as cinco bibliografias mais recomendadas esto em


negrito)

1. Bowker & Lieberman, (1959), Engineering Statistics. Prentice


Hall, Inc., Englewood Cliffs, New Jersey, USA.
2. Clarke, G.M. & Cook, D. (1983), A Basic Course in Statistics. 2nd
ed., Edward Arnold Ltda, London.
3. Costa Neto, P. L. O. (1977), Estatstica. Edgar Blcher, So Paulo.
4. Drumond, F., Werkema, M. C. C. e Aguiar, S. (1996) Anlise de
varincia: comparao de vrias situaes. Universidade Federal
de Minas Gerais. Escola de Engenharia, Fundao Cristiano
Ottoni.
5. Duncan, A.J. (1974), Quality Control and Industrial Statistics, 4th
ed., Irwin, Homewood, ILL.
6. Guttman, Wilks & Hunter (1971), Introductory Engineering
Statistics. 2nd ed., John Wiley and Sons, New York.
7. Kume, H. (1993), Mtodos Estatsticos para a melhoria da
Qualidade; traduo de Dario Miyake; reviso tcnica de Alberto
Ramos. So Paulo: Editora Gene.
8. Miller, I. & Freund, J.E. (1977), Probability and Statistics for
Engineers. 2nd ed., Prentice Hall, Inc., Englewood Cliffs, New
Jersey, USA.
9. Montgomery, D.C. (1984), Design and analysis of experiments.
John Wiley and Sons, New York, 2nd ed.
10. Montgomery, D.C. (1985), Introduction to Statistical Quality
Control. John Wiley and Sons, New York.
11. Montgomery, D. C. & Peck, E. A. (1991), Introduction to Linear
Regression Analysis. John Wiley and Sons, 2nd ed, New York.
12. Lopes, A. F. (1999) Probabilidades e Estatsticas. Reichmann &
Afonso Editores, Rio de Janeiro, RJ, Brasil.
13. Ott, E.R. (1975), Process Quality Control. McGraw Hill, New
York.
14. Spiegel, M. R. (1993) Estatstica. Makron Books Brasil Editora, So
Paulo, SP, Brasil.
15. Snedcor, G.W. & Cochran, W.G. (1980), Statistical Methods. 7th
ed., The Iowa State Univ. Press, Iowa, USA.
16. Stevenson, W. J. (1981), Estatstica Aplicada Administrao;
traduo Alfredo de Farias. Harper & Raw do Brasil, So
10. Regresso linear mltipla
136 Jos Luis Duarte Ribeiro & Carla ten Caten/PPGEP-UFRGS

Paulo, SP, Brasil.


17. Werkema, M. C. (1996) Como Estabelecer Concluses com
Confiana: Entendendo Inferncia Estatstica. Fundao
Cristiano Ottoni, Escola de Engenharia da UFMG, Belo
Horizonte, MG, Brasil.
18. Werkema, M. C. C. e Aguiar, S. (1996) Anlise de regresso:
como entender o relacionamento entre variveis de um processo.
Universidade Federal de Minas Gerais. Escola de Engenharia,
Fundao Cristiano Ottoni.
reas sob a curva normal
(Cauda da esquerda)
z 0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,02 0,01 0,00 z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
-3,6 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0002 0,0002 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
-3,4 0,0002 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
-3,3 0,0003 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0005 0,0005 0,0005 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
-3,2 0,0005 0,0005 0,0005 0,0006 0,0006 0,0006 0,0006 0,0006 0,0007 0,0007 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
-3,1 0,0007 0,0007 0,0008 0,0008 0,0008 0,0008 0,0009 0,0009 0,0009 0,0010 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
-3,0 0,0010 0,0010 0,0011 0,0011 0,0011 0,0012 0,0012 0,0013 0,0013 0,0013 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
-2,9 0,0014 0,0014 0,0015 0,0015 0,0016 0,0016 0,0017 0,0018 0,0018 0,0019 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
-2,8 0,0019 0,0020 0,0021 0,0021 0,0022 0,0023 0,0023 0,0024 0,0025 0,0026 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
-2,7 0,0026 0,0027 0,0028 0,0029 0,0030 0,0031 0,0032 0,0033 0,0034 0,0035 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
-2,6 0,0036 0,0037 0,0038 0,0039 0,0040 0,0041 0,0043 0,0044 0,0045 0,0047 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
-2,5 0,0048 0,0049 0,0051 0,0052 0,0054 0,0055 0,0057 0,0059 0,0060 0,0062 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
-2,4 0,0064 0,0066 0,0068 0,0069 0,0071 0,0073 0,0075 0,0078 0,0080 0,0082 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
-2,3 0,0084 0,0087 0,0089 0,0091 0,0094 0,0096 0,0099 0,0102 0,0104 0,0107 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
-2,2 0,0110 0,0113 0,0116 0,0119 0,0122 0,0125 0,0129 0,0132 0,0136 0,0139 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
-2,1 0,0143 0,0146 0,0150 0,0154 0,0158 0,0162 0,0166 0,0170 0,0174 0,0179 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
-2,0 0,0183 0,0188 0,0192 0,0197 0,0202 0,0207 0,0212 0,0217 0,0222 0,0228 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
-1,9 0,0233 0,0239 0,0244 0,0250 0,0256 0,0262 0,0268 0,0274 0,0281 0,0287 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
-1,8 0,0294 0,0301 0,0307 0,0314 0,0322 0,0329 0,0336 0,0344 0,0351 0,0359 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
-1,7 0,0367 0,0375 0,0384 0,0392 0,0401 0,0409 0,0418 0,0427 0,0436 0,0446 2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
-1,6 0,0455 0,0465 0,0475 0,0485 0,0495 0,0505 0,0516 0,0526 0,0537 0,0548 2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
-1,5 0,0559 0,0571 0,0582 0,0594 0,0606 0,0618 0,0630 0,0643 0,0655 0,0668 2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
-1,4 0,0681 0,0694 0,0708 0,0721 0,0735 0,0749 0,0764 0,0778 0,0793 0,0808 2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
-1,3 0,0823 0,0838 0,0853 0,0869 0,0885 0,0901 0,0918 0,0934 0,0951 0,0968 2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
-1,2 0,0985 0,1003 0,1020 0,1038 0,1056 0,1075 0,1093 0,1112 0,1131 0,1151 2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
-1,1 0,1170 0,1190 0,1210 0,1230 0,1251 0,1271 0,1292 0,1314 0,1335 0,1357 2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
-1,0 0,1379 0,1401 0,1423 0,1446 0,1469 0,1492 0,1515 0,1539 0,1562 0,1587 2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
-0,9 0,1611 0,1635 0,1660 0,1685 0,1711 0,1736 0,1762 0,1788 0,1814 0,1841 3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
-0,8 0,1867 0,1894 0,1922 0,1949 0,1977 0,2005 0,2033 0,2061 0,2090 0,2119 3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
-0,7 0,2148 0,2177 0,2206 0,2236 0,2266 0,2296 0,2327 0,2358 0,2389 0,2420 3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
-0,6 0,2451 0,2483 0,2514 0,2546 0,2578 0,2611 0,2643 0,2676 0,2709 0,2743 3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
-0,5 0,2776 0,2810 0,2843 0,2877 0,2912 0,2946 0,2981 0,3015 0,3050 0,3085 3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
-0,4 0,3121 0,3156 0,3192 0,3228 0,3264 0,3300 0,3336 0,3372 0,3409 0,3446 3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
-0,3 0,3483 0,3520 0,3557 0,3594 0,3632 0,3669 0,3707 0,3745 0,3783 0,3821 3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
-0,2 0,3859 0,3897 0,3936 0,3974 0,4013 0,4052 0,4090 0,4129 0,4168 0,4207 3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
-0,1 0,4247 0,4286 0,4325 0,4364 0,4404 0,4443 0,4483 0,4522 0,4562 0,4602 3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
0,0 0,4641 0,4681 0,4721 0,4761 0,4801 0,4840 0,4880 0,4920 0,4960 0,5000 3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
Distribuio de Student - cauda da direita
Pr (t > talfa) = alfa

Nvel de significncia
- alfa
GL 0,250 0,100 0,050 0,025 0,010 0,005
1 1,000 3,078 6,314 12,706 31,821 63,656
2 0,816 1,886 2,920 4,303 6,965 9,925
3 0,765 1,638 2,353 3,182 4,541 5,841
4 0,741 1,533 2,132 2,776 3,747 4,604
5 0,727 1,476 2,015 2,571 3,365 4,032
6 0,718 1,440 1,943 2,447 3,143 3,707
7 0,711 1,415 1,895 2,365 2,998 3,499
8 0,706 1,397 1,860 2,306 2,896 3,355
9 0,703 1,383 1,833 2,262 2,821 3,250
10 0,700 1,372 1,812 2,228 2,764 3,169
11 0,697 1,363 1,796 2,201 2,718 3,106
12 0,695 1,356 1,782 2,179 2,681 3,055
13 0,694 1,350 1,771 2,160 2,650 3,012
14 0,692 1,345 1,761 2,145 2,624 2,977
15 0,691 1,341 1,753 2,131 2,602 2,947
16 0,690 1,337 1,746 2,120 2,583 2,921
17 0,689 1,333 1,740 2,110 2,567 2,898
18 0,688 1,330 1,734 2,101 2,552 2,878
19 0,688 1,328 1,729 2,093 2,539 2,861
20 0,687 1,325 1,725 2,086 2,528 2,845
21 0,686 1,323 1,721 2,080 2,518 2,831
22 0,686 1,321 1,717 2,074 2,508 2,819
23 0,685 1,319 1,714 2,069 2,500 2,807
24 0,685 1,318 1,711 2,064 2,492 2,797
25 0,684 1,316 1,708 2,060 2,485 2,787
26 0,684 1,315 1,706 2,056 2,479 2,779
27 0,684 1,314 1,703 2,052 2,473 2,771
28 0,683 1,313 1,701 2,048 2,467 2,763
29 0,683 1,311 1,699 2,045 2,462 2,756
inf 0,674 1,282 1,645 1,960 2,326 2,576
Distribuio do Qui Quadrado - cauda da direita
Pr (QQ > QQalfa) = alfa

Nvel de
significncia - alfa
GL 0,995 0,990 0,975 0,950 0,900 0,010 0,050 0,025 0,010 0,005
1 0,0000 0,0002 0,0010 0,0039 0,016 6,635 3,841 5,024 6,635 7,879
2 0,010 0,020 0,051 0,103 0,211 9,210 5,991 7,378 9,210 10,597
3 0,072 0,115 0,216 0,352 0,584 11,345 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,064 13,277 9,488 11,143 13,277 14,860
5 0,412 0,554 0,831 1,145 1,610 15,086 11,070 12,832 15,086 16,750
6 0,676 0,872 1,237 1,635 2,204 16,812 12,592 14,449 16,812 18,548
7 0,989 1,239 1,690 2,167 2,833 18,475 14,067 16,013 18,475 20,278
8 1,344 1,647 2,180 2,733 3,490 20,090 15,507 17,535 20,090 21,955
9 1,735 2,088 2,700 3,325 4,168 21,666 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 4,865 23,209 18,307 20,483 23,209 25,188
11 2,603 3,053 3,816 4,575 5,578 24,725 19,675 21,920 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 26,217 21,026 23,337 26,217 28,300
13 3,565 4,107 5,009 5,892 7,041 27,688 22,362 24,736 27,688 29,819
14 4,075 4,660 5,629 6,571 7,790 29,141 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 30,578 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 32,000 26,296 28,845 32,000 34,267
17 5,697 6,408 7,564 8,672 10,085 33,409 27,587 30,191 33,409 35,718
18 6,265 7,015 8,231 9,390 10,865 34,805 28,869 31,526 34,805 37,156
19 6,844 7,633 8,907 10,117 11,651 36,191 30,144 32,852 36,191 38,582
20 7,434 8,260 9,591 10,851 12,443 37,566 31,410 34,170 37,566 39,997
21 8,034 8,897 10,283 11,591 13,240 38,932 32,671 35,479 38,932 41,401
22 8,643 9,542 10,982 12,338 14,041 40,289 33,924 36,781 40,289 42,796
23 9,260 10,196 11,689 13,091 14,848 41,638 35,172 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 15,659 42,980 36,415 39,364 42,980 45,558
25 10,520 11,524 13,120 14,611 16,473 44,314 37,652 40,646 44,314 46,928
26 11,160 12,198 13,844 15,379 17,292 45,642 38,885 41,923 45,642 48,290
27 11,808 12,878 14,573 16,151 18,114 46,963 40,113 43,195 46,963 49,645
28 12,461 13,565 15,308 16,928 18,939 48,278 41,337 44,461 48,278 50,994
29 13,121 14,256 16,047 17,708 19,768 49,588 42,557 45,722 49,588 52,335
30 13,787 14,953 16,791 18,493 20,599 50,892 43,773 46,979 50,892 53,672
Distribuio F - cauda da direita
Pr (F > Falfa(n1,n2)) = alfa

Nvel de significncia - alfa = 0,05 Nvel de significncia - alfa = 0,05


n2 \ 1 2 3 4 5 6 7 8 9 n2 \ 10 12 15 20 30 40 60 120 500
n1 n1
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 1 241,9 243,9 245,9 248,0 250,1 251,1 252,2 253,3 254,1
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 2 19,40 19,41 19,43 19,45 19,46 19,47 19,48 19,49 19,49
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 3 8,79 8,74 8,70 8,66 8,62 8,59 8,57 8,55 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 4 5,96 5,91 5,86 5,80 5,75 5,72 5,69 5,66 5,64
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 5 4,74 4,68 4,62 4,56 4,50 4,46 4,43 4,40 4,37
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 6 4,06 4,00 3,94 3,87 3,81 3,77 3,74 3,70 3,68
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 7 3,64 3,57 3,51 3,44 3,38 3,34 3,30 3,27 3,24
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 8 3,35 3,28 3,22 3,15 3,08 3,04 3,01 2,97 2,94
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 9 3,14 3,07 3,01 2,94 2,86 2,83 2,79 2,75 2,72
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 10 2,98 2,91 2,85 2,77 2,70 2,66 2,62 2,58 2,55
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 11 2,85 2,79 2,72 2,65 2,57 2,53 2,49 2,45 2,42
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 12 2,75 2,69 2,62 2,54 2,47 2,43 2,38 2,34 2,31
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 13 2,67 2,60 2,53 2,46 2,38 2,34 2,30 2,25 2,22
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 14 2,60 2,53 2,46 2,39 2,31 2,27 2,22 2,18 2,14
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 15 2,54 2,48 2,40 2,33 2,25 2,20 2,16 2,11 2,08
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 16 2,49 2,42 2,35 2,28 2,19 2,15 2,11 2,06 2,02
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 17 2,45 2,38 2,31 2,23 2,15 2,10 2,06 2,01 1,97
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 18 2,41 2,34 2,27 2,19 2,11 2,06 2,02 1,97 1,93
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 19 2,38 2,31 2,23 2,16 2,07 2,03 1,98 1,93 1,89
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 20 2,35 2,28 2,20 2,12 2,04 1,99 1,95 1,90 1,86
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 21 2,32 2,25 2,18 2,10 2,01 1,96 1,92 1,87 1,83
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 22 2,30 2,23 2,15 2,07 1,98 1,94 1,89 1,84 1,80
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 23 2,27 2,20 2,13 2,05 1,96 1,91 1,86 1,81 1,77
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 24 2,25 2,18 2,11 2,03 1,94 1,89 1,84 1,79 1,75
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 25 2,24 2,16 2,09 2,01 1,92 1,87 1,82 1,77 1,73
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 26 2,22 2,15 2,07 1,99 1,90 1,85 1,80 1,75 1,71
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 27 2,20 2,13 2,06 1,97 1,88 1,84 1,79 1,73 1,69
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 28 2,19 2,12 2,04 1,96 1,87 1,82 1,77 1,71 1,67
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 29 2,18 2,10 2,03 1,94 1,85 1,81 1,75 1,70 1,65
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 30 2,16 2,09 2,01 1,93 1,84 1,79 1,74 1,68 1,64
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 40 2,08 2,00 1,92 1,84 1,74 1,69 1,64 1,58 1,53
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 60 1,99 1,92 1,84 1,75 1,65 1,59 1,53 1,47 1,41
80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 2,00 80 1,95 1,88 1,79 1,70 1,60 1,54 1,48 1,41 1,35
100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 100 1,93 1,85 1,77 1,68 1,57 1,52 1,45 1,38 1,31
500 3,86 3,01 2,62 2,39 2,23 2,12 2,03 1,96 1,90 500 1,85 1,77 1,69 1,59 1,48 1,42 1,35 1,26 1,16
Distribuio F - cauda da direita
Pr (F > Falfa(n1,n2)) = alfa

Nvel de significncia - alfa = 0,025 Nvel de significncia - alfa = 0,025


n2 \ 1 2 3 4 5 6 7 8 9 n2 \ 10 12 15 20 30 40 60 120 500
n1 n1
1 647,8 799,5 864,2 899,6 921,8 937,1 948,2 956,6 963,3 1 968,6 976,7 984,9 993,1 1001,4 1005,6 1009,8 1014,0 1017,2
2 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 2 39,40 39,41 39,43 39,45 39,46 39,47 39,48 39,49 39,50
3 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 3 14,42 14,34 14,25 14,17 14,08 14,04 13,99 13,95 13,91
4 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 4 8,84 8,75 8,66 8,56 8,46 8,41 8,36 8,31 8,27
5 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 5 6,62 6,52 6,43 6,33 6,23 6,18 6,12 6,07 6,03
6 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 6 5,46 5,37 5,27 5,17 5,07 5,01 4,96 4,90 4,86
7 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 7 4,76 4,67 4,57 4,47 4,36 4,31 4,25 4,20 4,16
8 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 8 4,30 4,20 4,10 4,00 3,89 3,84 3,78 3,73 3,68
9 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 9 3,96 3,87 3,77 3,67 3,56 3,51 3,45 3,39 3,35
10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 10 3,72 3,62 3,52 3,42 3,31 3,26 3,20 3,14 3,09
11 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 11 3,53 3,43 3,33 3,23 3,12 3,06 3,00 2,94 2,90
12 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 12 3,37 3,28 3,18 3,07 2,96 2,91 2,85 2,79 2,74
13 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 13 3,25 3,15 3,05 2,95 2,84 2,78 2,72 2,66 2,61
14 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 14 3,15 3,05 2,95 2,84 2,73 2,67 2,61 2,55 2,50
15 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 15 3,06 2,96 2,86 2,76 2,64 2,59 2,52 2,46 2,41
16 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 16 2,99 2,89 2,79 2,68 2,57 2,51 2,45 2,38 2,33
17 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 17 2,92 2,82 2,72 2,62 2,50 2,44 2,38 2,32 2,26
18 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 18 2,87 2,77 2,67 2,56 2,44 2,38 2,32 2,26 2,20
19 5,92 4,51 3,90 3,56 3,33 3,17 3,05 2,96 2,88 19 2,82 2,72 2,62 2,51 2,39 2,33 2,27 2,20 2,15
20 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 20 2,77 2,68 2,57 2,46 2,35 2,29 2,22 2,16 2,10
21 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 21 2,73 2,64 2,53 2,42 2,31 2,25 2,18 2,11 2,06
22 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 22 2,70 2,60 2,50 2,39 2,27 2,21 2,14 2,08 2,02
23 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 23 2,67 2,57 2,47 2,36 2,24 2,18 2,11 2,04 1,99
24 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 24 2,64 2,54 2,44 2,33 2,21 2,15 2,08 2,01 1,95
25 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 25 2,61 2,51 2,41 2,30 2,18 2,12 2,05 1,98 1,92
26 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 26 2,59 2,49 2,39 2,28 2,16 2,09 2,03 1,95 1,90
27 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 27 2,57 2,47 2,36 2,25 2,13 2,07 2,00 1,93 1,87
28 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 28 2,55 2,45 2,34 2,23 2,11 2,05 1,98 1,91 1,85
29 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 29 2,53 2,43 2,32 2,21 2,09 2,03 1,96 1,89 1,83
30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 30 2,51 2,41 2,31 2,20 2,07 2,01 1,94 1,87 1,81
40 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 40 2,39 2,29 2,18 2,07 1,94 1,88 1,80 1,72 1,66
60 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 60 2,27 2,17 2,06 1,94 1,82 1,74 1,67 1,58 1,51
80 5,22 3,86 3,28 2,95 2,73 2,57 2,45 2,35 2,28 80 2,21 2,11 2,00 1,88 1,75 1,68 1,60 1,51 1,43
100 5,18 3,83 3,25 2,92 2,70 2,54 2,42 2,32 2,24 100 2,18 2,08 1,97 1,85 1,71 1,64 1,56 1,46 1,38
500 5,05 3,72 3,14 2,81 2,59 2,43 2,31 2,22 2,14 500 2,07 1,97 1,86 1,74 1,60 1,52 1,42 1,31 1,19
Distribuio F - cauda da direita
Pr (F > Falfa(n1,n2)) = alfa

Nvel de significncia 0,01 Nvel de significncia 0,01


- alfa = - alfa =
n2 \ 1 2 3 4 5 6 7 8 9 n2 \ 10 12 15 20 30 40 60 120 500
n1 n1
1 4052 4999 5404 5624 5764 5859 5928 5981 6022 1 6056 6107 6157 6209 6260 6286 6313 6340 6360
2 98,50 99,00 99,16 99,25 99,30 99,33 99,36 99,38 99,39 2 99,40 99,42 99,43 99,45 99,47 99,48 99,48 99,49 99,50
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,34 3 27,23 27,05 26,87 26,69 26,50 26,41 26,32 26,22 26,15
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 4 14,55 14,37 14,20 14,02 13,84 13,75 13,65 13,56 13,49
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 5 10,05 9,89 9,72 9,55 9,38 9,29 9,20 9,11 9,04
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 6 7,87 7,72 7,56 7,40 7,23 7,14 7,06 6,97 6,90
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 7 6,62 6,47 6,31 6,16 5,99 5,91 5,82 5,74 5,67
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 8 5,81 5,67 5,52 5,36 5,20 5,12 5,03 4,95 4,88
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 9 5,26 5,11 4,96 4,81 4,65 4,57 4,48 4,40 4,33
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 10 4,85 4,71 4,56 4,41 4,25 4,17 4,08 4,00 3,93
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 11 4,54 4,40 4,25 4,10 3,94 3,86 3,78 3,69 3,62
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 12 4,30 4,16 4,01 3,86 3,70 3,62 3,54 3,45 3,38
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 13 4,10 3,96 3,82 3,66 3,51 3,43 3,34 3,25 3,19
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 14 3,94 3,80 3,66 3,51 3,35 3,27 3,18 3,09 3,03
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 15 3,80 3,67 3,52 3,37 3,21 3,13 3,05 2,96 2,89
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 16 3,69 3,55 3,41 3,26 3,10 3,02 2,93 2,84 2,78
17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 17 3,59 3,46 3,31 3,16 3,00 2,92 2,83 2,75 2,68
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 18 3,51 3,37 3,23 3,08 2,92 2,84 2,75 2,66 2,59
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 19 3,43 3,30 3,15 3,00 2,84 2,76 2,67 2,58 2,51
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 20 3,37 3,23 3,09 2,94 2,78 2,69 2,61 2,52 2,44
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 21 3,31 3,17 3,03 2,88 2,72 2,64 2,55 2,46 2,38
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 22 3,26 3,12 2,98 2,83 2,67 2,58 2,50 2,40 2,33
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 23 3,21 3,07 2,93 2,78 2,62 2,54 2,45 2,35 2,28
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 24 3,17 3,03 2,89 2,74 2,58 2,49 2,40 2,31 2,24
25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 25 3,13 2,99 2,85 2,70 2,54 2,45 2,36 2,27 2,19
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 26 3,09 2,96 2,81 2,66 2,50 2,42 2,33 2,23 2,16
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 27 3,06 2,93 2,78 2,63 2,47 2,38 2,29 2,20 2,12
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 28 3,03 2,90 2,75 2,60 2,44 2,35 2,26 2,17 2,09
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 29 3,00 2,87 2,73 2,57 2,41 2,33 2,23 2,14 2,06
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 30 2,98 2,84 2,70 2,55 2,39 2,30 2,21 2,11 2,03
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 40 2,80 2,66 2,52 2,37 2,20 2,11 2,02 1,92 1,83
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 60 2,63 2,50 2,35 2,20 2,03 1,94 1,84 1,73 1,63
80 6,96 4,88 4,04 3,56 3,26 3,04 2,87 2,74 2,64 80 2,55 2,42 2,27 2,12 1,94 1,85 1,75 1,63 1,53
100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59 100 2,50 2,37 2,22 2,07 1,89 1,80 1,69 1,57 1,47
500 6,69 4,65 3,82 3,36 3,05 2,84 2,68 2,55 2,44 500 2,36 2,22 2,07 1,92 1,74 1,63 1,52 1,38 1,23
Estatstica Industrial
10. Regresso linear mltipla 143

Potrebbero piacerti anche