Sei sulla pagina 1di 42

Teste de Aderência

Normalização e Confiabilidade
Aula 1 - Outros Testes Estatı́sticos

CEFET-RJ
Prof. Allan Jonathan

12/02/2019

Métodos Estatı́sticos 1
Teste de Aderência

Teste de Aderência

Métodos Estatı́sticos 2
Teste de Aderência

Histograma

- Distribuição de frequências
A distribuição de frequências é um agrupamento de dados em clas-
ses, de tal forma que contabilizamos o número de ocorrências em
cada classe. O número de ocorrências de uma determinada classe
recebe o nome de frequência absoluta.
O objetivo é apresentar os dados de uma maneira mais concisa e
que nos permita extrair informação sobre seu comportamento. A
seguir, apresentamos algumas definições necessárias à construção
da distribuição de frequências.

Métodos Estatı́sticos 3
Teste de Aderência

Histograma

Frequência absoluta (fi ): É o número de observações


correspondente a cada classe. A frequência absoluta é,
geralmente, chamada apenas de frequência.
Frequência relativa (fri ): É o quociente entre a frequência
absoluta da classe correspondente e a soma das frequências
fi
(total observado), isto é, fri = P onde n representa o
j fj
número total de observações.
Frequência acumulada: É o total acumulado (soma) de todas
as classes anteriores até a classe atual. Pode ser: frequência
acumulada absoluta (Fi ) ou frequência acumulada relativa
(Fri ).

Métodos Estatı́sticos 4
Teste de Aderência

Histograma

- Distribuição de frequência pontual: dados quantitativos discretos


A construção de uma tabela de distribuição de frequência pontual
é equivalente à construção de uma tabela simples, onde se listam
os diferentes valores observados da variável com suas frequências
absolutas, denotadas por (fi ) (o ı́ndice i corresponde ao número de
linhas da Tabela) como é mostrado na Tabela a seguir. Utiliza-
mos a distribuição de frequência pontual quando se trabalha com
dados discretos. Um gráfico utilizado para representar este tipo de
distribuição de frequência é o Gráfico de Barras.

Métodos Estatı́sticos 5
Teste de Aderência

Histograma

Exemplo 1
Considere a distribuição de frequências para este conjunto de
dados:

N. de pessoas com diabetes fi fr Fi


7 1 0,05 5
8 2 0,1 15
9 5 0,25 40
10 8 0,4 80
11 3 0,15 95
12 1 0,05 100

Métodos Estatı́sticos 6
Teste de Aderência

Histograma

Exemplo 1

Métodos Estatı́sticos 7
Teste de Aderência

Histograma

- Distribuição de frequência em intervalos de classes para dados


quantitativos contı́nuos:
Para dados quantitativos contı́nuos, geralmente resultantes de medições
de caracterı́sticas da qualidade de peças ou produtos, dividimos a
faixa de variação dos dados em intervalos de classes. O menor valor
da classe é denominado limite inferior (li ) e o maior valor da classe
é denominado limite superior (Ls ).
O intervalo ou classe pode ser representado das seguintes maneiras:

(li ) ` (Ls ), onde o limite inferior da classe é incluı́do na


contagem da frequência absoluta, mas o superior não;
(li ) a (Ls ) , onde o limite superior da classe é incluı́do na
contagem, mas o inferior não.
Métodos Estatı́sticos 8
Teste de Aderência

Histograma

Na tabela de distribuição de frequência, acrescentamos uma coluna


com os pontos médios de cada intervalo de classe, denotada por xi .
li + Ls
Esta é definida como a média dos limites da classe xi = .
2
Estes valores são utilizados na construção de gráficos.

Métodos Estatı́sticos 9
Teste de Aderência

Histograma

Algumas indicações na construção de distribuição de frequências são:


Na medida do possı́vel, as classes deverão ter amplitudes
iguais.
Escolher os limites dos intervalos entre duas possı́veis
observações.
O número de intervalos não deve ultrapassar 20.
Escolher limites que facilitem o agrupamento.
Marcar os pontos médios dos intervalos.
Ao construir o histograma, cada retângulo deverá ter área
proporcional à frequência relativa (ou à frequência absoluta, o
que dá no mesmo) correspondente.

Métodos Estatı́sticos 10
Teste de Aderência

Histograma

Um ponto importante na construção da distribuição de


frequência é o numero de intervalos de classes.
Utilizaremos a regra de Sturges para obter o número de
intervalos de classes

k = 1 + 3.3 log10 (n),


no qual n é o tamanho do conjuntos de dados.

Métodos Estatı́sticos 11
Teste de Aderência

Histograma

Histograma é uma representação gráfica (um gráfico de barras ver-


ticais ou barras horizontais) da distribuição de frequências de um
conjunto de dados quantitativos contı́nuos. O histograma pode ser
um gráfico por valores absolutos ou frequência relativa ou densidade.
No caso de densidade, a frequência relativa do intervalo i, (fri ), é
representada pela área de um retângulo que é colocado acima do
ponto médio da classe i. Consequentemente, a área total do histo-
grama (igual a soma das áreas de todos os retângulos) será igual a
1. Assim, ao construir o histograma, cada retângulo deverá ter área
proporcional à frequência relativa (ou à frequência absoluta, o que
é indiferente) correspondente. No caso em que os intervalos são
de tamanhos (amplitudes) iguais, as alturas dos retângulos serão
iguais às frequências relativas (ou iguais às frequências absolutas)
dos intervalos correspondentes.
Métodos Estatı́sticos 12
Teste de Aderência

Histograma

Média e Variância para dados agrupados


Quando se tem dados agrupados em classes a média é dada por:
K
X fi mi
X̄ = µ = .
N
i=1

A variância populacional é:


" K #
( K 2
P
2 1 X 2 i=1 fi mi )
σ = fi mi −
N N
i=1

Métodos Estatı́sticos 13
Teste de Aderência

Histograma

Média e Variância para dados agrupados


A variância amostral é:
" K #
( K 2
P
1 i=1 fi mi )
X
2 2
σ = fi mi − ,
n−1 n
i=1

onde mi é o valor médio de cada classe, fi a frequência de cada


classe e K é o número de classes.

Métodos Estatı́sticos 14
Teste de Aderência

Inferência

Métodos Estatı́sticos 15
Teste de Aderência

Distribuição Qui-quadrado

Definição
Se X é uma variável aleatória com densidade
 k/2
1 1
fX (x) = x k/2−1 e −x/2 11(0,∞) (x)
Γ(k/2) 2
então X tem uma distribuição qui-quadrado com k graus de liber-
dade, onde o parâmetro k é um número inteiro.

Métodos Estatı́sticos 16
Teste de Aderência

Distribuição Qui-quadrado

Teorema
Se as variáveis aleatórias Xi , i = 1, 2, . . . , n são independentes e
normalmente distribuı́das com médias µi e variâncias σi2 , então
n 
Xi − µi 2
X 
U=
σi
i=1

tem uma distribuição qui-quadrado com n graus de liberdade.

Métodos Estatı́sticos 17
Teste de Aderência

Distribuição Qui-quadrado

Teorema
Se X1 , X2 , . . . , Xn é uma amostra aleatória de uma distribuição nor-
mal padrão,
P então, valem as seguintes propriedades:
(i) XPe ni=1 (Xi − X )2 são independentes.
(ii) ni=1 (Xi − X )2 tem uma distribuição qui-quadrado com n − 1
graus de liberdade.

Métodos Estatı́sticos 18
Teste de Aderência

Distribuição Qui-quadrado

Corolário
Se s 2 é a variância amostral de uma amostra aleatória X1 , . . . , Xn
de uma distribuição normal com média µ e variância σ 2 , então

(n − 1)s 2
U=
σ2
tem uma distribuição qui-quadrado com n-1 graus de liberdade.

Métodos Estatı́sticos 19
Teste de Aderência

Teste de Aderência

Corolário
Suponhamos uma amostra de tamanho n. Sejam E1 , E2 , ..., Ek um
conjunto de possı́veis eventos da amostra. Sejam FO1 , FO2 , ..., FOk
as frequências observadas na amostra dos respectivos eventos. As-
sim,
K
X (FOi − FEi )2
χ2 =
FEi
i=1

possui distribuição χ2ψ (qui-quadrado com ψ graus de liberdade).

Métodos Estatı́sticos 20
Teste de Aderência

Teste de Aderência

Podemos realizar testes de adequação de ajustamento (ou teste de


aderência) para verificarmos se os dados da amostra se ajustam com
uma hipótese sobre a frequência esperada.

Métodos Estatı́sticos 21
Teste de Aderência

Teste de Aderência

Assim, pode-se formular uma hipótese sobe as frequências espe-


radas (com base numa certa distribuição teórica), e verificar se as
frequências observadas diferem de modo significativo das frequências
esperadas, ou se as discrepâncias (FOi − FEi ) são significantes.
Para a realização destes testes, usaremos a seguinte estatı́stica χ2ψ .

Métodos Estatı́sticos 22
Teste de Aderência

Teste de Aderência

Exemplo 2
Um carro pode ser vendido em 5 cores diferentes. Pretende-se es-
tudar a popularidade das diferentes cores. Assim, de uma amostra
aleatória de 300 carros já vendidos, registrou-se o número de carros
vendidos, de cada uma das cores:

Cor Branco Preto Prata Azul Vermelho


Freq 88 65 52 40 55

Considere, para este caso, a hipótese nula de que todas as cores são
igualmente populares.

Métodos Estatı́sticos 23
Teste de Aderência

Teste de Aderência

Exemplo 3
Pretende-se estudar a distribuição da frequência dos pedidos feitos
às companhias de seguros, para o pagamento de tratamentos em
hospitais. O estudo foi baseado em famı́lias com dois filhos, cujos
pais não tenham mais do que 50 anos de idade. De uma amos-
tra aleatória de 200 dessas famı́lias, registrou-se o número desses
pedidos, num perı́odo de 4 anos.

n. pedidos 0 1 2 3 4 5 6 7
Freq 22 53 58 39 20 5 2 1

Face a estes valores, a distribuição de Poisson se ajusta à frequência


desses pedidos?

Métodos Estatı́sticos 24
Teste de Aderência

Teste de Aderência

Em ambos os exemplos, a análise consiste em verificar se o modelo


dado pela hipótese nula se ajusta aos valores observados.
Podem considerar-se dois casos: no primeiro as probabilidades vêm
completamente especificadas na H0 e no segundo a distribuição não
vem completamente caracterizada na H0 , e precisamos fazer esti-
mativas com base na amostra.

Métodos Estatı́sticos 25
Teste de Aderência

Teste de Aderência

Quanto ao número de graus de liberdade ψ, devemos observar o


seguinte:
ψ = K − 1, quando as frequências esperadas puderem ser
calculadas sem que se façam estimativas dos parâmetros
populacionais a partir das distribuições amostrais. (K é o
número de eventos ou categorias em que foi dividida a
amostra.)
tem ψ = K − 1 − r , quando para a determinação das
frequências esperadas, r parâmetros tiveram suas estimativas
calculadas a partir das distribuições amostrais.

Métodos Estatı́sticos 26
Teste de Aderência

Teste de Aderência

A seguir, os principais passos para a efetivação de um teste de


aderência:
Enunciar as hipóteses H0 e H1 , sendo que H0 afirmará não
haver discrepância entre as frequências esperadas e
observadas.
Fixar o nı́vel de significância α bem como a variável χ2ψ .
Determinar a região crı́tica e a região de aceitação.
Distribuir as frequências num quadro similar a este:

Eventos C1 ... CK
FO FO1 ... FOK
FE FE1 ... FEK

Métodos Estatı́sticos 27
Teste de Aderência

Teste de Aderência

Conhecidos tais valores, deve-se calcular


K
X (FOi − FEi )2
χ2cal =
FEi
i=1

Conclusão: Caso χ2cal ≥ χ2ψ , conclui-se que as frequências


observadas diferem das esperadas e rejeita-se H0 ao nı́vel de
significância α.

Métodos Estatı́sticos 28
Teste de Aderência

Teste de Aderência

O teste de χ2 pode ser usado se o número de observações em cada


casela da tabela for maior ou igual a 5 e a menor frequência esperada
for maior ou igual a 5.

Métodos Estatı́sticos 29
Teste de Aderência

Teste de Aderência

Exemplo 4
Em 100 lances de uma moeda, observaram-se 65 coroas e 35 caras.
Testar a hipótese de a moeda ser honesta, adotando-se α = 5%.

Métodos Estatı́sticos 30
Teste de Aderência

Teste de Aderência

Exemplo 4
H0 : a moeda é honesta; H1 : a moeda não é honesta;
α = 5%. Escolhe-se χ21 pois, K = 2 e ψ = 2 − 1.
Determinação da região crı́tica: Pela tabela, encontramos
χ21 = 3, 84.
Cálculo do valor da variável χ2cal :

Eventos Cara Coroa


FO 35 65
FE 50 50

Métodos Estatı́sticos 31
Teste de Aderência

Teste de Aderência

Exemplo 4
2
X (FOi − FEi )2 35 − 50 65 − 50
χ2cal = = + =9
FEi 50 50
i=1

Conclusão: como χ2cal = 9 ≥ 3, 84 = χ2ψ , rejeita-se H0 ,


concluindo-se com risco de 5%, que a moeda não é honesta.

Métodos Estatı́sticos 32
Teste de Aderência

Teste de Aderência

Exemplo 5
Realizar um teste de aderência para verificar se a distribuição dada a
seguir se aproxima de uma distribuição normal. São dadas as alturas
de 100 estudantes do sexo feminino. Adote α = 5%.

Altura N
150` 156 4
156` 162 12
162` 168 22
168` 174 40
174` 180 20
180` 186 2

Métodos Estatı́sticos 33
Teste de Aderência

Teste de Aderência

Exemplo 5
A partir desses valores, devemos calcular a média e o desvio-padrão.
Assim
X̄ = 168, 96
S = 6, 65
Lembrando que Z = X σ−µ é a transformação para a distribuição
normal padrão, deveremos neste caso (para calcular as frequências
esperadas) Zi = Xiσ−µ , em que Xi são os limites das classes.

Métodos Estatı́sticos 34
Teste de Aderência

Teste de Aderência

Exemplo 5
Assim, temos que na classe (150 ` 156),

150 − 168.96
Z1 = = −2.85
6.65
e
156 − 168.96
Z2 = = −1.94.
6.65
Utilizando a tabela Z da distribuição normal padrão:

P(150 ≤ X ≤ 156) = P(−2.85 ≤ X ≤ −1.94) = 0.024

Logo, a frequência esperada da primeira classe é 2.4.

Métodos Estatı́sticos 35
Teste de Aderência

Teste de Aderência

Exemplo 5
De maneira similar, preenche-se a seguinte tabela:

Altura Limite Zi P FE FO
150-156 150 -2.85 0.024004 2.40 4
156-162 156 -1.94 0.122980 12.30 12
162-168 162 -1.04 0.295160 29.52 22
168-174 168 -0.14 0.329043 32.90 40
174-180 174 0.75 0.178170 17.82 20
180-186 180 1.66 0.043224 4.32 2
186 2.56

Obs: como a primeira e a última classe possuem FE ≥ 5, é feita


uma fusão com a classe mais próxima.
Métodos Estatı́sticos 36
Teste de Aderência

Teste de Aderência

Exemplo 5
H0 : a distribuição é normal; H1 : a distribuição não é normal;
α = 5%. Escolhe-se χ21 pois, ψ = 4 − 2 − 1.
Determinação da região crı́tica: Pela tabela, encontramos
χ21 = 3, 84. Observe que 2 parâmetros tiveram suas
estimativas calculadas a partir da amostra.
Cálculo do valor da variável χ2cal :

χ2cal = 3.55

Conclusão: como χ2cal = 3.55 ≤ 3, 84 = χ2ψ , não rejeita-se H0 ,


concluindo-se com risco de 5%, que a distribuição obedece a
lei normal.

Métodos Estatı́sticos 37
Teste de Aderência

Teste de Aderência

Exercı́cio 1
Deseja-se modelar os acidentes ocorridos numa certa rodovia com
uma distribuição de Poisson. Faça o teste de aderência utilizando
α = 2, 5% para verificar se essa distribuição se ajusta aos dados
coletados na amostra abaixo.

No. acidentes 0 1 2 3 4 5
No. Dias 25 19 10 9 4 3

Lembrando: a distribuição de Poisson é dada por:

λx e −λ
P(X = x) = ∀ x = 0, 1, 2, ...
x!

Métodos Estatı́sticos 38
Teste de Aderência

Teste de Aderência

Exercı́cio 2
Cinco moedas foram lançadas 1000 vezes. As frequências dos
números de caras são dadas a seguir. Verificar se os dados se ajus-
tam a um modelo binomial. Adote α = 5%.

No. de caras 0 1 2 3 4 5
Frequências 38 144 342 287 164 25

Métodos Estatı́sticos 39
Teste de Aderência

Teste de Aderência

Lembrando: a distribuição Binomial é dada por:


 
n
P[X = x] = p x (1 − p)n−x , ∀ x = 0, 1, . . . , n
k

sendo que  
n n!
= .
x x!(n − x)!

Métodos Estatı́sticos 40
Teste de Aderência

Teste de Aderência

Exercı́cio 3
Os dados a seguir são o número de interrupções por algum tipo de
problema no funcionamento de um grupo de máquinas industriais
(torno automático, envasadora de lı́quidos, etc...) durante intervalos
de tempo de uma hora, por um perı́odo de 5 dias (5 × 24) = 120
intervalos de 1 hora.

No. de interrupções 0 1 2 3 4 5 6 7 ou mais


Frequências 6 20 25 24 20 10 5 10

Teste ao nı́vel de significância de 5%, se os dados são provenientes


de uma distribuição de Poisson.

Métodos Estatı́sticos 41
Teste de Aderência

Teste de Aderência
Exercı́cio 4
Foram coletados dados experimentais sobre a duração da vida de
um dispositivo eletrônico, que se sabe ter em média 1 falha a cada
10 anos. Os dados estão resumidos na tabela abaixo:
Intervalo de falha (anos) Frequência
5.475519 1
6.818024 3
8.160529 4
9.503034 10
10.84554 9
12.18804 9
Mais 4
Qual é a probabilidade de esses dados serem oriundos de uma dis-
tribuição exponencial?
Métodos Estatı́sticos 42

Potrebbero piacerti anche