Sei sulla pagina 1di 79

MINISTRIODAEDUCAO

UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

7 FUNDAMENTOS DE TESTE DE HIPTESES PARA UMA AMOSTRA


8 TESTES PARA DUAS AMOSTRAS COM DADOS NUMRICOS
9 ANALISE DA VARIANCIA
10 TESTES PARA DUAS AMOSTRAS COM DADOS CATEGORICOS
11 REGRESSO LINEAR SIMPLES

Prof jorge roberto grobe

AD34S

14:11:14

11/09/14

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

ii

Sumrio
8TESTESPARADUASAMOSTRASCOMDADOSNUMRICOS..1
CAPITULO7..............................................................................................................................4
7FUNDAMENTOSDETESTEDEHIPTESESPARAUMAAMOSTRA.......................4
7.1METODOLOGIASDOTESTEDEHIPTESES..........................................................4
7.2OTESTEZDEHIPTESESPARAAMDIAARITMTICA(DESVIO
PADROCONHECIDO)AMOSTRASGRANDES.........................................................7
7.3EXERCICIOS..................................................................................................................8
7.4TESTEUNICAUDAIS..................................................................................................11
7.5.1Exercicios........................................................................................................11
7.6TESTEtDEHIPOTESESPARAAMDIAARITMTICA(desviopadro
desconhecido).......................................................................................................................13
7.7EXERCICIOS................................................................................................................14
7.7TESTEZDEHIPOTESESPARAAPROPORO...................................................17
7.8EXERCICIOS................................................................................................................18
CAPITULO8.....................................................................................................................19
8TESTESPARADUASAMOSTRASCOMDADOSNUMRICOS............................19
8.1COMPARANDODUASAMOSTRASINDEPENDENTES:TESTANDOA
DIFERENAENTREASMDIAS(amostrasgrandeseindependentes)........................19
8.2EXERCICIOS................................................................................................................21
8.3TESTEtDEVARINCIAAGRUPADAPARAADIFERENAENTREDUAS
MDIASARITMTICASamostraspequenaseindependentes......................................22
8.4ESTIMATIVADOINTERVALODECONFIANAPARADIFERENAENTRE
DUASMDIASARITMTICASDEDOISGRUPOSINDEPENDENTES....................24
8.5TESTEtVARINCIASSEPARADASPARADIFERENASENTREDUAS
MDIASARITMTICASVARIANCIASNOSOIGUAIS......................................24
8.6EXERCICIOS................................................................................................................25
8.7TESTEFPARADIFERENASENTREDUASVARIANCIAS................................30
8.7.1Exercicios........................................................................................................34
8.8COMPARANDODUASAMOSTRASRELACIONADAS(EMPARELHADAS):
TESTEtPARAADIFERENAENTREMDIASARITMTICASamostras
dependentes..........................................................................................................................38
8.8.1Exercicios........................................................................................................40
8.9TESTEDASOMADECLASSIFICAESDEWILCOXONPARADIFERENAS
ENTREDUASMEDIANAS...............................................................................................42
8.9.1Exercicios...............................................................................................................43
CAPITULO9....................................................................................................................46
9ANLISEDAVARINCIA...............................................................................................46
9.1OMODELOCOMPLETAMENTEALEATORIO:ANALISEDAVARIANCIADE
FATORNICO.................................................................................................................46

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

iii

9.2EXERCICIOS................................................................................................................48
9.3COMPARAESMULTIPLAS:OPROCEDIMENTOTUKEYKRAMER............50
9.4EXERCICIOS................................................................................................................51
9.5OMODELOFATORIALDEFATORDUPLO:ANALISEDAVARIANCIADE
FATORDUPLO...................................................................................................................52
9.6EXERCICIOS................................................................................................................54
9.7OTESTEDECLASSIFICAESDEKRUSKALWALLISPARADIFERENAS
ENTREASMEDIANAS.....................................................................................................56
9.8EXERCICIOS................................................................................................................57
...........................................................................................................................................59
CAPITULO10..................................................................................................................59
10TESTESPARADUASAMOSTRASCOMDADOSCATEGORICOS...........................59
101:TesteZparadiferenaentreduaspropores..............................................................59
10.1.1Exercicios.....................................................................................................60
10.2testequiquadradoparaadiferenaentreduaspropores........................................62
10.3TESTEQUIQUADRADOPARADIFERENASENTREMAISDEDUAS
PROPORES....................................................................................................................65
10.4TESTEQUIQUADRADOPARAAINDEPENDNCIA.........................................66
CAPITULO11..........................................................................................................................69
11REGRESSOLINEAR.......................................................................................................69
11.1AEQUAODEUMAREGRESSO.....................................................................69
11.3CORRELAO(r)......................................................................................................71
11.4COEFICIENTEDEDETERMINAO....................................................................71
.....71
REFERENCIAS................................................................................................................74

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

CAPITULO 7
7 FUNDAMENTOS DE TESTE DE HIPTESES PARA UMA AMOSTRA
7.1 METODOLOGIAS DO TESTE DE HIPTESES

Para LEVINE (2005), o teste de hiptese baseia-se em uma teoria, declarao ou afirmativa.

E a hiptese nula, diz respeito ao status quo, no qual corresponde a nenhuma diferena.

A metodologia de teste de hipteses, baseia-se em evidencias a partir da amostra, tanto


para a rejeio da hiptese nula como a hiptese alternativa.

E que a hiptese alternativa tenha uma probabilidade bem mais alta para ser verdadeira.

A hiptese nula nem sempre esta correta por que a deciso baseada em informaes da
amostra.

Quando se aceita Ho (hiptese nula), conclui-se que no existe evidencias para garantir sua
rejeio.
as hipteses nula e alternativa

Ho= sempre testada

H1=se Ho for rejeitada

Ho sempre se refere o valor especificado do parmetro da populao e no a mdia da


amostra X .

Ho: = mdia da populao

H1: mdia da populao

Para calcular a estatstica do teste com base em uma amostra, ela segue uma distribuio de
estatstica como uma distribuio normal ou distribuio t.

FARBER (2009, p.298), quando a hipotese H1 contem simbolos menos que < um teste
unicaudal a esquerda ou > unicaudal a direita.

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

unilateral esquerda
ou cauda superior
Ho: <= k
H1:: > k
Unilateral direita
ou cauda inferior
Ho: : >= k
H1: : < k
Bilateral:
Ho: : = k
H1:: k

fonte: www.dimap.ufrn.br/~marcilio/AM/testehipotese.ppt

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

FARBER (2009, p.294) A tabela seguir mostra a relao entre as possveis afirmaes
verbais sobre o parametro e as hipoteses nulas ou alternativa.

Formulao verbal
Ho: hipotese nula

Formulao matematica

Formulao verbal
H1: hipotese alternativa

a mdia Maior ou
igual a k
a mdia pelo menos k
a mdia no menos
que k

Ho: k
H1: <k
teste da cauda inferior

a mdia Menor que k


a mdia abaixo de k
a mdia menos que k

a mdia Menos ou
igual a k
a mdia no maximo k
a mdia no mais do
que k

Ho: k
H1: >k
teste da cauda superior

a mdia Maior que k


a mdia acima de k
a mdia mais do que k

a mdia no igual a k
a mdia diferente de k
a mdia no k

a mdia igual a k
Ho: =k
a mdia k
H1: k
a mdia exatamente k
teste bicaudal
* comparar a primeira coluna e a terceira coluna.

Riscos na tomada de deciso utilizando a metodologia do teste de hipteses

Pode correr o risco de uma concluso incorreta

Erro do tipo I:
rejeita-se Ho quando ela verdadeira, representado por .
Erro do tipo II:
aceita-se Ho, quando ela falsa, representado por .
O nivel de significncia

O nvel de significncia conhecido antes do teste.

Niveis so selecionados =0,01; 0,05;0,10

Toda escolha do nvel de significncia tem-se um risco.

Pode-se ocorrer erro do tipo I representado por .

Quando conhecido , conhecido a regio de aceitao e no aceitao em relao a


hiptese nula.

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

O coeficiente de confiana

representado por (1- ), corresponde a probabilidade de que Ho no seja rejeitada quando


que de fato ela verdadeira e no seja rejeitada.
Eficacia de um teste

A eficacia de um teste 1-, a probabilidade de que seja rejeitada a hipotese nula quando
que de fato ela for falsa e deva ser rejeitada.

Exemplo : 1) FARBER (2009, p.294-295) Afirme as hipoteses nula e alternativa e identifique qual
representa a afirmao.
a) uma universidade publica que a proporo de seus estudantes que se graduaram em 4 anos de
82%.

soluo : Ho: p=0,82 afirmao


H1:p 0,82

b) Um fabricante de torneiras anuncia que o indice mdio de fluxo de agua de certo tipo de torneira
menor que 2,5 galoes por minuto.

Ho: 2,5

H1: < 2,5 afirmao

Exemplo: 2) FARBER (2009, p.296-297) o limite USDA para contaminao por salmonela por
frango de 20%. Um inspetor de carnes reporta que o frango produzido por uma empresa excede o
limite USDA. Realizando o teste de hipoteses para determinar se afirmao do inspetor de carne
verdadeira. Quando ira ocorrer um erro do tipo I ou tipo II? Qual mais srio?

Soluo

Ho: p 0,20

H1: p> 0,20 ( afirmao )

erro do tipo I: se a proporo real de frango contaminado for menor ou igual a 0,20, decisao
de rejeitar Ho.

Erro do tipo II: ocorrer se a real proporo de frango contaminado for maior que 0,20 mas
voc no rejeita Ho.

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

7.2 O TESTE Z DE HIPTESES PARA A MDIA ARITMTICA ( DESVIO PADRO


CONHECIDO )- AMOSTRAS GRANDES

Caso o desvio padro () conhecido a distribuio de amostragem segue uma distribuio


normal, resultando na estatstica Z:
Z=

Na equao em Z o numerador mede a distancia ( absoluto) a mdia aritmtica da amostra


observada em relao a mdia aritmtica da hiptese e o denominador representa o erropadro.

FARBER (2009, p.307), quando n 30 podera ser usado o desvio padro da amostra no
lugar de sigma.

O mtodo do valor- p para testes de hipteses

p (nivel de significncia) = aceita-se Ho (mdias so iguais)


p<= aceita-se H1(mdias so diferentes)

7.3 EXERCICIOS
3) O diretor de produo de uma fabrica precisa determinar se uma nova maquina est produzindo
de acordo com as especificaes do fabricante, que indicam que o tecido deveria ter uma mdia
aritmtica de resistncia ao rompimento equivalente a 70 libras e um desvio padro de 3,5 libras.
Uma amostra de 49 peas de tecidos revela uma mdia aritmtica de resistncia ao rompimento da
amostra igual a 69,1 libras.
a) especifique a hiptese nula e alternativa.
Hiptese nula : Ho = 70 libras ( afirmao)
Hiptese alternativa : H1 70 libras
b)existem evidencia de que a mquina no esteja atendendo s especificaes do fabricante, com
relao a mdia da resistncia ao rompimento? ( =0,05). R: aceitar Ho
Dados:
Hiptese nula : Ho = 70 libras

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

Hiptese alternativa : H1 70 libras


desvio padro conhecido: 3,5 libras
n=49 peas
mdia aritmtica da amostra : 69,1 libras

Z Test of Hypothesis for the Mean


Data
=

Null Hypothesis
Level of Significance
Population Standard Deviation
Sample Size
Sample Mean

70
0,05
3,5
49
69,1

Intermediate Calculations
Standard Error of the Mean
Z Test Statistic
Two-Tailed Test
Lower Critical Value
Upper Critical Value
p-Value
Do not reject the null hypothesis

0,5
-1,800

-1,959962787
1,959962787
0,071860531

O valor de Z foi calculado pela seguinte formula :

Z=

c)calcule o valor p e interprete seu significado.


O valor de p equivale a 1- .
d)qual seria a sua resposta em (b) caso o desvio padro especificado fosse igual a 1,75 libras?
R: aceitar H1
Z Test of Hypothesis for the Mean
Data
Null Hypothesis
=
Level of Significance
Population Standard Deviation
Sample Size
Sample Mean

70
0,05
1,75
49
69,1

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

Intermediate Calculations
Standard Error of the Mean
Z Test Statistic
Two-Tailed Test
Lower Critical Value
Upper Critical Value
p-Value
Reject the null hypothesis

10

0,25
-3,600

-1,959962787
1,959962787
0,000318291

e) qual seria sua resposta em (b) caso a mdia aritmtica da amostra fosse igual a 69 libras e o
desvio padro fosse de 3,5 libras?
R:aceitar H1
Z Test of Hypothesis for the Mean
Data
Null Hypothesis
=
Level of Significance
Population Standard Deviation
Sample Size
Sample Mean
Intermediate Calculations
Standard Error of the Mean
Z Test Statistic
Two-Tailed Test
Lower Critical Value
Upper Critical Value
p-Value
Reject the null hypothesis

70
0,05
3,5
49
69

0,5
-2,000

-1,959962787
1,959962787
0,045500124

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

11

7.4 TESTE UNICAUDAIS

Em LEVINE (2005), o teste unicaudal ou teste direcional esta contida em uma cauda da
distribuio de amostragem da estatistica do teste.

A metodologia do teste de hipteses utilizada para examinar a questo relativa a mdia


aritmtica da populao correspondente a ser ou no ser igual a .

Ho: mdia da amostra


H1 : < media da amostra

Para calcular o valor de Z com rea de 5%, chamado zona de rejeio: invnormp(0,05)=
-1,645 abaixo e acima 1,645

unilateral esquerda
ou cauda superior
Ho: k
H1:: > k
Unilateral direita
ou cauda inferior
Ho: : k
H1: : < k
Bilateral:
Ho: : = k
H1:: k

fonte: www.dimap.ufrn.br/~marcilio/AM/testehipotese.ppt

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

12

7.5.1 Exercicios
4) FARBER (2009, p.308) Em um anuncio, uma pizzaria afirma que a mdia de seu tempo de
entrega menor que 30 minutos. Uma seleo aleatria de 36 tempos de entrega tem mdia
amostral de 28,5 minutos e desvio padro de 3,5 minutos. H evidencia suficiente para apoiar a
afirmao em =0,01 ? Use o valor de P.
Soluo:

afirmao : a media de entrega menor que 30 minutos.

Ho: 30 minutos

H1: u< 30 minutos ( afirmao )

cauda inferior o valor de z negativo.

5) FARBER (2009, p.309) proprietrios de casas afirmam que a velocidade mdia de veculos que
passam por sua rua maior que o limite de velocidade de 35 milhas por hora. Uma amostra
aleatria de 100 automveis tem mdia de velocidade de 36 milhas por hora e desvio padro de 4
milhas por hora. H evidencia suficiente para apoiar a afirmao em =0,05. Use o valor de P.
Soluo:

Ho: 35 milhas por hora

H1: u > 35 milhas por hora ( afirmao)

cauda superior o valor de z positivo

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

6) A Glen

13

Valley Steel Company produz barras de ao. Se o processo estiver operando

adequadamente so produzidas barras de ao com uma mdia aritmtica de comprimento


equivalente pelo menos 2,8 ps, com um desvio padro de 0,2 ps. Barras de ao mais longas
podem ser utilizadas ou alteradas, porem barras mais curtas devem ser descartadas. Uma amostra
de 25 barras selecionada da linha de produo. A amostra indica que o comprimento mdio de
2,73 ps. A empresa deseja determinar se o equipamento de produo necessita de algum ajuste.
a)especifique a hiptese nula e alternativa.
Resultado1:

Ho: 2,8 ps ( afirmao)

H1: < 2,8 ps

b)caso a empresa desejasse testar a hiptese no nvel de significncia de 0,05, que decises ela iria
tomar utilizando o modelo do valor critico para testes de hipteses?
Z=

Resultado 2:Z=-1,75 ( zona de rejeio) < Z=-1,645 ( zona de aceitao)


portanto :rejeitar Ho
comando: inv.normp(z)

c)caso a empresa desejasse testar a hiptese no nvel de significncia de 0,05, que decises ela iria
tomar utilizando o modelo do valor-p para testes de hipteses?
Resultado3:p=0,0401< =0,05 rejeitar Ho

d) interprete o significado do valor-p neste problema.


e)compare suas concluses em (b) e (c).

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

7.6 TESTE t DE HIPOTESES PARA A MDIA ARITMTICA

14

((sigma) desvio padro

desconhecido)
Em diversas situaes teste de hipoteses utilizam dados numericos, onde o desvio padro da
populao desconhecido.

t=

=media da

Xu
S
n

populao onde a estatistica do teste t segue uma distribuio t, tendo n-1 graus

de liberdade.
S= desvio padro da amostra
Premissas do teste t de uma amostra

Para utilizar o teste t de uma amostra , os dados numricos obtidos so vistos como se
representassem uma amostra aleatria, a partir de uma populao que seja normalmente
distribuda.

Na pratica, enquanto tamanho da amostra no for demasiadamente pequeno e a populao


no for muito assimtrica, a distribuio t fornece uma boa aproximao da distribuio de
amostragem da mdia aritmtica quando for desconhecido.

7.7 EXERCICIOS
7) Se, em uma amostra de tamanho n=16 selecionada a partir de uma populao normal subjacente,
=56, e o desvio padro da amostra S=12, qual sera o valor da
a mdia aritmtica da amostra X
estatstica do teste t, se voc estiver testando a hiptese nula, de que =50?
Soluo:
n=16
=56
X
S=12 ( desvio padro da amostra)
=50

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

o calculo realizado pela seguinte formula :

t=

15

Xu 5650 6
= =2
3
S = 12
n
16

o valor de t igual a 2.
8) O diretor de uma grande universidade informa aos pais de alunos recm-chegados sobre os
custos dos livros durante um semestre. Uma amostra de 100 alunos matriculados na universidade
indica uma mdia aritmtica da amostra de custos correspondentes a $315,4, com um desvio padro
da amostra igual a $43,20 e a mdia da populao de $300?
a) construa uma estimativa de intervalo de confiana de 90%.
Resposta:[308,23;322,57]

Dados : n=100 media da amostra=315,4 desvio padro da amostra =43,20 media da populao
:=300
Confidence Interval Estimate for the Mean
Data
Sample Standard Deviation
Sample Mean
Sample Size
Confidence Level

43,2
315,4
100
90%

Intermediate Calculations
Standard Error of the Mean
4,32
Degrees of Freedom
99
t Value
1,660391717
Interval Half Width
7,172892219
Confidence Interval
Interval Lower Limit
Interval Upper Limit

308,23
322,57

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

b) qual seria sua deciso estatistica caso voce testasse Ho e H1, ao nvel de significncia de 0,05 e
0,1?
Resposta:
a nvel de 0,05 e 0,1 rejeita-se Ho, existem diferenas entre as medias da populao e da
amostra.

t Test for Hypothesis of the Mean


Data
Null Hypothesis
=
Level of Significance
Sample Size
Sample Mean
Sample Standard Deviation

300
0,05
100
315,4
43,2

Intermediate Calculations
Standard Error of the Mean
4,32
Degrees of Freedom
99
t Test Statistic
3,564814815
Two-Tailed Test
Lower Critical Value
Upper Critical Value
p-Value
Reject the null hypothesis

-1,984217306
1,984217306
0,000562434

t Test for Hypothesis of the Mean


Data
Null Hypothesis
=
Level of Significance
Sample Size
Sample Mean
Sample Standard Deviation
Intermediate Calculations
Standard Error of the Mean
Degrees of Freedom
t Test Statistic
Two-Tailed Test
Lower Critical Value
Upper Critical Value
p-Value
Reject the null hypothesis

300
0,1
100
315,4
43,2

4,32
99
3,564814815

-1,660391717
1,660391717
0,000562434

16

17

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

c)utilizando o nvel de significncia de 0,1, existem evidencias de que a mdia da populao seja
superior a $300?
cauda superior
Teste t de Hipteses para a Mdia Aritmtica
Dados
Hiptese Nula
Nvel de Significncia
Tamanho da Amostra
Mdia da Amostra
Desvio Padro da Amostra

300,0000
0,1000
100,0000
315,4000
43,2000

Clculos Intermedirios
Erro Padro da Mdia
Graus de Liberdade
Estatstica do Teste t
TESTE CAUDA SUPERIOR
Valor Crtico Inferior
Valor-p

4,3200
99,0000
3,5648

1,2902

Area da cauda
superior
0,10000

0,000281
Rejeitar a hiptese nula

9)FARBER (2009, p.326-327) Para o seu estudo sobre hbitos alimentares entre adolescentes
homens, voc seleciona aleatoriamente 20 adolescentes e pergunta a cada um deles quantas pores
de 12 onas de refrigerante ele bebe todos os dias. Os resultados so listados a seguir. Com o nivel
de significancia igual a 0,05 , h evidencia suficiente para dar suporte a afirmao de que
adolescentes homens bebem menos que tres pores de 12 onas de refrigerantes todos os dias?
2,1

2,3

1,6
2,1
* 1 ona = 28 ml

2,4

1,2

0,8

2,1

2,2

2,5

2,1

1,8

2,2

2,8

3,2

0,5

1,4

1,2

a) escreva a afirmao matematicamente e identifique Ho e H1.


Resposta:
H1: < 3,0 afirmao
Ho: 3,0

b) calcule o valor P.

18

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

Resposta:
c) decida se rejeita ou aceita Ho.
d) interprete a deciso no contexto da afirmao original.

10) Uma empresa que produz materiais escolares diz que os professores gastam uma mdia de mais
do que $550 de seu dinheiro em materiais escolares em um ano. Uma amostra aleatoria da
quantidade ( em dolares) que 24 professores gastaram em materiais escolares em um ano recente
listada a seguir. Com =0,05, h evidencia suficiente para dar suporte a afirmao da empresa?
715

623

582

721

602

621

462

320

532

566

686

532

603

420

684

713

531

888

482

361

560

910

546

860

a) escreva a afirmao matematicamente e identifique Ho e H1.

Ho: 550

H1: 550 afirmativa

b) calcule o valor P.
c) decida se rejeita ou aceita Ho.
d) interprete a deciso no contexto da afirmao original.

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

19

7.7 TESTE Z DE HIPOTESES PARA A PROPORO

FARBER (2009, p.327), ocorrem quando um politico quer saber a proporo de seus
constituintes que esto a favor de certo projeto de lei ou quando um engenheiro de qualidade
testa a proporo de peas com problemas.

LEVINE (2005, p.246) Uma distribuio normal pode ser utilizada para aproximar a
distribuio binomial quando np5 e nq 5.

Para uma distribuio binomial , ento uma distribuio amostral para

p normal com:

p= p e p= pq
n
Testar a hipotese pertinente a proporo, p, de valores que se encontram em uma
determinada categoria em vez de testar a media aritmtica da populao.
Teste Z para a proporo
Z

pa=X/n

pa p
p (1 p)
n

X= numero de sucessos na amostra

n=tamanho da amostra
p=proporo da hipotese de sucessos na populao
7.8 EXERCICIOS
11)Caso, em uma amostra aleatria de 400 itens, sejam encontrados 88 itens com defeito, qual a
proporo da amostra dos itens defeituosos?
R:pa =88/400=0,22=22%

12)No problema anterior,se a hiptese nula, determinar que 20% dos itens na populao so
defeituosos, qual o valor da estatstica do teste Z?
Dados: p=0,20 pa=88/400=0,22

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

pa p
p (1 p)
n

Z=

20

[0,220,2]
0,210,2
400

Z=1
13) Suponha que voc esteja testando a hiptese nula. Ho: p =0,2, contra a hiptese alternativa
bicaudal , H1: p0,2, e que voce escolheu o nvel de significncia correspondente a =0,05. Qual
seria a sua deciso estatistica?
Resultado1: aceita-se Ho em que a proporo igual a 20%.
Resultado 2: para rejeitar Ho, pode-se mudar aleatriamente o numero de sucessos maior ou menor que 80.

14) FARBER (2009, p.328) Um centro de pesquisas declara que menos que 20% dos usuarios de
internet nos EUA tem rede sem fio em suas casas. Em uma amostra aleatoria de 100 adultos, 15%
dizem que tem rede sem fio em casa. Com =0,01 h evidencias suficientes para apoiar a
declarao do pesquisador?
15) FABER (2009, p.329) A Zogby Internacional declara que 45% das pessoas nos EUA so a favor
de tornar a venda do cigarro ilegal dentro dos prximos 10 anos. Voc decide testar essa afirmao e
entrevista uma amostra de 200 pessoas, dentre as quais, 49% so a favor da lei. Com =0,05, h
evidencia o bastante para apoiar a afirmao?R : no rejeitar Ho.
16) FARBER (2009,p.331) O centro de pesquisas de Pew afirma que mais de 55% dos adultos
norte-americanos assistem seus noticirios locais regularmente. Voc decide testar essa afirmao e
entrevista uma amostra de 425 adultos nos EUA sobre esse assunto. Dos 425 entrevistados, 255
responderam que assistem seus noticirios locais regularmente. Com =0,05,ha evidencia o
suficiente para apoiar essa afirmao do centro de pesquisas Pew? R:rejeitar Ho.

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

21

CAPITULO 8
8 TESTES PARA DUAS AMOSTRAS COM DADOS NUMRICOS
8.1 COMPARANDO DUAS AMOSTRAS INDEPENDENTES: TESTANDO A DIFERENA
ENTRE AS MDIAS ( amostras grandes e independentes)

FARBER (2009, p.352) duas amostras so independentes se a amostra selecionada de uma


das populaes no relacionada a amostra selecionada da segunda populao.

Duas amostras so dependentes se cada membro de uma amostra corresponde a um


membro da outra amostra .

As

amostras tambem so chamadas de amostras emparelhadas ou amostras

relacionadas.

Exemplo 1: dependentes

amostra 1- ritmo cardiaco em descanso de 35 indivduos antes de tomar caf.

Amostra 2: ritmo cardiaco em descanso de 35 indivduos depois de tomar caf.

Exemplo2:independentes

amostra 1:nota de teste de 35 estudantes de estatistica,

amostra 2: nota de teste de 42 estudantes de biologia que no estudam estatistica.

Teste z de duas amostras para a diferenas entre medias


FARBER (2009, p.354)
1) as amostras devem ser selecionadas aleatoriamente.
2) As amostras devem ser independentes.
3) Cada tamanho da amostra deve ser pelo menos 30 ou, se no , cada populao deve ter
uma distribuio normal com um desvio padro conhecido.

LEVINE(2005, p.346), suponha que uma amostra n1 foi extraida da primeira populao e
n2 da segunda populao, existem uma varivel numrica correspondente.

Nas duas populaes existem suas respectivas mdias e seus respectivos desvio padro.

A estatstica do teste, utilizada para determinar a diferena entre as mdias das populaes,
baseado na diferena entre as medias das amostras X1 e X2 .

Esta estatstica de teste segue uma distribuio normal padronizada, para tamanhos de
amostras suficientemente grandes.

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

22

O teste Z para diferena entre duas mdias aritmticas:


Z=

( X 1 X 2 )( 1 2)

21 22
+
n1 n 2

FARBER (2009, p.355) quando as amostras so grandes( ao menos 30), pode usar s1 e
s2 no lugar de 1 e 2 .

Se as amostras no so grandes pode-se usar o teste z de duas amostras, contanto que


as populaes sejam distribuidas normalmente e os desvios padroes populacionais seja
conhecidos.

Para LEVINE (2005, 346),na maioria dos casos as varincias e os desvios padres no so
conhecidos, a nica informao disponveis so as mdias aritmticas , varincias e desvios
-padro das amostras.

Podem ser estabelecidas premissas de que as amostras tm que ser extradas de uma de
forma aleatria e independente, a partir de uma populao normalmente distribudas e que as
2
2
varincias das populaes sejam iguais 1 = 2 .

Um teste t de variancia agrupada pode ser utilizado para determinar se existe um diferena
significativa entre as mdias aritmticas das duas populaes.

Onde:
n1 = tamanho da populao 1
n2 = tamanho da populao 2
1 = mdia aritmtica da populao 1
2 = mdia aritmtica da populao 2
1 = desvio padro da populao 1
2 = desvio padro da populao 2
S2p =varincia agrupada
X1 e X2= mdias aritmticas das amostras da populao 1 e 2.

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

23

Teste de Hiptese
Para testar a hiptese nula de que no existe uma diferena entre as medias das duas populaes
independentes:
Ho: 1 = 2 ou 1 - 2=0
contra a hiptese alternativa de que as medias aritmticas no so iguais.
H1: 1 1 2 ou 12 0

unilateral esquerda
ou cauda superior
Ho: 2
H1:: >2
Unilateral direita
ou cauda inferior
Ho: 2
H1: : < 2
Bilateral:
Ho: : = 2
H1:: 2

fonte: www.dimap.ufrn.br/~marcilio/AM/testehipotese.ppt
8.2 EXERCICIOS
17) Sendo conhecida uma amostra de tamanho n1=40 , a partir de uma populao com desvio
padro conhecido

1=20 , e uma amostra independente de tamanho n2=50, a partir de uma outra

populao , com desvio padro conhecido

2 =10 , qual o valor da estatstica do teste Z para

1 =72 e X
2 =66?
testar diferenas entre mdias aritmticas de duas populaes, se X
Z=

X 1 X 2 1 2

21 21

n 1 n2

resposta: 1,7321
18)Qual seria sua deciso no problema numero 17, caso voc estivesse testando H o:, contra a
hiptese nula alternativa bi caudal, utilizando o nvel de significncia =0,01 .
resposta: aceitar a hipotese nula de que a mdias das populaes so iguais.

24

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

19) Qual o valor - p no problema 1, caso vc tivesse testando Ho e H1 bicaudal.

0,0833

20) FARBER (2009, p.359) Custos de reparo : fornos micro -ondas. Voc quer comprar um forno de
micro-ondas e escolhera o modelo A se os custos de reparo forem mais baixos que os custos de
reparo do modelo B. Voc pesquisa os custos de reparo de 47 fornos do modelo A e 55 fornos do
modelo B. Os resultados da sua pesquisa so , com nivel de significancia de 0,01, voc compraria o
modelo A?
Dados:
Modelo A

Modelo B

X 1 =$ 75

X 2 =$80

S1= $12,50

S2=$20

a) identifique a afirmao e expresse Ho e H1.


Ho: B A
H1: B >A ( afirmao)
b) encontre os valores criticos
c) encontre a estatistica do teste z.
d) decida se rejeita ou aceita Ho.
e) interprete a decisao no contexto da afirmao geral.
21) assistindo mais TV. Um sociologo afirma que crianas entre 6 e 17 anos passavam mais tempo
assistindo TV em 1981 do que crianas de 6 a 17 anos passam hoje. Um estudo foi conduzido em
1981 para descobrir o tempo que crianas de 6 a 17 anos assistiam TV nos dois dias da semana. Os
resultados ( em horas por dia da semana ) so mostrados a seguir:
amostra 1: ( em 1981)
2

2,5

2,1

2,3

2,1

1,6

2,6

2,1

2,1

2,4

2,1

2,1

1,5

1,7

2,1

2,3

2,5

3,3

2,2

2,9

1,5

1,9

2,4

2,2

1,2

2,1

1,9

2,2

25

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

Em um estudo similar foi conduzido. Os resultados so mostrados a seguir:


amostra 2:( nos dias de hoje)
2,9

1,8

0,9

1,6

1,7

2,5

1,1

1,6

1,4

1,7

1,7

1,9

1,6

1,7

1,2

2,6

1,6

2,5

1,6

2,1

1,7

1,8

1,1

1,4

1,2

2,3

1,5

Em =0,025 , voc pode apoiar a afirmao do sociologo?


a) identifique a afirmao e expresse Ho e H1.

soluo

Ho: 1 2
H1: 1 > 2 ( afirmao)
b) encontre os valores criticos
zo=1,96

regio de rejeio : z>-1,96

c) encontre a estatistica do teste z.

3,01

d) decida se rejeita ou aceita Ho.


Rejeite Ho
e) interprete a decisao no contexto da afirmao geral.

No nivel de significancia de 2,5%, h evidencia suficiente para apoiar a afirmao do


socilogo de que as crianas entre 6 e 17 anos passavam mais tempo assistindo TV em 1981
do que as crianas entre 6 e 17 hoje em dia.

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

26

8.3 TESTE
t DE

VARINCIA AGRUPADA PARA A DIFERENA ENTRE DUAS MDIAS ARITMTICAS


amostras pequenas e independentes.

FARBER (2009, p.363) variancias iguais: se as variancias da populao so iguais, ento a


informao das duas amostras combinada para calcular uma estimativa coligada do desvio

padro =S
p

S 2p =

n 11 S 21 n2 1 S 22
n 11 n2 1

t=

1 X
2 1 2
X

Sp

1 1

n1 n2

*A estatstica do teste t segue uma distribuio t, com n1+n2-2 graus de liberdade

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

27

FIGURA 1- Regies de rejeico e de no rejeio para os testes t para a diferena entre as mdias
aritmticas ( teste bicaudal)

A estatstica do teste t para varincia agrupada, requer que as duas varincias das amostras
sejam iguais, no sentido de obter o calculo da varincia agrupada para obter o melhor
estimador.

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

28

8.4 ESTIMATIVA DO INTERVALO DE CONFIANA PARA DIFERENA ENTRE DUAS MDIAS


ARITMTICAS DE DOIS GRUPOS INDEPENDENTES.

1 X
2 t S 2p
X

1 1

n1 n2

t=n1+n2-2 graus de liberdade

8.5 TESTE t VARINCIAS SEPARADAS PARA DIFERENAS ENTRE DUAS MDIAS


ARITMTICAS- VARIANCIAS NO SO IGUAIS
FARBER (2009, p.363-364)
t=

1 X
2 1 2
X

Sp

1 1

n1 n2

S 21 S 22
S =

n1 n2
2
p

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

29

valores criticos so calculados em cima da menor amostra.

VERIFICANDO PREMISSAS

Ao testar as diferenas entre as mdias, adotada a premissa de que as populaes so


normalmente distribudas, com varincias iguais.

Para situaes nos quais as duas populaes possuam iguais varincias, o teste t de varincia
agrupada robusto (no sensvel) quanto ao afastamentos moderados em relao a premissa
da normalidade, contanto que os tamanhos das amostras sejam grandes.

Nestas situaes, o teste t de varincia agrupada pode ser utilizado sem efeitos srios sobre
sua eficcia.

Os dados no so normalmente distribudos.

Um procedimento no paramtrico, tal como o teste da soma de classificaes de Wilcoxon,


que no depende da premissa da normalidade para as duas populaes.

8.6 EXERCICIOS
22)FARBER (2009, p.364) As distancias de frenagem de 8 Volks GTIS e 10 Ford Focus foram
testadas enquanto viajavam a 60 milhas por hora em pista seca. Os resultados so mostrados na
tabela. Voc pode concluir que existe diferena na mdia da distancia de frenagem dos dois tipos de
carro? Use =0,05 . Assuma que as populaes so distribuidas normalmente e as variancias da
populao no so iguais. R: rejeitar Ho
Estatistica amostral para a distancia de frenagem em pista molhada
GTI

FOCUS

Mdia da amostral:141 ps

Mdia da amostral:151 ps

Desvio padro amostral:7 ps

Desvio padro amostral:3,1 ps

n1=8

n2=10

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

30

23)Um fabricante esta desenvolvendo uma bateria de hidreto de nquel para telefones celulares em
substituio a baterias de nquel-cdmio diretor de controle de qualidade decide avaliar o
desempenho da bateria recentemente desenvolvida em relao amplamente utilizada bateria de
nquel-cdmio. Uma amostra aleatria de 25 baterias de cada tipo, so colocadas em telefones
celulares da mesma marca e modelo. A medida de desempenho de interesse o tempo de
conversao (em minutos), at que seja necessria a recarga.Os resultados so seguintes:
* colar antes no calc e depois no gnumeric
Bateria de niquel Bateria de hidreto
cadmio

de niquel

54,5

71

56,7

78,3

103

91,1

67,8

41,7

86,8

95,4

81,3

82,8

64,5

69,7

74,9

69,4

46,4

71,8

70,4

40,8

76,9

87,3

82,3

77,5

72,5

75,4

104,4 62,5

83,2

74,3

64,9

81

82

85

85,3

86,1

83,3

90,4

58,7

85,3

85,5

74,1

72,8

71,8

72,1

112,3

68,8

67

41,1

79,8

a) Existem diferenas entre as medias, admitindo que as varincia so iguais? =0,05


APLICAES DAS FERRAMENTA
1. USANDO GNUMERIC:
FERRAMENTAS/ANLISE ESTATISTICA/ DUAS MDIAS/
AMOSTRAS NO EMPARELHADAS/
VARIANCIAS IGUAIS ( PRESUMINDO) /
VARIANCIAS POPULACES DESCONHECIDAS
( POR CAUSA DA AMOSTRA )/VARIANCIAS IGUAIS

rejeitar Ho

2.CALC-LibreOffice
TESTET
Retorna a probabilidade associada ao Teste t de Student.
Sintaxe

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

TESTET(Dados1; Dados2; Modo; Tipo)


Dados1 a matriz ou intervalo de dados dependente para o primeiro registro.
Dados2 a matriz ou intervalo de dados dependentes para o segundo registro.
Modo = 1 calcular o teste uni-caudal;
Modo = 2 calcular o teste bi-caudal.
Tipo o tipo de teste t que ser realizado.
O Tipo 1 significa pareado.
O Tipo 2 significa duas amostras de varincia igual (homoscedstico).
O Tipo 3 significa duas amostras de varincia diferente (heteroscedstico).

RESULTADO 1:CALC
valor-p:
0,033711727

RESULTADO 2: GNUMERIC
Varivel 1 Varivel 2
Mdia

70,748

79,728

Varincia

195,788

226,030

Observaes

25

25

Correlao de Pearson

0,00911

Hiptese

de

Diferena

entre

Mdias
Diferena

0
entre

Mdias

Observada

8,98

Varincia das Diferenas

417,985

df

24

t Stat

2,1962

31

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

P (T<=t) monocaudal

0,01899

t Crtico monocaudal

1,71088

P (T<=t) bicaudal

0,03798

32

t Crtico bicaudal
2,06390
O valor-p 0,03798 menor que o nvel de significncia de 0,05,portanto rejeita-se Ho ( ento as
medias so diferentes presumindo varincias iguais ).

b)Que outras premissas devem ser adotadas em (a)?


Resposta: so normalmente distribudas
c)Determine o valor- p em (a) e interprete seu significado.
Resposta:
P (T<=t) bicaudal

0,03798

d) Repita para que as varincias no so iguais


USANDO GNUMERIC:
FERRAMENTAS/ANLISE ESTATISTICA/
DUAS MDIAS/AMOSTRAS NO EMPARELHADAS/
VARIANCIAS DESIGUAIS ( PRESUMINDO) /
VARIANCIAS POPULACES DESCONHECIDAS

Teste-t:
presumindo

duas

amostras
varincias

diferentes
Varivel 1
Mdia
70,7480
Varincia
195,7884
Observaes
25,0000
Hiptese da diferena de
mdia
gl
Stat t

0,0000
48,0000
-2,1862

Varivel 2
79,7280
226,0296
25,0000

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

P(T<=t) uni-caudal
t crtico uni-caudal
P(T<=t) bi-caudal
t crtico bi-caudal

33

0,0169
1,6772
0,0337
2,0106

Rejeita-se Ho , ou seja as medias so diferentes presumindo varincias diferentes.


e) construa uma estimativa do intervalo de confiana de 95% da diferena entre as mdias
aritmticas das populaes entre as baterias de niquel-cadmio e as baterias d hidreto de niquel.

1 X
2 t S 2p
X

1 1

n1 n2

O intervalo de confiana de 95% para a diferena entre as medias [0,72; 17,24]

24) Uma agencia imobiliria deseja comparar os valores de avaliao de residncias uni familiares
em 2 comunidades no Condado de Nassau, Nova York. Uma amostra de 60 residncias em
Farmingdale e 99 residncias em Lewittown produz os seguintes resultados (milhares de dlares):
Farmingdale

Lewittown

Medias X

191,33

172,34

S ( desvio padro)

32,60

16,92

60

99

a) nivel de significancia de 0,05, existem evidencias de uma diferena na mdia de valores


avaliados para residencias unifamiliares nas duas comunidades do Conrado de Nassau?

presumindo variancias diferentes

presumindo variancias iguais

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

34

b) construa uma estimativa do intervalo de confiana de 95% da diferena entre as mdias


aritmticas das populaes de Farmingdale e Lewittown.
25) A diretora de treinamento de uma empresa que produz equipamentos eletronicos esta
interessada em determinar se diferentes metodos de treinamento possuem algum efeito sobre a
produtividade de empregados, da linha de produo. Ela designa 42 empregados recentemente
contratados, para dois grupos com 21 empregados. O primeiro grupo recebe um programa de
treinamento individual, assistido por computador de uso pessoal , e outro recebe um programa de
treinamento baseado em equipes. Ao trmino do treinamento, os empregados so avaliados em
relao ao tempo ( em segundos) necessrio para que seja montada uma pea.
Programa com base Programa

baseado

individual assistido em equipes


por computador
19,4

16,7

16,5

22,4

13,8

23,7

20,7

19,3

17,7

18,7

18

17,4

21,8

16,8

16,2

19,3

20,8

23,2

14,1

17,7

17,4

15,6

17,1

20,1

16,1

19,8

16,4

18

28,2

12,3

16,8

19,3

16,8

21,7

20,8

15,2

14,7

16

18,5

30,7

24,7

16

a) admitindo que as variancias so iguais das populaes correspondentes a metodos de treinamento


sejam iguais , existem evidencias de uma diferena entre a mdia dos tempos de montagem ( em
segundos) de empregados treinados em um programa com base individual assistido por computador
e aqueles treinados em um programa baseado em equipes? =0,05
b) repita para que as variancias das populaes so diferentes.
c) compare os resultados a e b

35

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

d)construa uma estimativa do intervalo de confiana de 95% da diferena entre as medias


aritmeticas das populaes relativas aos dois metodos de treinamento.
8.7 TESTE F PARA DIFERENAS ENTRE DUAS VARIANCIAS
DEFINIO :FARBER (2009,p.461-462)

2
2
sejam s
e s representam as variancias de amostras de duas populaes.
1
2

Se duas populaes so normais e as variancia populacionais

2
1

2
2

so iguais ,

ento a distribuio de amostragem de :

s2
1
F=
chamada de distribuio F.
s2
1

PROPRIEDADES

LEVINE (2005, p. )

O objetivo desta estatistica F testar se duas populaes possuem a mesma variabilidade.

Outra importante razo para testar a diferena entre as variancias de duas populaes
determinar se o teste t para variancia agrupada apropriado.

A distribuio F denominada em funo do famoso R. A. Fisher.

Os valores criticos da distribuio F dependem de dois conjuntos de graus de liberdade.

Os graus de liberdade no numerador da frao pertencem a primeira amostra e o


denominador a segunda amostra.

A estatistica do teste F segue uma distribuio F, com n1-1 e n2-1 graus de liberdade.

Para um dado nivel de significncia para testar hipotese nula de igualdade de variancias:

2
2
Ho: =
1
2

contra a hipotese alternativa de que as variancias das duas populaes no so iguais:

2
2
H1:
1
2

Na tabela 1 a seguir tem -se os valores de F com nivel de significancia de 5%

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

TABELA 1 Distribuio

rea =
= 0,05

F de Snedecor
= 0,05
F

(valor tabulado)

Tabela 2 : nivel de significancia de 0,05 unicaudal


gl
graus de liberdade no numerador
denom. 1 2
3
4
5
6
7
8
9
10
1
161 199,5 215,7 224,5 230,1 233,9 236,7 238,8 240,5 241,8
2

,45 0
1
8
6
9
7
8
4
8
18, 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40

51
10, 9,55

9,28

9,12

9,01

8,94

8,89

8,85

8,81

8,79

13
7,7 6,94

6,59

6,39

6,26

6,16

6,09

6,04

6,00

5,96

1
6,6 5,79

5,41

5,19

5,05

4,95

4,88

4,82

4,77

4,74

1
5,9 5,14

4,76

4,53

4,39

4,28

4,21

4,15

4,10

4,06

9
5,5 4,74

4,35

4,12

3,97

3,87

3,79

3,73

3,68

3,64

9
5,3 4,46

4,07

3,84

3,69

3,58

3,50

3,44

3,39

3,35

2
5,1 4,26

3,86

3,63

3,48

3,37

3,29

3,23

3,18

3,14

10

2
4,9 4,10

3,71

3,48

3,33

3,22

3,14

3,07

3,02

2,98

11

6
4,8 3,98

3,59

3,36

3,20

3,09

3,01

2,95

2,90

2,85

12

4
4,7 3,89

3,49

3,26

3,11

3,00

2,91

2,85

2,80

2,75

13

5
4,6 3,81

3,41

3,18

3,03

2,92

2,83

2,77

2,71

2,67

14

7
4,6 3,74

3,34

3,11

2,96

2,85

2,76

2,70

2,65

2,60

15

0
4,5 3,68

3,29

3,06

2,90

2,79

2,71

2,64

2,59

2,54

36

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

16

4,4 3,63

3,24

3,01

2,85

2,74

2,66

2,59

2,54

2,49

17

9
4,4 3,59

3,20

2,96

2,81

2,70

2,61

2,55

2,49

2,45

18

5
4,4 3,55

3,16

2,93

2,77

2,66

2,58

2,51

2,46

2,41

19

1
4,3 3,52

3,13

2,90

2,74

2,63

2,54

2,48

2,42

2,38

20

8
4,3 3,49

3,10

2,87

2,71

2,60

2,51

2,45

2,39

2,35

21

5
4,3 3,47

3,07

2,84

2,68

2,57

2,49

2,42

2,37

2,32

22

2
4,3 3,44

3,05

2,82

2,66

2,55

2,46

2,40

2,34

2,30

23

0
4,2 3,42

3,03

2,80

2,64

2,53

2,44

2,37

2,32

2,27

24

8
4,2 3,40

3,01

2,78

2,62

2,51

2,42

2,36

2,30

2,25

25

6
4,2 3,39

2,99

2,76

2,60

2,49

2,40

2,34

2,28

2,24

26

4
4,2 3,37

2,98

2,74

2,59

2,47

2,39

2,32

2,27

2,22

27

3
4,2 3,35

2,96

2,73

2,57

2,46

2,37

2,31

2,25

2,20

28

1
4,2 3,34

2,95

2,71

2,56

2,45

2,36

2,29

2,24

2,19

29

0
4,1 3,33

2,93

2,70

2,55

2,43

2,35

2,28

2,22

2,18

30

8
4,1 3,32

2,92

2,69

2,53

2,42

2,33

2,27

2,21

2,16

35

7
4,1 3,27

2,87

2,64

2,49

2,37

2,29

2,22

2,16

2,11

40

2
4,0 3,23

2,84

2,61

2,45

2,34

2,25

2,18

2,12

2,08

45

8
4,0 3,20

2,81

2,58

2,42

2,31

2,22

2,15

2,10

2,05

50

6
4,0 3,18

2,79

2,56

2,40

2,29

2,20

2,13

2,07

2,03

37

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

3
3,9 3,09

100

2,70

2,46

2,31

2,19

2,10

2,03

1,97

1,9

4
Fonte: www.inf.ufsc.br/~ogliari/arquivos/Tabelas.do

Para obter os valores criticos da cauda inferior a partir da distribuio F

Fi= 1/Fs

quando Fs vem de uma distribuio F, com n2-1 graus de liberdade no numerador e

n1-1 graus de liberdade no denominador.

Para calcular o valor critico :

INVF ( ,n1-1,n2-1) unicaudal


INVF (

,n1-1,n2-1) bicaudal
2

exemplos :

INVF (0,05,9,9)=3,18 unicaudal (Fs)

INVF (0,025,9,9)=4,03 (FS) bicaudal

Fi=1/4,03 = 0,248

8.7.1 Exercicios
26) MONTGOMERY (2003), para uma distribuio F , calcule o seguinte :
a) F0,25,5,10= 1,59 unicaudal
(bicaudal divide o alfa por dois) F (0,125,5,10)= FSuperior = 2,2820 Finferior=
b) F0,10,24,9=

c) F0,05,8,15=

respostas:1,59; 2,29;1,64;0,529

d) F 0,75,5,10=

1
=0,4382
2,2820

38

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

39

27) Duas companhias quimicas podem fornecer uma materia prima , cuja concentrao de um
determinado elemento importante. A concentrao media para ambos os fornecedores a mesma,
porem suspeitamos de que a variabilidade na concentrao pode diferir entre duas companhias. O
desvio padro da concentrao em uma amostra aleatoria de n 1=10 bateladas produzidas pela
companhia 1 s1=4,7g/l, enquanto para a companhia 2, uma amostra aleatoria de n 2=16 bateladas
resulta em s2=5,8 g/l. H evidencias suficiente para concluir que as varincias das duas populaes
difiram? Use : =0,05
F Test for Differences in Two
Variances
Data
Level of Significance
Population 1 Sample
Sample Size
Sample Standard Deviation
Population 2 Sample
Sample Size
Sample Standard Deviation

0,05
10
4,7
16
5,8

Intermediate Calculations
F-Test Statistic
0,656659
Population 1 Sample Degrees of
Freedom
9
Population 2 Sample Degrees of
Freedom

15

Two-Tailed Test
Lower Critical Value
Upper Critical Value
p-Value
Do not reject the null hypothesis

0,265297
3,122707
0,531163

Nao podemos rejeitar a que as variancias sao diferentes

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

40

28) LEVINE (2005), a diretora de treinamento de uma empresa que produz equipamentos
eletronicos esta interessada em determinar se diferentes metodos de treinamento possuem algum
efeito sobre a produtividade de empregados, da linha de produo. Ela designa 42 empregados
recentemente contratados, para dois grupos com 21 empregados. O primeiro grupo recebe um
programa de treinamento individual, assistido por computador de uso pessoal , e outro recebe um
programa de treinamento baseado em equipes. Ao trmino do treinamento, os empregados so
avaliados em relao ao tempo ( em segundos) necessrio para que seja montada uma pea.

Programa com base Programa

baseado

individual assistido em equipes


por computador
19,4

16,7

16,5

22,4

13,8

23,7

20,7

19,3

17,7

18,7

18

17,4

21,8

16,8

16,2

19,3

20,8

23,2

14,1

17,7

17,4

15,6

17,1

20,1

16,1

19,8

16,4

18

28,2

12,3

16,8

19,3

16,8

21,7

20,8

15,2

14,7

16

18,5

30,7

24,7

16

a) utilizando um nivel de significancia de 0,05 , existem evidencias de uma diferena entre


variancias do tempo de montagem ( em segundos) para empregados treinados atraves de um
programa de treinamento individual assistido por computador e aqueles empregados que foram
treinados em um programa de treinamento baseado em equipes?

APLICAES NA FERRAMENTA -CALC

TESTEF
Retorna o resultado de um teste F.
Sintaxe
TESTEF(Dados1; Dados2)
Dados1 a primeira matriz de registros.
Dados2 a segunda matriz de registros.
Exemplo

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

41

=TESTEF(A1:A30;B1:B12) calcula se dois conjuntos de dados so diferentes em suas varincias e


retorna a probabilidade que ambos conjuntos possam ter vindo da mesma populao total.

APLICAES NA FERRAMENTA -GNUMERIC

F Test for Differences in Two Variances


Data
Level of Significance
Population 1 Sample
Sample Size
Sample Standard Deviation
Population 2 Sample
Sample Size
Sample Standard Deviation

0,05
21
1,9333
21
4,5767

Intermediate Calculations
F-Test Statistic
0,178441
Population 1 Sample Degrees of
Freedom
20
Population 2 Sample Degrees of 20

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

42

Freedom
Two-Tailed Test
Lower Critical Value
Upper Critical Value
p-Value
Reject the null hypothesis

0,405764
2,464489
0,000311

As duas varincias so diferentes.

CALC valor -p 0,00031121

b) com base nos resultados obtidos em (a), apropriado utilizar o teste t para variancia agrupada
para comparar mdias aritmticas dos dois grupos?
8.8 COMPARANDO DUAS AMOSTRAS RELACIONADAS ( EMPARELHADAS): TESTE t
PARA A DIFERENA ENTRE MDIAS ARITMTICAS-amostras dependentes

LEVINE (2005, p. )Existem uma dependncia entre os grupos devido ao fato dos itens
serem colocados em pares, ou combinados , de acordo com alguma caracterstica, ou em
virtude de as medies repetidas serem obtidas a partir de um mesmo conjunto de itens.

A varivel de interesse representa a diferena entre os valores das observaes, e no os


valores das prprias observaes.

Os itens ou indivduos iro se comportar de uma mesma maneira, caso sejam tratados da
mesma forma, o objetivo da analise demonstrar que: quaisquer diferenas entre duas
medidas dos mesmos itens resultam de diferentes condies de tratamento.

O objetivo estudar as diferenas entre duas medies, reduzindo o efeito da variabilidade


decorrente dos prprios itens.
FARBER (2009, p.369-370) , as condies so requeridas para conduzir o teste:

amostras devem ser selecionadas aleatoriamente

amostras devem ser dependentes ( emparelhadas)

ambas as populaes devem ser normalmente distribuidas.

simbolo

descrio

Numero de dados emparelhados

43

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

Diferena entre entradas para dados


emparelhados, d=x1-x2

Media hipotetica das diferenas de dados


emparelhados na populao.

Mdia das diferenas entre entradas de dados


emparelhados nas amostras dependentes:
d
d=
n

sd

Desvio padro das diferenas entre dados


emparelhados nas amostras dependentes:
dd 2

sd =
n1

Teste t para diferena entre as mdias


Estatistica de teste padronizada:
graus de liberdade : n-1
Teste de hiptese

Ho: d=0 ( onde 1-2=0)

H1: d0 ( onde 1-2=0)

t=

d u d
Sd

Premissas do teste da diferena da media

Embora a populao seja assumida como normalmente distribuda, na pratica foi descoberto
que,

enquanto o tamanho da amostra no for bastante pequeno e a populao no for


significativamente assimtrica, a distribuio t fornece uma boa aproximao da distribuio
de amostragem da diferena da media, d .

Para testar a hiptese nula de que no existe nenhuma diferena entre duas medias
aritmticas de 2 populaes relacionadas ( a diferena na media aritmtica das
populaes,d zero):

Ho: d=0 ( onde 1-2=0)

Contra a hiptese alternativa de que as medias aritmticas no so iguais ( a diferena das


medias aritmticas das populaes d =0).

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

44

A estatistica do teste t segue uma distribuio t, com n-1 graus de liberdade.


coeficiente de correlao: nmero entre [-1;1] que descreve a relao entre pares de variveis.
coeficiente de correlao de Pearson (r): nmero entre [-1;1] que descreve a relao linear entre
pares de variveis quantitativas.
propriedades de r:
o sinal de r indica que o tipo de relao linear , se positiva ou negativa.
o valor de r , sem considerar o sinal, indica fora da relao linear.
LEVINE (2005, p.111)
COMANDO NO CALC: pearson ou correl
Estimativa do intervalo de confiana para a diferena da mdia aritmetica
t
D

SD

TESTE Z PARA A DIFERENA ENTRE DUAS MDIAS ARITMTICAS

Quando a populao suficientemente grande o tamanho da amostra segue uma


distribuio normal.
Z=

mD
D
sD

8.8.1 Exercicios
29)Um desenho experimental para um teste t de medies repetidas necessita de uma medio
anterior e uma medio posterior a apresentao de estmulos em cada um dos 15 sujeitos. Quantos
graus de liberdade existem neste teste t?

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

45

30) Um professor de uma escola de negcios deseja investigar os preos de novos livros na livraria
do campus e em uma livraria concorrente fora do campus, filial de uma cadeia nacional de livrarias.
O prof. escolhe aleatoriamente os livros solicitados em 12 cursos de escolas de negcios e compara
os preos nas duas livrarias:
preos
Livros

Livraria

1
2
3
4
5
6
7
8
9
10
11
12

campus
55
47,5
50,5
38,95
58,7
49,9
39,95
41,5
42,25
44,95
45,95
56,95

do Livraria fora do
campus
50,95
45,75
50,95
38,50
56,25
45,95
40,25
39,95
43
42,25
44
55,60

a) a nvel de significncia de 0,01 existem evidencias de uma diferena entre a mdia aritmtica do
preo de livros de negcios nas duas livrarias.
Teste-t: duas amostras em
par para mdias
Varivel
Mdia
Varincia
Observaes
Correlao de Pearson
Hiptese da diferena de
mdia
gl
Stat t
P(T<=t) uni-caudal
t crtico uni-caudal
P(T<=t) bi-caudal
t crtico bi-caudal

Varivel 1
47,6750
44,3598
12,0000
0,9730
0,0000
11,0000
3,3653
0,0032
2,7181
0,0063
3,1058

2
46,1167
36,2824
12,0000

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

46

Resposta: como o valor -p no teste bicaudal 0,0063 menor que o nivel de significancia de 0,01,
ento rejeita-se Ho de que existe uma diferena entre as mdias.
rejeitar Ho:uD =0 ( onde u D =u1 u2 )
B)encontre o valor de p em (a) e interprete seu significado.
Valor p=0,0063
c) construa um intervalo de confiana 99% da diferena na mdia de preos entre duas livrarias.
8.9 TESTE DA SOMA DE CLASSIFICAES DE WILCOXON PARA DIFERENAS ENTRE
DUAS MEDIANAS

FARBER (2009,

p.494) os testes de postos de sinais de Wilcoxon um teste no

paramtrico que pode ser usado para determinar

se duas amostras dependentes ou

independentes foram selecionadas de populaes que possuem a mesma distribuio.

LEVINE (2005, p.372-373) , o teste

da soma de classificaes de Wilcoxon para

encontrar diferenas entre duas medianas.

Caso os tamanhos das amostras sejam pequenos e no deseje avaliar a premissa de que os
dados em cada grupo seja extraidos de populaes normalmente distribuidas, tem duas
opes:

pode-se utilizar um procedimento no paramtrico, que no depende da premissa da


normalidade ou

pode-se utilizar o teste t de variancia agrupada, seguindo alguma transformao


normalizante.

O teste da soma de classificaes de Wilcoxon para encontrar diferenas entre duas


medianas, procedimento no paramtrico.

Para realizar o teste da soma de classificaes de Wilcoxon:


substitua

as observaes nas duas amostras de tamanhos n1 e n2, por classificaes

combinadas.

47

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

classifica-se em ordem crescente o tamanho da amostra n=n1+n2 observaes combinadas,


at que a classificao n seja a maior delas.

Na repetio de valores faz-se a mdia aritmetica entre as classificaes.

Quando houver duas amostras de tamanhos diferentes,

utiliza-se n1 (menor tamanho) e n2 (maior tamanho).

A estatistica T1 corresponde ao teste de soma de classificaes de Wilcoxon,

como sendo a soma de classificaes de n1 ( menor amostra)


n n+1
2

Verificando
classificaes

T 1 +T 2 =

Grandes amostras:
estatistica do teste T1

Media aritmtica T =

n1 n+1
2

desvio padro

T =
1

Estatistica do teste Z

Z=

T 1 T
T

n 1 n 2 n+1
12

Testes de hipotese: M1 e M2 (medianas das populaes 1 e 2)


Teste bicaudal

Ho: M1=M2
H1: M1M2

Teste unicaudal- inferior

Ho: M1M2
H1:M1<M2

Teste unicaudal-superior

Ho: M1 M2
H1:M1 > M2

CALC seleciona variveis e dados /ferramentas/dados/classificar/ coluna dos dados ordem


crescente / em seguida das variveis ordem crescente.

os dados da amostra que forem iguais depois de classificados faz


ordem de classificao.

a mdia aritmtica da

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

48

8.9.1 Exercicios
31) Realize o teste da soma de classificaes de Wilcoxon.
Amostra A
22
34
52
62
30
40
64
84
56
59

Amostra B
52
71
76
54
67
83
66
90
77
84

32) As informaes disponiveis para duas amostras extraidas a partir de populaes independentes:
amostra 1: n1=7
classificaes : 4,1,8,2,5,10,11
amostra 2: n2=9
classificaes : 7,16,12,9,3,14,13,6,15
qual o valor da estatistica do teste T 1, se voce estiver testando a hipotese nula, de igualdade entre
as medianas das populaes.
Resposta: 41

33) Um fabricante esta desenvolvendo uma bateria de hidreto de nquel para telefones celulares em
substituio a baterias de nquel-cdmio diretor de controle de qualidade decide avaliar o
desempenho da bateria recentemente desenvolvida em relao amplamente utilizada bateria de
nquel-cdmio. Uma amostra aleatria de 25 baterias de cada tipo, so colocadas em telefones
celulares da mesma marca e modelo. A medida de desempenho de interesse o tempo de
conversao (em minutos), at que seja necessria a recarga.Os resultados so seguinte:

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

Bateria

de

49

niquel Bateria de hidreto de

cadmio

niquel

54,5

71

56,7

78,3

103

91,1

67,8

41,7

86,8

95,4

81,3

82,8

64,5

69,7

74,9

69,4

46,4

71,8

70,4

40,8

76,9

87,3

82,3

77,5

72,5

75,4

104,4

62,5

83,2

74,3

64,9

81

82

85

85,3

86,1

83,3

90,4

58,7

85,3

85,5

74,1

72,8

71,8

72,1

112,3

68,8

67

41,1

79,8

a) Utilizando um nivel de significancia de 0,05 , existem de uma diferena entre os dois tipos de
baterias em termos de mediana do tempo de conversao ( em minutos) at que seja necessaria a
recarga ?
Wilcoxon Rank Sum
Test
Data
Level of Significance
Population 1 Sample
Sample Size
Sum of Ranks
Population 2 Sample
Sample Size
Sum of Ranks

0,05
25
502,5
25
772,5

Intermediate Calculations
Total Sample Size n
50
T1 Test Statistic
502,5
T1 Mean
637,5
Standard Error of T1
51,53882
Z Test Statistic
-2,61938
Two-Tailed Test
Lower Critical Value
Upper Critical Value

-1,95996
1,959963

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

p-value
Reject

50

0,008809
the

null

hypothesis
Rejeitamos que as medianas das duas populaes so iguais.
b)Que premissas devem ser adotadas em (a)?
c) compare os resultados obtidos no problema 4 para as variancias iguais.

RESUMO
TESTE t para diferena entre duas medias
TESTE F para diferena entre as varincias
TESTE de Wilcoxon para a diferena entre as medianas.

CAPITULO 9
9 ANLISE DA VARINCIA
9.1 O MODELO COMPLETAMENTE ALEATORIO :ANALISE DA VARIANCIA DE FATOR
NICO
Para LEVINE (2005, p.390),algumas aplicaes que envolvem experimentos podem ser
consideradososgruposounveispertencentesasomenteumfatordeinteresse.

Fator:temperaturadecozimento(podepossuirvriosnveisnumricos:300,350,400e
450grauscentigrados).

TESTEFPARADIFERENASENTREDUASMDIASARITMTICAS

medidasnumricassocontinuas;

metodologiausadaAnalisedaVarincia(ANOVA);

oobjetivoanalisardiferenasentreasmdiasaritmticasdosgrupos;

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

51

atravsdaanaliseda variaodosdados,forneceentreosgruposedentrodosprprios
grupos;

avariaodosgruposconsideradaerroexperimental;

avariaoentreosgruposoefeitodostratamentos.

c=numerodegrupos.

Admitesequeos(c)grupossejamextradasdemaneiraaleatriaeindependente,segueuma
distribuionormalevarinciaiguais.

Otestedehiptese:

Ho:1=2=...=c(noexistediferenaentreasmdiasdaspopulaes)

admitindosequeos(c)gruposrepresentamaspopulaes,

cujasmedidassoextradasdemaneiraaleatriaeindependente,

seguemumadistribuionormal,

epossuemvarinciasiguais,

H1:nemtodasasjsoiguais(ondej=1,2..c)

testadaemrelaohiptesealternativadequenemtodasascmdiasdaspopulaesso
iguais.

A variao total soma total dos quadrados (STQ), obtido atravs da soma das
diferenasaoquadradoentrecadaobservaoesuamediageral(somatodasasobservaes
emtodososgruposcombinados).
c

nj

STQ= X ij X onde X =mdiageral


j=1 i=1

Asomadosquadradosentreosgrupos(SQE),medidaatravsdasomadadiferenaaoquadrado
entreamediadecadaamostraeamediageral.
c

SQE= n j X j X nj=numerodeobservaesnogrupoounivelj
j=1

Avariaodentrodogrupo, comoasomadosquadradosdentrodosgrupos(SQD),medea
diferenaentrecadaobservaoeamediadeseuprpriogrupo.
c

nj

SQD= X ij X
j=1 i=1

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

52

Obtendoosquadradosdamediaaritmtica:

MQE=

SQE
SQD
STQ
MQD=
MTQ=
c1
nc
n1

c=numerodegruposn=numerototaldeamostras
MQE=MEDIADOSQUADRADOSENTREOSGRUPOS
MQD=MEDIADOSQUADRADOSDENTRODOSGRUPOS
MTQ=MEDIATOTALDOSQUADRADOS
SQE=VARIAOENTREOSGRUPOS
SQD=VARIAODENTRODOGRUPO
STQ=VARIAOTOTAL
AestatisticadotesteFAnovadefatornico

F=

MQE
MQD

RejeitarHOseF>Fs
tabelaresumidadaanalisedavarincia
Fonte

Grausde
liberdade

Somados
quadrados

Quadrados
damdia
arimtica
(variancia)

Entreosgrupos c1

SQE

MQE

Dentrodos
grupos

nc

SQD

MQD

total

n1

STQ

F(valorcriticodeFs)
INVF(,c1;nc)unicaudal

F=

MQE
MQD

RejeitarHOseF>Fs

FS

9.2 EXERCICIOS
34)Resistncia trao de paraquedas fabricados com fibras sintticas, obtidas atravs de 4
fornecedores.Verificarsetemdiferenaentreasmdias.=0,05
*Fatornicotestararesistnciaatrao.

PARACOLARNOGNUMERIC

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

COLEANTESNOCALC

tools/analiseestatstica/anova/fatornico

53

F1

F2

F3

F4

18,5

26,3

20,6

25,4

24

25,3

25,2

19,9

17,2

24

20,8

22,6

19,9

21,2

24,7

17,5

18

24,5

22,9

20,4

Anova:fatornico

RESUMO
Conta
Grupo
gem
Soma
Mdia
Coluna1
5
97,6
19,52
Coluna2
5
121,3
24,26
Coluna3
5
114,2
22,84
Coluna4
5
105,8
21,16

ANOVA
Fontedavaria
o
SQ
gl
MQ
Entregrupos
63,2855
3 21,0952
Dentrodosgru
pos
97,504
16
6,094

Total
160,7895
19
*MQ ou MS = mdia dos quadrados dentro dos

Varin
cia
7,237
3,683
4,553
8,903

F
valorP Fcrtico
3,4616 0,0414
3,2389

grupos

Concluso:

OvalordeFcalculado=3,4616>Fcritico=3,2389ouvalorp0,0414menorqueonivelde
significanciade0,05.

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

54

rejeitasedequeasmediassotodasiguais,sendoquepelomenosumamediadiferente
dasdemais

9.3 COMPARAES MULTIPLAS: O PROCEDIMENTO TUKEY-KRAMER

LEVINE(2005,p.399),quandohevidenciasdequeexistemmediasdiferentespelomenos
uma,utilizaseoprocedimentodeTUKEY,desenvolvidoporJohnTukey.

Esteprocedimento TukeyKramerexaminasimultaneamentecomparaesentretodosos
paresdegrupos.

Oprimeiropassocalcularasdiferenasentretodososparesdemdiaaritmticas.

ObtendoointervalocriticoparaoprocedimentodeTukeyKramer
Intervalocritico= Qs

MQD 1
1

2
n j n' j

nj:nmerodeobservaesdogrupoj.
n'j:nmeroderplicasdecadagrupo.
ondeQS ovalorcritico dacauda superior apartir da distribuio deintervalos deStudent,
possuindo(c)grausdeliberdadenonumeradore(nc)grausdeliberdadenodenominador.
Intervalocrtico:
Qs


MQD 1
1

2
n j n' j

erropadrodadiferena


MQD 1
2

nj

n '
j

SQD:variaodentrodogrupo.

MQD=

SQD

nc

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

MQD:quadradodamdiaaritmticadentrodosgrupos.

n:tamanhototaldasamostras.

c:numerodegrupos

55

EstatisticaQdestudentusaratabelan1=4en2=16grausdeliberdade

Nestemtodocomparadaadiferenaabsolutaentreosparesde mdias comovalor


critico.

Casoumadiferenadamdiaemvalorabsolutosejamaiorqueovalorcrticoexistemuma
diferenaentreostratamentosouporexemplofornecedor1efornecedor2.

PREMISSASDEANOVA

aleatoriedadeeindependenciaosdadossejamextraidosdeformaaleatoriaeindependente.

Normalidadeextraidosdepopulaesdistribuidasdeformanormal.

Homogeneidadedavarianciaafirmaqueavarianciadentrodecadapopulaodeveserigual
paratodasaspopulaes.

9.4 EXERCICIOS
35)Conformeexerccioanteriorverificarquaisdosfornecedoressodiferentes,quantoasmedias?
Fornecedor 1 Fornecedor 2 Fornecedor 3 Fornecedor 4

18,5

26,3

20,6

25,4

24

25,3

25,2

19,9

17,2

24

20,8

22,6

19,9

21,2

24,7

17,5

36) Uma empresa fabricante de petiscos e que

18

24,5

22,9

20,4

abastece lojas em uma rea metropolitana com

Resposta:fornecedor1e2.

produtossaudveis estavaminteressadaemmelhorar otempodepermanncia deseuspetiscos


tortillachipsnasprateleirasemboascondiesdeconsumo.Seislotes(cadaumcontendo1libra)
doprodutoforamfabricadoscom4diferentesreceitasetodosmantidossobasmesmascondies
de armazenamento. As condies do produto eram verificados diariamente em relao a suas

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

56

condies deconsumo.Otempodepermanncia naprateleira, emdias,atqueoprodutoser


consideradoimprprioparaoconsumofoioseguinte:

Tipodereceita
A

94

88

76

82

100

89

69

80

90

88

76

82

97

83

79

78

101

79

80

89

90
82
72
80
a)nvelde0,05verifiqueseexistediferenaentreasmdiasdotempodepermanncia?
resposta:rejeitarHo
b)determinequaisosgruposdiferememrelaoamdiadotempodepermanncianaprateleira.
Resposta:grupos1e2;1e3;1e4;2e3;2e4;3e4

Procedimento de Tukey-Kramer
Mdia
da Amostra

Grupos

95,3333
84,8333
75,3333
81,8333

1
2
3
4
Outros Dados
Nvel de Significncia
g.l. numerador ( c )
g.l. denominador
MQD-quadrado da media dentro dos grupos

Estatstica Q

Tamanho
da Amostra

6
6
6
6

Comparao
Grupo 1 com Grupo 2
Grupo 1 com Grupo 3
Grupo 1 com Grupo 4
Grupo 2 com Grupo 3
Grupo 2 com Grupo 4
Grupo 3 com grupo 4

Diferena
intervalo ou
Absoluta Erro Padro Amplitude
mdias
da Diferena
Crtica Resultados
10,5000
1,728034
6,84301 Mdias so diferentes
20,0000
1,728034
6,84301 Mdias so diferentes
13,5000
1,728034
6,84301 Mdias so diferentes
9,5000
1,728034
6,84301 Mdias so diferentes
3,0000
1,728034
6,84301 Mdias so diferentes
6,5000
1,728034
6,84301 Mdias so diferentes

0,05
4
20

17,9166
3,96

Pagina 796

nj
nj'


MQD

nj

n '
j

numero de observaes do grupo j


numero de rplicas do grupo j

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

57

9.5 O MODELO FATORIAL DE FATOR DUPLO: ANALISE DA VARIANCIA DE FATOR


DUPLO

Omodelofatorialdefatorduplo,emquedoisfatoressosimultaneamenteavaliadoseum
numeroigualderepeties(n')

ParaosfatoresAeBpossuemumainteraoseoefeitoqueofatorApossuisobreas
medidasnumericasfordependentedoniveldofatorB.

OprocedimentoANOVA,conhecidoANOVAFATORDUPLOostermossodefinidos:

l=numerodeniveisdofatorA

c=nmerodeniveisdofatorB.

n'=numerodevalores(rplicas)paracadaclula(combinaodeumdeterminado
nveldofatorAcomumdeterminadonveldofatorB)

n=numerototaldeobservaesnaexperiencia(onden=lcn')

Xijk=valorksimaobservaoparaonvelifatorAenveljdofatorB.

X =mdiageralougrandemdia(somatodososvaloresedividepelototal)

X i =mdiaaritmticadecadaniveldofatorA(mdiageraldenivelderepetio)

X j =mdiadecadacoluna(fatorB)

REPARTINDOAVARIAOTOTAL
STQ=SQA+SQB+SQAB+SQR(residuo)
ANOVADEFATORDUPLOTEMTRESTESTESDISTINTOSPARASEREMREALIZADOS:
FATORA(linhas)

HO:todasasmediassoiguais

H1:nemtodasasmediassoiguais

FATORB(colunas)
HO:todasasmediassoiguais

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

58

H1:nemtodasasmediassoiguais
INTERAOENTREOSFATORESAEB
Ho:ainteraodeAeBigualazero
H1:ainteraodeAeBnoigualazero
Parainterpretarosresultados,iniciasetestandooefeitodeinteraoentreofatorAeB,casoesse
efeitonosejasignificativoofocoseconcentraranosefeitosprincipaisFatorAeFatorB.
Interpretandoefeitosdeinterao

Paraumamelhorcompreensodoconceitodeinterao,construir umgraficoem
linhasdasmediasdosniveisdecadagrupo.

CasoaslinhassejamparalelasnoexisteumainteraoentreosfatoresAeB.

9.6 EXERCICIOS
37)Resistnciatraodospraquedastecidospordoistiposdeteares.Apartirdefibrassintticas
oriundasde4fornecedores.Faaumaanlisedavarinciadefatorduplo.
fornecedor
teares

jetta

20,6

22,6

27,7

21,5

jetta

18,9

24,6

18,6

20

jetta

19

19,6

20,8

21,1

jetta

21,3

23,8

25,1

23,9

jetta

13,2

27,1

17,7

16

turk

18,5

26,3

20,6

25,6

turk

24

25,3

25,2

19,9

turk

17,2

24

20,8

22,6

turk

19,9

21,2

24,7

17,5

turk

18

24,5

22,9

20,4

a)aonivelde5%,existeumainteraoentreosdoistiposdeteares?
INTERAOENTREOSFATORESAEB
Resposta:

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

59

aceitarHo,indicaqueadiferenaentreasmediasderesistenciasatraoaosdoistearesso
virtualmenteiguaisparaos4fornecedores.

CasoaslinhassejamparalelasnoexisteumainteraoentreosfatoresAeB.

GRAFICO DAS MEDIAS DE Turk e Jetta


30
25
20
turk
jetta

15
10
5
0
F1

F2

F3

F4

4 fornecedores

b)nonivelde0,05,existeumefeitodevidoaos4fornecedores?
FATORB(colunas)
Resposta:rejeitarHo,existemevidenciasdeumadiferenaentreos4fornecedores,emtermosde
mediadaresistenciaatraodosparaquedas.
c)noniveldesignificanciade0,05,existeumefeitodevidoaosdoistiposdeteares?
FATORA(linhas)
resposta:aceitarHo,noexistediferenaentreosdoistiposdeteares.

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

60

Anova: fator duplo com repetio


RESUMO

5,0000

5,0000

5,0000

4 Total

jetta

Contagem

5,0000

20,0000

Soma

93,0000 117,7000 109,9000 102,5000 423,1000

Mdia

18,6000

23,5400

21,9800

20,5000

21,1550

Varincia

10,1750

7,5680

18,3970

8,3550

12,8742

turk

Contagem
Soma
Mdia
Varincia

5,0000
5,0000
5,0000
5,0000 20,0000
97,6000 121,3000 114,2000 106,0000 439,1000
19,5200 24,2600 22,8400 21,2000 21,9550
7,2370
3,6830
4,5530
9,3350
8,5373
Total

Contagem
Soma
Mdia
Varincia

10,0000 10,0000 10,0000 10,0000


190,6000 239,0000 224,1000 208,5000
19,0600 23,9000 22,4100 20,8500
7,9738
5,1444 10,4054
7,9983

ANOVA
Fonte da variao
Amostra
Colunas
Interaes
Dentro

SQ
6,4000
129,5210
0,0860
277,2120

gl
1,0000
3,0000
3,0000
32,0000

Total

413,2190

39,0000

MQ
6,4000
43,1737
0,0287
8,6629

F
0,7388
4,9838
0,0033

valor-P
F crtico
0,3964
4,1491
0,0060
2,9011
0,9997
2,9011

9.7 O TESTE DE CLASSIFICAES DE KRUSKAL-WALLIS PARA DIFERENAS ENTRE


AS MEDIANAS

EmLEVINE(2005),otestedeclassificaesdeKruskalWallisparaadiferenasentrec
medianas(c>2),

utilizadocommuitafrequenciaparatestarsecgruposdeamostrasindependentesforam
extraidosdepopulaesquepossuemmedianasiguais.

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

61

TESTEDEHIPOTESES
hipotesenula

Ho:M1=M2=...=MC

Hipotese alternativa

H1: nem todos os Mj so iguais ( onde


j=1,2,..,c)

AestatsticadotestedeKruskalWallisparadiferenasemcmedianas

H=

12
n n+1

T 2j
j=1

nj

3 n+1

onde:
n=nmerototaldeobservaesaolongodasamostrascombinadas.
nj=nmerodeobservaesnajsimaamostra(j=1,2,..,c)
Tj=somadasclassificaesdesignadasjsimaamostra.

T 2j =quadradodasomadasclassificaesdesignadasjsimaamostra.
PREMISSASDOTESTEDEKRUSKALWALLIS
I. Ascamostrassoaleatriaseindependentementeextradasdesuasrespectivaspopulaes.
II. Avarivelcontinua(evitaigualdade)
III. Osdadosobservadosconstituemnomnimoumconjuntodeclassificaes,tantodentro
quantoentreascamostras.
IV. Ascpopulaespossuemamesmavariabilidade
V. Ascpopulaespossuemomesmoformato
Paraobterovalorcriticocaudasuperior:
INV.QUI(ALFA,GRAUSDELIBERDADE)TESTEQUIQUADRADO
9.8 EXERCICIOS
39)Umpsiclogodotrabalhodesejatestarseostemposderespostadetrabalhadoresdelinhasde
montagemsoequivalentessobtrsdiferentesmtodosdeaprendizagem.Apartirdeumgrupode
25empregadosrecentementecontratados,9foramaleatoriamentedesignadosparaomtodoA,8
paraomtodoBe8paraomtodoC.Apsoperododeaprendizagem,foiatribudaumatarefaa

62

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

cadafuncionrioemedidosseustemposderesposta.Atabelaaseguirapresentaasclassificaes
dostemposderespostas,desde1(maisrpido)at25(maislento):
A)existemevidenciasdeumadiferenasignificativaentreamedianadostemposderespostaem
relaoaestesmtodosdeaprendizagem?=0,01
Metodo A

Metodo B

Metodo C

11

15

12

10

16

13

14

17

18

19

21

24

20

22

25

23
DECISO:aceitaseahiptesenuladequeasmedianassoiguais.
Teste de Classificaes de Kruskal-Wallis
hiptese nula Ho: M1=M2=...=MC
hiptese alternativa H1: nem todas as medianas so iguais.

Entre com o
nivel de
significancia

Dados
Nvel de Significncia

0,01
Grupo 1

Soma de Classificaes
Tamanho da Amostra

104
9
Grupo 2

Soma de Classificaes
Tamanho da Amostra

106
8
Grupo 3

Soma de Classificaes
Tamanho da Amostra

115
8
Grupo 4

Soma de Classificaes
Tamanho da Amostra

0
0

Clculos Intermedirios
Soma das Classificaes ao Quadrado/Tamanho da Amostra
Soma de Tamanhos de Amostras
Nmero de grupos
Estatstica do Teste H

4259,4
25
3
0,64

Resultado do Teste
Valor Crtico
Valor-p

9,21
0,7279
No rejeitar a hiptese nula

Digite o numero
de grupos

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

63

CAPITULO 10
10 TESTES PARA DUAS AMOSTRAS COM DADOS CATEGORICOS
10-1:TESTE Z PARA DIFERENA ENTRE DUAS PROPORES

ParaLEVINE(2005,p.433),comparareanalisardiferenasentreduaspopulaesem
termosdeumavarivelcategrica.

Umtesteparaadiferenaentreduaspropores,obtidasapartirdeamostrassoobtidasa
partirdeamostrasindependentes

(Amostras independentes quando o resultado de um evento no afeta a probabilidade de


ocorrncia de outro evento) utilizando dois diferentes mtodos.)

AestatsticadotesteZaproximadaatravsdeumdistribuionormalpadronizada.

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

64

Avaliardiferenasentreduaspropores,baseandoseemamostrasindependentes,utiliza

seumTesteZ,
com uma distribuio normal padronizada paratamanhos deamostras suficientementes

grandes.
EstaestatsticadotesteZdeterminaadiferenaentreduasproporesdepopulaes,e

baseadanadiferenaentreduaspropores(pa1pa2).
AestatsticadotesteZtemaseguinteequao:

Z=

p a1pa2 p1p 2

p 1p

1 1

n1 n2

com: p=

X 1 X 2
n1 n2

p a1=

X1
n1

p a2=

X2
n2

pa1=proporodesucessosnaamostra1

X1=numerodesucessosnaamostra1

n1=tamanhodaamostra1

p1=proporodesucessosnapopulao1

pa2=proporodesucessosnaamostra2

X2=numerodesucessosnaamostra2

n2=tamanhodaamostra2

p2=proporodesucessosnapopulao2.

Testedehiptese(bicaudal)

p1=proporodesucessosnapopulao1.

P2=proporodesucessosnapopulao2.

Ho:p1=p2

H1:p1p2

ESTIMATIVA DO INTERVALO DE CONFIANA PARA A DIFERENA ENTRE


PROPORESDEDOISGRUPOSINDEPENDENTES

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

pa1 p a2 Z p 1- p
p=

X 1 X 2
n1 n2

p a1=

X1
n1

65

1 1

n1 n2
p a2=

X2
n2

10. 1.1 Exercicios


40)LEVINE(2005,p.438),admitaquen1=100,X1=50,n2=100eX2=30.
a)noniveldesignificanciade0,05,existemevidenciasdeumadiferenasignificativaentreas
proporesdesucessosnogrupo1egrupo2?
b)construaumaestimativadointervalodeconfianade95%dadiferenaentreasduaspropores.

41)Um estudo realizado como parte de um esforopara aperfeioamento da produo de um


fabricadesemicondutores forneceudadoscorrespondentes adefeitos paraumaamostrade450
placas.Atabeladecontingnciaaseguirapresentaumresumodasrespostasparaasduasperguntas
(algumapartcula foiencontrada nafrmaqueproduziuaplaca?e aplaca deboaoudem
qualidade?
Condiodaforma
Qualidade Nenhuma particulas total
daplaca
Boa
m
total

particulas
320
14
80
36
400
50

334
216
450

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

66

a)Nonveldesignificncia de0,05,existeumadiferenaentreaproporodeplacas deboa


qualidadeedemqualidadequecontmpartculas.
Concluso:otesteestatsticoZ=4,4menorqueotestecriticoZ=1,96,portantorejeitaseHo
dequeasmediassoiguais.
b)Construaumaestimativadointervalodeconfianade95%,correspondentediferenaentreas
propores das populaes relativas a placas de boa qualidade e de m qualidade que contm
partculas.
Dados:

pa1 p a2 Z p 1- p

1 1

n1 n2

n1=50X1=14pa1=14/50n2=50X2=36pa2=36/50p=50/100
Resultado1:[0,636;0,244]noestincluidoozeronointervalo,porissorejeitaseHo
42)Assumaquen1=100X1=45,n2=50eX2=25.
a)noniveldesignificanciade0,01,existemevidenciasdeumdiferenasignificativaentreas
proporesdesucessosnogrupo1egrupo2?
b)construaumaestimativadeintervalodeconfianade99%dadiferenaentreasduaspropores.

10.2 TESTE QUI-QUADRADO 2

PARA A DIFERENA ENTRE DUAS PROPORES

Nasecoanteriorfoicomparardiretamenteproporesemtermosdesucesso.

Nesta seco os dados soexaminados em termos de frequncia desucessos nos dois


grupos.

Umprocedimentocujaestatsticadotesteaproximadaatravsdeumadistribuioqui
quadrado,com1graudeliberdade.

TABELADECONTINGNCIA
Varivel da coluna ( grupo)
Variveis da linha 1

totais

sucessos

X1

X2

insucessos

n1-X1

n2-X2

n-X

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

totais

n1

n2

67

TESTEQUIQUADRADOPARAADIFERENAENTREDUASPROPORES

Aestatsticadotestequiquadradoigualadiferenaaoquadradoentreasfrequncias
observadaeesperadadivididapelafrequnciaesperadaemcadaceluladatabelasomadaao
longodetodasascelulasdatabela:

(f o f e ) 2

fe
todas as celulas
2

fo=freqnciaobservada,emumdeterminadacluladeumatabeladecontingncia2x2
fe=freqnciaesperadaouterica,eumadeterminadaclula,seahiptesenulaforverdadeira.
f e=

total da colunatotal dalinha


total geral

TESTEDEHIPTESE
Ho:p1=p2(noexistenenhumadiferenaentreduasproporesdepopulao)
H1:p1p2(existeumadiferenaentreasduasproporesdepopulao)
Aregradedecisaoilustradapelafigura:

INV.QUI(0,05;1)=0,05en=1graudeliberdade
Verificandoaspremissascomrelaoaumatabela2x2:

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

68

Paraqueotesteoferearesultadosprecisosparaumatabela2x2,assumidoquecadafreqncia
esperadasejapelomenosiguala5.
10.2.1Exercicios
43)LEVINE(2005,p.446)OTheNewYorkdivulgouumestudorealizadopelaHenryJ.Kaiser
FamilyFoundation,comrelaoaopapeldosmeiosdecomunicaonavidadascrianas.Emuma
dasquestesdoestudo,foiperguntadoascrianasseelasutilizamumcomputadortodososdias.Os
resultadosencontramseresumidosnaseguintetabeladecontingncia:
Utiliza computador todos os dias
idade

sim

nao

02 ate 7 anos

283

807

08 ate 18 anos

1053

1012

total

total
a)aoniveldesignificanciade0,05,existeumadiferenasignificativaentreasduasfaixasetrias,
noquedizrespeitoaproporodecrianasquefazemusodocomputadortodososdias?
Soluo:

TESTEDEHIPTESE

Ho:p1=p2(noexistenenhumadiferenaentreduasproporesdepopulao)

H1:p1p2(existeumadiferenaentreasduasproporesdepopulao)

GNUMERIC

Test of Homogeneity
Test Statistic:
Degrees of
Freedom:

183,066
1

p-Value:

1,0E41

Critical Value:

3,84146

DECISO: como o valor-p 1*10 -41 menor que 0,05 rejeita-se Ho, ento existe uma diferena nas
propores das duas faixas etrias.

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

69

10.3 TESTE QUI-QUADRADO PARA DIFERENAS ENTRE MAIS DE DUAS PROPORES

Otestequiquadradopodeserestendidoparaocasogeral,noqualexistemduasoumais
populaesindependentes.

Testedehipteses

Ho:p1=p2=...=pc

H1:nemtodaspjsoiguais,ondej=1,2,...,c

Verificandoaspremissasemrelaoaumatabela2xc

Todasasfrequenciastemquesergrandes

Frequenciasesperadasforemiguaisoumaioresque0,5.

Ou

Nomaisque20%dasclulascontenhamfrequenciasesperadasinferioresa5enenhuma
clulapossuafrequenciaesperadainferiora1.

Paraterumequilibriorazovelquecadafrequenciaesperadasejapelomenosiguala1.

Suposiesdealgunsestatsticos.

10.3.1Exercicios
44)Umacadeiadelanchonetesdesejadeterminarseexistemquaisquerdiferenasentreosmeiosde
comunicao(revista,tv,radio),emtermosdoconsumidorviraserecordardeumapropaganda.
Osresultadosdeumestudoemrelaoapropagandasoosseguintes:
Meios de comunicao
Capacidade de recordao

revista tv

rdio total

Numero de pessoas que se recordam da propaganda

25

10

Numero de pessoas que no se recordam da propaganda 73

93

108

total

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

70

a)Aoniveldesignificnciade0,05,determineseexistemevidnciadeumefeitosignificativode
ummeiodecomunicaocomrelaoproporodeindivduosquepodemserecordardeuma
propaganda.

Testedehipteses

Ho:p1=p2=...=pc

H1:nemtodaspjsoiguais,ondej=1,2,...,c
Test of Homogeneity

Test Statistic:
Degrees of
Freedom:

19,0222
2

p-Value:

7,4E05

Critical Value:

5,99146

deciso:comovalorpmenorque0,05entorejeitaseHo.
b)Qualseriaasuarespostapara(a),se17entreos115indivduosqueouviramapropagandano
radiopudessemserecordardela?
10.4 TESTE QUI-QUADRADO PARA A INDEPENDNCIA

Notestequiquadradoparadiferenasentremaisdeduasproporesfoiavaliardiferenas
potenciaisentreaproporodesucessosemqualquernmerodepopulaes.

Ostestequiquadradopodesergeneralizadocomoumtestedeindependncia.

TESTE PARA A INDEPENDNCIA

Ho: as duas variveis categricas so independentes ( no existe nenhuma relao


entreelas)

H1:asduasvariveiscategricassodependentes(existeumarelaoentreelas)

Verificandoaspremissasemrelaoaumatabelalxc:

Garantidosresultadosprecisos

Todasasfrequnciasesperadassejamgrandes.

10.4.5 Exercicios

71

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

45)LEVINE(2005,p.458)Umagrandecorporaoestainteressadaemdeterminarseexistealguma
associaoentreotempodetransportedeseusempregadoseoniveldeproblemasrelacionadosao
estressenotrabalho.Umestudorelativoa116trabalhadoresdalinhadeproduorevelaoseguinte:
ESTRESSE
Tempo
transporte
Abaixo
minutos

de

15 45 minutos
Acima de
minutos

de alto

moderado

baixo

15 9

18

17

28

45 18

total

a)noniveldesignificanciade0,01,existemevidenciasdeumarelaosignificativaentreotempo
detransporteeoestresse?

Test of Independence
Test Statistic:
Degrees of
Freedom:

9,83114
4

p-Value:

0,04337

Critical Value:

13,2767

deciso:existeumrelaosignificativaentreotempodetransporteeoestresse,istoaceitaseHo.
b)qualseriasuarespostapara(a)seoniveldesignificanciade0,05tivessesidoutilizado?
Resposta:rejeitaseHo.

46)DuranteaguerradoVietn,umsistemadeloteriafoiinstitudoparaescolherhomensaserem
requisitadosparaoserviomilitar.Osnmeros,representandodiasdoano,foramaleatoriamente
selecionados;homensnascidosnosdiasdoanocomnmerosbaixoseramconvocadosemprimeiro

72

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

lugar; aqueles com nmeros mais elevados no eram convocados. Os dados a seguir mostram
quantosnmerosbaixos(1122),mdios(122244)ealtos(245366)foramextradosparadatasde
nascimentoemcadatrimestredoano.
trimestres
Conjunto de numeros

jan- abr-jun jul-set out-dez total


mar

baixo

21

28

35

38

122

mdio

34

22

29

37

122

alto

36

41

28

17

122

total

91

91

92

92

366

a)Existemevidnciasdequeosnmerosextradoseramsignificativamenterelacionadospocado
ano? =0,05
b)Quaisseriarespostaem(a)seasfrequenciasfossem:
trimestres
Conjunto de numeros jan-mar abr-jun jul-set out-dez total
baixo

23

30

32

37

122

mdio

27

30

34

31

122

alto

41

31

26

24

122

total

91

91

92

92

366

47) WITTE (2005, p.379) Alunos so classificados de acordo com sua preferencia religiosa
( budista, judaica, protestante, catolica romana ou outras) e afiliao poltica ( democrata,
republicana,independenteououtras)
Preferencia religiosa e afiliao politica
Preferencia religiosa
Afiliao
politica

budista

judaica

protestante

Catolica
romana

outras

democrata

30

30

40

60

40

republicana

10

10

40

20

20

independente 10

10

20

20

40

total

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

outras

73

100

total
a) utilizando o nivel de significancia de 0,05 , teste a hipotese nula que essas duas variveis sejam
independentes.
soluo: Ho : preferencia religiosa e afiliao politica so independentes
H1: Ho falsa.

Test of Independence
Test Statistic:
Degrees of Freedom:

220
12

p-Value:

2,4E40

Critical Value:

21,0261

Deciso: rejeitar Ho ao nivel de significancia de 0,05 em razo do valor de -p 2,4*10^-40 menor


de 0,05 ou 2 =220 ser maior do que 21,03.

CAPITULO 11
11 REGRESSO LINEAR
Definio: uma linha de regresso tambem chamada de linha de melhor ajuste , a linha para a
qual a soma dos quadrados dos residuos um minimo. FARBER (2009,p.409) .
Considere o diagrama de disperso e a linha mostrados a seguir:

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

74

11.1 A EQUAO DE UMA REGRESSO


FARBER (2009, p.410) A equao de uma reta de regresso para uma varivel independente x e
uma varivel dependente y :

y =mx+ b

48) Exemplo:
Encontre a reta de regresso para os gastos com propaganda e dados sobre vendas da empresa:
Custo de propaganda

Vendas da empresa

2,4

225

1,6

184

220

2,6

240

1,4

180

1,6

184

186

2,2

215

a) qual a reta de regresso


resposta:

f(x) = 50,7287449393x + 104,0607287449

b) use a equao para prever as vendas esperadas da empresa para os seguintes gastos com
propaganda:
i) 1,5 mil dlares resposta: 180,1538
ii) 1,8 mil dlares

resposta:195,3724

iii) 2,5 mil dlares resposta: 230,8825


* os valores de previso so significativos somente para valores de x na ( ou prximos a) faixa de dados.
11.2 EXERCICIOS
49) FARBER (2009, p.414) O numero de horas que 12 alunos passaram on-line durante o fim de
semana e as pontuaes que cada um conseguiu em um teste na segunda-feira seguinte:
Horas gastas on-line x

Pontuao no teste y

96

85

82

74

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

95

68

76

84

58

65

75

75

10
50
Construa um diagrama de disperso dos dados e desenhe a linha de regresso. Use a equao de
regresso para prever o valor de y para um dos valores x dados. Caso o valor de x no seja
importante para prever o valor de y , explique o porque.
A equao de regresso -4,0674*x +93,9700
a) x=4 horas

resposta: 77,7004

b) x=8 horas resposta: 61,6308


c) x= 9 horas resposta: 57,5634
d) x=15 horas resposta : este valor esta fora da faixa de dados, por isso no possvel prever o
resultado.
11.3 CORRELAO (r)
FARBER (2009, p.398) uma medida da fora e direo de uma relao entre duas
variveis.
A amplitude do coeficiente de correlao -1 para 1.
Mais prximo de zero no h correlao linear.
Comandos no calc : correl ou pearson
11.4 COEFICIENTE DE DETERMINAO
FARBER (2009, p.420) o coeficiente de r2 a relao da variao explicada com variao total.
2
variao explicada ( y i y )
2
r =
=
varia total
( y i y )2

variao explicada a soma dos quadrados das diferenas entre cada valor de y previsto e a
mdia de y.

variao total a soma dos quadrados das diferenas entre cada valor de y e a mdia de y.

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

O quadrado do coeficiente de correlao (r) chamado de coeficiente de determinao (r2)

Por exemplo se o coeficiente de correlao r= 0,90 , ento o coeficiente de


determinao r2=0,902= 81% , significa que 81% da variao de y podem ser
explicados pela relao entre x e y ;

19% restante da variao no explicada e em razo de outros fatores

50)FARBER (2009, p.425) A tabela mostra o numero de cigarros consumidos( em bilhoes) nos
EUA e o numero de cigarros exportados ( em bilhoes) nos EUA por 7 anos. Determine a equao
de regresso e o coeficiente de determinao.
Cigarros consumidos nos EUA (x) bilhes

Cigarros consumidos nos EUA (y)exportados


bilhes

435

166

430

154

425

145

415

130

400

127

388

122

376

124

RESPOSTA:
f(x) = 0,6711050038x - 136,7714651251
R = 0,7869564637

76

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

77

51) FARBER (2009, p.416) Use dos dados apresentados na tabela:


Numero de horas x

Numero de bactrias y

165

280

468

780

1310

1920

4900

a) encontre a equao de regresso.


f(x) = 654,5357142857x - 1214,8571428572
R = 0,7243296207

b) construa um grafico de disperso de (x,log y) e encontre a equao de regresso.


f(x) = 3,8581524066x - 2,8885449998
R = 0,9837535766

c) uma equao exponencial uma equao de regresso no linear da forma y=ab x, encontre essa
equao.
f(x) = 93,02821425241,7119074994^x
R = 0,9897099883

d) uma equao de potencia uma equao de regresso no linear da forma y=axb, encontre essa
equao.
Soluo: y=axb,
*APLICAR LOGARITMO NEPERIANO OU LOGARITMO NA BASE 10 NOS DOIS
TERMOS.

Ln y = Ln axb

Ln (y)= Ln (a) + b Ln (x)

78

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

Y = Bo +B1X
Construir a tabela com Ln (y) e Ln(x).
x
y
LN(x)
LN(y)
1
165
0,0000
2
280
0,6931
3
468
1,0986
4
780
1,3863
5 1310
1,6094
6 1920
1,7918
7 4900
1,9459

5,1059
5,6348
6,1485
6,6593
7,1778
7,5601
8,4970

f(x) = 1,6163518497x + 4,7148129033


R = 0,89906368

FAZENDO A COMPARAO ENTRE Y=B0=B1*X e Ln y = Ln a +b* Ln x


b=1,6163
* Ln a= 4,7148
a = exp(4,7148)= 111,5864
A EQUAO DE POTENCIA AJUSTADA :
Y =111,5864X 1,6163

REFERENCIAS

Disponivel em www.inf.ufsc.br/~ogliari/arquivos/Tabelas.doc, acessado em 29/10/2010

Disponivel

em

www.dimap.ufrn.br/~marcilio/AM/testehipotese.ppt,

acessado

em

13/10/2010.

REFERENCIAS

MONTGOMERY, D.C. e RUNGER,G.C. Estatstica Aplicada e Probabilidade Para


Engenheiros.2aedioRJ.EditoraLTC.2003.

LEVINE, David M. et. al. EstatsticaTeoriaeAplicaesUsandooMicrosoftExcelem


Portugus.3aed.RJEditoraLTC.2005.

CRESPO,A.EstatsticaFcil.14aed.SP.EditoraSaraiva.1994

BROFFICE

LARSON & FARBER. Estatstica Aplicada. 4a edio.SP.Pearson Education.2009.

DOMENICO, Luiz Carlos De. MATEMATICA 3 em 1. Artes Grficas e Editora- Unificado.


Curitiba.PR.

MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas

79

FARBER,Betsy.LARSON,Ron.EstatsticaAplicada.SoPaulo.4edio.2009.Pearson.

MILONE,Giuseppe.EstatisticaGeraleAplicada.SoPaulo:ThomsonLearning.2006.

WITTE, John S.; WITTE, Robert S. Estatstica. LTC. 7a edio 2005. 506p. ISBN 85-216-14411