Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
AD34S
14:11:14
11/09/14
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
ii
Sumrio
8TESTESPARADUASAMOSTRASCOMDADOSNUMRICOS..1
CAPITULO7..............................................................................................................................4
7FUNDAMENTOSDETESTEDEHIPTESESPARAUMAAMOSTRA.......................4
7.1METODOLOGIASDOTESTEDEHIPTESES..........................................................4
7.2OTESTEZDEHIPTESESPARAAMDIAARITMTICA(DESVIO
PADROCONHECIDO)AMOSTRASGRANDES.........................................................7
7.3EXERCICIOS..................................................................................................................8
7.4TESTEUNICAUDAIS..................................................................................................11
7.5.1Exercicios........................................................................................................11
7.6TESTEtDEHIPOTESESPARAAMDIAARITMTICA(desviopadro
desconhecido).......................................................................................................................13
7.7EXERCICIOS................................................................................................................14
7.7TESTEZDEHIPOTESESPARAAPROPORO...................................................17
7.8EXERCICIOS................................................................................................................18
CAPITULO8.....................................................................................................................19
8TESTESPARADUASAMOSTRASCOMDADOSNUMRICOS............................19
8.1COMPARANDODUASAMOSTRASINDEPENDENTES:TESTANDOA
DIFERENAENTREASMDIAS(amostrasgrandeseindependentes)........................19
8.2EXERCICIOS................................................................................................................21
8.3TESTEtDEVARINCIAAGRUPADAPARAADIFERENAENTREDUAS
MDIASARITMTICASamostraspequenaseindependentes......................................22
8.4ESTIMATIVADOINTERVALODECONFIANAPARADIFERENAENTRE
DUASMDIASARITMTICASDEDOISGRUPOSINDEPENDENTES....................24
8.5TESTEtVARINCIASSEPARADASPARADIFERENASENTREDUAS
MDIASARITMTICASVARIANCIASNOSOIGUAIS......................................24
8.6EXERCICIOS................................................................................................................25
8.7TESTEFPARADIFERENASENTREDUASVARIANCIAS................................30
8.7.1Exercicios........................................................................................................34
8.8COMPARANDODUASAMOSTRASRELACIONADAS(EMPARELHADAS):
TESTEtPARAADIFERENAENTREMDIASARITMTICASamostras
dependentes..........................................................................................................................38
8.8.1Exercicios........................................................................................................40
8.9TESTEDASOMADECLASSIFICAESDEWILCOXONPARADIFERENAS
ENTREDUASMEDIANAS...............................................................................................42
8.9.1Exercicios...............................................................................................................43
CAPITULO9....................................................................................................................46
9ANLISEDAVARINCIA...............................................................................................46
9.1OMODELOCOMPLETAMENTEALEATORIO:ANALISEDAVARIANCIADE
FATORNICO.................................................................................................................46
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
iii
9.2EXERCICIOS................................................................................................................48
9.3COMPARAESMULTIPLAS:OPROCEDIMENTOTUKEYKRAMER............50
9.4EXERCICIOS................................................................................................................51
9.5OMODELOFATORIALDEFATORDUPLO:ANALISEDAVARIANCIADE
FATORDUPLO...................................................................................................................52
9.6EXERCICIOS................................................................................................................54
9.7OTESTEDECLASSIFICAESDEKRUSKALWALLISPARADIFERENAS
ENTREASMEDIANAS.....................................................................................................56
9.8EXERCICIOS................................................................................................................57
...........................................................................................................................................59
CAPITULO10..................................................................................................................59
10TESTESPARADUASAMOSTRASCOMDADOSCATEGORICOS...........................59
101:TesteZparadiferenaentreduaspropores..............................................................59
10.1.1Exercicios.....................................................................................................60
10.2testequiquadradoparaadiferenaentreduaspropores........................................62
10.3TESTEQUIQUADRADOPARADIFERENASENTREMAISDEDUAS
PROPORES....................................................................................................................65
10.4TESTEQUIQUADRADOPARAAINDEPENDNCIA.........................................66
CAPITULO11..........................................................................................................................69
11REGRESSOLINEAR.......................................................................................................69
11.1AEQUAODEUMAREGRESSO.....................................................................69
11.3CORRELAO(r)......................................................................................................71
11.4COEFICIENTEDEDETERMINAO....................................................................71
.....71
REFERENCIAS................................................................................................................74
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
CAPITULO 7
7 FUNDAMENTOS DE TESTE DE HIPTESES PARA UMA AMOSTRA
7.1 METODOLOGIAS DO TESTE DE HIPTESES
Para LEVINE (2005), o teste de hiptese baseia-se em uma teoria, declarao ou afirmativa.
E a hiptese nula, diz respeito ao status quo, no qual corresponde a nenhuma diferena.
E que a hiptese alternativa tenha uma probabilidade bem mais alta para ser verdadeira.
A hiptese nula nem sempre esta correta por que a deciso baseada em informaes da
amostra.
Quando se aceita Ho (hiptese nula), conclui-se que no existe evidencias para garantir sua
rejeio.
as hipteses nula e alternativa
Para calcular a estatstica do teste com base em uma amostra, ela segue uma distribuio de
estatstica como uma distribuio normal ou distribuio t.
FARBER (2009, p.298), quando a hipotese H1 contem simbolos menos que < um teste
unicaudal a esquerda ou > unicaudal a direita.
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
unilateral esquerda
ou cauda superior
Ho: <= k
H1:: > k
Unilateral direita
ou cauda inferior
Ho: : >= k
H1: : < k
Bilateral:
Ho: : = k
H1:: k
fonte: www.dimap.ufrn.br/~marcilio/AM/testehipotese.ppt
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
FARBER (2009, p.294) A tabela seguir mostra a relao entre as possveis afirmaes
verbais sobre o parametro e as hipoteses nulas ou alternativa.
Formulao verbal
Ho: hipotese nula
Formulao matematica
Formulao verbal
H1: hipotese alternativa
a mdia Maior ou
igual a k
a mdia pelo menos k
a mdia no menos
que k
Ho: k
H1: <k
teste da cauda inferior
a mdia Menos ou
igual a k
a mdia no maximo k
a mdia no mais do
que k
Ho: k
H1: >k
teste da cauda superior
a mdia no igual a k
a mdia diferente de k
a mdia no k
a mdia igual a k
Ho: =k
a mdia k
H1: k
a mdia exatamente k
teste bicaudal
* comparar a primeira coluna e a terceira coluna.
Erro do tipo I:
rejeita-se Ho quando ela verdadeira, representado por .
Erro do tipo II:
aceita-se Ho, quando ela falsa, representado por .
O nivel de significncia
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
O coeficiente de confiana
A eficacia de um teste 1-, a probabilidade de que seja rejeitada a hipotese nula quando
que de fato ela for falsa e deva ser rejeitada.
Exemplo : 1) FARBER (2009, p.294-295) Afirme as hipoteses nula e alternativa e identifique qual
representa a afirmao.
a) uma universidade publica que a proporo de seus estudantes que se graduaram em 4 anos de
82%.
b) Um fabricante de torneiras anuncia que o indice mdio de fluxo de agua de certo tipo de torneira
menor que 2,5 galoes por minuto.
Ho: 2,5
Exemplo: 2) FARBER (2009, p.296-297) o limite USDA para contaminao por salmonela por
frango de 20%. Um inspetor de carnes reporta que o frango produzido por uma empresa excede o
limite USDA. Realizando o teste de hipoteses para determinar se afirmao do inspetor de carne
verdadeira. Quando ira ocorrer um erro do tipo I ou tipo II? Qual mais srio?
Soluo
Ho: p 0,20
erro do tipo I: se a proporo real de frango contaminado for menor ou igual a 0,20, decisao
de rejeitar Ho.
Erro do tipo II: ocorrer se a real proporo de frango contaminado for maior que 0,20 mas
voc no rejeita Ho.
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
FARBER (2009, p.307), quando n 30 podera ser usado o desvio padro da amostra no
lugar de sigma.
7.3 EXERCICIOS
3) O diretor de produo de uma fabrica precisa determinar se uma nova maquina est produzindo
de acordo com as especificaes do fabricante, que indicam que o tecido deveria ter uma mdia
aritmtica de resistncia ao rompimento equivalente a 70 libras e um desvio padro de 3,5 libras.
Uma amostra de 49 peas de tecidos revela uma mdia aritmtica de resistncia ao rompimento da
amostra igual a 69,1 libras.
a) especifique a hiptese nula e alternativa.
Hiptese nula : Ho = 70 libras ( afirmao)
Hiptese alternativa : H1 70 libras
b)existem evidencia de que a mquina no esteja atendendo s especificaes do fabricante, com
relao a mdia da resistncia ao rompimento? ( =0,05). R: aceitar Ho
Dados:
Hiptese nula : Ho = 70 libras
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
Null Hypothesis
Level of Significance
Population Standard Deviation
Sample Size
Sample Mean
70
0,05
3,5
49
69,1
Intermediate Calculations
Standard Error of the Mean
Z Test Statistic
Two-Tailed Test
Lower Critical Value
Upper Critical Value
p-Value
Do not reject the null hypothesis
0,5
-1,800
-1,959962787
1,959962787
0,071860531
Z=
70
0,05
1,75
49
69,1
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
Intermediate Calculations
Standard Error of the Mean
Z Test Statistic
Two-Tailed Test
Lower Critical Value
Upper Critical Value
p-Value
Reject the null hypothesis
10
0,25
-3,600
-1,959962787
1,959962787
0,000318291
e) qual seria sua resposta em (b) caso a mdia aritmtica da amostra fosse igual a 69 libras e o
desvio padro fosse de 3,5 libras?
R:aceitar H1
Z Test of Hypothesis for the Mean
Data
Null Hypothesis
=
Level of Significance
Population Standard Deviation
Sample Size
Sample Mean
Intermediate Calculations
Standard Error of the Mean
Z Test Statistic
Two-Tailed Test
Lower Critical Value
Upper Critical Value
p-Value
Reject the null hypothesis
70
0,05
3,5
49
69
0,5
-2,000
-1,959962787
1,959962787
0,045500124
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
11
Em LEVINE (2005), o teste unicaudal ou teste direcional esta contida em uma cauda da
distribuio de amostragem da estatistica do teste.
Para calcular o valor de Z com rea de 5%, chamado zona de rejeio: invnormp(0,05)=
-1,645 abaixo e acima 1,645
unilateral esquerda
ou cauda superior
Ho: k
H1:: > k
Unilateral direita
ou cauda inferior
Ho: : k
H1: : < k
Bilateral:
Ho: : = k
H1:: k
fonte: www.dimap.ufrn.br/~marcilio/AM/testehipotese.ppt
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
12
7.5.1 Exercicios
4) FARBER (2009, p.308) Em um anuncio, uma pizzaria afirma que a mdia de seu tempo de
entrega menor que 30 minutos. Uma seleo aleatria de 36 tempos de entrega tem mdia
amostral de 28,5 minutos e desvio padro de 3,5 minutos. H evidencia suficiente para apoiar a
afirmao em =0,01 ? Use o valor de P.
Soluo:
Ho: 30 minutos
5) FARBER (2009, p.309) proprietrios de casas afirmam que a velocidade mdia de veculos que
passam por sua rua maior que o limite de velocidade de 35 milhas por hora. Uma amostra
aleatria de 100 automveis tem mdia de velocidade de 36 milhas por hora e desvio padro de 4
milhas por hora. H evidencia suficiente para apoiar a afirmao em =0,05. Use o valor de P.
Soluo:
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
6) A Glen
13
b)caso a empresa desejasse testar a hiptese no nvel de significncia de 0,05, que decises ela iria
tomar utilizando o modelo do valor critico para testes de hipteses?
Z=
c)caso a empresa desejasse testar a hiptese no nvel de significncia de 0,05, que decises ela iria
tomar utilizando o modelo do valor-p para testes de hipteses?
Resultado3:p=0,0401< =0,05 rejeitar Ho
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
14
desconhecido)
Em diversas situaes teste de hipoteses utilizam dados numericos, onde o desvio padro da
populao desconhecido.
t=
=media da
Xu
S
n
populao onde a estatistica do teste t segue uma distribuio t, tendo n-1 graus
de liberdade.
S= desvio padro da amostra
Premissas do teste t de uma amostra
Para utilizar o teste t de uma amostra , os dados numricos obtidos so vistos como se
representassem uma amostra aleatria, a partir de uma populao que seja normalmente
distribuda.
7.7 EXERCICIOS
7) Se, em uma amostra de tamanho n=16 selecionada a partir de uma populao normal subjacente,
=56, e o desvio padro da amostra S=12, qual sera o valor da
a mdia aritmtica da amostra X
estatstica do teste t, se voc estiver testando a hiptese nula, de que =50?
Soluo:
n=16
=56
X
S=12 ( desvio padro da amostra)
=50
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
t=
15
Xu 5650 6
= =2
3
S = 12
n
16
o valor de t igual a 2.
8) O diretor de uma grande universidade informa aos pais de alunos recm-chegados sobre os
custos dos livros durante um semestre. Uma amostra de 100 alunos matriculados na universidade
indica uma mdia aritmtica da amostra de custos correspondentes a $315,4, com um desvio padro
da amostra igual a $43,20 e a mdia da populao de $300?
a) construa uma estimativa de intervalo de confiana de 90%.
Resposta:[308,23;322,57]
Dados : n=100 media da amostra=315,4 desvio padro da amostra =43,20 media da populao
:=300
Confidence Interval Estimate for the Mean
Data
Sample Standard Deviation
Sample Mean
Sample Size
Confidence Level
43,2
315,4
100
90%
Intermediate Calculations
Standard Error of the Mean
4,32
Degrees of Freedom
99
t Value
1,660391717
Interval Half Width
7,172892219
Confidence Interval
Interval Lower Limit
Interval Upper Limit
308,23
322,57
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
b) qual seria sua deciso estatistica caso voce testasse Ho e H1, ao nvel de significncia de 0,05 e
0,1?
Resposta:
a nvel de 0,05 e 0,1 rejeita-se Ho, existem diferenas entre as medias da populao e da
amostra.
300
0,05
100
315,4
43,2
Intermediate Calculations
Standard Error of the Mean
4,32
Degrees of Freedom
99
t Test Statistic
3,564814815
Two-Tailed Test
Lower Critical Value
Upper Critical Value
p-Value
Reject the null hypothesis
-1,984217306
1,984217306
0,000562434
300
0,1
100
315,4
43,2
4,32
99
3,564814815
-1,660391717
1,660391717
0,000562434
16
17
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
c)utilizando o nvel de significncia de 0,1, existem evidencias de que a mdia da populao seja
superior a $300?
cauda superior
Teste t de Hipteses para a Mdia Aritmtica
Dados
Hiptese Nula
Nvel de Significncia
Tamanho da Amostra
Mdia da Amostra
Desvio Padro da Amostra
300,0000
0,1000
100,0000
315,4000
43,2000
Clculos Intermedirios
Erro Padro da Mdia
Graus de Liberdade
Estatstica do Teste t
TESTE CAUDA SUPERIOR
Valor Crtico Inferior
Valor-p
4,3200
99,0000
3,5648
1,2902
Area da cauda
superior
0,10000
0,000281
Rejeitar a hiptese nula
9)FARBER (2009, p.326-327) Para o seu estudo sobre hbitos alimentares entre adolescentes
homens, voc seleciona aleatoriamente 20 adolescentes e pergunta a cada um deles quantas pores
de 12 onas de refrigerante ele bebe todos os dias. Os resultados so listados a seguir. Com o nivel
de significancia igual a 0,05 , h evidencia suficiente para dar suporte a afirmao de que
adolescentes homens bebem menos que tres pores de 12 onas de refrigerantes todos os dias?
2,1
2,3
1,6
2,1
* 1 ona = 28 ml
2,4
1,2
0,8
2,1
2,2
2,5
2,1
1,8
2,2
2,8
3,2
0,5
1,4
1,2
b) calcule o valor P.
18
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
Resposta:
c) decida se rejeita ou aceita Ho.
d) interprete a deciso no contexto da afirmao original.
10) Uma empresa que produz materiais escolares diz que os professores gastam uma mdia de mais
do que $550 de seu dinheiro em materiais escolares em um ano. Uma amostra aleatoria da
quantidade ( em dolares) que 24 professores gastaram em materiais escolares em um ano recente
listada a seguir. Com =0,05, h evidencia suficiente para dar suporte a afirmao da empresa?
715
623
582
721
602
621
462
320
532
566
686
532
603
420
684
713
531
888
482
361
560
910
546
860
Ho: 550
b) calcule o valor P.
c) decida se rejeita ou aceita Ho.
d) interprete a deciso no contexto da afirmao original.
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
19
FARBER (2009, p.327), ocorrem quando um politico quer saber a proporo de seus
constituintes que esto a favor de certo projeto de lei ou quando um engenheiro de qualidade
testa a proporo de peas com problemas.
LEVINE (2005, p.246) Uma distribuio normal pode ser utilizada para aproximar a
distribuio binomial quando np5 e nq 5.
p normal com:
p= p e p= pq
n
Testar a hipotese pertinente a proporo, p, de valores que se encontram em uma
determinada categoria em vez de testar a media aritmtica da populao.
Teste Z para a proporo
Z
pa=X/n
pa p
p (1 p)
n
n=tamanho da amostra
p=proporo da hipotese de sucessos na populao
7.8 EXERCICIOS
11)Caso, em uma amostra aleatria de 400 itens, sejam encontrados 88 itens com defeito, qual a
proporo da amostra dos itens defeituosos?
R:pa =88/400=0,22=22%
12)No problema anterior,se a hiptese nula, determinar que 20% dos itens na populao so
defeituosos, qual o valor da estatstica do teste Z?
Dados: p=0,20 pa=88/400=0,22
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
pa p
p (1 p)
n
Z=
20
[0,220,2]
0,210,2
400
Z=1
13) Suponha que voc esteja testando a hiptese nula. Ho: p =0,2, contra a hiptese alternativa
bicaudal , H1: p0,2, e que voce escolheu o nvel de significncia correspondente a =0,05. Qual
seria a sua deciso estatistica?
Resultado1: aceita-se Ho em que a proporo igual a 20%.
Resultado 2: para rejeitar Ho, pode-se mudar aleatriamente o numero de sucessos maior ou menor que 80.
14) FARBER (2009, p.328) Um centro de pesquisas declara que menos que 20% dos usuarios de
internet nos EUA tem rede sem fio em suas casas. Em uma amostra aleatoria de 100 adultos, 15%
dizem que tem rede sem fio em casa. Com =0,01 h evidencias suficientes para apoiar a
declarao do pesquisador?
15) FABER (2009, p.329) A Zogby Internacional declara que 45% das pessoas nos EUA so a favor
de tornar a venda do cigarro ilegal dentro dos prximos 10 anos. Voc decide testar essa afirmao e
entrevista uma amostra de 200 pessoas, dentre as quais, 49% so a favor da lei. Com =0,05, h
evidencia o bastante para apoiar a afirmao?R : no rejeitar Ho.
16) FARBER (2009,p.331) O centro de pesquisas de Pew afirma que mais de 55% dos adultos
norte-americanos assistem seus noticirios locais regularmente. Voc decide testar essa afirmao e
entrevista uma amostra de 425 adultos nos EUA sobre esse assunto. Dos 425 entrevistados, 255
responderam que assistem seus noticirios locais regularmente. Com =0,05,ha evidencia o
suficiente para apoiar essa afirmao do centro de pesquisas Pew? R:rejeitar Ho.
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
21
CAPITULO 8
8 TESTES PARA DUAS AMOSTRAS COM DADOS NUMRICOS
8.1 COMPARANDO DUAS AMOSTRAS INDEPENDENTES: TESTANDO A DIFERENA
ENTRE AS MDIAS ( amostras grandes e independentes)
As
relacionadas.
Exemplo 1: dependentes
Exemplo2:independentes
LEVINE(2005, p.346), suponha que uma amostra n1 foi extraida da primeira populao e
n2 da segunda populao, existem uma varivel numrica correspondente.
Nas duas populaes existem suas respectivas mdias e seus respectivos desvio padro.
A estatstica do teste, utilizada para determinar a diferena entre as mdias das populaes,
baseado na diferena entre as medias das amostras X1 e X2 .
Esta estatstica de teste segue uma distribuio normal padronizada, para tamanhos de
amostras suficientemente grandes.
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
22
( X 1 X 2 )( 1 2)
21 22
+
n1 n 2
FARBER (2009, p.355) quando as amostras so grandes( ao menos 30), pode usar s1 e
s2 no lugar de 1 e 2 .
Para LEVINE (2005, 346),na maioria dos casos as varincias e os desvios padres no so
conhecidos, a nica informao disponveis so as mdias aritmticas , varincias e desvios
-padro das amostras.
Podem ser estabelecidas premissas de que as amostras tm que ser extradas de uma de
forma aleatria e independente, a partir de uma populao normalmente distribudas e que as
2
2
varincias das populaes sejam iguais 1 = 2 .
Um teste t de variancia agrupada pode ser utilizado para determinar se existe um diferena
significativa entre as mdias aritmticas das duas populaes.
Onde:
n1 = tamanho da populao 1
n2 = tamanho da populao 2
1 = mdia aritmtica da populao 1
2 = mdia aritmtica da populao 2
1 = desvio padro da populao 1
2 = desvio padro da populao 2
S2p =varincia agrupada
X1 e X2= mdias aritmticas das amostras da populao 1 e 2.
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
23
Teste de Hiptese
Para testar a hiptese nula de que no existe uma diferena entre as medias das duas populaes
independentes:
Ho: 1 = 2 ou 1 - 2=0
contra a hiptese alternativa de que as medias aritmticas no so iguais.
H1: 1 1 2 ou 12 0
unilateral esquerda
ou cauda superior
Ho: 2
H1:: >2
Unilateral direita
ou cauda inferior
Ho: 2
H1: : < 2
Bilateral:
Ho: : = 2
H1:: 2
fonte: www.dimap.ufrn.br/~marcilio/AM/testehipotese.ppt
8.2 EXERCICIOS
17) Sendo conhecida uma amostra de tamanho n1=40 , a partir de uma populao com desvio
padro conhecido
1 =72 e X
2 =66?
testar diferenas entre mdias aritmticas de duas populaes, se X
Z=
X 1 X 2 1 2
21 21
n 1 n2
resposta: 1,7321
18)Qual seria sua deciso no problema numero 17, caso voc estivesse testando H o:, contra a
hiptese nula alternativa bi caudal, utilizando o nvel de significncia =0,01 .
resposta: aceitar a hipotese nula de que a mdias das populaes so iguais.
24
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
0,0833
20) FARBER (2009, p.359) Custos de reparo : fornos micro -ondas. Voc quer comprar um forno de
micro-ondas e escolhera o modelo A se os custos de reparo forem mais baixos que os custos de
reparo do modelo B. Voc pesquisa os custos de reparo de 47 fornos do modelo A e 55 fornos do
modelo B. Os resultados da sua pesquisa so , com nivel de significancia de 0,01, voc compraria o
modelo A?
Dados:
Modelo A
Modelo B
X 1 =$ 75
X 2 =$80
S1= $12,50
S2=$20
2,5
2,1
2,3
2,1
1,6
2,6
2,1
2,1
2,4
2,1
2,1
1,5
1,7
2,1
2,3
2,5
3,3
2,2
2,9
1,5
1,9
2,4
2,2
1,2
2,1
1,9
2,2
25
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
1,8
0,9
1,6
1,7
2,5
1,1
1,6
1,4
1,7
1,7
1,9
1,6
1,7
1,2
2,6
1,6
2,5
1,6
2,1
1,7
1,8
1,1
1,4
1,2
2,3
1,5
soluo
Ho: 1 2
H1: 1 > 2 ( afirmao)
b) encontre os valores criticos
zo=1,96
3,01
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
26
8.3 TESTE
t DE
padro =S
p
S 2p =
n 11 S 21 n2 1 S 22
n 11 n2 1
t=
1 X
2 1 2
X
Sp
1 1
n1 n2
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
27
FIGURA 1- Regies de rejeico e de no rejeio para os testes t para a diferena entre as mdias
aritmticas ( teste bicaudal)
A estatstica do teste t para varincia agrupada, requer que as duas varincias das amostras
sejam iguais, no sentido de obter o calculo da varincia agrupada para obter o melhor
estimador.
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
28
1 X
2 t S 2p
X
1 1
n1 n2
1 X
2 1 2
X
Sp
1 1
n1 n2
S 21 S 22
S =
n1 n2
2
p
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
29
VERIFICANDO PREMISSAS
Para situaes nos quais as duas populaes possuam iguais varincias, o teste t de varincia
agrupada robusto (no sensvel) quanto ao afastamentos moderados em relao a premissa
da normalidade, contanto que os tamanhos das amostras sejam grandes.
Nestas situaes, o teste t de varincia agrupada pode ser utilizado sem efeitos srios sobre
sua eficcia.
8.6 EXERCICIOS
22)FARBER (2009, p.364) As distancias de frenagem de 8 Volks GTIS e 10 Ford Focus foram
testadas enquanto viajavam a 60 milhas por hora em pista seca. Os resultados so mostrados na
tabela. Voc pode concluir que existe diferena na mdia da distancia de frenagem dos dois tipos de
carro? Use =0,05 . Assuma que as populaes so distribuidas normalmente e as variancias da
populao no so iguais. R: rejeitar Ho
Estatistica amostral para a distancia de frenagem em pista molhada
GTI
FOCUS
Mdia da amostral:141 ps
Mdia da amostral:151 ps
n1=8
n2=10
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
30
23)Um fabricante esta desenvolvendo uma bateria de hidreto de nquel para telefones celulares em
substituio a baterias de nquel-cdmio diretor de controle de qualidade decide avaliar o
desempenho da bateria recentemente desenvolvida em relao amplamente utilizada bateria de
nquel-cdmio. Uma amostra aleatria de 25 baterias de cada tipo, so colocadas em telefones
celulares da mesma marca e modelo. A medida de desempenho de interesse o tempo de
conversao (em minutos), at que seja necessria a recarga.Os resultados so seguintes:
* colar antes no calc e depois no gnumeric
Bateria de niquel Bateria de hidreto
cadmio
de niquel
54,5
71
56,7
78,3
103
91,1
67,8
41,7
86,8
95,4
81,3
82,8
64,5
69,7
74,9
69,4
46,4
71,8
70,4
40,8
76,9
87,3
82,3
77,5
72,5
75,4
104,4 62,5
83,2
74,3
64,9
81
82
85
85,3
86,1
83,3
90,4
58,7
85,3
85,5
74,1
72,8
71,8
72,1
112,3
68,8
67
41,1
79,8
rejeitar Ho
2.CALC-LibreOffice
TESTET
Retorna a probabilidade associada ao Teste t de Student.
Sintaxe
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
RESULTADO 1:CALC
valor-p:
0,033711727
RESULTADO 2: GNUMERIC
Varivel 1 Varivel 2
Mdia
70,748
79,728
Varincia
195,788
226,030
Observaes
25
25
Correlao de Pearson
0,00911
Hiptese
de
Diferena
entre
Mdias
Diferena
0
entre
Mdias
Observada
8,98
417,985
df
24
t Stat
2,1962
31
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
P (T<=t) monocaudal
0,01899
t Crtico monocaudal
1,71088
P (T<=t) bicaudal
0,03798
32
t Crtico bicaudal
2,06390
O valor-p 0,03798 menor que o nvel de significncia de 0,05,portanto rejeita-se Ho ( ento as
medias so diferentes presumindo varincias iguais ).
0,03798
Teste-t:
presumindo
duas
amostras
varincias
diferentes
Varivel 1
Mdia
70,7480
Varincia
195,7884
Observaes
25,0000
Hiptese da diferena de
mdia
gl
Stat t
0,0000
48,0000
-2,1862
Varivel 2
79,7280
226,0296
25,0000
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
P(T<=t) uni-caudal
t crtico uni-caudal
P(T<=t) bi-caudal
t crtico bi-caudal
33
0,0169
1,6772
0,0337
2,0106
1 X
2 t S 2p
X
1 1
n1 n2
24) Uma agencia imobiliria deseja comparar os valores de avaliao de residncias uni familiares
em 2 comunidades no Condado de Nassau, Nova York. Uma amostra de 60 residncias em
Farmingdale e 99 residncias em Lewittown produz os seguintes resultados (milhares de dlares):
Farmingdale
Lewittown
Medias X
191,33
172,34
S ( desvio padro)
32,60
16,92
60
99
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
34
baseado
16,7
16,5
22,4
13,8
23,7
20,7
19,3
17,7
18,7
18
17,4
21,8
16,8
16,2
19,3
20,8
23,2
14,1
17,7
17,4
15,6
17,1
20,1
16,1
19,8
16,4
18
28,2
12,3
16,8
19,3
16,8
21,7
20,8
15,2
14,7
16
18,5
30,7
24,7
16
35
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
2
2
sejam s
e s representam as variancias de amostras de duas populaes.
1
2
2
1
2
2
so iguais ,
s2
1
F=
chamada de distribuio F.
s2
1
PROPRIEDADES
LEVINE (2005, p. )
Outra importante razo para testar a diferena entre as variancias de duas populaes
determinar se o teste t para variancia agrupada apropriado.
A estatistica do teste F segue uma distribuio F, com n1-1 e n2-1 graus de liberdade.
Para um dado nivel de significncia para testar hipotese nula de igualdade de variancias:
2
2
Ho: =
1
2
2
2
H1:
1
2
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
TABELA 1 Distribuio
rea =
= 0,05
F de Snedecor
= 0,05
F
(valor tabulado)
,45 0
1
8
6
9
7
8
4
8
18, 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40
51
10, 9,55
9,28
9,12
9,01
8,94
8,89
8,85
8,81
8,79
13
7,7 6,94
6,59
6,39
6,26
6,16
6,09
6,04
6,00
5,96
1
6,6 5,79
5,41
5,19
5,05
4,95
4,88
4,82
4,77
4,74
1
5,9 5,14
4,76
4,53
4,39
4,28
4,21
4,15
4,10
4,06
9
5,5 4,74
4,35
4,12
3,97
3,87
3,79
3,73
3,68
3,64
9
5,3 4,46
4,07
3,84
3,69
3,58
3,50
3,44
3,39
3,35
2
5,1 4,26
3,86
3,63
3,48
3,37
3,29
3,23
3,18
3,14
10
2
4,9 4,10
3,71
3,48
3,33
3,22
3,14
3,07
3,02
2,98
11
6
4,8 3,98
3,59
3,36
3,20
3,09
3,01
2,95
2,90
2,85
12
4
4,7 3,89
3,49
3,26
3,11
3,00
2,91
2,85
2,80
2,75
13
5
4,6 3,81
3,41
3,18
3,03
2,92
2,83
2,77
2,71
2,67
14
7
4,6 3,74
3,34
3,11
2,96
2,85
2,76
2,70
2,65
2,60
15
0
4,5 3,68
3,29
3,06
2,90
2,79
2,71
2,64
2,59
2,54
36
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
16
4,4 3,63
3,24
3,01
2,85
2,74
2,66
2,59
2,54
2,49
17
9
4,4 3,59
3,20
2,96
2,81
2,70
2,61
2,55
2,49
2,45
18
5
4,4 3,55
3,16
2,93
2,77
2,66
2,58
2,51
2,46
2,41
19
1
4,3 3,52
3,13
2,90
2,74
2,63
2,54
2,48
2,42
2,38
20
8
4,3 3,49
3,10
2,87
2,71
2,60
2,51
2,45
2,39
2,35
21
5
4,3 3,47
3,07
2,84
2,68
2,57
2,49
2,42
2,37
2,32
22
2
4,3 3,44
3,05
2,82
2,66
2,55
2,46
2,40
2,34
2,30
23
0
4,2 3,42
3,03
2,80
2,64
2,53
2,44
2,37
2,32
2,27
24
8
4,2 3,40
3,01
2,78
2,62
2,51
2,42
2,36
2,30
2,25
25
6
4,2 3,39
2,99
2,76
2,60
2,49
2,40
2,34
2,28
2,24
26
4
4,2 3,37
2,98
2,74
2,59
2,47
2,39
2,32
2,27
2,22
27
3
4,2 3,35
2,96
2,73
2,57
2,46
2,37
2,31
2,25
2,20
28
1
4,2 3,34
2,95
2,71
2,56
2,45
2,36
2,29
2,24
2,19
29
0
4,1 3,33
2,93
2,70
2,55
2,43
2,35
2,28
2,22
2,18
30
8
4,1 3,32
2,92
2,69
2,53
2,42
2,33
2,27
2,21
2,16
35
7
4,1 3,27
2,87
2,64
2,49
2,37
2,29
2,22
2,16
2,11
40
2
4,0 3,23
2,84
2,61
2,45
2,34
2,25
2,18
2,12
2,08
45
8
4,0 3,20
2,81
2,58
2,42
2,31
2,22
2,15
2,10
2,05
50
6
4,0 3,18
2,79
2,56
2,40
2,29
2,20
2,13
2,07
2,03
37
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
3
3,9 3,09
100
2,70
2,46
2,31
2,19
2,10
2,03
1,97
1,9
4
Fonte: www.inf.ufsc.br/~ogliari/arquivos/Tabelas.do
Fi= 1/Fs
,n1-1,n2-1) bicaudal
2
exemplos :
Fi=1/4,03 = 0,248
8.7.1 Exercicios
26) MONTGOMERY (2003), para uma distribuio F , calcule o seguinte :
a) F0,25,5,10= 1,59 unicaudal
(bicaudal divide o alfa por dois) F (0,125,5,10)= FSuperior = 2,2820 Finferior=
b) F0,10,24,9=
c) F0,05,8,15=
respostas:1,59; 2,29;1,64;0,529
d) F 0,75,5,10=
1
=0,4382
2,2820
38
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
39
27) Duas companhias quimicas podem fornecer uma materia prima , cuja concentrao de um
determinado elemento importante. A concentrao media para ambos os fornecedores a mesma,
porem suspeitamos de que a variabilidade na concentrao pode diferir entre duas companhias. O
desvio padro da concentrao em uma amostra aleatoria de n 1=10 bateladas produzidas pela
companhia 1 s1=4,7g/l, enquanto para a companhia 2, uma amostra aleatoria de n 2=16 bateladas
resulta em s2=5,8 g/l. H evidencias suficiente para concluir que as varincias das duas populaes
difiram? Use : =0,05
F Test for Differences in Two
Variances
Data
Level of Significance
Population 1 Sample
Sample Size
Sample Standard Deviation
Population 2 Sample
Sample Size
Sample Standard Deviation
0,05
10
4,7
16
5,8
Intermediate Calculations
F-Test Statistic
0,656659
Population 1 Sample Degrees of
Freedom
9
Population 2 Sample Degrees of
Freedom
15
Two-Tailed Test
Lower Critical Value
Upper Critical Value
p-Value
Do not reject the null hypothesis
0,265297
3,122707
0,531163
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
40
28) LEVINE (2005), a diretora de treinamento de uma empresa que produz equipamentos
eletronicos esta interessada em determinar se diferentes metodos de treinamento possuem algum
efeito sobre a produtividade de empregados, da linha de produo. Ela designa 42 empregados
recentemente contratados, para dois grupos com 21 empregados. O primeiro grupo recebe um
programa de treinamento individual, assistido por computador de uso pessoal , e outro recebe um
programa de treinamento baseado em equipes. Ao trmino do treinamento, os empregados so
avaliados em relao ao tempo ( em segundos) necessrio para que seja montada uma pea.
baseado
16,7
16,5
22,4
13,8
23,7
20,7
19,3
17,7
18,7
18
17,4
21,8
16,8
16,2
19,3
20,8
23,2
14,1
17,7
17,4
15,6
17,1
20,1
16,1
19,8
16,4
18
28,2
12,3
16,8
19,3
16,8
21,7
20,8
15,2
14,7
16
18,5
30,7
24,7
16
TESTEF
Retorna o resultado de um teste F.
Sintaxe
TESTEF(Dados1; Dados2)
Dados1 a primeira matriz de registros.
Dados2 a segunda matriz de registros.
Exemplo
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
41
0,05
21
1,9333
21
4,5767
Intermediate Calculations
F-Test Statistic
0,178441
Population 1 Sample Degrees of
Freedom
20
Population 2 Sample Degrees of 20
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
42
Freedom
Two-Tailed Test
Lower Critical Value
Upper Critical Value
p-Value
Reject the null hypothesis
0,405764
2,464489
0,000311
b) com base nos resultados obtidos em (a), apropriado utilizar o teste t para variancia agrupada
para comparar mdias aritmticas dos dois grupos?
8.8 COMPARANDO DUAS AMOSTRAS RELACIONADAS ( EMPARELHADAS): TESTE t
PARA A DIFERENA ENTRE MDIAS ARITMTICAS-amostras dependentes
LEVINE (2005, p. )Existem uma dependncia entre os grupos devido ao fato dos itens
serem colocados em pares, ou combinados , de acordo com alguma caracterstica, ou em
virtude de as medies repetidas serem obtidas a partir de um mesmo conjunto de itens.
Os itens ou indivduos iro se comportar de uma mesma maneira, caso sejam tratados da
mesma forma, o objetivo da analise demonstrar que: quaisquer diferenas entre duas
medidas dos mesmos itens resultam de diferentes condies de tratamento.
simbolo
descrio
43
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
sd
sd =
n1
t=
d u d
Sd
Embora a populao seja assumida como normalmente distribuda, na pratica foi descoberto
que,
Para testar a hiptese nula de que no existe nenhuma diferena entre duas medias
aritmticas de 2 populaes relacionadas ( a diferena na media aritmtica das
populaes,d zero):
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
44
SD
mD
D
sD
8.8.1 Exercicios
29)Um desenho experimental para um teste t de medies repetidas necessita de uma medio
anterior e uma medio posterior a apresentao de estmulos em cada um dos 15 sujeitos. Quantos
graus de liberdade existem neste teste t?
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
45
30) Um professor de uma escola de negcios deseja investigar os preos de novos livros na livraria
do campus e em uma livraria concorrente fora do campus, filial de uma cadeia nacional de livrarias.
O prof. escolhe aleatoriamente os livros solicitados em 12 cursos de escolas de negcios e compara
os preos nas duas livrarias:
preos
Livros
Livraria
1
2
3
4
5
6
7
8
9
10
11
12
campus
55
47,5
50,5
38,95
58,7
49,9
39,95
41,5
42,25
44,95
45,95
56,95
do Livraria fora do
campus
50,95
45,75
50,95
38,50
56,25
45,95
40,25
39,95
43
42,25
44
55,60
a) a nvel de significncia de 0,01 existem evidencias de uma diferena entre a mdia aritmtica do
preo de livros de negcios nas duas livrarias.
Teste-t: duas amostras em
par para mdias
Varivel
Mdia
Varincia
Observaes
Correlao de Pearson
Hiptese da diferena de
mdia
gl
Stat t
P(T<=t) uni-caudal
t crtico uni-caudal
P(T<=t) bi-caudal
t crtico bi-caudal
Varivel 1
47,6750
44,3598
12,0000
0,9730
0,0000
11,0000
3,3653
0,0032
2,7181
0,0063
3,1058
2
46,1167
36,2824
12,0000
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
46
Resposta: como o valor -p no teste bicaudal 0,0063 menor que o nivel de significancia de 0,01,
ento rejeita-se Ho de que existe uma diferena entre as mdias.
rejeitar Ho:uD =0 ( onde u D =u1 u2 )
B)encontre o valor de p em (a) e interprete seu significado.
Valor p=0,0063
c) construa um intervalo de confiana 99% da diferena na mdia de preos entre duas livrarias.
8.9 TESTE DA SOMA DE CLASSIFICAES DE WILCOXON PARA DIFERENAS ENTRE
DUAS MEDIANAS
FARBER (2009,
Caso os tamanhos das amostras sejam pequenos e no deseje avaliar a premissa de que os
dados em cada grupo seja extraidos de populaes normalmente distribuidas, tem duas
opes:
combinadas.
47
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
Verificando
classificaes
T 1 +T 2 =
Grandes amostras:
estatistica do teste T1
Media aritmtica T =
n1 n+1
2
desvio padro
T =
1
Estatistica do teste Z
Z=
T 1 T
T
n 1 n 2 n+1
12
Ho: M1=M2
H1: M1M2
Ho: M1M2
H1:M1<M2
Teste unicaudal-superior
Ho: M1 M2
H1:M1 > M2
a mdia aritmtica da
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
48
8.9.1 Exercicios
31) Realize o teste da soma de classificaes de Wilcoxon.
Amostra A
22
34
52
62
30
40
64
84
56
59
Amostra B
52
71
76
54
67
83
66
90
77
84
32) As informaes disponiveis para duas amostras extraidas a partir de populaes independentes:
amostra 1: n1=7
classificaes : 4,1,8,2,5,10,11
amostra 2: n2=9
classificaes : 7,16,12,9,3,14,13,6,15
qual o valor da estatistica do teste T 1, se voce estiver testando a hipotese nula, de igualdade entre
as medianas das populaes.
Resposta: 41
33) Um fabricante esta desenvolvendo uma bateria de hidreto de nquel para telefones celulares em
substituio a baterias de nquel-cdmio diretor de controle de qualidade decide avaliar o
desempenho da bateria recentemente desenvolvida em relao amplamente utilizada bateria de
nquel-cdmio. Uma amostra aleatria de 25 baterias de cada tipo, so colocadas em telefones
celulares da mesma marca e modelo. A medida de desempenho de interesse o tempo de
conversao (em minutos), at que seja necessria a recarga.Os resultados so seguinte:
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
Bateria
de
49
cadmio
niquel
54,5
71
56,7
78,3
103
91,1
67,8
41,7
86,8
95,4
81,3
82,8
64,5
69,7
74,9
69,4
46,4
71,8
70,4
40,8
76,9
87,3
82,3
77,5
72,5
75,4
104,4
62,5
83,2
74,3
64,9
81
82
85
85,3
86,1
83,3
90,4
58,7
85,3
85,5
74,1
72,8
71,8
72,1
112,3
68,8
67
41,1
79,8
a) Utilizando um nivel de significancia de 0,05 , existem de uma diferena entre os dois tipos de
baterias em termos de mediana do tempo de conversao ( em minutos) at que seja necessaria a
recarga ?
Wilcoxon Rank Sum
Test
Data
Level of Significance
Population 1 Sample
Sample Size
Sum of Ranks
Population 2 Sample
Sample Size
Sum of Ranks
0,05
25
502,5
25
772,5
Intermediate Calculations
Total Sample Size n
50
T1 Test Statistic
502,5
T1 Mean
637,5
Standard Error of T1
51,53882
Z Test Statistic
-2,61938
Two-Tailed Test
Lower Critical Value
Upper Critical Value
-1,95996
1,959963
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
p-value
Reject
50
0,008809
the
null
hypothesis
Rejeitamos que as medianas das duas populaes so iguais.
b)Que premissas devem ser adotadas em (a)?
c) compare os resultados obtidos no problema 4 para as variancias iguais.
RESUMO
TESTE t para diferena entre duas medias
TESTE F para diferena entre as varincias
TESTE de Wilcoxon para a diferena entre as medianas.
CAPITULO 9
9 ANLISE DA VARINCIA
9.1 O MODELO COMPLETAMENTE ALEATORIO :ANALISE DA VARIANCIA DE FATOR
NICO
Para LEVINE (2005, p.390),algumas aplicaes que envolvem experimentos podem ser
consideradososgruposounveispertencentesasomenteumfatordeinteresse.
Fator:temperaturadecozimento(podepossuirvriosnveisnumricos:300,350,400e
450grauscentigrados).
TESTEFPARADIFERENASENTREDUASMDIASARITMTICAS
medidasnumricassocontinuas;
metodologiausadaAnalisedaVarincia(ANOVA);
oobjetivoanalisardiferenasentreasmdiasaritmticasdosgrupos;
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
51
atravsdaanaliseda variaodosdados,forneceentreosgruposedentrodosprprios
grupos;
avariaodosgruposconsideradaerroexperimental;
avariaoentreosgruposoefeitodostratamentos.
c=numerodegrupos.
Admitesequeos(c)grupossejamextradasdemaneiraaleatriaeindependente,segueuma
distribuionormalevarinciaiguais.
Otestedehiptese:
Ho:1=2=...=c(noexistediferenaentreasmdiasdaspopulaes)
admitindosequeos(c)gruposrepresentamaspopulaes,
cujasmedidassoextradasdemaneiraaleatriaeindependente,
seguemumadistribuionormal,
epossuemvarinciasiguais,
H1:nemtodasasjsoiguais(ondej=1,2..c)
testadaemrelaohiptesealternativadequenemtodasascmdiasdaspopulaesso
iguais.
A variao total soma total dos quadrados (STQ), obtido atravs da soma das
diferenasaoquadradoentrecadaobservaoesuamediageral(somatodasasobservaes
emtodososgruposcombinados).
c
nj
Asomadosquadradosentreosgrupos(SQE),medidaatravsdasomadadiferenaaoquadrado
entreamediadecadaamostraeamediageral.
c
SQE= n j X j X nj=numerodeobservaesnogrupoounivelj
j=1
Avariaodentrodogrupo, comoasomadosquadradosdentrodosgrupos(SQD),medea
diferenaentrecadaobservaoeamediadeseuprpriogrupo.
c
nj
SQD= X ij X
j=1 i=1
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
52
Obtendoosquadradosdamediaaritmtica:
MQE=
SQE
SQD
STQ
MQD=
MTQ=
c1
nc
n1
c=numerodegruposn=numerototaldeamostras
MQE=MEDIADOSQUADRADOSENTREOSGRUPOS
MQD=MEDIADOSQUADRADOSDENTRODOSGRUPOS
MTQ=MEDIATOTALDOSQUADRADOS
SQE=VARIAOENTREOSGRUPOS
SQD=VARIAODENTRODOGRUPO
STQ=VARIAOTOTAL
AestatisticadotesteFAnovadefatornico
F=
MQE
MQD
RejeitarHOseF>Fs
tabelaresumidadaanalisedavarincia
Fonte
Grausde
liberdade
Somados
quadrados
Quadrados
damdia
arimtica
(variancia)
Entreosgrupos c1
SQE
MQE
Dentrodos
grupos
nc
SQD
MQD
total
n1
STQ
F(valorcriticodeFs)
INVF(,c1;nc)unicaudal
F=
MQE
MQD
RejeitarHOseF>Fs
FS
9.2 EXERCICIOS
34)Resistncia trao de paraquedas fabricados com fibras sintticas, obtidas atravs de 4
fornecedores.Verificarsetemdiferenaentreasmdias.=0,05
*Fatornicotestararesistnciaatrao.
PARACOLARNOGNUMERIC
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
COLEANTESNOCALC
tools/analiseestatstica/anova/fatornico
53
F1
F2
F3
F4
18,5
26,3
20,6
25,4
24
25,3
25,2
19,9
17,2
24
20,8
22,6
19,9
21,2
24,7
17,5
18
24,5
22,9
20,4
Anova:fatornico
RESUMO
Conta
Grupo
gem
Soma
Mdia
Coluna1
5
97,6
19,52
Coluna2
5
121,3
24,26
Coluna3
5
114,2
22,84
Coluna4
5
105,8
21,16
ANOVA
Fontedavaria
o
SQ
gl
MQ
Entregrupos
63,2855
3 21,0952
Dentrodosgru
pos
97,504
16
6,094
Total
160,7895
19
*MQ ou MS = mdia dos quadrados dentro dos
Varin
cia
7,237
3,683
4,553
8,903
F
valorP Fcrtico
3,4616 0,0414
3,2389
grupos
Concluso:
OvalordeFcalculado=3,4616>Fcritico=3,2389ouvalorp0,0414menorqueonivelde
significanciade0,05.
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
54
rejeitasedequeasmediassotodasiguais,sendoquepelomenosumamediadiferente
dasdemais
LEVINE(2005,p.399),quandohevidenciasdequeexistemmediasdiferentespelomenos
uma,utilizaseoprocedimentodeTUKEY,desenvolvidoporJohnTukey.
Esteprocedimento TukeyKramerexaminasimultaneamentecomparaesentretodosos
paresdegrupos.
Oprimeiropassocalcularasdiferenasentretodososparesdemdiaaritmticas.
ObtendoointervalocriticoparaoprocedimentodeTukeyKramer
Intervalocritico= Qs
MQD 1
1
2
n j n' j
nj:nmerodeobservaesdogrupoj.
n'j:nmeroderplicasdecadagrupo.
ondeQS ovalorcritico dacauda superior apartir da distribuio deintervalos deStudent,
possuindo(c)grausdeliberdadenonumeradore(nc)grausdeliberdadenodenominador.
Intervalocrtico:
Qs
MQD 1
1
2
n j n' j
erropadrodadiferena
MQD 1
2
nj
n '
j
SQD:variaodentrodogrupo.
MQD=
SQD
nc
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
MQD:quadradodamdiaaritmticadentrodosgrupos.
n:tamanhototaldasamostras.
c:numerodegrupos
55
EstatisticaQdestudentusaratabelan1=4en2=16grausdeliberdade
Casoumadiferenadamdiaemvalorabsolutosejamaiorqueovalorcrticoexistemuma
diferenaentreostratamentosouporexemplofornecedor1efornecedor2.
PREMISSASDEANOVA
aleatoriedadeeindependenciaosdadossejamextraidosdeformaaleatoriaeindependente.
Normalidadeextraidosdepopulaesdistribuidasdeformanormal.
Homogeneidadedavarianciaafirmaqueavarianciadentrodecadapopulaodeveserigual
paratodasaspopulaes.
9.4 EXERCICIOS
35)Conformeexerccioanteriorverificarquaisdosfornecedoressodiferentes,quantoasmedias?
Fornecedor 1 Fornecedor 2 Fornecedor 3 Fornecedor 4
18,5
26,3
20,6
25,4
24
25,3
25,2
19,9
17,2
24
20,8
22,6
19,9
21,2
24,7
17,5
18
24,5
22,9
20,4
Resposta:fornecedor1e2.
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
56
Tipodereceita
A
94
88
76
82
100
89
69
80
90
88
76
82
97
83
79
78
101
79
80
89
90
82
72
80
a)nvelde0,05verifiqueseexistediferenaentreasmdiasdotempodepermanncia?
resposta:rejeitarHo
b)determinequaisosgruposdiferememrelaoamdiadotempodepermanncianaprateleira.
Resposta:grupos1e2;1e3;1e4;2e3;2e4;3e4
Procedimento de Tukey-Kramer
Mdia
da Amostra
Grupos
95,3333
84,8333
75,3333
81,8333
1
2
3
4
Outros Dados
Nvel de Significncia
g.l. numerador ( c )
g.l. denominador
MQD-quadrado da media dentro dos grupos
Estatstica Q
Tamanho
da Amostra
6
6
6
6
Comparao
Grupo 1 com Grupo 2
Grupo 1 com Grupo 3
Grupo 1 com Grupo 4
Grupo 2 com Grupo 3
Grupo 2 com Grupo 4
Grupo 3 com grupo 4
Diferena
intervalo ou
Absoluta Erro Padro Amplitude
mdias
da Diferena
Crtica Resultados
10,5000
1,728034
6,84301 Mdias so diferentes
20,0000
1,728034
6,84301 Mdias so diferentes
13,5000
1,728034
6,84301 Mdias so diferentes
9,5000
1,728034
6,84301 Mdias so diferentes
3,0000
1,728034
6,84301 Mdias so diferentes
6,5000
1,728034
6,84301 Mdias so diferentes
0,05
4
20
17,9166
3,96
Pagina 796
nj
nj'
MQD
nj
n '
j
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
57
Omodelofatorialdefatorduplo,emquedoisfatoressosimultaneamenteavaliadoseum
numeroigualderepeties(n')
ParaosfatoresAeBpossuemumainteraoseoefeitoqueofatorApossuisobreas
medidasnumericasfordependentedoniveldofatorB.
OprocedimentoANOVA,conhecidoANOVAFATORDUPLOostermossodefinidos:
l=numerodeniveisdofatorA
c=nmerodeniveisdofatorB.
n'=numerodevalores(rplicas)paracadaclula(combinaodeumdeterminado
nveldofatorAcomumdeterminadonveldofatorB)
n=numerototaldeobservaesnaexperiencia(onden=lcn')
Xijk=valorksimaobservaoparaonvelifatorAenveljdofatorB.
X =mdiageralougrandemdia(somatodososvaloresedividepelototal)
X i =mdiaaritmticadecadaniveldofatorA(mdiageraldenivelderepetio)
X j =mdiadecadacoluna(fatorB)
REPARTINDOAVARIAOTOTAL
STQ=SQA+SQB+SQAB+SQR(residuo)
ANOVADEFATORDUPLOTEMTRESTESTESDISTINTOSPARASEREMREALIZADOS:
FATORA(linhas)
HO:todasasmediassoiguais
H1:nemtodasasmediassoiguais
FATORB(colunas)
HO:todasasmediassoiguais
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
58
H1:nemtodasasmediassoiguais
INTERAOENTREOSFATORESAEB
Ho:ainteraodeAeBigualazero
H1:ainteraodeAeBnoigualazero
Parainterpretarosresultados,iniciasetestandooefeitodeinteraoentreofatorAeB,casoesse
efeitonosejasignificativoofocoseconcentraranosefeitosprincipaisFatorAeFatorB.
Interpretandoefeitosdeinterao
Paraumamelhorcompreensodoconceitodeinterao,construir umgraficoem
linhasdasmediasdosniveisdecadagrupo.
CasoaslinhassejamparalelasnoexisteumainteraoentreosfatoresAeB.
9.6 EXERCICIOS
37)Resistnciatraodospraquedastecidospordoistiposdeteares.Apartirdefibrassintticas
oriundasde4fornecedores.Faaumaanlisedavarinciadefatorduplo.
fornecedor
teares
jetta
20,6
22,6
27,7
21,5
jetta
18,9
24,6
18,6
20
jetta
19
19,6
20,8
21,1
jetta
21,3
23,8
25,1
23,9
jetta
13,2
27,1
17,7
16
turk
18,5
26,3
20,6
25,6
turk
24
25,3
25,2
19,9
turk
17,2
24
20,8
22,6
turk
19,9
21,2
24,7
17,5
turk
18
24,5
22,9
20,4
a)aonivelde5%,existeumainteraoentreosdoistiposdeteares?
INTERAOENTREOSFATORESAEB
Resposta:
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
59
aceitarHo,indicaqueadiferenaentreasmediasderesistenciasatraoaosdoistearesso
virtualmenteiguaisparaos4fornecedores.
CasoaslinhassejamparalelasnoexisteumainteraoentreosfatoresAeB.
15
10
5
0
F1
F2
F3
F4
4 fornecedores
b)nonivelde0,05,existeumefeitodevidoaos4fornecedores?
FATORB(colunas)
Resposta:rejeitarHo,existemevidenciasdeumadiferenaentreos4fornecedores,emtermosde
mediadaresistenciaatraodosparaquedas.
c)noniveldesignificanciade0,05,existeumefeitodevidoaosdoistiposdeteares?
FATORA(linhas)
resposta:aceitarHo,noexistediferenaentreosdoistiposdeteares.
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
60
5,0000
5,0000
5,0000
4 Total
jetta
Contagem
5,0000
20,0000
Soma
Mdia
18,6000
23,5400
21,9800
20,5000
21,1550
Varincia
10,1750
7,5680
18,3970
8,3550
12,8742
turk
Contagem
Soma
Mdia
Varincia
5,0000
5,0000
5,0000
5,0000 20,0000
97,6000 121,3000 114,2000 106,0000 439,1000
19,5200 24,2600 22,8400 21,2000 21,9550
7,2370
3,6830
4,5530
9,3350
8,5373
Total
Contagem
Soma
Mdia
Varincia
ANOVA
Fonte da variao
Amostra
Colunas
Interaes
Dentro
SQ
6,4000
129,5210
0,0860
277,2120
gl
1,0000
3,0000
3,0000
32,0000
Total
413,2190
39,0000
MQ
6,4000
43,1737
0,0287
8,6629
F
0,7388
4,9838
0,0033
valor-P
F crtico
0,3964
4,1491
0,0060
2,9011
0,9997
2,9011
EmLEVINE(2005),otestedeclassificaesdeKruskalWallisparaadiferenasentrec
medianas(c>2),
utilizadocommuitafrequenciaparatestarsecgruposdeamostrasindependentesforam
extraidosdepopulaesquepossuemmedianasiguais.
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
61
TESTEDEHIPOTESES
hipotesenula
Ho:M1=M2=...=MC
Hipotese alternativa
AestatsticadotestedeKruskalWallisparadiferenasemcmedianas
H=
12
n n+1
T 2j
j=1
nj
3 n+1
onde:
n=nmerototaldeobservaesaolongodasamostrascombinadas.
nj=nmerodeobservaesnajsimaamostra(j=1,2,..,c)
Tj=somadasclassificaesdesignadasjsimaamostra.
T 2j =quadradodasomadasclassificaesdesignadasjsimaamostra.
PREMISSASDOTESTEDEKRUSKALWALLIS
I. Ascamostrassoaleatriaseindependentementeextradasdesuasrespectivaspopulaes.
II. Avarivelcontinua(evitaigualdade)
III. Osdadosobservadosconstituemnomnimoumconjuntodeclassificaes,tantodentro
quantoentreascamostras.
IV. Ascpopulaespossuemamesmavariabilidade
V. Ascpopulaespossuemomesmoformato
Paraobterovalorcriticocaudasuperior:
INV.QUI(ALFA,GRAUSDELIBERDADE)TESTEQUIQUADRADO
9.8 EXERCICIOS
39)Umpsiclogodotrabalhodesejatestarseostemposderespostadetrabalhadoresdelinhasde
montagemsoequivalentessobtrsdiferentesmtodosdeaprendizagem.Apartirdeumgrupode
25empregadosrecentementecontratados,9foramaleatoriamentedesignadosparaomtodoA,8
paraomtodoBe8paraomtodoC.Apsoperododeaprendizagem,foiatribudaumatarefaa
62
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
cadafuncionrioemedidosseustemposderesposta.Atabelaaseguirapresentaasclassificaes
dostemposderespostas,desde1(maisrpido)at25(maislento):
A)existemevidenciasdeumadiferenasignificativaentreamedianadostemposderespostaem
relaoaestesmtodosdeaprendizagem?=0,01
Metodo A
Metodo B
Metodo C
11
15
12
10
16
13
14
17
18
19
21
24
20
22
25
23
DECISO:aceitaseahiptesenuladequeasmedianassoiguais.
Teste de Classificaes de Kruskal-Wallis
hiptese nula Ho: M1=M2=...=MC
hiptese alternativa H1: nem todas as medianas so iguais.
Entre com o
nivel de
significancia
Dados
Nvel de Significncia
0,01
Grupo 1
Soma de Classificaes
Tamanho da Amostra
104
9
Grupo 2
Soma de Classificaes
Tamanho da Amostra
106
8
Grupo 3
Soma de Classificaes
Tamanho da Amostra
115
8
Grupo 4
Soma de Classificaes
Tamanho da Amostra
0
0
Clculos Intermedirios
Soma das Classificaes ao Quadrado/Tamanho da Amostra
Soma de Tamanhos de Amostras
Nmero de grupos
Estatstica do Teste H
4259,4
25
3
0,64
Resultado do Teste
Valor Crtico
Valor-p
9,21
0,7279
No rejeitar a hiptese nula
Digite o numero
de grupos
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
63
CAPITULO 10
10 TESTES PARA DUAS AMOSTRAS COM DADOS CATEGORICOS
10-1:TESTE Z PARA DIFERENA ENTRE DUAS PROPORES
ParaLEVINE(2005,p.433),comparareanalisardiferenasentreduaspopulaesem
termosdeumavarivelcategrica.
Umtesteparaadiferenaentreduaspropores,obtidasapartirdeamostrassoobtidasa
partirdeamostrasindependentes
AestatsticadotesteZaproximadaatravsdeumdistribuionormalpadronizada.
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
64
Avaliardiferenasentreduaspropores,baseandoseemamostrasindependentes,utiliza
seumTesteZ,
com uma distribuio normal padronizada paratamanhos deamostras suficientementes
grandes.
EstaestatsticadotesteZdeterminaadiferenaentreduasproporesdepopulaes,e
baseadanadiferenaentreduaspropores(pa1pa2).
AestatsticadotesteZtemaseguinteequao:
Z=
p a1pa2 p1p 2
p 1p
1 1
n1 n2
com: p=
X 1 X 2
n1 n2
p a1=
X1
n1
p a2=
X2
n2
pa1=proporodesucessosnaamostra1
X1=numerodesucessosnaamostra1
n1=tamanhodaamostra1
p1=proporodesucessosnapopulao1
pa2=proporodesucessosnaamostra2
X2=numerodesucessosnaamostra2
n2=tamanhodaamostra2
p2=proporodesucessosnapopulao2.
Testedehiptese(bicaudal)
p1=proporodesucessosnapopulao1.
P2=proporodesucessosnapopulao2.
Ho:p1=p2
H1:p1p2
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
pa1 p a2 Z p 1- p
p=
X 1 X 2
n1 n2
p a1=
X1
n1
65
1 1
n1 n2
p a2=
X2
n2
particulas
320
14
80
36
400
50
334
216
450
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
66
pa1 p a2 Z p 1- p
1 1
n1 n2
n1=50X1=14pa1=14/50n2=50X2=36pa2=36/50p=50/100
Resultado1:[0,636;0,244]noestincluidoozeronointervalo,porissorejeitaseHo
42)Assumaquen1=100X1=45,n2=50eX2=25.
a)noniveldesignificanciade0,01,existemevidenciasdeumdiferenasignificativaentreas
proporesdesucessosnogrupo1egrupo2?
b)construaumaestimativadeintervalodeconfianade99%dadiferenaentreasduaspropores.
Nasecoanteriorfoicomparardiretamenteproporesemtermosdesucesso.
Umprocedimentocujaestatsticadotesteaproximadaatravsdeumadistribuioqui
quadrado,com1graudeliberdade.
TABELADECONTINGNCIA
Varivel da coluna ( grupo)
Variveis da linha 1
totais
sucessos
X1
X2
insucessos
n1-X1
n2-X2
n-X
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
totais
n1
n2
67
TESTEQUIQUADRADOPARAADIFERENAENTREDUASPROPORES
Aestatsticadotestequiquadradoigualadiferenaaoquadradoentreasfrequncias
observadaeesperadadivididapelafrequnciaesperadaemcadaceluladatabelasomadaao
longodetodasascelulasdatabela:
(f o f e ) 2
fe
todas as celulas
2
fo=freqnciaobservada,emumdeterminadacluladeumatabeladecontingncia2x2
fe=freqnciaesperadaouterica,eumadeterminadaclula,seahiptesenulaforverdadeira.
f e=
TESTEDEHIPTESE
Ho:p1=p2(noexistenenhumadiferenaentreduasproporesdepopulao)
H1:p1p2(existeumadiferenaentreasduasproporesdepopulao)
Aregradedecisaoilustradapelafigura:
INV.QUI(0,05;1)=0,05en=1graudeliberdade
Verificandoaspremissascomrelaoaumatabela2x2:
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
68
Paraqueotesteoferearesultadosprecisosparaumatabela2x2,assumidoquecadafreqncia
esperadasejapelomenosiguala5.
10.2.1Exercicios
43)LEVINE(2005,p.446)OTheNewYorkdivulgouumestudorealizadopelaHenryJ.Kaiser
FamilyFoundation,comrelaoaopapeldosmeiosdecomunicaonavidadascrianas.Emuma
dasquestesdoestudo,foiperguntadoascrianasseelasutilizamumcomputadortodososdias.Os
resultadosencontramseresumidosnaseguintetabeladecontingncia:
Utiliza computador todos os dias
idade
sim
nao
02 ate 7 anos
283
807
08 ate 18 anos
1053
1012
total
total
a)aoniveldesignificanciade0,05,existeumadiferenasignificativaentreasduasfaixasetrias,
noquedizrespeitoaproporodecrianasquefazemusodocomputadortodososdias?
Soluo:
TESTEDEHIPTESE
Ho:p1=p2(noexistenenhumadiferenaentreduasproporesdepopulao)
H1:p1p2(existeumadiferenaentreasduasproporesdepopulao)
GNUMERIC
Test of Homogeneity
Test Statistic:
Degrees of
Freedom:
183,066
1
p-Value:
1,0E41
Critical Value:
3,84146
DECISO: como o valor-p 1*10 -41 menor que 0,05 rejeita-se Ho, ento existe uma diferena nas
propores das duas faixas etrias.
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
69
Otestequiquadradopodeserestendidoparaocasogeral,noqualexistemduasoumais
populaesindependentes.
Testedehipteses
Ho:p1=p2=...=pc
H1:nemtodaspjsoiguais,ondej=1,2,...,c
Verificandoaspremissasemrelaoaumatabela2xc
Todasasfrequenciastemquesergrandes
Frequenciasesperadasforemiguaisoumaioresque0,5.
Ou
Nomaisque20%dasclulascontenhamfrequenciasesperadasinferioresa5enenhuma
clulapossuafrequenciaesperadainferiora1.
Paraterumequilibriorazovelquecadafrequenciaesperadasejapelomenosiguala1.
Suposiesdealgunsestatsticos.
10.3.1Exercicios
44)Umacadeiadelanchonetesdesejadeterminarseexistemquaisquerdiferenasentreosmeiosde
comunicao(revista,tv,radio),emtermosdoconsumidorviraserecordardeumapropaganda.
Osresultadosdeumestudoemrelaoapropagandasoosseguintes:
Meios de comunicao
Capacidade de recordao
revista tv
rdio total
25
10
93
108
total
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
70
a)Aoniveldesignificnciade0,05,determineseexistemevidnciadeumefeitosignificativode
ummeiodecomunicaocomrelaoproporodeindivduosquepodemserecordardeuma
propaganda.
Testedehipteses
Ho:p1=p2=...=pc
H1:nemtodaspjsoiguais,ondej=1,2,...,c
Test of Homogeneity
Test Statistic:
Degrees of
Freedom:
19,0222
2
p-Value:
7,4E05
Critical Value:
5,99146
deciso:comovalorpmenorque0,05entorejeitaseHo.
b)Qualseriaasuarespostapara(a),se17entreos115indivduosqueouviramapropagandano
radiopudessemserecordardela?
10.4 TESTE QUI-QUADRADO PARA A INDEPENDNCIA
Notestequiquadradoparadiferenasentremaisdeduasproporesfoiavaliardiferenas
potenciaisentreaproporodesucessosemqualquernmerodepopulaes.
Ostestequiquadradopodesergeneralizadocomoumtestedeindependncia.
H1:asduasvariveiscategricassodependentes(existeumarelaoentreelas)
Verificandoaspremissasemrelaoaumatabelalxc:
Garantidosresultadosprecisos
Todasasfrequnciasesperadassejamgrandes.
10.4.5 Exercicios
71
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
45)LEVINE(2005,p.458)Umagrandecorporaoestainteressadaemdeterminarseexistealguma
associaoentreotempodetransportedeseusempregadoseoniveldeproblemasrelacionadosao
estressenotrabalho.Umestudorelativoa116trabalhadoresdalinhadeproduorevelaoseguinte:
ESTRESSE
Tempo
transporte
Abaixo
minutos
de
15 45 minutos
Acima de
minutos
de alto
moderado
baixo
15 9
18
17
28
45 18
total
a)noniveldesignificanciade0,01,existemevidenciasdeumarelaosignificativaentreotempo
detransporteeoestresse?
Test of Independence
Test Statistic:
Degrees of
Freedom:
9,83114
4
p-Value:
0,04337
Critical Value:
13,2767
deciso:existeumrelaosignificativaentreotempodetransporteeoestresse,istoaceitaseHo.
b)qualseriasuarespostapara(a)seoniveldesignificanciade0,05tivessesidoutilizado?
Resposta:rejeitaseHo.
46)DuranteaguerradoVietn,umsistemadeloteriafoiinstitudoparaescolherhomensaserem
requisitadosparaoserviomilitar.Osnmeros,representandodiasdoano,foramaleatoriamente
selecionados;homensnascidosnosdiasdoanocomnmerosbaixoseramconvocadosemprimeiro
72
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
lugar; aqueles com nmeros mais elevados no eram convocados. Os dados a seguir mostram
quantosnmerosbaixos(1122),mdios(122244)ealtos(245366)foramextradosparadatasde
nascimentoemcadatrimestredoano.
trimestres
Conjunto de numeros
baixo
21
28
35
38
122
mdio
34
22
29
37
122
alto
36
41
28
17
122
total
91
91
92
92
366
a)Existemevidnciasdequeosnmerosextradoseramsignificativamenterelacionadospocado
ano? =0,05
b)Quaisseriarespostaem(a)seasfrequenciasfossem:
trimestres
Conjunto de numeros jan-mar abr-jun jul-set out-dez total
baixo
23
30
32
37
122
mdio
27
30
34
31
122
alto
41
31
26
24
122
total
91
91
92
92
366
47) WITTE (2005, p.379) Alunos so classificados de acordo com sua preferencia religiosa
( budista, judaica, protestante, catolica romana ou outras) e afiliao poltica ( democrata,
republicana,independenteououtras)
Preferencia religiosa e afiliao politica
Preferencia religiosa
Afiliao
politica
budista
judaica
protestante
Catolica
romana
outras
democrata
30
30
40
60
40
republicana
10
10
40
20
20
independente 10
10
20
20
40
total
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
outras
73
100
total
a) utilizando o nivel de significancia de 0,05 , teste a hipotese nula que essas duas variveis sejam
independentes.
soluo: Ho : preferencia religiosa e afiliao politica so independentes
H1: Ho falsa.
Test of Independence
Test Statistic:
Degrees of Freedom:
220
12
p-Value:
2,4E40
Critical Value:
21,0261
CAPITULO 11
11 REGRESSO LINEAR
Definio: uma linha de regresso tambem chamada de linha de melhor ajuste , a linha para a
qual a soma dos quadrados dos residuos um minimo. FARBER (2009,p.409) .
Considere o diagrama de disperso e a linha mostrados a seguir:
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
74
y =mx+ b
48) Exemplo:
Encontre a reta de regresso para os gastos com propaganda e dados sobre vendas da empresa:
Custo de propaganda
Vendas da empresa
2,4
225
1,6
184
220
2,6
240
1,4
180
1,6
184
186
2,2
215
b) use a equao para prever as vendas esperadas da empresa para os seguintes gastos com
propaganda:
i) 1,5 mil dlares resposta: 180,1538
ii) 1,8 mil dlares
resposta:195,3724
Pontuao no teste y
96
85
82
74
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
95
68
76
84
58
65
75
75
10
50
Construa um diagrama de disperso dos dados e desenhe a linha de regresso. Use a equao de
regresso para prever o valor de y para um dos valores x dados. Caso o valor de x no seja
importante para prever o valor de y , explique o porque.
A equao de regresso -4,0674*x +93,9700
a) x=4 horas
resposta: 77,7004
variao explicada a soma dos quadrados das diferenas entre cada valor de y previsto e a
mdia de y.
variao total a soma dos quadrados das diferenas entre cada valor de y e a mdia de y.
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
50)FARBER (2009, p.425) A tabela mostra o numero de cigarros consumidos( em bilhoes) nos
EUA e o numero de cigarros exportados ( em bilhoes) nos EUA por 7 anos. Determine a equao
de regresso e o coeficiente de determinao.
Cigarros consumidos nos EUA (x) bilhes
435
166
430
154
425
145
415
130
400
127
388
122
376
124
RESPOSTA:
f(x) = 0,6711050038x - 136,7714651251
R = 0,7869564637
76
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
77
Numero de bactrias y
165
280
468
780
1310
1920
4900
c) uma equao exponencial uma equao de regresso no linear da forma y=ab x, encontre essa
equao.
f(x) = 93,02821425241,7119074994^x
R = 0,9897099883
d) uma equao de potencia uma equao de regresso no linear da forma y=axb, encontre essa
equao.
Soluo: y=axb,
*APLICAR LOGARITMO NEPERIANO OU LOGARITMO NA BASE 10 NOS DOIS
TERMOS.
Ln y = Ln axb
78
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
Y = Bo +B1X
Construir a tabela com Ln (y) e Ln(x).
x
y
LN(x)
LN(y)
1
165
0,0000
2
280
0,6931
3
468
1,0986
4
780
1,3863
5 1310
1,6094
6 1920
1,7918
7 4900
1,9459
5,1059
5,6348
6,1485
6,6593
7,1778
7,5601
8,4970
REFERENCIAS
Disponivel
em
www.dimap.ufrn.br/~marcilio/AM/testehipotese.ppt,
acessado
em
13/10/2010.
REFERENCIAS
CRESPO,A.EstatsticaFcil.14aed.SP.EditoraSaraiva.1994
BROFFICE
MINISTRIODAEDUCAO
UNIVERSIDADETECNOLGICAFEDERALDOPARAN
CAMPUSPATOBRANCO
CoordenaodoCursoAnliseeDesenvolvimentodeSistemas
79
FARBER,Betsy.LARSON,Ron.EstatsticaAplicada.SoPaulo.4edio.2009.Pearson.
MILONE,Giuseppe.EstatisticaGeraleAplicada.SoPaulo:ThomsonLearning.2006.
WITTE, John S.; WITTE, Robert S. Estatstica. LTC. 7a edio 2005. 506p. ISBN 85-216-14411