Sei sulla pagina 1di 20

Inferncia sobre uma

proporo populacional
Captulo 18

2006 W.H. Freeman and Company

Objetivos
Inferncia sobre a proporo populacional


A proporo amostral p (pchapu)

A distribuio amostral de

Condies para a inferncia

Intrervalos de confiana para amostras grandes para uma proporo p

Intervalo de confiana mais quatro para p

Tamanho da amostra para uma margem de erro desejada

Testes de significncia para uma proporo

Os dois tipos de dados lembretes




Quantitativo


Algo que pode ser contado ou medido e posteriormente somado,


subtrado, calculado a mdia, atravs de indivduos da populao.

Exemplo: Qual a sua altura, sua idade, seu nvel de colesterol no


sangue?

Categrico


Algo que pode ser classificado em uma das vrias categorias. O que
pode ser contado a proporo de indivduos em cada categoria.

Exemplo: Seu tipo sangneo (A, B, AB, O), a cor de seu cabelo, seu
histrico familiar para doenas genticas, se voc ir desenvolver
cncer de pulmo.

O que voc quer saber? Pergunte:






Quais so os n indivduos/unidades na amostra (de tamanho n)?


O que est sendo registrado a respeito destes n indivduos/unidades?
um nmero ( quantitativa) ou uma afirmativa ( categrica)?

A proporo amostral pchapu


Vamos estudar dados categricos e extrair inferncia da proporo, ou
percentagem, da populao com uma caracterstica especfica.
Se chamarmos uma caracterstica categrica da populao de
sucesso, ento a proporo amostral de sucesso ,

p(pchapu) :

count of successes in the sample


p =
count of observations in the sample

Escolhemos 50 alunos de uma turma de segundo grau e notamos que 10

deles so hispnicos:
pchapu = (10)/(50) = 0,2 (proporo de hispnicos na amostra)


Tratamos um grupo de 120 pacientes com Herpes com uma nova droga; 30

sentiram-se melhor:
pchapu = (30)/(120) = 0,25 (proporo de pacientes que melhoram na amostra)

Distribuio amostral de p
A distribuio amostral de p nunca
exatamente normal, mas quando o
tamanho da amostra aumenta, a
distribuio amostral torna-se
aproxidamente normal.

Implicaes para a estimativa de uma proporo


A mdia e o desvio padro da distribuio amostral
so completamente determinados por p e n.

N p, p(1 p) n

Assim, temos somente um


parmetro populacional para
estimar, p.

Portanto, a inferncia para a proporo depende diretamente da


distribuio normal (diferentemente da inferncia para a mdia, que requer
o uso da distribuio t com um nmero especfico de graus de liberdade.

Condies para a inferncia em p


Postulados:
1. Os dados usados para a estimativa so provenientes de uma AAS
da populao estudada.
2. A populao , no mnimo 10 vezes maior, que a amostra usada
para fazer a inferncia. Isto assegura que o desvio padro de pchapu
seja prximo de p (1 p ) n.

3. O tamanho da amostra n grande o suficiente para que a


distribuio seja considerada normal. O quo grande o tamanho da
amostra for depende em parte do valor de p e do teste conduzido
(iremos ver o que fazer na prtica).

Intervalos de confiana de amostras grandes


para uma proporo p
Intervalos de confiana contm a proporo populacional p em C% das
amostras. Para uma AAS de tamanho n extrada de uma grande
populao e com a proporo amostral p calculada dos dados, um
intervalo de confiana de nvel C aproximado para p :

p m , m is the margin of error


m = z * SE = z *

p (1 p ) n

C
m

Use este mtodo quando o nmero de


sucessos e o nmero de fracassos so,
no mnimo, 15 para cada.

Z*

m
Z*

C a rea sob a curva de densidade


normal padro entre z* e z*.

Efeitos colaterais da medicao


Artrite dolorosa, uma inflamao crnica das
articulaes. Um experimento para verificar os efeitos
colaterais da medicao examinou pacientes com artrite
para encontrar a proporo de pacientes que sofrem os
efeitos colaterais.
Qauis so os efeitos colaterais do ibuprofen?
Efeitos colaterais srios (necessita ateno mdica imediata):
Reaes alrgicas (dificuldade de respirar, inchao)
Paralisia muscular
lceras (inflamaes) na boca
Aumento rpido de peso (reteno de lquidos)
Sangue na urina ou vmito
Audio reduzida
Ictercia (pele ou olhos amarelos)
Contrao abdominal, indigesto, ou azia
Efeitos colaterais menos srios (discuta com seu mdico):
Vertigem ou dor de cabea
Nusea, diarria, ou constipao
Depresso
Fadiga ou fraqueza
Boca seca
Menstruao irregular.

Vamos calcular o intervalo de confiana 90% para a proporo populacional


de pacientes com artrite que sofrem algum sintoma adverso.
Qual proporo amostral

p ?

p =

23
0.052
440

Qual a distribuio amostral para a proporo de pacientes com artrite com


sintomas adversos para uma amostra de 440? p N ( p, p(1 p) n )
Para um nvel de confiana de 90%, z* = 1,645.
Usando o mtodo das grandes amostras,
z*
calcula-se a margem de erro m:

m = z * p (1 p ) n
m = 1.645 * 0.052(1 0.052) / 440

Upper tail probability P


0.25
0.2 0.15
0.1 0.05 0.03 0.02 0.01
0.67 0.841 1.036 1.282 1.645 1.960 2.054 2.326
50% 60% 70% 80% 90% 95% 96% 98%
Confidence level C

90% CI for p : p m
or 0.052 0.023

m = 1.645 * 0.014 0.023


 Com um nvel de confiana de 90%, de 2,9% a 7,5% dos pacientes com
artrite, que fizeram uso da medicao, mostraram alguns sintomas adversos.

Porque usamos uma estimativa de p para calcular a margem de erro,


os intervalos de confiana para a proporo populacional no so
muito precisos.

m = z*

p (1 p )
n

Especificamente,
tendemos a ser incorretos
mais freqentemente que o
nvel de confiana indica,
mas no existe nenhum
erro sistemtico (porque
ele depende de p).

Use com cautela!

Intervalo de confiana mais quatro para p


Um simples ajuste no procedimento produz intervalos de confiana
mais precisos. Agimos como se tivessemos tido quatro observaes
adicionais, duas com sucesso e duas com fracasso. Assim, o novo
tamanho da amostra ser n + 4 e a contagem de sucessos ser X + 2.
A estimativa mais quatro de p :

~
p=

counts of successes + 2
count of all observations + 4

e o intervalo de confiana com um nvel C aproximado :

CI : ~
p m , with
m = z * SE = z * ~
p (1 ~
p ) ( n + 4)
Use este mtodo quando C seja 90% e o tamanho da amostra seja 10.

Agora, usamos o mtodo mais quatro para calcular o intervalo de


confiana com 90% para a proporo populacional de pacientes com
artrite que sofrem sintomas adversos com a medicao.
Qual o valor estimado de p usando o mtodo
mais quatro?

23 + 2
25
~
p=
=
0.056
440 + 4 444

Um intervalo de confiana com 90% para p usando o mtodo mais quatro :

m = z* ~
p (1 ~
p ) (n + 4)
m = 1.645 * 0.056(1 0.056) / 444
m = 1.645 * 0.011 0.018

90% CI for p : ~
pm
or 0.056 0.018

 Com um nvel de confiana de 90%, de 3,8% a 7,4% dos pacientes com


artrite, que fizeram uso da medicao, mostraram alguns sintomas adversos.

z*

0.25
0.674
50%

0.2
0.841
60%

0.15
1.036
70%

Upper tail probability P


0.1
0.05 0.025
0.02
1.282 1.645 1.960 2.054
80%
90%
95%
96%
Confidence level C

0.01
2.326
98%

0.005
2.576
99%

0.003
2.807
99.5%

0.001
3.091
99.8%

0.0005
3.291
99.9%

Tamanho da amostra para uma margem de erro


desejada
Voc precisa escolher um tamanho de amostra para encontrar uma
margem de erro especificada. No entanto, como a distribuio amostral
de p uma funo da proporo populacional p, este processo requer
que voc advinhe um valor de p: p*.
2

z *
p N ( p, p(1 p ) n n = p 1 p *
m
*

A margem de erro ser menor ou igual a m se p* advinhado for 0,5.


Lembre-se que o tamanho de amostra no sempre aumentado vontade.
Existem tipicamente custos e restries associadas com amostras grandes.

Qual o tamanho da amostra necessrio para se obter um margem de erro


no superior a 0,01 (1%) para um intervalo de confiana com 90% para a
proporo populacional de pacientes com artrite que sofrem alguns
sintomas adversos?
Podemos usar 0,5 para o valor advinhado de p*. No entanto, como a droga foi
aprovada para venda em todo o pas, podemos seguramente assumir que no
mais de 10% dos pacientes devem sofrer sintomas adversos (um valor
advinhado melhor que 50%).
z*

Para o nvel de confiana 90%, z* = 1,645.


2

Upper tail probability P


0.25
0.2 0.15
0.1 0.05 0.03 0.02 0.01
0.67 0.841 1.036 1.282 1.645 1.960 2.054 2.326
50% 60% 70% 80% 90% 95% 96% 98%
Confidence level C

z*
1.645
n = p * (1 p*) =
(0.1)(0.9) 2434.4
m
0.01
 Para obter uma margem de erro inferior a 1% precisamos de uma amostra
com tamanho n de, no mnimo, 2435 pacientes com artrite.

Teste de significncia para p


A distribuio amostral para p^ aproximadamente normal para
amostras com tamanho grande e sua forma depende apenas de p e n.
Assim, podemos facilmente testar a hiptese nula:
H0: p = p0 (um dado valor a ser testado)
Se H0 verdadeiro, a distribuio amostral
conhecida  A probabilidade da proporo
amostral para a hiptese nula depende de quo
distante p0 est de p^ em unidades de desvio
padro.

z=

p p0
p0 (1 p0 )
n

Isto vlido quando as contagens esperadas sucessos np0 e


fracassos n(1 p0) so iguais ou superiores a 10.

p0 (1 p0 )
n

p0

P-valores e hipteses unicaudal ou bicaudal lembete

e como sempre, se o P-valor for menor que o nvel de significncia escolhido

, ento a diferena estatisticamente significante e rejeita-se H0.

Uma pesquisa nacional feita pelo Instituto Nacional de Sade e Segurana


Ocupacional (NIOSH) em empregados de restaurante mostrou que 75% dos
trabalhadores disseram que o trabalho estressante e que tem um impacto
negativo em suas vidas pessoais.
Voc investiga um cadeia de restaurantes para saber se a proporo dos
empregados negativamente afetado pelo trabalho estressante difere da
proporo nacional p0 = 0,75.
H0: p = p0 = 0,75 vs. Ha: p 0,75 (alternativa bicaudal)
Se na AAS de 100 empregados, 68 respoderam Sim quando perguntado, O
estresse no trabalho tem um impacto negativo em sua vida pessoal?
A contagem esperada era 100 0,75 = 75 e 25.
Como o tamanho da amostra maior que 10, podemos
usar o teste z. O teste estatstico :

Da Tabela A achamos a rea esquerda de z = 1,62 0,9474.


Assim P(Z 1,62) = 1 0,9474, ou 0,0526. Como a hiptese alternativa
bilateral, o P-valor a rea nas duas caudas, e P = 2 0,0526 = 0,1052.

 Os dados da cadeia de
restaurante so compatveis
com o resultado da pesquisa
nacional ( p = 0,68, z = 1,62, P
= 0,11).

Interpretao: magnitude versus confiabilidade dos


efeitos
A confiabilidade de uma interpretao relaciona-se com a fora da
evidncia. Um P-valor pequeno a mais forte evidncia contra a
hiptese nula e mais confiante voc pode ficar com sua interpretao.
A magnitude ou tamanho do efeito relaciona-se com a relevncia real
do fenmeno no-coberto. O P-valor NO assegura a relevncia do
efeito, nem a sua magnitude.
O intervalo de confiana ir assegurar a magnitude do efeito. No
entanto, a magnitude no necessariamente equivalente a quanto um
efeito relevante do ponto de vista terico ou prtico.

Potrebbero piacerti anche