Sei sulla pagina 1di 28

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

SUMRIO
1. AMOSTRAGEM 1.1. Conceitos bsicos 1.2. Distribuio amostral dos estimadores 1.2.1. Distribuio amostral da mdia 1.2.2. Distribuio amostral da varincia 1.2.3. Distribuio amostral da proporo 2. ESTIMAO 2.1. Propriedades dos estimadores 2.2. Estimao por ponto 2.3. Estimao por intervalo 2.3.1. Da mdia populacional 2.3.2. Da proporo populacional 2.3.3. Da varincia populacional (2) 2.3.4. Do desvio padro populacional () 3. EXERCCIOS 4. RESPOSTAS DOS EXERCCIOS 5. REFERNCIAS 4 4 8 8 11 13 16 16 16 16 17 19 21 22 24 27 29

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

1. AMOSTRAGEM
1.1. C ONCEITOS BSICOS
Estatstica Indutiva. Muitas vezes, apesar dos recursos computacionais e da boa vontade no possvel estudar todo um conjunto de dados de interesse. Neste caso estuda-se uma parte do conjunto. O principal motivo para se trabalhar com uma parte do conjunto ao invs do conjunto inteiro o custo. O conjunto de todos os elementos que se deseja estudar denominado de populao. Note-se que o termo populao usado num sentido amplo e no significa, em geral, conjunto de pessoas. Pode-se definir uma populao como sendo:

Uma coleo de todos os possveis elementos, objetos ou medidas de interesse.


Assim, so exemplos de populaes: O conjunto das rendas de todos os habitantes de Porto Alegre; O conjunto de todas as notas dos alunos de Estatstica; O conjunto das alturas de todos os alunos da Universidade; etc. Um levantamento efetuado sobre toda uma populao denominado de levantamento censitrio ou Censo. Fazer levantamentos, estudos, pesquisas, sobre toda uma populao (censo) , em geral, muito difcil. Isto se deve vrios fatores. O principal o custo. Um censo custa muito caro e demanda um tempo considervel para ser realizado. Assim, normalmente, se trabalha com partes da populao denominadas de amostras. Uma amostra pode ser caracterizada como:

Uma poro ou parte de uma populao de interesse.


Utilizar amostras para se ter conhecimento sobre populaes realizado intensamente na Agricultura, Poltica, Negcios, Marketing, Governo, etc., como se pode ver pelos seguintes exemplos: Antes da eleio diversos rgos de pesquisa e imprensa ouvem um conjunto selecionado de eleitores para ter uma idia do desempenho dos vrios candidatos nas futuras eleies. Uma empresa metal-mecnica toma uma amostra do produto fabricado em intervalos de tempo especificados para verificar se o processo est sob controle e evitar a fabricao de itens defeituosos. O IBGE faz levantamentos peridicos sobre emprego, desemprego, inflao, etc. Redes de rdio e TV se utilizam constantemente dos ndices de popularidade dos programas para fixar valores da propaganda ou ento modificar ou eliminar programas com audincia insatisfatria. Bilogos marcam pssaros, peixes, etc. para tentar prever e estudar seus hbitos. O processo de escolha de uma amostra da populao denominado de amostragem. Riscos da amostragem. O processo de amostragem envolve riscos, pois toma-se decises sobre toda a populao com base em apenas uma parte dela. A teoria da probabilidade pode ser utilizada para fornecer uma idia do risco envolvido, ou seja, do erro cometido ao utilizar uma amostra ao inProf. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 4

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

vs de toda a populao, desde que, claro, a amostra seja selecionada atravs de critrios probabilsticos, isto , ao acaso. Baseado nos conceitos anteriores pode-se definir Estatstica Indutiva ou Inferencial como sendo: A coleo de mtodos e tcnicas utilizados para se estudar uma populao baseados em amostras probabilsticas desta mesma populao.

Uma amostra dita probabilstica se todos os elementos da populao tiverem probabilidade conhecida e no zero de pertencer a amostra.
Dentre as vrias maneiras de se selecionar uma amostra probabilstica ou aleatria de uma populao a mais simples atribuir a todos os elementos da populao a mesma probabilidade de pertencer a amostra. Uma amostra que satisfaa tal critrio denominada de amostra aleatria simples (aas). Uma aas pode ser extrada de uma populao de acordo com os critrios: (a) com reposio e (b) sem reposio. Se a populao for infinita ento as retiradas com e sem reposio sero equivalentes, isto , se a populao for infinita (ou ento muito grande), o fato de se recolocar o elemento retirado de volta na populao. no vai afetar em nada a probabilidade de extrao do elemento seguinte. Se, no entanto, a populao for finita (e pequena) ser necessrio fazer uma distino entre os dois procedimentos, pois na extrao com reposio as diversas retiradas sero independentes, mas no processo sem reposio haver dependncia entre as retiradas, isto , o fato de no recolocar o elemento retirado afeta a probabilidade do elemento seguinte ser retirado. A amostragem sem reposio mais eficiente que a amostragem com reposio e reduz a variabilidade uma vez que no possvel retirar elementos extremos mais do que uma vez. Assim se N representa o tamanho da populao e n < N o tamanho da amostra, ento o nmero de amostras possveis de acordo com os critrios com e sem reposio ser:

(a) Com reposio


k = nmero de amostras = Nn

(b) Sem reposio


k = nmero de amostras = =
n N

N! n!(N n)!

Exemplo: Considere a populao P = { 1, 3, 5, 6 }. Ento o nmero de amostras possveis de tamanhos n = 2 e n = 3, de acordo com os critrios com e sem reposio ser:

(a) Sem reposio


(1) n = 2 Como N = 4 e n = 2, ento o nmero de amostras possveis ser: = =
n 2 N 4

4! =6 2!( 4 2)!

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

Estas amostras sero: (1, 3) (1, 5) (1, 6) (3, 5) (3, 6) (5, 6) (2) n = 3 Como N = 4 e n = 3, ento o nmero de amostras possveis ser: = =
n 3 N 4

4! =4 3 !( 4 3 )!

Estas amostras sero: (1, 3, 5) (1, 3, 6) (1, 5, 6) (3, 5, 6).

(b) Com reposio


(1) n = 2 Como N = 4 e n = 2, ento o nmero de amostras possveis ser Nn = 42 = 16. Estas amostras sero: (1, 1) (1, 3) (1, 5) (1, 6) (3, 3) (3, 5) (3, 6) (5, 5) (5, 6) (6, 6) (3, 1) (5, 1) (6, 1) ( 5, 3) (6, 3) (6, 5) Como pode ser observado neste caso as amostras (a, b) e (b, a) so consideradas diferentes, isto , na amostragem com reposio as amostras so ordenadas. (2) n = 3 Como N = 4 e n = 3, ento o nmero de amostras possveis ser Nn = 43 = 64 Algumas destas amostras so: (1, 1, 1) (1, 1, 3), (1, 3, 1), (3, 1, 1) (1, 3, 5) (1, 5, 3) ( 5, 3, 1) (5, 1, 3) (1, 3, 6) (3, 3, 3), (5, 5, 5) (5, 5, 6) (1, 5, 6) (3, 5, 6) , etc.

Estimador, estimativas e parmetros Uma caracterstica da populao denominada parmetro.


Um parmetro uma constante, isto , um nmero que representa uma caracterstica nica da populao. Assim se P uma populao, os principais parmetros seriam: (i) A mdia de P, anotada por P
2 (ii) A varincia de P, anotada por P

(iii) O desvio padro de P, anotado por P (iv) A proporo de elementos de P que apresentam determinada caracterstica, anotada por: , entre outros.

Exemplo:
Para a populao P = { 1, 3, 5, 6 } os parmetros acima seriam: (i) P = (1 + 3 + 5 + 6) / 4 = 15 / 4 = 3,75
2 (ii) P = (1 + 9 + 25 + 36) / 4 - 3,752 = 71/4 - 3,752 = 17,75 - 14,0625 = 3,6875 = 3,69.

(iv) P = 1,9203 = 1,92 (v) = 1 / 4 = 25%, onde o numerador representa o nmero de elementos pares na populao

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

Estimador Um estimador uma caracterstica da amostra.


Como a amostra aleatria um estimador uma varivel aleatria. Assim tudo o que foi visto em probabilidade sobre variveis aleatrias, aplica-se aos estimadores. A distribuio de probabilidade de um estimador denominada de distribuio amostral. Os principais estimadores so: (I) A mdia da amostra, X que um estimador da mdia da populao: (ii) A varincia amostral, S2 que um estimador da varincia populacional: 2 (iii) A proporo amostral, P, que um estimador amostral da proporo populacional .

Estimativa Uma estimativa um valor particular de um estimador


Assim x = 2 uma estimativa. O estimador a expresso (frmula) enquanto que a estimativa o valor particular que ele assume (nmero).

Clculo dos principais estimadores.


Se (X1, X2, ..., Xn) uma amostra aleatria de tamanho n extrada de uma populao, ento: (a) X = Xi / n uma estimativa da mdia populacional quando a amostra no est agrupada e X = f i Xi / n uma estimativa da mdia da amostra quando a amostra est agrupada em uma distribuio de freqncias (por ponto ou por valores). (b) S =
2

( Xi X) 2
n1
2

Xi2 n X2
n1

uma estimativa da varincia populacional quando a

amostra no est agrupada e S =


2

f i( Xi X )
n1

2 f i Xi n X2

n1

uma estimativa da varincia populacional quando a

amostra est agrupada em uma distribuio de freqncias. Note-se que agora a varincia calculada com n - 1 no denominador. Isto se deve ao fato de que a varincia for calculada com n no denominador, a mdia de sua distribuio amostral no ser igual a varincia populacional o que caracterizaria um estimador tendencioso. Embora a varincia seja calculada com n - 1 no denominador com o objetivo de que as estimativas variem em torno do parmetro, isto no ir ocorrer se a amostragem for sem reposio de populao finita. Neste caso necessrio utilizar, ainda, uma correo para a varincia que consiste em multiplic-la pelo valor (N - 1) / N. Evidentemente esta correo s ser necessria se a populao for pequena, caso contrrio o quociente acima ser aproximadamente igual a um e a correo no precisar ser feita. Assim se a populao for finita (e pequena) e a amostragem for realizada sem reposio a varincia dever ser calculada por:
N1 2  S2 = S N

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

(c) P = f / n, onde f = freqncia de elementos na amostra com determinada caracterstica uma estimativa da proporo populacional .

1.2. D ISTRIBUIO AMOSTRAL DOS ESTIMADORES 1.2.1. Distribuio amostral da mdia


(1) Amostragem com reposio
Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 extradas com reposio. Para cada amostra vai-se calcular a mdia. Ter-se- assim um conjunto de 16 valores que sero dispostos em uma tabela, com as respectivas probabilidades, e que constituir ento a distribuio amostral da mdia da amostra. As possveis amostras com as respectivas mdias so: Amostras Amostras x (1, 1) 1 (5, 6) 5,5 (1, 3) 2 (6, 6) 6 (1, 5) 3 (3, 1) 2 (1, 6) 3,5 (5, 1) 3 (3, 3) 3 (6, 1) 3,5 (3, 5) 4 ( 5, 3) 4 (3, 6) 4,5 (6, 3) 4,5 (5, 5) 5 (6, 5) 5,5

Colocando estes resultados em uma tabela (distribuio amostral da mdia) vem:


x 1,0 2,0 3,0 3,5 4,0 4,5 5,0 5,5 6,0

f( x ) = P( X = x ) 1/16 2/16 3/16 2/16 2/16 2/16 1/16 2/16 1/16 1

x f( x ) 1/16 4/16 9/16 7/16 8/16 9/16 5/16 11/16 6/16 60/16

x2 f( x )

1,0/16 8,0/16 27,0/16 24,5/16 32,0/16 40,5/16 25,0/16 60,5/16 36,0/16 254,5/16

Pela tabela pode-se verificar que: E( X ) = x f( x ) = 60/16 = 3,75 = , isto a expectncia (mdia) de todas as mdias amostrais, extradas com reposio da populao P, igual a mdia populacional (parmetro populacional mdia).
2 V( X ) = x2 f( x ) - X = 254,5/16 - 3,752 = 1,84375 = 2/ 2 = 3,6875/2, isto , a varincia entre as mdias amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional.

O valor X = 1,36 denominado erro padro da mdia. Ele mede a variabilidade entre as mdias amostrais e d uma idia do erro que se comete ao se substituir a mdia da populao pela mdia da amostra. De fato, verificando a tabela acima, pode-se ver que se por exemplo, fosse selecionada a amostra (1, 1) seramos levados a crer que a mdia da populao seria um, quando de fato ela vale 3,75, cometendo assim um erro de 2,75 unidades. Felizmente este erro (o maior possvel neste caso) s vai ocorrer com uma probabilidade de 1/16 = 6,25%. Se por exemplo, fosse selecionada a amostra (1,
Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 8

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

6) a mdia amostral seria 3,5 e o erro cometido (neste caso) seria de 0,25 unidades. Este erro bem menor que o anterior ocorre com uma probabilidade de 2/16 = 12,5%. O que o desvio padro da distribuio amostral da mdia faz determinar o erro mdio, sendo por isso denominado, ento, de erro padro da amostragem.

(2) Amostragem sem reposio


Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 extradas sem reposio. As possveis amostras com as respectivas mdias so: Amostras
x

(1, 3) 2

(1, 5) 3

(1, 6) 3,5

(3, 5) 4

(3, 6) 4,5

(5, 6) 5,5

Colocando estes resultados em uma tabela (distribuio amostral da mdia) vem:


x 2,0 3,0 3,5 4,0 4,5 5,5

f( x ) = P( X = x ) 1/6 1/6 1/6 1/6 1/6 1/6 1

x f( x ) 2,0 / 6 3,0 / 6 3,5 / 6 4,0 / 6 4,5 / 6 5,5 / 6 22,5 / 6

2 x f( x )

04,00 / 6 09,00 / 6 12,25 / 6 16,00 / 6 20,25 / 6 30,25 / 6 91,75 / 6

Da tabela segue: E( X ) = x f( x ) = 22,5/6 = 3,75 = , isto a expectncia (mdia) de todas as mdias amostrais, extradas sem reposio da populao P, tambm igual a mdia populacional (parmetro populacional mdia).
2 2 N n V( X ) = x2 f( x ) - X = 91,75/6 - 3,752 = 1,2292 = . N 1 = 1,84375. (2/3), isto , a varin2 cia entre as mdias amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional multiplicada pelo fator de correo de populao finita. Este fator, pode ser considerado como o fator de eficincia da amostragem sem reposio sobre a amostragem com reposio, que neste caso (N = 4 e n =2) vale 2/3. Como na amostragem sem reposio no possvel retirar o mesmo elemento duas vezes, as mdias no podem assumir valores to extremos, como por exemplo, o valor um ou seis que assumiram na amostragem com reposio. Isto faz com que a erro padro na amostragem sem reposio seja menor do que na amostragem com reposio.

O fator de reduo da varincia na amostragem sem reposio : (N - n) / (N -1) Pode-se perceber facilmente que quanto maior for a diferena entre o tamanho da populao e o tamanho da amostra mais prximo de um ser este fator. Ento, como regra prtica, pode-se admitir como necessria a correo para a varincia das mdias amostrais sempre que o tamanho da amostra exceder a 5% do tamanho da populao. Caso isto no ocorra no necessrio fazer-se a distino entre os dois procedimentos (com e sem reposio). Evidentemente as consideraes acima valem para populaes pequenas. Se a populao bastante grande ou infinita, no mais ser possvel pensar em construir tabelas para representar a distriProf. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

buio das mdias amostrais. Neste caso necessrio procurar por modelos probabilsticos que descrevam a distribuio da mdia amostral. Neste caso, tambm, como declarado acima a distino entre amostragem com e sem reposio no ser necessrio, pois o fator de correo ser aproximadamente um e no necessitar ser utilizado. Os modelos probabilsticos so conhecidos a partir dos dois seguintes resultados: (a) Se (X1, X2, ..., Xn) uma amostra aleatria de uma populao com distribuio normal de mdia e desvio padro , ento a mdia da amostra ( X ) ter uma distribuio tambm normal com a mesma mdia da populao e com desvio padro (erro padro) raiz de n vezes menor que o desvio padro da populao, isto : Se X N(, ) ento X ser N(, (b) Teorema Central do Limite Se (X1, X2, ..., Xn) uma amostra aleatria extrada de uma populao com qualquer distribuio de mdia e desvio padro , ento a mdia da amostra ( X ) ter uma distribuio aproximadamente normal com a mesma mdia da populao e com desvio padro (erro padro) raiz de n vezes menor que o desvio padro da populao medida que o tamanho da amostra aumenta. OBS.: Para amostras de 30 ou mais valores, em geral, a aproximao j ser suficiente boa, para se poder utilizar este resultado. Assim: Se X tem qualquer distribuio ento X ter uma distribuio aproximadamente N(, para n grande (n 30).
n n

Exemplos:
(1) Uma populao X tem uma distribuio normal de mdia 100 e desvio padro 10. (a) Qual P(95 < X < 105)? (b) Se X a mdia de 16 elementos extrada desta populao, qual a P(95 < X < 105) ?

Soluo:
(a) Como X uma N(100, 10) vem: P(95 < X < 105) = P(-0,5 < Z < 0,5) = (0,5) - (-0,5) = 0,6915 - 0,3185 = 38,30%. Neste caso X uma N(100; 2,5), ento: (b) P(95 < X < 105) = P(-2,0 < Z < 2,0) = (2,0) - (-2,0) = 0,9772 - 0,0228 = 95,44%. (2) A renda de um conjunto de pessoas de uma certa regio tem mdia 6 s.m. e desvio padro de 2 s.m. Se desta populao for extrada uma amostra de n = 100 pessoas, qual a probabilidade de a mdia desta amostra acuse um valor superior a 6,3 s.m?

Soluo:
Neste caso, como no foi declarado que a populao normal necessrio aplicar o teorema central do limite, uma vez que n = 100 > 30, isto possvel. A mdia da amostra ter uma distribuio aproximadamente normal com mdia 6 s.m. e desvio padro de: 2 / 10 = 0,20, uma vez que o erro pa-

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

10

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

dro da mdia raiz de n vezes menor do que o desvio padro populacional. Ento, a probabilidade pedida ser: P( X > 6,30) = P(Z > (6,30 - 6)/0,20 ) = P (Z > 1,5) = (-1,5) = 6,68%, isto , apenas 6,68% das mdias de amostras de tamanho n = 100 apresentaro um valor superior a 6,30 s.m.

1.2.2. Distribuio amostral da varincia


(1) Amostragem COM reposio
Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 extradas com reposio. Para cada amostra vai-se calcular a varincia. Ter-se- assim um conjunto de 16 valores que sero dispostos em uma tabela, com as respectivas probabilidades, e que constituir ento a distribuio amostral da varincia. As possveis amostras com as respectivas varincias so: Amostras
x s2 Amostras x s2

(1, 1) 1 0 (5, 6) 5,5 0,5

(1, 3) 2 2 (6, 6) 6 0

(1, 5) 3 8 (3, 1) 2 2

(1, 6) 3,5 12,5 (5, 1) 3 8

(3, 3) 3 0 (6, 1) 3,5 12,5

(3, 5) 4 2 ( 5, 3) 4 2

(3, 6) 4,5 4,5 (6, 3) 4,5 4,5

(5, 5) 5 0 (6, 5) 5,5 0,5

Colocando estes resultados em uma tabela(distribuio amostral da varincia) vem: s2 0,0 0,5 2,0 4,5 8,0 12,5 f(s2) = P(S2 = s2 ) 4/16 2/16 4/16 2/16 2/16 2/16 1 s2f(s2) 0/16 1/16 8/16 9/16 16/16 25/16 59/16

Pela tabela segue que: E(S2) = s2f(s2) = 59/16 = 3,6875 = 2, isto a expectncia (mdia) de todas as varincias das amostras de tamanho n = 2, extradas com reposio da populao P, igual a varincia populacional (parmetro populacional varincia). Em outras palavras, pode-se dizer que quando a amostragem com reposio a varincia amostral S2 um estimador no tendencioso da varincia populacional 2. Desta forma, sempre que se desejar estimar a varincia de uma populao onde as amostras foram retiradas com reposio, pode-se usar a varincia amostral como estimador.

(2) Amostragem SEM reposio


Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 obtidas sem reposio.

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

11

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

As possveis amostras com as respectivas varincias so: Amostras


x s2

(1, 3) 2 2

(1, 5) 3 8

(1, 6) 3,5 12,5

(3, 5) 4 2

(3, 6) 4,5 4,5

(5, 6) 5,5 0,5

Colocando estes resultados em uma tabela (distribuio amostral da varincia) vem: s2 0,5 2,0 4,5 8,0 12,5 f(s2) = P(S2 = s2 ) 1/6 2/6 1/6 1/6 1/6 1 s2f(s2) 0,5/6 4,0/6 4,5/6 8,0/6 12,5/6 29,5/6

Pela tabela pode-se ver que: E(S2) = s2f(s2) = 29,5/6 3,6875 = 2, isto a expectncia (mdia) de todas as varincias das amostras de tamanho n = 2, extradas sem reposio da populao finita P, no igual a varincia populacional (parmetro populacional varincia). Neste caso, para que se obtenha um estimador no tendencioso da varincia populacional necessrio corrigir a varincia amostral atravs do fator (N - 1) / N. Assim se cada varincia acima for multiplicada por este fator, que neste caso ser, (N - 1) / N = 3 / 4 = 0,75, ento, se ter:
 s2
 f( s2 ) = P(S2 = s2 )   1/6 2/6 1/6 1/6 1/6 1

s2 f( s2 )  

0,375 1,500 3,375 6,000 9,375

0,375/6 3,000/6 3,375/6 6,000/6 9,375/6 22,125/6

 E( S2 ) = s2 f( s2 ) = 22,125 / 6 = 3,6875 = 2, isto a expectncia (mdia) de todas as varin  cias corrigidas igual ao parmetro populacional 2. Assim quando a populao pequena e amostragem for sem reposio necessrio corrigir a varincia da amostra pelo fator (N - 1) / N, para que ela seja um bom estimador da varincia populacional. claro que esta correo s ser importante para populaes pequenas. Se a populao for grande, por exemplo, N = 1000, ento o fator (N - 1) / N = 999 / 1000 = 0,999 o que aproximadamente 1. Neste caso, no necessrio usar esta correo e a amostragem sem reposio pode ser considerada equivalente a com reposio para efeitos de estimao da varincia populacional.

Evidentemente as consideraes acima valem para populaes pequenas. Se a populao bastante grande ou infinita, no mais ser possvel pensar em construir tabelas para representar a distribuio das varincias amostrais. Neste caso necessrio procurar por modelos probabilsticos (funes) que descrevam a distribuio da varincia amostral. Para a varincia este modelo existe e denominado de distribuio Qui-quadrado (2).
Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 12

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

1.2.3. Distribuio amostral da proporo


(1) Amostragem COM reposio
Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 obtidas com reposio. Para cada amostra vai-se calcular a proporo P de elementos pares na populao. Ter-se- assim um conjunto de 16 valores que sero dispostos em uma tabela, com as respectivas probabilidades, e que formaro ento a distribuio amostral da proporo. As possveis amostras com as respectivas propores so: Amostras p Amostras p (1, 1) 0 (5, 6) 1/2 (1, 3) 0 (6, 6) 1 (1, 5) 0 (3, 1) 0 (1, 6) 1/2 (5, 1) 0 (3, 3) 0 (6, 1) 1/2 (3, 5) 0 ( 5, 3) 0 (3, 6) 1/2 (6, 3) 1/2 (5, 5) 0 (6, 5) 1/2

Colocando estes resultados em uma tabela (distribuio amostral da proporo) vem: p 0,0 0,5 1,0 f(p) = P(P = p) 9/16 6/16 1/16 1 pf(p) 0/16 3/16 1/16 4/16 p2f(p) 0,0/16 1,5/16 1,0/16 2,5/16

Pode-se ento calcular a expectncia e a varincia: E(P) = pf(p) = 4/16 = 0,25 = , isto o valor esperado (mdia) de todas as propores amostrais, extradas com reposio da populao P, e igual a proporo populacional (parmetro populacional ). Isto significa, que o estimador P um estimador no tendencioso (ou no viciado) da proporo populacional , quando as amostras so extradas com reposio da populao.
2 V(P) = p2f(p) - P = 2,5/16 - 0,252 = 0,09375 = (1 - ) / n, isto , a varincia entre as propores amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional. Isto porque quando se est trabalhando com propores, pode-se mostrar que a varincia populacional igual a (1 - ).

O valor P =

(1 ) n

= 0,09375 denominado erro padro da proporo. Ele mede a va-

riabilidade entre as propores amostrais e d uma idia do erro que se comete ao se substituir a proporo da populao pela proporo da amostra. (2) Amostragem SEM reposio Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 extradas sem reposio. As possveis amostras com as respectivas propores so:

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

13

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

Amostras p

(1, 3) 0

(1, 5) 0

(1, 6) 1/2

(3, 5) 0

(3, 6) 1/2

(5, 6) 1/2

Colocando estes resultados em uma tabela (distribuio amostral da proporo) vem: p 0,0 0,5 Portanto: E(P) = pf(p) = 0,5/2 = 0,25 = , isto a expectncia (mdia) de todas as propores amostrais, extradas sem reposio da populao P, e igual a proporo populacional (parmetro populacional ). Isto significa, que o estimador P um estimador no tendencioso (ou no viciado) da proporo populacional , quando as amostras so retiradas sem reposio.
2 V(P) = p2f(p) - P = 0,25/2 - 0,252 = 0,0625 =

f(p) = P(P = p) 1/2 1/2 1

pf(p) 0,0/2 0,5/2 0,5/2

p2f(p) 0,00/2 0,25/2 0,25/2

(1 ) N n . , isto , a varincia entre as pro2 N1

pores amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional multiplicada pelo fator de correo de populao finita. Este fator, pode ser considerado como o fator de eficincia da amostragem sem reposio sobre a amostragem com reposio que, neste exemplo, (N = 4 e n = 2) vale 2/3. Evidentemente as consideraes acima valem para populaes pequenas. Se a populao bastante grande ou infinita, no mais ser possvel pensar em construir tabelas para representar a distribuio das propores amostrais. Nesta situao necessrio procurar por modelos probabilsticos que descrevam a distribuio da proporo amostral. Neste caso, tambm, como declarado acima a distino entre amostragem com e sem reposio no ser necessria, pois o fator de correo ser aproximadamente um e no precisar ser utilizado. O modelo probabilstico para a proporo amostral dada pelo seguinte resultado: (a) Se (X1, X2, ..., Xn) uma amostra aleatria retirada de uma populao com proporo , ento a distribuio da proporo amostral ser aproximadamente normal com mdia P = e desvio padro P =
(1 ) . n

OBS.: Para amostras de 30 ou mais valores, em geral, a aproximao j ser suficiente boa, para se poder utilizar este resultado. Para amostras pequenas a distribuio da proporo amostral Binomial.

Exemplo:
(1) A proporo de eleitores do candidato D. M. A. Gogo numa certa regio de 20%. Extrada uma amostra de 100 eleitores desta regio, qual a probabilidade que ela apresente um nmero de eleitores do candidato (a) Abaixo de 15% (b) Superior a 30%

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

14

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

Soluo:
Como n > 30 pode-se usar a distribuio normal com mdia = = 20% e desvio padro

(1 ) = n

0,2(1 0,2) = 0,04 = 4%, Ento: 100

(a) P(P < 15%) = P(Z < -1,25) = (-1,25) = 10,56%. (b) P(P > 30) = P(Z > 2,5) = (-2,5) = 0,62%.

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

15

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

2. ESTIMAO
A inferncia estatstica tem por objetivo fazer generalizaes sobre uma populao com base em valores amostrais. A inferncia pode ser feita estimando os parmetros: (a) Por ponto e (b) Por intervalo. A estimao por ponto feita atravs de um nico valor, enquanto que a estimao por intervalo fornece um intervalo de valores em torno do valor da estimativa pontual.

Exemplo:
Uma amostra aleatria simples de 400 pessoas de uma cidade extrada e 300 respondem que acham a administrao municipal boa ou tima. Ento o valor p = 300/400 = 75% uma estimativa por ponto do percentual de pessoas da cidade que acham a administrao boa ou tima. Esta mesma estimativa poderia ser enunciado como de: 70% a 80% das pessoas da cidade acham a administrao boa ou tima. Neste caso, teramos uma estimativa por intervalo da proporo. Note-se que o centro do intervalo o valor 75% da estimativa pontual.

2.1. P ROPRIEDADES DOS ESTIMADORES


Seja X uma populao com um parmetro de interesse e seja (X1, X2, ..., Xn) uma amostra  aleatria simples extrada desta populao. Seja um estimador do parmetro . Ento:
  (i) Se E( ) = se dir que um estimador no-tendencioso ou no viciado do parmetro  populacional . Neste caso, a mdia do estimador o parmetro populacional , ou ainda, pode-se dizer que o estimador varia em torno do parmetro populacional.   (ii) Se um estimador no tendencioso de um parmetro , se dir que consistente se medida que o tamanho da amostra aumenta a variabilidade do estimador diminui, isto , as observaes vo ficando cada vez mais concentradas em torno do parmetro na medida em que a amostra vai ficando cada vez maior. Em smbolos:
n

 lim V() = 0

2.2. E STIMAO POR PONTO


Seja X uma populao com mdia , desvio padro e com uma proporo e seja (X1, X2, ..., Xn) uma amostra aleatria simples extrada desta populao. Ento: (a) X um estimador no-tendencioso e consistente da mdia da populao . (b) P um estimador no-tendencioso e consistente da proporo populacional . (c) S2 estimador no-tendencioso e consistente da varincia da populao 2, a menos que a
 extrao seja sem reposio de populao finita. Neste caso, o estimador S2 =

N1 2 S. N

2.3. E STIMAO POR INTERVALO


O estimador por ponto no permite ter uma idia do erro cometido ao se fazer a estimativa do parmetro. Para que se possa associar uma confiana (probabilidade) a uma estimativa necessrio
Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/

16

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

construir um intervalo em torno da estimativa por ponto. Este intervalo construdo baseado na distribuio amostral do estimador.

2.3.1. Da mdia populacional


(a) Desvio padro populacional () conhecido
O intervalo de confiana para a mdia () de uma populao construdo em torno da estimativa pontual X . Para construir este intervalo fixa-se uma probabilidade 1 - de que o intervalo construdo contenha o parmetro populacional. Desta forma, ser a probabilidade de que o intervalo obtido no contenha o valor do parmetro, isto , ser a probabilidade de erro. Sabe-se que a se a populao de onde mdia da amostra tem distribuio normal de mdia e desvio padro n for extrada a amostra for normal (ou se a amostra for superior a 30 e retirada de qualquer populao ) de mdia e de desvio padro , pode-se ento utilizar a curva normal para estabelecer os limites para o intervalo de confiana. Lembrando que o que se quer um intervalo que contenha o parmetro populacional com probabilidade 1 - tem-se ento:

/2.

P(-z/2 < Z < z/2) = 1 - , onde z/2 o valor da normal padro com rea direita igual a Mas Z = ( X - ) / P(-z/2 < ( X - ) / P( X - z/2 [ X - z/2 substituindo na expresso acima vem: < z/2 ) = 1 - . Trabalhando esta desigualdade, segue que:

n n

< < X + z/2 ) = 1 - . Que o intervalo procurado. Assim o intervalo n n de confiana (probabilidade) de 1 - para a mdia de uma populao dado por:
n

; X + z/2

] onde:

X a estimativa por ponto da mdia da populao.

o desvio padro da populao e


z/2 o valor da distribuio normal padro cuja rea direita igual a /2, isto , o valor de Z tal que: P(Z > z/2) = /2, ou ento: (-z/2) = /2.

Exemplo:
Uma populao tem um desvio padro igual a 10 e mdia desconhecida. Uma amostra de tamanho n = 100 retirada e fornece uma mdia x = 50. Qual o intervalo de 95% de confiana para a mdia desta populao?

Soluo:
Tem-se 1 - = 95%, ento = 5% e / 2 = 2,5%. O coeficiente de confiana que deve ser buscado na normal padro valor z/2 de Z tal que: P(Z > z/2) = 2,5%, ou ento: (-z/2) = 2,5%.

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

17

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

Este valor vale 1,96. Ento o intervalo de confiana de 95% para a mdia desta populao ser: [ X - z/2
n

; X + z/2

] = [50 - 1,96.10/10; 50 + 1,96.10/10] = [50 - 1,96; 50 + 1,96] =

[48,04; 51,96], ou seja, pode-se afirmar com uma certeza de 95% de que este intervalo conter a mdia desta populao. Obs.: O valor = z/2 valor denominado de erro padro da estimao. No confundir com o n que o erro padro da amostragem. O erro padro da estimao a semi-amplitude do in-

n tervalo de confiana. A amplitude do intervalo de confiana (IC) ser; 2.

(b) Desvio padro populacional () desconhecido


Quando o desvio padro da populao () desconhecido necessrio utilizar sua estimativa s. S que ao substituir-se o desvio padro populacional pelo sua estimativa no quociente: no se ter mais uma normal padro. De fato, conforme demonstrado pelo esn tatstico ingls W. S. Gosset, conhecido por Student o comportamento do quociente: ( X - ) / S
n

( X - ) /

segue uma distribuio simtrica em torno de zero, porm com uma variabili-

dade maior do que a da normal padro. A distribuio do quociente acima conhecida como distribuio t de Student. Na realidade existem infinitas distribuies t, uma para cada tamanho de amostra. Estas distribuies a exemplo da normal padro encontram-se tabeladas. A tabela para a distribuio t segue uma metodologia um pouco diferente daquela da normal padro. De fato, como existem muitas distribuies de Student no seria possvel tabel-las da mesma forma que a da normal padro. Assim cada linha de uma tabela representa uma distribuio diferente e cada coluna representa um valor de confiana que poder ser ou /2, isto , a tabela poder ser unilateral ou bilateral. A linha de cada tabela fornece a distribuio t com parmetro n - 1 denominado de graus de liberdade, isto , o grau de liberdade = = n - 1 = linha da tabela. Neste caso, o intervalo de confiana com probabilidade 1 - para a mdia ser: [ X - t/2 S
n

; X + t/2 S

] onde:

X a estimativa por ponto da mdia da populao;

S o desvio padro da amostra e uma estimativa do desvio padro da populao e t/2 o valor da distribuio t cuja rea direita igual a /2, isto , o valor de t tal que: P(t > t/2) = /2, ou ento: P(- t/2 < t < t/2) = 1 - .

Exemplo:
Uma amostra de tamanho 25 foi retirada de uma populao com o objetivo de estimar a sua mdia e forneceu os valores x = 50 e s = 10. Qual o intervalo de 95% de confiana para a mdia desta populao?

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

18

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

Soluo:
Tem-se 1 - = 95%, ento = 5% e / 2 = 2,5%. O coeficiente de confiana que deve ser buscado na distribuio t com = n - 1 = 25 - 1 = 24. Esta a linha da tabela. A coluna poder ser o valor = 5% ou ento o valor / 2 = 2,5%, dependendo do tipo de tabela. Em qualquer caso o que se procura o valor t com grau de liberdade igual a 24, isto , o valor t24 tal que: P(- t/2 < t24 < t/2) = 95% Este valor vale 2,064. (Note-se que na a normal este mesmo valor valia 1,96). Ento o intervalo de confiana de 95% para a mdia desta populao ser: [ X - t/2 S
n

; X + t/2 S

] = [50 - 2,064.10/5; 50 + 2,064.10/5] = [50 - 4,13; 50 + 4,13] =

[45,87; 54,13], ou seja, pode-se afirmar com uma certeza de 95% de que este intervalo conter a mdia desta populao. Convm notar que a ltima linha da tabela da distribuio t apresenta valores coincidentes com aqueles que seriam obtidos se fosse utilizado a distribuio normal padro. Isto ocorre porque a distribuio t tende a distribuio normal medida que o tamanho da amostra aumenta, isto , a distribuio normal o limite da distribuio t quando o tamanho da amostra tende ao infinito. Esta aproximao j ser bastante boa para amostras de tamanho n > 30. Assim se a amostra for superior a 30 pode-se utilizar a distribuio normal ao invs da distribuio t, isto , pode-se ler os valores na normal padro, ou ento na ltima linha da tabela t.

2.3.2. Da proporo populacional


Seja P = proporo amostral. Sabe-se que para n > 30 a distribuio amostral de P aproximadamente normal com mdia P = e desvio padro (erro padro) P =
(1 ) . Pode-se ento utilin

zar a curva normal para estabelecer os limites para o intervalo de confiana. Lembrando que o que se quer um intervalo que contenha o parmetro populacional com probabilidade 1 - ento tem-se:

/2.

P(-z/2 < Z < z/2) = 1 - , onde z/2 o valor da normal padro com rea direita igual a Mas Z = (P- P) / P ento substituindo na expresso acima vem: P(-z/2 < (P - P) / P < z/2 ) = 1 - . Trabalhando esta desigualdade, segue que:

P(P - z/2P < P <P + z/2P) = P(P - z/2P < <P + z/2P) = 1 - . Que o intervalo procurado. Assim o intervalo de confiana (probabilidade) de 1 - para a proporo P de uma populao dado por: [P- z/2
(1 ) (1 ) ; P + z/2 ]. n n

Observando-se a expresso acima pode-se perceber que o intervalo de confiana para a proporo populacional , depende dele mesmo, isto , necessrio calcular o erro amostral que est expresso em funo de . Como o objetivo estimar este valor, evidentemente ele no conhecido. As-

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

19

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

sim necessrio utilizar, sua estimativa P , isto , necessrio substituir por P na expresso P = 
(1 ) . Desta forma o intervalo acima ficar: n

[P- z/2

P(1 P) P(1 P) ; P + z/2 ], onde: n n

P a estimativa por ponto da proporo populacional .


P = 
P(1 P) uma estimativa do erro padro, isto , do desvio padro amostral e n

z/2 o valor da distribuio normal padro cuja rea direita igual a /2. o valor de Z tal que: P(Z > z/2) = /2, ou ento: (-z/2) = /2.

Exemplo 1:
Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobre sua preferncia por determinado produto. Destas 400 pessoas, 240 disseram preferir o produto. Determinar um intervalo de confiana de 95% de probabilidade para o percentual de preferncia dos consumidores em geral para este produto.

Soluo:
Tem-se 1 - = 95%, ento = 5% e / 2 = 2,5%. O coeficiente de confiana que deve ser buscado na normal padro valor z/2 de Z tal que: P(Z > z/2) = 2,5%, ou ento: (-z/2) = 2,5%. Este valor vale 1,96. A estimativa por ponto para a proporo populacional ser: p = f/n = 240/400 = 0,60 = 60%. Ento o intervalo de confiana de 95% para a proporo populacional ser: [P- z/2
P(1 P) P(1 P) 0,60(1 0,60 ) 0,60(1 0,60 ) ; P + z/2 ] = [0,60 - 1,96 .; 0,60 + 1,96 ] n n 400 400

= [60% - 4,80% ; 60% + 4,80%] = [55,20%; 64,80%], ou seja, pode-se afirmar com uma certeza de 95% de que este intervalo conter a proporo populacional, isto , a verdadeira percentagem dos consumidores que preferem o produto pesquisado.

Exemplo 2:
Numa pesquisa de mercado para estudar a preferncia da populao de uma cidade em relao ao consumo de um determinado produto, colheu-se uma amostra aleatria de 300 consumidores da cidade e observou-se que 180 consumiam o produto. Determinar um IC de 99% para a proporo populacional de consumidores do produto.

Soluo:
Tem-se 1 - = 99%, ento = 1% e / 2 = 0,5%. O coeficiente de confiana que deve ser buscado na normal padro valor z/2 de Z tal que: P(Z > z/2) = 0,5%, ou ento: (-z/2) = 0,5%. Este valor vale 2,575. A estimativa por ponto para a proporo populacional ser: p = f/n = 180/300 = 0,60 = 60%.
Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/

20

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

Ento o intervalo de confiana de 99% para a proporo populacional ser: [P- z/2
P(1 P) P(1 P) 0,60(1 0,60 ) 0,60(1 0,60 ) ; P + z/2 ] = [0,60 - 2,58 .; 0,60 + 2,58 ] n n 300 300

= [60% - 7,28% ; 60% + 7,28%] = [52,72%; 67,28%], ou seja, pode-se afirmar com uma certeza de 99% de que este intervalo conter a proporo populacional, isto , a verdadeira percentagem dos consumidores que preferem o produto pesquisado.

2.3.3. Da varincia populacional ( 2)


Sabe-se que o estimador no-tendencioso de 2 S2 e que E(S2) = 2, enquanto V (S2) = 22/(n -1). No entanto, para se construir um intervalo de confiana para 2 necessrio, ainda conhecer qual o comportamento de S2 , isto , qual o modelo terico (probabilstico) seguido pelo estimador. Assim antes de se construir um intervalo de confiana para a varincia populacional necessrio se conhecer um novo modelo probabilstico denominado de qui-quadrado e representado por 2 (c grego).

A distribuio qui-quadrado
A distribuio ou modelo qui-quadrado pode ser obtida de uma soma de variveis normais
n 2 padronizadas, isto , 2 = Zi . n i =1

A distribuio assimtrica positiva (possu uma cauda direita) e de depende do parmetro . Sabe-se tambm que:
2

E(2) = e que V(2) = 2. A figura 2.1 mostra alguns exemplos de modelos qui-quadrado.

0,8

0,6

0,4

0,2

0 0,0 0,7 1,4 2,1 2,8 3,5 4,2 4,9 5,6 6,3 7,0 7,7 8,4 9,1 9,8

Figura 2.1 - Algumas distribuies qui-quadrado

A comportamento, distribuio de probabilidade, apresentado pela varincia amostral (S2) est relacionado com a distribuio (modelo) 2 atravs do seguinte resultado:

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

21

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

menos de uma constante. Neste caso = n -1.


2

21 = n

(n 1) S2

, isto , a varincia segue uma distribuio 2 com "n - 1" graus de liberdade a

Tabelas
A distribuio 2 est tabelada em funo do grau de liberdade n - 1 = (linha da tabela) e rea sua direita, isto , P(2 > c) = . Na realidade o que est tabelado a funo inversa da 2, isto , entrando com o valor do parmetro (graus de liberdade) e uma determinada probabilidade (rea), a tabela fornece um valor da varivel (abscissa) tal que a probabilidade direita (rea) deste valor seja igual a rea especificada.

O intervalo
2 Suponha que seja fixado um nvel de confiana de 1 - e que 1 e 2 sejam dois valores 2 2 da distribuio 2 tais que P( 1 < 2 < 2 ) = 1 - . 2 2 P( 1 < 2 < 2 ) = 1 - 2 2 P( 1 <

(n 1) S2

< 2 ) = 1 - 2

P(

2 2

<

1 2 < 2)=1- 2 (n 1) S 1
< 2 < (n 1) S2
2 1

P(

(n 1) S2 2 2

)=1-

Assim o intervalo de confiana (probabilidade) de 1 - para a varincia da populao dado por:


(n 1) S2 (n 1) S2 ; 2 2 1 2

2.3.4. Do desvio padro populacional ( )


Para determinar um intervalo de confiana de "1 - " de probabilidade para o desvio padro populacional basta apenas tomar a raiz quadrada positiva dos termos do intervalo para a varincia populacional. Assim o intervalo ser:
(n 1) S2 (n 1) S2 ; 2 2 1 2 O significado deste intervalo :

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

22

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

(n 1) S2 << P 2 2

(n 1) S2 = 1 . 2 1

Exemplo:
Uma amostra extrada de uma populao normal forneceu uma varincia de s2 = 8,38. Determinar um intervalo de confiana de 90% para a varincia da populao e um intervalo de mesma confiabilidade para o desvio padro da populao.

Soluo.
Neste caso necessrio inicialmente determinar os valores da distribuio 2, de modo, que 2 1 tenha uma rea (probabilidade) direita igual a 95% e 2 tenha uma rea (probabilidade) direita 2
2 igual a 5%. Estes valores so: 1 = 3,940 e 2 = 18,307. 2

O intervalo de confiana, para a varincia, ser:


(n 1) S2 (n 1) S2 ; 2 2 1 2 (11 1).8,38 (11 1).8,38 18,307 ; 3,940

[4,58; 21,27] O intervalo de confiana, para o desvio padro, ser: (n 1) S2 (n 1) S2 ; 2 2 1 2


(11 1).8,38 (11 1).8,38 ; 18,307 3,940

4,58;

21,27; ]

[2,14; 4,61].

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

23

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

3. EXERCCIOS
(01) De uma populao com N = 12 elementos retirada uma amostra aleatria simples, sem reposio, de n = 5. (01.1) Quantas so as possveis amostras? (01.2) Qual a probabilidade de cada uma destas amostras ser selecionada? (02) Uma populao composta dos elementos: A, B, C, D e F. (02.1) Liste todas as possveis amostras aleatrias simples, sem reposio, com n = 2. (02.2) Liste todas as aas, sem reposio, de tamanho n = 3. (02.3) Determine a probabilidade de ser sorteada a amostra BC. (02.4) Determine a probabilidade de ser sorteada a amostra ACD. (03) A tabela, ao lado, a distribuio de freqncias de uma amostra proveniente de determinada populao. (03.1) Determine o tamanho da amostra. (03.2) Determine uma estimativa da mdia da populao. (03.3) Determine uma estimativa da varincia da populao. (03.4) Determine uma estimativa da proporo de valores pares na populao. (04) A tabela ao lado apresenta valores amostrais. (04.1) Qual o tamanho da amostra? (04.2) Determine uma estimativa para a mdia da populao. (04.3) Determine uma estimativa do desvio padro populacional. (04.4) Determine uma estimativa dos valores mpares de X.

X 1 2 3 4

f 40 45 8 7

Elementos A B C D E

X 5 7 12 15 10

(05) Uma populao formada pelos elementos: A = 3, B = 6, C = 9 e D = 12. (05.1) Determine os seguintes parmetros: (a) mdia, (b) varincia e (c) proporo de elementos menores que 8. (05.2) (a) Construa a distribuio amostral da mdia da amostra utilizando aas, sem reposio, de tamanho n = 2. (b) Determine a expectncia e a varincia da distribuio amostral em (a) (c) Construa a distribuio amostral da mdia da amostra utilizando aas, sem reposio, de tamanho n = 3. (d) Determine a expectncia e a varincia da distribuio amostral em (c) (5.3) (a) Construa a distribuio amostral da varincia amostral utilizando aas, sem reposio, de tamanho n = 2 e determine a sua expectncia. (b) Utilize a correo de populao finita para as varincias obtidas em (a) obtendo a distribuio amostral da varincia corrigida e determine sua expectncia. (c) Construa a distribuio amostral da varincia corrigida utilizando aas, sem reposio, de tamanho n = 3 e determine sua expectncia.
Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 24

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

(d) Utilize a correo de populao finita para as varincias obtidas em (c) obtendo a distribuio amostral da varincia corrigida e determine sua expectncia. (5.4) (a) Construa a distribuio amostral para o estimador da proporo de elementos menores que 8 utilizando aas, sem reposio, de tamanho n = 2. (b) Determine a expectncia e a varincia da distribuio em (a). (c) Construa a distribuio amostral para o estimador da proporo de elementos menores que 8 utilizando aas, sem reposio, de tamanho n = 3. (d) Determine a expectncia e a varincia da distribuio em (c). (06) Utilize os valores da amostra tabelada ao lado, extrada aleatoriamente e sem reposio, de uma populao com N = 2000 elementos, para estimar: (06.1) A mdia da populao. (06.2) A varincia da populao. (06.3) O percentual de elementos menores que 6. (06.4) O erro amostral da mdia.

X 0 |-- 2 2 |-- 4 4 |-- 6 6 |-- 8 8 |-- 10

f 27 51 49 48 25

(07) De uma populao com N = 4000 pessoas de uma regio foi obtida uma amostra aleatria, sem reposio, de 400 pessoas que revelou 60 analfabetos. Estime: (07.1) A proporo de analfabetos da regio. (07.2) O erro amostral do estimador proporo. (08) Uma aas de tamanho 900 extrada de uma populao bastante grande apresentou 40% de pessoas do sexo masculino. Estime o erro amostral do estimador proporo de pessoas do sexo masculino. (09) Uma populao tem mdia 500 e desvio padro 30. (09.1) Determinar a probabilidade que uma aas de 100 elementos apresentar um valor mdio superior a 504,50. (09.2) Calcule a probabilidade de que uma aas com n = 64 valores apresentar mdia entre 492,5 e 507,5. (09.3) Se uma aas de n = 144 for extrada desta populao, qual o percentual de mdias amostrais que estaro entre 495,5 e 504,5? (10) Uma populao normalmente distribuda com mdia 800 e desvio padro 60. (10.1) Determine a probabilidade de que uma aas de tamanho 9 apresentar mdia menor que 780. (10.2) Calcule a probabilidade de que uma aas de tamanho n = 16 tenha mdia entre os valores 781,4 e 818,6. (10.3) Que percentual de mdias amostrais de uma amostra de tamanho n = 25 estaro no intervalo [776; 824]? (11) A proporo de eleitores de um candidato 20%. (11.1) Qual a probabilidade de uma amostra aleatria simples de 100 eleitores apresentar uma proporo amostral superior a 26%? (11.2) Qual a probabilidade de uma amostra aleatria simples de 400 eleitores apresentar uma proporo de eleitores do candidato entre 17% e 23%? (11.3) Se a amostra aleatria for de 625 eleitores, qual a percentual de valores do estimador proporo amostral que estaro no intervalo [0,16864; 0,23136]? (12) Admitindo que a probabilidade nascer um menino ou uma menina seja iguais, determine a probabilidade de que das prximas 400 crianas a nascerem:
Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 25

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

(12.1) Menos de 45% sejam meninas. (12.2) Mais de 54% sejam meninos. (13) De uma distribuio normal com varincia 2,25, obteve-se a seguinte amostra: 27,5; 25,6; 28,2; 26,1 e 25,0 Determinar um intervalo de confiana para a mdia desta populao com confianas de: (13.1) 95% (13.2) 99% (14) Atravs de uma aas de 145 profissionais de certa regio, verificou-se que o salrio mdio de 8 salrios mnimos (s.m.) com um desvio padro de 1,8 s.m. A amostra tambm forneceu a informao de que 70% dos profissionais eram casados. (14.1) Determine e interprete o intervalo de confiana de 95% para o salrio mdio de todos os profissionais desta regio. (14.2) Determine e interprete o intervalo de confiana de 99% para a proporo de profissionais casados desta regio? (14.3) Determine e interprete um Intervalo de Confiana de 90% para 2. (15) A amostra apresenta os valores da varivel tamanho da famlia coletados atravs de uma aas em uma vila popular. (15.1) Determine e interprete o intervalo de confiana de 95% para o parmetro tamanho familiar mdio por domiclio da vila. (15.2) Determine e interprete o intervalo de confiana de 90% para o parmetro proporo de domiclios da vila com tamanho igual ou superior a cinco.

X 3 4 5 6 7

f 10 14 19 15 07

(16) A varincia de uma populao 150. Deseja-se obter um intervalo de confiana para a mdia da populao com uma confiabilidade de 95% e um erro mximo de 2. Quantos valores desta populao devem ser retirados aleatoriamente? (17) Quer-se estimar a mdia de uma populao de varincia desconhecida atravs de um intervalo de confiana de 95% e com erro de estimao mximo de 5 unidades. Atravs de uma amostra piloto de 100 valores a varincia foi estimada em 400 unidades. Que tamanho deve ter a amostra final? (18) Uma amostra preliminar de pessoas de uma determinada comunidade apresentou 18% de analfabetos. Com este resultado quer-se estimar a proporo de analfabetos da populao com uma confiabilidade de 95% e com um erro de estimao mximo de 2,5%. Qual o tamanho da amostra a ser utilizada? (19) De uma populao normalmente distribuda foi extrada uma aas de n = 10 que apresentou os valores abaixo: 4 8 12 5 7 9 10 11 6 8 (19.1) Determine uma estimativa da varincia populacional. (19.2) Determine uma estimativa da mdia populacional e do correspondente erro amostral? (19.3) Determine um intervalo de confiana de 95% para a mdia desta populao. (20) A tabela apresenta os valores de uma amostra retirada de uma populao normal. Determine: (20.1) Um intervalo de confiana de 95% para a mdia desta populao. (20.2) Um intervalo de confiana de 99% para a mdia desta populao.

X 04 |-- 08 08 |-- 12 12 |-- 16 16 |-- 20

f 8 8 6 4
26

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

4. RESPOSTAS DOS EXERCCIOS


(01) (1.1) 792 (1.2) 1/792 (02) (2.1) AB AC AD AE BC BD BE CD CE DE (2.2) ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE (2.3) 1/10 (2.4) 1/10 (03) (3.1) 100 (04) (4.1) 5 (05) (5.1) (a) = 7,50 (5.2) (a)
x f( x )

(3.2) 1,82 (4.2) 9,80 (b) 2 = 11,25

(3.3) 0,73 (4.3) 3,96 (c) = 0,50

(3.4) 0,52 = 52% (4.4) 0,60 = 60%

6 1/4

7 1/4

8 1/4

9 1/4

(b) E( X ) = 7,50 (c)


x

V( X ) = 3,75 6,0 1/6 7,5 2/6 9,0 1/6 10,5 1/6

4,5 1/6

f( x )

(d) E( X ) = 7,50 (5.3) (a)

V( X ) = 1,25

s2 f(s2)
 s2  f( s2)

4,5 3/6

18,0 2/6

40,5 1/6

E(S2) = 15 2
(b)

3,375 3/6

13,500 2/6

30,375 1/6

 E( S2 ) = 11,25 = 2

(c)

s2 f(s2)
 s2  f( s2)

9 1/2

21 1/2

E(S2) = 15 2
(d)

9 1/2

17 1/2

 E( S2 ) = 11,25 = 2

(5.4) (a)

p f(p)

0 1/ 6

0,5 1 4/ 1/ 6 6 V(P) = 1/12

(b)

E(P) = 0,50

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

27

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

(c)

p f(p)

1/3 1/2

2/3 1/2 V(P) = 1/36


(6.2) s2 = 6,1628 (7.2) 1,69% (9.2) 95,44 (10.2) 78,50% (11.2) 86,64% (12.2) 5,48% (13,2) [24,75; 28,21] (9.3) 92,82% (10.3) 95,44% (11.3) 95% (6.3) p = 63,50% (6.4) 0,1666

(d) E(P) = 0,50 (06) (6.1) x = 4,93 (07) (7.1) 60/400 = 15% (08) 1,63% (09) (9.1) 6,68% (10) (10.1) 15,87% (11) (11.1) 6,68% (12) (12.1) 2,28% (13) (13.1) [25,17; 27,79]

(14) (14.1) [7,71; 8,29] Tem-se 95% de certeza de que o salrio mdio de todos os profissionais da rea est entre 7,71 s.m. e 8,29 s.m. (14.2) [60,20%; 79,80%] Tem-se 99% de confiana de que a percentagem de profissionais da rea que so casados esteja entre 60,20% e 79,80%. (14.3) [2,70; 3,98]. Tem-se 90% de confiana de que o valor da varincia populacional pertena a este intervalo. (15) (15.1) [4,62; 5,22] Tem-se 95% de confiana de que o valor mdio do tamanho familiar da vila esteja entre 4,62 e 5,22 membros. (15.2) [53,23%; 72,93%] H 90 de certeza de que o percentual de famlias com 5 ou mais membros esteja entre 53,23% e 72,93%. (16) n = 145 (17) n = 62, como a amostra piloto utilizada foi de n = 100 mais confivel ficar com a amostra piloto. (18) n = 908 (19) (19.1) 6,67 (20) (20.1) [9,19; 12,65] (19.2) 8 e 0,82 (20.2) [8,58; 13,26] (19.3) [6,15; 9,85]

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

28

SRIE: Estatstica Bsica Texto 3: AMOSTRAGEM & ESTIMAO

5. REFERNCIAS
[BUS86] BUSSAB, Wilton O, MORETTIN, Pedro A. Estatstica Bsica. 3. ed. So Paulo, Atual, 1986. [HOF80] HOFFMAN, Rodolfo. Estatstica para Economistas. So Paulo. Livraria Pioneira Editora, 1980. [NET74] NETO, Pedro Luiz de Oliveira Costa. Estatstica. So Paulo, Edgard Blcher, 1977. [NET74] NETO, Pedro Luiz de Oliveira Costa, CYMBALISTA, Melvin. Probabilidades: resumos tericos, exerccios resolvidos, exerccios propostos. So Paulo, Edgard Blcher, 1974. [MAS90] MASON, Robert D., DOUGLAS, Lind A. Statistical Techniques in Business And Economics. IRWIN, Boston, 1990. [MEY78] MEYER, Paul L. Probabilidade: aplicaes Estatstica. Traduo do Prof. Ruy C. B. Loureno Filho. Rio de Janeiro, Livros Tcnicos e Cientficos Editora S.A., 1978 [STE81] STEVENSON, William J. Estatstica Aplicada Administrao. So Paulo. Editora Harbra, 1981. [WON85] WONNACOTT, Ronald J., WONNACOTT, Thomas. Fundamentos de Estatstica. Rio de Janeiro. Livros Tcnicos e Cientficos Editora S. A., 1985.

Prof. Lor Viali - viali@mat.pucrs.br

- http://www.mat.pucrs.br/~lori/

29