Sei sulla pagina 1di 27

Roteiro

1. Introduo
2. Teorema Central do Limite
3. Conceitos de Estimao Pontual
Distribuio Amostral e Estimao
4. Mtodos de Estimao Pontual
Pontual de Parmetros 5. Referncias

Populao e Amostra

Populao:
Conjunto de elementos que apresentam pelo menos
Introduo uma caracterstica em comum
Populao Alvo:
Populao de interesse da pesquisa
Amostra:
Qualquer subconjunto no vazio da populao

1
Tcnicas de Amostragem

CARACTERSTICAS Procedimento a ser adotado na seleo dos


DA
Populao POPULAO elementos da amostra
O principal objetivo central obter uma

INFERNCIA
amostra representativa
ESTATSTICA
Amostra que representa toda a populao da
melhor maneira possvel
EXTRAO
DE AMOSTRAS PROBABILIDADE A representatividade depende de:
ALEATRIAS ESTATSTICA
DESCRITIVA
Metodologia adotada para seleo da amostra
Amostra CARACTERSTICAS Tamanho da amostra
DA
AMOSTRA

Problema Fundamental da Estatstica Planejando um Experimento

Identificar seu objetivo


Coletar dados amostrais
A partir da observao de amostras, COMO Usar procedimento aleatrio para evitar vcio
podemos tirar CONCLUSES sobre a Analisar dados e tirar concluses
POPULAO ?

2
Erro Amostral Erro Noamostral

Diferena entre um resultado amostral e o Incorreo na coleta, registro ou anlise de


verdadeiro resultado populacional dados amostrais
so resultantes de flutuaes amostrais aleatrias. Ex.
Coleta tendenciosa de amostra
Utilizao de instrumento descalibrado
Registro incorreto de dados amostrais

Inferncia Estatstica
Estimao de Parmetros
Definio:
Procedimentos generalizar caractersticas de Estimao Pontual
populao a partir da informao contida na amostra.
Estimao Intervalar
Baseia-se na Teoria de Probabilidades Intervalos de Confiana
reas:
Estimao de parmetros
Testes de hipteses.

3
Teste de Hipteses
Conceitos Fundamentais

Hiptese: Amostra aleatria:


Afirmao (alegao) sobre caracterstica populacional As variveis aleatrias X1, X2, ..., Xn so uma
amostra aleatria de tamanho n, se:
Forem independentes
Teste de Hipteses:
Cada Xi tiver mesma distribuio de probabilidades
Procedimento padro para se testar uma afirmativa
sobre caracterstica populacional

Parmetro: Estatstica:
Quantidades de interesse da populao Qualquer funo da amostra que no dependa de
Em geral, desconhecidas parmetros desconhecidos
Mdia de uma populao () Exemplo : Algumas estatsticas da amostra aleatria
Desvio-padro de uma populao () X1, X2, ..., Xn:
Representadas por letras gregas X(1) = mn(X1, X2, ..., Xn)
Notao para estimador qualquer: X(n) = mx(X1, X2, ..., Xn)

4
Distribuio amostral: Espao paramtrico ()
Distribuio de probabilidades de uma estatstica Conjunto em que o parmetro toma valores
Exemplo: Exemplo: Seja a amostra aleatria X1, X2, ..., Xn da
Distribuio amostral da mdia varivel X ~ N(, 2)
Parmetros da distribuio amostral da mdia Se 2=1, ento = o parmetro desconhecido e
= {, < < }
Se = 0, ento = 2 o parmetro desconhecido e
= {2, 2 > 0}

Estimador de Estimativa de parmetro populacional:


Qualquer estatstica que assuma valores em . um valor especfico, ou um intervalo de valores,
Notao: ^ usado para estimar parmetro populacional
Exemplo: Estimativa pontual:
^
Alguns estimadores para a mdia de uma populao um nico valor numrico de uma estatstica
Mdia da amostra
Mediana da amostra
X1
Etc.

5
Teorema Central do Limite

Seja X1, X2, ..., Xn uma amostra aleatria de


tamanho n de uma populao (finita ou infinita),
Teorema Central do Limite com mdia e varincia finita 2. Ento

quando n .

Exemplo Simulao
Comentrios:
A aproximao normal para a mdia amostral Populao exponencial com mdia 1:
depende do tamanho da amostra =1
Com populao contnua, unimodal e simtrica, na Gerao de 10.000 valores dessa populao
maioria dos casos, o TCL trabalha bem para Amostra de tamanho 1 (n = 1)
pequenas amostras (n = 4, 5).
Em muitos casos de interesse prtico, a aproximao
normal ser satisfatria para n 30
Se n < 30, o TCL funcionar se a distribuio da
populao no for muito diferente da normal

6
Amostra n =1 Amostra n = 2

> mean(media_n); sd(media_n)


> mean(amostra); sd(amostra) [1] 1.012711
[1] 0.9990838 [1] 0.7129089
[1] 1.010478

Exemplo Simulao
Amostras de tamanhos 2, 4, 10 e 20
Populao com densidade em U:
f(x) = 12 (x 0,5)2
Gerao de 10.000 valores dessa populao
Amostra de tamanho 1 (n = 1)

n_2 n_4 n_10 n_20


n 2.0000000 4.0000000 10.0000000 20.0000000
media 0.9951777 1.0004503 0.9963200 0.9997876
padrao 0.7038013 0.5018562 0.3190797 0.2223573

7
Amostra n =1 Amostras de tamanhos 2, 4, 10 e 20

> mean(amostra); sd(amostra)


[1] 0.5061657
[1] 0.3877259 n_2 n_4 n_10 n_20
n 2.0000000 4.0000000 10.0000000 20.00000000
media 0.5017138 0.4986490 0.4994313 0.49993781
padrao 0.2742383 0.1957755 0.1221512 0.08599018

Comparao de Populaes Caso 1: As duas populaes so normais


Distribuio amostral da diferena
Considere duas populaes:
Populao 1: mdia 1 e varincia 12
Mdia da diferena de mdias amostrais:
Populao 2: mdia 2 e varincia 22
Amostras aleatrias das duas populaes?

Amostra da populao 1 de tamanho n1: X1
Varincia da diferena de mdias amostrais:
Amostra da populao 2 de tamanho n2: X2

8
Caso 2: populaes no normais com tamanhos Distribuio Amostral Aproximada de
amostrais maiores que 30 Diferena de Mdias Amostrais
Pode-se usar o TCL para aproximar a distribuio Suponha:
amostral da diferena:
Duas populaes independentes, com mdias 1 e 2
e varincias 12 e 22
Amostras aleatrias independentes de tamanhos n1 e
n2 dessas populaes

se as condies do TCL se aplicarem

Exemplo Vida de Motor

Motor de turbina de aeronave a jato


Vida de componente varivel aleatria com mdia
5000 h e desvio-padro 40 horas
Melhoria no componente: mdia 5050 h e desvio- Estimao Pontual Conceitos
padro 30 horas
Suponha amostra de n1 = 16 componente do processo
antigo e n2 = 25 do processo aprimorado
Qual a probabilidade de que a diferena das
mdia amostrais seja no mnimo 25 horas?

9
Propriedades de um Estimador Vcio

Alguma propriedades importantes: Vcio de um estimador:


^ ^
Vcio Vcio() = E[]
Consistncia ^
Um estimador no viciado (no viesado, no
^
Eficincia tendencioso) para um parmetro se E[] =
A esperana de um estimador est relacionada
com sua exatido

A varincia amostral no viciada para estimar


Exemplos:
a varincia populacional (2)?
A mdia amostral no viciada para estimar a mdia
verdadeira (populacional):

X1 (primeiro item coletado da amostra) no viciado


para estimar a verdadeira mdia

10
Varincia de Estimador
Estimador de Varincia Mnima
^ ^
1 e 2 estimadores no-viciados de
Varincias diferentes Se considerarmos todos os estimadores no-
tendenciosos de , aquele com a menor varincia
ser chamado de estimador no-tendencioso de
varincia mnima
Esse estimador o mais provvel, dentre todos os
no-viciados, para produzir uma estimativa que seja
prxima do valor verdadeiro
^ ^
Var(1) < Var(2)
mais provvel que ^1 produza uma estimativa mais
prxima do valor verdadeiro de

Erro Padro Se o erro-padro envolver parmetros desconhecidos


que possam ser estimados, ento a substituio
^ daqueles valores produz um erro-padro estimado
O erro padro de um estimador o seu desvio- Exemplo: O erro padro da mdia amostral :
padro.
Se no conhecermos s, mas substitumos pelo desvio-
padro amostral, ento o erro-padro amostral estimado da
mdia amostral :
O erro padro (ou da varincia) do estimador est
relacionada com sua preciso

11
Quando o estimador seguir uma distribuio normal, Quadro comparativo:
podemos estar confiantes que o valor verdadeiro do
parmetro estar entre dois erros-padro da
estimativa
Para grandes valores de n este um resultado til
Nos casos em que o estimador no-viciado e no
normalmente distribudo
Estimativa do parmetro, em no mximo 6% das vezes, se
desviar do valor verdadeiro tanto quanto 4 erros-padro

Consistncia
Exemplos:
^ A mdia amostral consistente para estimar a mdia
Um estimador consistente se medida em verdadeira
que o tamanho amostral aumenta, seu valor O primeiro item coletado da amostra no
esperado converge para o parmetro de interesse consistente para estimar a mdia populacional.
e sua varincia converge para zero.
O estimador consistente se e

Consistncia uma propriedade assinttica (grandes


amostras)

12
Erro Quadrtico Mdio
Estimadores tendenciosos podem ser preferveis a
^ estimadores no-tendenciosos se tiverem EQM menor
O erro quadrtico mdio de um estimador do
parmetro definido como:

EQM Vcio e erro-padro

O EQM um critrio importante para comparar ^ estaria provavelmente mais


Estimativa baseada em 1
dois estimadores prxima do valor verdadeiro do que a baseada em ^2

Estimador timo de : EQM de Estimadores No-viciados


Tem EQM menor ou igual ao EQM de qualquer
outro estimador, para todos os valores de
^
No caso em que um estimador no viciado
Estimadores timos raramente existem para um parmetro , ento:

13
Exemplo:
Eficincia No caso de amostra proveniente de distribuio
Normal.
^ ^
Dados dois estimadores 1 e 2, no viciados Mdia amostral e mediana amostral so no viciadas para
^
para um parmetro , dizemos que 1 mais estimar a mdia populacional:
^ ^ e
eficiente que 2 se Var[1] < Var[2]. Mdia amostral e mediana amostral so consistentes para
estimar a mdia verdadeira
e

A mdia amostral mais eficiente que a mediana amostral


para estimar a mdia populacional

Mtodos para Obteno de Estimadores

Obteno de bons estimadores:


As propriedades de estimadores no nos orientam
Mtodos de Estimao Pontual sobre como constru-los
Mtodos para obteno de estimadores pontuais:
Mtodo dos Momentos
Mtodo da Mxima Verossimilhana

14
Momentos
Mtodo dos Momentos
Seja X1, X2, ..., Xn uma amostra aleatria de
Ideia geral: populao com distribuio de probabilidades
Igualar os momentos da populao (definidos em expressa por f(x) (funo de probabilidade, se X
termos de esperanas) aos correspondentes for discreta ou funo de densidade de
momentos da amostra probabilidades, se X for contnua)
Os momentos da populao so funes de k-simo momento populacional
parmetros desconhecidos
Essas equaes so resolvidas de modo a se obter k-simo momento da amostra
estimadores dos parmetros desconhecidos
com k = 1, 2, ...

Estimadores de Momento Exemplo


Seja uma amostra aleatria de funo de Estimador de momentos da distribuio
probabilidade (ou de densidade de exponencial
probabilidade) com m parmetros desconhecidos f(x) = e x, x>0
1, 2, ..., m. E(X) = 1/
^
Os estimadores de momento 1, ^2, ..., ^m so 1 momento da amostra: X
encontrados igualando os m primeiros momentos da
populao aos m primeiros momentos da amostra
Os estimadores sero a soluo das equaes
resultantes

15
Exemplo Estimador de Momento da Normal

Tempo de falha de mdulo eletrnico de motor Amostra aleatria oriunda de populao normal,
Amostra: com parmetros e 2.
n=8 Momentos da normal:
(11,96; 5,03; 67,40; 16,07; 31,50; 7,73; 11,10; 22,38)
Mdia amostral: 21,65
Estimativa de momento de :
Estimador de momentos:

Estimador de Momento da Gama Exemplo

Amostra aleatria oriunda de populao normal, Continuao exemplo 7.6 Tempos de falha
com parmetros r e .
Momentos da gama:

Estimador de momentos:

r um pouco maior que 1


bem possvel que a distribuio gama ou exponencial
fornea um modelo razovel para os dados

16
Mtodo da Mxima Verossimilhana No conhecemos p0, mas podemos considerar o
cenrio em p0 = .
Exemplo de Motivao: Sob esta particular condio, a probabilidade de
Dados oriundos de populao binomial com gerar o dado que realmente observamos (X = 3) :
parmetros 10 e p0.
p0: constante e desconhecido
Funo de probabilidade de X:
Podemos calcular esta probabilidade sob a
condio que p0 = p
Observa-se X = 3
Objetivo:
Basear-se no dado disponvel para estimar o valor Essa funo denominada funo de
verdadeiro do parmetro verossimilhana e denotamos por L(p; 3)

Princpio da Mxima Verossimilhana Funo de Log-Verossimilhana


Devemos usar como nossa estimativa de p0 o Como o log uma funo crescente, o valor de p
valor de p que faz L(p; 3) o maior possvel que maximiza L(p; 3) o mesmo que maximiza
log L(p; 3)
Toma-se o valor do parmetro Em geral, conveniente maximizar log L(p; 3) ao
que torna mais provvel o dado invs de L(p; 3)
observado
Assim, em nosso exemplo, a funo de log-
verossimilhana definida como:

17
O ponto crtico da funo um ponto no domnio de
em que a derivada zero

A estimativa determinada pelo valor de X


Funo de Verossimilhana Definio
Se tivssemos observado X = k, teramos a
estimativa
Suponha X uma varivel aleatria com
distribuio de probabilidades f(x; ), em que
Em nosso exemplo, o estimador de mxima
um nico parmetro desconhecido.
verossimilhana ?
Sejam x1, x2, ..., xn os valores observados de amostra
aleatria de tamanho n.
A funo de verossimilhana da amostra :

18
Estimador de Mxima Verossimilhana Exemplo Distribuio de Bernoulli

O estimador de mxima verossimilhana (EMV) Seja X uma varivel aleatria de Bernoulli


^
de o valor que maximiza a funo de Funo de probabilidade:
verossimilhana L(; x)

p o parmetro desconhecido a ser estimado

No caso discreto, o EMV um estimador que


maximiza a probabilidade de ocorrncia dos valores
da amostra

Funo de verossimilhana da amostra Derivada da funo de log-verossimilhana:

Estimativa de mxima verossimilhana da


amostra x:

Funo de log-verossimilhana
Estimador de mxima verossimilhana para
amostras de Bernoulli
Proporo de sucessos na amostra

19
Exemplo Duas amostras de n= 40 com e

Bernoulli com parmetro p desconhecido Pontos de mxima verossimilhana


Duas amostras de n= 20 com e correspondentes proporo de
sucessos de cada amostra

Pontos de mxima verossimilhana


correspondentes proporo de
sucessos de cada amostra

Amostragem industrial pode ser modelada como


amostras de varivel aleatria de Bernoulli:
n itens selecionados ao acaso de linha de produo
Varivel Aleatria:

Estatstica de teste:

As curvas crescem (decrescem) mais


acentuadamente nas proximidades dos pontos de
mximo na amostra maior (n = 40)
Varincia do EMV menor para amostras maiores)

20
Exemplo Distribuio Exponencial Funo de verossimilhana da amostra

Seja X uma varivel aleatria exponencial


Funo de densidade de probabilidade:

Funo de log-verossimilhana
o parmetro desconhecido a ser estimado

Exemplo
Derivada da funo de log-verossimilhana:
(Continuao Ex. 7.6)
Tempo de falha de mdulo eletrnico de motor
Estimativa de mxima verossimilhana da Amostra:
n=8
amostra x:
(11,96; 5,03; 67,40; 16,07; 31,50; 7,73; 11,10; 22,38)
Mdia amostral: 21,65
Estimativa de mxima verossimilhana de :

Estimador de mxima verossimilhana para


amostras exponenciais
O EMV da exponencial igual a seu estimador de
momentos

21
Funo de log-verossimilhana da amostra Comparao exponenciais:
Curvas das diferenas de log-verossimilhana com o
mximo em cada tamanho amostral
Mantida mesma mdia amostral de 21,65
Funo atinge mximo
para =0,0462 n mx)
l(
8 32,599
20 81,497
40 162,994
Inclinao da curva de log-
verossimilhana acentua-se com
aumento da amostra.

Picos acentuados = maior


Funo relativamente plana na regio do mximo preciso na estimao
Parmetro no estimado muito precisamente

Funo de verossimilhana da amostra


Exemplo Distribuio Normal desconhecida e 2 conhecido

Seja X uma varivel aleatria normal


Funo de probabilidade:

Situaes de estimao dos parmetros: Funo de log-verossimilhana


desconhecido e conhecido
2
e 2 so desconhecidos

22
Funo de verossimilhana da amostra
Derivada da funo de log-verossimilhana:
e 2 desconhecidos

Estimativa de mxima verossimilhana da


amostra x:
Funo de log-verossimilhana

Estimador de mxima verossimilhana da mdia


verdadeira para amostras normais

Derivadas parciais da log-verossimilhana: Estimativas de mxima verossimilhana da


amostra x:

23
Estimador de mxima verossimilhana da mdia
Comentrios
e varincias verdadeiras para amostras normais

Para usar a estimao de mxima


verossimilhana, a distribuio da populao
tem de ser conhecida ou suposta
O EMV da varincia amostral viciado para a
varincia verdadeira Em geral, o mtodo da mxima verossimilhana
produz estimadores com boas propriedades
estatsticas
Tm boas propriedades assintticas dos estimadores
(so consistentes e assintoticamente eficientes)

Estimador de Mxima Verossimilhana -


Propriedade da Invarincia
Propriedades
^
Sob condies gerais e no-restritivas, quando Seja um estimador de mxima verossimilhana
^
uma amostra de tamanho n for grande e se for de .
um EMV do parmetro , ento: Ento o EMV de qualquer funo h() desse
^ um estimador consistente ^ ^
parmetro a mesma funo h() do estimador
Assintoticamente no viciado No caso da distribuio normal
^ varincia de ^
A assintoticamente eficiente O EMV de
tem distribuio assintoticamente normal
O EMV de no o desvio-padro amostral S

24
Complicaes no Uso da Estimao de
Exemplo Distribuio Gama
Mxima Verossimilhana

Nem sempre simples maximizar a funo de Seja X uma varivel aleatria exponencial
verossimilhana Funo de densidade de probabilidade:
Pode no ser possvel utilizar diretamente
mtodos de clculo para determinar o mximo
de L(; x) r e so os parmetros desconhecidos a serem estimados

Funo gama:

Derivadas da funo de log-verossimilhana:


Funo de verossimilhana da amostra

Estimativa de mxima verossimilhana da


amostra x:

Funo de log-verossimilhana

No h soluo exata para essas equaes

25
Aplicao Funo de verossimilhana da amostra

Mtodo Lincoln-Peterson de Marcao e Recaptura


Objetivo: estimar tamanho de populao de animais
Variveis: O espao paramtrico so os inteiros positivos
t: nmero de animais capturados e marcados No se pode usar Clculo
k: nmero de animais recapturados Razo de verossimilhana para sucessivos
r: nmero de animais marcados que so recapturados
valores da populao total
N: populao total (desconhecida)
Os valores t e k so fixos (no so aleatrios)
So determinados no planejamento do estudo N mais provvel que N1 quando a razo > 1
r: observao amostral (pode variar)

Desenvolvimento razo de verossimilhanas: Determinao mximo:

Seja [x]: parte inteira de x

Isso nos d o EMV de N:

26
Exemplo
Objetivo:
Estimar populao de peixes
Procedimento:
So marcados t = 200 peixes
Peixes so devolvidos ao habitat
Aguarda-se que os peixes devolvidos misturem-se
populao
So recapturados k = 400 peixes
Dos peixes recapturados, h r = 43 peixes marcados
Populao estimada: 1.860 peixes
Obs. Dados obtidos em simulao com N=2000
Populao real: 2000 (na prtica, desconhecido)

Bibliografia Recomendada

Montgomery, D. C. (LTC)
Referncias Estatstica Aplicada e Probabilidade para
Engenheiros

Pinheiro, J. I. D et al. (Campus)


Probabilidade e Estatstica: Quantificando a
Incerteza

27

Potrebbero piacerti anche