Sei sulla pagina 1di 5

Teoria da Estimação

População: é o conjunto de elementos para os quais desejamos que as nossas


conclusões sejam válidas – o universo de nosso estudo.
Amostra aleatória: são subconjuntos representativos de uma dada população,
que obedecem a dois princípios básicos: deve ser suficientemente grande e seus
constituintes terem sido selecionados ao acaso.
Parâmetro: é uma medida numérica que descreve certa característica dos
elementos da população. Por exemplo, a estatura média de uma população
constitui um parâmetro.
Estimação: é o processo; procedimento estatístico que permite prever, com
certa probabilidade, o valor de um parâmetro desconhecido (populacional) com
base nas informações obtidas da amostra.
Estatística: alguma medida associada com os dados de uma amostra a ser
extraída da população. Quando usada com o objetivo de avaliar (estimar) o valor
de algum parâmetro, também é chamada de estimador.
Erro amostral: é a diferença entre uma estatística e o parâmetro que se quer
estimar.
Estimador: é a estatística usada, por exemplo, a média da amostra é um
estimador da média populacional.
Estimativa: é um valor particular de um estimador, como por exemplo: 𝑥 = 2,5
é uma estimativa de 𝜇.
Distribuição de frequências: compreende a organização dos dados de acordo
com as ocorrências dos diferentes resultados observados.

Tipos de estimação:
Estimadores de ponto: Quando, a partir de uma amostra, procura-se tomar o
valor do parâmetro populacional desconhecido por um único número, embora
isso inclua a possibilidade de resultados de um vetor de valor único.
Estimadores de intervalo: Quando, a partir de uma amostra, procura-se tomar
o valor do parâmetro populacional desconhecido por um conjunto ou intervalo de
estimativas.

Intervalo de Confiança – IC

Def.: São intervalos baseados na distribuição amostral do estimador pontual, o


qual estabelece um conjunto de estimativas para o parâmetro com objetivo de
informar sobre o valor do mesmo. Até este momento, todos os estimadores
apresentados foram pontuais. Estes estimadores por apresentar um único
número, não fornece por si mesma qualquer informação sobre a precisão e a
confiabilidade da estimativa.

 Estimativa do Intervalo de Confiança da Média Aritmética (𝝈


conhecido):
Quando a variável populacional for normal, pelo Teorema das
Combinações Lineares, a distribuição amostral da média será normal.
Suponha que queiramos estimar a média 𝜇 de uma população qualquer, e para
tanto usamos a média (𝑋) de uma amostra de tamanho (𝑛).
𝑒 = (𝑋 − 𝜇)~𝑁(0, 𝜎𝑋2 )
𝑃(|𝑒| < 1,96𝜎𝑋 )

1
𝑃(|𝑋 − 𝜇| < 1,96𝜎𝑋 ) = 0,95
𝑃(−1,96𝜎𝑋 < 𝑋 − 𝜇 < 1,96𝜎𝑋 ) = 0,95
𝑃(𝑋 − 1,96𝜎𝑋 < 𝜇 < 𝑋 + 1,96𝜎𝑋 ) = 0,95
𝜎
𝑋 ± 𝑍𝛼⁄2
√𝑛
Ou
𝜎 𝜎
𝑋 − 𝑍𝛼⁄2 ≤ 𝜇 ≤ 𝑋 + 𝑍𝛼⁄2
√𝑛 √𝑛
Em que (𝑍𝛼⁄2 ), é chamado de valor crítico para a distribuição e é igual ao valor
correspondente a uma probabilidade da cauda superior igual a (𝛼⁄2), a partir da
distribuição normal padronizada.

Exemplo: Um fabricante de papel utiliza um processo de produção que opera


continuamente ao longo de todo um turno de produção. Espera-se que o papel
apresente uma média aritmética de comprimento igual a 11 polegadas e que o
desvio-padrão do comprimento seja igual a 0,02 polegada. Em intervalos
periódicos, são selecionadas amostras para determinar se a média do
comprimento do papel permanece, ainda, igual a 11 polegadas ou se no
processo de produção ocorreu algo de errado que possa ter modificado o
comprimento do papel produzido. Você seleciona uma amostra aleatória com
100 folhas, e a média aritmética do comprimento do papel é igual a 10,998
polegadas. Construa uma estimativa para o intervalo de confiança de 95% e 99%
para a média aritmética da população correspondente ao comprimento do papel.
Obs.: (𝑍2,5% = 1,96) e (𝑍0,5% = 2,58).

 Estimativa do Intervalo de Confiança da Média Aritmética (𝝈-


desconhecido), mas o tamanho da amostra é grande (𝒏 ≥ 𝟑𝟎):
𝑆 𝑆
𝑋 − 𝑍𝛼⁄2 ≤ 𝜇 ≤ 𝑋 + 𝑍𝛼⁄2
√𝑛 √𝑛
Exemplo: Uma pesquisa de mercado, feita junto a 100 pessoas selecionadas
aleatoriamente, revelou que o salário médio dos entrevistados é de R$ 1200,00.
O desvio-padrão é de R$ 200,00. Qual o intervalo de confiança de 95% para a
média de salários de todo o mercado considerado?

 Estimativa do Intervalo de Confiança da Média Aritmética (𝝈-


desconhecido), mas o tamanho da amostra é pequeno (𝒏 < 𝟑𝟎):
Quando o desvio-padrão populacional for desconhecido, não podemos
garantir a utilização da normal reduzida, pois o que se tem disponível é o desvio-
padrão amostral (𝑆). Como podemos constatar, a distribuição neste caso é a 𝑡-
Student, assim:
𝑆 𝑆
𝑋 − 𝑡𝛼⁄2 ≤ 𝜇 ≤ 𝑋 + 𝑡𝛼⁄2
√𝑛 √𝑛
Exemplo: Uma pesquisa de mercado, feita junto a 4 pessoas selecionadas
aleatoriamente, revelou que o salário médio dos entrevistados é de R$ 1200,00.
O desvio-padrão é de R$ 200,00. Qual o intervalo de confiança de 95% para a
média de salários de todo o mercado considerado? (𝑈𝑛𝑖𝑐𝑎𝑢𝑑𝑎𝑙 −> 𝑡 =
2,353 𝑒 𝐵𝑖𝑐𝑎𝑢𝑑𝑎𝑙 −> 𝑡 = 3,182).

2
 Estimativa do Intervalo de Confiança para a Proporção

Neste caso, a distribuição amostral original de (𝑝) não é normal e sim binomial.
Isso porque uma proporção é uma soma de Bernoullis dividida por uma
constante, que é o tamanho da amostra. Para garantir a normalidade desta
distribuição amostral, é necessário que utilizemos amostras aleatórias grandes,
𝑛 ≥ 30.

𝑝𝑞 𝑝𝑞
𝑝 − 𝑍𝛼⁄2 √ < 𝜋 < 𝑝 + 𝑍𝛼⁄2 √
𝑛 𝑛

Exemplo proporção: Em uma amostra aleatória de 2000 eleitores de um país,


constatou-se uma intenção de voto de 43% para um candidato à presidência, na
época de eleições. Depois das eleições, qual o intervalo de variação da
proporção de votos do candidato, com uma confiança de 99%? (𝑍0,5% = 2,58).

 Intervalo de Confiança para a soma ou diferença de médias quando


os desvios-padrão populacionais são conhecidos

(𝑋1 ± 𝑋2 ) − 𝑍√(𝜎12 ⁄𝑛1 ) + (𝜎22 ⁄𝑛2 ) ≤ 𝜇1 ± 𝜇2

≤ (𝑋1 ± 𝑋2 ) + 𝑍√(𝜎12 ⁄𝑛1 ) + (𝜎22 ⁄𝑛2 )

Observação:
Quando se sabe que 𝜎1 e 𝜎2 têm o mesmo valor, conhecido 𝜎, o erro-padrão da
soma ou diferenças de médias fica:
𝐸𝑃 = 𝜎√(1⁄𝑛1 ) + (1⁄𝑛2 )
Então:
(𝑋1 ± 𝑋2 ) − 𝑍𝜎√(1⁄𝑛1 ) + (1⁄𝑛2 ) ≤ 𝜇1 ± 𝜇2 ≤ (𝑋1 ± 𝑋2 ) + 𝑍𝜎√(1⁄𝑛1 ) + (1⁄𝑛2 )

Exemplo: Uma empresa tem duas filiais (A e B), para as quais as variâncias das
vendas diárias são de 27 e 9, respectivamente. Uma amostra de 36 dias forneceu
uma venda média diária de 40 peças para a filial A e 30 peças para a filial B.
Supondo que a distribuição diária de vendas seja normal, qual o intervalo de
confiança para a diferença de médias das vendas nas duas filiais com uma
confiança de 95%? (𝑍2,5% = 1,96).

3
 Intervalo de Confiança para a soma ou diferença de médias quando
os desvios-padrão populacionais são desconhecidos, mas
supostamente iguais.
Nesse caso, devemos substituir, na expressão do erro-padrão do caso anterior,
o desvio-padrão desconhecido, por uma estimativa. Como temos duas amostras,
devemos utilizar os resultados de ambas ao realizar essa estimação. Logo, a
estimativa da variância (𝜎 2 ) é:
2
(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22
𝑆𝑝 =
𝑛1 + 𝑛2 − 2

Esta é a média ponderada das variâncias amostrais.


𝑆[𝑋1 ± 𝑋2 ] = 𝐸𝑃 = √(𝑆𝑝2 ⁄𝑛1 ) + (𝑆𝑝2 ⁄𝑛2 ) = 𝑆𝑝 √(1⁄𝑛1 ) + (1⁄𝑛2 )

Assim,

(𝑋1 ± 𝑋2 ) − 𝑡𝑆𝑝 √(1⁄𝑛1 ) + (1⁄𝑛2 ) ≤ 𝜇1 ± 𝜇2 ≤ (𝑋1 ± 𝑋2 ) + 𝑡𝑆𝑝 √(1⁄𝑛1 ) + (1⁄𝑛2 )

Se as duas amostras forem suficientemente grandes, podemos utilizar a


distribuição normal associada à expressão do intervalo de confiança acima.
(𝑋1 ± 𝑋2 ) − 𝑍𝑆𝑝 √(1⁄𝑛1 ) + (1⁄𝑛2 ) ≤ 𝜇1 ± 𝜇2
≤ (𝑋1 ± 𝑋2 ) + 𝑍𝑆𝑝 √(1⁄𝑛1 ) + (1⁄𝑛2 )

Exemplo: De uma grande turma extrai-se uma amostra de quatro notas: 64, 66,
89 e 77. Uma amostra independente de três notas de uma segunda turma foi:
56, 71 e 53. Se for razoável admitir que as variâncias das turmas sejam
aproximadamente iguais, qual o intervalo de confiança de 95% para a diferença
de médias? (𝑡 = 2,57).
𝜙 = 𝑛1 + 𝑛2 − 2 = 4 + 3 − 2 = 5

 Intervalo de Confiança para a soma ou diferença de médias quando


os desvios-padrão populacionais são desconhecidos, mas
supostamente desiguais.
Suponhamos agora que não conhecemos os desvios-padrão das duas
populações, mas não podemos admitir que esses desvios-padrão são iguais, ou
seja, 𝜎1 ≠ 𝜎2 . Nesse caso, devemos substituir, na expressão do erro-padrão da
soma ou diferença de médias, os respectivos erros-padrão amostrais.
𝑆[𝑋1 ± 𝑋2 ] = 𝐸𝑃 = √(𝑆12 ⁄𝑛1 ) + (𝑆22 ⁄𝑛2 )
A distribuição por amostragem da soma ou diferenças de médias no caso
em que as variâncias são desconhecidas e supostamente distintas terá
distribuição normal se as amostras forem suficientemente grandes ou 𝑡 −
𝑆𝑡𝑢𝑑𝑒𝑛𝑡, em caso contrário.
Graus de liberdade:
(𝑉1 + 𝑉2 )2
𝜙= 2 −2
𝑉1 ⁄(𝑛1 + 1) + 𝑉22 ⁄(𝑛2 + 1)

4
Em que,
𝑉1 = 𝑆12 ⁄𝑛1 𝑉2 = 𝑆22 ⁄𝑛2
Para (𝑛 ≥ 30):
(𝑋1 ± 𝑋2 ) − 𝑍√(𝑆12 ⁄𝑛1 ) + (𝑆22 ⁄𝑛2 ) ≤ 𝜇1 ± 𝜇2

≤ (𝑋1 ± 𝑋2 ) − 𝑍√(𝑆12 ⁄𝑛1 ) + (𝑆22 ⁄𝑛2 )


Para (𝑛 < 30):
(𝑋1 ± 𝑋2 ) − 𝑡√(𝑆12 ⁄𝑛1 ) + (𝑆22 ⁄𝑛2 ) ≤ 𝜇1 ± 𝜇2 ≤ (𝑋1 ± 𝑋2 ) − 𝑡√(𝑆12 ⁄𝑛1 ) + (𝑆22 ⁄𝑛2 )

Exemplo: De uma pequena classe do curso do ensino médio pegou-se uma


amostra de 4 provas de matemática e obteve: média=81, variância=2. Outra
amostra, de 6 provas de biologia, forneceu: média=77, variância=14,4. Para
testar a hipótese de que as médias populacionais são iguais, qual o intervalo de
confiança de 99% para a diferença de médias, supondo os desvios-padrão
populacionais desiguais? (𝑡𝛼=1,𝜙=8 = 3,36)

 Intervalo de Confiança para a Soma ou Diferença de Proporções.


Se a proporção amostral 𝑝1 ~𝑁[𝑝1 ; (𝑝1 𝑞1 )⁄𝑛1 ] e 𝑝2 ~𝑁[𝑝2 ; (𝑝2 𝑞2 )⁄𝑛2 ], válidas
quando 𝑛 ≥ 30, então a distribuição amostral das diferenças ou somas será
aproximadamente normal.

Observação:
Quando não conhecemos os valores de (𝜋1 ) e (𝜋2 ), que são parâmetros
populacionais, e (𝑛 ≥ 30), substituímos 𝜋1 por 𝑝1 e 𝜋2 por 𝑝2 .
A expressão do intervalo de confiança fica, então:

(𝑝1 ± 𝑝2 ) − 𝑍√(𝑝1 𝑞1 ⁄𝑛1 ) + (𝑝2 𝑞2 ⁄𝑛2 ) ≤ 𝜋1 ± 𝜋2


≤ (𝑝1 ± 𝑝2 ) + 𝑍√(𝑝1 𝑞1⁄𝑛1 ) + (𝑝2 𝑞2 ⁄𝑛2 )

Exemplo: Num levantamento de opinião pública para previsão de uma eleição,


foram ouvidos 500 eleitores escolhidos ao acaso na cidade A onde 236 declaram
que iriam votar num verto candidato. Na cidade B, foram ouvidos outros 500
leitores onde 200 declararam que iriam votar no candidato em questão. Para
verificar, com base nesta previsão, se o desempenho do candidato difere nas
duas cidades, qual a estimativa intervalar com um nível de significância de 5%
para a diferença de proporções?

Potrebbero piacerti anche