Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
SUMÁRIO PÁGINA
Introdução à inferência estatística 2
Amostragem e estimador 2
Variância de estimadores 10
Consistência e distribuição amostral 14
Estimador de Máxima Verossimilhança 16
Lista de Exercícios resolvidos em aula 52
Gabarito 67
Dica de um concurseiro
05949764803
O exemplo mais clássico é o da cozinheira que prova uma colher do seu preparo a
fim de determinar se o mesmo está muito salgado. Ora, a colher que ela experimentou
é só uma parte de seu cozido, mas, com base nesta amostra, ela irá inferir como
está toda a panela.
Entendeu? Ela não precisa provar a panela toda para tirar suas conclusões, ela irá se
basear somente em parte dela, isso é inferência! Na estatística é a mesma coisa,
muitas vezes não temos dados sobre toda uma população, mas precisamos tirar
conclusões a respeito da mesma, assim necessitaremos de inferência estatística. Isso
é comum no dia a dia de um pesquisador!
05949764803
Há diversas formas de obter uma amostra com base em uma extração de elementos
de uma população. Tais métodos têm muitas particularidades e formalismos que vão
além do escopo deste curso. Porém, precisamos saber alguns dos métodos mais
conhecidos em amostragem. Vamos a eles!
Quer um exemplo? Suponha que tenhamos uma população com a renda de diversos
indivíduos em uma economia. Podemos dividir a população em “classe baixa”, “classe
média” e “classe alta”. A partir daí, aplicaríamos uma AAS em cada um destes estratos
para obtermos nossa amostra. A ideia deste procedimento é diminuir a variância
dentro das amostras para cada estrato. Perceba que qualquer estatística a ser
aplicada à amostra deve ser ponderada pelo tamanho do estrato.
Agora, vamos tratar de um caso muito parecido com o anterior. Neste caso, a AAS
será aplicada sobre os subgrupos e não mais sobre os indivíduos da população.
Por exemplo, suponha que há diversos bairros em uma cidade com variabilidade
05949764803
interna significativa, mas bastante semelhantes entre si. Neste caso, “sortearíamos”
alguns destes bairros como “amostras” da população total. Você está realizando a
amostragem sobre conglomerados, entende? Segue-se, então, uma análise de todos
os indivíduos nos conglomerados escolhidos.
Amostragem Sistemática
Nessa técnica supõe-se que temos uma listagem das unidades populacionais. Para
um valor fixado, sorteamos um elemento entre os primeiros da listagem. Depois
observamos, sistematicamente, indivíduos separados por unidades. Por exemplo,
se e sorteamos o oitavo elemento, observamos depois o décimo oitavo, o
vigésimo oitavo, etc.
Neste caso, o pesquisador só realiza amostragem com os casos que ele tem a sua
disposição. Assim, acaba-se por realizar uma pesquisa com somente uma parcela da
população, o que pode, inclusive, gerar vieses em sua conclusão. Não é possível
generalizar os resultados encontrados para a população, contudo este tipo de
amostragem pode ser útil no início de uma pesquisa, testar questionários, por
exemplo.
indivíduos, a amostra será feita de tal forma que 60% dela (600) sejam homens e 40%
(400) sejam mulheres.
Amostragem Intencional
Porém, raramente isso ocorre, pois quase nunca temos toda a população, mas
somente uma amostra. Nesse caso, a média calculada com base na amostra seria
um estimador do parâmetro populacional. Assim:
05949764803
Isso está aproximadamente correto, mas nem sempre a mesma “fórmula” que
utilizamos para o cálculo de uma estatística na população é a que devemos usar na
amostra. Isso deriva do fato de que o estimador que iremos utilizar na amostra deve
ser não viesado.
Se eu digo para vocês que um estimador não é viesado, eu estou dizendo que, na
média, ele “acerta”, ou seja, dá o valor “real” do parâmetro. Ou seja:
uma determinada amostra, basta calcular a média como sempre fizemos para a
população ( ), pois este é um estimador não viesado para a média populacional.
Só que agora o buraco é mais embaixo! A estatística que aprendemos para calcular
a variância de uma população é dada por:
E, por consequência:
E:
-“Isso quer dizer que aquela fórmula não nos dá uma estatística não viesada
quando aplicada à amostra”?
Precisamente!
Olha pessoal, não vou ficar fazendo demonstração de cada uma destas afirmações
porque isso não é importante para seu concurso! Se vocês quiserem saber como se
05949764803
Assim, pode-se provar que, para obtermos estimadores não viesados para a variância
e desvio padrão amostrais, devemos nos utilizar das seguintes estatísticas:
-“A única diferença é que o denominador deixa de ser ( ) e passa a ser ( )”?
Exato!
Apesar de estas não serem as únicas estatísticas que podem ser avaliadas em termos
da comparação parâmetro\estimador, para fins de concurso, estas são as mais
cobradas.
Pense comigo, não basta que um estimador acerte na média, mas também é
desejável que os seus resultados apresentem baixa variância ao redor do valor
populacional que se esta tentando estimar.
Perceba que o segundo gráfico tem alguns valores que praticamente “acertam” o valor
populacional, mas o mesmo apresenta grande variabilidade. Ou seja, o segundo
estimador tem maior variância. 05949764803
O ideal seria que nosso estimador não viesado tivesse a menor variância dentre todos
os estimadores não viesados. Este é o conceito de estimador absolutamente
eficiente.
Entendeu? Isso é muito importante na hora de decidirmos qual estimador usar. Você
não precisa conhecer a variância de todos os tipos de estimadores possíveis (até
porque são infinitos), mas esta é uma forma importante de avaliarmos o quanto um
estimador é “bom”. Podemos comparar a eficiência de alguns estimadores não
viesados por meio de análise de suas variâncias.
Um ponto importante! Como foi dito, vocês não precisam conhecer as propriedades
de uma infinidade de estimadores, podendo compará-los no caso concreto diante de
vocês. Entretanto, há um estimador importante em termos de prova: o estimador da
média amostral. Com base neste estimador, vocês vão ver, podemos chegar a várias
conclusões importantes que podem ser estendidas a qualquer distribuição de
probabilidade.
Então, vamos aprofundar nosso estudo sobre o estimador da média amostral. Pode-
se provar que:
05949764803
Se você só tiver a variância amostral, substitua (desvio padrão) por este valor,
essa estatística é chamada de erro padrão.
Não é possível responder isso a não ser se comparamos a variância deste último com
a variância de todos os estimadores não viesados possíveis da média populacional.
Pode-se demonstrar, entretanto, que, quando a variável para a qual está sendo
calculada a média seguir uma distribuição normal, a média amostral é um estimador
eficiente da média populacional.
É fácil perceber que o nosso estimador é assintoticamente não viesado, pois ele
não é viesado! Entretanto, a recíproca não é verdadeira, pois há vários estimadores
que são viesados e assintoticamente não viesados. Assim:
05949764803
Para quem não é da área de exatas, o que esta simbologia está dizendo é que, no
limite, quando a amostra tende ao infinito ( ), a esperança da média amostral é
igual à média populacional.
Um teorema importante que trata sobre o nosso caso concreto da média amostral
define que, dada uma variável , é possível demonstrar que a sua média amostral, ,
assumirá uma distribuição normal conforme a amostra aumenta. Este é o famoso
Teorema do Limite Central (TLC).
05949764803
O que isso está dizendo é que, conforme a amostra aumenta, a distribuição da média
amostral converge para uma distribuição normal! Percebe a importância disso? A
distribuição normal é uma antiga conhecida nossa e nós sabemos muita coisa sobre
ela (já aprendemos algumas em aulas anteriores e iremos aprender ainda mais em
aulas futuras). Isso é muito útil em várias ocasiões, pois como sabemos do TLC,
podemos nos basear nisso para entendermos o comportamento assintótico da média
amostral de qualquer variável!
Antes de começarmos, preciso ensinar mais uma coisinha sobre cálculo diferencial.
Bom, o porquê de tudo isso é ensinar a vocês como encontrar o ponto máximo ou
mínimo de uma função, isso é, um ponto extremo.1
Como você encontra um ponto extremo de uma função? Simples! Derive a função
(você já aprendeu) e iguale a zero. Por exemplo, suponha a função:
1
Para quem entende de matemática, saiba que estamos tratando de pontos extremos locais e não
globais. É só uma introdução mesmo.
Retornando.
Então, como funciona? Você tem uma amostra de valores obtidos de uma população
que, por hipótese, você conhece a distribuição de probabilidade (ou pelo menos
supõe que seja desta forma). Com base nestas informações, o estimador MLE irá lhe
fornecer os parâmetros desta distribuição de probabilidade que maximizam a chance
de que esta amostra realmente siga esta distribuição!
Ou seja, a FV busca estimar o valor do parâmetro (ou parâmetros, já que pode ser
mais de um) em função dos valores da amostra. E qual o formato da função ? Aí
é que entra o conhecimento que você deve ter da distribuição de probabilidade que a
amostra segue, esta determinará a forma desta função!
Fica difícil visualizar sem um exemplo. Vamos supor que uma amostra (
) siga uma distribuição normal, com média e variância desconhecidas.
Vamos determinar os estimadores MLE para a média e variância desta amostra.
Rearranjando a expressão:
ln
É isso aí! Você tem uma amostra e uma função de distribuição, no nosso
exemplo a Normal. O que nós vamos fazer é, para dados valores de , vamos
encontrar os valores de média e variância que maximizam a probabilidade que
tal amostra siga esta distribuição! Como se faz isso? Derive em função dos
parâmetros e iguale o resultado a zero! Não se preocupe, você não precisa
saber se o ponto é de máximo ou mínimo, a banca fará a questão de forma a
sempre ser um ponto extremo de máximo local!
E a variância?
05949764803
Opa! Mas, este não é o estimador de variância amostral já conhecido por vocês da
aula de Estatística. O denominador deve ser , caso contrário o mesmo será
viesado! Portanto, o estimador MLE para a variância é viesado!
Viram? O estimador MLE nem sempre é não viesado! Mas, o mesmo tem
propriedades úteis, como:
1) É consistente
2) Sua distribuição converge para a normal conforme a amostra tende ao infinito
(assintoticamente normal)
3) O estimador tende a ser eficiente conforme a amostra tende ao infinito
(assintoticamente eficiente)
-“Professor, mas porque você ensinou os conceitos básicos de derivada se não é tão
simples aplicá-los no caso do exemplo que você mostrou?
05949764803
Ou seja, é a própria proporção deste elemento na amostra como um todo, tal como
no caso da média!
Simples não? É claro que não! Esta aula é muito complexa. Faça um favor a
você, releia o conteúdo mais de uma vez! Vamos aos exercícios.
Exercício 1
Resolução
plicando:
05949764803
Alternativa (b).
Exercício 2
Resolução
Alternativa (c).
05949764803
Resolução
Alternativa (e).
(SEFAZ\RJ – FGV/2010 - alterada) Com base em uma variável ( ) que segue uma
05949764803
Exercício 4
Quando uma variável tem distribuição normal, sua média aritmética tem distribuição
exata normal. Alternativa correta.
Exercício 5
Resolução
Exercício 6
Resolução
â05949764803
Portanto:
Substituindo os valores:
Alternativa verdadeira.
Exercício 7
Resolução
05949764803
Alternativa (a).
a) Eficiente
b) Não viesado
c) Consistente
d) De Mínimos Quadrados
e) De Máxima Verossimilhança
Resolução
Alternativa (b).
Exercício 9
05949764803
Resolução
Alternativa correta, pois, dado que ambos são não tendenciosos, o que tiver menor
variância será “mais eficiente”.
Resolução
Alternativa verdadeira.
Exercício 11
Resolução
Como nós vimos na aula, um estimador não viesado é consistente, mas a recíproca
não é verdadeira.
Alternativa falsa.
05949764803
Animal Efetivo
Asininos 80
Bovinos 300
Caprinos 120
Equinos 150
Suínos 250
Resolução
Aproximadamente 9.
Alternativa (e).
Exercício 13
Resolução
05949764803
Alternativa (c).
Exercício 14
Resolução 05949764803
Exercício 15
Resolução
Alternativa errada. Como há um número par de elementos em cada uma das turmas
(30 alunos), a mediana será uma média aritmética entre a 15ª e 16ª nota.
Exercício 16
Resolução
Alternativa errada. Tal como vimos na aula 01, nestes casos é útil usarmos o conceito
de coeficiente de variação, pois a variância é afetada pelos valores absolutos dos
dados analisados. Com base no coeficiente de variação aí sim poderíamos usar o
valor do desvio padrão para afirmar que uma turma tem notas mais homogêneas do
que a outra.
05949764803
Exercício 17
O erro padrão da média das notas dos alunos da turma A foi superior a 0,40.
Resolução
Quando você ouvir “erro padrão”, pense em desvio padrão. A diferença é que
erro padrão” é o caso no qual não temos o valor do desvio padrão populacional,
assim, usamos o desvio padrão amostral. Assim:
Alternativa errada.
Exercício 18
05949764803
Resolução
ç ç
O valor é constante, portanto sua esperança é igual ao seu próprio valor. Portanto,
vamos tirá-lo do parêntese e aplicar nossa propriedade:
Exercício 19
Resolução
Exercício 20
Resolução
Alternativa verdadeira. Pois, este pode não apresentar a menor variância possível na
classe de estimadores que está sendo comparado.
Exercício 21
Resolução
Exercício 22
Resolução
Exercício 23
Resolução
05949764803
Correto. Dado que cada estrato escolhido é uma parte da amostra total, a média da
população deve ser calculada de forma a ser uma média ponderada, levando-se em
conta o “tamanho” de cada parcela desta amostra. Porém, caso a amostragem seja
uniforme, uma média aritmética simples funciona, dado que todas tem o mesmo
tamanho.
Exercício 24
Resolução
Alternativa (e).
Exercício 25
Resolução
Questão puramente conceitual. Vamos nos lembrara do que foi dito lá em cima:
Assim, fica fácil chegar à resposta que a única das amostragens que não é
probabilística é a por quotas (ou cotas).
Alternativa (b).
Exercício 26
c)Por conglomerados
d)Estratificada
e)Sistemática
Perceba o que está sendo dito! O exercício está te dizendo que a hipótese é que os
itens da população estão distribuídos em subgrupos diferentes, mas que representam
bem a população como um todo.
Em primeiro lugar, nós podemos perceber que a resposta será a alternativa (c) ou (d),
afinal estas são amostragens probabilísticas que levam em conta “subgrupos da
população”.
Mas, a resposta é Amostragem por Conglomerados. Por que? O exercício afirma que
os subgrupos, apesar de diferentes entre si, são representativos da população total,
ou seja, cada um destes grupos pode ser usado para representar a população como
um todo! Vamos pensar em um jeito fácil de representar estes tipos de amostragem:
Qual você acha que tem subgrupos que melhor representam a população total? A
Amostragem por Conglomerados, afinal, esta amostragem forma subgrupos que
seriam “pequenas populações” no que se refere à presença de diversas parcelas da
população. No caso da Amostragem Estratificada, os subgrupos seriam “partes” da
população total que seriam homogêneos entre si.
05949764803
Alternativa (c).
Exercício 27
Resolução
Olha pessoal, esta questão é ótima para ser “decorada” no que se refere à concepção
do motivo pelo qual seria utilizada uma amostragem não probabilística. Vamos
resumir:
1)dificuldade de obter os dados completos;
05949764803
2)análise preliminar;
3)necessidade de conhecer o comportamento de um grupo específico.
Alternativa (c).
Exercício 28
Resolução
I. A ASI nunca poupa mais tempo, afinal a AAS é muito fácil de ser utilizada,
05949764803
Exercício 29
Resolução
Guarde isso! O esquema dos cinco números é dado por cinco medidas de uma
amostra, nesta ordem:
-Menor valor da amostra
-1º quartil
-2º quartil ou mediana
-3º quartil 05949764803
Alternativa (a).
Exercício 30
Resolução
Alternativa (c).
Exercício 31
Resolução
05949764803
Assim, o total de pessoas que fizeram algum destes reforços foi de:
Portanto, a quantidade que não fez nenhum dos dois foi de:
Alternativa (b).
05949764803
Exercício 32
(EMPLASA – VUNESP/2014)
Resolução
Normalmente não é esta “mamata”! Você terá de perceber se a questão está falando
de uma amostra para usar o estimador da variância no caso da amostra, ou seja, o
denominador n-1! Mas, a questão é fácil:
05949764803
Alternativa (d).
Exercício 33
(EMPLASA – VUNESP/2014)
Resolução
De uma maneira bem simples, o que a questão está dizendo é que houve um
problema no processo de amostragem, decorrente de um processo de amostragem
“casual”! O que houve foi que, no processo natural de amostragem probabilística,
existem erros que são inevitáveis. Esse é um erro de amostragem!
05949764803
Alternativa (a).
Exercício 34
(MPOG – ESAF/2015)
05949764803
Resolução
ã
ã
ã
Suponha que o total seja de 100 pessoas. Neste caso, 50 pessoas gostam de carne
de gado, 40 de javali e 10 de jacaré. Dentre estes indivíduos, suponha que, para fins
de facilitar o cálculo e trabalhar com números redondos, cada um destes indivíduos
tenha ido a restaurantes 2 vezes em um determinado período de tempo.
Neste caso:
Dos que gostam de gado: nas 100 visitas (50 pessoas com duas idas cada),
não foi pedida cerveja em 20% das vezes, ou seja, 20 vezes.
Dos que gostam de javali: nas 80 visitas (40 pessoas com duas idas cada),
não foi pedida cerveja em 10% das vezes, ou seja, 8 vezes.
Dos que gostam de jacaré: nas 20 visitas (10 pessoas com duas idas cada),
não foi pedida cerveja em 5% das vezes, ou seja, 1 vez.
Portanto:
A probabilidade de gostar de javali e não beber é dada pelas 8 visitas acima do total
de 200 visitas. Assim, a probabilidade condicional é de:
05949764803
ã
ã
Alternativa (a).
Resolução
Vamos “fingir” que, no total há 100 automóveis nesta cidade. Neste caso, 25 são da
marca A e 50 da B, certo?
05949764803
Portanto, 17,5 (10 + 7,5) carros são pretos (eu sei, ficou estranho ter 7,5 carros
pretos da marca A, mas eu acho que esse tipo de exercício fica melhor
visualizado com essa técnica de atribuir um número para o percentual dado no
enunciado), pois só estas duas marcas possuem carros pretos. Como nós fizemos
com que cada automóvel representasse 1% do total, 17,5 é a mesma coisa que
17,5%!
Alternativa (a).
Resolução
05949764803
Alternativa (e).
Exercício 1
Exercício 2
(SEFAZ\RJ – FGV/2010 - alterada) Com base em uma variável ( ) que segue uma
distribuição normal de média 15 e desvio padrão ( ) 2, com uma amostra de 36
elementos, julgue as afirmativas.
Exercício 4
Exercício 5
05949764803
Exercício 6
Exercício 8
a) Eficiente
b) Não viesado
c) Consistente
d) De Mínimos Quadrados
e) De Máxima Verossimilhança
Exercício 9
Exercício 11
Exercício 12
Animal Efetivo
Asininos 80
Bovinos 300
Caprinos 120
Equinos 150
Suínos 250
05949764803
(SEDUC-AM – 2011\CESPE)
Exercício 14
Exercício 15
Exercício 16
Exercício 17
O erro padrão da média das notas dos alunos da turma A foi superior a 0,40.
05949764803
Exercício 18
Exercício 19
Exercício 20
Exercício 21
05949764803
Exercício 22
Exercício 23
Exercício 24
Exercício 25
Exercício 26
05949764803
Exercício 27
Exercício 28
Exercício 29
Exercício 30
d) 45%
e) 50%
Exercício 32
(EMPLASA – VUNESP/2014)
05949764803
(EMPLASA – VUNESP/2014)
05949764803
Exercício 34
(MPOG – ESAF/2015)
05949764803
Exercício 35
(Agente fazendário – ESAF\2010)
Exercício 36
(ANEEL – ESAF/2009)
05949764803
1-b
2-c
3-e
4-V
5-F
6-V
7-a
8-b
9-V
10-V
11-F
12-e
13-c
14-V
15-F
16-F
17-F
18-F
19-F
20-V
21-V
22-F
23-V
24-e
25-b
26-c
27-c
28-a
29-a
30-c
31-b
05949764803
32-d
33-a
34-a
35-a
36-e
jeronymobj@hotmail.com