Sei sulla pagina 1di 8

Probabilidade e Estatı́stica

5 – Processo de estimação

Faculdade

Araguaia-

Curso de Construção de Edifícios

SUMÁRIO

5

- PROCESSO DE ESTIMAÇÃO

1

5.1

TIPOS DE ESTIMADORES

5

1
1

5 - PROCESSO DE ESTIMAÇÃO

Em nossa penúltima unidade da disciplina de Probabilidade e Estatística vamos estudar as principais características do processo de estimação. Este processo consiste em levantar inferências a respeito à população, por meio da utilização de amostras. Para iniciar o estudo do processo de estimação, convêm resgatar os principais conceitos do estudo da Estatística, ou seja, população e amostra (estudados na primeira unidade da disciplina). Segundo Araújo (2008):

População corresponde ao conjunto de elementos que possui alguma característica em comum e que será estudada.

Amostra representa um subconjunto, uma parte da população que representa o todo.

Normalmente ao realizar-se um estudo estatístico é impossível ou impraticável trabalhar com toda a população. Assim a opção mais viável é utilizar uma amostra. Se essa amostra for representativa, os resultados obtidos poderão ser generalizados, ou seja, aplicados à população que deu origem a amostra. Neste contexto o pesquisar poderá levantar hipóteses das generalizações dos resultados, poderá testar essas hipóteses, que poderão ser aceitas ou rejeitadas. Todas as vezes que uma conclusão for firmada, tendo com base uma amostra, a generalização para a população, virá acompanhada de um grau de incerteza ou risco (MORETTIN, 2010). Denomina-se inferência estatística o conjunto de técnicas e procedimentos que permitem ao pesquisar atribuir um grau de confiabilidade, as afirmações acerca da população. Dessa forma a questão central da inferência estatística, é medir o grau de incerteza ou risco do processo de generalização, ou ainda do processo de estimação. Os instrumentos da inferência estatística permitem a viabilidade das conclusões por meio de afirmações estatísticas (MORETTIN, 2010). Para a análise do processo de estimação é preciso conhecer e compreender dois novos conceitos, parâmetro e estimador. O parâmetro corresponde a qualquer valor obtido da população. Já o estimador corresponde a qualquer valor obtido da amostra. Segundo Hoffmann (2006) no estudo de uma dada população, é desejável obter os valores dos parâmetros como, por exemplo, a média e a variância. Contudo, geralmente não conhecemos os valores desses parâmetros, e por esse motivo obtemos as respectivas estimativas a partir dos valores observados em uma amostra. Utilizam-se as amostras pelos seguintes motivos:

O tempo e/ou os recursos disponíveis não são suficientes para obter os valores para toda a população ou universo estatístico;

2
2

Pode impossível medir ou conhecer toda a população;

Há experimentos em que a mensuração da variável determina a destruição do elemento

onde a variável é medida (teste impacto com carros).

Segundo Morettin (2010) o principal objetivo do processo de estimação reside em calcular

o estimador, ou seja, um valor que represente o parâmetro (o verdadeiro valor). Estuda-se uma

população cuja distribuição é considerada conhecida por meio de sua função de densidade de

probabilidade, f ( , , ,

onde X é uma variável aleatória e (lê-se teta) são os

parâmetros da distribuição. Supõe-se que a X, a variável aleatória, possui uma distribuição

normal, que depende de 2 parâmetros, são eles: (lê-se mi), a média populacional, e (lê-se

sigma dois), a variância da população. Vale lembrar que os valores referentes a população são os

parâmetros. Sempre devemos avaliar um ou mais parâmetros da distribuição populacional,

tomando por base uma amostra aleatória simples. A principal questão é procurar funções de

observações que forneçam estimativas dos parâmetros populacionais. Os valores estimados

devem estar o mais concentrados em torno dos verdadeiros valores dos parâmetros de . Vamos

observar os estimadores da média populacional ( ) e da variância populacional ( ).

),

O estimador da média populacional ( ) é dado pelo cálculo do

vejamos o cálculo:

(lê-se “x” barra),

=

o

o

o

, onde:

é o estimador da média populacional;

é o somatório de todos os elementos da amostra;

é o elemento que multiplica o somatório de todos os elementos da amostra,

onde o “n” corresponde o quantidade de elementos que integram a amostra.

O estimador da variância populacional ( ) é dado pelo cálculo do (lê-se “s” dois),

vejamos o cálculo:

=

∑( ̅) 2 , onde:

o é o estimador da variância populacional;

3
3

o

o

∑( ̅) 2 é o somatório da diferença entre cada observação da amostra é a

média, elevado ao quadro.

é o elemento que multiplica o somatório, onde o “n” corresponde o

quantidade de elementos que integram a amostra.

Vejamos um exemplo prático do processo de estimação da média e variância de amostra.

Considerando o conjunto de dados a seguir vamos realizar a estimação.

A = {3, 5, 9, 13, 15}

Primeiramente, calculando a média ( ). Neste caso o “n” é igual a 5, pois o conjunto

“A”, que corresponde a um amostra de uma dada população, possui apenas cinco elementos.

que multiplicará o somatório de cada “xi”, ou seja, cada elemento do

Dessa forma teremos

conjunto “A”. Teremos:

=

=

=

× 45

Calculando, agora, a estimativa da variância (s ). Para realizar o cálculo do “ ”, é

preciso utilizar o valor anteriormente encontrado ( = 9). O primeiro passo consiste em realizar a

diferença entre cada valor do conjunto “A” pela média da amostra (9) e depois elevar cada valor

ao quadrado. Vejamos a tabela a seguir:

xi

 

xi -

(xi - ) 2

3

3

– 9 = - 6

(-6) 2 = 36

5

5

– 9 = - 4

(-4) 2 = 16

9

9 – 9 = 0

(0) 2 = 0

13

13

– 9 = 4

(4) 2 = 16

15

15

– 9 = 6

(6) 2 = 36

Realizado o processo anterior, cabe agora realizar o somatório de (xi - ) 2 , neste caso o

lugar observado é de 104. Para finalizar o cálculo basta multiplicar o último valor encontrado por

, lembrando que o “n” para o conjunto “A” é igual a 5. Vejamos:

" # = ∑( ) 2

4
4

" # = × $%

" # = % × $%

" # = #&

Recapitulando, o conjunto “A” é uma amostra, ou seja, o pequeno conjunto que representa uma população. A população neste caso não é conhecida, assim não é possível obter os parâmetros referentes à população. O que resta é utilizar amostra para estimar os parâmetros, ou seja, calcular os estimadores. Realizamos a estimação da média da população e da variância da população, conforme ilustra os cálculos anteriormente apresentados. Assim a estimativa da verdadeira média e variância são respectivamente 9 e 26.

5.1 TIPOS DE ESTIMADORES

Segundo Morettin (2010) existem dois tipos de processos de estimação: por ponto e por intervalo. No processo por estimação por ponto, a partir das observações, calcula-se uma estimativa, os exemplos desenvolvidos anteriormente correspondem a exemplos do processo de estimação pontual. Em nossa segunda unidade dessa disciplina estudamos as chamadas medidas de posição e dispersão, elas também correspondem a exemplos de estimativas pontais. Ainda segundo Morettin (2010) a estimação por pontos de um parâmetro não possui uma medida do possível erro cometido no processo de estimação. Uma maneira de materializar a incerteza desse tipo de processo é estabelecer limites, que com certa probabilidade incluam o verdadeiro valor do parâmetro da população. Esses limites são chamados limites ou intervalos de confiança, que determinam um intervalo, no qual deverá estar o verdadeiro valor do parâmetro. Logo, a estimação por intervalo, consiste na determinação de dois valores, tais que 1- (lê-se um menos alfa) seja a probabilidade de que o intervalo contenha o verdadeiro valor do parâmetro. Vale registrar que:

(lê-se alfa) corresponde ao nível de incerteza ou grau de confiança;

1- (lê-se um menos alfa) corresponde ao coeficiente de confiança ou nível de confiabilidade do processo de esticão por intervalo.

Cabe destacar que tanto o grau de confiança ((), com o coeficiente de confiança (1 – () pode ser expresso em termos percentuais (%). Em resumo, por meio de informações da amostra, devemos calcular os limites de um dado intervalo, que em 1- % (lê-se um menos alfa por

5
5

cento) dos casos inclua o calor do parâmetro a estimar e em % (lê-se alfa por cento) dos casos não inclua o valor do parâmetro. Vamos considerar o exemplo em que o (lê-se alfa) seja igual a 5%, logo o 1 - (lê-se um menos alfa), expresso em porcentagem, será igual a 95%. Suponhamos que seja feita uma amostra de 500 brasileiros e calcula-se a média de suas estaturas e encontra-se o valor de 1,69 m. Este valor representa uma estimativa pontual da verdadeira altura média de toda a população brasileira. Com a utilização do intervalo de confiança pode-se encontrar um intervalo, por exemplo, 1,65 a 1,75, que em 95% das vezes incluirá a verdadeira altura média dos brasileiros. Assim com a utilização do intervalo de confiança encontrar “espaço” que contem a verdadeira média referente à população. Encerramos aqui mais um tópico do conteúdo programático. Peço que você faça as atividades proposta, leia o material novamente, pesquise sobre o assunto e discuta com seus colegas os temas tratados até aqui. Até a próxima!

6
6

REFERÊNCIAS

ARAÚJO, E. Métodos numéricos aplicados à gestão. Curitiba: IESDE, 2008.

MORETTIN, L. G. Estatística Básica: probabilidade e inferência. São Paulo: Pearson Prentice Hall, 2010.

7
7