Sei sulla pagina 1di 14

Sérgio Paulino Bandeira

Ramalho Eduardo Mauride

Amade Eugénio Amade

Helena Monteiro

Gabriel Manuel

Amostragem e distribuição de amostras

(Licenciatura em Ensino de Matemática com Habilidade em Estatística)

Universidade Rovuma

Extensão do Niassa

2019
1

Sérgio Paulino Bandeira

Ramalho Eduardo Mauride

Amade Eugénio Amade

Helena Monteiro

Gabriel Manuel

Amostragem e distribuição de amostras

(Licenciatura em Ensino de Matemática com Habilidade em Estatística)

Trabalho da cadeira de Inferência Estatística


leccionada pelo docente Msc Mayawo a ser
apresentado no departamento de Ciências
Naturais e Matemática para fins avaliativos.

Universidade Rovuma

Extensão do Niassa

2019
2

Índice
1. Introdução................................................................................................................................. 3

1.1. Objectivos ......................................................................................................................... 3

1.1.1. Geral .......................................................................................................................... 3

1.1.2. Específicos ................................................................................................................. 3

2. CONCEITOS BÁSICOS ......................................................................................................... 4

3. Amostragens probabilísticas .................................................................................................... 4

3.1. Tipos de Amostragem ....................................................................................................... 4

3.1.1. Amostragem aleatória simples .................................................................................. 5

3.1.2. Amostragem aleatória estratificada ........................................................................... 5

3.1.3. Amostragem em cachos ............................................................................................. 5

3.1.4. Amostragem sistemática ............................................................................................ 5

4. Amostragem não probabilística ................................................................................................ 5

4.1. Amostra por conveniência ................................................................................................ 5

4.1.1. Vantagens e inconvenientes....................................................................................... 6

5. Amostra por quotas .................................................................................................................. 6

5.1. Vantagens e inconvenientes .............................................................................................. 7

6. Amostra por bola de neve......................................................................................................... 7

6.1. Tipos de amostra bola de neve .......................................................................................... 8

6.1.1. Vantagens e inconvenientes .......................................................................................... 8

7. Cálculo do tamanho da amostra para populações infinitas (> 100.000 elementos) ................. 8

8. Cálculo do tamanho da amostra para populações finitas ( <100.000 elementos) .................. 10

9. Conclusão ............................................................................................................................... 12

10. Bibliografia ......................................................................................................................... 13


3

1. Introdução

No estudo da estatística, vimos que população é o conjunto de elementos para os quais se deseja
estudar determinada(s) característica(s). Vimos também que uma amostra é um subconjunto da
população. No estudo da inferência estatística, o objectivo principal é obter informações sobre
uma população a partir das informações de uma amostra e aqui vamos precisar de definições mais
formais de população e amostra. Para facilitar a compreensão destes conceitos, iremos apresentar
alguns exemplos a título de ilustração. População, o grupo inteiro de objectos (unidades) dos
quais se pretende obter informações. A população deve ser definida claramente e em termos
daquilo que se pretende conhecer. Amostra uma parte ou subconjunto da população usada para
obter informação acerca do todo.
1.1.Objectivos:
1.1.1. Geral:
 Conciliar o estudo da amostragem por meio da inferência estatística;
1.1.2. Específicos:
 Dar o conceito de População, amostra e unidade estatística;
 Descrever o processo de amostragem a partir de uma população;
 Mostrar a obtenção da inferência estatística por meio da população e amostra;
 Descrever a distribuição de amostragem com respectivos métodos;
 Definir o tamanho de uma população seja ela, finita ou infinita;
4

2. CONCEITOS BÁSICOS
 População objecto: É a população total de interesse sobre a qual desejamos obter
informações.
 Característica populacional: Este é o aspecto da população que interessa ser medido.
 Unidade amostral: Deve ser definida de acordo com o interesse do estudo, podendo ser
uma peça, um indivíduo, uma família, uma fazenda, etc. A escolha deve ser feita no início
da investigação.
 Erro amostral: É a diferença entre um resultado amostral e o verdadeiro resultado
populacional.
 Amostra: Conjunto formado por um subconjunto da população.
 Censo: Exame de todos os elementos da população.

3. Amostragens probabilísticas
Os métodos de amostragem probabilística servem para assegurar uma certa precisão na estimação
dos parâmetros da população, reduzindo o erro amostral. A principal característica dos métodos
de amostragem probabilística reside no facto de que cada elemento da população tem uma
probabilidade conhecida e diferente de zero, de ser escolhida, aquando da tiragem ao acaso para
fazer parte da amostra.

3.1.Tipos de Amostragem
 A Amostragem Aleatória Simples;
 A Amostragem Aleatória Estratificada;
 A Amostragem em Cachos;
 A Amostragem Sistemática.
5

3.1.1. Amostragem aleatória simples


A Amostragem aleatória simples é uma técnica segundo a qual cada um dos elementos (sujeitos)
que compõe a população alvo tem igual probabilidade de ser escolhido para fazer parte de uma
amostra. A amostragem aleatória simples consiste em elaborar uma lista numérica de elementos
de onde se tira, com a ajuda de uma tabela de números aleatórios, uma série de números para
constituir a amostra.

3.1.2. Amostragem aleatória estratificada


A Amostragem aleatória estratificada é uma variante da amostra aleatória simples. Esta técnica
consiste em dividir a população alvo em subgrupos homogéneos chamados «estratos» e a seguir
tirar de forma aleatória uma amostra de cada estrato. A Amostragem aleatória estratificada é
utilizada quando a população inteira é reconhecida por certas características precisas, tais como a
idade, o sexo, a incidência de uma condição de saúde, tudo isto para assegurar a melhor
representatividade possível.

3.1.3. Amostragem em cachos


Consiste em retirar de forma aleatória os elementos por cachos em vez de unidades. É útil quando
os elementos da população estão naturalmente por cachos e por isso devem ser tratados como
grupos ou quando não é possível obter uma listagem de todos os elementos da população-alvo.

3.1.4. Amostragem sistemática


Consiste quando existe uma lista ordenada de elementos da população. Esta técnica consiste K
elementos dessa lista sendo o primeiro elemento da amostra retirado ao acaso. O intervalo entre
os elementos corresponde à razão entre o tamanho da população e da amostra. Exemplo: Se
pretender uma amostra de 100 indivíduos e a população for de 1000 o sistema será 1000:100=10
(dez em dez é o sistema), isto é, será incluído um elemento da lista de 10 em 10 indivíduos a
partir do 1.º n.º sorteado.

4. Amostragem não probabilística

4.1.Amostra por conveniência


Esta técnica é muito comum e consiste em seleccionar uma amostra da população que seja
acessível. Ou seja, os indivíduos empregados nessa pesquisa são seleccionados porque eles estão
prontamente disponíveis, não porque eles foram seleccionados por meio de um critério
6

estatístico. Geralmente essa conveniência representa uma maior facilidade operacional e baixo
custo de amostragem, porém tem como consequência a incapacidade de fazer afirmações gerais
com rigor estatístico sobre a população.
Por exemplo, suponhamos que queremos saber a opinião de estudantes universitários da
Unirovuma. Para realizar uma amostra probabilística, seria necessário ter acesso a todos os
estudantes universitários da Unirovuma, seleccionar um grupo aleatório e realizar a pesquisa. Já
para realizar uma amostra por conveniência, poderíamos abordar três universidades próximas,
simplesmente porque representam o local onde a população da pesquisa "reside" e perguntar a
alguns estudantes do período matutino que concordam em participar.
As limitações desse tipo de amostragem são óbvias. Analisando o exemplo anterior, poderia
ocorrer que as universidades tenham diferentes estratos sociais e pontos de vista políticos. Além
disso, se eu seleccionar 3 estudantes no período da manhã, pode ser que eles tenham opiniões
distintas dos estudantes do período vespertino e nocturno.

4.1.1. Vantagens e inconvenientes


A principal vantagem da amostra por conveniência é... sua conveniência! Simples, económica,
rápida... Nos pode oferecer informações valiosas em inúmeras circunstâncias, especialmente
quando não existem razões fundamentais que diferenciem os indivíduos acessíveis que formam o
total da população.

5. Amostra por quotas


Amostra por quotas é composta por três fases:
a) Segmentação
Em primeiro lugar, dividimos a população do estudo em grupos de forma exaustiva (todos os
indivíduos estão em um grupo) mutuamente exclusivos (um indivíduo só pode estar em um único
grupo), semelhante à divisão em camadas usadas na amostragem estratificada. Normalmente, esta
segmentação é feita através de alguma variável sócio-demográfica, como: sexo, idade, classe
social ou região.
b) Definindo o tamanho das quotas

Estabelecemos a meta de indivíduos a serem entrevistados para cada um desses grupos.


Normalmente definimos estes objectivos de forma proporcional ao tamanho do grupo
populacional. Por exemplo, se nós definimos segmentos por sexo numa população em que há
7

60% das mulheres e 40% homens, e queremos obter uma amostra de 1.000 pessoas, definimos
uma meta de 600 mulheres e 400 homens. Estes objetivos são conhecidos como quotas. Neste
exemplo, teríamos uma quota de gênero de 600 mulheres e 400 homens. Em algumas ocasiões, se
definem quotas não proporcionais à população, para poder aprofundar a análise de um grupo
específico.

c) Seleção de participantes e comprovação de quotas


Para finalizar, buscam-se por participantes para cobrir todas as quotas definidas. Este ponto é
onde nos afastamos da amostra probabilística: Na amostragem por quotas é permitido que a
seleção de indivíduos não seja aleatória, ou seja, os indivíduos podem ser selecionados através
da amostra por conveniência. Por exemplo, em um estudo no qual nós definimos uma quota de
100 pessoas com menos de 25 anos e 100 pessoas com idades entre 25 anos ou mais, caso não
conseguimos atingir 100% da quota prometida, poderíamos sair nas ruas e abordar pessoas,
entrevistando aquelas que cumprem as idades restantes para fechar a quota referente a nossa
meta.

5.1. Vantagens e inconvenientes


A principal vantagem da amostra por quotas é que ela oferece resultados extremamente úteis a
um custo baixo e, se as variáveis foram escolhidas de forma correcta, os resultados serão
totalmente confiáveis.

Este método apresenta dois inconvenientes: (1) a impossibilidade de limitar o erro neste tipo de
amostragem e (2) evitar o risco de uma parte significativa do estudo. Por exemplo, se num estudo
eleitoral não existia uma quota por regiões, provavelmente irá existir tendências de voto
diferentes em algumas regiões, distorcendo fortemente os resultados globais do estudo.

6. Amostra por bola de neve


A amostra por bola de neve é uma técnica de amostragem não probabilística onde os indivíduos
seleccionados para serem estudados convidam novos participantes da sua rede de amigos e
conhecidos. O nome de "bola de neve" provem justamente dessa ideia: do mesmo modo que uma
bola de neve rola ladeira a baixo, cada vez mais ela aumenta seu tamanho. O mesmo ocorre com
a essa técnica amostral, ela vai crescendo a medida que os indivíduos seleccionados convidam
8

novos participantes. A bola de neve é usada com frequência para acessar a populações de baixa
incidências e indivíduos de difícil acesso por parte do pesquisador.

6.1.Tipos de amostra bola de neve


Basicamente podemos identificar dois tipos de amostra por bola de neve:

 Amostra lineal: Cada indivíduo participante deve recomendar outro indivíduo, de forma
que a amostra cresça num ritmo linear.
 Amostra exponencial: Cada indivíduo precisa convidar dois ou mais indivíduos a
participar da amostra. Dessa forma, quanto mais gente participar do estudo, mais pessoas
serão adicionadas.

6.1.1. Vantagens e inconvenientes


As principais vantagens dessa técnica são:

Realizar amostra populações de difícil acesso.


É um processo económico e simples.
Requer planejamento e poucos recursos humanos: os próprios entrevistados fazem a mão de obra.

A respeito dos inconvenientes:

Falta de controle sobre como se constitui a amostra, já que está nas mãos dos próprios
respondentes e seu critério para seleccionar os indivíduos.
Como toda técnica não probabilística, a bola de neve não garante a representatividade, nem
permite saber o grau de precisão.

7. Cálculo do tamanho da amostra para populações infinitas (> 100.000 elementos)


A amostra depende da:
 Extensão do universo;

 Do Nível de Confiança;

 Do Erro Máximo permitido;

 Percentagem com que o fenómeno se verifica.


9

Fórmula:

𝝈𝟐 (𝒑𝒒)
𝒏=
𝒆𝟐

Onde:

n= Tamanho da amostra

σ = Nível de confiança escolhido expresso em n desvios padrão (s)

p = % com o qual o fenómeno se verifica

q = % complementar (100-p)

e = Erro máximo permitido

Se desejarmos um nível de confiança bastante alto – superior a 99% aplica-se a fórmula dos três
desvios.

Figura: Conversão dos níveis de confiança em desvios padrão

Logo o desvio (𝑠)2 seria igual a 32 = 9

Se o erro máximo for de 2% o e2 será igual a 22 = 4


10

Exemplo: Se for possível admitir que o número de captações de água em profundidade se situam
por volta dos 50%, não ultrapassando esta %, então p=50 e, consequentemente, q=100-50 ou seja
50. Assim, tem-se a equação:

9(500)
𝑛= = 5625
4

Isto é, para atender às exigências estabelecidas, o n.º de captações a analisar seria 5625. Se
todavia, for aceite o nível de confiança de 95% (2 desvios) e um erro máximo de 5% o n.º de
elementos será bem menor. os cálculos.

𝜎2 (𝑝𝑞)
𝑛= 𝑒2

4. (50.50)
𝑛= = 400
25

Convém lembrar que sempre que não seja possível estimar uma percentagem do fenómeno, deve
utilizar-se sempre p=50.

8. Cálculo do tamanho da amostra para populações finitas ( <100.000 elementos)


A amostra depende da:

 Extensão do universo;

 Do Nível de Confiança;

 Do Erro Máximo permitido;

 Da percentagem com que o fenómeno se verifica.


Fórmula

𝝈𝟐 𝒑𝒒𝑵
𝒏=
𝒆𝟐 (𝑵 − 𝟏) + 𝝈𝟐 𝒑𝒒

Onde:
n = Tamanho da amostra;
N = tamanho da população;
σ = nível de confiança escolhido, expresso em números de desvios padrão;
11

p = percentagem do fenómeno;
q = percentagem complementar;
𝒆𝟐 = erro máximo permitido.

Exemplo: Verificar quantos dos 100 empregados de uma cantina cumprem correctamente as
normas de higiene e segurança do trabalho.

Presume-se que esse n.º não seja superior a 30% do total; deseja-se um nível de confiança de 95%
(2 desvios) e tolera-se um erro até 3%. Então, n=90,4 Logo deverão ser pesquisados 90
empregados.

Mas, se a população fosse de 10.000 empregados, com os mesmos critérios anteriormente


referidos, então:

4. (30.70). 1000
𝑛= = 400
(9.9999) + 4. (30.70)

O tamanho "óptimo" de uma amostra, não depende tanto do tamanho da população mas sim de
dois parâmetros estatísticos: a margem de erro e o nível de confiança Margem de erro – Uma
amostra representa aproximadamente (e nunca exactamente) uma população. A medida deste
"aproximadamente" é a chamada margem de erro, e é lido assim: se uma pesquisa tem uma
margem de erro de 2% e a Doença Cardíaca teve 25% de prevalência na amostra recolhida,
podemos dizer que, naquele instante, na população, ela terá uma prevalência entre 23% e 27%
(25% menos 2% e 25% mais 2%).

Nível de confiança, as pesquisas são feitas com um parâmetro chamado nível de confiança,
geralmente de 95%. Estes 95% querem dizer o seguinte: se realizarmos uma outra pesquisa, com
uma amostra do mesmo tamanho, nas mesmas datas e locais e com o mesmo instrumento de
recolha de dados, há uma probabilidade de 95% de que os resultados sejam os mesmos (e uma
probabilidade de 5%, é claro, de que tudo difira).
12

9. Conclusão
Este contexto pretende arrolar as últimas considerações finais ao desafio reconstrutivo da
inferência estatística, particularmente na amostragem. Que contra partida, a palavra estatística
apareceu pela primeira vez no século XVIII e foi sugerida pelo alemão Gottfried Achemmel
(1719-1772). A palavra estatística vem de Status (estado, em latim). As primeiras técnicas
estatísticas surgiram para responder o desenvolvimento social, pela necessidade de tomar
decisões que exigiam o conhecimento numérico dos recursos disponíveis.
Os métodos de amostragem probabilística servem para assegurar uma certa precisão na
estimação dos parâmetros da população, reduzindo o erro amostral. A principal característica dos
métodos de amostragem probabilística reside no facto de que cada elemento da população tem
uma probabilidade conhecida e diferente de zero, de ser escolhida, aquando da tiragem ao acaso
para fazer parte da amostra.
13

10. Bibliografia
CHISTINE, Dancey. Estatística sem Matemática para Psicologia. 3.ed. São Paulo, Artmed
Editora, 2006.
LEVIN, J. Fox James. Estatística para Ciências Humanas. São Paulo, Prentice Hall, 2000.
PESTANA Maria e GAGEIRO, João. Análise de Dados para Ciências Sociais- A
complementaridade do SPSS. 3 ed. Edições Sílabo, 2000.

Potrebbero piacerti anche