Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Conteúdos Programáticos:
• Noções de estatística
• Metodologia de Inquéritos
• Amostragem
1. Noções de Estatística
Objectivos
Desenvolver conhecimentos sobre noções de estatística descritiva e inferência
estatística, correlação simples e regressão linear.
Conteúdo da Formação:
1. Objectivos da estatística; 2. Tipos de variáveis; 3. População e amostra;
1. Introdução à Amostragem;
ESTATÍSTICA
“Ciência que dispõe de processos apropriados para recolher,
organizar, descrever, apresentar, classificar e interpretar conjuntos de
dados"
Estatística Inferencial
Parte da Estatística que procura estabelecer conclusões para a população com base no
conhecimento parcial da mesma.
1.Noções de Estatística
2 Tipos de variáveis
VARIÁVEL
Ela varia de uma observação para outra e podem ter valores numéricos ou não
numéricos.
Discreta
Característica que é medida e assume valores
finitos ou infinitos contáveis (valores inteiros).
Quantitativa Exemplos: número de irmãos, número de
Característica que pode filhos.
ser medida em escala Contínua
quantitativa. Característica que é medida e assume valores
numa escala contínua (que podem
Numérica representar-se na recta real). Exemplos: peso
(balança), altura (régua), idade.
BASE DE SONDAGEM
Constituída por uma lista que identifica as unidades de amostragem
AMOSTRAGEM
Parte da estatística onde se estudam os métodos de selecção de
amostras e como extrapolar os seus resultados para a população
1.Noções de Estatística
3. População e amostra
- AMOSTRA, um subconjunto de indivíduos da população-alvo
- Média ponderada
𝑛
1
𝑥= 𝑥𝑖 𝐹𝑖
𝑁
𝑖=1
onde 𝑁 é a dimensão da amostra e 𝑥𝑖 𝑖 = 1, 2, … , 𝑛 representa cada
um dos valores da variável 𝑋, 𝐹𝑖 representa a frequência absoluta.
1.Noções de Estatística
6.1. Medidas de tendência central
- Média ponderada: Exemplo: Cálculo da média segundo o seguinte quadro
de dados: 𝒙 𝑭 𝒙 ×𝑭
𝒊 𝒊 𝒊 𝒊
770 4 3080
790 43 33970
810 118 95580
830 168 139440
850 117 99450
870 39 33930
890 11 9790
Total 500 415240
𝑛
1 1
𝑥= 𝑥𝑖 × 𝐹𝑖 = × 415240 = 830,48
𝑁 500
𝑖=1
1.Noções de Estatística
6.1. Medidas de tendência central
- Mediana 𝑥 ou 𝑀𝑒
É o valor de 𝑋𝑖 tal que, depois de ordenadas por ordem crescente todas
as observações da variável 𝑋, 50% das observações sejam superiores
ou iguais e 50% sejam inferiores ou iguais à mediana.
Calcula-se por:
𝑋𝑛 + 𝑋𝑛+1
2 2
, 𝑠𝑒 𝑛 𝑝𝑎𝑟
𝑥= 2
𝑋𝑛+1
2
, 𝑠𝑒 𝑛 í𝑚𝑝𝑎𝑟
2
1.Noções de Estatística
6.1. Medidas de tendência central
1. Com os dados 2, 5, 3, 1, 6 calcular a mediana?
Ordena-se por ordem crescente: 1, 2, 3, 5, 6. O valor 𝑥𝑖 = 3 coloca 50%
dos dados à direita e 50% à esquerda, daí que é a 𝑥 = 3. Mas se for
2, 3, 5, 6 já teremos dificuldades de encontrar o tal valor 𝑥𝑖 coloca 50%
dos dados à direita e 50% à esquerda. Por isso temos que calcular
𝑋𝑛 + 𝑋𝑛+1
2 2 3+5
= =4
2 2
Sabendo que: 𝑋𝑛 = 3 e 𝑋𝑛+1 = 5
2 2
1.Noções de Estatística
6.1. Medidas de tendência central
2. Com os dados do quadro seguinte calcular a mediana.
Classes Frequências A mediana é o valor a que corresponde
absolutas 𝑁 500
acumuladas a frequência acumulada = = 250
2 2
760-780 4
780-800 47 e que se verifica pertencer à classe
800-820 165 820-840 (classe mediana), pois até 820
820-840 333
840-860 450 há 165 observações e até 840 há 333
860-880 489
880-900 500 observações. Assim, a mediana será
840+820
o ponto da classe, ou seja: = 830.
2
1.Noções de Estatística
6.1. Medidas de tendência central
- Moda (é a media de tendência central menos usada)
• Para dados não classificados a moda é o valor mais frequente.
• Para dados classificados a classe modal é que tem frequência mais
elevada.
- Costuma utilizar-se a seguinte fórmula:
𝑓 ∗∗
𝑚𝑜𝑑 = 𝑙 + ∗ ∗∗
×ℎ
𝑓 +𝑓
onde 𝑙- limite inferior da classe modal, 𝑓 ∗ - frequência da classe
anterior à modal, 𝑓 ∗∗ - frequência da classe posterior à modal e ℎ-
amplitude da classe.
1.Noções de Estatística
6.1. Medidas de tendência central
Calcular a moda?
Classes Frequências Frequências 𝑓∗∗
absolutas relativas 𝑚𝑜𝑑 = 𝑙 + ×ℎ
𝑓∗ +𝑓∗∗
117
760-780 4 0,008 = 820 + × 20 = 829,96
780-800 43 0,086 118+117
800-820 118 0,236
820-840 168 0,336
840-860 117 0,234
860-880 39 0,078
880-900 11 0,022
Total 500 1,000
1.Noções de Estatística
6.2. Medidas de dispersão
Quando se analisam as colecções de dados também se utilizam a
dispersão à par da média e mediana. Esta medida serve para analisar o
comportamento da colecção, tomando como referência uma medida
fixa que, deve ser o valor escolhido para localizar a distribuição.
Normalmente usa-se a média como medida fixa e ela é tomada para
referenciar a dispersão das observações. Perante tal hipótese a
dispersão deve sintetizar o comportamento do conjunto dos desvios
em relação à média, isto é, 𝑥𝑖 − 𝑥 , 𝑖 = 1, 2, … , 𝑁; havendo pouca
dispersão os desvios são globalmente pequenos; havendo muita
dispersão os desvios são globalmente grandes. Como a soma dos
desvios é zero, toma-se os desvios elevados ao quadrado para perder o
sinal e não haver compensação entre valores e negativos.
1.Noções de Estatística
6.2. Medidas de dispersão
- Variância e desvio padrão para os dados não classificados:
• Variância:
1. Para amostras consideradas não pequenas
𝑁
2
1
𝑠 = 𝑥𝑖 − 𝑥 2
𝑁
𝑖=1
2. Para amostras consideradas pequenas (variância corrigida)
𝑁
2
1
𝑠 = 𝑥𝑖 − 𝑥 2
𝑁−1
𝑖=1
1.Noções de Estatística
6.2. Medidas de dispersão
- Variância e desvio padrão para os dados não classificados:
• Desvio-padrão:
1. Para amostras consideradas não pequenas
𝑁
1 2
𝑠= 𝑥𝑖 − 𝑥
𝑁
𝑖=1
𝑥=48,72
𝑥𝑖 2
𝑥𝑖 − 𝑥
1 𝑁
44,8 12,82 𝑠2 = 𝑖=1 𝑥𝑖 − 𝑥 2
𝑁−1
53,5 26,21
32,8 242,74 911,81
34,3 198,25 = = 113,98
8
46,8 2,50
49,2 0,68 1 𝑁 2
53,8 29,38 𝑠= 𝑖=1 𝑥𝑖 − 𝑥
𝑁−1
66,5 328,33
56,8 70,90
= 113,98 = 10,68
1.Noções de Estatística
6.2. Medidas de dispersão
- Variância e desvio padrão para os dados classificados:
• Variância:
1. Para amostras consideradas não pequenas
𝑁
2
1
𝑠 = 𝐹𝑖 𝑥𝑖 − 𝑥 2
𝑁
𝑖=1
2. Para amostras consideradas pequenas (variância corrigida)
𝑁
2
1
𝑠 = 𝐹𝑖 𝑥𝑖 − 𝑥 2
𝑁−1
𝑖=1
1.Noções de Estatística
6.2. Medidas de dispersão
• Variância e desvio padrão para os dados classificados:
- Desvio padrão
1. Para amostras consideradas não pequenas
𝑁
1 2
𝑠= 𝐹𝑖 𝑥𝑖 − 𝑥
𝑁
𝑖=1
𝑛 2 2
𝑖=1 𝑋1𝑖 − 𝑋1 𝑋2 − 𝑋2
𝜌𝑋1 ,𝑋2 =
𝑛 2 𝑛 2
𝑖=1 𝑋1𝑖 − 𝑋1 𝑖=1 𝑋2 − 𝑋2
1.Noções de Estatística
7. Principais distribuições
Com as amostras constituídas (com recurso às técnicas de amostragem) e a
sua caracterização (com recurso à estatística descritiva) o passo seguinte
consiste em fazer inferir acerca dos valores dos parâmetros da população,
onde foram obtidas as amostras e ou validar as hipóteses acerca desses
parâmetros.
Definições
1. A área total sob a curva é igual a 1.
2. Todo o ponto sob a curva deve ter uma ordenada de valor igual ou superior a zero.
Distribuição Normal Standard :
a distribuição Normal tem média 0 e desvio padrão 1.
1.Noções de Estatística
7. Principais distribuições
•Distribuição Normal
1.Noções de Estatística
7. Principais distribuições
• Distribuição Normal
1.Noções de Estatística
7. Principais distribuições
• Distribuição do X -Quadrado
1. A distribuição Qui-quadrado
não é simétrica, ao contrário do
que sucede com as distribuições
Normal e t de Student.
1.Noções de Estatística
7. Principais distribuições
• Distribuição do X -Quadrado
Distribuição Qui-quadrado
para g.l.= 10 e g.l.= 20
• Distribuição T -Student
A distribuição t de Student é
a designação de uma família
de distribuições indexada
pelo parâmetro n, que representa
o número de graus de liberdade (g.l.).
1.Noções de Estatística
7. Principais distribuições
• Distribuição T -Student
1.Noções de Estatística
8. Testes de hipóteses
Hipótese
É uma conjectura, uma resposta provisória que de acordo com certos
critérios, será rejeitada ou não-rejeitada.
Nota:
Considerando que as mesmas causas nem sempre produzem os
mesmos efeitos, em lugar de ACEITAR, costuma-se dizer NÃO REJEITAR,
associando a esta última expressão uma PROBABILIDADE.
1.Noções de Estatística
8. Testes de hipóteses
Ideia de base subjacente aos testes estatísticos é:
- A Hipótese que vai ficar no lugar da Hipótese Nula, caso ela seja rejeitada –
Chama-se Hipótese Alternativa e designa-se por 𝐻𝟏
Regra de Decisão
• Se o valor da estatística do teste cair dentro da região crítica, rejeita-se 𝐻0 .
Ao rejeitar a hipótese nula (𝐻0 ) existe uma forte evidência de sua falsidade.
• Ao contrário, quando não rejeitamos, dizemos que não houve evidência
amostral significativa no sentido de permitir a rejeição de 𝐻0 .
1.Noções de Estatística
8. Testes de hipóteses
1.Noções de Estatística
9. Correlação linear simples
Objectivo
• Estudar a relação entre duas variáveis quantitativas
Exemplos:
• Quantidade e preço das laranjas vendidas
• Idade e altura das crianças
• Tempo de prática de desporto e ritmo cardíaco
• Tempo de estudo e nota na prova
• Taxa de desemprego e taxa de criminalidade
• Expectativa de vida e taxa de analfabetismo
1.Noções de Estatística
9. Correlação linear simples
Averiguaremos a presença ou ausência de relação linear entre duas
variáveis sob dois pontos de vista:
No parágrafo 9: a) Quantificando a força dessa relação: correlação.
No parágrafo 10: b) Explicitando a forma dessa relação: regressão.
Casos particulares:
𝑟 = 1 ⟹ correlação linear positiva e perfeita
𝑟 = −1 ⟹ correlaçãolinearnegativaeperfeita
𝑟 = 0 ⟹ inexistência de correlação linear
1.Noções de Estatística
9. Correlação linear simples
𝑥1 ; 𝑦1 , 𝑥2 ; 𝑦2 , … , 𝑥𝑖 ; 𝑦𝑖 , … , (𝑥𝑛 ; 𝑦𝑛 )
Com os dados constrói-se o diagrama de dispersão. Este deve exibir uma tendência linear
para que se possa usar a regressão linear.
Portanto este diagrama permite decidir empiricamente se um relacionamento linear entre
𝑋 e 𝑌 deve ser assumido.
Por análise do diagrama de dispersão pode-se também concluir (empiricamente) se o grau
de relacionamento linear entre as variáveis e forte ou fraco, conforme o modo como se
situam os pontos em redor de uma recta imaginária que passa através do enxame de
pontos.
1.Noções de Estatística
10. Regressão linear simples
Diagrama de Dispersão
Exemplos
1. Relação entre o peso e a altura de um homem adulto (𝑋: altura; 𝑌: peso)
2. Relação entre o preço do vinho e o montante da colheita em cada ano (𝑋: montante da
colheita; 𝑌: preço do vinho)
1.Noções de Estatística
10. Regressão linear simples
Num estudo de regressão temos 𝑛 observações da variável 𝑋: 𝑥1 , 𝑥2 , … , 𝑥𝑛
(assume-se que estas observações são medidas sem erro).
Temos então 𝑛 variáveis aleatórias 𝑌1 , 𝑌2 , … , 𝑌𝑛 tais que:
𝑌𝑖 = 𝛼 + 𝛽𝑋𝑖 + 𝐸𝑖 𝑖 = 1, 2, … , 𝑛
𝑥1 ; 𝑦1 , 𝑥2 ; 𝑦2 , … , 𝑥𝑖 ; 𝑦𝑖 , … , (𝑥𝑛 ; 𝑦𝑛 )
𝑦𝑖 = 𝛼 + 𝛽𝑋𝑖 + 𝜀𝑖 𝑖 = 1, 2, … , 𝑛
O valor observado de uma variável aleatória (𝑦𝑖 ), usualmente difere da sua média (𝑌 ) por uma
quantidade aleatória 𝜀𝑖 .
1.Noções de Estatística
10. Regressão linear simples
A partir dos dados disponíveis estimamos 𝛼 e 𝛽 e substituímos estes
parâmetros pelas suas estimativas para obter a equação de regressão
estimada.
𝑦 = 𝛼 + 𝛽𝑥
Esta equação estima o valor médio de 𝑌 para um dado valor 𝑥 de 𝑋,
mas é usada para estimar o próprio valor de 𝑌.
𝑆𝑆𝐸 = 𝑑𝑖 2 = 𝑦𝑖 − 𝛼 + 𝛽𝑋𝑖 2
𝑖=1 𝑖=1
1.Noções de Estatística
10. Regressão linear simples
Estimação pelo Método dos Mínimos Quadrados
𝜕𝑆𝑆𝐸
=0 𝛼 = 𝑦 − 𝛽𝑥
𝜕𝛼 𝑛
𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦
𝜕𝑆𝑆𝐸 ⟺ ⋯ ⟺ 𝑖=1
𝛽= 𝑛
=0 𝑥
𝑖=1 𝑖
2
− 𝑛 𝑥 2
𝜕𝛽
1.Noções de Estatística
10. Regressão linear simples
ATENÇÃO:
Um conjunto de pontos dá evidência de linearidade apenas para os valores de 𝑋 cobertos pelo
conjunto de dados. Para valores de 𝑋 que saem fora dos que foram cobertos não há qualquer
evidência de linearidade. Por isso é arriscado usar uma recta de regressão estimada para predizer
valores de 𝑌 correspondentes a valores de 𝑋 que saem fora do âmbito dos dados.
O perigo de extrapolar para fora do âmbito dos dados amostrais é que a mesma relação possa não mais se
verificar.
INTRODUÇÃO AO SPSS
CONTEÚDO
• O que é o SPSS?
• Vantagens e desvantagens da utilização do SPSS
• Como está estruturado o SPSS?
• Introdução de dados
• Transformação de dados
• Importação e exportação de dados e resultados
CRIAÇÃO DE UMA BASE DE DADOS EM SPSS
OBJECTIVOS
No final deve o formando ser capaz de:
• Saber o que é e para que serve o SPSS;
• Saber tirar vantagens sem perder de vista os riscos da utilização
abusiva do SPSS;
• Criar uma base de dados em SPSS;
• Aplicar aos dados algumas transformações;
• Representar graficamente diferentes tipos de dados;
• Importar e exportar dados para outras aplicações informáticas.
CRIAÇÃO DE UMA BASE DE DADOS EM SPSS
O que é o SPSS
SPSS – Statistical Package for the Social Sciences (Aplicação Estatística
para as Ciências Sociais)
Vantagens:
Permite realizar muito mais rapidamente a análise de um conjunto dados;
Permite a utilização de métodos estatísticos complexos, a utilizadores que
também não tenham uma grande formação estatística. O utilizador não
necessita de conhecer em detalhe os cálculos envolvidos.
Desvantagens:
O utilizador necessita de ter uma ideia de como funciona o método
estatísticos em causa e ter noção dos seus fundamentos teóricos para
permitir analisar, de forma crítica, os resultados que são obtidos.
CRIAÇÃO DE UMA BASE DE DADOS EM SPSS
Como está estruturado o SPSS?
O SPSS subdivide-se em dois subprogramas:
- O IBM SPSS Statistics Editor de Dados – se relaciona com tudo o que
tem a ver com os dados (seja a caracterização das variáveis, seja o
registo dos dados recolhidos);
- O IBM SPSS Statistics Visualizador – permite visualizar e formatar a
apresentação dos resultados.
Nome – permite definir o nome da variável (não pode ter espaços e tem caracteres
proibidos);
Largura – permite fixar o máximo de algarismos ou caracteres que podem ser utilizados na
introdução de dados na janela de visualização de dados;
Decimais – define-se o número de casa decimais com que os valores são apresentados na
janela de visualização de dados;
Rótulo – permite associar uma etiqueta, que serve para melhor descrever a variável;
CRIAÇÃO DE UMA BASE DE DADOS EM SPSS
Valores – no caso das variáveis qualitativas, permite associar etiquetas aos códigos numéricos
utilizados;
Ausentes – permite indicar qual o código numérico utilizado para as não respostas (células da janela
de visualização em branco);
Alinhar – permite definir o alinhamento dos dados na janela de visualização de dados (à esquerda,
ao centro, ou à direita);
Medir – permite associar à uma variável uma etiqueta com informação sobre a natureza da escala
utilizada no registo dos dados (escalar, ordinal ou nominal);
Dados
Este menu dá acesso a uma série de ferramentas de validação,
reestruturação e filtragem dos dados. Ferramentas mais utilizadas:
- Dividir arquivo, seleccionar casos, …
CRIAÇÃO DE UMA BASE DE DADOS EM SPSS
Menu de Dados
CRIAÇÃO DE UMA BASE DE DADOS EM SPSS
Menu Transformar
Menu Analisar
Transformação de Dados
Transformação de Dados
- Recodificação em categorias dos valores das variáveis. Os resultados
podem ser guardados na variável em causa, ou numa nova variável.
Transformar ⟹ Recodificar nas mesmas variáveis… ⟹
⟹ Recodificar em variáveis diferentes…
Importação de dados
O SPSS permite importar dados de ficheiros gerados por uma grande variedade de
programas informáticos. Os tipos de ficheiros compatíveis com o SPSS para importação de
dados são os seguintes:
.xls (Excel);
.w* (Lotus);
.dbf (dbase);
.txt
.dat
É necessário, para realizar a importação, assegurar as seguintes condições:
- O ficheiro terá que estar organizado de forma compatível com o SPSS;
- O nome de cada variável terá que ser o primeiro resultado da respectiva coluna.
AMOSTRAGEM E ESTIMAÇÃO
CONCEITOS BÁSICOS
POPULAÇÃO
É O CONJUNTO DE ELEMENTOS QUE TÊM UMA DETERMINADA
CARACTERÍSTICA EM COMUM
UNIDADE ESTATÍSTICA
É CADA UM DOS ELEMENTOS QUE CONSTITUEM A POPULAÇÃO
BASE DE SONDAGEM
É UMA LISTAGEM COM A IDENTIFICAÇÃO DAS UNIDADES DE AMOSTRAGEM.
AMOSTRAGEM E ESTIMAÇÃO
AMOSTRA
É TODO O CONJUNTO NÃO VAZIO E COM MENOR NÚMERO DE
ELEMENTOS DO QUE A POPULAÇÃO
AMOSTRAGEM E ESTIMAÇÃO
AMOSTRAGEM
É A PARTE DA ESTATÍSTICA QUE ESTUDA OS MÉTODOS DE SELECCIONAR
AMOSTRAS E O MODO DE EXTRAPOLAR OS SEUS RESULTADOS PARA A
POPULAÇÃO
AMOSTRA REPRESENTATIVA
É UMA AMOSTRA SELECCIONADA DE FORMA QUE AS INFORMAÇÕES
RECOLHIDAS POSSAM SER ESTENDIDAS AO CONJUNTO DA
POPULAÇÃO, COM UMA PRECISÃO JULGADA ADEQUADA
AMOSTRAGEM E ESTIMAÇÃO
INFERÊNCIA ESTATÍSTICA
É O RAMO DA ESTATÍSTICA QUE ESTUDA A VALIDADE DA
EXTRAPOLAÇÃO DOS RESULTADOS DA AMOSTRA PARA O CONJUNTO
DA POPULAÇÃO.
PLANO DE AMOSTRAGEM
É O PROCESSO QUE DEFINE O MÉTODO DE SELECCIONAR A AMOSTRA E
O MODO DE EXTRAPOLAR OS SEUS RESULTADOS PARA A POPULAÇÃO
AMOSTRAGEM E ESTIMAÇÃO
AMOSTRA ALEATÓRIA
CONJUNTO DE 𝑛 VARIÁVEIS ALEATÓRIAS INDEPENDENTES, (𝑥1 , 𝑥2 , … , 𝑥𝑛 ),
EXTRAÍDAS DE UMA POPULAÇÃO, TAL QUE CADA 𝑥𝑖 TEM A MESMA
CARACTERÍSTICA, OU DISTRIBUIÇÃO DA VARIÁVEL 𝑿 (VARIÁVEL
POPULACIONAL)
PARÂMETRO
MEDIDA USADA PARA DESCREVER UMA CARACTERÍSTICA DA POPULAÇÃO.
A MÉDIA POPULACIONAL COSTUMA SER DESIGNADA POR 𝜇 E A VARIÂNCIA
POPULACIONAL POR 𝜎 2 .
AMOSTRAGEM E ESTIMAÇÃO
ESTIMADOR (ESTATÍSTICA)
MEDIDA USADA PARA DESCREVER UMA CARACTERÍSTICA DA
AMOSTRA.
A MÉDIA É DESIGNADA POR 𝑥 E O DESVIO PADRÃO POR 𝑠.
ESTIMATIVA
VALOR NUMÉRICO DO ESTIMADOR.
AMOSTRAGEM E ESTIMAÇÃO
DIMENSÃO DA POPULAÇÃO (𝑁)
NÚMERO DE UNIDADES QUE COMPÕEM A POPULAÇÃO EM ESTUDO.
TAXA DE RESPOSTA
PERCENTAGEM DE INQUÉRITOS VÁLIDOS EM RELACÇÃO AO NÚMERO DE
CASOS INCLUIDOS NA AMOSTRA
𝑟𝑒𝑠𝑝𝑜𝑠𝑡𝑎
𝑇𝑎𝑥𝑎 =
𝑛
AMOSTRAGEM E ESTIMAÇÃO
PORQUE USAMOS AMOSTRAS?
POPULAÇÃO INFINITA
ECONOMIA
TEMPO
MAIOR PRECISÃO
DESTRUIÇÃO DE ELEMENTOS
AMOSTRAGEM E ESTIMAÇÃO
CAMPOS DE APLICAÇÃO DA AMOSTRAGEM
AGRICULTURA
FENÓMENOS SÓCIO-DEMOGRÁFICOS
SAÚDE
ECONOMIA E FINANÇAS
ESTUDOS DE OPINIÃO
CONTROLO DE QUALIDADE
AMBIENTE
AMOSTRAGEM E ESTIMAÇÃO
ORGANIZAÇÃO PRÁTICA DE UM INQUÉRITO
OBJECTIVOS
POPULAÇÃO
UNIDADE ESTATÍSTICA
BASE DE AMOSTRAGEM
AMOSTRA
PERÍODO DE REFERÊNCIA
MÉTODO DE RECOLHA
QUESTIONÁRIO
AMOSTRAGEM E ESTIMAÇÃO
ORGANIZAÇÃO PRÁTICA DE UM INQUÉRITO
APLICAÇÃO INFORMÁTICA
CONTROLO DE QUALIDADE
ANÁLISE DOS DADOS
DIVULGAÇÃO DOS DADOS
AMOSTRAGEM E ESTIMAÇÃO
MÉTODOS DE AMOSTRAGEM
1. MÉTODOS EMPÍRICOS
NÃO EXISTE BASE DE AMOSTRAGEM
A SELECÇÃO DAS UNIDADES AMOSTRAIS PODE TER ORIGEM NA INTUIÇÃO DO ENTREVISTADOR
OU EM CRITÉRIOS DE CONVENIÊNCIA
TIPOS:
• Intencional
• Bola de neve
• Por Quotas
• Por conveniência
• Itinerários Aleatórios
AMOSTRAGEM E ESTIMAÇÃO
MÉTODOS DE AMOSTRAGEM
1. MÉTODOS EMPÍRICOS
VANTAGENS
Não necessitam de uma base de amostragem, mas unicamente duma
informação auxiliar global
Rápidos de construir
Pouco dispendiosos
Asseguram a dimensão exacta da amostra
Permitem obter categorias pouco frequentes da população
AMOSTRAGEM E ESTIMAÇÃO
MÉTODOS DE AMOSTRAGEM
1. MÉTODOS NÃO PROBABILÍSTICOS OU EMPÍRICOS
INCONVENIENTES
Necessitam duma informação externa
Nenhum controlo sobre as respostas (os inquiridores podem escolher
pessoas mais acessíveis)
Não têm inferência estatística
AMOSTRAGEM E ESTIMAÇÃO
MÉTODOS DE AMOSTRAGEM
A – INTENCIONAL
TIPOS:
• Amostragem Aleatória Simples
• Amostragem Sistemática
• Amostragem Estratificada
• Amostragem por Conglomerados
• Amostragem Multi-etápica
AMOSTRAGEM E ESTIMAÇÃO
MÉTODOS DE AMOSTRAGEM
2. MÉTODOS PROBABILÍSTICOS
VANTAGENS
Critérios de selecção dos elementos são rigorosamente definidos
Cálculo da precisão e nível de confiança associados às estimativas
Cálculo da dimensão da amostra adequada à precisão e nível de
confiança desejados para os resultados
AMOSTRAGEM E ESTIMAÇÃO
MÉTODOS DE AMOSTRAGEM
2. MÉTODOS PROBABILÍSTICOS
INCONVENIENTES
Base de amostragem incompleta ou desactualizada pode enviesar os
resultados.
Pode-se obter uma amostra geograficamente muito dispersa,
podendo agravar o tempo e os custos associados à recolha dos dados.
Por vezes é difícil inquirir todos os elementos seleccionados
AMOSTRAGEM E ESTIMAÇÃO
MÉTODOS DE AMOSTRAGEM
A. AMOSTRAGEM ALEATÓRIA SIMPLES
• Os elementos da amostra são escolhidos por um processo casual ou
aleatório (ao acaso)
• Todos os elementos têm uma probabilidade positiva de pertencer à
amostra
• Todas as amostras de dimensão 𝑛, extraídas de uma população de N
elementos, têm a mesma probabilidade de selecção.
AMOSTRAGEM E ESTIMAÇÃO
MÉTODOS DE AMOSTRAGEM
A. AMOSTRAGEM ALEATÓRIA SIMPLES
ESTIMADORES
• MÉDIA
1 𝑛 𝑠 2 𝑁−𝑛 1 𝑛
𝑥= 𝑖=1 𝑥𝑖 𝑣𝑎𝑟 𝑥 = 𝑠2 = 𝑖=1 𝑥𝑖 − 𝑥 2
𝑛 𝑛 𝑁 𝑛−1
• TOTAL
𝑠 2 𝑁−𝑛
𝜏 =𝑁×𝑥 𝑣𝑎𝑟 𝜏 = 𝑛2 ×
𝑛 𝑁
• PROPORÇÃO
1 𝑛 𝑝𝑞 𝑁−𝑛
𝑝= 𝑖=1 𝑥𝑖 𝑣𝑎𝑟 𝑝 = 𝑞 =1−𝑝
𝑛 𝑛−1 𝑁
AMOSTRAGEM E ESTIMAÇÃO
MÉTODOS DE AMOSTRAGEM
B. AMOSTRAGEM SISTEMÁTICA
• Os elementos da amostra são extraídos da população de acordo com
uma progressão aritmética, cuja base é escolhida ao acaso e cuja
razão é calculada de modo a cobrir totalmente a população.
𝑁º 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑎 𝑃𝑜𝑝𝑢𝑙𝑎çã𝑜
Razão da progressão 𝑘 = 𝑖𝑛𝑡
𝐷𝑖𝑚𝑒𝑛𝑠ã𝑜 𝑑𝑎 𝐴𝑚𝑜𝑠𝑡𝑟𝑎
NOTAS
• Uma amostra extraída pelo método sistemático é uma amostra aleatória
• Amostragem sistemática versus A.A.S.:
- Amostra sistemática muitas vezes é mais fácil de ser executada;
ESTIMADORES
• MÉDIA
1 𝑛 𝑠 2 𝑁−𝑛 1 𝑛
𝑥𝑠𝑡 = 𝑖=1 𝑥𝑖 𝑣𝑎𝑟 𝑥𝑠𝑡 = 𝑠2 = 𝑖=1 𝑥𝑖 − 𝑥𝑠𝑡 2
𝑛 𝑛 𝑁 𝑛−1
• TOTAL
𝑠 2 𝑁−𝑛
𝜏 = 𝑁 × 𝑥𝑠𝑡 𝑣𝑎𝑟 𝜏𝑠𝑡 = 𝑛2 ×
𝑛 𝑁
• PROPORÇÃO
1 𝑛 0 𝑛ã𝑜 𝑝𝑒𝑟𝑡𝑒𝑛𝑐𝑒 𝑝𝑠𝑡 𝑞𝑠𝑡 𝑁−𝑛
𝑝= 𝑖=1 𝑥𝑖 𝑥𝑖 𝑣𝑎𝑟 𝑝𝑠𝑡 = 𝑞𝑠𝑡 = 1 − 𝑝𝑠𝑡
𝑛 1 𝑝𝑒𝑟𝑡𝑒𝑛𝑐𝑒 𝑛−1 𝑁
AMOSTRAGEM E ESTIMAÇÃO
MÉTODOS DE AMOSTRAGEM
C. AMOSTRAGEM ESTRATIFICADA
• A estratificação consiste em decompor a população em grupos
homogéneos chamados ESTRATOS (em que cada unidade pertence a
um e um só estrato) e extrair uma amostra aleatória separadamente
em cada estrato.
VANTAGENS:
• Maior homogeneidade dentro de cada estrato (menor variância);
• Custo menor;
• TOTAL
2
𝐿 𝐿 2 𝑁ℎ −𝑛ℎ 𝑠ℎ
𝜏𝑒𝑠𝑡 = ℎ=1 𝑁ℎ 𝑥ℎ 𝑣𝑎𝑟 𝜏𝑒𝑠𝑡 = ℎ=1 𝑁ℎ 𝑁ℎ 𝑛ℎ
• PROPORÇÃO
1 𝑛 𝑁ℎ 𝑝𝑒𝑠𝑡 𝐿 2 𝑝𝑠𝑡 𝑞𝑠𝑡 𝑁ℎ −𝑛ℎ
𝑝𝑒𝑠𝑡 = 𝑛 𝑖=1 𝑁 𝑣𝑎𝑟 𝑝𝑒𝑠𝑡 = 𝑁
ℎ=1 ℎ 𝑛−1 𝑞𝑒𝑠𝑡 = 1 − 𝑝𝑒𝑠𝑡
ℎ 𝑁ℎ
AMOSTRAGEM E ESTIMAÇÃO
MÉTODOS DE AMOSTRAGEM
C. AMOSTRAGEM ESTRATIFICADA
REPARTIÇÃO DA AMOSTRA PELOS ESTRATOS
Dada a dimensão total da amostra, n, fixa, e considerando os diferentes estratos, pretende-se determinar a
repartição da amostra pelos vários estratos, isto é, conhecer o número de observações a seleccionar em cada
estrato.
Sabendo que a dimensão total da amostra é 𝑛
𝑛 = 𝑛1 + 𝑛2 + … . +𝑛ℎ
qual será o valor da dimensão de cada estrato 𝑛1 , 𝑛2 , … . , 𝑛ℎ ?
𝑓 = 𝑛 /𝑁
em que: 𝑛 é a dimensão da amostra e 𝑁 é o número de elementos do
universo
AMOSTRAGEM E ESTIMAÇÃO
MÉTODOS DE AMOSTRAGEM
C. AMOSTRAGEM ESTRATIFICADA
AMOSTRA ESTRATIFICADA PROPORCIONAL
Uma amostra estratificada diz-se proporcional se as taxas de
amostragem 𝑓ℎ são iguais em todos os estratos
𝑛ℎ
𝑓ℎ = 𝑓ℎ = ⋯ = 𝑓ℎ = 𝑓ℎ = =𝑓
𝑁ℎ
Numa amostra PROPORCIONAL, em cada estrato, extrai-se a mesma
proporção 𝑓 de indivíduos.
AMOSTRAGEM E ESTIMAÇÃO
MÉTODOS DE AMOSTRAGEM
C. AMOSTRAGEM ESTRATIFICADA
AMOSTRA ESTRATIFICADA ÓPTIMA (NO SENTIDO DE NEYMAN)
Uma amostra estratificada óptima caracteriza-se pelas dimensões dos estratos 𝑛ℎ
serem escolhidas de modo a minimizar a variância da média, 𝑣𝑎𝑟 𝑥𝑒𝑠𝑡 , com a
condição de a soma dos 𝑛ℎ ser igual à dimensão total da amostra, 𝑛.
𝑁ℎ 𝑠ℎ
Para tal, 𝑛ℎ = 𝑛 × ℎ = 1, 2, … , 𝐿
ℎ 𝑁ℎ 𝑠ℎ
MÉDIA
TOTAL
PROPORÇÃO
D. AMOSTRAGEM POR CONGLOMERADOS
EM DUAS ETAPAS COM Nº DESIGUALDE DE UNIDADES
ESTIMADORES
MÉDIA POR CONGLOMERADO
onde,
𝑀 = nº de conglomerados na população;
𝑁 = nº de elementos na população;
𝑁𝑖 = nº de elementos na população do conglomerado i;
𝑚 = nº de conglomerados na amostra.
TOTAL
PROPORÇÃO
é igual a quando a variável Xé binária, assumindo valores 0 ou 1.
AMOSTRAGEM E ESTIMAÇÃO
NÃO-RESPOSTAS
• Nos censos e inquéritos por amostragem pode ocorrer que não se
recolham os dados de todas as unidades. Neste caso falta informação
de uma parte da população ou da amostra seleccionada.
• Põe-se, então, o problema de estabelecer que inferência se pode
fazer a partir dos dados obtidos e tentar ter alguns conhecimentos da
parte da população que não respondeu ao inquérito.
• Diversas circunstâncias contribuem para a existência deste problema
AMOSTRAGEM E ESTIMAÇÃO
NÃO-RESPOSTAS
NÃO-RESPOSTA TOTAL
• RECUSA
• AUSÊNCIA DE LONGA DURAÇÃO
• ABANDONO NO DECORRER DO INQUÉRITO
• INCAPACIDADE DE RESPONDER
• NEGLIGÊNCIA DO INQUIRIDO
• MÁ QUALIDADE DO ENTREVISTADOR
AMOSTRAGEM E ESTIMAÇÃO
NÃO-RESPOSTAS
NÃO-RESPOSTA POR ITEM
COLD–DECK
UTILIZAÇÃO DUMA INFORMAÇÃO EXTERIOR RELATIVA À MESMA UNIDADE
Ex: valor observado numa data anterior
HOT–DECK
SUBSTITUI-SE O VALOR EM FALTA POR UM VALOR OBSERVADO NUM RESPONDENTE “PRÓXIMO”, O DADOR
HOT-DECK NO CONJUNTO
O DADOR É ESCOLHIDO AO ACASO ENTRE RESPONDENTES
HOT-DECK POR CLASSE
O DADOR É ESCOLHIDO AO ACASO NA CLASSE ONDE PERTENCE O NÃO-RESPONDENTE
AMOSTRAGEM E ESTIMAÇÃO
ERROS DOS INQUÉRITOS
ERRO TOTAL
𝑁𝑠 2
𝑛=
𝑏2
𝑁 2 + 𝑠2
𝑧
EM QUE
𝑁 – dimensão da População
𝑠 – variância amostral
𝑏 – precisão da estimativa
𝑧 – valor da distribuição Normal padrão
AMOSTRAGEM E ESTIMAÇÃO
DIMENSÃO DA AMOSTRA
DIMENSÃO DA AMOSTRA
IDEALMENTE, A DIMENSÃO DA AMOSTRA É DETERMINADA PELA PRECISÃO 𝑏 (FIXADA À PARTIDA) QUE SE
PRETENDE OBTER NOS RESULTADOS.
PARA UMA AMOSTRA ALEATÓRIA SIMPLES:
QUANDO SE PRETENDE ESTIMAR UMA PROPORÇÃO 𝒑,
TEREMOS:
𝑁𝑝𝑞
𝑛=
𝑏2
𝑁 2 + 𝑝𝑞
𝑧
𝑛
𝑦 𝑦′ 𝑖=1 𝑦𝑖
𝑟= = ′= 𝑛
𝑥 𝑥 𝑖=1 𝑥𝑖
𝑛 2
1 𝑁−𝑛 𝑖=1 𝑦𝑖 − 𝑟𝑥𝑖
𝑉𝑎𝑟 𝑟 = 2
𝑥 𝑁×𝑛 𝑛−1
Cálculo do Tamanho da Amostra
• O conceito de nível de confiança pode ser utilizado para o cálculo do
tamanho da amostra, necessário para fazermos inferências confiáveis.
2
E Z .
s Z / 2 .s
n n
2
E
Como o tamanho da amostra afeta o erro de amostragem?
• Se a amostra empregada for muito pequena, a margem de erro será
grande, o que impossibilita ou inviabiliza a tomada de decisão.
• Por outro lado, se a amostra for muito grande, o intervalo obtido pode
ser mais estreito do que o necessário (gastos desnecessários).
Cálculo do Tamanho da Amostra
3,0
Tamanho de amostra e margens de erro,
Margem de erro (E)
1,5
0,5
Este método de recolha de dados pode oscilar da entrevista formal e estruturada, à discussão
informal entre dois ou mais indivíduos.
Nas entrevistas formais, são colocadas questões estandardizadas respeitando uma pré-designada
sequência.
1) O plano do questionário
Para escrever um bom questionário convém:
a) Listar todas as variáveis da investigação, incluindo as características dos casos;
b) Especificar o número de perguntas para medir cada uma das variáveis;
c) Escrever uma versão inicial para cada pergunta;
d) Pensar cuidadosamente na natureza da primeira hipótese geral e nas variáveis e
perguntas iniciais com elas associadas. Identificar em seguida que tipo de Hipótese se
tem;
e) Consoante o tipo de hipótese geral, decidir quais as técnicas estatísticas adequadas
para testar a hipótese e ter em atenção os pressupostos destas técnicas.
METDOLOGIAS DOS INQUÉRITOS
A construção de um Questionário
A elaboração do questionário
a) Decidir, com base na informação do passo e), o tipo de resposta desejável para cada
pergunta associada com a hipótese gera;
b) Com base na informação dos passos d), e) e f) escrever a hipótese operacional;
c) Considerar as perguntas iniciais associadas com a primeira hipótese operacional;
d) Verificar se as versões finais das perguntas e das respostas ainda estão adequadas
para testar a hipótese operacional;
e) Repetir os passos c) – i) para as outras hipóteses gerais;
f) Escrever as instruções associadas com as perguntas para informar o respondente
como deve responder;
g) Planear as secções do questionário.
METDOLOGIAS DOS INQUÉRITOS
A construção de um Questionário
A primeira secção do questionário
Consiste num conjunto de perguntas para solicitar informação sobre as
características dos respondentes ao questionário, pretendendo-se
descrever os inquiridos.
Escrever perguntas
É preciso pensar cuidadosamente sobre o objectivo geral de cada uma
das perguntas que está a inserir no questionário