Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1º semestre/2009 - Aula 2
Unidade Curricular:
Estatística Aplicada
Aula 16/04
1
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Agenda
2
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
3
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Definições
1. Dados Quantitativos: consistem em números que representam contagens
ou medidas.
2. Dados Qualitativos (ou categóricos ou de atributos): podem ser
separados em diferentes categorias que se distinguem por alguma
característica numérica.
3. Dados Discretos: número de valores possível é um número finito ou uma
quantidade enumerável (passíveis de contagem: 0, 1, 2, 3).
4. Dados Contínuos: infinitos valores possíveis, cobrindo um intervalo sem
vazios, interrupções ou saltos.
4
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Ordinal As categorias são ordenadas mas as Conceitos dos 3668 cursos avaliados
diferenças não podem ser no Provão (2001) Ordem
encontradas A: 14,3%
B: 13,3%
C: 40,9%
} estabelecida:
A, B, C
Intervalar As diferenças são significativas, mas Temperaturas em Diadema 0oC não significa
não existe ponto inicial ou zero 15ºC “nenhum calor; 30oC
natural e as razões não tem sentido. 22ºC
30ºC } não é 2x + quente
que 15oC
Razão Há um ponto inicial zero natural e as Distância que um aluno percorre
razões são significativas entre sua casa e a escola:
5 km 10 km é 2x + distante
10 km
22 km
} que 5 km
5
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
1) Gráfico de pontos:
Sejam as temperaturas (oC) de uma Cidade A medidas às 12:00 h (horário local):
T = 30; 25; 32; 34; 31; 29; 28; 30; 32; 34; 34; 32; 30; 26; 43
Um ponto “afastado” da
tendência dos dados
20 25 30 35 40 “outlier”
Temperatura (oC)
6
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
0 9 9
Diagrama de Caule e Folha 1 0 1 5 5 6
2 0 2 2 4 5 8
3 0 1
Casa das dezenas 4 0 Casa das unidades
“CAULE” “FOLHA” 7
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
0,2
3 6 0.150
4 8 0.200
Freqüência relativa
5 6 0.150
6 5 0.125
0,1 7 3 0.075
8 2 0.050
9 1 0.025
0 2 4 6 8 10
Número de defeitos
8
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
3 6 0.150 15 0,375
1
4 8 0.200 23 0,575
0.8
5 6 0.150 29 0,725
(F rac)
0.6
6 5 0.125 34 0,850
0.4 7 3 0.075 37 0,925
0.2 8 2 0.050 39 0,975
0 9 1 0.025 40 1,000
0 2 4 6 8 10
Valor da variável x
9
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
0,15
0 2 4 6 8 10
Número de defeitos 10
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Conjunto de dados
Número médio de
Quadrimestre 8
defeitos
4 2
2
5 1
6 7 0
7 3 1 3 5 7 9
Quadrimestres
8 2
9 6
11
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
40
T = 30,4 C
30
20
T = 29,5 C
Como n = 14
10 (caso acima)
0
0 5 10 15 20 Então: T = 29,5 C
Observações
n n
n = tamanho da amostra 12
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
N N
N = tamanho da população
2.3) Moda
Definição
A moda de um conjunto de dados é o valor que ocorre mais freqüentemente.
c. 1; 2; 3; 4; 5; 6; 8; 9; 10 Não há Moda.
14
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
µ =~
µ ~
µµ µ~µ
Comportamento simétrico Desvio positivo Desvio negativo
15
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
16
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
17
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Amostras Tendenciosas
Não representativas da população da qual foram obtidas.
Pecam pela falta de Aleatoriedade para seleção dos indivíduos.
Exemplo
18
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
19
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
20
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Mãe-canguru Normal
21
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
R$ 20.000,00 R$ 25.000,00
R$ 19.500,00
R$ 20.000,00
R$ 19.000,00
R$ 15.000,00
R$ 18.500,00
Renda per cápita Renda per cápita
R$ 18.000,00 R$ 10.000,00
R$ 17.500,00
R$ 5.000,00
R$ 17.000,00
R$ 16.500,00 R$ -
São Paulo Rio de Janeiro São Paulo Rio de Janeiro
5,0
Consumo Diário de Petróleo
(milhões de barris)
2,6
5,0
2,6
Japão Alemanha
Japão Alemanha
24
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
•Está sendo gasto muito pouco dinheiro com assistência social. 19%
•Está sendo gasto muito pouco dinheiro com assistência aos pobres 63%
Palavras podem ser usadas intencionalmente na questão da
sondagem para provocar uma resposta desejada.
Exemplo 7
•Tráfego contribui mais ou menos do que a indústria para a poluição? 45% Tráfego
27% Indústria
•Indústria contribui mais ou menos do que o tráfego para a poluição? 24% Tráfego
57% Indústria
Não-resposta
26
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
•Vocês confiariam num estudo patrocinado pela indústria do fumo para provar que
“o cigarro diminui a chance de se contrair Parkinson?”
•Nos Estados Unidos, uma montadora fez propaganda dizendo que 90% dos seus
carros produzidos nos últimos 10 anos ainda estavam rodando.
Porém, também 90% dos carros daquela marca haviam sido produzidos nos
EUA nos últimos 3 anos!
27
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Definição
1. Estudo observacional: observamos e medimos características específicas,
mas não tentamos modificar os sujeitos objeto do estudo. Ex: Ibope.
2. Experimento: aplicamos algum tratamento e passamos, então, a observar
seu efeito sobre os sujeitos. Ex: Teste Clínico
28
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Definição
1. Estudo transversal: os dados são observados, medidos e coletados em um
ponto no tempo.
2. Estudo retrospectivo (ou de controle de caso): os dados são coletados
do passado, através de registros históricos.
3. Estudos prospectivo (ou longitudinal ou de coorte): os dados são
coletados no futuro, de grupos (chamados coortes) que compartilham fatores
comuns.
29
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Confundimento
No início do ano letivo de 2008, um professor, preocupado com a assiduidade de
seus alunos, dá um incentivo de 1 ponto na média final para aqueles alunos que
compareceram a 90% de suas aulas, ministradas às quartas-feiras, no último
horário do curso noturno de Química.
O professor observa um incremento da assiduidade dos alunos quando comparada
à 2007.
Entretanto, em 2007, 5 feriados prolongados caíram numa quinta-feira, contra
apenas 1 em 2008.
O professor pode atribuir o aumento da assiduidade apenas ao programa de
incentivo?
30
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Confundimento
Definição
Confundimento: ocorre quando em um experimento você não é capaz de
distinguir entre os efeitos de diferentes fatores.
31
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Experimento Cego
Experimento da vacina Salk (1954):
- Um grupo recebeu a vacina Salk, enquanto um grupo recebeu um placebo.
- Efeito placebo: sujeito não tratado tratado relata melhora.
- Experimento cego: sujeito tratado não sabe se está recebendo droga ou
placebo
- Duplo-cego: sujeito e experimentador não sabem se droga ou placebo.
Experimentador só sabe a posteriori.
32
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Planejamento
experimental ruim
Mas os blocos são
diferentes entre si.
Blocos
Planejamento em blocos
Experimento com um novo fertilizante: aleatorizado:
Num experimento, quando há grupos
Depois de formados blocos, diferentes que podem apresentar
passa-se à associação
resposta diferentes, use este
aleatória dos tratamentos
aos sujeitos em cada bloco. planejamento experimental:
34
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
35
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
36
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
37
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Definição
1. Amostra aleatória: membros de uma população são selecionados de tal
modo que cada membro individual tenha igual chance de ser selecionado. Ex:
situação 1 e 2.
2. Amostra aleatória simples : de tamanho n é selecionada de tal modo que
toda amostra possível de mesmo tamanho n tenha a mesma chance de ser
escolhida. Ex: situação 2.
Importante
Neste curso, geralmente exigiremos que coletamos uma amostra aleatória
simples para que os procedimentos estáticos estudados sejam válidos.
38
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
1. Amostragem estratificada:
• População dividida em 2 ou mais grupos (estratos).
• Indivíduos nos estratos possuem características em comum. Ex: sexo, renda.
• Extrai-se amostra aleatória de cada estrato.
Mulheres Homens
39
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
•Entrevista todos os
eleitores das zonas
eleitorais sorteadas (em
verde).
40
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Problema-Objetivo
41
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Objetivos
42
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
43
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Definição
Distribuição de frequencia (ou tabela de frequencia): lista os valores dos
dados juntamente com suas frequencias correspondentes.
44
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Definição
Limites inferiores de classe: os menores números que podem pertencer às diferentes classes. (21,
31, 41, 51, 61 e 71).
Limites superiores de classe: os maiores números que podem pertencer às diferentes classes. (30,
40, 50, 60, 70 e 80).
Fronteiras de classe: números criados para separar as classes mas sem os saltos entre as classes. Útil
para construir histogramas. (30.5, 40.5, 50.5, 60.5, 70.5).
Pontos médios das classes: pontos médios dos intervalos de cada classe: (lim. sup. + lim. inf.)/2.
Amplitude da classe: diferença entre dois limites inferiores consecutivos.
Erro comum:achar que é a diferença entre os limites
superior e inferior da mesma classe.
45
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
3. Ponto inicial: comece escolhendo um número para limite inferior da primeira classe: ou o
valor mínimo ou um valor um pouco menor.
4. Usando o limite inferior e a amplitude de classe, prossiga e liste os limites inferiores das
próximas classes.
5.Liste os limites inferiores de classe em uma coluna vertical e prossiga para preencher os
limites superiores das classes.
6. Percorra o conjunto de dados e coloque uma marca na classe apropriada para cada valor
de dado. Use as marcas para encontrar a frequência total de cada classe.
46
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
47
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
frequência de classe
Frequência relativa =
soma de todas as frequências
48
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
25
2. Na escala horizontal, cada barra é
Frequência
marcada com seu limite inferior à esquerda e 20
classes. 5
0
21 - 30 31 - 40 41 - 50 51 - 60 61 - 70 71 - 80
Idades das Melhores Atrizes
49
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
30% Atrizes
20
Atores
15
20%
10
5 10%
0
0 25,5 35,5 45,5 55,5 65,5 75,5 0%
0 25,5 35,5 45,5 55,5 65,5 75,5
Idades das melhores atrizes
Idades
4000
2000
0 Taxas; 4473
Tr oca; 12478
g
s
so
is
a
in
xa
ço
in
oc
na
es
m
t
Ta
vi
Tr
ke
io
oa
ac
r
ar
c
se
na
R
de
M
de
r
te
s
xa
In
o
ã
Ta
as
rç
se
ad
In
m
ha
C
- correlação entre x e y. 30
- Conglomerados ou blocos
25
semelhantes.
20
Controle Remoto
15
10
0
60 70 80 90 100
Peso (kg)
52
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
3 Estatísticas para Descrição, Exploração e Comparação de Dados
3) Quartis
Analogamente à mediana, divide um conjunto de dados, organizados em ordem
crescente, em quatro partes iguais.
T = 25; 25; 26; 26; 27; 28; 29; 30; 30; 32; 33; 34; 34; 34; 43; 45
mediana
4) Percentis
Analogamente à mediana, divide um conjunto de dados, organizados em ordem
crescente, em subdivisões mais detalhadas.
Seja uma amostra contendo 100 observações:
x1 , x2 , x3 , x4 , …, x98 , x99 , x100
5) Média aparada
A média aparada consiste no cálculo da média de um conjunto de dados, organizados
em forma crescente, eliminando-se iguais quantidades de dados dos dois extremos.
Consiste em uma medida de localização que apresenta as características da média e
da mediana.
Seja uma amostra contendo 100 observações:
x3 + x4 + … + x98
x =
tr(2)
96
54
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Análise cálculos de medidas numéricas : Medidas de Dispersão
4
Resíduo % de A (%)
3
R2 - R = +1 R5 - R = +1
2
R1 - R = -1 R4 - R = -1 R = 2,0
1
0
0 1 2 3 4 5 6 7
Média = 2,0 %
Experimentos
55
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Análise cálculos de medidas numéricas : Medidas de Dispersão
1) Variância amostral (s2)
n
Σ
i=1
(xi – x)2
(unidade de s2 unidade de x ao quadrado)
s2 =
(n-1)
2) Desvio padrão amostral (s)
n
s= s2 =
Σ (x – x)
i=1
i
2 (unidade de s unidade de x)
n
(n-1)
N
Observação: Sxx = Σ (x – x)
i=1
i
2
Σ (x – µ)
i=1
i
2
Σ
i=1
(xi – µ)2
4) Desvio padrão da população (σ) σ =
N 56
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Análise cálculos de medidas numéricas : Medidas de Dispersão
n
Obs: Variância amostral (s2)
Σ
i=1
(xi – x)2
s2 =
(n-1)
n n n n n
Sxx = Σ
i=1
(xi – x)2 = Σ
i=1
[ (xi)2 – 2xi x + (x)2 ] = Σ (x ) + Σ(– 2x x ) + Σ(x)
i=1
i
2
i=1
i
i=1
2
n n n n
Sxx = Σ
i=1
(xi)2 – 2x Σ Σ
i=1
xi +
i=1
(x)2 = Σ
i=1
(xi)2 – 2x nx + n(x)2
n n
Sxx = Σ (x )
i=1
i
2 – 2n (x)2 + n(x)2 = Σ (x )
i=1
i
2 – n (x)2
Então: Σ
i=1
(xi)2 – n (x)2
s2 =
(n-1)
57
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Boxplot
Esquema gráfico que resume informações de posição, de simetria, de dispersão,
além de identificar possíveis “outliers’.
Medidas de temperatura de uma dada Cidade A em uma mesma hora do dia
T = 25; 25; 26; 26; 27; 28; 29; 30; 30; 30; 32; 33; 34; 34; 34; 43; 45
25 30 35 40 45
Temperatura ( C )
Dispersão entre os quartos fs
58
fs = 34 – 27 = 7
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Boxplot
Esquema gráfico que resume informações de posição, de simetria, de dispersão,
além de identificar possíveis “outliers’.
Medidas de temperatura de uma dada Cidade A em uma mesma hora do dia
T = 25; 25; 26; 26; 27; 28; 29; 30; 30; 30; 32; 33; 34; 34; 34; 43; 45
Identificação de outliers: Identificação de outliers extremo:
Qualquer ponto distante > 1,5 fs Qualquer ponto distante > 3 fs
No exemplo > 10,5 No exemplo > 21
Temos um outlier (T= 45) Não temos outlier extremo
25 30 35 40 45
Temperatura ( C )
Dispersão entre os quartos fs
59
fs = 34 – 27 = 7
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Boxplot
Esquema gráfico que resume informações de posição, de simetria, de dispersão,
além de identificar possíveis “outliers’.
Medidas de temperatura de uma dada Cidade A em uma mesma hora do dia
T = 25; 25; 26; 26; 27; 28; 29; 30; 30; 30; 32; 33; 34; 34; 34; 43; 45
Identificação de outliers: Identificação de outliers extremo:
Qualquer ponto distante > 1,5 fs Qualquer ponto distante > 3 fs
No exemplo > 10,5 No exemplo > 21
Temos um outlier (T= 45) Não temos outlier extremo
25 30 35 40 43 45
Temperatura ( C )
Dispersão entre os quartos fs
60
fs = 34 – 27 = 7
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Boxplot
Esquema gráfico que resume informações de posição, de simetria, de dispersão,
além de identificar possíveis “outliers’.
Medidas de temperatura de uma dada Cidade A em uma mesma hora do dia
T = 25; 25; 26; 26; 27; 28; 29; 30; 30; 30; 32; 33; 34; 34; 34; 43; 45
Identificação de outliers: Identificação de outliers extremo:
Qualquer ponto distante > 1,5 fs Qualquer ponto distante > 3 fs
No exemplo > 10,5 No exemplo > 21
Temos um outlier (T= 45) Não temos outlier extremo
25 30 35 40 45
Temperatura ( C )
Dispersão entre os quartos fs
61
fs = 34 – 27 = 7
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Boxplot
Esquema gráfico que resume informações de posição, de simetria, de dispersão,
além de identificar possíveis “outliers’.
Medidas de temperatura de uma dada Cidade A em uma mesma hora do dia
T = 25; 25; 26; 26; 27; 28; 29; 30; 30; 30; 32; 33; 34; 34; 34; 43; 45
Identificação de outliers: Identificação de outliers extremo:
Qualquer ponto distante > 1,5 fs Qualquer ponto distante > 3 fs
No exemplo > 10,5 No exemplo > 21
Temos um outlier (T= 45) Não temos outlier extremo
25 30 35 40 45
Temperatura ( C )
Dispersão entre os quartos fs
62
fs = 34 – 27 = 7
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Melhores Atores
44 41 62 52 41 34 34 52 41 37
38 34 32 40 43 56 41 39 49 57
Seja a seguinte tabela de idades: 41 38 42 52 51 35 30 39 41 44
49 35 47 31 47 37 57 42 45 42
44 62 43 42 48 49 56 38 60 30
40 42 36 76 39 53 45 36 62 43
51 32 42 54 52 37 38 32 45 60
46 40 36 47 29 43