Sei sulla pagina 1di 63

Ciclo Profissional Unidade Curricular: Estatística

1º semestre/2009 - Aula 2

Unidade Curricular:
Estatística Aplicada
Aula 16/04

1
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

Agenda

1. Recapitulação da Aula passada


2. Pensamento Crítico
3. Planejamento de Experimentos
4. Estatística Descritiva (cont.):
1. Resumos e Gráficos de Dados (cont.)
2. Estatísticas para Descrição, Exploração e Comparação de
Dados

2
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1.1 - Visão Geral


Definições
1. Dados: são observações coletadas (por exemplo, medidas, respostas de
sondagens)
2. Estatística: conjunto de métodos para o planejamento de estudos e
experimentos, obtenção de dados e conseqüentemente organização, resumo,
apresentação, análise, interpretação e elaboração de conclusões baseadas nos
dados.
3. Uma população é a coleção completa de todos os elementos (pessoas,
notas, medidas e outros) a serem estudados.
4. Amostra: é um subconjunto de uma população.
5. Parâmetro: é uma medida numérica que descreve alguma característica de
uma população.
6. Estatística: é uma medida numérica que descreve alguma característica de
uma amostra.

3
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1.2 Tipos de Dados


Tipos de dados

Definições
1. Dados Quantitativos: consistem em números que representam contagens
ou medidas.
2. Dados Qualitativos (ou categóricos ou de atributos): podem ser
separados em diferentes categorias que se distinguem por alguma
característica numérica.
3. Dados Discretos: número de valores possível é um número finito ou uma
quantidade enumerável (passíveis de contagem: 0, 1, 2, 3).
4. Dados Contínuos: infinitos valores possíveis, cobrindo um intervalo sem
vazios, interrupções ou saltos.

4
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1.2 Tipos de Dados


Níveis de Mensuração

Nível Resumo Exemplo

Nominal Apenas categorias. Os dados não Cidades dos estudantes


podem ser usados em um esquema de 35 Paulistanos
ordem. 5 Santistas
3 Campineiros
2 Joseenses
} “Rótulos”, apenas

Ordinal As categorias são ordenadas mas as Conceitos dos 3668 cursos avaliados
diferenças não podem ser no Provão (2001) Ordem
encontradas A: 14,3%
B: 13,3%
C: 40,9%
} estabelecida:
A, B, C

Intervalar As diferenças são significativas, mas Temperaturas em Diadema 0oC não significa
não existe ponto inicial ou zero 15ºC “nenhum calor; 30oC
natural e as razões não tem sentido. 22ºC
30ºC } não é 2x + quente
que 15oC
Razão Há um ponto inicial zero natural e as Distância que um aluno percorre
razões são significativas entre sua casa e a escola:
5 km 10 km é 2x + distante
10 km
22 km
} que 5 km

5
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1.3 Estatística Descritiva


Técnicas da Estatística Descritiva:
 Baseadas em visualizações gráficas de um conjunto de dados
 Baseadas em cálculos numéricos de um conjunto de dados
Notações:
n = tamanho da amostra
xi = i-ésima observação de uma dada variável “x”

1) Gráfico de pontos:
Sejam as temperaturas (oC) de uma Cidade A medidas às 12:00 h (horário local):

T = 30; 25; 32; 34; 31; 29; 28; 30; 32; 34; 34; 32; 30; 26; 43

Um ponto “afastado” da
tendência dos dados

20 25 30 35 40 “outlier”
Temperatura (oC)
6
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1.3 Estatística Descritiva


2) Diagrama de Caule e folha:
É uma forma simples de visulazação gráfica do comportamento de um conjunto
de dados (os dados devem apresentar, no mínimo, dois dígitos)

Seja o conjunto do número multas de trânsito notificadas em uma certa via da


Cidade de Diadema, observadas durante 16 dias:
Dados observados:
10; 15; 22; 9; 15; 16; 9; 24; 11; 20; 22; 25; 40; 28; 30; 31 Dados brutos
Vamos organizá-los: (ordená-los em ordem crescente, por exemplo)
9; 9; 10; 11; 15; 15; 16; 20; 22; 22; 24; 25; 28; 30; 31; 40 Rol

0 9 9
Diagrama de Caule e Folha 1 0 1 5 5 6
2 0 2 2 4 5 8
3 0 1
Casa das dezenas 4 0 Casa das unidades
“CAULE” “FOLHA” 7
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1.3 Estatística Descritiva


3) Histograma: “Para variáveis discretas”
Seja o conjunto do número de defeitos em um dado produto
Consideremos a seguinte amostra de 40 observações:
Tabela de freqüências
Valor de x f (x) fr (x)
0 2 0.050
1 2 0.050
2 5 0.125

0,2
3 6 0.150
4 8 0.200
Freqüência relativa

5 6 0.150
6 5 0.125
0,1 7 3 0.075
8 2 0.050
9 1 0.025

0 2 4 6 8 10
Número de defeitos
8
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1.3 Estatística Descritiva


3) Histograma: “Para variáveis discretas” Tabela de freqüências
Valor de x f (x) fr (x) Fac Frac
0 2 0.050 2 0,050
1 2 0.050 4 0,100
2 5 0.125 9 0,225
F req ü ên cia R elativa A cu m u lad a

3 6 0.150 15 0,375
1
4 8 0.200 23 0,575
0.8
5 6 0.150 29 0,725
(F rac)

0.6
6 5 0.125 34 0,850
0.4 7 3 0.075 37 0,925
0.2 8 2 0.050 39 0,975
0 9 1 0.025 40 1,000
0 2 4 6 8 10
Valor da variável x

9
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1.3 Estatística Descritiva


3) Histograma: “Para variáveis contínuas”
Sejam os valores de pH medidos pelos alunos numa aula de Química das
Transformações para uma mesma amostra X.
Tabela de freqüências
2,6; 2,6; 2,8; 3,1; 4,0; 4,0; 4,0; 4,1; 4,2; 4,5; Classe f (x) fr (x)
5,1; 5,1; 5,2; 5,2; 5,3; 5,3; 5,3; 5,8; 5,9; 6,0; 2,60 3,53 4 0,08
6,0; 6,0; 6,0; 6,1; 6,1; 6,2; 6,2; 6,3; 6,4; 6,5; 3,53 4,46 5 0,10
6,6; 6,8; 7,0; 7,0; 7,0; 7,0; 7,0; 7,1; 7,2; 7,2; 4,46 5,39 8 0,16
7,2; 7,6; 7,7; 7,8; 7,9; 8,0; 8,6; 8,8; 8,9; 9,1
5,39 6,32 11 0,22
0,30
6,32 7,25 13 0,26
Freqüência relativa

7,25 8,18 5 0,10

8,18 9,11 4 0,08

0,15

0 2 4 6 8 10
Número de defeitos 10
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1.3 Estatística Descritiva


4) Gráfico da série temporal:
Seja o conjunto do número médio de defeitos, medidos quadrimestralmente, de
um dado produto produzido ao longo de 9 quadrimestres.

Conjunto de dados
Número médio de
Quadrimestre 8
defeitos

Núm ero m édio de defeitos


1 2
6
2 3
3 6 4

4 2
2
5 1
6 7 0
7 3 1 3 5 7 9
Quadrimestres
8 2
9 6

11
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1.3 Estatística Descritiva


Análise cálculos de medidas numéricas : Medidas de Localização
Sejam as temperaturas (oC) de uma Cidade A medidas às 12:00 h (horário local):
T = 30; 25; 32; 34; 26; 29; 33; 25; 28; 34; 34; 27; 30; 26; 43

50 “outlier” Excluindo-o, temos:


Temperatura (C)

40
T = 30,4 C
30

20
T = 29,5 C
Como n = 14
10 (caso acima)
0
0 5 10 15 20 Então: T = 29,5 C
Observações

1.1) Média amostral: x


x =
x1 + x2 + … + xn
=
Σx
i=1
i

n n
n = tamanho da amostra 12
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1.2) Média da população: µ


µ =
x1 + x2 + … + xn
=
Σx
i=1
i

N N
N = tamanho da população

Em casos práticos, a média da população é inviável de ser calculada


x Inferência µ

2.1) Mediana amostral ( ~


x)
Com os dados de uma amostra organizados em forma de ROL, na ordem
crescente, a mediana amostral é representada pelo valor que divide o conjunto
de dados em duas partes iguais.
Ou seja, considerando uma amostra com cinco observações dispostas em
ordem crescente: x1 , x2 , x3 , x4 , x5
mediana amostral

Observação: No caso de amostras com um número par de observações, a mediana


consistirá na média aritmética das duas observações centrais.
x1 , x2 , x3 , x4 , x5 , x6 x3 + x4
mediana amostral 13
2
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

2.3) Moda
Definição
A moda de um conjunto de dados é o valor que ocorre mais freqüentemente.

Ache as modas dos seguintes conjuntos de dados:

a. 5,40; 1,10; 0,42; 0,73; 0,48; 1,10 Moda = 1,10

b. 27; 27; 27; 55; 55; 55; 88; 88; 90 Modas = 27 e 55

c. 1; 2; 3; 4; 5; 6; 8; 9; 10 Não há Moda.

•Quando dois valores ocorrem com a mesma freqüência, cada um é uma


moda, e o conjunto de dados é bimodal.
•Quando mais de dois valores ocorrem com a mesma freqüência, cada
um é uma moda, e o conjunto de dados é mutimodal.

•Quando nenhum valor se repete, dizemos que não há moda.

14
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

Simetria e Assimetria nas Distribuições

Considerando as seguintes distribuições populacionais:


moda
moda
moda

µ =~
µ ~
µµ µ~µ
Comportamento simétrico Desvio positivo Desvio negativo

Média, Mediana e Moda Assimétrica à direita: Assimétrica à esquerda:


coincidem Média e Mediana à direita da Média e Mediana à esquerda
média da média

15
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

Aula 13/04/08 – 1ª Parte


Objetivos
Após essa 1ª. Parte da aula, você deve ser capaz de :

1. Analisar criticamente estudos estatísticos.


2. Reconhecer os princípios de um bom planejamento de
experimentos.
3. Reconhecer a importância e os tipos de amostragem.
4. Distinguir uma amostra aleatória simples de outros tipos de
amostras.

Bibiliografia: Triola, Cap 1. 9 - 27.

16
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

• Sucesso em um curso introdutório em Estatística requer mais senso


comum do que habilidade matemática.
• Os números não mentem
• “Há três tipos de mentiras: mentiras, mentiras cabeludas e estatísticas.”
(Benjamin Disraeli).
• Nem toda estatística é confiável.
• Vamos ver agora algumas falhas que podem comprometer os resultados
de uma pesquisa ou experimento.

17
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

Amostras Tendenciosas
 Não representativas da população da qual foram obtidas.
 Pecam pela falta de Aleatoriedade para seleção dos indivíduos.
Exemplo

18
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico


Definição
1. Amostra de resposta voluntária (ou amostra auto-selecionada):
aquela na qual os respondentes decidem, eles mesmos, se serão ou não
incluídos.

Quando a Folha ou outro meio de comunicação realiza uma pesquisa pela


internet, as pessoas decidem, elas mesmas, se participam ou não, de modo
que constituem uma amostra de resposta voluntária.

Não representam toda população:


- Acesso à Internet;
- Diferentes sites possuem diferentes públicos;
- Pessoas com opiniões fortes têm mais tendência a se auto-selecionarem.

19
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico


Amostra de resposta voluntária (cont)

• Pesquisas feitas pela Internet, Telefone ou Correio: amostra de resposta


voluntária.
• São válidas apenas em relação ao grupo específico que resolveu participar.
• De um ponto de vista estatístico, essas amostras são tendenciosas e não
devem ser usadas para afirmar algo sobre uma população maior.

20
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

Amostras Tendenciosas (cont)


Exemplo 2
Em TCC, uma fonoaudióloga concluiu que, entre crianças que têm parto
prematuro, aquelas que são submetidas ao método da mãe-canguru
apresentam resultados superiores no desenvolvimento da fala que aquelas
não submetidas a tal método.

Mãe-canguru Normal

Reconhecimen 60% 45%


to de Palavras
aos 18 meses
Qual o problema
Tamanho da 7 crianças 7 crianças aqui?
Amostra

Amostras pequenas: conclusões não devem ser baseadas em


amostras muito pequenas.

21
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

Problemas com gráficos


Exemplo 3

Renda per cápita Renda per cápita

R$ 20.000,00 R$ 25.000,00

R$ 19.500,00
R$ 20.000,00
R$ 19.000,00
R$ 15.000,00
R$ 18.500,00
Renda per cápita Renda per cápita
R$ 18.000,00 R$ 10.000,00
R$ 17.500,00
R$ 5.000,00
R$ 17.000,00

R$ 16.500,00 R$ -
São Paulo Rio de Janeiro São Paulo Rio de Janeiro

Gráficos de barras podem ser usados para exagerar ou reduzir a


verdadeira natureza dos dados:
Atenção à informação numérica
Cuidado com a forma geral do gráfico: escala das barras
22
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

Problemas com gráficos


(B)
Exemplo 4 (A) Consumo Diário de Petróleo
(milhões de barris)

5,0
Consumo Diário de Petróleo
(milhões de barris)

2,6

5,0

2,6

Japão Alemanha
Japão Alemanha

Pictogramas: objetos tridimensionais criados por artistas podem deturpar dados.


•(B): falsa impressão de que o consumo alemão de petróleo é + ou - 1/8 do japonês.
• Na verdade a razão entre os dois é 1/2.
•(B) reduz tanto a altura qto o diâmetro do “barril” proporcional/e à razão dos consumos.
•Apenas a altura deveria ser reduzida para transmitir a idéia correta. 23
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

Problemas com porcentagens


Exemplo 5

• Empresa aérea veicula notícia que aponta melhoria de 100% no extravio de


bagagens.
• Quantas bagagens devem ser extraviadas nessa companhia para que essa
informação seja verdadeira?
• Suponha que em 2007 ocorreram 4 furtos de carros numa cidade do interior
(Pirapozinho) e em 2008, ocorreram 3 furtos. Pode-se dizer que:
a) O número de furtos diminuiu 33% em 2007, comparado com 2008?
b) O número de furtos diminuiu 25% em 2007, comparado com 2008?

24
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

Fraseamento de questões em sondagens


Exemplo 6 SIM

•Está sendo gasto muito pouco dinheiro com assistência social. 19%
•Está sendo gasto muito pouco dinheiro com assistência aos pobres 63%
Palavras podem ser usadas intencionalmente na questão da
sondagem para provocar uma resposta desejada.
Exemplo 7

•Tráfego contribui mais ou menos do que a indústria para a poluição? 45% Tráfego

27% Indústria
•Indústria contribui mais ou menos do que o tráfego para a poluição? 24% Tráfego

57% Indústria

A ordem com que os fatores são apresentados podem afetar os


resultados das sondagens.
25
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

Não-resposta

•Algumas pessoas se recusam terminantemente a responder pesquisas.


•Esta taxa vem crescendo nos últimos anos.
•Por questões de privacidade ou de temperamento: este grupo é diferente
daqueles que aceitam responder enquetes.
•Número de pessoas que não quiseram responder deve ser relatado.

26
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

Estudo de interesse próprio, cenários parciais  distorções deliberadas

•Vocês confiariam num estudo patrocinado pela indústria do fumo para provar que
“o cigarro diminui a chance de se contrair Parkinson?”
•Nos Estados Unidos, uma montadora fez propaganda dizendo que 90% dos seus
carros produzidos nos últimos 10 anos ainda estavam rodando.
Porém, também 90% dos carros daquela marca haviam sido produzidos nos
EUA nos últimos 3 anos!

27
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Planejamento de Experimentos

Se os dados amostrais não forem coletados de maneira apropriada, eles podem


ser de tal modo inúteis que nenhuma manipulação poderá salvá-los

•Qual a diferença de uma pesquisa do Ibope e de um teste clínico para se medir a


eficácia de um novo medicamento?

Definição
1. Estudo observacional: observamos e medimos características específicas,
mas não tentamos modificar os sujeitos objeto do estudo. Ex: Ibope.
2. Experimento: aplicamos algum tratamento e passamos, então, a observar
seu efeito sobre os sujeitos. Ex: Teste Clínico

28
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Planejamento de Experimentos

Definição
1. Estudo transversal: os dados são observados, medidos e coletados em um
ponto no tempo.
2. Estudo retrospectivo (ou de controle de caso): os dados são coletados
do passado, através de registros históricos.
3. Estudos prospectivo (ou longitudinal ou de coorte): os dados são
coletados no futuro, de grupos (chamados coortes) que compartilham fatores
comuns.

29
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

Confundimento
No início do ano letivo de 2008, um professor, preocupado com a assiduidade de
seus alunos, dá um incentivo de 1 ponto na média final para aqueles alunos que
compareceram a 90% de suas aulas, ministradas às quartas-feiras, no último
horário do curso noturno de Química.
O professor observa um incremento da assiduidade dos alunos quando comparada
à 2007.
Entretanto, em 2007, 5 feriados prolongados caíram numa quinta-feira, contra
apenas 1 em 2008.
O professor pode atribuir o aumento da assiduidade apenas ao programa de
incentivo?

30
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

Confundimento

Definição
Confundimento: ocorre quando em um experimento você não é capaz de
distinguir entre os efeitos de diferentes fatores.

Tente planejar o experimento de modo que não ocorra confundimento.

1. Controle o efeito das variáveis.


2. Replicação.
3. Aleatorização

31
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

1. Controle do efeito das variáveis

Experimento Cego
Experimento da vacina Salk (1954):
- Um grupo recebeu a vacina Salk, enquanto um grupo recebeu um placebo.
- Efeito placebo: sujeito não tratado tratado relata melhora.
- Experimento cego: sujeito tratado não sabe se está recebendo droga ou
placebo
- Duplo-cego: sujeito e experimentador não sabem se droga ou placebo.
Experimentador só sabe a posteriori.

32
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

1. Controle do efeito das variáveis

Blocos Um bloco é um grupo


de sujeitos que são
Experimento com um novo fertilizante: semelhantes...

Sabemos que umidade do


solo é fator crítico para o
crescimento.

Planejamento
experimental ruim
Mas os blocos são
diferentes entre si.

Os testes de fertilizantes devem envolver um bloco de árvores


em terrenos secos e outro de árvores em terrenos úmidos.
33
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

1. Controle do efeito das variáveis

Blocos
Planejamento em blocos
Experimento com um novo fertilizante: aleatorizado:
Num experimento, quando há grupos
Depois de formados blocos, diferentes que podem apresentar
passa-se à associação
resposta diferentes, use este
aleatória dos tratamentos
aos sujeitos em cada bloco. planejamento experimental:

Planejamento • Forme blocos de sujeitos com


experimental em bloco características semelhantes.
aleatorizado
• Associe aleatoriamente os
tratamentos aos sujeitos em cada
bloco.

34
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

1. Controle do efeito das variáveis

Replicação e Tamanho de amostra


• Replicação é a repetição em grupos suficientemente grandes de sujeitos.
• Dependendo do contexto, pode ter outro significado: duplicação de um
experimento, para confirmar resultados.
• Use uma amostra suficientemente grande.
• Use um método baseado em aleatoriedade para obter a amostra.

35
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

2. Aleatorização e Outras Estratégias Amostrais


Sala com 60 alunos
Filas:
Situação 1: Jogamos uma
1 dado e escolhemos todos os
alunos daquela fila.

•Todos os alunos têm a


2 mesma chance de serem
escolhidos.
•Apenas as amostras de
3 10 elementos em fila
podem ser escolhidas.
4 •Nem todas as amostras
de 10 elementos podem
ser escolhidas.
5
Amostra Aleatória
6

36
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

2. Aleatorização e Outras Estratégias Amostrais


Sala com 60 alunos
Filas:
Situação 2: Associamos
1 cada aluno a um número de
1 a 0. Num globo de bingo,
com bolinhas numeradas de
1 a 60, retiramos 10
2 bolinhas.

•Todos os alunos têm a


3 mesma chance de serem
escolhidos.
4 •Todas as amostras de 10
elementos podem ser
escolhidas.
5
Amostra Aleatória
Simples
6

37
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

2. Aleatorização e Outras Estratégias Amostrais

Definição
1. Amostra aleatória: membros de uma população são selecionados de tal
modo que cada membro individual tenha igual chance de ser selecionado. Ex:
situação 1 e 2.
2. Amostra aleatória simples : de tamanho n é selecionada de tal modo que
toda amostra possível de mesmo tamanho n tenha a mesma chance de ser
escolhida. Ex: situação 2.

Importante
Neste curso, geralmente exigiremos que coletamos uma amostra aleatória
simples para que os procedimentos estáticos estudados sejam válidos.

38
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

2. Aleatorização e Outras Estratégias Amostrais

1. Amostragem estratificada:
• População dividida em 2 ou mais grupos (estratos).
• Indivíduos nos estratos possuem características em comum. Ex: sexo, renda.
• Extrai-se amostra aleatória de cada estrato.

Mulheres Homens

39
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

1-4 Pensamento Crítico

2. Aleatorização e Outras Estratégias Amostrais

2. Amostragem por conglomerado:


• Área da população dividida em 2 ou mais seções (conglomerados).
• Selecionam-se aleatoriamente alguns desses conglomerados.
• Entrevista-se todos indivíduos desses conglomerados.

•Entrevista todos os
eleitores das zonas
eleitorais sorteadas (em
verde).

40
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

2 Resumos e Gráficos de Dados

Problema-Objetivo

1. Analisando dois conjuntos de dados, contendo as idades dos melhores atores e


das melhores atrizes, desde a primeira cerimônia, pode-se perceber que a
premiação do Oscar envolve discriminação com base na idade?
Melhores Atrizes Melhores Atores
22 37 28 63 32 26 31 27 27 28 44 41 62 52 41 34 34 52 41 37
30 26 29 24 38 25 29 41 30 35 38 34 32 40 43 56 41 39 49 57
35 33 29 38 54 24 25 46 41 28 41 38 42 52 51 35 30 39 41 44
40 39 29 27 31 38 29 25 35 60 49 35 47 31 47 37 57 42 45 42
43 35 34 34 17 37 42 41 36 32 44 62 43 42 48 49 56 38 60 30
41 33 31 74 33 50 38 61 21 41 40 42 36 76 39 53 45 36 62 43
26 80 42 19 33 35 45 49 39 34 51 32 42 54 52 37 38 32 45 60
26 25 33 35 35 28 46 40 36 47 29 43

41
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

Aula 13/04/08 – 2ª Parte


2 Resumos e Gráficos de Dados

Objetivos

Após essa 2ª. Parte da aula, você deve ser capaz de :

• Compreensão de dados: a importância de certas características do conjunto:


centro, variação, distribuição, outliers, tempo.
• Resumindo dados: Distribuição de Frequência.
• Visualizando dados (cont): depois de termos visto alguns gráficos, como o
Histograma, ver Gráfico de setores e de Pareto, Diagramas de dispersão.

42
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

2 Resumos e Gráficos de Dados

2.1 Visão Geral

Características Importantes dos Dados:


• Centro: um valor representativo que indica o “centro” do conjunto de dados.
• Variação: quanto os valores variam entre si?
• Distribuição: natureza ou forma da distribuição dos dados.
• Outliers ou Valores Discrepantes: numa amostra, valores que se localizam
muito longe da maioria dos outros valores.
• Tempo: identificar características que mudam com o tempo.

43
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

2 Resumos e Gráficos de Dados

2.2 Distribuição de Frequencia


Distribuição de
Melhores Atrizes Frquencia: Idade das
22 37 28 63 32 26 31 27 27 28 melhores atrizes
30 26 29 24 38 25 29 41 30 35 Idade das
35 33 29 38 54 24 25 46 41 28 atrizes Frequencia
40 39 29 27 31 38 29 25 35 60 21 - 30 28
43 35 34 34 17 37 42 41 36 32 31 - 40 30
41 33 31 74 33 50 38 61 21 41 41 - 50 12
26 80 42 19 33 35 45 49 39 34 51 - 60 2
26 25 33 35 35 28 61 - 70 2
71 - 80 2

Definição
Distribuição de frequencia (ou tabela de frequencia): lista os valores dos
dados juntamente com suas frequencias correspondentes.

44
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

2 Resumos e Gráficos de Dados

Distribuição de 2.2 Distribuição de Frequencia


Frquencia: Idade das
melhores atrizes Limites de Classe
Idade das
atrizes Frequencia 21 30 31 40 41 50 51 60 61 70 71 80
21 - 30 28
31 - 40 30
41 - 50 12
51 - 60 2 ? 30.5 40.5 50.5 60.5 70.5 ?
61 - 70 2
Fronteiras de Classe
71 - 80 2

Definição
Limites inferiores de classe: os menores números que podem pertencer às diferentes classes. (21,
31, 41, 51, 61 e 71).
Limites superiores de classe: os maiores números que podem pertencer às diferentes classes. (30,
40, 50, 60, 70 e 80).
Fronteiras de classe: números criados para separar as classes mas sem os saltos entre as classes. Útil
para construir histogramas. (30.5, 40.5, 50.5, 60.5, 70.5).
Pontos médios das classes: pontos médios dos intervalos de cada classe: (lim. sup. + lim. inf.)/2.
Amplitude da classe: diferença entre dois limites inferiores consecutivos.
Erro comum:achar que é a diferença entre os limites
superior e inferior da mesma classe.
45
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

2 Resumos e Gráficos de Dados

2.2 Distribuição de Frequencia

Procedimento para a Construção de uma Distribuição de Frequência


1.Decida o número de classes: entre 5 e 20. Essa escolha deve ser conveniente para que
limites das classes sejam números redondos.
(valor máximo) - (valor mínimo)
2. Calcule a amplitude de classe ≈ . Arredonde o resultado para
número de classes obter um número redondo.

3. Ponto inicial: comece escolhendo um número para limite inferior da primeira classe: ou o
valor mínimo ou um valor um pouco menor.
4. Usando o limite inferior e a amplitude de classe, prossiga e liste os limites inferiores das
próximas classes.
5.Liste os limites inferiores de classe em uma coluna vertical e prossiga para preencher os
limites superiores das classes.
6. Percorra o conjunto de dados e coloque uma marca na classe apropriada para cada valor
de dado. Use as marcas para encontrar a frequência total de cada classe.

46
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

2 Resumos e Gráficos de Dados

2.2 Distribuição de Frequencia


Exemplo: Idade das Melhores Atrizes
Melhores Atrizes
22 37 28 63 32 26 31 27 27 28
30 26 29 24 38 25 29 41 30 35
35 33 29 38 54 24 25 46 41 28
1.Comece com 6 classes.
40 39 29 27 31 38 29 25 35 60
43 35 34 34 17 37 42 41 36 32
41 33 31 74 33 50 38 61 21 41
26 80 42 19 33 35 45 49 39 34
(valor máximo) - (valor mínimo)
2. Calcule a amplitude de classe ≈
26 25 33 35 35 28 número de classes
(80) - (21) ≈ 9,833

6
3. Escolha 21 como ponto inicial, que é o valor mínimo da lista e é
também conveniente, pois a primeira classe se torna 21-30.
4. Usando o limite inferior e a amplitude de classe, prossiga e liste os
limites inferiores das próximas classes: 1ª. 21 + 10 = 31, 2ª. 31
+ 10 = 41, ..., 6ª. 61 + 10 = 71.
5.Liste os limites inferiores de classe em uma coluna vertical e
prossiga para preencher os limites superiores das classes: 1ª. 30;
2ª. 40; 3ª. 50; ...; 6ª. 80.

47
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

2 Resumos e Gráficos de Dados

2.2 Distribuição de Frequencia

Distribuição de Frequência Relativa

frequência de classe
Frequência relativa =
soma de todas as frequências

Distribuição de Frequência Acumulada

A frequência acumulada para uma classe é a


soma da frequência daquela classe com as
frequências de todas as classes anteriores.

48
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

2 Resumos e Gráficos de Dados

2.3 Histogramas (cont)

Procedimento para construção


35

1. Construa uma tabela de frequência. 30

25
2. Na escala horizontal, cada barra é

Frequência
marcada com seu limite inferior à esquerda e 20

com seu limite superior à direita. 15

3. Na escala vertical, use as frequências das 10

classes. 5

0
21 - 30 31 - 40 41 - 50 51 - 60 61 - 70 71 - 80
Idades das Melhores Atrizes

O histograma é uma versão


gráfica da tabela de
frequência.

49
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

2 Resumos e Gráficos de Dados

2.4 Outros Gráficos Estatísticos

Um polígono de frequência usa segmentos de reta ligados a pontos localizados


diretamente acima dos valores dos pontos médios das classes.
50%
35

Frequência Relativa (%)


30
40%
25

30% Atrizes
20
Atores
15
20%
10

5 10%
0
0 25,5 35,5 45,5 55,5 65,5 75,5 0%
0 25,5 35,5 45,5 55,5 65,5 75,5
Idades das melhores atrizes
Idades

Uma variação do polígono de frequência básico é o polígono de frequência relativa.


50
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

2 Resumos e Gráficos de Dados

2.4 Outros Gráficos Estatísticos


Gráfico de Pareto: gráfico de barras Gráfico de setores: gráfico para dados
para dados qualitativos, com as qualitativos, com frequências
barras dispostas em ordem de retratadas como “pedaços de pizza”.
frequência.
14000
12000 Roami ng; 534

Taxas de acesso; 614

10000 Chamadas Inter naci onais;


766

8000 Mar keting; 1007

6000 Inser ção de ser vi ços; 1214

4000
2000
0 Taxas; 4473
Tr oca; 12478

g
s

so
is
a

in
xa

ço

in
oc

na

es

m
t
Ta

vi
Tr

ke

io

oa
ac
r

ar

c
se

na

R
de
M
de

r
te

s
xa
In
o
ã

Ta
as

se

ad
In

m
ha
C

Ambos representam a mesma informação mas de maneiras diferentes.


Pareto é mais claro para mostrar diferenças entre os componentes.
51
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

2 Resumos e Gráficos de Dados

2.4 Outros Gráficos Estatísticos


Diagrama de dispersão: gráfico de pares de dados (x, y), com um eixo
horizontal x e um eixo vertical y.
Identifica: Diagrama de Dispersão: Controle Remoto vs Peso

- correlação entre x e y. 30

- Conglomerados ou blocos
25
semelhantes.
20

Controle Remoto
15

10

0
60 70 80 90 100
Peso (kg)

52
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
3 Estatísticas para Descrição, Exploração e Comparação de Dados
3) Quartis
Analogamente à mediana, divide um conjunto de dados, organizados em ordem
crescente, em quatro partes iguais.

T = 25; 25; 26; 26; 27; 28; 29; 30; 30; 32; 33; 34; 34; 34; 43; 45

26,5 30,0 34,0


1o Quartil 2o Quartil 3o Quartil
Quarto inferior Quarto superior

mediana

4) Percentis
Analogamente à mediana, divide um conjunto de dados, organizados em ordem
crescente, em subdivisões mais detalhadas.
Seja uma amostra contendo 100 observações:
x1 , x2 , x3 , x4 , …, x98 , x99 , x100

98o percentil  Separa os 2% superiores dos restantes


53
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

5) Média aparada
A média aparada consiste no cálculo da média de um conjunto de dados, organizados
em forma crescente, eliminando-se iguais quantidades de dados dos dois extremos.
Consiste em uma medida de localização que apresenta as características da média e
da mediana.
Seja uma amostra contendo 100 observações:

x1 , x2 , x3 , x4 , …, x98 , x99 , x100

A média aparada de 2% resulta em:

x3 + x4 + … + x98
x =
tr(2)
96

54
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Análise cálculos de medidas numéricas : Medidas de Dispersão

4
Resíduo % de A (%)

3
R2 - R = +1 R5 - R = +1
2

R1 - R = -1 R4 - R = -1 R = 2,0
1

0
0 1 2 3 4 5 6 7
Média = 2,0 %
Experimentos

A soma dos desvios pode refletir o grau da dispersão:


n

Σ (R – R) = – 1 + 1 + 0 – 1 + 1 + 0 = 0 (zero?? Mas a dispersão existe!)


i=1
i
n

A soma dos quadrados dos desvios é mais apropriada: OBS: Σ (x – x) = 0 i


i=1
n

Σ (R – R) = (–1) + (1) + (0) + (–1) + (1) + (0) = 4


i=1
i
2 2 2 2 2 2 2

55
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Análise cálculos de medidas numéricas : Medidas de Dispersão
1) Variância amostral (s2)
n

Σ
i=1
(xi – x)2
(unidade de s2  unidade de x ao quadrado)
s2 =
(n-1)
2) Desvio padrão amostral (s)
n

s= s2 =
Σ (x – x)
i=1
i
2 (unidade de s  unidade de x)
n

(n-1)
N
Observação: Sxx = Σ (x – x)
i=1
i
2

Σ (x – µ)
i=1
i
2

3) Variância da população (σ2)  σ2 =


N
N

Σ
i=1
(xi – µ)2
4) Desvio padrão da população (σ)  σ =
N 56
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Análise cálculos de medidas numéricas : Medidas de Dispersão
n
Obs: Variância amostral (s2)
Σ
i=1
(xi – x)2
s2 =
(n-1)
n n n n n

Sxx = Σ
i=1
(xi – x)2 = Σ
i=1
[ (xi)2 – 2xi x + (x)2 ] = Σ (x ) + Σ(– 2x x ) + Σ(x)
i=1
i
2

i=1
i
i=1
2

n n n n

Sxx = Σ
i=1
(xi)2 – 2x Σ Σ
i=1
xi +
i=1
(x)2 = Σ
i=1
(xi)2 – 2x nx + n(x)2

n n
Sxx = Σ (x )
i=1
i
2 – 2n (x)2 + n(x)2 = Σ (x )
i=1
i
2 – n (x)2

Então: Σ
i=1
(xi)2 – n (x)2
s2 =
(n-1)

57
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Boxplot
Esquema gráfico que resume informações de posição, de simetria, de dispersão,
além de identificar possíveis “outliers’.
Medidas de temperatura de uma dada Cidade A em uma mesma hora do dia
T = 25; 25; 26; 26; 27; 28; 29; 30; 30; 30; 32; 33; 34; 34; 34; 43; 45

metade menor mediana metade maior

Quarto inferior Quarto superior

25 30 35 40 45
Temperatura ( C )
Dispersão entre os quartos  fs
58
fs = 34 – 27 = 7
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Boxplot
Esquema gráfico que resume informações de posição, de simetria, de dispersão,
além de identificar possíveis “outliers’.
Medidas de temperatura de uma dada Cidade A em uma mesma hora do dia
T = 25; 25; 26; 26; 27; 28; 29; 30; 30; 30; 32; 33; 34; 34; 34; 43; 45
Identificação de outliers: Identificação de outliers extremo:
Qualquer ponto distante > 1,5 fs Qualquer ponto distante > 3 fs
No exemplo > 10,5 No exemplo > 21
Temos um outlier (T= 45) Não temos outlier extremo

25 30 35 40 45
Temperatura ( C )
Dispersão entre os quartos  fs
59
fs = 34 – 27 = 7
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Boxplot
Esquema gráfico que resume informações de posição, de simetria, de dispersão,
além de identificar possíveis “outliers’.
Medidas de temperatura de uma dada Cidade A em uma mesma hora do dia
T = 25; 25; 26; 26; 27; 28; 29; 30; 30; 30; 32; 33; 34; 34; 34; 43; 45
Identificação de outliers: Identificação de outliers extremo:
Qualquer ponto distante > 1,5 fs Qualquer ponto distante > 3 fs
No exemplo > 10,5 No exemplo > 21
Temos um outlier (T= 45) Não temos outlier extremo

25 30 35 40 43 45
Temperatura ( C )
Dispersão entre os quartos  fs
60
fs = 34 – 27 = 7
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Boxplot
Esquema gráfico que resume informações de posição, de simetria, de dispersão,
além de identificar possíveis “outliers’.
Medidas de temperatura de uma dada Cidade A em uma mesma hora do dia
T = 25; 25; 26; 26; 27; 28; 29; 30; 30; 30; 32; 33; 34; 34; 34; 43; 45
Identificação de outliers: Identificação de outliers extremo:
Qualquer ponto distante > 1,5 fs Qualquer ponto distante > 3 fs
No exemplo > 10,5 No exemplo > 21
Temos um outlier (T= 45) Não temos outlier extremo

25 30 35 40 45
Temperatura ( C )
Dispersão entre os quartos  fs
61
fs = 34 – 27 = 7
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2
Boxplot
Esquema gráfico que resume informações de posição, de simetria, de dispersão,
além de identificar possíveis “outliers’.
Medidas de temperatura de uma dada Cidade A em uma mesma hora do dia
T = 25; 25; 26; 26; 27; 28; 29; 30; 30; 30; 32; 33; 34; 34; 34; 43; 45
Identificação de outliers: Identificação de outliers extremo:
Qualquer ponto distante > 1,5 fs Qualquer ponto distante > 3 fs
No exemplo > 10,5 No exemplo > 21
Temos um outlier (T= 45) Não temos outlier extremo

25 30 35 40 45
Temperatura ( C )
Dispersão entre os quartos  fs
62
fs = 34 – 27 = 7
Ciclo Profissional Unidade Curricular: Estatística
1º semestre/2009 - Aula 2

Melhores Atores
44 41 62 52 41 34 34 52 41 37
38 34 32 40 43 56 41 39 49 57
Seja a seguinte tabela de idades: 41 38 42 52 51 35 30 39 41 44
49 35 47 31 47 37 57 42 45 42
44 62 43 42 48 49 56 38 60 30
40 42 36 76 39 53 45 36 62 43
51 32 42 54 52 37 38 32 45 60
46 40 36 47 29 43

Para 6 classes e adotando como valor mínimo da primeira classe 21 anos:


(1) Qual amplitude de cada classe (aproxime para um número redondo conveniente) ( 1
pt)
(2) Quais são os demais limites inferiores? (1 pt)
(3) Quais são os limites superiores? (1 pt)
(4) Quanto vale a fronteira entre a 2ª. A 3ª. Classe? (1 pt)
(5) Construa a tabela completa de frequência, seguindo o procedimento dado em aula
(2 pt)
(6) Acrescente uma coluna à tabela anterior, calculando as frequências relativas de cada
classe.(1 pt)
(7) Plote o histograma e o polígono de frequencias no mesmo gráfico. (2 pt)
(8) Por que um diagrama de Pareto é melhor que um gráfico de Pizza para mostrar a
frequencia de dados qualitativos? (1 pt)
63

Potrebbero piacerti anche