Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Processos Organizacionais
Estatística Aplicada
Bibliografia Complementar:
Anderson, D.R., Sweeney, D.J. & Williams, T.A. (2005). Estatística
Aplicada à Administração e Economia. São Paulo: Pioneira Thomson
Learning.
Anderson, D.R., Sweeney, D.J. & Williams, T.A. (1999). Statistics for
Business and Economics. 7ed. Cincinnati: South-Western College
Publishing.
Freedman, D., Pisani, R. & Purves, R. (1998) Statistics. New York: W.W.
Norton & Company.
Freund, J. E. e Simon, G. A. (2000). Estatística Aplicada: economia,
administração e contabilidade. 9 ed. Porto Alegre: Bookman
Levine, D. M., Berenson, M.L., Stephan, D. (2005). Estatística: Teoria e
Aplicações. 3 ed. Rio de Janeiro: LTC.
3
Critério de Avaliação
4
Estatística Aplicada
Análise Exploratória de Dados
5
Estatística Descritiva e Inferência
Estatística
Estatística é a ciência que tem por objetivo orientar a coleta, o
resumo, a apresentação, a análise e a interpretação de
dados. Podem ser identificadas duas grandes áreas de
atuação desta ciência:
Análise Inferencial
Objetivos da
pesquisa Conclusões
Formulação de
novos objetivos 7
Razões para entender Estatística
Descrever e apresentar informações de forma
adequada.
Tirar conclusões sobre grandes populações baseado
na informação obtida da amostra.
Saber melhorar processos baseado em informações
amostrais.
Obter previsões confiáveis.
Para aqueles que tomam decisões, o principal papel da
estatística é fornecer-lhes os métodos para obtenção e
conversão de dados (valores, fatos, observações ou
medições) em informações úteis.
8
Estatística no mundo real ...
1. Um empresário investe seu patrimônio em diversos
fundos de renda fixa e variável. Qual o ganho médio e
a variabilidade de seus ganhos no último ano? Como
fazer a previsão da rentabilidade destes fundos para o
próximo mês?
2. Você foi contratado para trabalhar no departamento
financeiro da Moderna e sua primeira tarefa é sugerir
uma aplicação à empresa. Você pode aplicar na PPN
(empresa do setor petroquímico) ou nas ações que
compõem o fundo IBP. Qual seria o melhor
investimento?
9
Estatística no mundo real ...
3. Um instituto de pesquisa, coletou dados de preços de dois
livros em vinte lojas na cidade de SP. Qual dos livros
apresentou maior variação de preços?
4. O departamento de RH de uma empresa deseja avaliar a
eficácia dos testes aplicados para a seleção de
funcionários. Para tanto, foi sorteada uma amostra de 50
funcionários e observou-se, para cada um, a nota média
nos testes de admissão e um escore que indica o seu
desempenho profissional. Existe alguma relação entre a
nota do teste e o desempenho dos funcionários? Como
prever o desempenho de um funcionário de acordo com
sua nota no teste?
10
Estatística no mundo real ...
5. A sua empresa está sendo acusada de pagar um salário maior
para os homens do que para as mulheres. Para justificar a
acusação, apresentou-se uma lista de salários de uma amostra
de funcionários. Você tem motivos para se preocupar?
Sexo Anos no Salário Sexo Anos no Salário
emprego emprego
fem 0 24 masc 3 35
fem 0 27 masc 5 30
fem 0 29 masc 6 25
fem 0 33 masc 6 36
fem 1 26 masc 6 37
fem 2 30 masc 6 49
fem 3 32 masc 9 35
fem 4 37 masc 9 40
fem 5 27 masc 9 41
fem 5 35 masc 12 55
fem 6 34 masc 12 56
fem 6 36 masc 14 46
fem 6 37 masc 15 33
fem 6 44 masc 15 48
fem 7 31 masc 18 39
fem 7 35 masc 18 52
fem 8 35 masc 19 38
fem 9 35 masc 20 46
fem 9 36 masc 20 55
fem 9 39 masc 21 39
fem 16 40 masc 22 42
fem 20 56 masc 22 69 11
masc 25 68
masc 27 64
Inferência Estatística
Características desconhecidas
Técnicas de Amostra
amostragem
Inferência estatística
Características
conhecidas
População
12
População, amostra e dados
População: é a coleção de todos os elementos de
interesse num estudo
Amostra: é uma porção da população
Exemplo: Pesquisa eleitoral na cidade de SP
População: Todos os eleitores da cidade de SP
Amostra: 2000 eleitores da cidade de SP
Observe que um eleitor de Fortaleza não faz parte da população desse
estudo e nem poderia fazer parte dos 2000 eleitores escolhidos da
amostra.
Cada um dos 2000 eleitores pesquisados, darão suas
opiniões e a essas opiniões chamamos de dados.
Dados: são as informações obtidas de uma unidade
experimental ou de observação. 13
Tipos de população
Populações finitas: o tamanho da população é
conhecido. Exemplo: eleitores de São Paulo,
aparelhos de som produzidos por uma
indústria, etc. A listagem de todos as unidades
amostrais recebe o nome de sistema de
referência.
17
Tipos de variáveis
As variáveis Quantitativas são classificadas em:
Discreta: uma característica desse tipo de variável é
que entre dois resultados consecutivos não existe
nenhum valor intermediário, geralmente é uma
contagem.
Ex. Número de acidentes de trabalho: 0, 1, 2, 3, …
Não tem sentido prático 0,5 acidentes de trabalho ou 2,3
acidentes de trabalho.
Contínua: os resultados observáveis estão dentro de
intervalos, necessita da unidade para ser medida.
Ex.: Inflação, salário.
Entre R$ 5.000,00 e R$ 6.000,00 existem infinitos resultados
possíveis.
18
Exercício
Suponha que um recém formado precise escolher entre 4
possibilidades de emprego. Para tomar tal decisão, ele observa os
seguintes dados: salário, número de benefícios, satisfação dos
funcionários, ranking da empresa numa revista de negócios e o
local da empresa. Classifique as variáveis envolvidas no
problema.
ALTERNATIVA
Número de benefícios 5 2 3 4
19
Tipos de Dados
Nominal Ex.: Localização
Qualitativo
Ordinal Ex.: Ranking
Quantitativo
20
Tipo de amostra
População
Amostra
finita ou infinita
n
Amostra
Simples
Por quotas Coleta Telefone
Amostra
26
Área da Pesquisa
67= República
80=Sé
9= Bom Retiro
57= Pari
10= Brás
14= Cambuci
49= Liberdade
7= Bela Vista
26= Consolação
70= Santa Cecília
27
Esquemas amostrais
probabilísticos
28
Amostra Aleatória Simples
O sistema de referência é numerado de 1 até N
(tamanho da população) e sorteia-se ao acaso
n unidades amostrais para comporem a
amostra. O sorteio pode ser com ou sem
reposição
29
Amostra Estratificada (AE)
Estrato: segmento homogêneo da população
AE: divide-se a população em estratos. Em
cada estrato é sorteada uma amostra
aleatória simples.
30
Amostra por conglomerados
(AC)
Conglomerado (cluster): segmento heterogêneo
da população.
AC: divide-se a população em conglomerados.
Sorteia-se uma amostra aleatória simples de
conglomerados. Todas as unidades amostrais
dos conglomerados sorteados são
pesquisadas.
31
Amostra em múltiplos
estágios
Exemplo: Amostra em 2 estágios:
33
Planos não-probabilísticos
• Amostragem por conveniência
34
Amostra por quotas
20 classe A/B
20% classe A/B
40 classe C
40% classe C
30 classe D/E
30% classe D/E
Amostra (n=90)
Escolher unidades amostrais
População que reproduzam um perfil
populacional.
35
E no nosso problema??
Que tipo de
amostragem
vc utilizaria?
36
Situação 1
Os membros de um partido político estavam considerando apoiar um
determinado candidato à eleição de prefeito da cidade, e os líderes do
partido queriam uma estimativa da proporção dos eleitores registrados
que favoreciam o candidato. O tempo e o custo associados em contatar
cada individuo na população dos eleitores registrados poderia ser
estratosférico.
Por isso, uma amostra de 400 eleitores registrados foi selecionada, e 160
dos 400 eleitores indicaram preferência pelo candidato. A estimativa da
proporção da população de eleitores registrados que favoreceram o
candidato foi de 160/400=0,40
37
Situação 2
Um fabricante de pneus desenvolveu um novo tipo de pneu
concebido para proporcionar um aumento de quilometragem à
atual linha de pneus da empresa. Para estimar o número médio
de quilômetros proporcionados, o fabricante coletou uma
amostra de 120 pneus para teste.
Observacionais
Estudos
Experimentais
41
Planejamento da Pesquisa
De um modo geral o plano de uma pesquisa pode ser
observacional ou experimental.
Observacional: coletamos informações sobre variáveis
categóricas e numéricas de interesse, em indivíduos de um ou
mais grupos, mas não realizamos intervenções.
Exemplos: levantamento populacional, levantamento amostral
e estudo epidemiológico. Quanto à forma de obtenção dos
dados: prospectivo, retrospectivo e transversal.
Experimental: coletamos as informações como no caso
anterior, mas os resultados são influenciados pelo pesquisador
com intervenções. Em geral é necessário grupo controle.
Exemplos: ensaios clínicos, experimentos na área de
agronomia, nas áreas industriais, em laboratórios. A forma de
obtenção dos dados é prospectiva, longitudinal, em geral.
42
Censo
Todas as unidades amostrais da população
são pesquisadas (amostra = população).
Vantagem: é possível conhecer com
exatidão todas as características da
população (não há erro amostral).
Desvantagens:
• pode ser caro e demorado (trabalhoso).
• em algumas situações não é factível, pois o
processo de observação das variáveis leva à
destruição das unidades amostrais.
43
Discriminação
A sua empresa está sendo acusada de
pagar um salário maior para os homens
do que para as mulheres. Para justificar
a acusação, apresentou-se uma lista de
salários de uma amostra de
funcionários. Você tem motivos para se
preocupar? Justifique!
44
Discriminação.xls
Sexo Anos no Salário Sexo Anos no Salário
emprego emprego
fem 0 24 masc 3 35
fem 0 27 masc 5 30
fem 0 29 masc 6 25
fem 0 33 masc 6 36
fem 1 26 masc 6 37
fem 2 30 masc 6 49
fem 3 32 masc 9 35
fem 4 37 masc 9 40
fem 5 27 masc 9 41
fem 5 35 masc 12 55
fem 6 34 masc 12 56
fem 6 36 masc 14 46
fem 6 37 masc 15 33
fem 6 44 masc 15 48
fem 7 31 masc 18 39
fem 7 35 masc 18 52
fem 8 35 masc 19 38
fem 9 35 masc 20 46
fem 9 36 masc 20 55
fem 9 39 masc 21 39
fem 16 40 masc 22 42
fem 20 56 masc 22 69
masc 25 68
masc 27 64
45
Ramo e folhas dos salários anuais (em
salários mínimos) de homens e mulheres
20 20 4
25 5 25 6 7 7 9
30 0 3 30 0 1 2 3 4
35 5 5 6 7 8 9 9 35 5 5 5 5 6 6 7 7 9
40 0 1 2 40 0 4
45 6 6 8 9 45
50 2 50
55 5 5 6 55 6
60 4 60 Mulheres
Homens
65 8 9 65
46
Boxplot dos salários
(visão aérea dos dados)
70
60
50
Salario
40
30
20
fem masc
Sexo
47
Estatísticas Descritivas
48
Problema
Os funcionários amostrados são
comparáveis?
49
Ajuste de Curvas
Existe relação entre salário e tempo no emprego?
Gráfico de dispersão
80
70
60
50
Salário
40
30
20
10
0
0 5 10 15 20 25 30
Tempo no emprego
50
Diagrama de Dispersão
Gráfico de dispersão
80
70
y = 1.1225x + 27.872
60
50
Salário
40
30
y = 1.0664x + 29.854
20
10
0
0 5 10 15 20 25 30
tempo no emprego
51
Dados Qualitativos
O gerente do restaurante MC&M gostaria de planejar a
compra e estoque dos refrigerantes devido ao volume que
eles ocupam no seu armazém. Para isso, ele vai analisar
os tipos de refrigerantes (A, B, C e outros) pedidos num
dia típico de funcionamento. Os dados obtidos são:
A A A C A Outros B A C B
B Outros A Outros B A B A B A
C A B A A B B B B B
Outros B C B A C C A C C
A B A A A B A A A Outros
52
Freqüência Relativa e
Porcentagem
refrigerante freqüência freqüência relativa Porcentagem
A 21 0,42 42%
B 16 0,32 32%
C 8 0,16 16%
Outros 5 0,10 10%
Total 50
42
Outros 45
10% 40 32
C
A 35
Porcentagem
16%
42% 30
25
16
20
15 10
10
B 5
32% 0
A B C Outros
43 32 62 54 49
48 61 50 42 62
39 59 35 76 48
51 49 23 55 40
46 63 62 36 43
46 44 52 46 57
56
Determinação do tamanho das
classes
MÁXIMO = 76 E MÍNIMO = 23
AMPLITUDE DE VARIAÇÃO = MAX - MIN = 76 - 23 =
53
NÚMERO DE CLASSES = aproximadamente n
TAMANHO DAS CLASSES :
Amplitude 53
10
n º de classes 30
57
Tabela e gráfico de dados quantitativos
43 32 62 54 49 Pertencem à classe
48 61 50 42 62 que vai de 30 (exclusive)
39 59 35 76 48
até 40 (inclusive).
51 49 23 55 40
46 63 62 36 43
46 44 52 46 57
classe
inf sup freq. absoluta freq. relativa tamanho classe densidade
inf sup freqüência
20 ----| 30 1 0,0333 10,00 0,0033
20 ----| 30 Contagem para 30 ----| 40 5 0,1667 10,00 0,0167
30 ----| 40 5 40 ----| 50 12 0,4000 10,00 0,0400
40 ----| 50
cada intervalo 50 ----| 60 6 0,2000 10,00 0,0200
50 ----| 60
60 ----| 70 5 0,1667 10,00 0,0167
60 ----| 70
70 ----| 80 1 0,0333 10,00 0,0033
70 ----| 80 30 1,0000
0.0450
0.0400
0.0350
Denmsidade
0.0300
0.0250
0.0200
0.0150
0.0100
0.0050
Histograma 0.0000
20 --| 30 30 --| 40 40 --| 50 50 --| 60 60 --| 70 70 --| 80
100,00
80,00
60,00
40,00
20,00
0,00
30 40 50 60 70 80
Venda (milhares de unidades)
Densidade
[0, 2) [2, 4) [4, 8) [8, 12) [12, 16) [16, 25) [25, 50)
salário
66
Histograma - Densidade
Calcular a área sob o histograma feito utilizando-se a
densidade como altura.
Área = 1
O nome densidade é dado para distribuições cuja
área sob a curva é igual a 1.
Pq construir um histograma com classes de
tamanhos diferentes? Para que em algumas classes
não ocorram saltos no histograma, presença de
classes vazias. A assimetria da variável influencia na
construção do histograma, por exemplo, salários.
67
Exemplo
O gerente comercial de uma editora deseja
estudar o preço de venda de um pequeno livro
de histórias infantis em 2 municípios: A e B.
Para estudar a distribuição de preços, foram
tomados os preços praticados por uma amostra
de 25 distribuidoras do município A e de 20
distribuidoras do município B.
68
Dados
Município
A B
14,80 12,90 21,30 20,30
18,20 20,90 20,70 19,60
13,60 19,30 20,70 19,20
15,50 14,40 19,90 18,50
12,00 15,10 20,30 18,60
13,70 13,10 21,10 20,30
16,00 15,50 19,60 20,10
17,30 14,30 19,30 19,90
14,40 15,10 20,80 21,00
16,10 15,80 19,70 18,90
26,80 13,00
12,10 14,90
17,00
69
Ramo-e-Folhas – Município A
12 0 10 90 12 0 10 90
Dados 13 60 70 10 0 13 0 10 60 70
14,80 12,90 14 80 40 40 30 90 14 30 40 40 80 90
18,20 20,90 15 50 10 50 10 80 15 10 10 50 50 80
13,60 19,30 16 0 10 16 0 10
15,50 14,40 17 30 0 17 0 30
12,00 15,10 18 20 Análise
18 20
13,70 13,10 19 30 19 30
16,00 15,50 20 90
• Distribuição
20 90assimétrica
17,30 14,30 de preços;21
21
14,40 15,10 22 • Grande22 variabilidade;
16,10 15,80 23 23
26,80 13,00 • Preço típico
24
entre 13 e 16;
24
12,10 14,90 25 • Presença 25 de um valor
17,00 aberrante26(outlier).
80
26 80
70
Ramo-e-Folhas – Município B
Dados 18 50 60 90
21,30 20,30 19 20 30 60 60 70 90 90
20,70 19,60
20 10 30 30 30 70 70 80
20,70 19,20
19,90 18,50 21 0 10 30
20,30 18,60
21,10 20,30 Análise
19,60 20,10
• Distribuição pouco assimétrica;
19,30 19,90
20,80 21,00 • Pequena variabilidade de preços;
19,70 18,90 • Preço típico entre 19 e 21;
• Não há valores aberrantes.
71
Ramo-e-folhas - Comparação
12 00 10 90 12
13 60 70 10 00 13
14 80 40 40 30 90 14 Município B
15 50 10 50 10 80 15
16 00 10 16
17 30 00 17
18 20 18 50 60 90
19 30 19 90 60 30 70 60 20 90
20 90 20 70 70 30 80 30 30 10
21 21 30 10 00
22 Município A 22
23 23
24 24
25 25
26 80 26
72
Exercício no Excel
Construir um histograma para cada um dos municípios (usando
classes de tamanho R$1,00) e compará-los de acordo com a
distribuição dos preços praticados pelos municípios.
Histograma - Município A
0.50
0.40
Densidade
0.30
0.20
0.10
0.00
12 --| 13 13 --| 14 14 --| 15 15 --| 16 16 --| 17 17 --| 18 18 --| 19 19 --| 20 20 --| 21 21--| 22 22 --| 23 23 --| 24 24 --| 25 25 --| 26 26 --| 27
Preço em R$
Histograma - Município B
0.5
0.4
Densidade
0.3
0.2
0.1
0
12 --| 13 13 --| 14 14 --| 15 15 --| 16 16 --| 17 17 --| 18 18 --| 19 19 --| 20 20 --| 21 21--| 22 22 --| 23 23 --| 24 24 --| 25 25 --| 26 26 --| 27
73
Preço em R$
Escolhendo uma aplicação
Você foi contratado para trabalhar no
departamento financeiro de uma
empresa. Sua primeira tarefa é sugerir
uma aplicação à empresa. Você pode
aplicar na PPN (empresa do setor
petroquímico) ou nas ações que
compõem o fundo IBP.
Que informações você gostaria de ter?
(IBP_PPN_aula.xls)
74
Fechamento – IBP
Agosto/94 a Janeiro/04
76
Fechamento – PPN
Agosto/94 a Dezembro/03
77
-3
-2
-1
0
1
2
3
4
02/08/1994
02/12/1994
02/04/1995
02/08/1995
02/12/1995
02/04/1996
02/08/1996
02/12/1996
02/04/1997
02/08/1997
02/12/1997
02/04/1998
02/08/1998
02/12/1998
02/04/1999
02/08/1999
02/12/1999
02/04/2000
02/08/2000
Agosto/94 a Janeiro/04
02/12/2000
02/04/2001
02/08/2001
02/12/2001
02/04/2002
02/08/2002
02/12/2002
Retornos diários (%) – IBP
02/04/2003
78
02/08/2003
02/12/2003
-15
-10
-5
0
5
10
15
20
02/08/1994
02/12/1994
02/04/1995
02/08/1995
02/12/1995
02/04/1996
02/08/1996
02/12/1996
02/04/1997
02/08/1997
02/12/1997
02/04/1998
02/08/1998
02/12/1998
02/04/1999
Retorno
02/08/1999
02/12/1999
02/04/2000
02/08/2000
02/12/2000
02/04/2001
02/08/2001
PN Agosto/94 a Dezembro/03
02/12/2001
02/04/2002
02/08/2002
02/12/2002
02/04/2003
79
02/08/2003
Retornos (%) diários– PPN
02/12/2003
Comparação dos retornos
IBP
2,1
1,6
1,1
0,6
0,1
0,85
Densidade de freqüência
0,75
0,65
0,55
0,45
0,35
0,25
0,15
0,05
-0,05
27
77
28
78
28
78
4
3
,7
,2
,7
,2
,7
,2
0,
0,
1,
1,
2,
2,
-2
-2
-1
-1
-0
-0 Retorno
Retorno IBP
Agosto/99-Janeiro/04
5000
4500
4000
3500
Densidade
3000
2500
2000
1500
1000
500
0
0.05
0.20
0.35
0.50
0.65
0.80
0.95
-1.00
-0.85
-0.70
-0.55
-0.40
-0.25
-0.10
Retorno (%)
81
Comparação dos retornos
Histogramas alisados
Densidade de freqüência
1,5
IBP
1
PPN
0,5
0
-3,0 -2,0 -1,0 0,0 1,0 2,0 3,0
Retornos
82
Comparação dos retornos
Gráfico da freqüência acumulada
1
Frequência acumulada
0,9
0,8
0,7
0,6 IBP
0,5
0,4 PPN
0,3
0,2
0,1
0
-3,0 -2,0 -1,0 0,0 1,0 2,0 3,0
Retornos
83
Exercício - Bussab e Morettin (pg. 26)
84
Dados
Func Seção Administração Direito Redação Estatística Inglês Metodologia Política Economia
1 P 8.0 9.0 8.6 9.0 B A 9.0 8.5
2 P 8.0 9.0 7.0 9.0 B C 6.5 8.0
3 P 8.0 9.0 8.0 8.0 D B 9.0 8.5
4 P 6.0 9.0 8.6 8.0 D C 6.0 8.5
5 P 8.0 9.0 8.0 9.0 A A 6.5 9.0
6 P 8.0 9.0 8.5 10.0 B A 6.5 9.5
7 P 8.0 9.0 8.2 8.0 D C 9.0 7.0
8 T 10.0 9.0 7.5 8.0 B C 6.0 8.5
9 T 8.0 9.0 9.4 9.0 B B 10.0 8.0
10 T 10.0 9.0 7.9 8.0 B C 9.0 7.5
11 T 8.0 9.0 8.6 10.0 C B 10.0 8.5
12 T 8.0 9.0 8.3 7.0 D B 6.5 8.0
13 T 6.0 9.0 7.0 7.0 B C 6.0 8.5
14 T 10.0 9.0 8.6 9.0 A B 10.0 7.5
15 V 8.0 9.0 8.6 9.0 C B 10.0 7.0
16 V 8.0 9.0 9.5 7.0 A A 9.0 7.5
17 V 8.0 9.0 6.3 8.0 D C 10.0 7.5
18 V 6.0 9.0 7.6 9.0 C C 6.0 8.5
19 V 6.0 9.0 6.8 4.0 D C 6.0 9.5
20 V 6.0 9.0 7.5 7.0 C B 6.0 8.5
21 V 8.0 9.0 7.7 7.0 D B 6.5 8.0
22 V 6.0 9.0 8.7 8.0 C A 6.0 9.0
23 V 8.0 9.0 7.3 10.0 C C 9.0 7.0
24 V 8.0 9.0 8.5 9.0 A A 6.5 9.0
25 V 8.0 9.0 7.0 9.0 B A 9.0 8.5
85
Exercício - Bussab e Morettin (pg. 26)
a) Após observar cada variável e com o intuito de
resumi-las, classifique cada uma delas.
b) Construa gráficos e tabelas para cada uma das
variáveis envolvidas no problema.
c) Compare e indique as diferenças existentes
entre as distribuições das variáveis Direito, Política
e Estatística.
Entregar exercício, na próxima aula, em grupos
de até 3 alunos. 86