Sei sulla pagina 1di 79

ESTATÍSTICA APLICADA

 CURSO: MBA LOGÍSTICA

 PROFESSOR: ALTAIR FERREIRA FILHO

 AULA 1

1
O que é Estatística?

Conjunto de métodos científicos para

coleta, organização, resumo, análise e apresentação de dados, bem


como a obtenção de conclusões válidas que dêem suporte à tomada de
decisões baseadas em tais análises.

 Tipos de estatística:
• Estatística Descritiva: utiliza números para descrever fatos.
• Probabilidade: analisa situações que envolvem o acaso.
• Inferência Estatística: analisa e interpreta dados amostrais.

Dados e Variáveis
Dados são fatos que representam as coisas do mundo real em sua forma primária e
possuem pouco valor além de si mesmos. Apesar disso, estão entre os recursos mais
valiosos de uma organização.

Variáveis são características de um item. Dados são os diferentes valores que podem ser
associados a uma variável.

 Uma variável pode ser:

• Categórica ou qualitativa: é agrupada em categorias (estado civil, partido político, etc).

• Numérica ou quantitativa: é fruto de uma medição numérica.

 As variáveis numéricas podem ser:

• Discretas: quantidade de filhos, defeitos por dia, etc.

• Contínuas: peso, voltagem, etc.

2
População e Amostra

População: todos os itens sobre os quais se deseja tirar uma

conclusão.

 Amostra: parte da população selecionada para análise estatística.

Tabela de Frequências
Para organizar os dados, à medida que o número de observações

aumenta, faz-se necessário que os dados sejam ainda mais


condensados em tabelas resumidas, no sentido de apresentar, analisar
e interpretar os resultados de maneira correta. Assim, os dados podem
ser organizados na forma de grupos de classes (categorias), de acordo
com divisões da amplitude de observações, adequadamente
estabelecidas. O número de classes deve ficar entre 5 e 20.
• Quantidade de classes(k) =


• Amplitude de cada classe = n


(maior valor − menor valor ) amplitude
=
número de classes k

3
Gráfico de Barras
9

0
32 33 34 35 36 37 38 39

Gráfico de Setores

32

33

34

35

36

37

38

39

4
Histograma
6

0
16 24 32 40 48

8 16 24 32 40

Polígono de Frequências
6

0
16 24 32 40 48

8 16 24 32 40

5
Exemplo

Considere uma população de 20 pessoas cujas idades são


representadas na lista abaixo:
 32 38 36 37 37 39 37 38 36 37
 39 37 37 35 36 37 36 38 36 37

Pedidos:
a) Construa a tabela de frequências.
b) Construa o gráfico de barras correspondente.
c) Construa o gráfico de setores correspondente.

Exercício
Um estudo sobre o valor da diária dos funcionários de uma empresa foi
feito por parte do Financeiro. Uma amostra de 20 funcionários
escolhidos aleatoriamente apresentou os seguintes resultados:

US$22 US$34 US$48 US$12 US$23 US$28 US$37


US$39 US$43 US$24 US$28 US$11 US$8 US$32
US$25 US$39 US$26 US$21 US$37 US$23

Pedidos:

a) Construa a tabela de distribuição de frequências.

b) Construa o histograma correspondente.

c) Construa o polígono de frequências correspondente.

6
Medidas de Posição

 Medidas de Tendência Central:


• Média aritmética.
• Mediana.
• Moda.

 Medidas Separatrizes:
• Quartis.
• Decis.
• Percentis.

Medidas de Variação

• Amplitude.
• Amplitude Interquartil.
• Variância.
• Desvio Padrão.
• Coeficiente de Variação.
• Coeficiente de Assimetria de Pearson.

7
Medidas de Posição para Dados
Numéricos
 Medidas de Tendência Central:
n

∑X i
X1 + X 2 + L + Xn
• Média aritmética: X= i=1
=
n n

• Mediana: é o número do meio.

• Moda: valor que ocorre com mais frequência.

Exemplo

 Seja a seguinte distribuição de escores:

 54 54 56 63 65 75 78 88 89 92

 Pedidos:

a) Calcule a média.

b) Calcule a mediana.

c) Calcule a moda.

8
Medidas de Posição para Dados
Numéricos
 Medidas Separatrizes:
• Quartis: medidas descritivas que dividem os dados ordenados em 4
partes.

25% 25% 25% 25%

Q1 Q2 Q3

( n + 1) 2(n + 1) 3( n + 1)
Q1 = Q2 = Q3 =
4 4 4

(n + 1) ( n + 1)
• Decis: dividem em 10 partes. D1 = P1 =
10 100
• Percentis: dividem em 100 partes.

Exemplo

 Seja a seguinte distribuição de escores ordenados:

6 8 14 14 14 14 16 16 18 22 24 32

 Pedidos:

a) Calcule a posição do 1ºQ.

b) Calcule a posição do 7ºD.

c) Calcule a posição do 57ºC.

9
Medidas de Variação para Dados
Numéricos
• Amplitude: Diferença entre o maior e o menor valor num conjunto de
dados.
Amplitude =

Xmaior− Xmenor

• Amplitude Interquartil: Diferença entre o terceiro quartil e o primeiro


quartil.
Amplitude Interquartil =
Q −Q 3 1

Medidas de Variação para Dados


Numéricos
• Variância:
n

∑ (X − X)i
2

S2 = i =1
n -1

• Desvio Padrão:
n

∑ (X i − X) 2
S= i =1
n -1

10
Exemplo

 Seja a seguinte distribuição de escores ordenados:

6 8 14 14 14 14 16 16 18 22 24 32

 Pedidos:

a) Calcule a amplitude interquartil.

b) Calcule a variância.

c) Calcule o desvio padrão.

Medidas de Variação para Dados


Numéricos
• Coeficiente de variação (CV): Medida relativa de variação, útil para
comparação do grau de concentração em torno da média de séries
distintas. Como o CV é uma medida que exprime a variabilidade
relativa à média, é usualmente expresso em porcentagem.

S
CV =   ⋅ 100%
X

11
Medidas de Variação para Dados

Numéricos
Coeficiente de Assimetria de Pearson (Sk): Indica o grau de
distorção da distribuição em relação à uma distribuição simétrica.

 Sk = 3( x − Mediana)
s
Assimétrica negativa Simétrica Assimétrica positiva

Média < Mediana Média = Mediana Mediana < Média

Exemplo

 Seja a seguinte distribuição de escores ordenados:

6 8 14 14 14 14 16 16 18 22 24 32

 Pedidos:

a) Calcule o coeficiente de variação (CV).

b) Calcule a coeficiente de assimetria de Pearson (Sk).

12
Ferramenta: Estatística Descritiva

Ferramenta: Estatística Descritiva

X maior

X menor
Q3 X maior
X menor Q1
X menor
X maior
X menor Q1
Q3 X maior

X menor X maior

X menor Q1 Q3 X maior

13
Medidas de Posição para
População N

∑X i
X1 + X 2 + L + X N
• Média aritmética: µ= i =1
=
N N
N

∑(X i − µ) 2
• Variância: σ2 = i =1
N
N

∑(X i − µ) 2
• Desvio Padrão: σ= i =1
N

ESTATÍSTICA APLICADA

 CURSO: MBA LOGÍSTICA

 PROFESSOR: ALTAIR FERREIRA FILHO

 AULA 2

14
Probabilidade

Probabilidade é uma afirmação numérica sobre a possibilidade de que


algo ocorra, quantificando o grau de (in)certeza dos eventos, variando
de 0% a 100%.

 Exemplos:

• Qual é a chance de retirar uma carta preta de um baralho de cartas?

• Qual é a chance de um indivíduo preferir um produto em relação a


outro?

• Qual é a chance de um novo produto de mercado obter sucesso?

Probabilidade: Principais
Abordagens
• Probabilidade clássica a priori: Baseada no conhecimento prévio
sobre o processo envolvido.
Exemplo: Um dado de 6 faces é jogado. A probabilidade de obter o
número 3 é de 1/6, a probabilidade de obter o número 7 é 0/6, a
probabilidade de obter um número menor do que 5 é de 4/6, etc.

• Probabilidade clássica empírica: Embora a probabilidade ainda seja


definida como a razão do número de resultados favoráveis em
relação ao número total de resultados, os resultados são baseados
em dados observados e não em um conhecimento prévio de um
processo.
Exemplo: A proporção de indivíduos, em uma pesquisa, que têm
preferência por um certo candidato político.

15
Probabilidade: Principais
Abordagens
• Probabilidade subjetiva: Nas duas abordagens anteriores, enquanto
a probabilidade de um evento favorável é calculada de maneira
objetiva, a probabilidade subjetiva refere-se à chance de ocorrência
atribuída a um evento por parte de um determinado indivíduo. Essa
chance provavelmente será diferente da probabilidade subjetiva
atribuída por um outro indivíduo.
Exemplo: A probabilidade de que a linha telefônica esteja ocupada.

Definições Importantes
• Experimento: É a ação ou um ensaio por meio do qual
resultados específicos são obtidos.
• Resultado: É a consequência de um único ensaio em um
experimento.
• Espaço amostral: É o conjunto de todos os resultados possíveis
em um experimento.
• Evento: Consiste em um ou mais resultados e é um subconjunto
do espaço amostral.
• Complemento do evento: Consiste em todos os resultados do
espaço amostral que não estejam incluídos no evento principal.

Um evento é complementar a outro quando, juntos, formam o


espaço amostral.

16
Regra da Adição
A probabilidade de ocorrer “A” ou “B” é:
P(AUB) = P(A) + P(B) – P(A e B)

Exemplo: Uma carta é tirada de um baralho. Determine a


probabilidade de ser um rei ou ser de naipe vermelho.

Solução:
A = a carta é um rei; B = a carta é vermelha
P(A) = 4/52
P(B) = 26/52
P(A e B) = 2/52
logo P(AUB) = 4/52 + 26/52 – 2/52 = 0,54

Regra da Multiplicação

A regra da multiplicação de probabilidades está relacionada com a


intercessão de eventos (a intercessão de eventos está relacionada
com o conceito de independência entre eventos).
Multiplica-se a probabilidade de A ocorrer pela propriedade
condicional de B ocorrer, dado que A já ocorreu.
P(A e B) = P(A) X P(B/A)

17
Regra da Multiplicação

Exemplo: Suponha que de cada 100 pessoas que vão tirar o visto
no consulado americano, 70 desejam o visto de turismo e 30 o visto
de trabalho. Suponha também que 60% das pessoas que desejam
o visto de turismo já estiveram nos EUA. Dos que desejam o visto
de trabalho, 35% já estiveram nos EUA. Determine a probabilidade
de se escolher aleatoriamente uma pessoa que deseje tirar o visto
de turismo e nunca esteve nos EUA.
Solução:
P(visto de turismo e nunca) = P(visto de turismo) X P(nunca / visto
de turismo)
P(visto de turismo e nunca) = 0,7 X 0,4 = 0,28

Exercício

Uma sorveteria consultou 105 clientes a respeito de suas


preferências: 70 disseram gostar de creme, 72 de chocolate, 53 de
morango, 50 disseram gostar de chocolate e creme, 40 disseram
gostar de chocolate e morango e 30 disseram gostar de
chocolate, creme e morango. Considere que todos optaram
por, pelo menos, 1 sabor.

Pedidos:
a) Qual a probabilidade de ser sorteado um cliente que gosta de
creme e morango?
b) P(só de creme)?
c) “Gostar de creme”, “gostar de chocolate” são mutuamente
excludentes?
d) “Gostar de creme” e “gostar de chocolate ou de morango” são
complementares entre si?

18
Exercício

Uma corretora realizou uma pesquisa. Foram consultados 100


clientes: 80 disseram aplicar em poupança, 70 disseram aplicar em
fundo DI e 60 disseram aplicar em poupança e fundo DI.

Pedidos:
a) “Aplicar em poupança” e “aplicar em fundo DI” são mutuamente
exclusivos?
b) “Aplicar em poupança” e “aplicar em fundo DI” são
complementares? Por quê?

Probabilidade Condicional
É a probabilidade de um evento ocorrer dado que outro evento já
ocorreu. Escreve-se essa situação com P(B/A) e lê-se “a probabilidade
de ocorrer o evento B, dado que ocorreu o evento A”.

Nesse caso, a ocorrência do evento A é um fato. Não existe incerteza


a esse respeito.
Exemplo: Dois carros são selecionados em uma linha de produção

com 12 carros, 5 deles defeituosos. Qual é a probabilidade de o


segundo carro ser defeituoso, dado que o primeiro carro era
defeituoso?
Solução:
Dado que um carro defeituoso já foi selecionado, o espaço amostral
condicional possui 4 carros defeituosos entre 11. Logo, P(B/A) = 4/11.

19
Exercício
Uma empresa que realiza vendas online possui em seus arquivos a
informação de que 40% dos seus clientes são da América do
Norte, enquanto que 30% são da Europa, 20% são da América do Sul
e o restante são de outros lugares. Dos clientes que são da América do
Norte, 30% pagam a vista, enquanto 70% parcelam o valor. Estes
percentuais para os outros continentes são os seguintes
respectivamente: Europa: 40% e 60%; América do Sul: 35% e 65%; e
Outros lugares: 20% e 80%.

 Pedidos:
a) Qual a probabilidade de “ser de outros lugares” ou “ser da América
do Norte”?
b) Qual a probabilidade de “ser da América do Norte” e “pagar a
vista”?

Teorema de Bayes
Tendo ocorrido o evento X1, os casos possíveis de terem acontecido
são:
• Ocorrer Y1 e X1;
• Ocorrer Y2 e X1;
• Ocorrer Y3 e X1;

 O caso favorável é ocorrer Y2 e X1

 Aplicando a fórmula de Bayes, obtem-se:

P(Y2) . P(X1/Y 2)
P(Y2/X 1) =
P(Y1) . P(X1/Y 1) + P(Y2) . P(X1/Y 2) + P(Y3) . P(X1/Y 3)

20
Exercício

Os arquivos da polícia revelam que, das vítimas de acidente

automobilístico que utilizam cinto de segurança, apenas 10% sofrem


ferimentos graves, enquanto que essa incidência é de 50% entre as
vítimas que não utilizam o cinto de segurança. Estima-se em 60% a
percentagem dos motoristas que usam o cinto. A polícia acaba de ser
chamada para investigar um acidente em que houve um indivíduo
gravemente ferido.

 Pedido:

Calcule a probabilidade de ele estar usando o cinto no momento do


acidente.

Exercício
De cada 200 carros fabricados, 80 são VW, 40 são GM, 20 são Fiat, 10

são Ford, e o restante são de outras marcas. Dos carros da marca


VW, 60% são de cores claras. Para as demais marcas é de
40%, 70%, 65% e 80% respectivamente.

 Pedidos:
a) Considerando que foi sorteado um carro escuro, qual a
probabilidade de se da marca Fiat?
b) Os eventos “VW”, “GM”, “Fiat”, e “claro” são coletivamente
exaustivos?
c) Os eventos “claro” e “escuro” são complementares entre si?
d) os eventos “Fiat” e “escuros” são independentes entre si? Por quê?

21
Distribuições de Probabilidade
Discretas
Uma variável aleatória é discreta se o número de resultados possíveis
é finito ou pode ser contado.
Exemplo: suponha que a variável aleatória em estudo seja o número
de pessoas que passam pela porta de um determinado banco em um
determinado período do dia. Podem passar 50 ou 51 pessoas, mas não
podem passar 50,7. Essa variável pode assumir uma infinidade de
valores, mas não pode assumir valores fracionários.

 Distribuições discretas de probabilidade:


• Distribuição Binomial.
• Distribuição de Poisson.
• Distribuição Hipergeométrica.

Distribuição Binomial
 A distribuição binomial é uma distribuição discreta de
probabilidade, aplicável sempre que o processo de amostragem é do
tipo de Bernoulli:
• Em cada tentativa existem dois resultados possíveis, mutuamente
exclusivos. Eles são chamados, por conveniência, sucesso e
fracasso;
• As séries de tentativas, ou observações, são constituídas de eventos
independentes;
• A probabilidade de sucesso, indicada por p, permanece constante de
tentativa para tentativa. Ou seja, o processo é estacionário.
n!
P(X) = p X (1 − p ) n − X
X!(n − X)!

22
Exemplo
A fim de fazer uma pesquisa de mercado com montadoras
multinacionais, observou-se que uma montadora produz peças para
carro com uma probabilidade de produção de 1 peça defeituosa igual a
20%. Esta probabilidade permanece inalterada ao longo do tempo.

Pedidos:

Tomando-se uma amostra de 4 peças, qual a probabilidade de 2


a)
peças estarem boas?

Tomando-se uma amostra de 50 peças, qual a probabilidade de 10


b)

peças estarem defeituosas?

Tomando-se uma amostra de 16 peças, qual a probabilidade de 4 ou 5


c)

peças estarem defeituosas?

Distribuição de Poisson
É a probabilidade de ocorrer um sucesso em um intervalo de tempo ou
espaço.
µ x × e−µ
Onde: P( x) = ; µ = λt
x!
= nº médio de sucesso no intervalo pretendido

= nº de sucessos pretendido

µ = razão de ocorrência do “sucesso”


x = período ao longo do qual se deseja calcular a probabilidade
λ
t

23
Exemplo

Em um caixa automático chegam 30 clientes por hora. Qual a


probabilidade de, em 10 minutos, chegarem 3 clientes?

Distribuição Hipergeométrica
Determina a probabilidade de sucessos numa sequência de n
extrações de uma população finita, sem reposição.
Considera-se “população finita” quando o tamanho da amostra for
maior do que 5% do tamanho da população. Caso o tamanho da
população não seja conhecido, tratar-se-á como população não finita.

C xr × C nN−−xr
Onde: P( x) =
C nN
= tamanho da população
N = tamanho da amostra
n = número de sucessos na população
r = número de sucessos desejado na amostra
x

24
Exemplo

Uma agência bancária possui 40 clientes com saldo em conta


corrente maior ou igual a $1.000. Destes, 30 se declararam
proprietários de imóveis rurais. Qual a probabilidade de em uma
amostra de 6 clientes com saldo em conta corrente acima de
$1.000, 3 não serem proprietários de imóveis rurais?

Distribuições Probabilidade
Contínuas
Uma variável aleatória contínua é aquela que pode assumir qualquer
valor de uma escala.
 Exemplo: o tempo entre duas requisições chegarem a um servidor.

 Serão apresentadas as seguintes distribuições contínuas:

• Normal.
• Log Normal.
• Uniforme.

25
Distribuição Normal
 Propriedades:

Possui a forma de um sino (simétrica).




Suas medidas de tendência central (média aritmética, mediana e

moda) são todas idênticas.


Sua variável aleatória possui uma amplitude infinita (-∞ < X < ∞).


f(X)

Distribuição Normal
 Função de densidade da probabilidade normal:

2
 X −µ 
− 12  
e  σ 
1
f ( x) =
onde: σ 2π
e = constante ≅ 2,71828
π = constante ≅ 3,14159
µ = média da população
σ = desvio padrão da população
X = qualquer valor da variável contínua, -∞ <X< ∞

26
Distribuição Normal Padronizada

Uma distribuição normal padronizada é aquela cuja variável

aleatória Z sempre possui média aritmética µ=0 e desvio padrão


σ=1.

 Fórmula de transformação:

X −µ
Z=
σ

Exemplo
Dada uma distribuição normal padronizada, com média aritmética igual
a zero e desvio padrão igual a um.

 Pedidos:

a) Qual é a probabilidade de que Z seja menor que 1,59?

b) Qual é a probabilidade de que Z seja maior que 1,68?

c) Qual é a probabilidade de que Z esteja entre 1,59 e 1,68?

Qual é a probabilidade de que Z seja menor que 1,59 ou maior que


d)

1,68?

27
Exemplo

e) Qual é a probabilidade de que Z esteja entre -1,59 e 1,68?

f) Qual é o valor de Z, se 50% de todos os valores possíveis de Z


forem maiores do que ele próprio?

g) Qual é o valor de Z, se somente 3% de todos os valores


possíveis de Z forem maiores do que ele próprio?

h) Entre que dois valores de Z (simetricamente distribuídos em


torno da média aritmética) estarão contidos 68,26% de todos os
valores possíveis de Z?

Exercício
Um conjunto de notas de provas finais em um curso de Estatística foi
considerado como normalmente distribuído, com uma média igual a 6,7
e um desvio padrão igual a 1,8.

 Pedidos:
a) Qual é a probabilidade de se obter uma nota maior do que 7,4 nessa
prova?
b) Qual é a probabilidade de se obter uma nota igual ou menor do que
9,0 nessa prova?
c) Que percentagem de alunos tirou entre 5,3 e 8,9?
d) Que percentagem de alunos tirou entre 7,0 e 8,9?
e) Apenas 5% dos alunos que fizeram a prova obtiveram pontuação
mais alta de que nota?

28
Distribuição Log-Normal
Frequentemente usada na modelagem do preço de ações e outros
ativos financeiros. Também pode modelar o tempo até a ocorrência de
um defeito de uma máquina.

Diz-se que “X” é uma variável aleatória distribuída segundo uma log-
normal quando o seu logarítimo natural for normalmente distribuído.

 Passos:
1) Fazer o IL(índice de lucratividade) de cada linha;
2) Fazer o ln de cada IL;
3) Fazer o gráfico (a média é sempre no meio);
4) Aplicar a fórmula da normal;
5) Ir na tabela da normal;
6) Chegar à conclusão.

Distribuição Log-Normal

 Onde:
preço de venda
IL (índice de lucratividade) =
preço de compra

ln x − média
Fórmula da normal =
desvio padrão

29
Exemplo
Considere que você seja o gerente de uma carteira de investimentos

de uma determinada Administradora Financeira. O histórico do


desempenho de um determinado ativo, ao longo das últimas 5
transações é o seguinte:

Compra Venda
3,00 3,05
3,10 3,19
2,90 2,98
2,85 2,95
2,70 2,78

Tendo a compra de um lote sido feita ao preço unitário de $ 2,98, qual a


probabilidade deste lote ser vendido ao preço unitário de pelo menos $
3,02?

Distribuição Uniforme
Quando uma variável aleatória pode tomar qualquer valor numa
escala contínua entre dois pontos, de tal maneira que nenhum valor
seja mais provável que o outro, então as probabilidades associadas
à variável podem ser descritas pela distribuição uniforme.

Exemplo: O ponteiro de um relógio se enquadra nessa categoria:


todos os pontos ao longo da circunferência são igualmente
prováveis.

Graficamente, a distribuição uniforme é representada como um


retângulo limitado por dois pontos a e b, que representam o
âmbito, ou intervalo, de resultados possíveis. A altura do retângulo é
considerada como sendo 1, e a área é considerada como 100%.

30
Exemplo
Ao analisar uma proposta de trabalho, João fica sabendo por um

amigo que os rendimentos mensais dos funcionários de sua área de


interesse dentro da empresa são uniformemente distribuídos entre R$
500,00 e R$ 2.100,00. Qual a probabilidade do rendimento do João
ficar:

a) entre R$ 800,00 e R$ 1.500;

b) entre R$ 300,00 e R$ 1.200;

c) entre R$1.100,00 e R$ 5.000.

Distribuição de Amostragem
 Um dos principais objetivos da análise de
dados é realizar inferências estatísticas, isto
é, utilizar estatísticas tais como a média
aritmética da amostra e a proporção da
amostra para estimar os parâmetros
correspondentes nas respectivas
populações.
 A inferência estatística tira conclusões sobre
uma população e não sobre uma amostra.

31
Conceitos
Parâmetro populacional é uma
característica numérica da população:
Média (µ), desvio padrão (σ) e proporção da população
(π ou p).

Estatística da amostra é uma


característica da amostra:
Média (X ), desvio padrão (S) e proporção da amostra
(p ou pa).

Distribuição de Amostragem
da Média Aritmética
É a distribuição de probabilidade de todos
X
os valores possíveis da média da amostra,
(de um determinado tamanho de amostra n).
A média aritmética de todas as possíveis
médias aritméticas da amostra será igual à
média aritmética da população, µ.

32
Distribuição de Amostragem
da Média Aritmética
O desvio padrão das médias aritméticas de
todas as possíveis amostras é chamado de
erro padrão da média aritméticaσ Xe é
representado por σ .
σX =
n

 onde: σ = desvio padrão da população


n = tamanho da amostra

Distribuição de Amostragem
da Média Aritmética

 Exemplo 1: Suponha que o desvio padrão


para um teste de desempenho distribuído
normalmente seja conhecido e igual a 5,7.
Qual seria o erro padrão da média aritmética
se fôssemos extrair uma amostra aleatória
de:
 20 testes?
 36 testes?

33
Exemplo
 A Oxford Cereals abastece milhares de caixas de
cereais durante um turno de oito horas. Como
gerente de operações da unidade de
produção, você é responsável por monitorar a
quantidade de cereal colocada em cada caixa.
Para ser coerente com o conteúdo especificado
na embalagem, as caixas devem conter uma
média aritmética de 368 gramas de cereal. Em
razão da velocidade do processo, o peso do
cereal varia de caixa para caixa, fazendo com
que algumas caixas fiquem mal abastecidas
enquanto outras ficam hiperabastecidas.

Exemplo
 Se o processo não estiver funcionando
de maneira apropriada, o peso médio
das caixas pode se desviar
demasiadamente do peso especificado
no rótulo, 368 gramas, e se torna
inaceitável. Uma vez que a pesagem de
cada caixa individual consome uma
quantidade demasiadamente grande de
tempo, é dispendiosa e ineficiente, você
deve extrair uma amostra de caixas.

34
Exemplo
 Para cada amostra selecionada, você
planeja pesar as caixas individuais e calcular
a média aritmética para a amostra. Você
precisa determinar a probabilidade de que
essa média aritmética da amostra tenha sido
extraída aleatoriamente de uma população
cuja média aritmética é igual a 368 gramas.
Com base em sua análise, você terá que
decidir entre manter, alterar ou interromper o
processo.

Exemplo
 Retornando ao processo de abastecimento
de cereais, se você selecionar
aleatoriamente uma amostra de 25 caixas
sem reposição dos milhares de caixas
abastecidas durante um determinado
turno, a amostra contém muito menos do
que 5% da população. Considerando que o
desvio padrão do processo de
abastecimento de cereais seja 15
gramas, calcule o erro padrão da média
aritmética.

35
Amostragem a partir de populações
normalmente distribuídas
 Exemplo 3: O gerente da agência bancária verificou que o
saldo médio das contas correntes aumentou.
Considerando todos os clientes da agência, a média e o
desvio padrão do saldo médio das contas correntes
são, respectivamente, $375 e $118. Se for retirada uma
amostra de 100 contas correntes, qual a probabilidade de
a média dos saldos médios

 ser menor ou igual a $350?


 ser maior ou igual a $365?
 estar entre $323,6 e $370?
 Entre que dois valores (simetricamente distribuídos em torno
da média) estariam 60% das médias das amostras?

Amostragem a partir de populações cuja


distribuição não é normal

 Para amostra de tamanho ≥ 30, a distribuição de


amostragem da média aritmética estará próxima
da normal.

 Pode-se aplicar o Teorema do Limite Central


para tamanhos de amostra menores somente se
a distribuição tiver um formato aproximado de
um sino.

36
Exercício
 O tempo gasto por um caixa de banco, com cada
cliente, tem média aritmética da população µ=3,1
minutos e desvio padrão σ=0,4 minuto. Se você
selecionar uma amostra aleatória de 16 clientes,

a. qual é a probabilidade de que a média aritmética do tempo


gasto por cliente seja pelo menos 3 minutos?

b. existe uma chance de 85% de que a média aritmética da


amostra seja menor do que quantos minutos?

c. Quais premissas devem ser adotadas, para resolver (a) e (b)?

d. Se você seleciona uma amostra aleatória de 64


clientes, existe uma chance de 85% de que a média
aritmética da amostra seja menor do que quantos minutos?

Distribuição de amostragem
da proporção
ATENÇÃO: A notação utilizada será π para proporção
populacional e p para a proporção da amostra.

 A proporção da amostra

X número de sucessos
p= =
n tamanho da amostra
 Erro padrão da proporção
π (1 − π )
σp =
n

37
Distribuição de amostragem
da proporção
 A distribuição de amostragem
da proporção para uma população finita
(amostragem com reposição), segue a
distribuição binomial.

 Se nπ ≥ 5 e n(1- π) ≥ 5 pode-se utilizar


aa distribuição normal para aproximar a
distribuição binomial.

Aula 2

Distribuição de amostragem
da proporção
Encontrando Z para a distribuição de
amostragem da proporção.

p −π p −π
Z= =
σp π (1 − π )
n

Aula 2

38
Exemplo

 Suponha que um gerente de um banco


afirme que 40% de todos os
depositantes possuem contas múltiplas
no banco. Se você selecionar uma
amostra aleatória composta de 200
depositantes, qual é a probabilidade de
que a proporção da amostra de
depositantes com contas múltiplas seja
menor do que 0,30?

Aula 2

Estimativa

Estimativa de ponto – consiste em


uma única estatística da amostra, que
é utilizada para estimar o verdadeiro
valor de um parâmetro da população.

 Exemplos: X ⇒ µ X = µ
S2 ⇒σ 2

Aula 3

39
Estimativa
Estimativa de intervalo – a estimativa está
incluída num intervalo considerando um grau de
acerto denominado intervalo de confiança que
contém a estimativa pontual.

O nível de confiança é representado por


(1-α)x100%, onde α é a proporção nas caudas da
distribuição que se encontra fora do intervalo de
confiança. As proporções nas caudas superior e
inferior são iguais a α/2.

Aula 3

Estimativa
 Quanto maior a confiança maior será o intervalo.
 0% de confiança → um ponto
 100% de confiança → um intervalo de -∞ a +∞

 Quanto maior a variabilidade do processo


aleatório, maior será o intervalo de estimação para um
mesmo grau de confiança.

 Quanto maior o tamanho da amostra (maior o número


de informações), menor será o intervalo de confiança
necessário para um mesmo grau de confiança.

Aula 3

40
Estimativa do intervalo de confiança
da média aritmética - σ conhecido
 σ conhecido
σ
X ±Z⋅ ou
n
σ σ
X −Z⋅ ≤µ≤ X +Z⋅
n n
Z é chamado de valor crítico
onde é o erro de amostragem
σ
Z⋅
n

Estimativa do intervalo de confiança da


média aritmética - σ conhecido
 Exemplo 1: Foram retiradas 25 peças da
produção diária de uma
máquina, encontrando-se para uma medida
uma média de 5,2mm. Sabendo que as
medidas tem distribuição normal com desvio
padrão populacional de 1,2mm, construir
intervalos de confiança para a média aos
níveis de 90%, 95% e 99%. Que se pode
dizer, com 95% de confiança, sobre o
tamanho do erro na estimação?
Aula 3

41
Estimativa do intervalo de confiança
da média aritmética - σ conhecido

 Exemplo 2: Suponha que a altura dos alunos de


nossa faculdade tenham distribuição normal
com σ=15cm. Foi retirada uma amostra
= 1,62m
aleatória de 100 alunos,Xobtendo-se .
a) Qual é a estimação pontual da altura média
dos alunos?
b) Construa um intervalo de 95% de confiança
para a verdadeira altura média dos alunos.

Aula 3

Estimativa do intervalo de confiança


da média aritmética - σ
desconhecido
Como a média aritmética e o desvio padrão
da população são geralmente
desconhecidos, utiliza-se somente as
estatísticas da amostra, e S, para construir
uma estimativa do intervalo de confiança.
O desvio padrão da amostra, S, é utilizado
como uma estimativa de σ.

Aula 3

42
Estimativa do intervalo de confiança
da média aritmética - σ
desconhecido

 O erro padrão é medido com a expressão

S
SX =
n

Aula 3

Distribuição t de Student
 É similar à distribuição normal padronizada.
 Possui maior área nas caudas e menor área no
centro, em comparação com a distribuição normal
padronizada (possui maior dispersão porque σ é
desconhecido).
 Uma distribuição t com mais graus de liberdade
(maior tamanho da amostra) tem menos variabilidade
e se assemelha mais com a distribuição normal
padronizada.

 Quando o tamanho da amostra é superior a


120, pode-se utilizar Z no lugar de t.

Aula 3

43
Intervalo de confiança da média
aritmética - σ desconhecido
 Distribuição t

X −µ
t=
S
n
 Graus de liberdade
n-1

Aula 3

Intervalo de confiança da média


aritmética - σ desconhecido

S
X ± tn −1 ⋅ ou
n
S S
X − tn −1 ⋅ ≤ µ ≤ X + tn −1 ⋅
n n
onde tn-1 é o valor crítico da distribuição t com n-1 graus de liberdade

Aula 3

44
Intervalo de confiança da média
aritmética - σ desconhecido
 Exemplo 3: Suponha que uma amostra de
100 faturas de vendas de um empresa seja
selecionada, a partir da população de faturas
de vendas, durante o mês, e a média
aritmética da amostra de 100 faturas de
vendas seja $110,27, com um desvio padrão
da amostra igual a $28,95. Construa uma
estimativa do intervalo de confiança de 95%
do total de todas as faturas de vendas.

Aula 3

Intervalo de confiança da média


aritmética - σ desconhecido

 Exemplo 4: Uma amostra aleatória de


40 contas de pessoas físicas na filial
de um banco apresentou saldo médio
de $1.400 com desvio padrão de $300.
a) Estime a média da população com intervalo de
confiança de 95%.
b) Estime a média da população com intervalo de
confiança de 99%.

Aula 3

45
Estimativa do intervalo de
confiança para a proporção
Lembrete: quando nπ≥5 e n(1-π)≥5 ( ou
X e n-X são maiores do que 5) a
distribuição binomial se aproxima da
distribuição normal. p(1 − p) ou
p ± Z ⋅σ = p ± Z ⋅
p
n
p (1 − p ) p (1 − p )
p−Z⋅ ≤π ≤ p+Z ⋅
n n

X números de sucessos
=
n tamanho da amostra

onde:

p = proporção da amostra = Aula 4

Estimativa do intervalo de confiança


para a proporção
 Exemplo 1: Uma centena de componentes
foi ensaiada, e 93 deles funcionaram mais
de 1.000 horas. Determinar um intervalo
de confiança de 95% para a proporção de
componentes que funcionam mais de
1.000 horas. Que se pode dizer quanto ao
tamanho do erro máximo para esse
intervalo de confiança.

Aula 4

46
Exemplo

 Um grande jornal deseja determinar a proporção de


jornais impressos que possuem um atributo de
inconformidade, como, por exemplo, excesso de tinta,
montagem inadequada de páginas, páginas faltando e
páginas duplicadas. Uma amostra aleatória de 200 jornais
é selecionada dentre todos os jornais impressos durante
um único dia. No que diz respeito a essa amostra de 200
jornais, 35 contém algum tipo de não-conformidade.
Construa e interprete um intervalo de confiança de 90%
para a proporção de jornais que apresentam algum
atributo de não-conformidade impressos durante aquele
determinado dia.

Aula 4

Exercício
 Uma pesquisa realizada junto a 750
trabalhadores indagou sobre o quanto eles
utilizavam a internet no trabalho: 243 afirmaram
utilizá-la dentro de limites e 183 afirmaram não
utilizar a internet no local de trabalho.
a) Construa um intervalo de confiança de 95%
para a proporção de todos os trabalhadores
que utilizavam a internet dentro de limites.
b) Construa um intervalo de confiança de 95%
para a proporção de todos os trabalhadores
que não utilizavam a internet no local de
trabalho.

Aula 4

47
Tamanho da amostra para a
média aritmética
 Para determinar o tamanho da amostra, você
deve conhecer três fatores:

1) O nível de confiança desejado, que determina


o valor de Z.
e= X −µ
2) O erro de amostragem, .
3) O desvio padrão, σ.

Aula 4

Tamanho da amostra para a


média aritmética
Z 2σ 2 σ
n= onde e = Z ⋅
e2 n

Exemplo 2: Suponha que depois de consultar funcionários de


uma determinada empresa, determina-se que um erro de
amostragem de não mais do que ±$5 é desejado, com 95% de
confiança. Dados anteriores indicam que o desvio padrão das
quantias relativas a vendas tem sido aproximadamente igual a
$25 para um período substancial de tempo. Determine o
tamanho da amostra necessária para satisfazer as
necessidades da empresa. É necessário supor a normalidade
da população?

Aula 4

48
Tamanho da amostra para a média
aritmética
 Na maioria dos casos, σ é desconhecido. Na prática, pode-se
escolher entre os seguintes procedimentos:

 O desvio padrão pode ser estimado a partir de dados do


passado.
 Uma suposição bem fundamentada poderia ser feita, levando
em consideração a amplitude e a distribuição da variável. Por
exemplo: se for admitida uma distribuição normal, a amplitude
é aproximadamente igual a 6σ, de forma que σ é estimado
como sendo igual à amplitude/6.
 Um estudo piloto pode ser conduzido e o desvio padrão pode
ser estimado a partir dos dados.

Aula 4

Tamanho da amostra para a média


aritmética
 Exemplo 3: Suponha que o gerente de marketing
deseje estimar a média aritmética da população,
do consumo anual de óleo para calefação
residencial, entre ±50 galões de distância em
relação ao verdadeiro valor, e deseje estimar
corretamente a verdadeira média aritmética com
95% de confiança. Com base em um estudo
realizado no ano anterior, ele acredita que o
desvio padrão pode ser estimado de 325 galões.
Encontre o tamanho da amostra necessário.

Aula 4

49
Tamanho da amostra para
uma proporção
 Para determinar o tamanho da amostra
para estimar uma proporção, você
deve conhecer três fatores:

1) O nível de confiança desejado, que determina o


valor de Z.
2) O erro de amostragem aceitável, e.
3) A verdadeira proporção de sucessos, π.

Aula 4

Tamanho da amostra para


uma proporção

Z 2 p(1 − p) p(1 − p)
n= onde e = Z ⋅
e2 n

Aula 4

50
Tamanho da amostra para
uma proporção
Para o cálculo do tamanho da amostra teremos que ter
o valor estimado da proporção populacional π. Na
prática, esse valor pode ser escolhido por meio de um
dos seguintes procedimentos:
Um estudo piloto para selecionar uma amostra
preliminar.
Use o julgamento para o valor de π.


Use um valor planejado de π=0,50 como a forma

mais conservadora (gera o maior tamanho de amostra


possível).

Aula 4

Tamanho da amostra para


uma proporção
 Exemplo 4: Suponha que o procedimento de
auditoria de uma empresa exija que você tenha
95% de confiança ao estimar a proporção da
população de faturas de vendas com erros,
dentro dos limites de ±0,07, em relação à
verdadeira proporção da população. Os
resultados, a partir dos meses anteriores, indicam
que a maior proporção não foi mais do que 0,15.
Determine o tamanho da amostra necessário
para satisfazer os requisitos da empresa.

Aula 4

51
ESTATÍSTICA APLICADA

 CURSO: MBA LOGÍSTICA

 PROFESSOR: ALTAIR FERREIRA FILHO

 AULA 3

Teste de Hipóteses

 É um outro método para fazer inferências sobre


parâmetros populacionais. Em vez de calcular
uma estimativa do parâmetro pontual ou por
intervalo, iremos admitir um valor hipotético para
um parâmetro populacional, e com base nas
informações da amostra realizaremos um teste
estatístico, para aceitar ou rejeitar o valor
hipotético.

Aula 5

52
Teste de Hipóteses

 Para o cenário da Oxford Cereals, o


teste de hipóteses permitiria inferir um
entre os seguintes itens:
o A média aritmética do peso de caixas de cereais na
amostra é um valor consistente com o que você
esperaria, caso a média aritmética de toda a população
de caixas de cereais fosse igual a 368 gramas.

o A média aritmética da população não é igual a 368


gramas, tendo em vista que a média aritmética da
amostra é significativamente diferente de 368 gramas.

Aula 5

Exemplos de hipóteses estatísticas

 A altura média da população brasileira é de


1,63m, isto é: H: µ=1,63m.

 A proporção de africanos com a doença X é


de 40%, isto é: H: π=0,40.

Aula 5

53
Teste de Hipóteses

 São dois os tipos de hipóteses:

 H0 – chamada de hipótese nula, a hipótese estatística a


ser aceitada (é a hipótese que é sempre testada).
 H1 – chamada de hipótese alternativa, é desenvolvida
como sendo o oposto da hipótese nula e representa a
conclusão apoiada, se a hipótese nula for rejeitada.

Aula 5

Teste de Hipóteses

 A metodologia do teste de hipóteses é projetada


de forma que a rejeição à hipótese nula seja
baseada em evidências a partir da amostra, e que
nossa hipótese alternativa tenha uma
probabilidade bem mais alta de ser verdadeira.
 Nunca será possível provar que a hipótese nula
está correta, uma vez que a decisão é baseada
somente em informações sobre a amostra, e não
sobre a população inteira.

Aula 5

54
Teste de Hipóteses
 A hipótese nula, H0, sempre se refere a um valor
especificado do parâmetro da população e não
como uma estatística da amostra.
 A afirmativa da hipótese nula sempre contém um
sinal de igualdade com relação ao valor
especificado do parâmetro da população.
 A afirmativa da hipótese alternativa nunca contém
um sinal de igualdade com relação ao valor
especificado do parâmetro da população.

Aula 5

Teste de Hipóteses
 Você é gerente de uma lanchonete e
deseja determinar se o tempo de
espera para atender a um pedido se
modificou, no mês anterior, em relação
ao valor anterior de 4,5
minutos, correspondente à média
aritmética da população. Declare a
hipótese nula e a hipótese alternativa.

Aula 5

55
Teste de Hipóteses

 Para tomar uma decisão com relação à


hipótese nula, primeiramente determina-
se o valor crítico da estatística do teste
que freqüentemente segue a distribuição
normal padronizada ou a distribuição t.
Esse valor faz a separação entre a
região de não-rejeição e a região de
rejeição.

Aula 5

Teste de Hipóteses
 Ao ser utilizada uma estatística da
amostra para tomar decisões sobre um
parâmetro da população, existe um
risco de que uma conclusão incorreta
seja obtida. Dois diferentes tipos de
erro podem ocorrer ao ser aplicada a
metodologia do teste de hipóteses:
 Erro do Tipo I: rejeitar H0, quando não deveria
 Erro do Tipo II: não rejeitar H0, quando deveria

Aula 5

56
Teste de Hipóteses
Riscos na tomada de decisão

 Nível de significância da estatística do


teste (α) – é a probabilidade de cometer
um erro do tipo I. Controlam-se as taxas
de erro do tipo I decidindo sobre o nível
de risco α que pode ser tolerado ao ser
rejeitada a hipótese nula quando ela for
efetivamente verdadeira.

 Coeficiente de confiança (1-α) –


Aula 5

representa a probabilidade de concluir


que determinado valor do parâmetro que

Teste de Hipóteses
Riscos na tomada de decisão

 Risco β – é a probabilidade de cometer


um erro do tipo II. A probabilidade de
cometer um erro do tipo II depende da
diferença entre o valor da hipótese e os
verdadeiros valores dos parâmetros da
população.

 Eficácia de um teste (1-β) – representa a


Aula 5

probabilidade de concluir que o


determinado valor do parâmetro que

57
Teste de Hipóteses
Riscos na tomada de decisão

Decisão
H0 verdadeiro H0 falso
Estatística
Decisão correta Erro do tipo II
Não rejeitar H0
Confiança = 1-α P(Erro tipo II) = β
Decisão correta
Erro do tipo I
Rejeitar H0 Eficácia = 1-β
P(Erro tipo I) = α

Aula 5

Teste de Hipóteses
Riscos na tomada de decisão
 Uma maneira de controlar e reduzir o erro do tipo II é
aumentar o tamanho da amostra. Tamanhos de
amostras maiores, de maneira geral, permitem detectar
pequenas diferenças entre os valores verdadeiros e os
valores da hipótese, com relação aos parâmetros da
população.

 Para um determinado tamanho de amostra, deve-se


levar em consideração a relação de ganhos e perdas
entre os dois possíveis tipos de erros.

Aula 5

58
Exercício
 Na legislação dos EUA, o acusado é tido como
inocente até que seja provado culpado.
Considere uma hipótese nula, H0, em que o
acusado seja inocente, e uma hipótese
alternativa, H1, em que o acusado seja culpado.
Um júri tem duas decisões possíveis: condenar o
acusado (isto é, rejeitar H0) ou não condenar o
acusado (isto é, não rejeitar H0). Explique o
significado dos riscos de ser cometido um erro do
tipo I ou do tipo II.

Aula 5

Teste Z de Hipóteses para a média


aritmética – σ conhecido

 Quando o desvio padrão é conhecido, a


distribuição de amostragem da média
aritmética segue a distribuição
normal, resultando na estatística do teste
Z. X −µ
Z=
σ
n

Aula 5

59
Teste Z de Hipóteses para a média
aritmética – σ conhecido
Método do valor crítico para o teste de hipóteses

 Valor crítico – um valor que é comparado


com a estatística do teste para determinar
se H0 deve ser rejeitado.

Aula 5

Exemplo
 Suponha que a amostra de 25 caixas de
cereais indicasse uma média da amostra
igual a 372,5 gramas, e o desvio padrão
da população, σ, fosse assumido como
sendo igual a 15 gramas. Se um nível de
significância de 0,05 for
utilizado, existem evidências de que a
média aritmética da população seja
diferente de 368 gramas?

Aula 5

60
Exemplo
 Você é gerente de uma lanchonete e deseja determinar se o
tempo de espera para atender a um pedido se modificou, no
mês anterior, em relação ao valor anterior de 4,5
minutos, correspondente à média aritmética da população. Com
base em experiências passadas, você pode pressupor que a
população é distribuída nos moldes da distribuição normal, com
desvio padrão de 1,2 para a população. Você seleciona uma
amostra de 25 pedidos durante um período de uma hora. A
média aritmética da amostra é de 5,1 minutos. Existem
evidências, no nível de significância de 0,05 de que a média
aritmética da população do tempo de espera para o
atendimento de um pedido se modificou, no mês passado, em
relação ao seu valor anterior de 4,5 minutos para a média
aritmética da população.

Aula 5

Testes Unicaudais
ou Teste Direcional
 É um teste de hipóteses no qual a rejeição
da hipótese nula ocorre para valores da
estatística do teste em uma cauda da
distribuição amostral.

Aula 5

61
Testes Unicaudais
Exemplo
 Uma empresa que processa queijos está
interessada em avaliar se alguns fornecedores de
leite para a sua produção estão adicionando água
a seu leite na tentativa de aumentar a quantidade
de leite fornecido para o processamento. Sabe-se
que água em excesso reduz o ponto de
congelamento do leite. O ponto de congelamento
do leite natural é normalmente distribuído, com
média aritmética de -0,545ºC. Sabe-se, também,
que o desvio padrão da temperatura de
congelamento do leite é igual a 0,008ºC.

Aula 5

Testes Unicaudais
Exemplo
Uma vez que a empresa de queijos está
interessada somente em determinar se o ponto de
congelamento do leite é inferior àquele que seria
esperado para o leite natural, toda a região de
rejeição se encontra localizada na cauda inferior
da distribuição.

H 0 : µ ≥ −0,5450
H1 : µ < −0,5450

Aula 5

62
Testes Unicaudais
Exemplo
Se uma amostra de 25 recipientes de
leite for selecionada, e a média aritmética
do ponto de congelamento da amostra for
determinada como sendo -
0,550ºC, resolver o problema utilizando o
teste Z e o valor-p.

Aula 5

Exemplo
 Uma empresa que fabrica barras de chocolate está
particularmente preocupada com o fato de a média
aritmética do peso de uma barra de chocolate não ser
superior a 6,03 onças. Experiências passadas
permitem que você pressuponha que o desvio padrão
seja de 0,02 onça. Uma amostra com 50 barras de
chocolate foi selecionada, e a média aritmética da
amostra é 6,034 onças. Utilizando o nível de
significância de 0,01, existem evidências de que a
média aritmética da população correspondente ao
peso das barras de chocolate seja maior do que 6,03
onças?

Aula 5

63
Teste t de Hipóteses para a média
aritmética – σ desconhecido
 Estatística do teste t

X −µ
t=
S
n
 Graus de liberdade
n-1

Aula 5

Exemplo

 Exemplo 1: O gerente financeiro da empresa


administradora de cartões de crédito definiu a renda
média mensal dos associados de $2.500 para ser
utilizada como premissa durante a preparação do
orçamento do próximo ano. Durante a primeira reunião do
orçamento anual, o gerente de marketing contestou o
valor da renda média mensal adotado, afirmando que a
atual renda média mensal dos associados é maior que
$2.500. O gerente geral solicitou que seja verificado o
valor adotado de $2.500, pois a maior parte do lucro da
empresa administradora de cartões de crédito depende
da renda dos associados.

Aula 5

64
Exemplo - continuação
 Na tentativa de verificar a afirmação do
gerente de marketing foi realizada uma
pesquisa de renda mensal em uma
amostra de 50 associados escolhidos
aleatoriamente na população de
associados. O resultado da pesquisa
mostrou que a variável aleatória renda
mensal tem média $2.590 e desvio padrão
$285. Que conclusões podemos tirar
desses dados da amostra?

Aula 5

Exemplo - continuação

 Podemos dizer que o aumento da renda


mensal de $2.500 para $2.590 pode ser
proveniente:

 Da própria variabilidade das médias amostrais.


 De um aumento real dos salários dos associados.

Aula 5

65
Exemplo - continuação
Para determinarmos qual é a afirmação verdadeira, recorreremos
ao teste de hipóteses.
H 0 : µ = $2.500
H1 : µ ≠ $2.500

Aparentemente, a média amostral igual a $2.590 não é muito


diferente da média da população $2.500.

Se a probabilidade de ocorrência de $2.590 for pequena, então a


hipótese alternativa deverá ser rejeitada, mantendo-se a hipótese
nula $2.500.

Aula 5

Exemplo - continuação

 Verifique se a afirmação do pessoal de


marketing é significativa considerando o
intervalo de confiança de 95%.
 Há evidências de rejeitar H0 e aceitar
H1?

Aula 5

66
Exercício
O gerente de uma empresa no ramo de telefonia
está interessado em determinar se a instalação
de um novo equipamento telefônico aumentou as
vendas médias por funcionário. No último ano, as
vendas durante o mês de julho foram de
R$3.987,00. Logo que o mês de julho terminou no
ano corrente, o gerente selecionou uma amostra
de quinze funcionários e avaliou o nível de
vendas de cada um deles, que se caracterizou da
seguinte maneira:

Aula 5

Exercício

2958 3816 4146 5325 4400 2085 5435 4518


2218 3341 5124 4011 4900 4511 4400

Com base nessa amostra o gerente tem evidência


suficiente, ao nível de significância de 0,05 de que
as vendas médias por funcionário durante o mês de
julho do corrente ano excederam a média de julho
do ano anterior?

Aula 5

67
Teste Z de Hipóteses para a
proporção
p −π
Z=
π (1 − π )
n
onde:
X números de sucessos
=
p = proporção de sucessos na amostra = n tamanho da amostra

π = proporção da hipótese de sucessos na população

Z = valor crítico (aproximadamente distribuição normal


padronizada)

n = tamanho da amostra

Aula 5

Teste Z de Hipóteses para a


proporção

Teste Z de Hipóteses para a proporção em


termos do número de sucessos (X).

X − nπ
Z=
nπ (1 − π )

Aula 5

68
Exemplo

 Um determinado jornal fez um estudo baseado na


seguinte pergunta: “Um número igual de empresas
domiciliares tem como proprietários homens e
mulheres?” O estudo de 899 empresas domiciliares
divulgou que 369 eram de propriedade de mulheres.
Determine se há evidências de que a proporção de
empresas domiciliares pertencentes a mulheres não é
0,50.
 Em termos de hipóteses nula e alternativa podem ser
declaradas da seguinte maneira:

Aula 5

Exemplo

 Uma cadeia de lanchonetes desenvolveu um novo


processo para garantir que os pedidos em guichês
para atendimento a automóveis sejam preenchidos
corretamente. Com o processo anterior, os pedidos
eram preenchidos corretamente durante 85% do
tempo. Com base em uma amostra de 100 pedidos
sob o novo processo, 94 foram preenchidos
corretamente. No nível de significância de 0,01, você
pode concluir que o novo processo fez crescer a
proporção de pedidos preenchidos corretamente?

Aula 5

69
Teste χ2 para a diferença entre duas
proporções

H 0 : π1 = π 2
H1 : π1 ≠ π 2
 Nesse teste, em vez de comparar
diretamente proporções de sucessos, os
dados são examinados em termos da
freqüência de sucessos nos dois grupos.

Aula 10

Tabela de Contingência 2x2


X1 = número de sucessos no grupo 1

X2 = número de sucessos no grupo 2 Variável na


coluna (grupo)
n1 – X1 = número de insucessos no grupo 1 Variável
1 2 Totais
na linha
n2 – X2 = número de insucessos no grupo 2
Sucessos X X2 X
1
X = X1+ X2 = número total de sucessos
n
n – X = (n1 – X1) +(n2 – X2 ) = número total de insucessos Insucess 1 n2 –
– n-X
os X2
n1 = tamanho da amostra do grupo 1 X
1

n2 = tamanho da amostra do grupo 2 Totais n n2 n


1

n = n1+n2 = tamanho total da amostra

Aula 10

70
Tabela de Contingência 2x2
Tabela de contingência 2x2 para a pesquisa de
satisfação do hóspede.

Hotel

Escolheria
novamente o Beachcomber Windsurfer Total
hotel?

Sim 163 154 317

Não 64 108 172

Total 227 262 489

Aula 10

Teste χ2 para a diferença entre duas


proporções
A estatística do teste χ2 é igual a diferença ao quadrado entre as
freqüências observada e esperada dividida pela freqüência
esperada em cada célula da tabela somada ao longo de todas as
células da tabela.
( fo − fe )2
χ =
2

todas as fe
onde: células

fo = freqüência observada, em uma determinada célula da tabela

fe = freqüência esperada ou teórica, em uma determinada célula, se a


hipótese nula for verdadeira

A estatística do teste χ2 segue uma distribuição qui-quadrada com 1 grau


de liberdade.

Aula 10

71
Cálculo da freqüência esperada
fe
Caso a hipótese nula seja verdadeira, ou seja, se as
proporções de sucessos nas duas populações forem iguais
entre si, então as proporções das amostras, calculadas a partir
de cada grupo, iriam divergir uma da outra, somente em função
do acaso, e cada uma iria fornecer uma estimativa do
parâmetro comum da população, π. Por isso, uma estatística
que agrupa ou combina essas duas estimativas separadas
dentro de uma estimativa geral do parâmetro da população, π,
fornece mais informações do que qualquer uma das duas
estimativas em separado poderia fornecer. Essa estatística é
X1 + X 2 X
p= = proporção geral de sucessos
n1 + n2 n

Aula 10

Cálculo da freqüência esperada


fe
Para obter a freqüência esperada para cada
célula pertencente a sucessos, o tamanho da
amostra para um grupo é multiplicado por .
p 1− p

Para obter a freqüência esperada para cada


célula pertencente a insucessos, o tamanho da
amostra para um grupo é multiplicado por
.
Aula 10

72
Grau de Liberdade

 A estatística do teste χ2 segue uma distribuição


qui-quadrada com graus de liberdade
correspondente ao número de linhas na tabela de
contingência menos 1, multiplicado pelo número
de colunas na tabela menos 1.

Graus de liberdade = (l – 1)(c – 1)

onde:

l = número de linhas na tabela


Aula 10

c = número de colunas na tabela

Regra de decisão
A hipótese nula é rejeitada em favor da
hipótese alternativa se a estatística calculada do
teste χ2 for maior do que o valor crítico da cauda
superior, a partir da distribuição qui-quadrada,
que possui 1 grau de liberdade.

χ 2calc > χ12


Rejeitar H0 se

Aula 10

73
Exemplo

 Para ilustrar a forma de utilizar o teste χ2 para determinar


a igualdade entre duas proporções, utilizaremos o
exemplo anterior com relação a T. C. Resort. Em uma
das ilhas, o grupo hoteleiro possui instalações em duas
diferentes localizações, o Beachcomber e o Windsurfer.
Ao tabular as respostas para a única pergunta: ”Você
está propenso a escolher novamente este hotel?”, 163
entre 227 hóspedes do Beachcomber responderam sim e
154 dos 262 hóspedes do Windsurfer responderam que
sim. No nível de significância de 0,05, existem evidências
de diferença significativa em relação à satisfação de
hóspedes entre os dois hotéis?

Aula 10

Exemplo
 Para resolvermos esse exemplo teremos que:
 Calcular .
 Calcular as freqüências esperadas. p
Criar a tabela de contingência 2x2 para comparar
os dados observados (fo) e esperados (fe), relativos
à satisfação de hóspedes.
 Calcular a estatística do teste χ2.
 Encontrar o valor crítico da estatística do teste χ2.

Aula 10

74
Exercício

 Um estudo realizado como parte de esforço


para aperfeiçoamento da produção de uma
fábrica de semicondutores forneceu dados
correspondentes a defeitos para uma amostra
de 450 placas. A tabela de contingência a seguir
apresenta o resumo das respostas para duas
perguntas: “Alguma partícula foi encontrada na
fôrma que produziu a placa?” e “A placa é
perfeita ou defeituosa?”

Aula 10

Exercício
Condição da fôrma

Qualidade Nenhuma
Partículas Total
da placa partícula

Perfeita 320 14 334


Defeituosa 80 36 116
Total 400 50 450

a) No nível de significância de 0,01, existe diferença significativa entre


a proporção de placas perfeitas e de placas defeituosas que contêm
partículas?
b) A que conclusões você chega a partir dessa análise?

Aula 10

75
ESTATÍSTICA APLICADA

 CURSO: MBA LOGÍSTICA

 PROFESSOR: ALTAIR FERREIRA FILHO

 AULA 4

Regressão Linear

Uma vez estabelecida a relação e uma boa correlação entre


as variáveis podemos partir para a determinação de uma
fórmula matemática que possa “prever” os resultados de y
dado os valores de x. Chamamos esta relação de regressão.

Estudaremos neste caso a regressão linear que é um modelo


adequado quando encontramos disposições dos pontos.

76
Regressão Linear Simples
 Descrevemos a equação linear através da fórmula:

y = a + bx

Chamamos a de intecepto (valor de y para o qual x=


0) e b o coeficiente angular da reta (inclinação).

 Os valores de b e a são determinados pelas fórmulas:

b =
n ∑ xy − ( ∑ x )( ∑ y)
n ∑ x 2
− ( ∑ x)2

a =
∑ y

b ∑ x
n n

Exemplo

 Observe o quadro abaixo, os valores (em mil reais) são


referentes aos 7 últimos meses de uma empresa:
Faturamento Lucro Líquido
32 25
14 8
37 27
20 10
37 26
34 27
28 27

Determine a equação de regressão.

77
Regressão Linear Múltipla

Os modelos lineares com mais de uma variável independente


são denominados modelos de regressão linear múltipla.

O desenvolvimento da equação de regressão linear múltipla


é similar ao da equação de regressão linear simples incluindo
a dependência de duas ou mais variáveis independentes.

Regressão Linear Múltipla

Dispondo de um grupo de amostras do mesmo


tamanho, sendo uma variável dependente y e n variáveis
independentes xi, o objetivo é determinar os coeficientes da
equação da reta:

yˆ = a + b1 x1 + b 2 x 2 + L + b n x n

cujos coeficientes minimizam a soma dos quadrados dos


desvios da variável com relação a y.

78
Exemplo
 Vendas de uma loja de departamento:

Após a emissão do relatório do EXCEL, use o risco de 5% e


analise o modelo como um todo. Analise cada um dos
regressores, determinando quais os que deverão permanecer
no modelo. Justifique sua resposta.

79