Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
DE
C AXIAS
DO
S UL
Probabilidade e Estatstica
ndice
2
3
4
7
8
Introduo _____________________________________________________1
1.1
Amostragem ________________________________________________________ 2
1.2
4.2
4.3
4.4
4.5
4.6
Mdia _____________________________________________________________ 20
5.2
Mediana ___________________________________________________________ 23
5.3
Moda _____________________________________________________________ 25
5.4
Amplitude _________________________________________________________ 28
6.2
Varincia __________________________________________________________ 29
6.3
6.4
8.2
8.3
Eventos ___________________________________________________________ 34
8.4
8.5
10.2
11
12
Estimao ___________________________________________________62
Testes de hipteses ___________________________________________68
12.1
12.2
12.3
12.4
13
13.1
13.2
14
Regresso ______________________________________________________________ 91
14.1
14.2
14.3
Correlao ______________________________________________________________ 94
14.4
14.5
14.6
14.7
14.8
15
Tabelas ____________________________________________________106
1 I ntroduo
Estuda-se estatstica para aplicar seus conceitos como auxlio nas tomadas de deciso
diante de incertezas, justificando cientificamente as decises.
Os princpios estatsticos so utilizados em uma grande variedade de situaes no
governo, nos negcios e na indstria, bem como no mbito das cincias sociais, biolgicas
e fsicas.
Estatstica a cincia ou mtodo cientfico que estuda os fenmenos multicausais,
coletivos ou de massa e procura inferir as leis que os mesmos obedecem.
Mtodo estatstico um processo para se obter, apresentar e analisar caractersticas ou
valores numricos para uma melhor tomada de deciso em situaes de incerteza. Os
passos da metodologia estatstica so os seguintes:
Divulgao de relatrio com as concluses, de tal modo que estas sejam facilmente
entendidas por quem as for usar na tomada de decises.
Definies:
Populao: coleo completa de todos os elementos (valores, pessoas, medidas,...) a
serem estudados.
Amostra: subcoleo de elementos extrados da populao.
Censo: coleo de dados relativos a todos os elementos de uma populao.
Amostragem: coleo de dados relativos a elementos de uma amostra.
Exemplo:
Populao
Amostra
1.1 Amostragem
O objetivo da amostragem permitir fazer inferncias sobre uma populao aps inspeo
de apenas parte dela. Fatores como custo, tempo, ensaios destrutivos e populaes
infinitas tornam a amostragem prefervel a um estudo completo (censo).
Os principais tipos de amostragem utilizados so os probabilsticos, onde todos os
indivduos da populao tm a mesma chance de serem selecionados. Os planos de
amostragem probabilstica so delineados de tal modo que se conhece todas as
combinaes amostrais possveis e suas probabilidades, podendo-se ento determinar o
erro amostral.
Os mtodos mais comuns de amostragem probabilstica so:
1.2
Tipos de variveis
Variveis
Quantitativas
Discretas
Qualitativas
Contnuas
Exerccios:
Identifique cada nmero como discreto ou contnuo
1. Cada cigarro Camel tem 16,13 mg de alcatro
2. O altmetro de um avio da American Airlines indica uma altitude de 21.359 ps
3. Uma pesquisa efetuada com 1015 pessoas indica que 40 delas so assinante de um
servio de informao on-line.
4. O tempo total gasto anualmente por um motorista de txi de Nova York ao dar
passagem a pedestres de 2367 segundos.
2 Sries estatstic as
Consiste no agrupamento dos dados estatsticos em tabelas.
Em qualquer srie estatstica so observados trs elementos fundamentais:
O espao geogrfico
A poca
Sries geogrficas
Os dados esto reunidos de acordo com o local, que varia. Os outros dois fatores - fato e
data - permanecem inalterados.
Sries especficas
Os dados esto reunidos de acordo com o evento, que varia. Os outros dois fatores - local
e data - permanecem inalterados.
As sries podem ainda apresentar-se sob a forma mista, resultante da combinao dos
fatores.
3 Grficos
Os grficos consistem em uma forma de apresentao dos dados, usualmente utilizada
pois facilita a interpretao dos resultados.
So elementos complementares de um grfico:
Colunas
Um grfico de colunas mostra as alteraes
de dados em um perodo de tempo ou
ilustra comparaes entre itens. As
categorias so organizadas na horizontal e
os valores so distribudos na vertical, para
enfatizar as variaes ao longo do tempo.
Grficos de colunas empilhadas mostram o relacionamento de itens individuais com o todo
. O grfico de colunas em perspectiva 3D
compara pontos de dados ao longo dos dois
eixos.
Barras
Um grfico de barras ilustra comparaes
entre itens individuais. As categorias so
organizadas na vertical e os valores na
horizontal para enfocar valores de
comparao.
Linha
Valor de venda do produto X
Pizza
Um grfico de pizza mostra o tamanho
proporcional de itens que constituem uma srie
de dados para a soma dos itens. Ele sempre
mostra somente uma nica srie de dados, sendo
til quando voc deseja dar nfase a um
elemento importante.
Totaliza a informao (100%). Cada faixa do
grfico proporcional informao.
Histograma
0.30
0.25
0.20
0.15
0.10
0.05
0.00
3a8
8 a 13 13 a 18 18 a 23 23 a 28 28 a 33
Safras (alq.)
rea
Um grfico de rea enfatiza a
dimenso das mudanas ao longo do
tempo. Exibindo a soma dos valores
plotados, o grfico de rea mostra
tambm o relacionamento das partes
com um todo.
Nesse exemplo, o grfico de rea
enfatiza o aumento das vendas em
Washington e ilustra a contribuio
de cada estado para o total das
vendas.
Superfcie
Um grfico de superfcie til quando
voc deseja localizar combinaes
vantajosas entre dois conjuntos de dados.
Como em um mapa topogrfico, as cores e
os padres indicam reas que esto no
mesmo intervalo de valores.
Esse grfico mostra as vrias combinaes
de temperatura e tempo que resultam na
mesma medida de resistncia trao.
Radar
Um grfico de radar compara os
valores agregados de vrias sries de
dados.
Aes
O grfico de alta-baixa-fechamento usado muitas vezes para ilustrar preos de aes.
Esse grfico tambm pode ser usado com dados cientficos para, por exemplo, indicar
mudanas de temperatura. Voc deve organizar seus dados na ordem correta para criar
esse e outros grficos de aes.
Um grfico de aes que mede o volume tem dois eixos de valores: um para as colunas,
que medem o volume, e outro para os preos das aes. Voc pode incluir volume em um
grfico de alta-baixa-fechamento ou de abertura-alta-baixa-fechamento.
10
Bolhas
Um grfico de bolhas um tipo de grfico xy (disperso). O tamanho do marcador de
dados indica o valor de uma terceira varivel.
Para organizar seus dados, coloque os valores de x em uma linha ou coluna e insira os
valores de y e os tamanhos das bolhas correspondentes nas linhas ou colunas adjacentes.
O grfico nesse exemplo mostra que a Empresa A tem a maioria dos produtos e a maior
fatia do mercado, mas no necessariamente as melhores vendas.
Rosca
Como um grfico de pizza, o grfico de
rosca mostra o relacionamento das partes
com o todo, mas pode conter mais de uma
srie de dados. Cada anel do grfico de
rosca representa uma srie de dados.
11
4 Distribuies de freqncias
Distribuio de freqncia uma tabela resumida na qual os dados so organizados em
grupos de classe ou categorias convenientemente estabelecidas e numericamente
ordenadas.
As distribuies de freqncias so series hetergrafas, isto , sries na qual o fenmeno
ou fato apresenta graduaes ou subdivises. Embora fixo, o fenmeno varia de
intensidade.
Nas distribuies de freqncia, os dados so agrupados segundo um critrio de
magnitude, em classe ou pontos, permanecendo constante o fato, local e tempo, de tal
forma que se possa determinar a percentagem ou nmero, de cada classe. um tipo de
apresentao que condensa uma coleo de dados conforme as freqncias ou repeties
de seus valores.
n onde n o
Exemplo:
Os dados a seguir representam o tempo (em minutos) que 45 operadores de mquina
demoraram para fazer o setup de uma mquina.
6,5
6,4
9,7
7,9
7,9
4,0
5,0
4,4
6,0
6,4
7,1
8,5
7,0
8,2
7,4
8,3
5,7
6,3
10,4
7,0
5,4
7,7
8,3
9,9
13,0
7,6
7,2
6,9
3,9
8,7
9,0
12,4
5,7
9,8
6,4
15,7
7,1
7,6
8,2
6,7
16,7
5,5
7,9
5,6
7,4
45 =6,7 7 classes
2 Amplitude das classes 16,7 3,9 = 12,8 (Maior valor = 16,7; Menor valor =
3,9). Logo, tem-se a amplitude das classes 12,8 / 7 = 1,83 2
12
Tempo
(minutos)
Nmero de
operadores
% de
operadores
3 | 5
8,9%
5 | 7
15
33,3%
7 | 9
18
40,0%
9 | 11
8,9%
11 | 13
4,4%
13 | 15
0,0%
15 | 17
4,4%
Total
45
100%
3 | 5 equivale a 3 < x 5
Ou seja, so contados no
intervalo todos os valores
superiores a 3 e inferiores ou
iguais a 5.
Nmero de operadores
18
15
4
2
0
2
0
3 | 5
5 | 7
7 | 9
9 | 11
11 | 13
13 | 15
15 | 17
Tempo (minutos)
13
Nmero de operadores
20
18
18
16
14
12
15
10
8
6
4
2
0
3 | 5
5 | 7
7 | 9
2
0
9 | 11 11 | 13 13 | 15 15 | 17
Tempo (minutos)
OBS: uma vez que a rea do polgono deve ser 100%, deve-se ligar o primeiro e o ltimo
pontos mdios com o eixo horizontal, de modo a cercar a rea da distribuio observada.
Exerccios:
1. A tabela de dados representa o peso de 30 sacos de arroz da marca A selecionados
aleatoriamente em um supermercado. Construa a distribuio de freqncias e
apresente em um grfico. (para facilitar os dados j esto ordenados)
922
930
936
950
954
954
958
965
968
974
977
979
987
1018 1034 1034 1035 1042 1044 1044 1048 1070 1116
9,0
12,2
14,7
7,9
9,8
8,0
13,3
13,3
8,9
8,8
8,3
11,8
11,8
14,7
8,5
7,7
11,4
11,2
10,6
14
Freqncia
dias
% dos
dias
0,06
0,06
12
0,08
10
0,10
10
0,20
10
0,20
0,12
0,08
0,06
0,04
50
1,00
Nmero de dias
Classe
8
6
4
2
0
0
15
Por outro lado, poderamos usar como classes 0-1, 2-3, 4-5, 6-7 e 8-9.
Freqncia
dias
% dos
dias
0-1
0,12
2-3
0,18
4-5
20
0,40
6-7
10
0,20
8-9
0,10
50
1,00
25
Nmero de dias
Classe
20
15
10
5
0
0-1
2-3
4-5
6-7
8-9
Por outro lado, prefere-se uma distribuio de freqncia com perda da informao
quando:
S existem inteiros, porm em nmero muito alto para permitir uma distribuio
til.
16
Classe
N dias
% dias
0,06
0,06
0,06
0,12
0,08
0,20
0,10
0,30
10
0,20
0,50
10
0,20
0,70
0,12
0,82
0,08
0,90
0,06
0,96
0,04
1,00
50
1,00
Classe
N dias
% dias
0-1
0,12
0,12
2-3
0,18
0,30
4-5
20
0,40
0,70
6-7
10
0,20
0,90
8-9
0,10
1,00
50
1,00
acumuladas
Podemos, pela primeira tabela, concluir que 90% dos dados correspondem a valores
menores ou iguais a 7. ou seja, Em 90% dos dias o nmero de acidentes no excede 7.
17
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
0
0-1
2-3
4-5
6-7
8-9
% dos dias
1,0
0,8
0,6
0,4
0,2
0,0
0
N. acidentes
Vendas
relativas
Limo
600
0,375
Laranja
400
0,250
Melo
300
0,188
Melancia
200
0,125
Abacaxi
100
0,063
Total
1600
1,000
18
Distribuies discretas
Assimtrica direita
Simtrica
Assimtrica esquerda
Exerccio:
Construa a distribuio de freqncia e desenhe o histograma dos dados a seguir. Qual
o formato da distribuio?
20,7
18,5
23,3
18,9
28,3
18,7
21,3
25,3
26,6
20,3
26,2
19,3
20,4
22,4
21,7
21,7
18,3
18,3
18,9
18,2
18,8
25,1
24,0
22,6
20,3
20,6
18,8
21,2
21,4
19,2
20,7
24,3
19,4
27,0
24,7
20,2
28,4
20,6
23,6
18,4
19
5.1 Mdia
5.1.1 Mdia aritmtica
A mdia aritmtica o resultado da diviso da soma de todos os valores da amostra pela
quantidade total de valores.
x
x=
i =1
ou simplesmente x =
x
n
i =1
n
= x1 + x 2 + ... + x n
i =1
Se um estudante faz quatro provas, obtendo as notas 70, 60, 80 e 75, sua mdia : 71,25.
20
w x
i
i =1
n
Mdia ponderada =
i =1
Consideremos que um professor informe a classe de que haver dois exames parciais,
valendo cada um 30% da nota e um exame final valendo 40%. Um aluno obtm
desempenho 70 na primeira avaliao, 65 na segunda e 80 no exame final.
n
wx
i
Mdia ponderada =
i =1
n
i =1
Mdia geomtrica =
i =1
OBS:
= x1x 2 x 3...x n
i =1
21
Mdia harmnica =
1
n
1
1
n i 1 xi
n
1
HGx
Em smbolos:
x =
fx
i
Exemplo:
Classe
Ponto mdio
(x i )
N dias (f i )
f i xi
0-1
0,5
3,0
2-3
2,5
22,5
4-5
4,5
20
90,0
6-7
6,5
10
65,0
8-9
8,5
42,5
n = 50
223
x=
fx
i
223
= 4,46
50
22
Classe (x i )
N dias (f i )
f i xi
15
10
40
10
50
36
28
24
18
50
222
x =
fx
i
222
= 4,44
50
5.2 Mediana
A principal caracterstica da mediana dividir o conjunto de nmeros em dois grupos
iguais: a metade ter valores inferiores ou iguais mediana e a metade ter valores
superiores ou iguais mediana.
Para calcular a mediana inicia-se ordenando os valores em ordem crescente. Em seguida
conta-se at a metade deles. Em geral a mediana ocupa a posio (n+1)/2.
Para nmero mpar de valores a mediana o valor do meio. Para amostras com nmero
par de unidades, a mediana a mdia dos dois valores centrais.
Exemplos:
Amostra
Nmero de elementos
Dados ordenados
Mediana
2 3 34 25 14 5
9 elementos mpar
1 2 23 3 4 45 5
2 4 31 73 89 24
10 elementos par
1 2 23 34 47 89
3,5
3 4 23 15 32
6 7 32 52 36 21
23
LI
Q1
Q 2 =mediana
Q3
LI = Limite inferior
LS
LS=Limite superior
( f )1
c
Mediana = L1 + 2
f mediana
onde: L 1 = limite inferior da classe mediana, isso , da classe que contm a mediana
n = nmero de itens dos dados (freqncia total)
( f) 1 =soma de todas as freqncias das classes anteriores mediana
f mediana = freqncia da classe mediana
c = amplitude do intervalo da classe mediana
Exemplo:
No caso dos acidentes, temos 50 observaes, logo a mediana deve estar localizada na
posio (50+1)/2 = 25,5, ou seja, a classe que contm a mediana a classe 4-5.
O limite inferior da classe mediana 4. Antes da classe mediana (( f) 1 ) haviam passado
15 dados. A classe mediana contm 20 observaes e a amplitude da classe mediana 1.
Ento
50
15
x1 = 4 + 0,5 = 4,5
Mediana = 4 + 2
20
24
5.3 Moda
A moda o valor que aparece com maior freqncia na amostra. Um conjunto de dados
pode no apresentar moda, apresentar uma moda, duas modas (bimodal), trs modas
(trimodal) ou mais modas (polimodal).
Exemplo:
A moda do conjunto 2 3 4 3 2 3 5 1 2 3, pois o trs o valor que mais vezes aparece.
1
Moda = L 1 +
1 + 2
onde: L 1 =limite inferior da classe modal (isto , a classe que contm a moda)
1 =excesso da freqncia modal sobre a da classe imediatamente anterior
2 = excesso da freqncia modal sobre a da classe imediatamente posterior
Exemplo:
No caso dos acidentes....
Classe
N dias (f i )
0-1
2-3
4-5
20
6-7
10
8-9
Classe modal
n = 50
11
Moda = 4 +
1 = 4 + 0 ,52 = 4 ,52
11 + 10
25
A distribuio pode ter mais de uma moda, sendo bimodal ou de modas mltiplas. OBS: as
duas modas no precisam, necessariamente, ter a mesma freqncia. Isso acontece
quando h um deslocamento da distribuio.
Moda
Classe modal
Classes modais
Classes modais
Moda
Moda
Mediana
Moda
Mediana
Mediana
Mdia
Mdia
Mdia
Exerccios:
1. Para os seguintes conjuntos de dados, determine os valores da mdia aritmtica,
mdia geomtrica, mdia harmnica, mediana e moda.
a)
12
15
16
15
12
15
15
b)
c)
10
d)
38
38
70
92
22
17
14
26
15
15
16
16
11
19
12
17
16
20
16
14
12
16
b)
12
11
12
4. Joo possui 5 imveis localizados nesta cidade. Ele deseja saber qual o valor
mdio, por metro quadrado, das suas propriedades. Sabendo que imveis no centro
valem R$ 450,00/m 2 e imveis em bairros valem R$ 300,00/m 2 , calcule o valor
mdio por m 2 do seu capital.
Apartamento de 80 m 2 no centro
Pavilho de 450 m 2 no bairro
Casa de 280 m 2 no centro
Apartamento de 120 m 2 no bairro
Casa de 320 m 2 no bairro
27
Exemplo:
Pequena variabilidade
Grande variabilidade
Exemplo:
Duas mquinas esto sendo comparadas. A seguir est descrita a produo de cada uma
durante 5 dias.
Mdia
Produo
Mq 1
10
10
10
10
10
10
Mq 2
18
16
10
Voc acha que a programao da produo para as duas mquinas pode ser a mesma
durante 1 semana? Por qu?
6.1 Amplitude
Tambm conhecida como intervalo.
A amplitude de um grupo de dados , de modo geral, mais simples de calcular e de
entender. Consiste na diferena entre o maior e o menor valor, ou seja, entre os valores
extremos.
Amplitude = X max - X
mn
28
Exemplo:
1. Calcule a amplitude dos seguintes conjuntos de dados. Voc acha que a disperso
dos conjuntos igual?
a)
15
15
12
14
16
16
15
b)
16
6.2 Varincia
Calcula-se a varincia de uma amostra elevando-se as diferenas de cada um dos valores
em relao mdia, somando-se estas diferenas e dividindo-se por n-1.
2
x
(x
=
x)2
n 1
Exemplo:
Clculo da varincia do conjunto de dados 2,4,6,8, e 10.
( xi
x )2
xi
xi x
-4
16
-2
10
16
40
Somas
2
x
(x
=
x)2
n 1
40
= 10
5 1
29
(x
sx =
x)2
n 1
xi
n 1
2
i
Exemplo:
Clculo do desvio padro do conjunto de dados 20, 5, 10, 15 e 25.
Usando a frmula normal:
( xi
x )2
xi
xi x
20
15
25
15
-10
100
10
15
-5
25
15
15
25
15
10
100
250
Somas
sx =
(x
x)2
n 1
250
=
5 1
62,5 = 7,91
x
x
i
2
i
= 20 + 5 + 10 + 15 + 25 = 75
= 202 + 52 + 102 + 152 + 252 = 1375
sx =
x
x
n 1
2
i
n
=
1375 75
5 1
5 =
250
= 7,91
5 1
O coeficiente de variao dado pelo quociente entre o desvio padro e a mdia dos
dados.
Prof. Cntia Paese Giacomello
30
CV =
Desvio padro S x
=
Mdia
X
Exemplo:
Entre os conjuntos de dados a seguir apresentados, qual apresenta maior variabilidade?
Conjunto A
Conjunto B
12
3
25
4
16
5
23
2
Soluo:
CVA =
CVB =
Exerccios:
1. O desvio padro pode ser zero? Explique. Pode ser negativo? Explique.
R$ 9000
R$ 4580
R$ 5600
R$ 7680
R$ 4800
R$ 10640
27,5
25,5
26,0
27,0
23,4
25,1
26,2
26,8
31
negativo indica uma distribuio com uma ponta assimtrica que se estende em direo a
valores mais negativos. No excel a funo correspondente distoro .
n
xi x
Assimetria =
(n 1)(n 2)
s
Assimtrica positiva
Simtrica
Assimtrica negativa
a>0
a=0
a<0
n(n + 1)
3(n 1) 2
x i x
Curtose =
s (n 2)(n 3)
(n 1)(n 2)(n 3)
Leptocrtica
Mesocrtica
Platicrtica
c>0
c=0
c<0
32
8 I nt r odu o p robabilid ad e
As origens da probabilidade remontam ao sculo XVI. As aplicaes iniciais referiam-se
quase todas a jogos de azar. Os jogadores aplicavam o conhecimento da teoria das
probabilidades para planejar estratgias de apostas.
Atualmente a utilizao das probabilidades ultrapassou de muito o mbito desses jogos.
Hoje os governos, as empresas, as organizaes profissionais incorporam a teoria das
probabilidades em seus processos dirios de deliberaes.
Independentemente de qual seja a aplicao em particular, a utilizao das probabilidades
indica que existe um elemento de acaso, ou de incerteza, quanto ocorrncia ou no de
um evento futuro. Assim que, em muitos casos, pode ser virtualmente impossvel afirmar
por antecipao o que ocorrer, mas possvel dizer o que pode ocorrer.
H numerosos exemplos de tais situaes no campo dos negcios e do governo. A previso
da procura de um novo produto, o clculo dos custos da produo, a previso das safras,
a compra de aplices de seguros, a avaliao da reduo de impostos sobre a inflao. As
probabilidades so teis pois ajudam a desenvolver estratgias.
O ponto central em todas as situaes a possibilidade de quantificar quo provvel
determinado evento.
As probabilidades so utilizadas para exprimir a chance de ocorrncia de determinado
evento. O estudo das probabilidades importante pois elas so a base para o estudo
estatstico.
resultados possveis
3. Se
33
Lana-se uma moeda at que ocorra uma cara e conta-se ento o nmero de
lanamentos necessrios.
8.3 Eventos
Chama-se de evento qualquer subconjunto do espao amostral S de um experimento
aleatrio, ou seja, qualquer resultado do espao amostral.
n(A) o nmero de resultados associados ao evento A.
34
P( A ) =
Exemplo:
Experimento: lanar um dado e observar a face superior
Espao amostral: S={1,2,3,4,5,6}
n(S)=6
n(A)=3
OBS: existe uma pequena diferena entre probabilidade e chance de um evento. A probabilidade
relaciona o nmero de resultados de A com o nmero de resultados total, enquanto que chance
compara o nmero de resultados de A com o nmero de resultados de outro evento (B ou C).
Em uma urna com 5 bolas brancas, 3 vermelhas e 2 azuis,
A probabilidade de selecionar uma bola branca P(branca)=5/10=0,5 ou 50%
E a chance de selecionar uma bola branca 5:5, que semelhante a 1:1, o que significa que existe a
mesma chance de retirar uma bola branca ou uma bola de outra cor.
Exerccios:
1. Escreva o espao amostral no lanamento de um dado. Ache a probabilidade
associada a cada evento.
35
Evento
Cara
P(Evento)
Face 3
6 vermelho
Valete de ouros
36
6. Um motorista tem uma marca num de seus pneus, e 20% do pneu visvel. Ao
parar, qual a probabilidade da marca ficar na parte visvel?
7. Um motor tem 6 velas, e uma est defeituosa, devendo ser substituda. Duas esto
em posio de difcil acesso, o que torna difcil a substituio.
a) Qual a probabilidade de a vela defeituosa estar em posio difcil?
b) Qual a de no estar em posio difcil?
9. Uma pesquisa de trfego levada a efeito das 5 s 6 horas da manh num trecho de
uma rodovia federal revelou que, de 200 carros que pararam para uma verificao
rotineira de segurana, 25 tinham pneus em ms condies. Estime a probabilidade
de um carro que pare naquele trecho ter seus pneus em boas condies
37
Regra da adio:
A regra da adio leva em conta a ocorrncia do evento A ou do evento B ou de ambos os
eventos e denotada por P(AB).
OBS: Para apresentar os eventos utilizam-se os Diagramas de Venn [apresentados por John Venn
(1834-1923)], que representam os espaos amostrais e os eventos como crculos, quadrados, ou outra
figura geomtrica conveniente.
Exerccios:
1. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso.
Qual a probabilidade do nmero ser par ou maior que 4?
2. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso.
Qual a probabilidade do nmero ser um nmero primo ou maior que 8?
38
Regra da multiplicao
Considerando-se dois eventos A e B de um mesmo espao amostral, a probabilidade de A e
B ocorrerem P(AB) dada por:
Exemplo 1: Deve-se inspecionar uma grande caixa de peas. Os registros indicam que 2%
das caixas acusam contedo inferior ao estipulado. Escolhidas duas caixas aleatoriamente,
qual a probabilidade de ambas acusarem contedo inferior, admitindo-se que a remessa
inspecionada semelhante as anteriores (isto , 2% de deficientes)?
P(ambas deficientes)=P(deficiente)P(deficiente)
=0,02 x 0,02
=0,0004 ou seja, 0,04% de probabilidade das caixas serem defeituosas.
Exemplo 2: Suponha que 20 canetas esto expostas numa papelaria. Seis so vermelhas e
14 azuis. Do conjunto de 20, iremos escolher 2 canetas aleatoriamente. Qual a
probabilidade de que as duas canetas selecionadas sejam vermelhas?
Neste caso os eventos no so independentes, pois a cor da primeira caneta
selecionada vai determinar a probabilidade da segunda caneta ser vermelha.
Seja
5 6 30
=
= 0,0789
19 20 380
39
Regras de probabilidade
P(A ou B), Para eventos no mutuamente excludentes:
P(A ou B ou ambos) = P(A) + P(B) P(A e B)
para eventos mutuamente excludentes:
P(A ou B) = P(A) + P(B)
para eventos independentes:
P(A e B),
Preta
Totais
No s
24
24
48
Totais
26
26
52
Exerccios
1. Uma urna contm 6 bolas vermelhas e 4 azuis. Em duas bolas consecutivas, sem
reposio, determine a probabilidade de retirar a primeira azul e a segunda
vermelha.
2. Uma urna contm 6 bolas vermelhas e 4 azuis. Em duas bolas consecutivas, com
reposio, determine a probabilidade de retirar a primeira azul e a segunda
vermelha.
3. Em um lote de 12 peas, quatro so defeituosas. Retira-se uma pea e inspecionase. Qual a probabilidade:
a. Da pea ser defeituosa
b. Dela no ser defeituosa
40
4. Uma loja dispe de pneus novos e recapados. Entre 100 pneus, sabe-se que 30 so
recapados.
a. Se um cliente levar um pneu, qual a probabilidade de que ele seja recapado?
b. Se um cliente levar dois pneus, qual a probabilidade de que ambos sejam
recapados?
6. Uma urna contm 50 bolas numeradas de 1 a 50. Sero selecionadas 5 bolas, sem
reposio. Qual a probabilidade de que uma pessoa que tenha feito um jogo
anotando os 5 nmero acerte todos?
41
CC bancrio
Totais
Sim
No
Sim
60
60
120
No
15
65
80
Totais
75
125
200
f.
42
9 Distribuies de probabilidade
O histograma usado para apresentar
observaes extradas de uma populao)
dados
amostrais
(Amostra=conjunto
de
Por exemplo, 50 valores de satisfao dos clientes so interpretados como uma amostra
da satisfao de todos os clientes.
O uso de mtodos estatsticos permite que se analise essa amostra e se tire alguma
concluso sobre a satisfao dos clientes.
Uma distribuio de probabilidade um modelo matemtico que relaciona um certo valor
da varivel em estudo com a sua probabilidade de ocorrncia.
assuma um valor
Relembrando: uma varivel aleatria uma funo com valores numricos, cujos
valores so determinados por fatores de chance.
Uma varivel aleatria considerada discreta se toma valores que podem ser
contados.
Uma varivel aleatria considerada contnua quando pode tomar qualquer valor
em determinado intervalo.
43
Exemplo:
Distribuio de probabilidade para a varivel aleatria nmero de caras em duas jogadas
de uma moeda.
Nmero de
caras
Valor da V.A.
Prob. do
resultado
Nmero de
caras
Valor da V.A
Prob. do
resultado
Cara
x =
Cara Coroa
x =
1
+ =
Coroa Cara
x =
Coroa Coroa
x =
Resultado
Cara
Soma = 1
Soma = 1
O valor esperado, ou esperana matemtica, de uma varivel aleatria E(x), que consiste
no valor esperado para ela, ou seja, o valor mdio da varivel.
n
E( x ) =
px
i
se X v.a. discreta
i =1
ou
E( X) =
x. f(x) dx
se X v.a. contnua
Var ( X)
44
Exemplo: um investidor julga que tem 0,4 de probabilidade de ganhar $ 25.000 e 0,6 de
perder $ 15.000. Seu ganho esperado de:
E(X) = 0,4 (25.000) + 0,6 (-15.000) = $ 1.000.
E a varincia Var(X)=E(X 2 )-[E(X)] 2
= E(X 2 ) 1.000 2
=(0,4.25.000 2 + 0,6.(-15.000) 2 )-1.000 2
=(0,4 x 625.000.000 + 0,6 x 225.000.000)-1.000 2
= 250.000.000+ 135.000.000 1.000 2
= 385.000.000 1.000.000
= 384.000.000
Desvio padro = $ 19.595,92
Exerccios:
1. O nmero de chamadas telefnicas recebidas por uma mesa e suas respectivas
probabilidades para um intervalo de 3 minutos so:
Nmero de chamadas
Total
Freqncia relativa
0,60
0,20
0,10
0,04
0,03
0,03
1,00
Em mdia, quantas chamadas podem ser esperadas num intervalo de trs minutos?
Total
Freqncia relativa
0,02
0,07
0,09
0,12
0,20
0,20
0,18
0,10
0,01
0,01
1,00
45
Distribuio de Bernoulli
A distribuio de Bernoulli consiste em uma distribuio adequada varivel aleatria de
Bernoulli, que por sua vez uma v.a. que assume apenas os valores 0 e 1, com funo de
probabilidade tal que:
P(0) = P(X=0) = 1- p
P(1) = P(X=1) = p
Distribuio Binomial
Seja um processo composto de uma seqncia de observaes independentes, onde o
resultado de cada observao pode ser um sucesso ou uma falha.
Se a probabilidade de sucesso constante e igual a p, a distribuio do nmero de
sucessos seguir o modelo Binomial.
A distribuio Binomial usada com freqncia no controle de qualidade. o modelo
apropriado quando a amostragem feita sobre uma populao infinita ou muito grande.
46
n
P ( x ) = p x (1 p ) n x
x
onde
n
n!
=
x ! ( n x )!
x
n
representa o nmero de combinaes de n objetos tomados x de cada vez
x
P(X) = probabilidade de X sucessos uma vez que n e p so conhecidos
n = tamanho da amostra
p = probabilidade de sucesso
= np
e a varincia
x
n
Exemplo:
Um processo industrial opera com mdia de 1% de defeituosos. Baseado em amostras de
100 unidades, calcule as probabilidades de uma amostra apresentar 0 , 1 , 2 , 3 e 4
defeituosos. Plote a distribuio de probabilidade correspondente.
Como a varivel aleatria pode apresentar apenas duas possibilidades, ser boa ou
defeituosa, a distribuio que melhor se ajusta a distribuio binomial, com
parmetros p=0,01 e n=100.
Ento, a probabilidade de uma amostra de tamanho n = 100 apresentar 0
defeituosos
n
100
0 ,010 (1 0 ,01)100 0 = 0,366
P( x ) = p x (1 p)n x P(x=0) = P(0) =
x
0
P(x=1) = P(1) =
100 1
0,01 (1 0,01)1001 = 0,370
1
100
0,01 (1 0,01)
P(x=3) = P(3) =
3
3
100 3
= 0,061
100
47
0,4
P(x)
0,3
0,2
0,1
0
x=0
x=1
x=2
x=3
x=4
Exerccios:
1. Um processo opera segundo uma chance de falha de 2%. Coletando amostras de 25
unidades, qual a probabilidade de uma amostra selecionada apresentar 2
defeituosos ou menos.
Distribuio de Poisson
48
P( x ) =
onde
e x
onde x=0,1,2,....
x!
Exemplo:
Suponha que o nmero de defeitos no cordo de solda de uma carroceria siga uma
distribuio de Poisson com = 2.
Ento a probabilidade de uma carroceria apresentar mais de 3 defeitos ser:
P(X> 3) = 1 P(x 3) = 1-[ P(x=0) + P(x=1) + P(x=2) + P(x=3)]
Onde P( x ) =
e x
x!
P(0) =
e 2 2 0
= 0,135
0!
e 2 21
P(x=1) = P(1) =
= 0,271
1!
P(x=2) = P(2) = 0,271
Logo,
P(X> 3)
Exemplo 2:
Prof. Cntia Paese Giacomello
49
e x
P( x ) =
x!
e 4 45
P (5) =
= 0,1563 = 15,63%
5!
Exerccios:
1. O setor financeiro de uma loja de departamentos est tentando controlar o nmero
de erros cometidos na emisso das notas fiscais. Suponha que esses erros sigam o
modelo de Poisson com mdia = 0,03. Qual a probabilidade de uma nota
selecionada ao acaso conter 1 ou mais erros?
4. Dez por cento das ferramentas produzidas por um certo processo de fabricao
revelaram-se defeituosas. Determinar a probabilidade de, em uma amostra de 10
ferramentas escolhidas ao acaso, exatamente duas serem defeituosas mediante o
emprego da distribuio de Poisson.
50
Distribuio Normal
A Distribuio Normal essencialmente importante na estatstica por trs razes
principais:
1. Inmeros fenmenos contnuos parecem segu-la ou podem ser aproximados por
meio dela
2. Podemos utiliz-la para aproximar vrias distribuies de probabilidade discretas
3. Ela oferece a base para a inferncia estatstica clssica, devido sua afinidade
com o teorema do limite central
f ( x) =
onde:
exp
1 x
51
99,73%
95,44%
68,26%
-1 +1
-2
+2
-3
+3
Para simplificar a notao de uma v.a.c. com distribuio normal, com mdia e varincia
2
utiliza-se:
X~ N( , 2 )
A distribuio Normal acumulada obtida calculando a probabilidade de X ser menor que
um dado valor a :
a
P( x a) = F(a) =
f (x)dx
Essa integral no pode ser resolvida em forma fechada, mas a soluo est apresentada
em tabelas onde se entra com a varivel reduzida ou varivel padronizada Z e
encontra-se F(Z) ou vice-versa.
P( x a) = P Z
= F(Z )
52
Exemplo:
O peso de um produto uma caracterstica muito importante. Sabe-se que o peso segue
um modelo normal com mdia 1000 gramas e desvio padro 40 gramas. Se a especificao
tcnica estabelece que o peso deve ser maior que 950 gramas, qual a probabilidade de
que um pacote selecionado aleatoriamente satisfaa a especificao?
OBS: este esquema equivale
P(x>950) = P Z >
Tabelado
950 1000
= P(Z > 1,25) = 0,3944 + 0,5000 = 0,8944
40
X=950 =1000
=40
Z=-1,25 =0
=1
112 100
95 100
<Z<
10
10
P(95<x<112)= P
= P(-0,5<Z<1,2)
=0,1915+0,3849
Valores tabelados
=100
=10
Se forem feitas 4000 medies, aproximadamente 2305 estaro entre 95 e 112. (4000 x
57,64%)
53
Exerccios:
1. A resistncia trao do papel usado em sacolas de supermercado uma
caracterstica de qualidade importante. Sabe-se que essa resistncia segue um
modelo Normal com mdia 40 psi e desvio padro 2 psi. Se a especificao
estabelece que a resistncia deve ser maior que 35 psi, qual a probabilidade que
uma sacola produzida com este material satisfaa a especificao?
4. A sada de uma bateria segue o modelo Normal com mdia 12,15 V e desvio padro
0,2 V.
0,5 V.
54
5. A vida til de lavadora de pratos automticas de 1,5 anos, com desvio padro 0,3
anos. Se os defeitos se distribuem normalmente, qual a probabilidade de uma
lavadora necessitar conserto antes de expirar o perodo de 1 ano de garantia?
7. Sabe-se que o contedo de uma lata de cerveja 350 ml e que tem distribuio
aproximadamente normal com mdia 350 ml e desvio padro 10 ml.
a. Que % de latas tem menos que 345 ml de contedo?
b. Que % de latas tem mais que 360 ml de contedo?
8. Uma fbrica de pneus fez um teste para medir o desgaste de pneus e verificou que
ele seguia o comportamento de uma curva normal com mdia 48.000 km e desvio
padro de 2.000 km. Calcule a probabilidade de um pneu escolhido ao acaso:
a. Dure mais que 47.000 km?
b. Dure entre 45.000 e 51.000 km?
c. At que quilometragem duram 90% dos pneus?
55
1 0 T e o r i a e l e m e n t a r d a a m o s t r a g em
A teoria da amostragem o estudo das relaes existentes entre uma populao e as
amostras dela extradas. muito utilizada para a estimao das grandezas desconhecidas
da populao ( parmetros ) atravs de conhecimento das grandezas correspondentes nas
amostras ( estatsticas amostrais ).
A teoria da amostragem tambm til para determinar se as diferenas observadas entre
duas amostras so devidas a uma variao casual ou so verdadeiramente significativas.
Por exemplo: queremos testar se os tempos de processamento da matria prima de dois
sistemas de produo so diferentes ou no. A resposta a esta questo implica o uso de
testes de hiptese, que ser visto mais adiante.
Denomina-se inferncia estatstica a inferncia de parmetros (da populao) com base
nos resultados obtidos na amostra.
Para que as concluses sejam vlidas, necessrio que a amostra selecionada seja
representativa da populao. Para isso podem ser utilizados os mtodos de amostragem
probabilsticos apresentados no captulo 1: aleatria, sistemtica, estratificada ou por
conglomerados. O mtodo mais utilizado o por amostragem aleatria.
56
Sejam:
x = mdia da populao =
x =
x =
Nn
N 1
x =
x =
A frmula do desvio padro nos diz que a quantidade de disperso na distribuio amostral
depende de dois fatores:
-
a disperso da populao
e desvio padro
x,
57
teorema do limite central da teoria avanada de probabilidade, que mostra que a preciso
da aproximao melhora quando n cresce. Isto indicado, algumas vezes, dizendo-se que
a populao assintoticamente normal. No caso da populao ser normalmente
distribuda, a distribuio amostral das mdias tambm o ser, mesmo para pequenos
valores de n (n<30).
Teorema do limite central
1. Se a populao sob amostragem tem distribuio normal, a
distribuio das mdias amostrais tambm ser normal para
todos os tamanhos de amostra.
2. Se a populao bsica no normal, a distribuio de mdias
amostrais ser aproximadamente normal para grandes
amostras.
Exemplos:
Calcule o desvio padro da distribuio amostral de mdias onde o desvio padro da
distribuio populacional 2 e o tamanho da amostra 40.
x =
x
n
= 0,3162
40
Determine a mdia das distribuies de mdias amostrais, sendo que a mdia populacional
678.
x = x = 678
Um fabricante de baterias alega que seu artigo de primeira categoria tem uma vida
esperada (mdia) de 50 meses. Sabe-se que o desvio padro correspondente de 4
meses. Que percentagem de amostras de 36 observaes acusar vida mdia no intervalo
de 1 ms em torno de 50 meses, admitindo ser de 50 meses a verdadeira vida mdia das
baterias?
Sabemos que, como n>30, a distribuio das mdias amostrais ser
aproximadamente normal com mdia igual mdia populacional e desvio padro
igual ao desvio padro populacional dividido pela raiz quadrada do tamanho da
Prof. Cntia Paese Giacomello
58
amostra. Alm disso vamos pressupor populao infinita, pois a produo de baterias
no termina (teoricamente!)
???
49
50
Meses
51
x =
x
n
4
36
xx
49 50
= 1,5
0,67
51 50
= +1,5
0,67
59
p = proporo populacional
p(1 p)
n
p =
Exemplos:
Determine a mdia da distribuio de propores amostrais, quando a proporo na
populao 72,3%
p =p=72,3%
p =
p(1 p)
=
n
0,6(1 0,6)
= 0,049
100
Verificou-se que 2% das ferramentas produzidas por uma certa mquina so defeituosas.
Qual a probabilidade de que, em uma remessa de 400 dessas ferramentas, 3% ou mais
revelarem-se defeituosas?
p =p=0,02
ep =
p(1 p)
=
n
0,02 * 0,98
= 0,007
400
0,03 0,02
) = P(z > 1,43) = 0,07636 = 7,636%
0,007
60
Exerccios:
1. Determine a mdia da distribuio das propores amostrais quando a proporo na
populao ....
a. 30%
b. 99%
c. 54%
3. Certas vlvulas fabricadas por uma companhia tm vida mdia de 800 horas e
desvio padro de 60 horas. Determinar a probabilidade de uma amostra aleatria
de 16 vlvulas, retiradas do grupo, ter vida mdia a) entre 700 e 810 horas;
b)inferior a 785 horas; c) superior a 820 horas; d) entre 770 e 830 horas.
4. Um fabricante faz a remessa de 1000 lotes de 100 lmpadas eltricas cada um. Se
5% das lmpadas so normalmente defeituosas, em quantos lotes pode-se esperar
que existam; a) menos de 90 lmpadas boas; b) 98 ou mais lmpadas boas
61
11 Estimao
A estimao o processo que consiste em utilizar dados amostrais para estimar
parmetros populacionais.
As estatsticas amostrais so utilizadas como estimadores de parmetros populacionais.
Assim, uma mdia amostral usada como estimativa da mdia populacional, a proporo
de defeituosos de uma caixa utilizada para estimar a proporo de defeituosos na
produo toda, etc.
Tais estimativas chamam-se estimativas pontuais, porque originam apenas uma nica
estimativa do parmetro. Em virtude da variabilidade amostral, usual incluir uma
estimativa intervalar para acompanhar a estimativa pontual. Esta nova estimativa
proporciona um intervalo, ou mbito, de possveis valores do parmetro populacional.
Exemplos:
Parmetro
populacional
Tipo de estimativa
Pontual
Intervalar
Mdia
Proporo
Desvio padro
62
Populao
Infinita
Finita
Estimativa de mdias
Pontual
Intervalar x conhecido
x desconhecido
xz
xt
x
n
sx
n
xz
xt
sx
Nn
N 1
Nn
N 1
Intervalar
p =
pz
x
n
p(1 p)
n
p =
pz
x
n
p(1 p) N n
n
N 1
Onde:
z representa o valor tabelado da distribuio Normal, com nvel de confiana .
t representa o valor tabelado da distribuio t de Student, com nvel de confiana e GL
graus de liberdade1
N o tamanho da populao
n o tamanho da amostra
63
Exemplo:
Intervalo de confiana para a mdia quando se conhece a varincia de populao x
Seja uma amostra de tamanho 36 de uma populao infinita, sabe-se que x =3 e x =24,2
Confiana
desejada
Z
(tabelado)
90%
1,65
xz
95%
1,96
xz
99%
2,58
xz
Frmula
Clculo
24,2 1,65
24,2 1,96
24,2 2,58
3
36
3
36
3
36
Intervalo
24,2 0,825
23,375 a 25,025
24,2 0,980
23,220 a 25,180
24,2 1,290
23,110 a 25,690
Tamanho da amostra
Uma das perguntas mais freqentes em estatstica : Qual o tamanho da amostra que
devemos tomar?
O tamanho da amostra depender do grau de confiana desejado (z), da quantidade de
disperso entre os valores individuais ( x ), e de certa quantidade especfica de erro
tolervel (e).
O tamanho da amostra que voc afinal selecionar depender de
seu oramento, da importncia econmica das decises e da
variabilidade na populao. Desses trs problemas, dois so de
ordem gerencial, cabendo a voc a deciso; apenas o terceiro
(variabilidade) est fora do seu controle .(Brenda Landy, citada no
livro Pesquisa de Marketing Naresh Malhotra. - 2001)
A frmula do erro pode ser resolvida em relao a n. Assim, para o caso de estimao de
mdias, tem-se:
e=z
x
n
n=z
n = z x
e
p(1 p)
e=z
n
p(1 p)
e = z
n=
z 2p(1 - p)
e2
64
Que tamanho de amostra ser necessrio para produzir um intervalo de 90% de confiana
para a verdadeira mdia da populao, com erro de 1,0 em qualquer dos sentidos, se o
desvio padro da populao 10?
Sabemos que x =10 e e=1 e queremos um intervalo 90% de confiana para a
mdia, o que implica utilizar um valor de z=1,65.
n = z x
e
10
n=
z 2p(1 - p)
e2
n=
Exerccios:
1. Os dados a seguir representam a temperatura coletada aleatoriamente em 15
cidades do estado. Determine o intervalo de confiana 90% para a temperatura
mdia. No dispomos da varincia populacional, mas sabemos que a populao
infinita. Dispomos apenas das seguintes informaes.
23
40
30
21
34
20
38
26
23
38
33
32
24
21
24
65
66
67
12 Testes de h ipteses
Os testes de hipteses so tambm conhecidos como testes de significncia.
A finalidade dos testes de hipteses avaliar afirmaes sobre os valores de parmetros
populacionais.
Os testes de hipteses e a estimao so dois ramos principais da inferncia estatstica.
Enquanto o objetivo da estimao estimar algum parmetro populacional, o objetivo dos
testes de hipteses decidir se determinada afirmao sobre um parmetro populacional
verdadeira. Por exemplo, podemos querer determinar se so verdadeiras as afirmaes:
-
Exemplo: O estudo de uma amostra de tamanho 55 peas indicou que o dimetro mdio
de 27,5 mm. Ento:
H 0 : o dimetro mdio da populao (de peas) 27,5 mm
H 1 : o dimetro mdio da populao (de peas) diferente de 27,5 mm
68
Se H 0
Ao
Verdadeira
Falsa
Aceitar H 0
Deciso correta
Erro tipo II ( )
Rejeitar H 0
Erro tipo I ( )
Deciso correta
Os testes de hiptese podem ser unilaterais ou bilaterais. Nos testes unilaterais a hiptese
alternativa H 1 do tipo >33 ou <33, por exemplo. Nos testes bilaterais a hiptese
alternativa do tipo 33. A hiptese nula permanece igual nos dois casos. A rea de
rejeio dividida quando o teste bilateral.
H 1 : <33
H 1 : 33
/2
Rejeitar H 0
Rejeitar
H0
/2
Rejeitar
H0
H 1 : >33
Rejeitar H 0
Exerccios
1. Para cada um dos seguintes casos, trace uma curva normal, indicando a rea de
rejeio na figura.
a) H 0 : =10, H 1 : 10, =0,02
b) H 0 : =120, H 1 : 120, =0,05
c) H 0 : =2000, H 1 : 2000, =0,01
d) H 0 : =2000, H 1 : >2000, =0,01
e) H 0 : =2000, H 1 : < 2000, =0,01
69
x conhecido
Quando se conhece o desvio padro da populao, a distribuio amostral adequada a
distribuio normal. Se a populao normal, a distribuio amostral ser normal para
todos os tamanhos de amostra. Se a populao no normal, ou se sua forma
desconhecida, pode-se usar um teste de uma amostra s para tamanhos de amostras
superiores a 30 observaes. Assim, pequenas amostras de populao no normais no
podem ser tratadas por este processo.
z teste =
x o
n
distribuio normal).
70
Exemplo:
Uma mquina de usinagem deveria produzir entalhes com 0,85 mm de profundidade. O
engenheiro desconfia que os entalhes que esto sendo produzidos so diferentes que o
especificado.
Uma amostra de 8 valores foi coletada e indicou X = 0,847 . Sabendo que o desvio padro
=0,010, teste a hiptese do engenheiro usando um nvel de significncia =0,05.
H o : = 0,850
H1 : 0,850
Z teste =
0,847 0,850
0,010 / 8
= 0,85
x desconhecido
Quando no se conhece o desvio padro da populao, deve-se estim-lo a partir dos
dados amostrais usando o desvio padro amostral. Quando isso ocorre (na maioria das
situaes reais x desconhecido), a distribuio t a distribuio amostral adequada.
Suponha que X uma varivel aleatria Normal com mdia e varincia 2
desconhecidas. Para testar a hiptese de que a mdia igual a um valor especificado o ,
formulamos:
Ho : = 0
H1 : o
Esse problema idntico quele da seo anterior, exceto que agora a varincia
desconhecida.
t teste =
x o
sx
n
E a hiptese nula H 0 rejeitada se |t teste |>t /2 , onde t /2, n-1 um valor limite da
distribuio de Student tal que a probabilidade de se obter valores externos a t /2 .
71
x conhecido
Quando h duas populaes com mdias desconhecidas, digamos a e b e desvios
padres conhecidos, a e b , o teste para verificar a hiptese que as mdias sejam iguais
o seguinte:
Ho : 1 = 2
H1 : 1 2
Z teste =
X1 X 2
12
n1
22
n2
x desconhecido
Similarmente, quando , a e b , no so conhecidos, o teste para verificar a hiptese que
as mdias sejam iguais :
t teste =
X1 X 2
S 2x1 S 2x 2
+
n1
n2
n1+n2-2
72
z teste =
x p
0
n
p0 (1 p0 ) / n
e deve ser comparada com o valor crtico de Z (retirado de uma tabela da distribuio
normal)
Exemplo:
Um fabricante afirma que uma remessa de pregos contm menos de 1% de defeituosos.
Uma amostra aleatria de 200 pregos acusa 4 defeituosos. Teste a afirmao ao nvel
0,01.
H 0 : p = 1%
H 1 : p > 1% pois desejamos evitar a aceitao de uma remessa com mais de
1% de defeituosos, mas nada h contra aceitar o fato da remessa apresentar
qualidade superior acordada.
z teste =
x p
0
n
= z teste =
p0 (1 p0 ) / n
0,01
200
= 1,42
0,01(1 0,01) / 200
73
Este teste baseia-se na distribuio qui-quadrado, onde o valor calculado deve ser
comparado com o valor tabelado. A deciso de aceitar ou rejeitar H 0 depender da
comparao deste valor com o valor tabelado da distribuio qui-quadrado.
Por exemplo, tem-se a distribuio de peas produzidas por turno e se essas peas so
boas ou apresentam algum tipo de defeito. No turno da manh foram produzidas 967
peas, onde 183 apresentaram algum tipo de defeito.
Turno de produo
Total
Manh
Tarde
Noite
183
30
11
224
Peas boas
784
264
308
1356
Total
967
294
319
1580
Frequncia _ Esperada =
Turno de produo
Total
Manh
Tarde
Noite
137,1
41,7
45,2
224
Peas boas
829,9
252,3
273,8
1356
967
294
319
1580
Total
Freq _ esperada =
224 x 967
= 137,1
1580
74
2 =
(O E) 2
E
Se o valor obtido for maior que o valor crtico obtido na tabela 2 ento diz-se que as
variveis NO so independentes. Se o valor encontrado for menor, ento diz-se que as
variveis so independentes.
O valor dos GRAUS DE LIBERDADE obtido atravs do clculo:
graus de liberdade = (colunas-1)(linhas-1)
No exemplo apresentado:
Tem-se valor calculado > valor tabelado ento diz-se que as variveis NO so
independentes. OU SEJA, a proporo de peas boas produzidas depende do turno de
trabalho. A proporo de peas boas no turno da manh 81%, na tarde 90% e na noite
97%.
Exerccios:
1. Um fornecedor apresenta uma caixa, e afirma que o peso mdio desta caixa de
368 gramas. De experincias anteriores sabe-se que o desvio padro da populao
vale 15 g e que os valores se comportam segundo a distribuio Normal. Para
verificar se a afirmao verdadeira, verifica-se uma amostra de 25 caixas, pesa-se
e calcula-se o peso mdio da amostra, achando 372,5 g. Qual a concluso a
respeito da afirmao do fornecedor, ao nvel de significncia 0,01?
2. Uma agncia de empregos alega que os candidatos diretoria por ela colocados
nos ltimos seis meses tm salrios de R$ 9000, em mdia. Uma agncia
governamental extraiu uma amostra aleatria daquele grupo, encontrando salrios
mdios de R$ 8000, com desvio padro de R$ 1000, com base em 50 empregados.
Teste a afirmao da agncia, contra a alternativa, de que o salrio mdio
inferior a R$ 9000, ao nvel de significncia 0,05.
75
76
Comisso
207
219
228
225
241
230
224
261
254
228
273
234
285
225
237
232
277
245
7. No caso judicial EUA versus Cidade de Chicago, foram postas em dvida as prticas
honestas de emprego. Um grupo minoritrio (A) e um grupo majoritrio (B) fizeram
o exame para capito do corpo de bombeiros, com os seguintes resultados:
Grupo A
Grupo B
Aprovados
10
417
Reprovados
14
145
Estagirios
5
25
Treinees
4
26
Tcnicos
20
10
Gerentes
27
3
77
10. A tabela abaixo apresenta dados relativos ao time vencedor em diferentes esportes.
Com o nvel de 0,05 de significncia, teste a afirmao de que as vitrias
casa/visitante so independentes do esporte.
O time da casa ganha
O time visitante ganha
Basquete
127
71
Beisebol
53
47
Hockey
50
43
Futebol
57
42
78
H situaes onde se deseja comparar vrias mdias, cada uma oriunda de um grupo
diferente. Esses grupos, tambm chamados tratamentos, poderiam ser 5 mquinas de
corte, ou 4 presses de operao, ou 4 layouts , 5 planos econmicos do governo, taxas
de cmbio em 3 diferentes pases, resultados da implantao de um novo sistema em duas
filiais, etc.
Exemplo:
Para verificar se existe diferena significativa entre os salrios mdios dos economistas da
Regio Sul, o sindicato da classe resolveu analisar os dados de algumas amostras. Assim
foram selecionados aleatoriamente 5 economistas de cada estado.
Econ.1
Econ.2
Econ.3
Econ.4
Econ.5
370
420
280
340
410
Santa Catarina
280
350
430
290
405
Paran
325
400
295
350
380
Exemplo:
Uma classe com 24 crianas foi dividida em trs grupos. Cada grupo de crianas aprendeu
a ler de acordo com um mtodo (trs mtodos diferentes). Aps 3 meses as crianas
foram testadas, utilizando uma escala de 1 a 10. Os resultados foram
Mtodo A
Mtodo B
Mtodo C
5
4
0
5
3
4
5
7
4
5
10
10
79
Tratamento
1
2
:
:
:
k
Observaes
Y11 , Y12 ... Y1n1
Y21 , Y22 ... Y2n2
:
:
:
Yk1 , Yk2 ... Yknk
Yij = + i + ij ;
i = 1,....., k
j = 1, ..., ni
Onde Y ij
o efeito do tratamento i;
ij
o erro aleatrio. (OBS: Para fins de testes de hiptese, supomos que o
erro aleatrio ij segue um modelo normal com mdia 0 e varincia 2
aproximadamente igual para todos os tratamentos)
Nosso objetivo ser testar a hiptese referente ao efeito dos tratamentos e estimar esses
efeitos, ou seja, verificar se existe diferena significativa entre os resultados apresentados
por cada grupo.
80
No modelo a nveis fixos, os efeitos dos tratamentos so definidos como desvios da mdia
geral, tais que:
H 0 : 1 = 2 = ..... = k
H 1 : i j
Na
para alguns i, j
economistas tm o mesmo salrio nos trs estados (e as diferenas entre os seus salrios
so devidas ao acaso) ou os trs mtodos de ensino so equivalentes.
A
H 1 (hiptese alternativa) indica que pelo menos uma das mdias difere, ou seja,
existem pelo menos dois estados com salrios diferentes entre si ou pelo menos dois
mtodos de ensino diferem.
Fonte de variao
onde
SQ
GDL
MQ
Teste F
Entre grupos
SQG
k-1
MQG
MQG/MQR
Dentro de grupos
SQR
N-k
MQR
Total
SQT
N-1
81
(Yij Y.. ) = (Y i.
) (
Y.. + Yij Y i .
(1)
onde:
(Yij Y i. )
ij
2
(2)
F=
MQG
MQR
82
O valor resultante do teste F deve ser comparado com uma tabela de valores F, que indica
o valor mximo da estatstica no caso de H o ser verdadeira, a um determinado nvel de
confiana.
Como o valor tabelado de F contnuo e depende da combinao dos graus de liberdade
do numerador e do denominador, usual apresentar seus valores apenas para os nveis de
confiana 0,05 e 0,01. Os graus de liberdade para a determinao do valor F so os
mesmos apresentados na tabela da ANOVA.
Os valores constantes na tabela F so valores crticos: apresentam a linha divisria entre a
variao aleatria e a no aleatria. Ao fazer a anlise de varincia, utilizam-se as duas
estimativas amostrais da varincia para calcular uma razo F. Compara-se ento o nmero
resultante com o nmero tabelado. Se o valor calculado maior que o valor tabelado,
rejeita-se a hiptese nula. Se o valor calculado menor que o valor tabelado, a hiptese
nula no pode ser rejeitada.
Distribuio F
Concluir pelo
acaso
Aceitar Ho
Concluir pelo
no-acaso
Rejeitar Ho
0
Valor tabelado
TC = ( T .. )2 N
SQT = ( Yij2 ) TC
SQG = ( Ti 2. ni ) TC
SQR = ( Yij2 ) ( Ti .2 ni ) = SQT SQG
onde
TC o termo de correo
T.. a soma de todas as observaes
Ti.
83
Mtodo A
Mtodo B
Mtodo C
0
5
3
4
5
7
4
5
10
10
TC = 116 2 / 24 = 560,67
SQT = (5 2 + 0 2 + 3 2 + ... + 4 2 + 9 2 ) 560,67 = 738 560,67 = 177,33
Fonte de variao
SQ
GDL
MQ
Teste F
Entre grupos
17,33
8,67
1,14
Dentro de grupos
160,00
21
7,62
Total
177,33
23
84
Utilizando o Excel
Clique em Ferramentas e depois em Anlise de Dados. (OBS: Se no seu
computador no aparecer Anlise de Dados porque este suplemento no est
ativado. V em Ferramentas, depois Suplementos. Disponibilize Anlise de
Dados e Anlise de Dados VBA.)
Mtodo A
Mtodo B
Mtodo C
5
4
0
5
3
4
5
7
4
5
10
10
ou
85
Contagem Soma
8
32
8
48
8
36
Varincia
5,714
7,429
9,714
Tabelado
Calculado
ANOVA
Fonte da variao
Entre grupos
Dentro dos grupos
SQ
17,33
160,00
gl
2
21
Total
177,33
23
Mdia
4,0
6,0
4,5
MQ
8,67
7,62
F
1,14
valor-P
0,340
F crtico
3,47
86
Exerccios:
1. Suponha que o valor crtico de F na anlise de varincia seja 1,99 ao nvel de 0,05.
Com base na figura: a) Como voc interpretaria uma estatstica de teste maior que
1,99? b) Como voc interpretaria uma estatstica de teste menor que 1,99?
Distribuio F
0,05
0
1,99
2. Duas turmas de pilotos de corrida de automveis esto sendo treinadas para uma
grande corrida no domingo. Cada turma faz cinco provas de troca dos quatro pneus
num carro. As turmas so equivalentes ou uma delas superior, ao nvel de
significncia 0,05? Complete a tabela da ANOVA e conclua a respeito.
Fonte de variao
SQ
GDL
MQ
Teste F
Entre grupos
Dentro de grupos
0,12
Total
0,22
A
B
C
D
E
Prof. Cntia Paese Giacomello
20
17
23
15
21
12
14
16
17
14
15
12
18
20
17
19
15
14
12
18
87
K
L
M
N
33
32
31
29
38
40
31
34
36
42
37
32
40
38
35
30
31
30
33
33
35
34
30
31
5. Um professor deseja testar trs mtodos diferentes de ensino I, II e III. Para isso so
escolhidos aleatoriamente trs grupos de cinco estudantes, e cada grupo instrudo
por um mtodo diferente. dada a mesma prova a todos os estudantes e os graus
obtidos constam na tabela. Determinar se existe diferena entre os mtodos de ensino
ao nvel de significncia 0,01.
I
II
III
75
81
73
62
85
79
71
68
60
58
92
75
73
90
81
6. A tabela apresenta os dados sobre a ferrugem acumulada sobre o ferro, que foi tratado
quimicamente com os produtos A, B ou C. Determinar se existe diferena significativa
nos tratamentos ao nvel de 0,05.
A
B
C
3
4
6
5
2
4
4
3
5
4
3
5
Alta
Mdia
Baixa
110
95
108
105
103
112
118
119
104
90
104
93
88
20
30
40
50
9.
mg
mg
mg
mg
46
48
49
52
46
48
49
53
46
47
50
52
45
47
50
52
45
47
49
52
45
47
50
52
46
47
50
53
46
48
49
53
Uma empresa deseja estudar trs tipos de enxerto para ver se todos apresentam o
mesmo crescimento anual. O que se pode concluir a respeito? (use nvel de
significncia 0,05)
Enxerto 1
14,4
14,8
12,7
12,2
10,9
Enxerto 2
10,8
12,2
11,2
12,8
13,0
Enxerto 3
11,1
9,5
10,8
12,7
10,9
10. Os dados abaixo do a vida observada dos pneus de quatro caminhes distribuidores
de sorvete, conforme a posio. Supondo comparveis os caminhes e os motoristas,
poderemos afirmar que a durao mdia independente da posio do pneu no
veculo? (use nvel de significncia 0,01). Disponha os clculos numa tabela ANOVA.
Qual a importncia da comparabilidade dos motoristas e veculos?
Dianteiro direito
Dianteiro esquerdo
Traseiro direito
Traseiro esquerdo
17
25
22
26
19
27
21
24
20
18
19
30
24
22
26
28
89
14 Regresso e co rrelao
A anlise de regresso e de correlao compreende a anlise de dados amostrais para
saber se e como duas ou mais variveis esto relacionadas uma com a outra em uma
populao.
Exemplos:
Famlia
Renda
Gastos
Peso
Altura
Aluno
Notas 2 o
grau
Notas
faculdade
R$ 1550
R$ 1350
56
179
80
85
R$ 2000
R$ 1970
67
176
75
70
R$ 1000
R$ 550
89
180
95
95
58
170
60
65
45
130
70
80
...
n
R$ 770
R$ 690
Relao linear
positiva perfeita
Relao linear
negativa perfeita
X e y positivamente
correlacionados
X e y negativamente
correlacionados
X e y no
correlacionados
90
Regresso
14.1 Aplicaes da regresso
1. Estimar valores de uma varivel com base em valores conhecidos de outra varivel.
(Situaes em que as duas variveis medem aproximadamente a mesma situao, mas
uma delas relativamente dispendiosa ou difcil de lidar, enquanto a outra no.)
2. Explicar valores de uma varivel em termos da outra, isto , pode-se suspeitar
uma relao de causa e efeito.
de
OBS: A anlise da regresso apenas indica qual relacionamento matemtico pode existir, se
existir algum. Ou seja, nem a regresso, nem a correlao podem mostrar que uma varivel
tenda a causar certos valores de outra varivel, no garantido que exista relao de causa e
efeito.
... a correlao entre beber um copo de vinho por dia e a menor chance de infarto do
miocrdio um bom exemplo. Estudos recentes mostram que ela no se deve ao vinho e
ao lcool, mas sim ao betacaroteno, corante contido na uva. Para infelicidade de
muitos, tomar suco de uva d o mesmo resultado que beber vinho tinto. Jornal do
Brasil, 08/01/1999
y = a + bx
O mtodo mais usado para ajustar uma linha reta a um conjunto de pontos conhecido
como mtodo dos mnimos quadrados .
91
b=
14.3.2
n( xy ) ( x )( y )
a=
n( x 2 ) ( x ) 2
y b x
n
aleatrias) necessrio verificar a preciso das estimativas, conhecendo o erro padro das
estimativas.
SE =
14.3.3
( a y + b xy )
n2
Para criar intervalos de confiana com base nos estimadores utiliza-se a equao:
yint ervalo = y t S E
y obtido da equao.
Onde:
Exemplo:
Seja y o consumo pessoal mdio e x o PIB do Brasil em anos consecutivos. Encontre o
Intervalo de confiana 90% para a estimativa quando o PIB for 10,0.
x
7,0
7,3
7,8
8,6
8,1
8,3
8,2
8,6
9,0
9,6
9,1
y
10,1
10,6
11,3
12,4
11,9
11,9
11,5
12,1
13,1
14,1
14,6
x2
49,00
53,29
60,84
73,96
65,61
68,89
67,24
73,96
81,00
92,16
82,81
xy
70,70
77,38
88,14
106,64
96,39
98,77
94,30
104,06
117,90
135,36
132,86
x = 91,6
y = 133,6
x 2 = 768,76
xy = 1122,50
92
ideal que sempre se inicie o estudo de regresso com o grfico de disperso dos valores.
Consum o pessoal
E o clculo de
b=
7,5
PIB
8,5
9,5
10,5
a e b fica:
y = 1,744 + 1,668 x ,
= 1,668
ou
a=
SE =
93
Correlao
14.4 Objetivo da correlao
O objetivo da correlao determinar a fora do relacionamento entre duas observaes
emparelhadas, porque indica at que ponto os valores de uma varivel esto relacionados
com os valores da outra varivel.
O resultado da anlise de correlao chamado de coeficiente de correlao um valor
que quantifica o grau de correlao.
O mtodo mais comum de anlise de correlao envolve observaes em valores
numricos. Neste caso utiliza-se o coeficiente r de Pearson.
Seu sinal. Positivo indica correlao linear positiva, ou seja, medida que uma varivel
cresce, a outra cresce tambm. Sinal negativo indica correlao linear negativa, ou
seja, medida que uma varivel cresce, a outra decresce.
Sua grandeza indica quo prximos da reta esto os pontos individuais caso fosse
ajustada uma reta de regresso. O valor do coeficiente pode variar de 1 a 1.
-1
Correlao
negativa
forte
Inexistncia
de
correlao
Correlao
positiva
forte
r=
( x )( y )
xy n
( x )
( y)
x
y
n
n
2
0 r2 1
94
Exemplo:
Prosseguindo o exemplo anterior, sendo y o consumo pessoal mdio e x o PIB do Brasil em
anos consecutivos.
x
7,0
7,3
7,8
8,6
8,1
8,3
8,2
8,6
9,0
9,6
9,1
y
10,1
10,6
11,3
12,4
11,9
11,9
11,5
12,1
13,1
14,1
14,6
x2
49,00
53,29
60,84
73,96
65,61
68,89
67,24
73,96
81,00
92,16
82,81
y2
102,01
112,36
127,69
153,76
141,61
141,61
132,25
146,41
171,61
198,81
213,16
xy
70,70
77,38
88,14
106,64
96,39
98,77
94,30
104,06
117,90
135,36
132,86
x = 91,6
y = 133,6
x 2 = 768,76
y 2 = 1641,28
xy = 1122,50
( 91,6 )( 133,6 )
11
r=
2
( 91,6 )
( 133,6 ) 2
768 ,76
1641,28
11
11
1122 ,5
= 0,9446
Ou seja, existe uma correlao forte positiva entre os valores do PIB e do consumo
pessoal.
O valor do coeficiente de determinao : r 2 = 0,9446 x 0,9446 = 0,8923, o que significa
que 89% da variao total explicada por este modelo.
Utilizando o Excel
Maneira 1: A equao da forma y = a + b x para os valores dos pares (x,y) e
os coeficientes da reta so calculados utilizando o mtodo dos mnimos
quadrados.Aps colocar os valores em duas colunas (valores de x e valores de
y) v ao Assistente de Funo e escolha as funes INCLINAO para
determinar o valor de b e INTERCEPO para calcular o valor de a. Os
passos seguintes devem ser feitos seguindo as indicaes do programa. Para o
clculo da correlao utiliza-se no Assistente de Funo o CORREL. Em
Matriz1 devem ser colocadas as clulas referentes varivel x em Matriz2 as
clulas referentes varivel y.
Maneira 2: Selecionar Ferramentas e Anlise de dados e ento
Regresso. Informar o que for solicitado.
95
Peso(Kg)
750
755
777
782
793
Veloc.Mx.(Km/h)
380
354
348
330
320
Velocidade
390
y = -1,181x + 1257,173
370
R = 0,865
350
330
310
740
750
760
770
Peso
780
790
800
Estatstica de regresso
R mltiplo
0,930
R-Quadrado
0,865
R-quadrado ajustado
0,820
Erro padro
9,851
Observaes
Se
96
SQ
MQ
F de significao
Regresso
1864,051
1864,051
19,207
0,022
Resduo
291,149
97,050
Total
2155,200
Testes para a e b
Se valor-P < 0,05, ento a estimativa
vlida, caso contrrio significativamente
nula
Valores de a e b
Coeficientes
Interseo 1257,173
Peso(Kg)
-1,181
Erro
padro
Stat t
valor-P
95%
95%
inferiores superiores
Inferior
95,0%
Superior
95,0%
207,862
6,048
0,009
595,662
1918,685
595,662
1918,685
0,269
-4,383
0,022
-2,038
-0,323
-2,038
-0,323
97
Exerccios
1. Determinar o coeficiente de correlao dos dados a seguir:
X
Y
1
4
2
7
3
7
6
9
9
15
Ano
1998
1999
2000
2001
Investimento
374
555
908
1010
1976
1990
1993
1996
Nmero
de anos de
estudo
4,7
5,7
6,3
6,6
Participao na renda
(%)
8,4
16
19
21
a) Caso exista associao, quantos anos de estudo sero necessrios para que a
participao da mulher na renda familiar chegue a 50% ?
b) E qual ser a participao da mulher na renda familiar quando ela tiver 12 anos de
estudo?
c) Voc poderia estimar o ano em que a mulher ir participar com 50% da renda?
98
1
10,7
2
10,9
3
10,8
4
9,3
5
9,5
6
10,4
7
9,0
8
9,3
9
7,6
10
7,6
11
7,9
12
7,7
Temperatura
Produtividade
21,2
142
20,3
148
22,7
131
22,0
132
22,3
145
23,5
138
24,8
144
24,2
136
25,5
141
25,2
124
25,5
133
25,8
128
Temperatura
Produtividade
27,5
132
26,3
137
28,2
124
28,6
117
29,0
122
29,7
131
30,7
124
30,3
111
30,2
119
31,4
129
32,5
123
32,7
116
X
(renda)
750
690
400
900
200
1000
300
600
1200
Y
(desempenho)
5
8
4
9
2
10
3
6
10
99
Nmero de
funcionrios
Empresa
Carrefour
Po de Acar
Casas Bahia
Sendas
Ponto Frio
Sonae
Bompreo
L. Americanas
McDonalds
AgipLiquigs
Pernambucanas
37.004
39.642
11.508
16.990
5.395
22.638
13.225
12.485
No informou
3.804
10.787
Vendas
(Milhes US$)
4.582,4
3.976,4
1642,2
1391,7
1223,6
1083,9
1062,7
900,6
726,7
693,1
619,1
y = -42 ,4 62 + 0 ,10 15 x
M ilh e s US$
4.000
R 2 = 0 ,80 1
3.500
3.000
2.500
2.000
1.500
1.000
500
-
5.000
10.000
15.000
20.000
25.000
30.000
35.000
40.000
Nm e r o d e fu ncion r ios
100
14.8.1
Funo exponencial
a>0
Utilizando
as
y = ab x
0<b<1
a>0
b>1
a<0
0<b<1
propriedades
dos
logaritmos
pode-se
a<0
chegar
b>1
Y = A + Bx
onde
a = 10 A e b = 10 B
Exemplo
Uma empresa fabricante de brinquedos registrou suas vendas nos ltimos 10 anos,
obtendo os valores apresentados a seguir.
Vendas (y)
450
500
600
800
1.200
1.700
2.100
4.000
5.000
7.000
10.000
8.000
Ve n d as
Ano (x)
1
2
3
4
5
6
7
8
9
10
6.000
4.000
2.000
0
0
5 6
An o
10 11
101
Para ajustar uma funo exponencial, inicia-se com o clculo dos somatrios de Y, x, Y 2 ,
x 2 e xY, onde Y = ln (y)
x
1
2
3
4
5
6
7
8
9
10
Total: 55
y
450
500
600
800
1.200
1.700
2.100
4.000
5.000
7.000
23.350
x2
1
4
9
16
25
36
49
64
81
100
385,00
Y=ln(y)
6,11
6,21
6,40
6,68
7,09
7,44
7,65
8,29
8,52
8,85
73,25
xY
6,11
12,43
19,19
26,74
35,45
44,63
53,55
66,35
76,65
88,54
429,64
Y2
37,32
38,62
40,92
44,68
50,27
55,33
58,52
68,79
72,54
78,39
545,39
Ento,
B=
A=
73,25 0 ,325( 55 )
= 5 ,5399
10
Observe como os valores estimados pela equao esto prximos dos valores reais,
observados na srie de dados.
8.000
7.000
V endas
obs ervadas
6.000
5.000
4.000
3.000
V endas
estim adas pela
equa o
2.000
1.000
0
1
9 10
102
14.8.2
a>0
Utilizando
as
b mpar
a>0
b par
a<0
propriedades
dos
logaritmos
pode-se
y = ax b
b mpar
chegar
a<0
b par
Y = A + bX
onde
a = 10 A
Exemplo
Os dados a seguir apresentam a produo de veculos automotivos (y) ao longo do tempo
(x). Para estes dados ajuste um modelo de potncia
ano
produo
59
96,1
60
133,0
61
145,6
62
191,2
63
174,2
64
183,7
65
185,2
ano
produo
66
224,6
67
225,4
68
278,5
69
349,5
70
416,0
71
516,0
72
609,0
700,0
600,0
500,0
400,0
300,0
200,0
100,0
0,0
55
60
65
An o
70
75
103
Ano
59
60
61
62
63
64
65
66
67
68
69
70
71
72
Produo
96,1
133,0
145,6
191,2
174,2
183,7
185,2
224,6
225,4
278,5
349,5
416,0
516,0
609,0
Totais:
Y=ln(y)
4,565
4,890
4,981
5,253
5,160
5,213
5,221
5,414
5,418
5,629
5,857
6,031
6,246
6,412
76,292
X=ln(x)
4,078
4,094
4,111
4,127
4,143
4,159
4,174
4,190
4,205
4,220
4,234
4,248
4,263
4,277
58,522
Y2
20,843
23,916
24,809
27,597
26,628
27,179
27,263
29,315
29,353
31,690
34,299
36,369
39,014
41,111
419,386
X2
16,626
16,764
16,899
17,033
17,166
17,296
17,426
17,553
17,679
17,804
17,928
18,050
18,170
18,290
244,684
XY
18,616
20,023
20,476
21,681
21,379
21,682
21,796
22,684
22,781
23,753
24,797
25,621
26,625
27,421
319,335
Assim,
b=
A=
Y=A+bX
Ou ento,
y=7,889E-13 x
7,970
7,970
104
700,0
600,0
Produo real
500,0
Produo estimada
pela equao
400,0
300,0
200,0
100,0
0,0
59
60
61
62
63
64
65
66
67
68
69
70
71
72
Exerccios
1.
Ano
Vendas
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
15
16
17
18
25
28
32
42
55
76
93
2. Se voc tivesse uma srie de dados como expressa no diagrama de disperso a seguir,
que modelo de regresso voc utilizaria? O que voc poderia dizer a respeito dos
valores dos parmetros?
3. Uma companhia de energia eltrica estimou o consumo mdio de energia das famlias
(kwh) de acordo com a renda (R$). Ajuste os seguintes modelos: y=ax b , y=ab x e
y=a+bx.
Renda
197
286
243
218
241
200
215
198
129
157
296
302
Consumo
1234
1432
1678
1300
1467
1245
1214
1200
770
890
2020
2100
105
15 Tabelas
106