Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
QUANTITATIVOS EM
GESTÃO
1
Médias Móveis .................................................................................................................. 135
Amortecimento (Suavização) Exponencial ........................................................................ 137
Métodos de Previsão para Modelos com Tendência e Nenhuma Sazonalidade .................. 139
Média Móvel Dupla (MMD) .............................................................................................. 140
Modelo de Previsão por Alisamento Exponencial Duplo de Holt ...................................... 141
Métodos de Previsão para Séries Temporais Sujeitas a Fenômenos Sazonais e Nenhuma
Tendência .............................................................................................................................. 143
Modelo de Previsão com Sazonalidade Multiplicativa ...................................................... 145
Modelo de Previsão com Sazonalidade Aditiva................................................................. 146
Método de Previsão com Suavização Exponencial de Holt-Winters ........................................ 147
Modelo Sazonal Multiplicativo de Holt-Winters ....................................................................... 148
Modelo Sazonal Aditivo de Holt-Winters .................................................................................. 151
Conclusão .................................................................................................................................. 152
BIBLIOGRAFIA ............................................................................................................................ 153
2
APRESENTAÇÃO
Alceu Jobim
Luanda, 2013
3
INTRODUÇÃO
Gestores tomam decisões. É para isso que são treinados. É por isso que
são contratados, e é para isso que são remunerados. Algumas dessas
decisões são tomadas com base na intuição ou “sentimento”. Decidir
aumentar o preço do seu produto numa negociação com um cliente é o
resultado mais provável de uma análise intuitiva do comportamento deste
do que o de uma análise detalhada a partir de uma quantidade
considerável de dados. Por outro lado, decidir qual combinação de
máquinas, trabalho e empregados disponíveis que geram uma produção
total de menor custo é uma decisão que exige algumas das técnicas
quantitativas que serão introduzidas neste curso.
1. O problema é complexo.
2. O problema envolve muitas variáveis.
3. Existem dados que descrevem o ambiente de decisão;
4. Existem dados que descrevem o valor ou utilidade das diversas
alternativas possíveis.
5. As metas do decisor ou de sua organização podem ser descritas em
termos quantitativos.
6. Modelos quantitativos estão disponíveis para determinadas
situações.
4
especializados desempenhava operações específicas em cada estágio da
linha. Muito mais tarde, em 1832, Charles Babbage escreveu On the
Economy of Machinery and Manufacturers, mostrando muitas das
aplicações da engenharia industrial.
6
CAPÍTULO 1
TEORIA DAS PROBABILIDADES
(Revisão)
Introdução
Probabilidade
7
O desenvolvimento de uma teoria matemática da probabilidade começou
durante o século 17 quando o nobre francês Antoine Gombauld
(conhecido como Chevalier de Méré) levantou certas questões sobre jogos
de azar. Especificamente, ele estava intrigado sobre as possibilidades de
obter dois 6 pelo menos uma vez em 24 jogadas de um par de dados. de
Méré colocou a questão a um jovem matemático francês, Blaise Pascal,
que a resolveu. Subsequentemente, Pascal discutiu esta e outras questões
da mesma natureza levantadas por de Méré com outro famoso
matemático francês, Pierre de Fermat. No decurso de suas
correspondências, a teoria matemática da probabilidade nasceu.
P (evento certo) = 1
P (evento impossível) = 0
8
Um conjunto é uma coleção qualquer de objetos, seres ou coisas. Os
alunos de um colégio são um conjunto. Os sete dias da semana são um
conjunto, assim como as moléculas de ar num pneu Goodyear. Os objetos,
seres ou coisas de um conjunto são os seus membros ou elementos.
Existem 18 elementos no conjunto das províncias de Angola, e existem
infinitos elementos no conjunto de todos os números inteiros positivos.
S = {1, 2, 3, 4, 5, 6}
No caso do experimento atirar uma moeda no ar, é certo que ou sai Cara
ou sai Coroa. Dado que a probabilidade de um evento certo é igual a 1,
então a probabilidade de Cara ou Coroa é igual a 1. Isto é:
P (Ca ou Co) = 1
P (1 ou 2 ou...ou 6) = 1
9
Assim, a segunda propriedade das probabilidades afirma que se Ei é um
evento representativo de certo elemento de um espaço amostral, então:
P (Ei) = 1.
Abordagens à Probabilidade
1) Abordagem Clássica
P (E) =
Número total de resultados possíveis
10
Assim, por exemplo, qual a probabilidade de ocorrer Cara no
lançamento de uma moeda?
Se esta moeda for honesta (ou justa), então os dois lados são
igualmente prováveis de ocorrerem. Como a moeda tem dois lados,
então o número total de resultados possíveis é igual a 2 (Cara e
Coroa). Como o lançamento é feito uma única vez, então Cara só
pode ocorrer uma única vez. Logo, utilizando a fórmula acima:
( )
11
Qual a probabilidade de se tirar um ás num baralho honesto de 52
cartas?
52
Um exercício interessante
Resultados do dado 1
1 2 3 4 5 6
Resultados do 1 2 3 4 5 6 7
dado 2 2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
12
a. Existem 36 resultados possíveis. Somente 8 desses resultados
somam 7 ou 11, no que resulta em ganho. Logo:
13
Número de vezes em que o evento ocorreu no passado
P (E) =
Número total de observações
32
P (E = menina) = = 0,64 = 64%
50
3) Abordagem Subjetiva
15
A probabilidade combinada de eventos coletivamente exaustivos é igual a
1, uma vez que é certo que um desses eventos ocorrerá. Assim, a
probabilidade de sair um 1, ou um 2, ou um 3, ou um 4, ou um 5, ou um 6,
no lançamento de um dado é 1.
P (1 ou 2 ou 3 ou 4 ou 5) = 1
51
16
Então podemos dizer que, quando fazemos retiradas em um conjunto
finito, como é o caso de um baralho de cartas, dois eventos são
independentes se e somente se a retirada é feita com reposição. Caso
contrário, os dois eventos são dependentes.
17
A B
AB
A B
AB
Exemplo
18
Ouros Reis
A B
Rei de Ouro (A B)
Regras da Probabilidade
Regra da Multiplicação
seguinte exemplo:
P (Valete) = 4 / 52
P (A e B) P (A B)
P (B/A) = =
P (A) P (A)
20
Considere a probabilidade de tirar um rei (R) de um baralho com 52 cartas,
e sair um 5 no lançamento de um dado. Estes são, obviamente, eventos
independentes, uma vez que o que é retirado do baralho não tem
nenhuma influência sobre o número que sai no dado. Então:
P (A R) = P (A) * P (R/A)
Exercício
Resposta:
Fazendo H = homem, e A = ação, queremos P (H A).
21
diferentes). Logo: P (H A) = P (H) * P (A/H) = 120/200 * 40/120 =
40/200 = 0,20 ou 20%
Falaremos mais sobre probabilidades condicionais quando estudarmos o
Teorema de Bayes, adiante.
Regra da Adição
P (A B) = P (A) + P (B) – P (A B)
A
B
(A B)
P (A) inclui P (A B)
22
Entretanto, se os eventos são mutuamente exclusivos, então sua
probabilidade conjunta é zero. Por definição, eles não podem ocorrer
juntos e P (A B) = 0. Então, a expressão a ser utilizada é:
P (A B) = P (A) + P (B)
Exemplo
P (A C) = P (A) + P (C) – P (A C)
Árvores de Probabilidade
23
probabilidades mostra todas as possibilidades associadas com todo um
produção.
24
Técnicas de Contagem
ABC BCA
ACB CAB
BAC CBA
25
Seis diferentes arranjos são obtidos simplesmente reordenando os
elementos. Podemos obter este total 6 utilizando o chamado princípio
multiplicativo: se a primeira de uma sequência de arrumações pode ser
feita de n1 maneiras, a segunda de n2 maneiras, e assim por diante para k
arrumações, então a sequência de k arrumações pode ser feita de
(n1)*(n2)*...*(nk) maneiras.
An, n = n!
26
n!
Pn , r
n r !
3!
Logo, P3, 2 = =6
(3 – 2)!
Note que quando r = n, Pn, r = An, n. Para verificar, resolva o exemplo das
letras ABC fazendo r = 3 utilizando a fórmula das permutações. Uma
observação: Por convenção, 0! = 1.
Exercícios
27
elementos também difere da proporção r em que eles são tomados, isto é,
n r.
n!
C n ,r
r!n r !
3!
Logo, C3, 2 = =3
2! (3 – 2)!
Exercícios
28
Técnica de Contagem 4 – Arranjos de Escolha Múltipla (AEM)
Mn, r = nr
uma lista de 5 universidades diferentes nas quais seus três filhos irão
porque ela determina qual estudante vai para qual universidade. Também,
dado que dois ou mais filhos podem ir para a mesma escola, a duplicação
cinco é:
M5, 3 = 53 = 125
Existem 125 diferentes arranjos nos quais os três filhos podem escolher
entre as 5 universidades.
29
OBS: O Excel dispõe da função matemática POTÊNCIA (núm; potência) que
Exercícios
Teorema de Bayes
30
( )
( )
( )
Assuma que temos dois tipos de dados viesados numa urna. Num deles, o
número 2 aparece 30% das vezes [ou seja, P(2) = 0,3]. No outro, o 2 surge
em 60% das vezes [P(2) = 0,6]. Chamemos o primeiro tipo de dado de Tipo
1 e o segundo de Tipo 2. Um dado é retirado, rolado uma vez, e aparece
um 2. Qual é a probabilidade de que seja o dado do Tipo 1? Bem, como
existem 2 dados, poderíamos responder que a probabilidade é 0,5. Mas
façamos melhor. Veja a tabela abaixo:
( )
( )
( )
( )
( )
( )
Distribuições de Probabilidades
Suponha que estejamos interessados em apresentar, de uma maneira
organizada, o número de coroas que possam resultar quando jogamos
uma moeda duas vezes. Estes resultados são apresentados na tabela
abaixo:
0,50
0,25
0 1 2
33
possibilidade de ocorrência de certos resultados (a noção pessoal de um
gestor financeiro sobre o nível das taxas de juros futuros de bonds).
Distribuições de probabilidade também podem ser baseadas na
experiência: os atuários de companhias de seguros determinam prêmios
para políticas de seguros de vida usando as taxas de mortalidade para
estabelecer probabilidades de falecimentos entre diferentes grupos.
Variáveis Aleatórias
Uma variável aleatória (V.A.) é uma variável que assume diferentes
valores como resultado de um experimento aleatório. Uma V.A. tanto
pode ser discreta como contínua. Pode-se pensar numa V.A. como um
valor ou magnitude que muda de ocorrência para ocorrência numa
sequência previsível. Um vendedor de eletrodomésticos não tem como
saber, com certeza, quais serão as vendas de amanhã. Assim, as vendas de
amanhã é uma variável aleatória. Os valores de uma variável aleatória são
os valores numéricos correspondentes a cada resultado possível de um
experimento aleatório. No caso do vendedor, suponha que saibamos que
34
os dados passados de vendas indicam que os valores da V.A. “vendas
diárias” variem de 110 a 115. Neste caso, esta V.A. é uma variável
aleatória discreta.
35
Note que a distribuição de probabilidade para uma variável aleatória
fornece a probabilidade para cada valor possível e que estas
probabilidades tem que somar 1. Lembre-se também que tanto a tabela
quanto o gráfico nos dão informação sobre a ocorrência a longo prazo das
vendas diárias que esperaríamos ver se este experimento fosse repetido.
E = x * P (x)
36
O valor esperado das vendas diárias, 108,02, é a soma dos produtos de
cada ocorrência de vendas pela sua probabilidade de ocorrência. A
Administração da loja de eletrodomésticos poderia achar útil basear suas
decisões no valor esperado das vendas diárias porque o valor esperado é
uma média ponderada dos resultados esperados no futuro. O valor
esperado pondera cada resultado possível pela probabilidade associada
com este resultado. Desta maneira, a ocorrências mais comuns são dadas
mais pesos do que ocorrências menos comuns. Na medida em que as
condições se alterassem ao longo do tempo, a Administração recalcularia
o valor esperado das vendas diárias e então usaria este novo dado como
base para tomar decisões.
37
Distribuição de Poisson – é uma distribuição discreta
frequentemente utilizada para contar o número de ocorrências de
algum evento num dado período de tempo;
Distribuição Exponencial – uma distribuição contínua
frequentemente utilizada para medir a extensão de tempo
necessária para desempenhar alguma atividade;
Distribuição Normal - uma distribuição contínua utilizada para
descrever muitos fenômenos físicos, biológicos, econômicos,
financeiros, administrativos, etc.
Distribuição Binomial
A distribuição Binomial descreve dados discretos resultantes de um
experimento chamado de Processo de Bernoulli. O lançamento de uma
moeda honesta um número fixo de vezes é um processo de Bernoulli, e os
resultados de tais lançamentos podem ser representados por uma
distribuição binomial de probabilidade. O sucesso ou fracasso de alunos
licenciados numa entrevista para um emprego também pode ser descrito
por um processo de Bernoulli.
( )
n = 15
p = 0,4 q = 0,6
r=6
P(r = 6) =?
( )
( )
n = 12
p = 0,3 q = 0,7
r=6
P(r = 6) =?
( )
( )
39
3) Uma cadeia de restaurantes classifica embarques de produtos
alimentícios. Um embarque de carne vem em caixas de 20 fatias. A
política da cadeia é classificar como “aceitável” se não mais do que
2 caixas estiverem estragadas. A cadeia assume que a probabilidade
de qualquer caixa estragada ser aleatoriamente selecionada é
independente de qualquer outra caixa.
Se um embarque de 20 caixas de carne é recebido, qual é a
probabilidade de que este embarque será aceito se a probabilidade
de que qualquer caixa estragada aleatoriamente escolhida é de 10%?
n = 20
p = 0,10 *10% das caixas são “sucessos” (estragadas)+ q = 0,7
r= 0, 1, 2
P(r 2) =?
P(r = 0) = 0,12577
P(r = 1) = 0,27017
P(r = 2) = 0,28518
40
carne estarem estragadas. Isto é, P(r 2). Nesta situação, é mais
fácil utilizar a lei dos complementos:
P (A) = 1 - P(Ā)
Veja que:
P (r 2) = 1 – [P (r = 0) + P (r = 1)]
= n*p
2 = n*p*(1-p)
Por exemplo, seja uma empresa que vende seus produtos por telefone.
Dados anteriores demonstram que a probabilidade de uma venda em
qualquer ligação é de p = 0,15. Se um vendedor fizer 15 chamadas num dia,
qual a média de vendas diárias que se poderia esperar?
41
√ ( )
Distribuição de Poisson
A distribuição de Poisson é frequentemente usada para descrever o
número de chegadas de clientes por hora, o número de acidentes
industriais em cada mês, o número de defeitos em conexões elétricas por
milha de fios numa estação de força, ou o número de máquinas que
quebraram e estão aguardando reparo. Em cada um desses casos, a
variável aleatória (clientes, acidentes, defeitos, máquinas) é medida por
unidade de tempo ou espaço (distância).
( )
onde
42
Exemplos
( )
( )
( )
( )
( )
( )
média = variância =
43
a. Qual é a probabilidade de 3 clientes pararem a qualquer hora?
Solução
( )
a. ( )
b. P (x 3) = P (x = 0) + P (x = 1) + P (x = 2) + P (x = 3) = 0,151204
= √6 = 2,45 clientes.
Distribuição Exponencial
44
f (x)
1 2 3 4 ...
X (unidades de tempo)
Por exemplo, se uma média de quatro caminhões chega a cada hora numa
estação de carregamento ( = 4), então, em média, um caminhão chega a
cada quarto de hora. Isto é,
45
de que não mais do que t unidades de tempo passarão entre ocorrências
sucessivas é:
( )
Exemplos
Fazendo t = 2, temos
( )
( )
( ) ( )( )
[ ]
47
em que W é o tempo médio que uma unidade gasta no sistema
esperando pelo serviço e recebendo aquele serviço (tempo de
espera mais o tempo de serviço).
( )
( )
48
a. A probabilidade de que ninguém esteja na caixa registradora é:
P (n 2) = 1 – [P (n = 0) + P (n = 1)] = 0,2941
[ ] ( )
( )
49
sendo atendido é relativamente baixa, se realmente o serviço de
atendimento deve ser agilizado.
Distribuição Normal
f(X)
50
b. 50% das observações estão acima da média e 50% abaixo dela. Isto
significa que metade da área sob a curva está à esquerda da média,
e a outra metade à direita da média.
c. Se os dados são normalmente distribuídos, podemos utilizar a
chamada Regra Empírica da Distribuição Normal para tirar
conclusões sobre tais dados. Esta regra diz o seguinte: se incluirmos
todas as observações dentro de um desvio-padrão da média (isto é,
um desvio-padrão abaixo e um desvio-padrão acima da média)
abrangeremos 68,3% de todas as observações. Assim, não importa
qual é a média e qual o desvio-padrão, podemos estar certos de que
68,3% das observações estarão dentro de um desvio-padrão da
média. Naturalmente, se nos movermos mais do que um desvio-
padrão acima e abaixo da média, abrangeremos uma porcentagem
maior de observações. A Regra Empírica especifica que
Graficamente
51
em que s é o desvio-padrão.
Frequência
X (minutos)
0 5 10 15 20
52
Assuma uma amostra de 1.000 chamadas. Assim, 997 das 1.000
levam entre 4 minutos e 16 minutos para entrar na central. Logo,
somente 3 de 1.000 chamadas levam menos de 4 minutos ou
mais do que 16 minutos para entrar.
( )
( )
( )
√
53
X (segundos)
120 150 180
Z (valores)
-2 -1 0 1 2
Assuma que uma chamada telefônica particular leve 180 segundos. Isto
está a dois desvios-padrão acima da média de 150. Podemos medir esta
distância entre 150 e 180 segundos de duas maneiras. Podemos dizer que
este ponto de 180 segundos é (1) 30 segundos acima da média, ou que (2)
este ponto é 2 desvios-padrão acima da média. Em ambos os casos,
estamos na mesma situação. Ao expressar a distância em desvios-padrão,
estamos dizendo que o valor de Z é dois desvios-padrão. Isto é, Z = 2. O
valor Z é o número de desvios-padrão que um dado ponto (180 neste caso)
está acima ou abaixo da média. Usando a fórmula de conversão, temos:
54
Padronizando a distribuição desta maneira oferece certas vantagens.
Agora existe somente uma distribuição para usar ao invés de um número
infinito delas. Evidentemente esta vantagem hoje está bem reduzida, pois
com programas tais como o Excel, é possível usar-se tanto a distribuição
normal quanto a normal padronizada para calcularem-se probabilidades.
Vejamos:
X N(150, 15)
0,5
0,5
X (segundos)
150 180
Z (valores)
0 2
ela pode:
55
A área sob a curva é igual a 1 ou 100%. Assim, a distribuição
acumulada até 180 é 0,97725. Subtraindo 1 de 0,97725 temos
0,0228, que corresponde à área acima de 180. Como metade da
curva (de 150 em diante) corresponde a 50% (0,5), subtraímos 0,5
de 0,0228. O valor, 0,4772, é a área desejada (entre 150 e 180). Veja
a figura abaixo:
0,5
0,0228
0,4772
0,5
X (segundos)
150 180
Z (valores)
0 2
X (segundos)
125 150
Z (valores)
0 2
57
A área abaixo de 125 corresponde a uma probabilidade de 0,0478. A área
de 150 e abaixo corresponde a 0,5. Logo, a área entre 150 e 125
corresponde à diferença entre 0,5 e 0,0478, o que gera a probabilidade de
0,4522 ou 45,22%.
X (segundos)
145 150 155
Z (valores)
-0,33 0 0,33
58
CAPÍTULO 2
PREVISÕES
Virtualmente todas as decisões administrativas dependem de previsões.
Os gestores estudam previsões de vendas, por exemplo, para tomar
decisões sobre necessidades de fundo de maneio, o tamanho da força de
trabalho, níveis de stocks, a programação da rotina de produção, a
localização das fábricas, o montante de propaganda e promoção de
vendas, a necessidade de alteração de preços, e muitos outros problemas.
59
Qual a relação entre a quantidade de dinheiro na economia,
digamos M1, e o nível da atividade econômica?
Se o Banco Central aumentar a taxa de desconto, isso causará uma
estagnação com inflação?
Qual o efeito, sobre a distribuição de renda, das modificações na
legislação tributária?
É melhor investir em títulos governamentais a longo prazo ou em
Letras do Banco Central a curto prazo?
Aumentos em gastos com propaganda geram aumentos de venda?
Aumentos na renda da população geram aumentos no consumo de
bens e serviços?
1 100 230
2 120 215
3 135 200
4 150 195
5 165 190
6 182 187
7 198 180
60
8 220 172
9 245 150
10 256 142
11 262 138
12 280 130
QD = f (P)
QD = 1 + 2P
61
Em teoria da probabilidade e estatística, correlação indica a força
e a direção do relacionamento linear entre duas variáveis. No uso
estatístico geral, correlação ou co-relação se refere a medida da
relação entre duas variáveis, embora correlação não implique
causalidade. Neste sentido geral, existem vários coeficientes
medindo o grau de correlação, adaptados à natureza dos dados.
XX X2
rXX 1
X * X X2
62
A permutação das variáveis não altera o resultado do
coeficiente de correlação, se os mesmos pares de valores forem
mantidos:
rXY = rYX
63
b) rXY = -1. Correlação perfeita negativa.
X
Figura 3. Inexistência de alinhamento, rXY = 0.
64
Três observações importantes se fazem necessárias sobre a
covariância e a correlação:
65
A seguir, é útil representar graficamente QD e P para analisarmos,
visualmente, como as duas variáveis se distribuem
conjuntamente. O gráfico utilizado para isso é chamado de
diagrama de dispersão porque mostra como as duas variáveis
estão dispersas em relação uma à outra. O diagrama de dispersão
obtido no Excel para as duas variáveis em questão está mostrado
no Gráfico 1 a seguir:
66
Gráfico 3. Reta de regressão dos dados da Tabela 1.
em que y = QD e x = P.
67
1,8748 unidades. Assim, existe uma relação inversa entre o preço
e a quantidade demandada do produto.
QD = 1 + 2 P + i
68
em que i é o chamado termo de erro estocástico ou perturbação
estocástica e reúne todos os outros fatores que influenciam as
quantidades demandadas do produto e que fazem com que a
reta não se ajuste perfeitamente aos dados.
Y i 1 2 X i u i
69
Análise da função demanda
70
Figura 5. Resultados da ferramenta Regressão para os dados da Tabela 1.
71
A ferramenta Regressão realiza a análise de regressão tanto
simples (uma única variável independente, que é o nosso caso)
quanto múltipla (mais de uma variável independente1) de um
conjunto de dados. Embora não seja um pacote econométrico
completo, pois outros resultados importantes para análise não
estão disponíveis, ela ainda assim é útil para uma análise inicial e
acessível dos dados. A ferramenta apresenta os resultados em
formato de blocos, que passamos a analisar em seguida:
1
A ferramenta aceita até 16 variáveis independentes.
2
Duas variáveis são estatisticamente independentes se a seguinte relação for verdadeira: f (x, y) = f (x) *
f (y). Isto é, se o produto de sua função de probabilidade conjunta for igual ao produto de suas funções
de probabilidade individuais.
72
próximo de 1, melhor é o ajuste e, portanto, maior é a influência
da variável independente sobre a dependente. Se r2 = 0, então
não há nenhuma relação entre as duas variáveis, e a melhor
estimativa para qualquer valor de QD será o seu valor médio. No
exemplo, r2 = 0,9781, o que demonstra que, aproximadamente
97,81% das variações nas quantidades demandadas do produto
são devidas às variações de seu preço, e os restantes 2,19% são
devidos a outros fatores não considerados, os resíduos u i . Uma
forma simples de achar r2 é elevar ao quadrado o coeficiente de
correlação r.
em que Yi Yi são os desvios dos valores observados em relação
aos estimados pela regressão, e n-2 são os chamados graus de
liberdade [o termo número de graus de liberdade significa o
número total de observações na amostra, ou seja, n, menos o
número de restrições independentes (lineares) impostas a elas.
Em resumo, é o número de observações independentes de um
total de n observações. Por exemplo, para que a soma dos
quadrados dos resíduos (SQR) possa ser calculada, deve-se
primeiro obter ̂ ̂ . Estas duas estimativas, portanto, impõem
duas restrições contra a SQR. Logo, há n – 2 e não n observações
independentes para calcular a SQR. Seguindo esta lógica, na
73
regressão de três variáveis, SQR terá n-3 gl, e o modelo de k
variáveis terá n – k gl. A regra é esta: gl= n- número dos
parâmetros estimados.] O erro padrão também pode ser
calculado com a função estatística EPADYX do Excel. Por exemplo,
se usarmos a regressão Q D = -1,8747549P + 525,362759 para
estimarmos o valor de QD para P = $ 230, digamos,
encontraremos Q D = -1,8747549*(230) + 525,362759 94,17.
Interpretamos esse resultado da seguinte maneira:
3
Pela Regra Empírica da Distribuição Normal.
74
Y
Yi
( ̅) ̂ ̂
̂ (̂ ̅)
0 Xi X
75
Então, r2 é definido como:
76
Onde, no argumento Probabilidade, digitamos o nível de
significância desejado, no caso, 5% ou 0,05. No argumento
Graus_liberdade1, digitamos os graus de liberdade (gl) da
regressão, 1; e no argumento Graus_liberdade2, os graus de
liberdade dos resíduos, 10. Este F encontrado (4,9646) é chamado
de F crítico, e a regra de decisão é a seguinte:
77
significativo) coincide com o resultado obtido com a ferramenta
Regressão. A regra de decisão agora é:
2
X X Y Y
i i
e
1 Y 2 X
X X
2
i
X 2
ep 2 ep 1
n X X
i
X
e
X
2
i
i
em que n é o número de observações e é o erro-padrão da
estimativa, cuja fórmula já apresentamos anteriormente.
AR
0,025 0,025
-2,2281 0 2,2281
79
Rejeite os ´s se os seus t observados estiverem entre -2,2281 e
2,2281. Não os rejeite se os t observados estiverem fora do
intervalo.
1 t / 2 * ep 1 = 525,362759 ± 2,2281*15,95104831 =
= 489,821 1 560,904
e
2 t / 2 * ep 2 = -1,8747549 ± 2,2281*0,088615682 =
= -2,0722 2 -1,6773
80
No bloco Resultado Residual são dadas:
▪ O número de observações: 12
A questão da previsão
A fórmula de JB é a seguinte:
A2 C 32
JB n
6 24
4
A distribuição normal tem assimetria zero e curtose 3. Na fórmula de JB, (C-3) é o excesso de curtose.
82
Estimativas por ponto
83
epQD
1
ep *
P P
0
2
P
P n
2
n 2
ou
5
Utilize a função INVT do Excel.
84
QD
QD médio.
184
172
Q D =525,3627-1,8747
0 P 177,42 P=185
85
em que epQD i é o erro padrão da média condicional e é dado pela
seguinte expressão:
epQD i
1
ep * 1
P P
0
2
n P 2
P 2
n
Fazendo os cálculos, encontramos epQDi 9,7367. Como Q D = 178
para P0 = 185, nosso intervalo de confiança é:
ou
86
QD
525
200
184
Q D =525,3627-1,8747
172
156
0 P 177,42 185
Figura 9. Intervalos ou bandas de confiança para Q D médio e Q Di individual.
87
demanda, e que não estão consideradas no presente modelo,
exercem sobre as quantidades demandadas.
Onde:
Rj = retorno proporcionado pela ação j em cada ano do horizonte de
tempo estudado.
RF = taxa de juros de um título livre de risco.
RM = retorno da carteira de mercado (o índice da carteira teórica de uma
Bolsa de Valores).
Rj - RF ; RM – RF = são, respectivamente, o retorno adicional da ação j e do
mercado em relação ao retorno do título sem risco.
88
= coeficiente angular da reta de regressão que identifica o risco
sistemático da ação j em relação ao mercado.
= coeficiente linear da reta característica.
(Eq. 2)
89
Embora esse r2 bruto satisfaça a relação 0 < r2 < 1, ele não pode ser
comparado diretamente ao r2 convencional.
Formas Funcionais
O Modelo Log-Linear
Se escrevermos como:
91
quantidade demandada de um bem e o seu preço for como a mostrada
no Gráfico 1:
Gráfico 1 Gráfico 2
QD QD
ln Y = ln1 - 2 ln
Xi
Preço Preço
92
O Modelo Log-Lin
Yt = Y0 (1 + r)t
93
modelo no qual o regressando é logarítmico será chamado de modelo
log-lin.
(Eq. 5)
94
Taxa de crescimento instantâneo versus composta. O coeficiente de
inclinação 0,0294 fornece a taxa de crescimento instantânea (em um
ponto do tempo), e não a taxa de crescimento composta (ao longo de
um período). Mas esta última pode ser calculada facilmente: basta
calcular o antilog de 0,02975, subtrair 1 e depois multiplicar por 100.
Assim, no presente caso:
(Eq. 7)
̂ ( )
ep = (5,5366) (136,650)
r2 = 0,9793
t = (43,5462) (24,3494)
p-value = (0,0000) (0,0000)
95
No período 1970-2011, o PNB real aumentou, em média, à taxa
absoluta (não relativa) de cerca de 241,098 bilhões de dólares. Assim,
nesse período, houve uma tendência crescente no PNB real.
A escolha entre o modelo de crescimento da Eq. 6 e o modelo linear da
Eq. 8 dependerá de estarmos interessados na variação relativa ou
absoluta do PNB real. Outra coisa importante: não podemos comparar
os valores r2 dos dois modelos, porque os regressandos são diferentes
nos dois modelos.
Uma advertência sobre os modelos log-lin e de tendência linear.
Embora estes modelos sejam utilizados com bastante frequência para
estimar a variação relativa na variável dependente ao longo do tempo,
seu uso rotineiro para este fim tem sido questionado por analistas de
séries temporais. O principal argumento deles é que tais modelos
podem ser adequados somente se uma série temporal for estacionária.
Grosso modo, uma série temporal é estacionária se o seu valor médio e
sua variância não se alterarem sistematicamente com o tempo.
O Modelo Lin-Log
Yi = 1 + 2 ln Xi + i (Eq. 9)
96
A segunda forma de expressar 2 resulta do fato de que uma variação
no ln de um número é uma variação relativa.
Assim:
(Eq. 10)
ou equivalentemente:
(Eq. 11)
ep = (171,0518) (1381,278)
t = (23,36949) ( -16,9702)
p-value = (0,0000) (0,0000)
97
Relações entre várias variáveis
Vimos como uma única variável independente pode ser usada para prever
o valor de uma variável dependente. Entretanto, uma regressão simples
nos limita a uma única variável independente. Em inúmeros casos temos
que utilizar mais de uma variável independente para explicar o
comportamento de uma única variável dependente. Isto é precisamente o
que a regressão múltipla nos permite. Regressão Múltipla envolve o uso
de duas ou mais variáveis independentes. O modelo de regressão simples
foi expresso como:
(Eq. 12)
̂ ̂
98
população, etc. Para simplificar a discussão, vamos supor que a
companhia inicie adicionando somente uma variável, a renda do
consumidor, que a companhia supõe poder melhorar o poder
explanatório da regressão. Seu modelo então passa a ser:
(Eq. 13)
onde
̂ ̂ ̂ ̂ ̂ (Eq. 14)
99
Quando utilizamos um modelo de regressão simples, sua representação
gráfica é uma reta. No modelo de regressão múltipla, entretanto, isto não
é mais possível. Se três variáveis estão envolvidas (duas independentes e
uma dependente) um plano de regressão é usado. A presença de mais de
três variáveis requer um hiperplano.
1
0
2 X1
X2
̂ (Eq. 15)
Dado o modelo da Eq. 15, a pergunta é: “Este modelo tem algum poder
explanatório?”. Isto pode ser respondido pela ANOVA. O procedimento
ANOVA testará se quaisquer das variáveis independentes têm relação com
100
a variável dependente. Se uma variável independente não estiver
relacionada com a variável Y, seu coeficiente deve ser estatisticamente
igual a zero. Isto é, se Xi não estiver relacionado com Y, então i = 0. A
ANOVA testa a hipótese nula de que todos os ´s são zero contra a
alternativa de que pelo menos um não é zero. Assim:
H0: 1 = 2 = 3 =...= k = 0
Se H0 não for rejeitado, então não existe relação linear entre Y e quaisquer
das variáveis independentes. Por outro lado, se H0 for rejeitado, então
pelo menos uma das variáveis independentes estará linearmente
relacionada a Y.
H0: 1 = 2 = 0
101
A regra de decisão é não rejeitar H0 se o F observado < 3,8853. Isto é
mostrado na figura abaixo:
f (F)
0,05
F
3,8853
121,18
A companhia viu que pelo menos uma das variáveis independentes tem
alguma relação com o número de passageiros. O passo lógico seguinte é
102
testar cada coeficiente individualmente para determinar qual (ou quais) é
(são) significante (s).
H0: i = 0
H1: i 0
A estatística t é:
103
É um teste bicaudal porque o valor t pode ser significativamente grande
ou significativamente pequeno. Veja então a figura abaixo:
NÃO REJEITE
2,5% 2,5%
Regra de Decisão: Não rejeite H0 se -2,1788 < t < 2,1788. Rejeite H0 se t < -
2,1788 ou t > 2,1788.
Este mesmo teste para significância também pode ser desenvolvido para
2, o coeficiente da Renda Nacional. De acordo com a tabela ANOVA a
Renda Nacional (RN) tem um valor-p (o valor p é o menor nível de
significância ao qual H0 seria rejeitado) de 0,07392 ou 7,392%. Assim, RN
deve ser significante a qualquer acima de 7,39%. Testando a = 5% e o t
crítico sendo 2,1788, a regra de decisão é:
104
Regra de Decisão: Não rejeite H0 se -2,1788 < t < 2,1788. Rejeite H0 se t < -
2,1788 ou t > 2,1788.
= 5%
NÃO REJEITE
2,5% 2,5%
= 10%
NÃO REJEITE
5% 5%
-1,782 0 1,782
105
Regra de Decisão: Não rejeite H0 se -1,782 < t < 1,782. Rejeite H0 se t < -
1,782 ou t > 1,782.
106
coincidente entre passageiros e atuns ou jacarés, tanto positiva quanto
negativa, o fato é que adicionando variáveis explanatórias “absurdas”,
podemos ilegitimamente aumentar r2. É por isso que é prática comum em
regressões e correlações múltiplas usar-se o CDA, simbolizado por ̅̅̅. Esta
estatística ajusta a medida do poder explanatório da regressão pelo
número de graus de liberdade. A regressão perde 1 grau de liberdade para
cada variável independente adicionada ao modelo porque cada variável
requer o cálculo de outro i e o ̅̅̅ penalizará a regressão por incorporar
uma variável que não adiciona poder explanatório suficiente. O valor de
̅̅̅ decrescerá. Em casos extremos, o CDA pode, na verdade, tornar-se
menor do que zero.
A fórmula do CDA é:
̅̅̅ ( ) ( )
A presença de Multicolinearidade
Mas o que é alto? Infelizmente, não há resposta para esta questão crítica.
Não há um ponto de corte no qual a correlação é julgada muito alta e a
multicolinearidade está presente. Multicolinearidade é um problema de
grau. Em qualquer modelo, alguma multicolinearidade sempre existe
entre duas variáveis independentes. Se a sua presença torna-se muito
pronunciada, o modelo é adversamente afetado. O que é considerado
107
muito alto é largamente uma questão de julgamento pelo analista ou
pesquisador.
Os problemas da Multicolinearidade
Detectando Multicolinearidade
108
Figura 10. Matriz de Correlação entre Passageiros, Propaganda e Renda Nacional.
H0: 12 =0
H1: 12 0
√ √ ( )
Este tOBSERVADO de 6,36 é comparado com um tCRÍTICO, que pode ser obtido
com a função estatística do Excel INV.T. BC, conforme mostra a Figura 11:
109
Figura 11. Obtendo tCRÍTICO com INV.T. BC.
Regra de Decisão: Não rejeite H0 se -2,16 < tOBSERVADO < 2,16. Rejeite se
tOBSERVADO < -2,16 ou tOBSERVADO > 2,16.
Dado que tOBSERVADO = 6,36 > tCRÍTICO = 2,16, a empresa pode rejeitar a
hipótese nula de que não existe correlação entre Propaganda (X1) e Renda
Nacional (X2). Alguma multicolinearidade existe. Isto não significa que o
modelo está irremediavelmente perdido. De fato, muitos poucos modelos
estão totalmente livres de multicolinearidade. Como lidar com isso é o
que veremos mais adiante.
110
da Renda Nacional. Isto é uma indicação de que a multicolinearidade deve
estar presente.
( )
( )
( )
111
que o FIV de um único Xi meça pelo menos 10, ou a soma dos FIV´s para
todos os Xi seja pelo menos 10.
Tratando a Multicolinearidade
112
É também possível combinar duas ou mais variáveis. Isto poderia ser feito
com um modelo para a demanda do consumidor, no qual X1 = homens, X2
= mulheres, e X3 = população total. As variáveis X1 e X2 podem ser
adicionadas para formar X3. O modelo então consistiria de uma única
variável explanatória.
Entretanto, este não é o caso de muitas outras variáveis que também são
úteis na explicação de níveis de renda. Estudos têm mostrado que o sexo e
a localização geográfica também carregam poder explanatório
considerável. Uma mulher com o mesmo número de anos de educação e
treinamento de um homem não tem, em geral, o mesmo rendimento. Um
trabalhador no Bié pode não ganhar o mesmo que um trabalhador em
Luanda fazendo o mesmo serviço. Ambos, sexo e geografia, podem provar
serem altamente úteis como variáveis explanatórias no esforço de prever
o rendimento de alguém. Porém, nenhuma destas variáveis pode ser
expressa numericamente e, portanto, serem imediatamente incluídas
num modelo de regressão. Assim, temos que modificar a forma dessas
variáveis não numéricas para incluí-las num modelo econométrico e,
dessa forma, ganhar o poder explanatório adicional que possam oferecer.
Variáveis que não são expressas numa forma quantitativa direta são
chamadas de variáveis qualitativas ou variáveis Dummy. Como outra
ilustração, as vendas de uma firma podem depender da estação do ano.
Roupas de praia provavelmente venderão melhor no Verão do que no
Inverno, enquanto dar-se-ia o contrário com guarda-chuvas e casacos.
Este fator sazonal só pode ser capturado levando-se em conta a estação
do ano, uma variável que não pode ser medida numericamente. Se uma
pessoa é casada, solteira ou divorciada pode afetar suas despesas para
propósitos recreacionais, enquanto o lugar de residência (urbana,
suburbana, ou rural) provavelmente afetará suas despesas com
pagamento de impostos territoriais. Em todos estes casos, as variáveis que
113
queremos medir não podem ser prontamente expressas numericamente.
Devemos então, usar variáveis Dummy para obter uma descrição mais
completa do impacto dessas variáveis não numéricas.
A regressão obtida é:
(0,000) (0,010)
̂ ( )
114
Despesas
41,05 ̂
35,94 ̂
17,32
12,21
30 Renda
̂ ( )
̂ ( )
e para homens:
̂ ( )
115
deveríamos testar a hipótese de que ele difere significantemente de zero.
Isto é:
H0: 2 = 0
H1: 2 0
Regra de Decisão: não rejeite H0 se -2,179 < t < 2,179. Rejeite se t < -2,179
ou t > 2,179.
Análise Residual
Autocorrelação
116
+e
0 tempo
-e
+e
0 tempo
-e
117
H0: et, et-1 = 0 Sem autocorrelação
H1: et, et-1 0 Autocorrelação presente
e é calculada como:
∑( )
( )
∑( )
118
A estatística d dá sempre um valor entre zero (0) e quatro (4), isto é:
0 d4
119
O teste é O teste é
+AC inconclusivo Sem AC inconclusivo -AC
dL dU 2 4-dU 4-dL
0,95 1,54 2,46 3,05
Como vimos os cálculos são bem tediosos. Eles podem ser simplificados
estimando o valo de d como:
Heteroscedasticidade
120
Y
10 11 X
10 11 X
+e
0 ̂
-e
Figura 17 (a)
+e
0 ̂
-e
Figura 17 (b)
122
+e
0 ̂
-e
Figura 17 (c)
124
A equação auxiliar é então:
3. Calculando nR2:
n = 15
R2 = 0,2151
Como nR2 < 20,05, 4, isto é, 3,227 < 9,4877, não rejeitamos a hipótese
nula de que os termos de erro têm variâncias iguais, e concluímos
que a heteroscedasticidade não existe.
125
CAPÍTULO 3
SIMULAÇÕES
No contexto das ciências e tecnologias, simular é recriar comportamentos
de um sistema ou processo – o sistema simulado – através de um sistema
computadorizado – o simulador – numa forma adequada para estudo e
interação (exemplos: simuladores de vôo, pacientes virtuais para estudo
de medicina).
126
• SIMULAÇÃO COM A FERRAMENTA SOLVER DO EXCEL
No ficheiro em Excel SOLVER – PROGRAMAÇÃO MATEMÁTICA,
apresentamos exemplos de utilização desta ferramenta.
CAPÍTULO 4
SÉRIES TEMPORAIS
Define-se série temporal como um conjunto de observações ordenadas no
tempo e que apresentam dependência serial (isto é, dependência entre
instantes de tempo). Uma notação usada para denotar uma série
temporal (dentre outras) é Z1, Z2, Z3,..., ZT, que indica uma série de
tamanho T. O instante T geralmente indica o último instante disponível.
De uma maneira um pouco mais formal dizemos que uma série temporal é
uma realização de um processo estocástico.
127
médias mensais do que a taxa mensal de inflação. Logo, não se pode
garantir que a previsão encontrada por este ou aquele método será
sempre “boa”, tudo depende das características da série que está sendo
estudada! No entanto, um aspecto deve ser levado em conta ao fazermos
previsões de séries temporais: o nível de incerteza aumenta com o
horizonte de previsão – quanto mais longe futuro, maior é a incerteza
associada à previsão. Isto é intuitivamente razoável, pois é sempre mais
difícil prever o futuro distante, e a nossa previsão estará cercada de
incertezas.
( ) ̂( )
( ) ̂( )
128
Por onde começar
Podemos fazer uma distinção básica entre duas grandes classes de modelos:
1) Ingênuo (naive)
129
deveriam receber um peso maior do que as observações mais antigas.
Esta idéia de ponderar as observações de acordo com as suas “idades”
leva aos diversos métodos de amortecimento exponencial.
130
Existem também modelos ARIMA multivariados, geralmente
chamados de modelos de função de transferência, mas eles não
serão estudados aqui.
Zt
t
t
Tendência Constante.
Zt Zt
t tt
t t
131
Zt
t
t
Tendência Quadrática.
Vendas
J F M A M J J A S O N D J F M A M J JA S O N D J F
Meses
Série com sazonalidade.
132
A ciclicidade (ou ciclos) indicam padrões que se repetem na série
superiores a 1 ano. Por exemplo, ciclos relacionados à atividade
econômica e ciclos meteorológicos.
133
(a)
(b)
(c) (d)
134
Métodos de Previsão através de Modelos com Nenhuma
Tendência ou Sazonalidade
Médias Móveis
FÓRMULA DA MMS
( )
onde
N = número de periodos
135
Média Móvel Ponderada
FÓRMULA DA MMP
(Equação 2)
Onde
FÓRMULA DA MME
̂ ( )̂ (Equação 3)
137
Onde ̂ é a previsão para o tempo t+1, feita no período atual t; é a
constante de suavização, assumindo valores entre zero e 1; yt é o valor
observado (real) na série temporal para o tempo t; e ̂ é o valor da
previsão feita para o tempo t.
̂ (Equação 4)
[̂ ] (Equação 5)
( )⁄
6
Duas variáveis aleatórias são independentes se P (AB) = P(A* B)* P(B) = P(A)*P(B) .
138
Assim que a variância é estatisticamente equivalente para a média móvel
com (2 - ) / = 19. Em termos de variância, o Método de Suavização
Exponencial com este valor de é equivalente ao Método da Média
Móvel que utiliza 19 observações. Entretanto, se uma mudança no
processo ocorre, a Suavização Exponencial irá reagir mais rapidamente
com melhor ajuste do que o Método da Média Móvel.
(Equação 6)
[ ]
Onde é a média móvel (simples) de tamanho p calculada usando
todas as observações até o instante T(inclusive).
140
[ ]
é a média móvel (simples) de tamanho k calculada usando as k
observações anteriores ao instante t (inclusive);
[ ]
é a média móvel(dupla) de tamanho k calculada usando as k médias
[ ]
móveis simples anteriores ao instante t (inclusive).
p é o período usado no cálculo da média móvel;
( )( ) ( )
( ) ( ) ( )
̂ ( )
onde:
Et é a componente de nível;
Tt é a componente de tendência;
h é o horizonte de previsão;
k = 1, 2,..., h;
̂ é a previsão;
( ) ( )
Onde:
( ) ( )
E1 = y1 (Equação 14)
T1 = y2 – y1 (Equação 15)
Ou
( )
( ) ( ) ( )
( )
142
O modelo é muito usado para modelagem de produtos na fase de
divulgação quando começa a ser aceito pelo público consumidor.
143
Este fenômeno viola a consideração de que o processo que gera a série é
por uma componente de valor constante ou com tendência e outra
componente de flutuação aleatória, cujos métodos anteriores de previsão
(média móvel simples, suavização exponencial simples, média móvel dupla,
suavização exponencial dupla de Holt) não podem ser utilizados para
previsão.
Xt = + St + t ( )
Onde: t = 1, 2,...
O uso deste modelo deve ser para dados que possuam sazonalidade
crescente ou decrescente, mas não possuam tendência de crescimento ou
decrescimento.
( ) ( )
( ) ( )
̂ ( )
Onde:
145
s é o período sazonal ou duração da sazonalidade
h é o horizonte de previsão;
k = 1, 2,..., h, isto é, o número de períodos da previsão;
̂ é a previsão;
Este modelo pode ser usado quando ocorre sazonalidade, mas onde não
se verifica a presença de tendência. Além disso, a amplitude da
sazonalidade é aproximadamente constante ao longo do tempo.
O modelo pode ser usado para realizar a previsão de diversas variáveis tais
como a venda de sorvetes, brinquedos, preços de commodities, etc.
( ) ( ) ( )
( ) ( ) ( )
146
̂ ( )
Onde:
h é o horizonte de previsão;
̂ é a previsão;
147
Considerando que o modelo do processo que gera a série temporal seja
dado por:
Xt = + at + St + t (Equação 25)
Onde: t = 1, 2,...
a é a tendência do modelo;
( )( ) ( )
( ) ( ) ( )
148
( ) ( )
̂ ( ) ( ) ( )
onde:
Lt é a componente de nível;
Tt é a componente de tendência;
St é a componente de sazonalidade;
s é o período sazonal;
h é o horizonte de previsão;
k = 1, 2,..., h;
mod(n,m) é o resto da divisão de n por m;
̂ é a previsão;
com valores no intervalo 0<<1, é a constante de suavização da
componente de nível Lt;
com valores no intervalo 0<<1, é a constante de suavização da
componente tendência Tt;
com valores no intervalo 0<<1, é a constante de suavização da
componente de sazonalidade St
( )( ) ( )
( ) ( ) ( )
149
Uma maneira simples de se fazer essa estimativa é através da inicialização
do nível e da tendência no mesmo período m:
( ) ( )
( ) ( )
( )
150
Se no mês 36 vendermos 80 varas de pescar, como você faria para prever
a venda no mês 37? Para prever, simplesmente preencha a fórmula da
célula G39 na célula G40 ou entre com a fórmula =(D39+E39)*F28.
̂ ( )
151
O algoritmo de previsão do modelo sazonal aditivo de Holt-Winters é
baseado nas seguintes expressões:
( ) ( )( ) ( )
( ) ( ) ( )
( ) ( ) ( )
̂ ( )
S1 = x1 – Ls; S2 = x2 – Ls;...; Ss = xs - Ls
Conclusão
Todos estes métodos de previsão são muito básicos, mas muito úteis. Os
métodos de previsão de séries temporais podem ser mais avançados do
que estes considerados nos nossos exemplos acima. Eles são baseados nos
modelos Auto Regressive Integrated Moving Average (ARIMA) (também
conhecido como técnica de Box-Jenkins). Essencialmente estes assumem
que as séries temporais foram geradas por um processo probabilístico
com valores futuros relacionados aos valores passados, como também aos
erros de previsão passados. Para aplicar os modelos ARIMA a série
temporal precisa ser estacionária. Uma série temporal estacionária é
aquela uma cujas propriedades estatísticas tais como média, variância e
autocorrelação são constantes no decorrer do tempo.
BIBLIOGRAFIA
153