Sei sulla pagina 1di 22

ESTATSTICA

MUITAS APLICAES EM EXCEL


e poucas frmulas...

JOS DIAS CURTO


https://fenix.iscte-iul.pt/homepage/jjdc@iscte.pt/livro_estatistica
dias.curto@iscte.pt
expressamente proibido reproduzir, no todo ou em parte, sob qualquer forma
ou meio, NOMEADAMENTE FOTOCPIA, esta obra. As transgres-
ses sero passveis das penalizaes previstas na legislao em vigor.

Visite a pgina do livro:


https://fenix.iscte-iul.pt/homepage/jjdc@iscte.pt/livro_estatistica

FICHA TCNICA:
Ttulo: Estatstica, muitas aplicaes em Excel e poucas frmulas
Autor: Jos Joaquim Dias Curto
c Jos Joaquim Dias Curto


Design: Starline - Freepik.com; Freepik


Direo de arte: Filipa Pestana
Impresso e acabamentos: GUIDE  Artes Grcas, Lda
1a edio, setembro de 2016
Depsito Legal: 414740/16
ISBN: 978-989-20-6961-6
Para o Toms e para a Ticas
ndice

Prefcio xi
A estatstica sempre por perto xiii
1 Coisas simples mas necessrias 1
1.1 Gnero e Salrio: so a mesma coisa? . . . . . . . . . . . . . . 1
1.1.1 Dados qualitativos . . . . . . . . . . . . . . . . . . . . 3
1.1.2 Dados quantitativos . . . . . . . . . . . . . . . . . . . 4
1.2 Dados de sries cronolgicas, seccionais e em painel . . . . . . 4
1.2.1 Variveis discretas e contnuas . . . . . . . . . . . . . . 5
1.3 Apresentao dos dados: em tabelas, por classes... . . . . . . 6
1.4 Preparar o Excel . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4.1 Suplemento Analysis ToolPack . . . . . . . . . . . . 8
1.4.2 Outros suplementos para o Excel . . . . . . . . . . . . 10
1.4.3 Funes de estatstica . . . . . . . . . . . . . . . . . . 11
1.5 Ficheiros de dados . . . . . . . . . . . . . . . . . . . . . . . . 12
1.6 Breve caraterizao dos funcionrios da PIXIES . . . . . . . . 13
1.7 procura de dados para analisar . . . . . . . . . . . . . . . . 21

2 O que dizem os dados? (No jogo nem tarot...) 23


2.1 Poupar para comprar um automvel . . . . . . . . . . . . . . 25
2.2 Quanto vale uma empresa de SI em Portugal? . . . . . . . . . 31
2.2.1 Indicao sobre o VNme e RLme por empresa . . . . . 34
2.2.2 Quantis e percentis . . . . . . . . . . . . . . . . . . . . 37
2.3 Para destacar as diferenas entre empresas . . . . . . . . . . . 39
2.4 O peso das anormalidades . . . . . . . . . . . . . . . . . . . 43
2.5 Rendibilidade e risco nos mercados nanceiros . . . . . . . . . 49

Apndices 63
Apndice 2.A Clculo dos percentis em Excel . . . . . . . . . . . . 63

i
NDICE

3 possvel dormir mais descansado? 65


3.1 No certo? Mas tem uma probabilidade... . . . . . . . . . . 67
3.2 Variveis aleatrias . . . . . . . . . . . . . . . . . . . . . . . . 70
3.3 Caratersticas das distribuies de probabilidade . . . . . . . 76
3.3.1 Mdia ou valor esperado . . . . . . . . . . . . . . . . . 76
3.3.2 Varincia . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.3.3 Covarincia e coeciente de correlao simples . . . . . 79
3.4 Distribuies de probabilidade tericas . . . . . . . . . . . . . 80
3.4.1 Distribuies: o que so e para que servem? . . . . . . 81
3.4.2 Todos tm a mesma probabilidade . . . . . . . . . . . 83
3.4.3 Sucessos/Insucessos: quantos so, quantos so? . . . . 84
3.4.4 Com reposio: distribuio hipergeomtrica . . . . . 93
3.4.5 Limitar no espao ou no tempo . . . . . . . . . . . . . 95
3.4.6 Distribuio Normal . . . . . . . . . . . . . . . . . . . 96
3.4.7 Distribuio do qui-quadrado . . . . . . . . . . . . . . 106
3.4.8 Distribuio t de Student . . . . . . . . . . . . . . . . 108
3.4.9 Distribuio F de Snedecor . . . . . . . . . . . . . . . 110
3.5 Simulao de vendas . . . . . . . . . . . . . . . . . . . . . . . 113
3.5.1 Distribuio Uniforme: U(a, b) . . . . . . . . . . . . . 114
3.5.2 Distribuio Triangular: T(a, b, c) . . . . . . . . . . . 120
3.5.3 Distribuio Exponencial . . . . . . . . . . . . . . . . 123
3.5.4 Simulao de vendas da empresa WILDNOTHING . . 125

Apndices 129
Apndice 3.A Momentos e parmetros de ordem de uma distribuio129

4 Uma parte para revelar o todo 131


4.1 Populao e amostra . . . . . . . . . . . . . . . . . . . . . . . 132
4.2 Mtodos de seleo das amostras . . . . . . . . . . . . . . . . 134
4.3 Parmetros e estatsticas . . . . . . . . . . . . . . . . . . . . . 140
4.4 Distribuies por amostragem (DPA) . . . . . . . . . . . . . . 141
4.4.1 Teorema do Limite Central . . . . . . . . . . . . . . . 146
4.4.2 DPA da mdia amostral . . . . . . . . . . . . . . . . . 147
4.4.3 DPA da varincia amostral . . . . . . . . . . . . . . . 147
4.4.4 DPA da proporo amostral . . . . . . . . . . . . . . . 148
4.5 Estimao paramtrica . . . . . . . . . . . . . . . . . . . . . . 148
4.6 Propriedades em amostras nitas . . . . . . . . . . . . . . . . 150
4.7 Propriedades em grandes amostras . . . . . . . . . . . . . . . 152
4.8 Estimao por intervalos . . . . . . . . . . . . . . . . . . . . . 155
4.9 Dimenso de uma amostra aleatria simples . . . . . . . . . . 159
4.9.1 Populaes de Bernoulli . . . . . . . . . . . . . . . . . 161

ii
NDICE

4.9.2 Populaes normais . . . . . . . . . . . . . . . . . . . 163

5 Testar para decidir 165


5.1 Na Bolsa, para ganhar ou para perder? . . . . . . . . . . . . 166
5.1.1 Abordagem do intervalo de conana . . . . . . . . . . 169
5.1.2 A abordagem dos testes (ou ensaios) de hipteses . . . 170
5.1.3 Aceitar ou No Rejeitar, que terminologia utilizar? 177
5.1.4 Tipo de erros . . . . . . . . . . . . . . . . . . . . . . . 179
5.2 O impacte da formao nas vendas dos lojistas . . . . . . . . 181
5.2.1 Teste diferena de duas mdias  amostras indepen-
dentes . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
5.2.2 Teste igualdade de varincias . . . . . . . . . . . . . 183
5.2.3 Teste diferena de duas mdias  amostras emparelhadas189
5.3 Testes normalidade da distribuio . . . . . . . . . . . . . . 192
5.3.1 Testes aos coecientes de assimetria e de curtose . . . 192
5.3.2 Teste de Jarque-Bera (JB) . . . . . . . . . . . . . . . 193
5.3.3 Teste de Kolmogorov-Smirnov (KS) . . . . . . . . . . 194

6 Variao com variao d... relao 197


6.1 Anlise de correlao paramtrica . . . . . . . . . . . . . . . . 198
6.1.1 Diagrama de disperso . . . . . . . . . . . . . . . . . . 199
6.1.2 Covarincia e Coeciente de correlao simples . . . . 202
6.2 Anlise de correlao no paramtrica . . . . . . . . . . . . . 208
6.3 Adivinhar? Pode-se tentar... com a regresso (simples) . . . . 212
6.3.1 O modelo de regresso linear simples . . . . . . . . . . 215
6.3.2 Funo de regresso . . . . . . . . . . . . . . . . . . . 217
6.3.3 O mtodo dos mnimos quadrados ordinrios . . . . . 226
6.3.4 Coeciente de determinao (r 2 ) . . . . . . . . . . . . 228
6.3.5 Hipteses do modelo de regresso linear . . . . . . . . 230
6.3.6 Distribuio por amostragem dos estimadores OLS . . 235
6.3.7 Inferncia estatstica no modelo . . . . . . . . . . . . 239
6.3.8 Predio no modelo . . . . . . . . . . . . . . . . . . . 243
6.3.9 Consumo de eletricidade . . . . . . . . . . . . . . . . . 244

7 Mais coisas na relao entre duas variveis 253


7.1 Escala e unidades de medida . . . . . . . . . . . . . . . . . . . 254
7.2 Modelo logartmico ou modelo linear-log . . . . . . . . . . . . 256
7.3 Modelo log-linear (ou modelo semilogartmico) . . . . . . . . 261
7.4 Modelo duplo-log (ou modelo log-log) . . . . . . . . . . . . . . 265
7.5 Relaes inversas . . . . . . . . . . . . . . . . . . . . . . . . . 268
7.6 Polinmios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269

iii
NDICE

7.7 Comparao dos valores de R2 entre modelos . . . . . . . . . 270

Apndices 279
Apndice 7.A Efeitos marginais e Elasticidades . . . . . . . . . . . 279
Apndice 7.B Funes exponencial e logartmica . . . . . . . . . . 281
7.B.1 Propriedades das funes . . . . . . . . . . . . . . . . 283
7.B.2 Propriedades das derivadas das funes . . . . . . . . 284
7.B.3 O conceito de elasticidade . . . . . . . . . . . . . . . . 285

8 Explicar melhor com a regresso 287


8.1 Os estimadores OLS . . . . . . . . . . . . . . . . . . . . . . . 288
8.1.1 Coecientes estandardizados . . . . . . . . . . . . . . 290
8.1.2 Coecientes de correlao part e parcial . . . . . . . . 291
8.2 Coeciente de determinao corrigido (ou ajustado) . . . . . . 292
8.3 Mais sobre o teste F . . . . . . . . . . . . . . . . . . . . . . . 294
8.3.1 Poder explicativo e signicncia estatstica . . . . . . . 296
8.3.2 Igualdade de coecientes . . . . . . . . . . . . . . . . . 301
8.4 Erros de especicao . . . . . . . . . . . . . . . . . . . . . . 303
8.4.1 O problema da multicolinearidade . . . . . . . . . . . 304
8.4.2 Forma funcional da relao . . . . . . . . . . . . . . . 311
8.4.3 Variveis explicativas endgenas . . . . . . . . . . . . 314
8.4.4 Teste de Chow . . . . . . . . . . . . . . . . . . . . . . 314
8.4.5 Heteroscedasticidade . . . . . . . . . . . . . . . . . . . 316
8.4.6 Autocorrelao . . . . . . . . . . . . . . . . . . . . . . 322

Bibliograa 331

v
i
Lista de Tabelas

1.1 Dados de Funcionrios . . . . . . . . . . . . . . . . . . . . . . 2


1.2 Tabela de Frequncias . . . . . . . . . . . . . . . . . . . . . . 15
1.3 Tabela de Frequncias: Resultados . . . . . . . . . . . . . . . 17
1.4 Tabela de Frequncias: Idade e Salrio . . . . . . . . . . . . . 18

2.1 Despesas mensais da famlia Pereira . . . . . . . . . . . . . . 26


2.2 Poupana dos Pereira para comprar o automvel . . . . . . . 30
2.3 Volume de Negcios (Vendas: VN), Resultados Lquidos (RL)
e Nmero de Trabalhadores (FT) das 30 Maiores Empresas
Portuguesas de Sistemas de Informao (Ano 2011) . . . . . . 32
2.4 Medidas de estatstica descritiva: resultados . . . . . . . . . . 35
2.5 Quartis e Percentis: clculo . . . . . . . . . . . . . . . . . . . 39
2.6 Quartis e Percentis: resultados . . . . . . . . . . . . . . . . . 39
2.7 Cotaes e Rendibilidades dirias do PSI20, SONAE e REN . 51
2.8 Medidas de estatstica descritiva: Resultados . . . . . . . . . 55
2.9 Taxas mdias de rendibilidade diria . . . . . . . . . . . . . . 58
2.10 Anlise de outliers: Resultados . . . . . . . . . . . . . . . . . 59

3.1 Conceito frequencista de probabilidade . . . . . . . . . . . . . 70


3.1 Funo de distribuio . . . . . . . . . . . . . . . . . . . . . . 110
3.2 Quantis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
3.1 Medidas de estatstica descritiva . . . . . . . . . . . . . . . . 117
3.2 Medidas de estatstica descritiva: N(0,1) . . . . . . . . . . . . 119
3.3 Medidas de estatstica descritiva: T(0, 50, 10) . . . . . . . . . 123
3.4 Medidas de estatstica descritiva: Exp( = 0.5) . . . . . . . . 125

4.1 Dimenso da amostra: clculos . . . . . . . . . . . . . . . . . 163


4.2 Dimenso da amostra: resultados . . . . . . . . . . . . . . . . 164

5.1 Resultados do teste F (igualdade de varincias) . . . . . . . . 184


5.2 Resultados do teste F (igualdade de varincias) . . . . . . . . 185

v
LISTA DE TABELAS

5.3 Teste T para as variveis L1CFDepois e L1SFDepois . . . . . 187


5.4 Teste T para a diferena de mdias . . . . . . . . . . . . . . . 189
5.5 Resultados do teste T para amostras emparelhadas (L1CF) . 191

6.1 Varincias e Covarincias . . . . . . . . . . . . . . . . . . . . 205


6.2 Coeciente de correlao simples . . . . . . . . . . . . . . . . 206
6.1 Coeciente de Spearman: ordenao dos valores . . . . . . . . 211
6.1 Nmero e receita dos turistas . . . . . . . . . . . . . . . . . . 212
6.2 Salrios por anos de escolaridade . . . . . . . . . . . . . . . . 218
6.3 Mdia condicional, valor estimado, erros e resduos . . . . . . 223
6.4 Clculos preliminares para estimar 1 e 2 . . . . . . . . . . . 227
6.5 Modelo de regresso linear simples: resultados . . . . . . . . . 246
6.6 Resduos OLS . . . . . . . . . . . . . . . . . . . . . . . . . . . 249

7.1 Efeitos marginais decrescentes . . . . . . . . . . . . . . . . . . 275


7.A.1Formas funcionais, efeitos marginais e elasticidades . . . . . . 280

8.1 Modelo de regresso linear mltipla: resultados . . . . . . . . 299


8.1 Coecientes de correlao part: Resultados . . . . . . . . . . . 308
8.2 Tolerncia e VIF . . . . . . . . . . . . . . . . . . . . . . . . . 309
8.3 Correlao e Multicolinearidade . . . . . . . . . . . . . . . . . 309
8.4 Modelo de regresso linear mltipla: sem varivel rendimento . 311
8.5 RL vs VN e TRAB . . . . . . . . . . . . . . . . . . . . . . . . . 319
8.6 Valores estimados de Y e Resduos OLS . . . . . . . . . . . . 319
8.7 Teste de White . . . . . . . . . . . . . . . . . . . . . . . . . . 321

vi
Lista de Figuras

1 Rendibilidade e Risco de um Fundo de Aes . . . . . . . . . xv

1.1 Instalao do suplemento Analysis ToolPack . . . . . . . 9


1.2 Comando Data Analysis (Anlise de Dados) . . . . . . . . 10
1.3 Janela de comandos estatsticos . . . . . . . . . . . . . . . . . 10
1.4 Instalao de suplemento extra . . . . . . . . . . . . . . . . . 11
1.5 Suplemento RealStats . . . . . . . . . . . . . . . . . . . . . 12
1.6 Introduo de funo . . . . . . . . . . . . . . . . . . . . . . . 12
1.7 Funes estatsticas . . . . . . . . . . . . . . . . . . . . . . . . 13
1.8 Funo FREQUENCY/FREQUNCIA . . . . . . . . . . . . . . . . . 16
1.9 Frequncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.10 Histograma: Introduo de dados . . . . . . . . . . . . . . . . 19
1.11 Histograma: Desempenho . . . . . . . . . . . . . . . . . . . . 20
1.12 Histograma: Salrio . . . . . . . . . . . . . . . . . . . . . . . 20
1.13 Histograma: Salrio . . . . . . . . . . . . . . . . . . . . . . . 21

2.1 Medidas de estatstica descritiva: clculo . . . . . . . . . . . . 34


2.2 Outliers severos e moderados . . . . . . . . . . . . . . . . . . 43
2.3 Tipos de assimetria . . . . . . . . . . . . . . . . . . . . . . . . 44
2.4 Efeito do peso das caudas na assimetria . . . . . . . . . . . 46
2.5 Histograma: Introduo de dados . . . . . . . . . . . . . . . . 52
2.6 Histograma: PSI20 . . . . . . . . . . . . . . . . . . . . . . . . 53
2.7 Medidas de estatstica descritiva: Clculo . . . . . . . . . . . 54
2.8 Anlise de outliers: Clculo . . . . . . . . . . . . . . . . . . . 59
2.9 Medidas de estatstica descritiva: tabela dinmica . . . . . . . 61
2.10 Medidas de estatstica descritiva: tabela dinmica 1. . . . . . 61
2.11 Medidas de estatstica descritiva: tabela dinmica 2. . . . . . 62

3.1 Frequncias relativas do PSI20, SONAE e REN . . . . . . . . 70


3.1 Funo densidade de probabilidade . . . . . . . . . . . . . . . 73

vii
LISTA DE FIGURAS

3.2 Funes densidade de probabilidade: f (x), e de distribuio:


F (x), de uma varivel aleatria com distribuio normal es-
tandardizada . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.1 Distribuio das vendas (milhares de euros) . . . . . . . . . . 82
3.2 Funo BINOM.DIST . . . . . . . . . . . . . . . . . . . . . . 88
3.3 Funo NEGBINOM.DIST . . . . . . . . . . . . . . . . . . . 92
3.4 Funo densidade de probabilidade de uma varivel aleatria
com distribuio normal . . . . . . . . . . . . . . . . . . . . . 97
3.5 Distribuio normal: clculo de probabilidades em Excel . . . 99
3.6 RETPSI20  Introduo da linha . . . . . . . . . . . . . . . . 105
3.7 RETPSI20  Histograma com sobreposio da curva Normal . 106
3.8 Distribuio qui-quadrado: funo densidade de probabilidade 108
3.9 Distribuio t de Student: funo densidade de probabilidade
para diferentes graus de liberdade . . . . . . . . . . . . . . . . 110
3.10 Distribuio F : funo densidade de probabilidade para dife-
rentes graus de liberdade . . . . . . . . . . . . . . . . . . . . . 112
3.1 Funo densidade de probabilidade U(2,4) . . . . . . . . . . . 115
3.2 Dados, Anlise de Dados, Histograma . . . . . . . . . . . 118
3.3 Histograma: distribuio U(0,1) . . . . . . . . . . . . . . . . . 119
3.4 Histograma: distribuio N(0,1) . . . . . . . . . . . . . . . . . 120
3.5 Funo densidade de probabilidade T(0, 12, 4) . . . . . . . . 121
3.6 Histograma: distribuio T(0, 50, 10) . . . . . . . . . . . . . . 123
3.7 Funo densidade de probabilidade Exp( = 0.5) . . . . . . . 124
3.8 Histograma: distribuio Exp( = 0.5) . . . . . . . . . . . . . 126

4.1 Amostra aleatria . . . . . . . . . . . . . . . . . . . . . . . . . 136


4.2 Gerao aleatria . . . . . . . . . . . . . . . . . . . . . . . . . 137
4.1 Amostras aleatrias . . . . . . . . . . . . . . . . . . . . . . . . 143
4.2 Amostras aleatrias . . . . . . . . . . . . . . . . . . . . . . . . 143
4.3 Histograma: introduo de dados . . . . . . . . . . . . . . . . 144
4.4 Histograma: introduo de dados da distribuio normal . . . 145
4.5 Histograma com sobreposio da curva normal . . . . . . . . 145

5.1 Regies de No Rejeio (RNR) e de Rejeio (RR) . . . . . . 170


5.2 Testes Unilateral Esquerdo e Unilateral Direito . . . . . . . . 171
5.3 Regies de No Rejeio (RNR) e de Rejeio (RR) . . . . . . 174
5.4 Clculo da probabilidade associada ao valor de Z . . . . . . . 175
5.5 Regio de No Rejeio (RNR) e de Rejeio (RR) . . . . . . 178
5.1 ndices de cumprimento antes, durante e depois da formao . 181
5.2 Teste F igualdade de varincias . . . . . . . . . . . . . . . . 184
5.3 Teste t igualdade das mdias . . . . . . . . . . . . . . . . . 186

viii
5.4 Teste T para amostras emparelhadas . . . . . . . . . . . . . . 191

6.1 Diagramas de disperso . . . . . . . . . . . . . . . . . . . . . 200


6.2 Diagrama de disperso . . . . . . . . . . . . . . . . . . . . . . 201
6.3 Diagrama de disperso SONAE-PSI20: procedimento de clculo203
6.4 Diagrama de disperso SONAE-PSI20: grco . . . . . . . . . 204
6.5 Covarincia: Introduo de dados . . . . . . . . . . . . . . . . 204
6.6 Coeciente de correlao: Introduo de dados . . . . . . . . 205
6.7 Diagrama de disperso . . . . . . . . . . . . . . . . . . . . . . 208
6.1 Evoluo da Receita e do No de Turistas . . . . . . . . . . . . 213
6.2 Diagrama de disperso . . . . . . . . . . . . . . . . . . . . . . 214
6.3 Retas alternativas . . . . . . . . . . . . . . . . . . . . . . . . 215
6.4 Distribuio condicional dos salrios por anos de escolaridade 219
6.5 Funes de regresso da populao e da amostra . . . . . . . 224
6.6 Mdia condicional dos erros . . . . . . . . . . . . . . . . . . . 232
6.7 Varincia condicional dos erros (homoscedasticidade) . . . . . 234
6.8 Varincia condicional dos erros (heteroscedasticidade) . . . . 235
6.9 Ausncia de autocorrelao . . . . . . . . . . . . . . . . . . . 236
6.10 Modelo de regresso linear simples: Estimao . . . . . . . . . 245
6.11 Normalidade dos erros . . . . . . . . . . . . . . . . . . . . . . 250
6.12 Homoscedasticidade e Autocorrelao . . . . . . . . . . . . . . 251

7.1 Modelo lin-log . . . . . . . . . . . . . . . . . . . . . . . . . . . 259


7.2 yields - maturidade . . . . . . . . . . . . . . . . . . . . . . . . 260
7.3 yields - logaritmo da maturidade . . . . . . . . . . . . . . . . . 260
7.1 PIB Norte-Americano . . . . . . . . . . . . . . . . . . . . . . 264
7.1 Modelo log-log . . . . . . . . . . . . . . . . . . . . . . . . . . 267
7.1 Risco de uma carteira de ttulos . . . . . . . . . . . . . . . . . 269
7.1 Funes Linear e Quadrtica . . . . . . . . . . . . . . . . . . 274
7.2 Valores estimados da varivel dependente . . . . . . . . . . . 277
7.B.1Funo Exponencial . . . . . . . . . . . . . . . . . . . . . . . 281
7.B.2Funo Logartmica . . . . . . . . . . . . . . . . . . . . . . . 282

8.1 Modelo de regresso linear mltipla: Estimao . . . . . . . . 298


8.1 Correlao: Introduo de dados . . . . . . . . . . . . . . . . 308
8.2 Resduos ao quadrado vs valores estimados de RL . . . . . . . 319
8.3 Autocorrelao dos erros . . . . . . . . . . . . . . . . . . . . . 324
8.4 Regies da estatstica de Durbin-Watson . . . . . . . . . . . . 325

ix
x
Prefcio
H j vrios anos que leciono e coordeno disciplinas (agora designadas
unidades curriculares, UCs) em cursos de ps-graduao e em mestrados exe-
cutivos. As designaes so variadas (Estatstica Aplicada, Tcnicas Quanti-
tativas para Finanas, Pesquisa e Anlise de Dados, Anlise de Dados e Infor-
mao, Mtodos Quantitativos Aplicados s Vendas, Mtodos Quantitativos
Aplicados, etc.) mas todas andam volta da matemtica, da estatstica e
da econometria, as matrias mal-amadas da maior parte dos estudantes. No
que eles no vejam interesse nos temas lecionados, mas o problema so as
bases... Assustam-se com a equao da curva de Gauss, estranham a palavra
ln, perguntam como que passo para o outro lado da equao e pedem,
quase sempre, para explicar outra vez e/ou mais devagar.
Muitos j no tm matemtica desde o 9o ano, outros tiveram at ao 12o
ano mas j no se lembram de quase nada e muitos j deram tudo mas o
tempo encarregou-se de lhes limpar a memria...
Perante este cenrio, e quando as aulas comeam, muitos dos alunos tm
uma expectativa quase catastrca sobre o resultado nal: O que que vai
acontecer?, Se calhar vou chumbar... E fazem muitas perguntas O profes-
sor chumba muitos alunos?, As notas so muito baixas?,  preciso saber
muita matemtica? Eu j no me lembro de quase nada..., E estatstica?
J foi h tantos anos...
Mas depois da primeira aula, e pelo menos at bem prximo do exame,
a calma regressa e quase todos admitem que sou capaz!. Deve ser porque
o mtodo de lecionao lhes transmite coragem e conana. A exposio das
matrias, mais baseada em nmeros do que em letras, relativiza o carter
abstrato das letras e as frmulas complexas, assustadoras e desmobiliza-
doras reduzem-se ao que essencial. Para alm disto, e antes de qualquer
frmula se revelar intimidatria, h sempre uma explicao prvia que a con-
textualiza na matria e que permite, atravs de palavras, compreender a sua
necessidade e perceber todos (ou quase todos...) os elementos (abstratos) que
a compem. Como j devem ter reparado, a utilizao da palavra frmulas
uma forma suave de me referir matemtica...
Mas para a acalmia ser denitiva ainda necessrio dar muitos exemplos
de situaes reais onde as matrias lecionadas podem ser aplicadas (e assim
xi
realar a utilidade respetiva) e libert-los da necessidade de fazer contas
sempre que os clculos envolvem frmulas mais complexas. Essa tarefa ca
a cargo do computador e dos programas utilizados: nas aulas os alunos
aprendem a trabalhar com o suplemento Analysis ToolPack do Excel e com
o SPSS. Outros ainda, dependendo do curso e da UC lecionada, utilizam
tambm o EViews. Sempre que possvel as aulas decorrem num laboratrio
de informtica com computadores disposio, mas h tambm cursos em que
os alunos so convidados a trazer o computador pessoal e a instalar o SPSS.
Em qualquer dos casos os alunos servem-se do computador para produzir
resultados a partir dos programas utilizados.
 ou no  este o mtodo que mais serve a quem frequenta uma ps-
graduao ou um mestrado executivo? Tenho a certeza que sim. Para estes
alunos e para as empresas onde trabalham, e  espero que estejam a per-
ceber, os fundamentos matemticos no so assim to importantes... O que
importa que saibam utilizar os programas para produzir informao a par-
tir dos dados disponveis e que sejam capazes de interpretar os resultados de
forma a tirar o mximo proveito dessa informao. E  est claro que este
o objetivo principal do mtodo que utilizo.
E agora o porqu deste livro. Ao longo destes anos tenho preparado e
disponibilizado materiais luz deste mtodo: frmulas quanto baste, cpias
de janelas do Excel (para ilustrar os comandos) e texto muito objetivo no
sentido de apresentar conceitos, descrever mtodos e... comentar resultados.
Penso que chegou o momento de lhes dar uma arrumao e apresent-los
sob a forma de livro esperando que, pela sua simplicidade e objetividade,
possa constituir um instrumento de trabalho para todos aqueles que utilizam
a estatstica como mtodo de apoio tomada de deciso.
Termino este prefcio agradecendo, primeiro, aos grandes mestres e pro-
fessores (portugueses) por me terem ajudado a perceber alguma coisa de
estatstica: Bento de Jesus Caraa, Tiago de Oliveira, Bento Murteira, Da-
niel Mller, Silva Ribeiro, Filomena Pimenta, Dinis Pestana, Elizabeth Reis e
Ivette Gomes. E em segundo, a todos os meus alunos pela estima, dedicao
e carinho que me merecem. Espero poder continuar a contar com eles (os que
j foram e os que ho-de vir a ser...) para comentar, encontrar coisas menos
explcitas, identicar erros (se os houver...) e contribuir assim para uma nova
edio ainda mais de acordo com as necessidades dos leitores: prossionais
que encaram os mtodos estatsticos no como um bicho de sete cabeas
mas como ferramentas importantes na anlise e tratamento de dados. Ainda
um obrigado muito especial Filipa pela capa bonita que inventou.

Lisboa, setembro de 2016

xii
A estatstica sempre por perto
Todos os dias recorremos matemtica e estatstica, mesmo que no
nos demos conta. No supermercado utilizamos a soma para saber quanto
gastmos e a diferena para calcular o troco. Na bomba de gasolina multipli-
camos o preo pelos litros de combustvel para saber quanto que vo custar
os prximos quilmetros a andar de carro. Em casa dividem-se as 8 pastilhas
pelos quatro lhos do casal (apesar do mais velho reclamar uma quantidade
maior...).
Mas a matemtica no se esgota nestas coisas simples da vida... Muito
do bem bom que temos hoje, e que aumentou de forma considervel nos
ltimos anos, deve-se matemtica. Sim, no tenham dvidas! Como no
estamos aqui para destacar as benfeitorias da matemtica, sugiro que leiam
os livros de Guillen (1995) e Stewart (2003) para me darem razo1 .
Apesar de no ser fcil separar a estatstica da matemtica, o nosso en-
foque a estatstica e o grande objetivo evidenciar como ela faz parte das
nossas vidas.
Comeamos pelo Totoloto (apesar do Euromilhes estar na moda...). Jo-
guei outra vez esta semana e... nada! No tenho sorte nenhuma. Pois... a
probabilidade de sair o totoloto, por cada aposta jogada, de 1 em 13983816,
ou seja, 0.00000007151, e  quase impossvel ser bafejado pela sorte (a
Santa Casa, e os que dela dependem, que no nos ouam...). Alis, h mesmo
quem diga que maior a probabilidade de ser atropelado por um carro do que
sair o totoloto. Mas h tambm quem diga que ele sai, sai! Portanto, no
um acontecimento impossvel.
Quando vamos ao futebol queremos que o nosso clube ganhe. Mas nunca
sabemos antes do jogo se tal vai acontecer. Para a vitria ser certa, sem-
pre se pode comprar o rbitro... Mas, independentemente do rbitro e da
capacidade dos nossos jogadores, h sempre fatores aleatrios (imprevisveis,
mas que ainda assim tm uma probabilidade de acontecer) que inuenciam o
1 J Galileu (1564-1642) no distante sculo XVII acreditava que a matemtica seria a chave para
a compreenso do universo. Newton, Bernoulli, Faraday, Clausis e Einstein, entre tantos outros,
viriam a dar-lhe razo. Para Galileu o grande livro do universo estava escrito em linguagem
matemtica.

xiii
resultado (por exemplo, o nosso melhor avanado lesionou-se e a equipa no
marcou golos). Portanto, quando se entra no estdio a esperana grande
mas a incerteza no resultado ainda maior.
Probabilidade, aleatrio e acontecimento so termos comuns que tm fun-
damento na estatstica, como se explica mais adiante. Certo, incerto e espe-
rana tambm no lhes so estranhos. Mas no se ca por aqui...
Quando pergunta ao lho (ou ao amigo) a nota que teve no exame de
fsica e ele lhe responde: 12, no h razes para grande entusiasmo. Mas se
ele disser que a mdia da turma foi 6, a a coisa muda de gura e at lhe
pode dar um abrao de parabns!
A mdia talvez o melhor exemplo da nossa convivncia com a esta-
tstica pela frequncia com que utilizada. Quantos quilos tem este saco
de laranjas? O fornecedor disse que o peso mdio de cada saco so dois
quilos. Em mdia quanto tempo demoras a chegar escola? Cerca de 30
minutos. At o banco regista o saldo mdio da sua conta bancria...
E j que falamos de bancos, o que vai fazer com os 5000 euros que pou-
pou no timo ano? Se no os gastar, sempre pode fazer uma aplicao que
lhe proporcione algum rendimento. Na hora de decidir revela-se o quanto
afoito e destemido (aquilo que em nanas se designa por averso ao risco).
Se optar por um depsito a prazo, o banco d-lhe 2% ao m de uma ano (que
representam 100 euros). Se comprar obrigaes da empresa BAUHAUS, a
taxa do cupo 4% (o dobro em euros: 200) e pode tambm comprar, cota-
o de 5 euros, 1000 unidades de participao (UP) do fundo de aes CURE
de um banco a operar em Portugal (a informao que consta do prospeto do
fundo, e que nos interessa, apresentada na gura 1).
Neste caso no possvel antecipar o valor do rendimento pois depende
da cotao das UP no momento da venda. Nesta data pode ganhar e ter
uma mais-valia, perder e incorrer numa menos-valia ou car em casa se a
cotao das UP estiver acima, abaixo ou nos 5 euros. Se a cotao estiver nos
6 euros, por exemplo, tem uma rendibilidade de 20%. Fantstico, vai ganhar
1000 euros!... Mas tambm pode acontecer o contrrio e o preo baixar para
os 4 euros. Neste caso perde 1000 euros e, ao nal de um ano, dos 5000 euros
iniciais restam apenas 4000... Ou seja, do depsito a prazo para as aes o
risco do seu investimento vai aumentando.
O termo risco pode at nem lhe ser familiar, mas percebe, de certeza, que
a possibilidade de ter um rendimento elevado maior nas aes. Alis, se
atentar na informao do prospeto, a rendibilidade do fundo foi de 13.94%
e 25.18% nos ltimos 12 e 24 meses, respetivamente, bem acima dos 2% e
4% oferecidos pelo depsito bancrio e pelas obrigaes. Mas leia tambm
a nota que se apresenta: as rendibilidades representam dados passados, no
constituindo garantia de rendibilidade futura. Alis, tambm est escrito que

xiv
Figura 1: Rendibilidade e Risco de um Fundo de Aes

o valor das UP pode cair e... neste caso incorre numa perda. Portanto, mais
arriscado aplicar os 5000 euros no fundo de aes, pois com o depsito a
prazo ou as obrigaes esto garantidos o capital inicial mais 100 ou 200 euros
de juros, respetivamente (admitindo que o banco e a empresa BAUHAUS no
vo falncia). Os nanceiros chamam risco possibilidade da coisa correr
mal e de perder parte (ou at mesmo a totalidade) do capital investido. Nos
casos do BES e do BANIF, por exemplo, os acionistas perderam tudo...
Ora bem, o risco  das nanas 1 mas so da estatstica as formas de
o quanticar. A medida mais utilizada o desvio-padro, como se apresenta
mais adiante, e antes de ser uma medida de risco uma medida de disperso,
designao dada pela estatstica a um conjunto de medidas para aferir sobre
a variao do fenmeno em causa. Se olhar novamente para a informao
do prospeto, e mesmo que no saiba o que o desvio-padro (mas que car
a saber mais adiante), as colunas Classe de risco e Escalo de risco so bem
claras sobre o perigo que investir no fundo de aes. Nos ltimos 2 anos
o risco foi superior a 18% ( como se pudssemos dizer, apesar de no ser
totalmente correto, que o valor das UP tanto pode subir como descer 18%) e
est na penltima classe de risco (risco elevado). Para melhor contextualizar
os 18%, e admitindo que o banco do depsito a prazo e a empresa BAUHAUS
no vo falncia, ao m de um ano receber os 5000 euros mais os juros
vencidos. Portanto, o risco 0%, que compara com os 18% do fundo de aes.
L esto o risco e a estatstica por detrs de uma deciso importante que
1 Da metereorologia, da medicina, da engenharia...

xv
pode tomar: comprar ou no as unidades de participao daquele fundo.
E para no me tornar chato ao defender a minha dama deixo apenas
mais trs exemplos da nossa familiaridade com a estatstica. No dia 9 de
agosto a temperatura em Vilamoura atingiu os 40o , coisa muito rara nos
ltimos 20 anos. Em estatstica estes valores pouco frequentes merecem uma
ateno especial e designam-se por outliers1 , se quisermos utilizar o termo em
ingls, ou valores extremos. A amplitude trmica (AT) diria na Beira Baixa
muito elevada. A AT (no confunda com Autoridade Tributria...) a
diferena entre as temperaturas mxima e mnima dirias e na estatstica esta
diferena constitui tambm uma medida de disperso designada por intervalo
de variao. Na minha empresa cerca de 95% dos funcionrios ganham entre
1200 e 3800 euros. O que quer dizer que o salrio dos restantes 5% inferior
a 1200 ou superior a 3800 euros. No sei se o fez, mas para chegar concluso
este patro pode ter recorrido distribuio normal, mais um instrumento
muito importante da estatstica.
E podamos continuar... mas penso que j os convenci da convivncia
e da importncia da estatstica no nosso dia a dia. E prometo que vai
descobrir muitas outras coisas onde a estatstica j , ou vir a ser, impor-
tante para a sua tomada de deciso. A aplicao dos 5000 euros j foi um
princpio... mas para j vamos estrutura deste livro.
No prximo captulo comea-se (de forma ligeira...) a falar dos dados,
o objeto da estatstica: classicao e formas de apresentao. Dene-se
varivel e prepara-se o Excel para utilizao futura (sempre na perspetiva
da estatstica...). Calculam-se e interpretam-se as frequncias absolutas e
relativas, o valor da moda e constri-se o primeiro histograma.
No captulo 2 introduz-se e aplica-se a generalidade das medidas de esta-
tstica descritiva para ajudar a famlia Pereira na compra de um automvel,
para analisar as vendas e os resultados lquidos das 30 maiores empresas de
sistemas de informao em Portugal no ano 2011 e para avaliar o risco e a
rendibilidade do ndice PSI20 e das aes das empresas SONAE e REN.
No captulo 3 discutem-se e aplicam-se os instrumentos estatsticos para
lidar com os fenmenos de natureza aleatria, introduzindo os conceitos de
probabilidade, varivel aleatria e distribuio de probabilidade. A seguir
descrevem-se com algum detalhe e aplicam-se as distribuies tericas mais
importantes: Binomial, Poisson, Normal, t-Student, F-Snedecor, etc. O ca-
ptulo termina com a simulao de vendas de uma empresa considerando-se
as distribuies Triangular, Normal e Exponencial para modelo probabilstico
terico das quantidades vendidas de trs produtos.
A distino entre amostra e populao constitui o mote do captulo 4.
1 Apesar de ser um termo em ingls, e por aparecer de forma recorrente no texto, a partir de agora
a palavra outlier vai deixar de ser apresentada em itlico.

xvi
Se no se consegue chegar a toda a populao, pelo menos pode recolher-se
uma amostra, o mais representativa possvel daquela populao. Explica-se
tambm a diferena entre parmetro e estatstica e fala-se de distribuies por
amostragem das estatsticas mais importantes: mdia, varincia e proporo
amostrais, no esquecendo o teorema do limite central (que ajuda que ele
nos d!...). A partir das distribuies por amostragem possvel deduzir
intervalos de conana para os parmetros e calcular tambm a dimenso
de uma amostra aleatria simples tendo em conta a dimenso da populao
(se conhecida...), o nvel de conana e o erro amostral em que se pretende
incorrer.
O captulo 5 trata dos testes de hipteses, comeando por apresentar as
abordagens do intervalo de conana e dos testes de hipteses na realizao
de inferncias sobre determinada populao. Distinguem-se ensaios de signi-
cncia de testes de hipteses e explica-se o signicado dos erros tipo I e II na
tomada de deciso. Por ltimo, procede-se descrio e aplicao de alguns
testes, nomeadamente o teste t para a diferena de mdias com o propsito de
avaliar o efeito das aes de formao nas vendas dos lojistas de uma empresa
portuguesa, e os testes mais populares (Jarque-Bera e Kolmogorov-Smirnov)
para aferir sobre a normalidade da distribuio de uma varivel aleatria.
Nos trs captulos seguintes andamos s voltas com a relao entre gran-
dezas econmicas e nanceiras. Se o preo de um bem aumentar, qual
o efeito expectvel sobre a quantidade vendida? Bem, se no for um da-
queles bens mesmo essenciais (po, por exemplo), as vendas devem baixar
(que se cuidem as empresas fornecedoras...). No captulo 6 apresentam-se e
aplicam-se as anlises de correlao e regresso linear simples. Com a pri-
meira consegue-se avaliar o tipo (linear ou no linear), o sentido (direta
ou inversa) e a intensidade (forte ou fraca) da relao. Para isso costuma
recorrer-se a uma representao grca (diagrama de disperso) e a uma me-
dida (coeciente de correlaao simples). A anlise de regresso linear, por
ser mais completa, permite avaliar como que a variao de uma varivel
impacta na variao da outra (se o preo do po aumentar 10 cntimos, qual
a reduo expectvel no valor da vendas). Neste captulo discute-se ainda o
mtodo dos mnimos quadrados ordinrios, as propriedades dos estimadores,
os pressupostos do modelo de regresso linear simples e a inferncia estatstica
atravs dos testes t e F .
Uma vez que as relaes no lineares so tambm bastante comuns entre
variveis de natureza econmica e nanceira, no captulo 7 so analisadas ou-
tras funes de regresso que, apesar de constiturem relaes no lineares na
sua forma original, podem ser convertidas em funes lineares nos parmetros
atravs de transformaes adequadas (a transformao logartmica a mais
utilizada). Para isso so propostas formas funcionais alternativas para a fun-

xvii
o de regresso conhecidas vulgarmente por lin-lin, log-lin, lin-log e log-log.
Tambm se analisam relaes polinomiais e inversas bem como a alterao
na escala dos dados e o seu impacte nas estimativas dos mnimos quadrados
ordinrios.
E o modelo de regresso linear mltipla (captulo 8) pe m a esta pe-
quena odisseia... um modelo mais completo (com mais variveis expli-
cativas) para responder melhor complexidade da vida real. Fala-se ou-
tra vez do mtodo dos mnimos quadrados ordinrios, do R2 , dos testes t
e F e introduzem-se novas medidas: coeciente de determinao ajustado,
coecientes estandardizados, coecientes de correlao parcial, etc. Por m,
avaliam-se de forma mais formal os pressupostos do modelo de regresso linear
atravs dos procedimentos estatsticos mais comuns (quase sempre baseados
em testes de hipteses).
E mesmo mesmo a acabar... faz-se um apanhado das referncias biblio-
grcas. Espero no me ter esquecido de nenhuma... mas se tal acontecer, as
minhas sinceras desculpas a quem cou injustamente de fora.

xviii