Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Apontamentos de Estatstica I
(Parte I)
LUANDA
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
2014
1
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
1. Introduo
SUMRIO
O que a Estatstica?
A Estatstica a cincia que se ocupa da obteno de informao, seu tratamento inicial, com a
finalidade de, atravs de resultados probabilsticos adequados, inferir de uma amostra para a
populao, e eventualmente prever a evoluo futura de um fenmeno. Em outras palavras, um
instrumento de leitura de informao, e da sua transformao em conhecimento.
v Estatsticas toda a funo que opera sobre a amostra. Isto , so valores no exactos,
dado que de uma populao se podem retirar diversas amostras estamos perante valores que
variam de amostra para amostra, e so designado por letras maisculas do alfabeto
Romano. Ex: mdia amostral ( X ), a varincia amostral (S2), desvio-padro amostral (S).
2
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
v Populao (ou Universo): Conjunto de unidades com uma ou mais caractersticas comuns
(n. de elementos N).
Exemplos:
Estatstica Inferencial: conjunto de mtodos estatsticos que visam caracterizar (ou inferir sobre)
uma populao a partir de uma parte dela (a amostra).
3
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
1.2- Evoluo histrica da Estatstica
O termo estatstica vem da expresso em Latim statisticum collegium isto , palestra sobre os
assuntos do Estado, de onde surgiu a palavra em lngua italiana statista, que significa "homem de
estado", ou poltico, e a palavra alem Statistik, designando a anlise de dados sobre o Estado. A
palavra foi proposta pela primeira vez no sculo XVII, em latim, por Schmeitzel na Universidade
de Lena e adoptada pelo acadmico alemo Godofredo Achenwall. Aparece como vocabulrio na
Enciclopdia Britnica em 1797, e adquiriu um significado de colecta e classificao de dados, no
incio do sculo 19.
Para que os governantes das grandes civilizaes antigas tivessem conhecimento dos bens que o
Estado possua e como estavam distribudos pelos seus habitantes, realizaram-se as primeiras
estatsticas, nomeadamente para determinarem leis sobre impostos e nmeros de homens
disponveis para combater. Estas estatsticas, eram frequentemente limitadas populao adulta
masculina.
O primeiro dado disponvel sobre um levantamento estatstico foi referido por Herdoto, que
afirmava ter-se efectuado em 3050 a.c um estudo das riquezas da populao do Egipto com a
finalidade de averiguar quais os recursos humanos e econmicos disponveis para a construo das
pirmides.
Existem indcios, que constam da Bblia, relativamente a recenseamentos feitos por Moiss (1490
a.c). Outra estatstica referida pelos investigadores foi feita no ano 1400 a.c, quando Ramss II
mandou realizar um levantamento das terras do Egipto.
As estatsticas realizadas por Pipino, em 758, e por Carlos Magno, em 762, sobre as terras que
eram propriedade da Igreja, so algumas das estatsticas importantes de que h referncias desde a
queda do imprio romano.
Para responder ao desenvolvimento social surgiram estas primeiras tcnicas estatsticas: classificar,
apresentar, interpretar os dados recolhidos foram para os censos e so para a Estatstica um aspecto
essencial do mtodo utilizado. Mas, um longo caminho havia de ser percorrido at aos dias de
hoje.
At ao incio do sc. XVII, a Estatstica limitou-se ao estudo dos assuntos de Estado. Usada
pelas autoridades polticas na inventariao ou arrolamento dos recursos disponveis, a Estatstica
limitava-se a uma simples tcnica de contagem, traduzindo numericamente factos ou fenmenos
observados fase da Estatstica Descritiva.
No sc. XVII, com os aritmticos polticos, nomeadamente John Graunt (1620-1674) e Sir William
Petty (1623-1687), inicia-se em Inglaterra uma nova fase de desenvolvimento da Estatstica, virada
para a anlise dos fenmenos observados na fase da Estatstica Analtica.
4
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
John Graunt, uma pessoa engenhosa e estudiosa, tinha o hbito de se levantar cedo para estudar,
antes da abertura da sua loja, inspirado nas tbuas de mortalidade que semanalmente se
publicavam na sua parquia, publicou, em 1660, um trabalho estatstico sobre a mortalidade dos
habitantes de Londres, procurando dar interpretaes sociais s listas de tempos de vida. Sir
William Petty, baseado neste trabalho, escreveu um livro de largo sucesso, divulgando a nova
cincia da Aritmtica Poltica.
Em 1692, o astrnomo Edmund Halley (1658-1744), famoso pela descoberta do cometa de rbita
elptica que se aproxima da Terra de 75 em 75 anos, baseando-se tambm em listas de nascimento
e falecimento, foi o percursor das actuais tabelas de mortalidade, base das anuidades dos seguros
de vida.
O desenvolvimento do Clculo das Probabilidades surgiu tambm no sculo XVII. A ligao das
probabilidades com os conhecimentos estatsticos veio dar uma nova dimenso Estatstica, que
progressivamente se foi tornando um instrumento cientfico poderoso e indispensvel. Considera-
se assim uma nova fase, a terceira, em que se comea a fazer inferncia estatstica: quando a partir
de observaes se procurou deduzir relaes causais, entre variveis, realizando-se previses a
partir daquelas relaes.
A palavra Estatstica surge, pela primeira vez, no sc. XVIII. Alguns autores atribuem esta origem
ao alemo Gottfried Achemmel (1719-1772), que teria utilizado pela primeira vez o termo statistik,
do grego statizein; outros dizem ter origem na palavra estado, do latim status, pelo aproveitamento
que dela tiravam os polticos e o Estado.
Na sua origem, a Estatstica estava ligada ao Estado. Hoje, no s se mantm esta ligao, como
todos os Estados e a sociedade em geral dependem cada vez mais dela. Por isso, em todos os
Estados existe um Departamento ou Instituto Nacional de Estatstica. Na actualidade, a Estatstica
j no se limita apenas ao estudo da Demografia e da Economia. O seu campo de aplicao
alargou-se anlise de dados em Biologia, Medicina, Fsica, Psicologia, Indstria, Comrcio,
Meteorologia, Educao, etc., e ainda a domnios aparentemente desligados, como estrutura de
linguagem e estudo de formas literrias.
1
Cfr WILLCOX, Walter (1938) The Founder of Statistics. Review of the International Statistical Institute
5(4):321-328.
5
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
1.3- Mtodo Estatstico de Resoluo de um Problema
Identificao do Problema
importante desde incio do estudo, ter claro, qual problema a analisar, e uma vez conhecido
importante saber, qual o tipo de decises que se pretende tomar.
A recolha de toda a informao pode ser feita directamente (quando os dados so obtidos da fonte
originria) ou de uma forma indirecta (quando dados recolhidos provm j de uma recolha
indirecta).
Os dados obtidos de fonte originria, isto , quando possvel encontrar em registos ou ficheiros,
chamam-se dados primrios; enquanto que os valores no disponveis nestas fontes e calculados a
partir daqueles so dados secundrios.
Exemplos:
Dados Primrios: Todos os dados resultantes de inquritos feitos directamente a uma populao
ou a um grupo desta populao.
As fontes dos dados podem ainda ser classificados como internas e externas.
6
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
No que diz respeito periodicidade, a recolha dos dados pode ser classificada como:
Muitas vezes acontece, no estar disponvel toda informao necessria ou porque no existe, ou
porque, se encontra desactualizada. Nestes casos necessrio fazer uma nova recolha de
informao
Uma vez recolhidos os dados, necessrio proceder-se a uma reviso crtica, de modo ao suprir
valores estranhos ou eliminar erros capazes de provocar futuros enganos de apresentao e anlise
ou mesmo de enviesar concluses obtidas.
Aqui comea o principal objectivo da estatstica descritiva, criar os instrumentos necessrios para
classificar e apresentar conjuntos de dados numricos, de modo que a informao neles contida
seja compreendida mais fcil e rapidamente. Este processo de classificao consiste na
identificao de unidades de informao com caractersticas comuns e no agrupamento em classes.
Uma vez classificados os dados, passa a ser possvel sintetizar a informao neles contida com
ajuda de quadros e valores numricos descritivos, que ajudem a compreender a situao e a
identificar relaes importantes entre as variveis.
Anlise e Interpretao
Por ltimo necessrio, interpretar os resultados encontrados. A interpretao ser tanto mais
facilitada quanto se tiver escolhido em etapas anteriores, os instrumentos mais apropriados
representao e anlise do tipo de dados recolhidos.
Dependendo do tipo de variveis que constituem os dados estes podem ser expressos em quatro
escalas distintas: nominal, ordinal, por intervalo e por rcios.
Os dados qualitativos exprimem-se nas duas primeiras escalas e os dados quantitativos nas duas
ltimas.
Exemplos:
O tipo de sangue de uma pessoa (O, A, B e AB)
7
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
Categorias taxionmicas das plantas ou animais.
O sexo (0 - Feminino, 1 - Masculino) ou questes que apenas podem ser
respondidas com sim ou no.
v Escala Ordinal so os valores (numricos ou no) que possuem uma ordem intrnseca.
Esta escala de medida pode ser construda a partir de escalas nominais quando existe
paralelismo evidente entre a escala nominal e uma sequncia crescente ou decrescente com
significado.
Exemplos:
Pode-se perguntar a um consumidor qual a sua opinio sobre um determinado
produto alimentar de acordo com a seguinte lista: (detesta; gosta pouco;
indiferente; gosta; adora), sendo evidente que esta lista corresponde a uma
sequncia ordenada com cinco categorias.
Classificaes obtidas no 2 e 3 ciclos do ensino bsico (1 a 5).
Classificao dos camares para venda.
Grupos etrios (crianas, jovens, adultos e idosos)
Exemplos:
O nmero de automveis que atravessa a ponte Elisabeth em cada hora pode ser
definido numa escala por intervalos de valores discretos, por exemplo, entre 0 e
150; entre 150 e 300; entre 300 e 450, etc.
A temperatura mnima diria do ar em C numa estao meteorolgica num
determinado ano pode ser definido numa escala por intervalos de valores
contnuos, por exemplo, [-5, 0[; [0, 5[; [5, 10[; [10, 15[; etc.
Exemplos:
O peso pode constituir uma escala por rcios (a razo entre os pesos de dois
pacotes de acar, por exemplo, sempre o mesmo qualquer que seja a unidade
de medida: g, kg, ton., etc.) mas a temperatura no (10C = 50 F; 30 C=86 F
porm 10/30 50/86.
Medidas de comprimento, reas, pesos ou intervalos de tempo.
8
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
2. Estatstica Descritiva
SUMRIO
A varivel uma caracterstica (quantificada) que pode variar de elemento para elemento, de uma
amostra ou populao.
Exemplo:
X representa a hemoglobina no sangue;
x =14,2 representa a hemoglobina de um certo indivduo
Uma amostra pode conter mais de uma caracterstica para cada uma das unidades observadas.
Por exemplo na populao angolana, podem interessar vrias caractersticas dos indivduos: o
peso, a altura, a cor dos olhos, a raa, o tipo de sangue, etc.
Tipos de variveis
9
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
discretas. Com exemplo temos: comprimento de um escaravelho, o n de filhos de um casal, a
temperatura da gua, etc.
Variveis nominais: no existe ordenao dentre as categorias. Por exemplo: sexo, cor dos
olhos, fumante/no fumante, doente/sadio.
OBS:
Exemplos:
1- A varivel idade, medida em anos completos, quantitativa (contnua); mas, se for informada
apenas a faixa etria (0 a 5 anos, 6 a 10 anos, etc.), qualitativa (ordinal).
2- O peso dos lutadores de boxe, uma varivel quantitativa (contnua) se trabalha com o valor
obtido na balana, mas qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso -
pena, peso-leve, peso -pesado, etc.).
Outro ponto importante que nem sempre uma varivel representada por nmeros
quantitativa.
Exemplos:
1- O nmero do telefone de uma pessoa, o nmero da casa, o nmero de sua identidade.
2- s vezes o sexo do indivduo registrado na placa de dados como 1 se for masculino e 2 se for
feminino. Isto no significa que a varivel sexo passou a ser quantitativa!
10
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
2.2- Apresentao dos Dados
Quando nos deparamos com muitos dados no classificados torna-se muito difcil tirar concluses.
Por isso necessrio proceder a um trabalho prvio de ordenao e apresentao desses valores, e
a mesma pode ser feita por quadros e grficos.
Quer os quadros, quer os grficos devem apresentar trs partes: o cabealho, o corpo e o rodap. O
cabealho deve dar-nos a informao sobre os dados, em que consistem e a que se referem (lugar e
poca); o corpo representado pelas colunas e sub colunas dentro dos quais se apresentam os
dados; no rodap, para alm da identificao dos dados, podero ainda incluir-se quaisquer
observaes pertinentes.
v Quadros
A UCAN resolveu observar as alturas (em cm) dos alunos de uma turma de Contabilidade e
Administrao do 2 Ano. O resultado obtido foi o seguinte:
Quadro 1: Alturas (em cm) dos alunos de uma turma de C. A do 2 Ano
150 169 174 155 165 170 172
152 158 163 158 166 158 166
170 171 162 171 161 154 168
161 164 166 164 162 156 167
Fonte: UCAN, 2009
11
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
Quadro 3: Vendas de Livros no ano de 2005
Meses do Ano Volumes Vendidos
Janeiro 70,436.00
Fevereiro 77,450.00
Maro 71,030.00
Abril 71,425.00
Maio 72,260.00
Junho 72,520.00
Julho 73,075.00
Agosto 73,612.00
Setembro 74,085.00
Outubro 74,350.00
Novembro 74,728.00
Dezembro 74,100.00
Fonte: Livraria Novo Horizonte
v Grficos
A representao grfica dos dados estatsticos tem por finalidade, dar uma ideia, mais imediata dos
resultados obtidos permitindo chegar-se a concluses mais rpidas sobre a evoluo do fenmeno
em estudo ou sobre a relao entre os diferentes valores apresentados.
Os mais comuns so: o diagrama de barras, o histograma, grfico de sectores e o grfico de linhas.
Grfico de Linhas
o mais utilizado de entre todos os tipos de grficos devido a sua facilidade de execuo e de
interpretao.
Grficos de Sectores
Consiste na representao grfica dos resultados num crculo, por meio de sectores.
Histograma
12
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
A frequncia correspondente a cada classe ou intervalo representada pela superfcie de um
rectngulo, cuja base, situada no eixo horizontal, limitada pelos valores extremos. Cada
rectngulo proporcional frequncia de cada classe ou intervalo.
Grfico de Linhas
Quadro 3: Vendas de Livros no ano de 2005
78,000.00
76,000.00
74,000.00
Quantidade Vendida
72,000.00
70,000.00
68,000.00
66,000.00
Janeiro Fevereiro Maro Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro
Meses
13
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
Grficos de Sectores
Janeiro
Fevereiro
Maro
Fevereiro
Maro
Abril
Histograma
14
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
2.2.2- Distribuio de Frequncias
Considerando uma populao (N) ou uma amostra (n) de indivduos com a caracterstica que
representa p modalidades observadas X1,X2, X3, ,Xp . Chama-se distribuio de frequncias
ao conjunto de todos os valores ou modalidades de uma varivel e das frequncias ou numero de
ocorrncias correspondentes.
Nas tabelas de distribuio de frequncias representa-se a forma como uma dada varivel se
encontra distribuda pelo conjunto dos indivduos em que essa varivel foi analisada, tendo
aplicao tanto em variveis qualitativas como quantitativas.
Varivel Discreta
A frequncia relativa (fi), dada por fi = Fi/N, isto , o nmero de vezes que esse valor ocorre
(Fi) relativamente ao total da amostra (n) ou populao (N).
As frequncias acumuladas (cum Fi; cum fi), representam a soma do nmero de ocorrncias para
os valores da varivel inferiores ou iguais ao valor dado, isto , o nmero ou proporo de
elementos observados que possuem o valor da caracterstica igual ou inferir modalidade em
causa.
15
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
Exemplo:
Varivel Qualitativa
Suponha que se pretende estudar a marca de computadores portteis preferida pelos estudantes do
ensino superior. Tendo-se questionado 50 estudantes obtiveram-se os dados representados na
Tabela seguinte:
TOSHIBA COMPAQ COMPAQ TOSHIBA TOSHIBA ACER ACER COMPAQ FUJITSU COMPAQ
FUJITSU IBM FUJITSU IBM COMPAQ TOSHIBA FUJITSU FUJITSU IBM TOSHIBA
ACER TOSHIBA IBM IBM IBM IBM FUJITSU COMPAQ TOSHIBA ACER
FUJITSU COMPAQ ACER IBM IBM TOSHIBA COMPAQ TOSHIBA COMPAQ TOSHIBA
14
Fi
12
10
0
COMPAQ TOSHIBA FUJITSU ACER HP IBM Marca de C omp.
16
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
Grfico sectorial
Marcas de computadores preferida pelos alunos universitrios
Porque a marca de computadores uma varivel qualitativa no possvel fazer outro tipo de
grficos.
Interpretao:
- Dos 50 estudantes entrevistados 26 preferem a marca compaq, ao passo que apenas um prefere a
marca HP;
Varivel Discreta
17
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
Variveis Contnuas
Nesse caso recorre-se distribuio dos dados por classes ou clulas. Aqui ser necessrio
introduzir alguns conceitos novos como: o nmero de classes (K), a amplitude (ai), limite e ponto
mdio ou centro de classes.
Existem algumas regras bsicas que devero ser consideradas na construo dos intervalos:
Levando em considerao as regras bsicas, para se determinar o nmero de classes (K), por
vezes adoptada a seguintes solues:
R (Valormximo - Valormnimo )
ai = =
K K
O exemplo n. 2, mais utilizado, e ser o adoptado nas aulas para estudo da estatstica descritiva.
O ponto mdio ou centro da classe (Ci), a mdia aritmtica entre o limite inferior e superior da
classe.
18
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
Exemplo:
A UCAN resolveu observar as alturas (em cm) dos alunos de uma turma de Contabilidade e
Administrao do 2 Ano. O resultado obtido foi o seguinte:
-Mdia (aritmtica,
harmnica e geomtrica)
Tendncia Central
-Medina
- Moda
Medidas de Localizao
-Quartis
Tendncia no Central - Decis
- Percentis
Tendncia Central
- Mdia Aritmtica
A mdia uma medida de localizao de tendncia central, sendo representada por X ou por
conforme se trate, da mdia amostral (estatstica) ou da mdia populacional (parmetro).
19
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
Dados no tabelados
n
x i
X= i =1
n
Onde:
xi o valor observado
n o nmero total de observaes
Dados Discretos
n n
X i Fi n X i Fi n
m= i =1
= X i fi X= i =1
= X i fi
N i =1 n i =1
Onde:.
Dados Contnuos
C F
n
m= i =1
i i n
= Ci f i
C F i i n
N X= i =1
= Ci f i
i =1 n i =1
Onde:.
Ci : centro da classe; N : somatrio de Fi; Fi: a frequncia absoluta e fi a frequncia relativa.
f (X i i - m) = 0
2- A mdia do quadrado dos desvios dos valores da varivel em relao mdia mnima.
f (X - m)
2
i i mnimo
Vantagens:
- Facilidade de calculo e de interpretao, e por isso muito utilizada;
20
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
- Utilizar toda a informao disponvel e poder ser calculada com preciso matemtica.
Desvantagens:
- Ser influenciada por valores extremos que tomam um peso significativo no calculo da
mdia;
- Poder no corresponder a um valor concreto da varivel.
Mediana
o valor que divide uma srie ordenada de tal forma que pelo menos a metade das observaes
sejam iguais ou maiores do que ela, e que haja pelo menos outra metade de observaes maiores
do que ela.
Dados discretos
Quando se tratam de dados discreto, primeiramente temos que saber se a distribuio par ou
impar.
N +1
- Se F i = N For impar ento, a mediana ser o central de ordem
2
N +2 N
+
- Se Fi = N For impar ento, a mediana ser o central de ordem 2 2
2
Exemplo 1:
Xi Fi CumFi
1 1 1
2 3 4
3 7 11
4 2 13
Soma 13
21
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
Exemplo 2:
Xi Fi CumFi
82 5 5
85 10 15
87 15 30
89 8 38
90 4 42
Soma 42
2- Achar a frequncia acumulada absoluta que contm este valor 21,5, neste caso a frequncia
acumulada que contm 21,5 a 30;
Dados Contnuos
22
Curso de Economia e Gesto UCAN/ 2014
Por: Albertina Delgado
0,5 - Cumf i ( Me-1)
Me = li( Me ) + a ( Me )
f i ( Me )
23