Sei sulla pagina 1di 40

ESTATÍSTICA DESCRITIVA

2010/2011 - 2º Semestre
ESTATÍSTICA DESCRITIVA

A Estatística Descritiva estatística visa predominantemente recolher, organizar, sumariar e


apresentar informação relativa a factos numéricos através da criação de instrumentos
adequados: quadros, gráficos e indicadores numéricos.

Associado às tarefas de organizar , recolher, sumariar e apresentar informação relativa a


factos numéricos, desenvolveram-se técnicas que permitem também interpretar, analisar e
actuar com base nessa informação. O conjunto dessas técnicas ficou conhecido pelo nome
de Estatística Indutiva ou Inferência Estatística ou ainda Estatística Matemática

ESTATÍSTICA

Estatística Descritiva: Estatística Indutiva:


Conjunto de técnicas para Conjunto de técnicas para fazer
recolher, organizar, sumariar e inferências acerca das
apresentar informação numérica características de uma certa
relativa a uma certa actividade. população.

Estimação: Teste de Hipóteses:


Ramo da inferência estatística que Ramo da inferência estatística que visa, a
visa determinar uma ou várias partir da informação contida numa amostra,
características numéricas de uma saber se certas conjecturas ou presunções
população a partir da informação acerca das características numéricas de
parcial contida numa amostra. uma população são válidas ou não.
ESTATÍSTICA DESCRITIVA

TÉCNICAS DE AMOSTRAGEM
grau de incerteza associado à
aleatoriedade da escolha da
População
amostra

Redução de informação

INFERÊNCIA
ESTATÍSTICA

Amostra

quantificar a incerteza
PROBABILIDADES quando passamos da ESTATÍSTICA
amostra para a população DESCRITIVA
ESTATÍSTICA DESCRITIVA

COMPILAÇÃO
RECOLHA

ESTATÍSTICA

ANÁLISE INTERPRETAÇÃO

Fases Fundamentais:

• Estatística Descritiva

Consiste em recolher, sintetizar e representar de uma forma


compreensível a informação contida num conjunto de dado
(amostra)

• Inferência Estatística
com base nos resultados da amostra pretende-se caracterizar o
todo, a partir do qual tais dados foram obtidos (população)
ESTATÍSTICA DESCRITIVA

Fases do Método de Análise Estatística

No âmbito da Estatística, o método de abordagem dos problemas pode ser

decomposto nas cinco fases que seguidamente se enunciam:

• Estabelecimento do objectivo da análise a efectuar (isto é, das questões que se

colocam e que se pretendem ver resolvidas) e definição da(s) população(ões)

correspondente(s).

• Concepção de um procedimento adequado para a selecção de uma ou mais

amostras (escolha das técnicas de amostragem a utilizar).

• Recolha de dados.

• Análise dos dados (Estatística Descritiva);

• Estabelecimento de inferências acerca da população (Inferência Estatística).


ESTATÍSTICA DESCRITIVA

Métodos de Amostragem
Acidental Conveniência

Não probabilísticos Intencional


Quotas ou proporcional
(empíricos)
Desproporcional

Aleatória Simples – a selecção da amostra pode ser feita por sorteio ou usando
uma tabela ou um gerador de números

Sistemática – consiste em ordenar por algum critério a população, calcular o intervalo


de selecção i = N/n (arredondando o valor obtido por defeito) e escolher aleatoriamente uma
unidade de entre as primeiras e finalmente seleccionar as unidades que distam i, 2i, 3i,…

Estratificada – quando a população a estudar é muito heterogénea, a população é


Probabilísticos dividida em grupos homogéneos e mutuamente exclusivos de acordo com alguma
característica (idade, sexo, religião, etc) sendo extraída aleatoriamente uma amostra de cada
um desses grupos.
(aleatórios)
Por Aglomerados – indicada para situações em que é difícil a identificação dos
elementos da população. Consiste em dividir a população em subconjuntos de elementos da
população (conglomerados) representativos dessa mesma população, seleccionar
aleatoriamente alguns desses conglomerados e incluir na amostra todos os elementos dos
conglomerados seleccionados.
ESTATÍSTICA DESCRITIVA

Fases do Método de Análise Estatística

Identificação do problema  objectivo da análise

Planeamento da experiência  Técnicas de Amostragem

Recolha de dados

Análise exploratória dos dados  Estatística Descritiva

Análise e interpretação dos resultados  Inferência Estatística


ESTATÍSTICA DESCRITIVA

Estatística Descritiva: Teoria das Probabilidades:

1 – Apresentação e organização da 4 – Probabilidade;


informação;
5 – Distribuições de probabilidade típicas
2 – Medidas descritivas
6 – Distribuições por amostragem
3 – Números índices

Inferência Estatística:

7 – Estimação e testes de hipóteses;

8 – Regressão simples

9 – Regressão múltipla

10 – Análise de variância

11 – Séries temporais
ESTATÍSTICA DESCRITIVA

Universo
Ou
População

População Finita (susceptível de


ser tratada como tal)
Conjunto de todos os elementos
que contêm uma certa
característica que estamos
População Finita (susceptível de
interessados em estudar. Sendo
ser tratada como infinita)
comum a todos os elementos, esta
característica varia em quantidade
ou qualidade. Uma população pode
ter dimensão finita ou infinita.
População Infinita
ESTATÍSTICA DESCRITIVA

o processo de amostragem deve recorrer a


métodos probabilísticos nos quais cada um dos
elementos da população tem uma certa
Amostragem probabilidade (conhecida) de ser incluído na
amostra. Destes métodos o mais utilizado é o de
amostragem aleatória.

Universo
Ou
Amostra
População

Subconjunto de dados que pertencem à


população. As amostras aleatórias são
escolhidas através de processos
(técnicas de amostragem) que nos
garantem que o subconjunto obtido é
representativo da população.
ESTATÍSTICA DESCRITIVA

Amostragem Variáveis Qualitativas

Universo
Ou
Amostra
População

As observações que constituem a amostra definem-se por dados ou variáveis


que podem ser de natureza qualitativa ou quantitativa
Variáveis Qualitativas – representam informação que identifica alguma
qualidade, categoria ou característica, não susceptível de ser medida, mas de
classificação, assumindo várias modalidades (cor dos olhos, sexo, raça, etc)
ESTATÍSTICA DESCRITIVA

Amostragem
Variáveis Qualitativas

Universo
Ou
Amostra
População
Discretas

Variáveis Quantitativas

Contínuas

Variáveis Quantitativas – representam informação resultante de características susceptíveis de


serem medidas isto é, que podem mensurar-se e exprimem-se em valores. Estas variáveis
apresentam-se com diferentes intensidades:
Variáveis Quantitativas Discretas – São as que podem assumir um nº finito (ou infinito
numerável) de valores distintos. Assim, no caso destas variáveis é sempre possível
listar todos os valores possíveis da variável (nº trabalhadores, nº filhos, idade, etc)
Variáveis Quantitativas Contínuas – São as que podem assumir todos os valores numéricos
compreendidos no seu intervalo de variação isto é, podem assumir um nº infinito ou uma
infinidade não numerável de valores (altura, peso, etc).
ESTATÍSTICA DESCRITIVA

Amostragem

Universo
Ou
Amostra Estatística Descritiva
População

Estudo
da amostra:
- Tabelas
- Gráficos
- Medidas…

A Estatística Descritiva tem como objecto a recolha, classificação e organização de


dados permitindo elaborar conclusões apenas para o subconjunto limitado de
indivíduos que serviram de base à recolha desses dados ou seja, apenas para a
amostra.

A informação fornecida pelos dados é compilada e sintetizada em tabelas, gráficos e


através de indicadores numéricos. O desafio da estatística descritiva consiste não na
própria construção das tabelas ou dos gráficos mas na escolha mais adequada
destas ferramentas de modo a caracterizar correctamente as variáveis em estudo.
ESTATÍSTICA DESCRITIVA

Amostragem

Universo
Ou
Amostra Estatística Descritiva
População

Estudo
da amostra:
- -Tabelas
Tabelas
- Gráficos
- Medidas…

Nas Tabelas de Distribuição de Frequências representa-se a forma como uma dada


variável se encontra distribuída pelo conjunto dos indivíduos em que essa variável foi
analisada, tendo aplicação tanto em variáveis quantitativas como qualitativas.

Classificação das variáveis – designa-se por variável qualquer símbolo que


represente uma característica ou atributo da população ou amostra que estamos
interessados em estudar.
ESTATÍSTICA DESCRITIVA

Frequência Absoluta (de um acontecimento):


número de ocorrências do acontecimento

Distribuição de
Frequências de Dados / Frequência Relativa: número de ocorrências
Variáveis Discretas relativo ao total

Frequência Acumulada: soma das frequências


absolutas ou relativas dos valores da variável
inferiores ou iguais ao valor dado
ESTATÍSTICA DESCRITIVA

A construção formal de uma tabela de frequência deverá ser a seguinte:

Valor da Frequência Frequência


Frequência Acumulada
Variável Absoluta Relativa
(x i ) (F i ) (f i ) Absoluta (F a) Relativa (f a)
x1 n1 f1 N1 = n1 F1 = f1
x2 n2 f2 N2 = n1 + n2 F2 =f1 +f2
… … …
… … …
xn nn fn Nn = n1 + n2+…+ nn = N Fn = f1 + f2+…+ fn = 1
Total N 1

em que:
a) fi = Fi / N  a frequência relativa de um acontecimento é igual à
frequência absoluta a dividir pelo número total de acontecimentos.

b) fi = f1 + f2 + … + fn = 1  a soma de todas as frequências relativas é


igual a 1 (100%)
ESTATÍSTICA DESCRITIVA

Ex 1 - Tabela de frequência do nº de filhos de uma


amostra de 10 casais:
0, 0, 0, 1, 1, 2, 2, 2, 2, 4
ESTATÍSTICA DESCRITIVA

Ex 2 – Suponha uma experiência concebida para verificar se um dado é ou não


viciado. A experiência consiste em lançar o dado 54 vezes e registar o resultado
obtido em cada lançamento.
Resultados obtidos nos 54 lançamentos

1ª conclusão - O espaço amostral desta experiência é um conjunto discreto,


limitado e de dimensão reduzida, correspondendo a A=[1,2,3,4,5,6]
ESTATÍSTICA DESCRITIVA

As variáveis continuas, por poderem assumir um número infinito não numerável de valores,
obrigam à definição de classes de valores, que passam a ser as modalidades da característica
em estudo.

Para definir estas classes é necessário introduzir alguns novos conceitos: o número de
classes, a amplitude, limite e ponto médio ou centro das classes.

Regras que deverão ser observadas na construção dos intervalos (nº de classes):

a) Em geral, o número de classes (K) deverá estar compreendido entre 4 e 14


b) Nenhuma classe deverá ter uma frequência nula;
c) As classes deverão ter, sempre que possível, amplitudes iguais;
d) Os pontos médios das classes deverão ser de cálculo fácil,
e) Deverão ser evitadas classes abertas
f) Os limites das classes são definidos de modo a que cada valor da variável é incluído num
e só num intervalo

Tendo em conta estas regras básicas, pode adoptar uma das seguintes alternativas para
determinar o nº de classes:
i) Nº de classes K =5 para n < 25 e K para n>=25
ii) Fórmula de Sturges: k = 1 + (10/3) x log N
ESTATÍSTICA DESCRITIVA

Formas de expressar os limites das classes:


i) [10, 12] compreende todos os valores entre 10 e 12;
ii) [10, 12[ compreende todos os valores entre 10 e 12 excluindo o 12
iii) ]10, 12] compreende todos os valores entre 10 e 12 excluindo o 10

O Ponto Médio da classe é a média aritmética entre o limite superior e o limite


inferior da classe:
(10  12)
 11
2

A Amplitude de uma classe é igual à diferença entre o valor mais elevado da


classe (ou limite superior) e o valor mais baixo (limite inferior)

(12 - 10)  2
ESTATÍSTICA DESCRITIVA

Ex: Suponha que registou a duração, em horas, de uma amostra de 40 pilhas


extraídas ao acaso de um lote de produção diário. Os valores obtidos foram os
seguintes:

45,7 44,7 44,5 44,1 45,3 45,6 45,2 43,8 44,2 45,2

45 44,8 43,7 44,4 43,8 43,9 43,9 44,2 44,7 45,5

45,8 44,5 45 44,7 44,2 44,9 43,7 45,5 44,9 45,7

45 43,8 44,9 44,5 45,3 44 43,6 43,9 44,5 44,4

Como se pode observar entre o valor mínimo (43.6) e o valor máximo (45.8)
existem um nº infinito de valores, alguns observados outros não. Nesse caso
recorre-se à distribuição dos dados por classes.

K  nº de classes  N 10
K 1 log N  K  1  3.333 * log 40
 40  6,66(6) 3
K  6,34
ESTATÍSTICA DESCRITIVA

Ex: Suponha que registou a duração, em horas, de uma amostra de 40 pilhas


extraídas ao acaso de um lote de produção diário. Os valores obtidos foram os
seguintes:

45,7 44,7 44,5 44,1 45,3 45,6 45,2 43,8 44,2 45,2

45 44,8 43,7 44,4 43,8 43,9 43,9 44,2 44,7 45,5

45,8 44,5 45 44,7 44,2 44,9 43,7 45,5 44,9 45,7

45 43,8 44,9 44,5 45,3 44 43,6 43,9 44,5 44,4

Com base nos resultados obtidos dever-se-iam criar 7 classes. Por uma questão
de simplificação vamos criar apenas 5 classes.

Para saber a amplitude das classes fazemos:


(45,8 – 43,6) / 5  0,44  0,5 arredonda-se por excesso
ESTATÍSTICA DESCRITIVA

Ex: Suponha que registou a duração, em horas, de uma amostra de 40 pilhas


extraídas ao acaso de um lote de produção diário. Os valores obtidos foram os
seguintes:

45,7 44,7 44,5 44,1 45,3 45,6 45,2 43,8 44,2 45,2

45 44,8 43,7 44,4 43,8 43,9 43,9 44,2 44,7 45,5

45,8 44,5 45 44,7 44,2 44,9 43,7 45,5 44,9 45,7

45 43,8 44,9 44,5 45,3 44 43,6 43,9 44,5 44,4

Uma vez definidas as classes, o processo de construção da tabela de distribuição


é semelhante ao utilizado para as variáveis discretas.

Frequência Frequência
Frequência Acumulada
Duração (h) Absoluta Relativa
(Fi) (fi) Absoluta (Fa) Relativa (fa)
[43,6 a 44,1[ 9 22,5% 9 22,5%
[44,1 a 44,6[ 7 17,5% 16 40,0%
[44,6 a 45,1[ 11 27,5% 27 67,5%
[45,1 a 45,6[ 7 17,5% 34 85,0%
[45,6 a 46,1[ 6 15,0% 40 100,0%
Total 40 100,0%
ESTATÍSTICA DESCRITIVA

Amostragem

Universo
Ou
Amostra Estatística Descritiva
População

Estudo
da amostra:
- -Gráficos
Tabelas
- Gráficos
- Medidas…

O recurso frequente a Gráficos tem como finalidade dar uma síntese visual da
distribuição de frequências. A apresentação gráfica utilizada vai depender do tipo de
variável (discreta ou contínua) e de se tratar de uma frequência simples ou
acumulada.
ESTATÍSTICA DESCRITIVA

Representação Gráfica de Distribuições de Frequência

As frequências absolutas e relativas para variáveis quantitativas discretas ou


qualitativas podem ser representadas em gráficos de barras, ou polignos de
frequência.

Poligno de frequência variaveis discretas

0,250

0,200

Frequência relativa
0,150

0,100

0,050

0,000
1 2 3 4 5 6
Pontos
ESTATÍSTICA DESCRITIVA

Representação Gráfica de Distribuições de Frequência

As frequências absolutas e relativas para variáveis quantitativas contínuas


podem ser representadas histogramas ou polignos de frequência (linha
poligonal – obtém-se unindo os pontos do histograma correspondentes aos
centros de classes).

30,0%

25,0%

20,0%

15,0%

10,0%

5,0%

0,0%
1 2 S1
3
4
5
ESTATÍSTICA DESCRITIVA

Representação Gráfica de Distribuições de Frequência

A curva de frequência pode assumir muitas formas:

Assimétrica Normal Assimétrica


Direita Esquerda
ESTATÍSTICA DESCRITIVA

Amostragem

Universo
Ou
Amostra Estatística Descritiva
População

Estudo
da amostra:
- -Medidas
Tabelas
- Gráficos
- Medidas…

Os indicadores numéricos (Medidas) sumariam a informação contida nos dados e,


quando calculados para uma amostra, denominam-se Estatísticas.
ESTATÍSTICA DESCRITIVA

Amostragem

Universo
Ou
Amostra Estatística Descritiva
População

Estudo
da amostra:
- Tabelas
- Gráficos
- Medidas…

Características Características
Populacionais: Amostrais:
Parâmetros estatísticas
Estatística
Inferencial
ESTATÍSTICA DESCRITIVA

As medidas podem ser classificadas em:

Média

Tendência Central Moda


ou Centralização
Mediana
Medidas de Localização

Quartis
Partição Decis
Percentis

Amplitude
AIQ (amplitude inter quartis)
Medidas de Dispersão Variância
Desvio Padrão
Coeficiente de Variação

Assimetria: Coeficiente de Assimetria

Curtose: Coeficiente de Curtose


ESTATÍSTICA DESCRITIVA

A Média Aritmética – é a medida de tendência central mais utilizada e de mais


fácil interpretação. Quer se trate de um parâmetro da população (u) ou de uma
estatística referente à amostra (X), a sua definição e cálculo são idênticos.

Quando os dados estão desagregados (desagrupados), a média aritmética é


a soma de todos os valores observados dividida pelo número de observações:

N
Xi
X1  X 2 X 3 X 4 .... 
 Média da População
µ Xn
 i 1
N N
N
Xi
X1  X 2 X 3 X 4 .... 
_
X Xn
 i 1  Média da Amostra
N N
com
Xi = valores individuais observados
N = tamanho da população
n = tamanho da amostra
ESTATÍSTICA DESCRITIVA

Ex: Os preços de seis modelos de portáteis são os seguintes:

Modelo Preço
A 695
B 1725
C 750
D 925
E 1200
F 1045

__
695  1725  750  925  1200  1045
X  1057
6

O preço médio dos portáteis foi de 1057 €. Neste exemplo, trata-se de uma
média aritmética simples.
ESTATÍSTICA DESCRITIVA

Se as observações individuais estiverem agrupadas num quadro de distribuição de


frequências, o método de cálculo da média deverá ser reconsiderado.

µ
 Xi * Fi
  Xi * fi  Média da população (dados agregados)
N

_
X
 Xi * Fi
  Xi * fi  Média amostra (dados agregados)
N
ESTATÍSTICA DESCRITIVA

Ex: O mesmo

Modelo Preço Quantidade Preço x Quantidade


Modelo Vendida Xi * Fi
Xi Fi
A 695 15 10425
B 1725 5 8625
C 750 10 7500
D 925 8 7400
E 1200 6 7200
F 1045 6 6270
Σ = 50 Σ = 47420

_ (695 * 15)  (1725 * 5)  (750 * 10 )  (925 * 8)  (1200 * 6)  (1045 * 6)


X  948
50

O preço médio dos portáteis foi de 948 €. Neste exemplo, trata-se de uma
média aritmética ponderada.
ESTATÍSTICA DESCRITIVA

Ex 2: Os resultados de um inquérito a uma amostra de 5000 pessoas retirada do


universo dos espectadores portugueses sobre o número de idas ao cinema
durante uma semana foram os seguintes:

Xi Fi fi
0 2913 0,5826
1 1532 0,3064
2 381 0,0762
3 101 0,0204
4 72 0,0144
Total 5000 1,0

_
(0 * 2913 )  (1 * 1532 )  ( 2 * 381)  (3 * 101)  ( 4 * 72 )
X  0,577
5000

_
X  (0 * 0,5826)  (1 * 0,3064)  (2 * 0,0762)  (3 * 0,0204)  (4 * 0,0144)  0,577
ESTATÍSTICA DESCRITIVA

No caso das variáveis contínuas, para efectuar o cálculo da média aritmética é


necessário considerar as várias classes ou intervalos em que a variável se
encontra dividida. O primeiro ponto consiste na definição dos centros ou pontos
médios das classes (Ci).

µ
 Ci * Fi
  Ci * fi  Média da população (dados agregados em classes)
N
Para estes casos a média passa a ser um valor aproximado da verdadeira
média, que se obteria a partir dos dados desagregados, uma vez que se
substituíram os valores exactos individuais incluídos em cada classe pelo ponto
médio ou centro da classe. Como se compreenderá, uma diferente divisão em
classes implicaria diferentes pontos médios e, portanto, uma valor para a
média, muito provavelmente diferente.

Em qualquer caso, sempre que se trabalha com amostras, as estatísticas são


estimativas dos verdadeiros parâmetros da população, sujeitas a erros de
medida e de amostragem.
ESTATÍSTICA DESCRITIVA

Ex: Venda das habitações numa determinada zona de Lisboa num determinado
ano.
Como se pode observar, nos cálculos vai utilizar-se o valor do centro da classe
que não é mais do que a soma do limite inferior com o limite superior dividida
por 2

Preço Frequência Centro Classe Ci * Fi


(mil €) Fi Ci
136  148
De 136 até 148 7 142 Ci 
2
 142 994
De 148 até 160 15 154 Ci 
148  160
 154 2310
2
De 160 até 172 24 166 3984
De 172 até 184 27 178 4806
De 184 até 196 17 190 3230
De 196 até 208 10 202 2020
De 208 até 220 8 214 1712
De 220 até 232 4 226 904
∑ = 112 ∑ = 19960

19960
µ  178,214
112
ESTATÍSTICA DESCRITIVA

Ex 2: o valor diário das vendas (mil €) de uma loja, ao longo de 40 dias, teve a
seguinte distribuição de frequências

Vendas Nº de dias fi (FI / N) Ci fi * Ci


Xi Fi
110 – 120 1 0,025 115 2,875
120 – 130 3 0,075 125 9,375
130 – 140 7 0,175 135 23,625
140 – 150 14 0,350 145 50,750
150 – 160 8 0,200 155 31,000
160 – 170 5 0,125 165 20,625
170 – 180 2 0,050 175 8,750
∑ = 40 ∑ = 1,000 ∑ = 147,000
ESTATÍSTICA DESCRITIVA

Exercícios

Exercício 1 - Foi feito um inquérito a um grupo de 40 compradores de carros novos para


determinar quantas reparações ou substituições de peças foram feitas durante o primeiro
ano de utilização dos carros. Obtiveram-se os seguintes resultados:

1 4 1 2 2
3 3 2 1 2
3 2 3 1 0
1 2 7 4 3
5 1 2 4 2
1 3 1 0 1
2 1 1 3 1
0 4 2 3 5

1. Construa um quadro de distribuição de frequências absolutas;


2. Calcule as frequências relativas
3. Construa um gráfico para as frequências absolutas
4. Calcule as frequências acumuladas
5. Construa um gráfico de frequências relativas
ESTATÍSTICA DESCRITIVA

Exercícios

Exercício 2 - Os seguintes dados referem-se ao tempo gasto (em minutos) por 42


trabalhadores entre a sua residência e o local de trabalho

5 21 26 13 24 29 37
12 31 5 50 18 33 14
23 22 17 32 7 17 42
15 38 20 11 26 25 29
27 8 24 12 39 25 28
14 47 19 22 28 9 18

1. Construa um quadro de distribuição de frequências depois de definir a amplitude


das classes de modo que achar mais conveniente.

2. A partir da distribuição anterior represente graficamente os dados através de um


histograma.

Potrebbero piacerti anche