Sei sulla pagina 1di 54

Estatística Básica - Análise

Descritiva
Selene Loibel

Estatstica Bsica - Anlise Descritiva – p. 1/3


Conteúdo
Introdução
Conceitos básicos de Estatística
Experimentos aleatórios e variáveis aleatórias (v.a.)
Classificação das v.a. (ou dados)
Populações, levantamentos censitários e amostras

Estatística Descritiva
Medidas de posição
Medidas de variabilidade
Distribuições de frequências
Tabelas e Gráficos
Coeficientes de assimetria e curtose
Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 2/3
Introdução
Estatística é a ciência de coletar, organizar,apresentar,
analisar e interpretar dados numéricos com o objetivo
de tomar decisões.

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 3/3
Introdução
Estatística é a ciência de coletar, organizar,apresentar,
analisar e interpretar dados numéricos com o objetivo
de tomar decisões.

Divisão da Estatística
Estatística Descritiva: Métodos para organizar,
resumir e apresentar dados

Inferência Estatística: Métodos para analisar os


dados e tomar decisões

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 3/3
Conceitos básicos - I
Experimentos aleatórios: Qualquer experimento
cujos resultados são aleatórios. A repetição do
experimento, nas mesmas condições, não leva
necessariamente ao mesmo resultado.
Exemplo: Captura mensal de peixes em determinado
local com o objetivo de observar características de
interesse.

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 4/3
Conceitos básicos - I
Experimentos aleatórios: Qualquer experimento
cujos resultados são aleatórios. A repetição do
experimento, nas mesmas condições, não leva
necessariamente ao mesmo resultado.
Exemplo: Captura mensal de peixes em determinado
local com o objetivo de observar características de
interesse.

Variáveis aleatórias (v.a.): Características de


interesse (numéricas ou não) obtidas a partir de
experimentos aleatórios.
Exemplos: Medidas de peso e comprimento de peixes,
quantidade de peixes capturados, espécies capturadas
etc
Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 4/3
Conceitos básicos - II
Classificação das Variáveis Aleatórias:

Qualitativas: Representam atributos ou qualidades.

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 5/3
Conceitos básicos - II
Classificação das Variáveis Aleatórias:

Qualitativas: Representam atributos ou qualidades.

Nominais: São qualidades que não se pode ordenar,


por exemplo: sexo, profissão, opinião sobre
qualquer assunto etc

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 5/3
Conceitos básicos - II
Classificação das Variáveis Aleatórias:

Qualitativas: Representam atributos ou qualidades.

Nominais: São qualidades que não se pode ordenar,


por exemplo: sexo, profissão, opinião sobre
qualquer assunto etc

Ordinais: São qualidades que possuem uma ordem


natural, por exemplo: classe social, tamanho de um
objeto, grau de escolaridade etc

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 5/3
Conceitos básicos - III
Classificação das Variáveis Aleatórias:

Quantitativas: Valores assumidos são de natureza


numérica.

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 6/3
Conceitos básicos - III
Classificação das Variáveis Aleatórias:

Quantitativas: Valores assumidos são de natureza


numérica.

Discretas - Valores assumidos são números inteiros


(contagens). Por exemplo: Número de filhos,
número acidentes em um cruzamento etc

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 6/3
Conceitos básicos - III
Classificação das Variáveis Aleatórias:

Quantitativas: Valores assumidos são de natureza


numérica.

Discretas - Valores assumidos são números inteiros


(contagens). Por exemplo: Número de filhos,
número acidentes em um cruzamento etc

Contínuas - Valores assumidos estão contidos em


intervalos dos números reais (mensurações). Por
exemplo peso, altura, diâmetro etc

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 6/3
Conceitos básicos - IV
População: Conjunto de todos os elementos ou
resultados sob investigação (universo do estudo).
Exemplo: Todos os peixes da espécie "A"que habitam o
rio Amazonas.

Levantamento censitário: Levantamento efetuado


com toda a população.

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 7/3
Conceitos básicos - IV
População: Conjunto de todos os elementos ou
resultados sob investigação (universo do estudo).
Exemplo: Todos os peixes da espécie "A"que habitam o
rio Amazonas.

Levantamento censitário: Levantamento efetuado


com toda a população.

Amostra aleatória (a.a.s.): Subconjunto da população,


selecionado aleatoriamente, de forma que todos os
elementos da pop. tenham a mesma chance de estar
na amostra.
Exemplo: 200 peixes da espécie "A"coletados
aleatoriamente no rio Amazonas.
Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 7/3
Medidas de Resumo - I
Um conjunto de dados (a.a.) pode ser resumido com:

Medidas de Posição
Média
Mediana
Moda

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 8/3
Medidas de Resumo - I
Um conjunto de dados (a.a.) pode ser resumido com:

Medidas de Posição
Média
Mediana
Moda
Medidas de Variabilidade
Amplitude
Desvio Médio
Variância e Desvio Padrão

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 8/3
Medidas de Resumo - I
Um conjunto de dados (a.a.) pode ser resumido com:

Medidas de Posição
Média
Mediana
Moda
Medidas de Variabilidade
Amplitude
Desvio Médio
Variância e Desvio Padrão
Medidas de Forma
Coeficiente de Assimetria
Coeficiente de Curtose
Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 8/3
Medidas de Posição - I
Considerar uma a. a. de tamanho n de uma v.a.
X : x1 , x2 , ..., xn .
Por exemplo, amostra X : 10, 15, 8, 12, 14 (a.a. com n = 5)

Média Amostral: É a média aritmética dos valores da


amostra, dada por:
n
1 X
X= xi
n
i=1

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 9/3
Medidas de Posição - I
Considerar uma a. a. de tamanho n de uma v.a.
X : x1 , x2 , ..., xn .
Por exemplo, amostra X : 10, 15, 8, 12, 14 (a.a. com n = 5)

Média Amostral: É a média aritmética dos valores da


amostra, dada por:
n
1 X
X= xi
n
i=1

Para os dados do exemplo, tenho

(10 + 15 + 8 + 12 + 14) 59
X= = = 11, 8
5 5

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 9/3
Medidas de Posição - II
Mediana Amostral: É o ponto que divide a amostra
ordenada em duas partes com o mesmo número de
observações.

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 10/3
Medidas de Posição - II
Mediana Amostral: É o ponto que divide a amostra
ordenada em duas partes com o mesmo número de
observações.
A amostra de X em ordem crescente:

min(X) = x(1) , x(2) , ..., x(n) = max(X)

Notação: x(k) é o elemento da amostra, em ordem


crescente, que se encontra na posição k .

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 10/3
Medidas de Posição - II
Mediana Amostral: É o ponto que divide a amostra
ordenada em duas partes com o mesmo número de
observações.
A amostra de X em ordem crescente:

min(X) = x(1) , x(2) , ..., x(n) = max(X)

Notação: x(k) é o elemento da amostra, em ordem


crescente, que se encontra na posição k .
Para o exemplo, X : 10, 15, 8, 12, 14

x(1) = 8, x(2) = 10, x(3) = 12, x(4) = 14, x(5) = 15

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 10/3
Medidas de Posição - III

A mediana é calculada por:


n+1
(
x 2 )
( se n é ímpar
M d(X) = n n
x( 2 ) +x( 2 +1)
2 se n é par

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 11/3
Medidas de Posição - III

A mediana é calculada por:


n+1
(
x 2 )
( se n é ímpar
M d(X) = n n
x( 2 ) +x( 2 +1)
2 se n é par

Para a amostra X : 8, 10, 12, 14, 15 temos n = 5 e


( n+1 ) ( 5+1 )
M d(X) = x 2 =x 2 = x(3) = 12

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 11/3
Medidas de Posição - III
Moda:É igual à observação com maior frequência.

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 12/3
Medidas de Posição - III
Moda:É igual à observação com maior frequência.
Exemplo: Amostra da v.a. Y : 1, 3, 5, 2, 2, 2, 3, 2, 2, 5, 1
(n = 11)

Contar a frequência de cada valor observado. Denotar


a frequência de cada y por f (y)

f (1) = 2, f (2) = 5, f (3) = 2, f (5) = 2

M o(Y ) = 2

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 12/3
Medidas de Variabilidade - I
Amplitude: Diferença entre max(X) e min(X)

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 13/3
Medidas de Variabilidade - I
Amplitude: Diferença entre max(X) e min(X)
Exemplo X : 8, 10, 12, 14, 15 temos
A = max(X) − min(X) = 15 − 8 = 7

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 13/3
Medidas de Variabilidade - I
Amplitude: Diferença entre max(X) e min(X)
Exemplo X : 8, 10, 12, 14, 15 temos
A = max(X) − min(X) = 15 − 8 = 7

Desvio Médio (absoluto): Média dos desvios em


valores absolutos
Desvios: ei = xi − X

n n
1 X 1X
DM A(X) = xi − X = |ei |
n n
i=1 i=1

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 13/3
Medidas de Variabilidade - II
Exemplo X : 8, 10, 12, 14, 15

i xi e i = xi − X |ei | = xi − X

1 8 −3, 8 3, 8
2 10 −1, 8 1, 8
3 12 0, 2 0, 2
4 14 2, 2 2, 2
5 15 3, 2 3, 2
P5
X = 11, 8 |ei | = 11, 2
i=1

n
1 X 11, 2
DM A(X) = xi − X = = 2, 24
n 5
i=1
Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 14/3
Medidas de Variabilidade - III
Variância Amostral:Média dos desvios ao quadrado
(ordem de grandeza diferente dos dados)

n n
" #
2 1 X
2 1 X 2
SX = (xi − X) = x2i − nX
n−1 n−1
i=1 i=1

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 15/3
Medidas de Variabilidade - III
Variância Amostral:Média dos desvios ao quadrado
(ordem de grandeza diferente dos dados)

n n
" #
2 1 X
2 1 X 2
SX = (xi − X) = x2i − nX
n−1 n−1
i=1 i=1

Desvio Padrão Amostral:

dp(X) = SX

O desvio padrão é a medida de variabilidade mais


usada uma vez que seu valor está na mesma unidade
dos dados.
Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 15/3
Medidas de Variabilidade - IV
2
Exemplo X : 8, 10, 12, 14, 15 com X = 139, 24 temos

i xi x2i
1 8 64
2 10 100
3 12 144
4 14 196
5 15 225
5
x2i = 729
P
i=1

32,8
S 2 = 14 [729 − 5(139, 4)] = 4 = 8, 2 e dp(X) = 2, 86

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 16/3
Dist. Frequências Simples - I
Dados de v.a. qualitativa (nominal ou ordinal) Supor uma
v.a. com k categorias de respostas. Na tabela dispomos as
frequências absoluta e relativa, dadas por:
nj
nj = # obs. Cj e fj = n para j = 1, ...k .

nj
”nome da v.a.” nj fj = n
C1 freq.absoluta C1 nn1
C2 freq. absoluta C2 nn2
... ... ...
Ck freq. absoluta Ck nnk

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 17/3
Exemplos

Estado civil nj fj = nni


C1:Solteiro (a) 13 0,3611
C2:Casado (a) 17 0,4722
C3:Separado (a) 6 0,1667
Total 36 1

Grau Instrução nj fj = nni


C1:Fundamental 12 0,3333
C2:Médio 18 0,5000
C3:Superior 6 0,1667
Total 36 1

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 18/3
Dist. Frequências Simples - II
Dados de v.a. quantitativa discreta - Para valores inteiros
pode-se fazer a tabela agrupando esses valores ou não.
Exemplo1:

#.filhos ni fi = nni # filhos ni fi = nni


0 20 0,5555 0-1 25 0,6944
1 5 0,1389 2-3 10 0.2778
2 7 0,1944 4-5 1 0.0278
3 3 0,0833 Total 36 1
5 1 0,0278
Total 36 1

Estatstica Bsica - Anlise Descritiva – p. 19/3


Dist. Frequências Simples - III
Exemplo: Para idade (em anos) devemos agrupar os dados
em faixas etárias

Idade ni fi = nni
20 a 24 2 0,0555
25 a 29 6 0,1667
30 a 34 10 0,2778
35 a 39 8 0,2222
40 a 44 8 0,2222
45 a 49 2 0,0555
Total 36 1

Estatstica Bsica - Anlise Descritiva – p. 20/3


Tabelas Freq. simples - IV
Dados de v.a. quantitativa contínua - Para valores reais é
preciso considerar intervalos de classes
Escolher o número de intervalos de classes, denotado
por nc.

Estatstica Bsica - Anlise Descritiva – p. 21/3


Tabelas Freq. simples - IV
Dados de v.a. quantitativa contínua - Para valores reais é
preciso considerar intervalos de classes
Escolher o número de intervalos de classes, denotado
por nc.
Calcular a amplitude da amostra A = max(X) − min(X).
O comprimento dos intervalos será dado por:
A
L≈
nc

Estatstica Bsica - Anlise Descritiva – p. 21/3


Tabelas Freq. simples - IV
Dados de v.a. quantitativa contínua - Para valores reais é
preciso considerar intervalos de classes
Escolher o número de intervalos de classes, denotado
por nc.
Calcular a amplitude da amostra A = max(X) − min(X).
O comprimento dos intervalos será dado por:
A
L≈
nc
Exemplo: Para os dados de peso (em Kg), fazer nc = 6
intervalos. A amplitude desta amostra é:

A = max(pesos) − min(pesos) = 76, 1 − 54, 6 = 21, 5

Estatstica Bsica - Anlise Descritiva – p. 21/3


Tabelas Freq. simples - IV
A 21, 5
L≈ = = 3, 58
nc 6
Poderiamos usar L = 4, mas neste ex. vamos usar L = 5.
Exemplo: V.a.peso(em Kg)

peso (kg) ni fi = nni


[50, 55) 1 0,0278
[55,60) 9 0,25
[60,65) 8 0,2222
[65,70) 4 0,1111
[70,75) 12 0,3333
[75,80) 2 0,0555
Total 36 1
Estatstica Bsica - Anlise Descritiva – p. 22/3
Tabelas de cruzamento - I
Tabelas de dupla entrada ou de cruzamento: São
tabelas nas quais podemos dispor informações de duas
v.a. para relacioná-las.
Exemplo: Cruzamento das v.a. Sexo e Hábito de praticar
exercícios físicos

Sexo × Hábito de praticar exercícios físicos


Faz exerc. Não faz exerc. Total
Feminino 11 (0,3056) 8 (0,2222) 19 (0,5278)
Masculino 8 (0,2222) 9 (0,25) 17 (0,4722)
Total 19 (0,5278) 17 (0,4722) 36

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 23/3
Tabelas de cruzamento - II
Exemplo: Cruzamento das v.a. Estado civil e Hábito de
praticar exercícios físicos

Estado civil × Hábito de praticar exercícios físicos (1)

Faz exerc. Não faz exerc.


Solteiro 5 (0,1389) 8 (0,2222) 13 (0,3611)
Casado 11 (0,3056) 6 (0,1667) 17 (0,4722)
Separado 3 (0,0833) 3 (0,0833) 6 (0,1667)
Total 19 (0,5278) 17 (0,4722) 36

Estatstica Bsica - Anlise Descritiva – p. 24/3


Tabelas de cruzamento - III
Exemplo: Cruzamento das v.a. Peso e Hábito de praticar
exercícios físicos

Peso × Hábito de praticar exercícios físicos


Faz exerc. Não faz exerc. Total
[50, 55) 1 (0,0278) 0 1 (0,0278)
[55,60) 2 (0,0556) 6 (0,1667) 8 (0,2222)
[60,65) 5 (0,1389) 3 (0,0833) 8 (0,2222)
[65,70) 0 5 (0,1389) 5 (0,1389)
[70,75) 8 (0,2222) 4 (0,1111) 12 (0,3333)
[75,80) 1 (0,0278) 1 (0,0278) 2 (0,0556)
Total 17 (0,4722) 19 (0,5278) 36
Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 25/3
Gráficos - I
Para v.a. qualitativas: Gráfico de barras e Gráfico de
setores (pie)
Hábito de praticar exercícios físicos
20

18

16

14

12
Pratica exerc
47,22%
10
Não pratica exerc
52,78%
8

0
fundamental médio superior
grau de escolaridade

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 26/3
Gráficos - I
Para v.a. qualitativas: Gráfico de barras e Gráfico de
setores (pie)
Hábito de praticar exercícios físicos
20

18

16

14

12
Pratica exerc
47,22%
10
Não pratica exerc
52,78%
8

0
fundamental médio superior
grau de escolaridade

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 26/3
Gráficos - II
Para v.a. quantitativas : Histogramas e Box-Plot

10/36
max(idade)=48

45
8 /36

7 /36 40 Q3=40

6 /36
freq. relativa

idade
35 Md=34,5

30 Q1=30
3 /36

2 /36 25

20 min(idade)=20
0
15 20 25 30 35 40 45 50 55
Idade

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 27/3
Gráficos - II
Para v.a. quantitativas : Histogramas e Box-Plot

10/36
max(idade)=48

45
8 /36

7 /36 40 Q3=40

6 /36
freq. relativa

idade
35 Md=34,5

30 Q1=30
3 /36

2 /36 25

20 min(idade)=20
0
15 20 25 30 35 40 45 50 55
Idade

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 27/3
Medidas de Forma - I

Coeficiente de Assimetria de Pearson:


3[X − M d(X)]
a1 (X) =
dp(X)

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 28/3
Medidas de Forma - I

Coeficiente de Assimetria de Pearson:


3[X − M d(X)]
a1 (X) =
dp(X)

Interpretação:
 Se temos:
 <0
 Ass. à esquerda - X < M d(X) < M o(X)
a1 (X) = 0 Simetria - X = M d(X) = M o(X)

>0 Ass. à direita - X > M d(X) > M o(X)

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 28/3
Formas das distribuções

400
a <0, Ass. esquerda
1
200

0
0.9 0.92 0.94 0.96 0.98 1
300

200 a1=0, simetria

100

0
−3 −2 −1 0 1 2 3 4
400

a1>0, Ass. direita


200

0
0 1 2 3 4 5 6
−3
x 10

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 29/3
Medidas de forma - II
Coeficiente de Curtose (achatamento):
Q3 − Q1
C(X) =
2(P90 − P10 )

Interpretação: No modelo normal C = 0, 263



 < 0, 263
 Curva lepocúrtica
C(X) = 0, 263 Curva mesocúrtiva

 > 0, 263 Curva platicúrtica

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 30/3
final
Bibliografia

Estatstica Bsica - Anlise Descritiva – p. 31/3


Dados Peixes adultos da espécie A

Id Sexo Comp.(cm) Peso(Kg)


1 M 45.60 2.280
2 M 40.00 2.110
3 F 39.67 2.050
4 M 39.96 2.000
5 F 38.78 1.970
6 F 37.72 1.960
7 F 36.34 1.090
8 M 39.95 2.000
... ... ... ...
300 F 41.71 2.030

Selene Loibel
Estatstica Bsica - Anlise Descritiva – p. 32/3

Potrebbero piacerti anche