Sei sulla pagina 1di 35

Estatstica

amintas paiva afonso


NOTAO
Caracterstica amostra
populao

Somatrio de um conjunto de valores
Valores individuais dos dados x
i
x
i

Nmero de valores (tamanho do conjunto) n N
Mdia aritmtica

Desvio padro s
o
o
2

s
2

Varincia
Range (amplitude)
R -
x
Notaes Estatsticas
Achatamento - curtose
Assimetria - coeficiente
de assimetria
-Mdia aritm.
-Mediana
-Moda
-Quartis
-Percentis
-Amplitude
-Varincia
-Desvio padro
-Coeficiente de
Variao
-Desvio mdio
MEDIDAS
ESTATSTICAS
DISPERSO
POSIO
tendncia central
FORMA
Unidade 4 Unidade 5
No ser abordado
Snteses Numricas
= E x
N
Mdia de todos os valores de
uma populao.
_ = E x
n
_
Mdia de um conjunto de valores
amostrais.
Obs.: A mdia nos d uma idia de onde os valores do meu conjunto de
dados tende a se concentrar.
Corresponde ao somatrio de um
conjunto de valores dividido pelo
nmero destes valores.
Mdia = E x
n
n = nmero de valores
Medidas de Posio Tendncia Central
Mdia aritmtica
Mdia aritmtica
Exerccio : Um estudante fez quatro provas e obteve as notas 89, 94, 95
e 86, a sua nota mdia :
5 , 89
4
86 95 94 89
=
+ + +
= x
notao
=
+ + +
=
n
x x x
x
n
...
2 1
n
x
n
x
n
i
i

=
=1
Medidas de Posio Tendncia Central
a mais importante das medidas de tendncia central;
A mdia de um conjunto de nmeros pode ser sempre calculada;
Para um dado conjunto de nmeros, a mdia nica;
sensvel (ou afetada) a todos os valores do conjunto. Assim se
um valor se modifica, a mdia tambm se modifica;
Somando-se ou reduzindo-se uma constante a cada valor do
conjunto, a mdia ficar aumentada ou reduzida dessa constante:
(x k) = (x) k;
Multiplicando-se ou dividindo-se cada valor do conjunto por uma
constante, a mdia ficar multiplicada ou reduzida por essa
constante: (x .\ k) = (x) .\ k
Mdia aritmtica
Medidas de Posio Tendncia Central
Foi introduzida recentemente nos estudos estatsticos;
Se obtm eliminando do conjunto de dados os m maiores e os
m menores valores;
Mdia aparada
No conjunto de dados abaixo, calcular a mdia aparada, com m =2
1, 2, 6, 7, 6, 8, 10, 8, 12, 23, 25, 8, 9, 7, 11, 12, 13, 10, 8, 9, 7, 12, 12,
10, 9, 11,7, 8, 6, 8, 9, 10, 11, 8, 7, 11, 12, 6, 10, 9, 7, 8, 10, 6, 7, 12, 8, 9,
10,
Normalmente m correspondente: 2,5% a 5% dos valores
observados;
Na verdade o que se est fazendo eliminando os valores
extremos superiores e inferiores (valores discrepantes - outliers);
Medidas de Posio Tendncia Central
Mdia aparada
0
5
10
15
20
25
30
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49
A mdia aparada exclui
valores discrepantes
A mdia aritmtica de todos os valores = 9,29
Excluindo os dois menores e dois maiores valores (1, 2, 23 e 25), a
mdia aparada = 8,98
Medidas de Posio Tendncia Central
Cada elemento do conjunto pode ter importncia diferente (peso).
Neste caso o clculo da mdia deve levar em conta os pesos
desiguais de cada elemento.
Exerccio : O colgio definiu que as provas mensais teriam peso de 30%
e a prova final teria peso de 40% no clculo dos rendimentos dos alunos.
Veja o quadro abaixo e calcule a mdia do aluno.
Mdia ponderada
80
0,30
0,30
Ms 2
90
96
exame
nota peso
Ms 1
Final
0,40

=
0,3*80 + 0,3*90 + 0,4*96
0,3 + 0,3 + 0,4
89,4
=
p
x
Medidas de Posio Tendncia Central
Mdia ponderada
Notao
n
n n
p
p p p
p x p x p x
x
+ + +
+ + +
=
...
...
2 1
2 2 1 1
p
1
, p
2
....p
n
so os pesos

=
=
=
n
i
i
i
n
i
i
p
p
p x
x
1
1
Medidas de Posio Tendncia Central
A Mediana de um conjunto de valores o valor do meio desse conjunto,
quando estes esto em ordem crescente.
Divide um conjunto de dados ordenados em dois grupos iguais.
3, 7, 5, 5, 1, 9, 15, 13, 17, 13, 17 Dado o conjunto de 11 dados:
Calcule a mediana.
Exerccio
5 dados
11, 13, 13, 15, 17
9,
Conjunto dados
ordenados
5 dados
1, 3, 5, 5, 7,
Valor central = mediana
Mediana
x
~
Medidas de Posio Tendncia Central
Mediana x
~
Conjunto de valores pares ( n = par)
+
= valor
n/2
(n / 2) + 1
valor
) (
/ 2
x
~
Conjunto de valores impares (n = impar)
= valor
(n+ 1) / 2
x
~
5 , 8 2 / ) 10 7 ( 2 / ) 3 2 (
~
= + = + = posio valor posio valor x
5, 7, 10, 11, 14 n = 5
10 = 3 =
~
posio valor x
exemplo
= valor
(5+1)/2
= valor 3
x
~
x
~
= (valor 4/2 + valor (4/2 + 1))/2
5, 7, 10, 11 n = 4
exemplo
Medidas de Posio Tendncia Central
Exerccio: Calcular a mediana das medidas de um conjunto de eixo:
(3,0 ; 2,8 ; 2,9 ; 3,3 ; 3,5 ; 3,1 ; 3,2 ; 3,0 ; 3,4 ; 2,7)
(2,7 ; 2,8 ; 2,9 ; 3,0 ; 3,0 ; 3,1 ; 3,2 ; 3,3 ; 3,4 ; 3,5)

Resoluo:
Mediana = x
~
3,0 + 3,1
2
= = 3,05
Interpretao do resultado: 50% dos dados brutos so valores
menores ou iguais a 3,05 e 50% desses so valores maiores ou iguais
a 3,05.
Medidas de Posio Tendncia Central
Mediana x
~
Mdia aritmtica Mediana
X
Salrio dos funcionrios de um restaurante
200, 250, 250, 300, 450, 460, 510 7 , 345
7
510 460 450 300 250 250 200
=
+ + + + + +
= x
A mdia de 345,7 sintetiza razoavelmente o conjunto de dados (salrios)
Salrio dos funcionrios incluindo o gerente
200, 250, 250, 300, 450, 460, 2300
4 , 601 =
7
2300 + 460 + 450 + 300 + 250 + 250 + 200
= x
A mdia de 601,4 no sintetiza razoavelmente o conjunto de dados
Nos dois casos a mediana 300. Para o segundo caso a mediana
representa melhor o conjunto de dados.
Num conjunto de dados fortemente desviado, a mediana uma medida
mais representativa (distribuio de rendas, folha de pagamentos)
Medidas de Posio Tendncia Central
Moda - MO
A Moda de um conjunto de valores o valor que apresenta maior
freqncia em um conjunto de observaes.
o valor ou classe de maior freqncia num conjunto de dados.
- pode no existir
- pode no ser nica
Exerccio : Dado o conjunto de dados 10, 10, 11, 14, 15, 16, 17, 18, 18.
Calcule a moda.
A moda constituda de dois valores: MO = 10 e 18 (duas vezes cada)
Medidas de Posio Tendncia Central
medida definio quo
freqente
existncia considera
todos
valores?
afetada
pelos
valores
extremos
vantagens e
desvantagens
mdia

mdia
mais
familiar
existe
sempre
sim sim muito utilizada
em estatstica
mediana Valor
mdio
usada existe
sempre
no no costuma ser
boa escolha se
h valores
extremos
moda valor
mais
freqente
usada s
vezes
pode no
existir;
pode ter
mais de
uma moda
no no apropriada para
dados ao nvel
nominal
x =
x
n
COMPARAO
Medidas de Posio Tendncia Central
Exerccio:
Inspecionaram-se quinze rdios antes da
remessa e os nmeros de defeito por unidade
so apresentados no quadro abaixo:
1 4 0 2 1
0 2 3 0 0
3 1 1 1 1
Nmeros de defeito por rdio
Encontre a mdia, a mediana e a moda do nmero de
defeitos.
Resposta: (mdia = 1,33) (mediana = 1) (moda =1).
Medidas de Posio Tendncia Central
A disperso mede quo prximo uns dos outros esto os valores
do grupo
pequena disperso
grande disperso
( ) ( )
31 31
46 , 39 , 30 , 23 , 17 37 , 34 , 31 , 28 , 25
= =
= =
B A
x x
B A
A variabilidade de B maior que de A
Uma medida
de posio
(quase sempre a
mdia)
Uma boa
representao
de dados
Uma medida de
disperso
(quase sempre o
desvio padro)
=
+
Medidas de Disperso
Amplitude, range ou intervalo
expresso pela diferena entre o maior e o menor valor num grupo, ou
pela identificao desses dois nmeros.
nmeros
intervalo
diferena do menor ao maior
(1 ; 5 ; 7 ; 13)
(14 ; 3 ; 17 ; 4 ; 8 ; 73 ; 36 ; 48)
(3,2 ; 4,7 ; 5,6 ; 2,1 ; 1,9 ; 10,3)
13 1 = 12
73 3 = 70
10,3 1,9 = 8,4
de 1 a 13
de 3 a 73
de 1,9 a 10,3
Medidas de Disperso
Amplitude, range ou intervalo



LIMITAO: s leva em conta os dois valores extremos do
conjunto, nada informando sobre os outros valores.






intervalo
1
2
3
distribuio uniforme o
intervalo uma boa medida
uma medida apenas
razovel
uma medida ruim da
disperso
Medidas de Disperso
Desvio mdio absoluto

DMA =
| x
i
x |
n
DMA fcil de
entender e calcular
mas pouco usado como medida de
disperso
outras medidas apresentam propriedades
matemticas mais interessantes
Medidas de Disperso
Exerccio: Calcule o DMA do conjunto de dados 2, 4, 6, 8, 10.
Calcular o desvio mdio.
X = (2 +4 +6 +8 +10) / 5 = 6
Desvio mdio absoluto
X
i
- X
2 6 = - 4
4 6 = - 2
6 6 = 0
8 6 = 2
10 6 = 4
0
soma
DMA = (4 +2 +0 +2 + 4 ) / 5 = 2,4
DMA =
| x
i
x |
n

Medidas de Disperso
Varincia
A Varincia uma medida de disperso muito utilizada.

S
x
2
=
n - 1

(x
i
- x )
2

n 1 amostra
n populao
ATENO
S
x
2
=
n - 1
(
x
i
)
2
/ n

x
i
2
-
OU
Medidas de Disperso
Varincia
Exerccio: Calcule a varincia da amostra 2, 4, 6, 8, 10.
A mdia desse conjunto 6.
6
6 + 2
4
4
x
i

x
x
i
- x (x
i
- x )
2

2
4
6
8
10
6
6
- 4
6
- 2
0
+ 4
0
16
16
somas
0 40
40
S
x
2
=
n - 1

(x
i
- x )
2

=
5 - 1
=
10
Se esses valores representassem
toda a populao, a varincia
seria 40/5 = 8.
Medidas de Disperso
Desvio padro
O desvio padro mais comumente usado porque se apresenta na
mesma unidade da varivel em anlise. Assim, se a unidade da
varivel for mm, o desvio padro tambm ser mm.
Isso no acontece com a varincia.
S
x
=
n - 1

(x
i
- x )
2

S
x
=
n - 1
(
x
i
)
2
/ n

x
i
2
-
n 1 amostra
n populao
s raiz positiva
da varincia
a raiz quadrada da varincia.
Medidas de Disperso
Desvio padro
O desvio padro a medida de disperso mais usada. Quanto maior
o desvio padro maior a disperso dos dados em torno da mdia.
s = 3
1 2 3 4 5 6 7
s = 1,0
1 2 3 4 5 6 7
s = 0,8
1 2 3 4 5 6 7 1 2 3 4 5 6 7
s = 0
7
6
5
4
3
2
1
0
O desvio-padro cresce quando a disperso dos dados aumenta
4
7
= X mdia com
medidas temos casos os todos em
Medidas de Disperso
Coeficiente de variao
a relao entre o desvio padro e a mdia do conjunto de dados.
Nos d a idia do tamanho do desvio padro em relao mdia.
Uma pequena disperso absoluta pode ser na verdade considervel
quando comparada com os valores da varivel
CV (%) =
S
x

x
. 100
Conjunto de dado com s = 15 e
mdia 100
CV = 15%
Conjunto de dado com s = 20 e
mdia 1000
CV = 2%

CV(%) =

. 100
ou
amostra populao
Medidas de Disperso
Exemplo: Calcular o desvio-padro da amostra
representada por: 1, 2, 4, 5, 7.
i X
i
(X
i
- X ) (X
i
- X )
2

1 1 (1 3,8) = -2,8 (-2,8)
2
= 7,84
2 2 (2 3,8) = -1,8 (-1,8)
2
= 3,24
3 4 (4 3,8) = 0,2 (0,2)
2
= 0,04
4 5 (5 3,8) = 1,2 (1,2)
2
= 1,44
5 7 (7 3,8) = 3,2 (3,2)
2
= 10,24
X = 3,8
( ) 8 , 22
5
1
2
=

X X
i


Mdias e Desvio-padro - Exemplos
( ) 39 , 2
4
8 , 22
8 , 22 .
1 5
1
.
1
1
2
= =

=

n
i
i
X X
n
S
Logo :
i X
i
(X
i
- X ) (X
i
- X )
2

1 1 (1 3,8) = -2,8 (-2,8)
2
= 7,84
2 2 (2 3,8) = -1,8 (-1,8)
2
= 3,24
3 4 (4 3,8) = 0,2 (0,2)
2
= 0,04
4 5 (5 3,8) = 1,2 (1,2)
2
= 1,44
5 7 (7 3,8) = 3,2 (3,2)
2
= 10,24
X = 3,8
( ) 8 , 22
5
1
2
=

X X
i


Mdias e Desvio-padro - Exemplos
Exerccio 1: Vamos supor que eu quero comprar uma
lmpada para a minha casa e quero que ela dure pelo
menos 700 h. Eu solicito a dois fabricantes o tempo de
vida til de suas lmpadas e eles me fornecem os
seguintes dados:
Fabricante A (h) Fabricante B (h)
730 1000
710 687
705 700
720 850
765 587
750 710

Supondo que as duas lmpadas custam o mesmo
valor, qual delas eu deveria comprar?
Mdias e Desvio-padro - Exerccios
Para chegarmos uma concluso necessrio
calcularmos o tempo de vida til mdio para cada
fabricante e saber qual variabilidade dos dados.
h X A 730 =
h X B 67 , 755 =
S
A
= 23,45 h S
B
= 146,25 h
Critrio de escolha: tempo de vida til = mdia desvio-
padro
Fabricante A (h) Fabricante B (h)
730 1000
710 687
705 700
720 850
765 587
750 710

Mdias e Desvio-padro - Exerccios
Fabricante A : 730 23,45 h
h X A 730 = h S X
A
A 45 , 23 730 = h S X
A
A 45 , 23 730 + = +
Fabricante A:[706,55 753,45= -46,9]
Fabricante B : 755,67 146,25 h
h S X
B
B 25 , 146 67 , 755 + = + h S X
B
B 25 , 146 67 , 755 = h X B 67 , 755 =
Fabricante B : [609,42 901,92= -292,5]
Concluso :
Escolheria o
fabricante A.
Mdias e Desvio-padro - Exerccios
Exerccio 2: Um comerciante est interessado em comprar 100
garrafas de cachaa para o seu estabelecimento. No entanto,
como de preferncia de sua clientela, necessrio que a
cachaa escolhida apresente um teor alcolico de no mnimo
33% em volume. Ele consultou alguns fornecedores e obteve
as seguintes informaes:
Teor alcolico de trs tipos de aguardente pesquisadas.
Marca A (R$ 3,50/l) Marca B (R$ 4,10/l) Marca C (R$ 3,65/l)
38,7 35,7 38,7
33,5 36,4 33,5
32,5 35,9 34,5
31,2 33,2 34,2
35,9 34,1 35,9

Na sua opinio, qual deveria ser a marca escolhida pelo
comerciante?
Mdias e Desvio-padro - Exerccios
Marca A: 34,36 2,97 [31,3937,33=-5,94]
Marca B: 35,06 1,35 [33,7136,41=-2,7]
Marca C:35,36 2,06 [33,337,42=-4,12]
As marcas B e C
atendem ao
requisito (>33%),no
entanto escolheria
a marca C pelo
preo. Assim, teria
um economia de R$
45,00!
Teor alcolico de trs tipos de aguardente pesquisadas.
Marca A (R$ 3,50/l) Marca B (R$ 4,10/l) Marca C (R$ 3,65/l)
38,7 35,7 38,7
33,5 36,4 33,5
32,5 35,9 34,5
31,2 33,2 34,2
35,9 34,1 35,9

Mdias e Desvio-padro - Exerccios
www.matematiques.com.br
amintas paiva afonso

Potrebbero piacerti anche