Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
n
c
i
a
30
20
10
0
O,Regio
Interior
Capital
17
HISTOGRAMA - a representao grfica de uma distribuio de frequncias de uma
varivel quantitativa (dados agrupados) por meio de retngulos justapostos centrados nos
pontos mdios das classes e cujas reas so proporcionais s frequncias das classes.
Exemplo: Grfico 3
Grfico 3:
Alturas dos estudantes de Calc. Prob. Estatstica I
Turno: Manh, Turma: 04, Perodo: 97.1
POLGONO DE FREQUNCIAS - a representao grfica de uma distribuio de
frequncias por meio de uma linha poligonal fechada ou polgono, cuja rea total igual
a do histograma. Exemplo: Grfico 4.
Grfico 4:
Alturas dos estudantes de Calc. Prob. Est I
Turno: Manh, Turma: 04, Perodo: 97.1
18
Vimos anteriormente a sintetizao dos dados sob a forma de tabelas, grficos e
distribuies de frequncias. Aqui, vamos aprender o clculo de medidas que possibilitem
representar um conjunto de dados (valores de uma varivel quantitativa, isto , informaes
numricas), relativos observao de determinado fenmeno de forma reduzida.
Estes ndices estatsticos so as MEDIDAS DE POSIO e, dentre as mais
importantes, citamos as Medidas de Tendncia Central, que recebem tal denominao
pelo fato dos dados observados tenderem, em geral, a se concentrar em torno de valores
centrais. Dentre as medidas de tendncia central, destacamos:
a Mdia aritmtica ou Mdia;
a Moda;
a Mediana.
As outras medidas de posio so as SEPARATRIZES, que englobam:
a prpria mediana;
os quartis;
os percentis.
1. MDIA ARITMTICA (ou simplesmente MDIA)
Definio 5.1:
(a) Dada uma populao constituda de N elementos, X
1
, X
2
, ..., X
N
sua mdia,
denotada por , mede o valor mdio do conjunto de dados, sendo expressa na mesma
unidade, e definida por:
=
+ + + X X X
N
N 1 2
...
ou =
X
N
i
( Mdia populacional ) Eq. (1)
(b) Dada uma amostra constituda de n elementos, X
1
, X
2
, ..., X
n
, sua mdia,
denotada X , ser definida por:
X =
X X X
n
n 1 2
+ + +
ou X =
X
n
i
( Mdia amostral ) Eq. (2)
Exemplo: Determinar a mdia do seguinte conjunto (amostra) de valores X
i
: 3, 7, 8,
10, 11
Logo, X =
X
n
i
=
3 7 8 10 11
5
+ + + +
X = 7,8
5 - MEDIDAS DE POSIO
19
(c) MDIA ARITMTICA PARA DISTRIBUIES DE FREQUNCIA
Seja um conjunto de dados ( uma amostra ) constituda de n valores da varivel X,
isto , X
1
, X
2
, ..., X
k
ocorrendo com respectivas frequncias f
1
, f
2
, ..., f
k
de modo que f
i
=
n .
A mdia aritmtica (ou simplesmente mdia) de X, denotada X , definida por:
X =
X f
f
i i
i
ou simplesmente X =
X f
n
i i
Eq. (3)
onde n = f
i
o nmero de elementos do conjunto.
OBS.: A expresso acima usada tanto no caso de distribuio de frequncias por valores,
como para dados agrupados em classes. No segundo caso, os X
is
representam os pontos
mdios de classes.
Exemplo: Determinar a mdia do seguinte conjunto de valores, X
i
: 2, 3, 8, 8, 5, 2, 2,
2, 8, 5, 3, 8, 2, 2, 5, 8, 2, 5, 8 e 2
X
i
f
i
X
i
f
i
2 8 16
3 2 6
5 4 20
8 6 48
20 90
Portanto, aplicando a Eq. (3), vem:
X =
X f
f
i i
i
90
20
X = 4,5
n = f
i
= 20
OBS.: A Equao (3) uma adequao da equao (2) no caso de um conjunto de valores
X
is
com elementos repetidos.
VANTAGENS E DESVANTAGENS DA MDIA
1. uma medida de tendncia central que por uniformizar os valores de um conjunto de
dados, no representa bem os conjuntos que revelam tendncias extremas. Ou seja,
grandemente influenciada pelos valores extremos (grandes) do conjunto.
2. No pode ser calculada para distribuies de frequncias com limites indeterminados
(indefinidos).
20
Exemplo: impossvel calcular a mdia da distribuio abaixo, representativa das
idades de um grupo de 300 pessoas.
IDADES
(Anos)
N
o
de Pessoas
f
i
Menos de 33 1
33 |------- 35 21
35 |------- 37 52
37 |------- 39 186
39 |------- 41 38
41 ou mais 2
Total ou 300
3. o promdio mais conhecido e de maior emprego.
4. facilmente calculvel.
5. Pode ser tratada algebricamente (ver propriedades).
6. Serve para compararmos conjuntos semelhantes.
7. particularmente indicada para sries (conjuntos) que possuem os valores simtricos
em relao a um valor mdio e de frequncia mxima.
8. Depende de todos os valores do conjunto de dados.
Propriedades:
1 - A soma dos desvios tomados em relao mdia nula, isto ,
( )
X X
i
i
n
=
=
1
0.
2 - Somando-se ou subtraindo-se uma constante (c) a todos os valores de uma varivel, a
mdia do conjunto fica aumentada ou diminuda dessa constante, isto ,
Y X c Y X c
i i
= = .
3 - Multiplicando-se ou dividindo-se todos os valores de uma varivel por uma constante
(c), a mdia do conjunto fica multiplicada ou dividida por essa constante, isto ,
Y X c Y X c
i i
= = ou Y X c Y X c
i i
= = , para c0.
2. MODA
Desprezando as classes abertas, isto , com
limites indeterminados, a sim, poderamos
calcular a referida mdia.
21
Definio 5.2: Dado um conjunto de valores, a moda, denotada Mo, o valor que ocorre
com maior frequncia, ou seja, o valor mais frequente do conjunto de
dados.
OBS.:
i) A moda de um conjunto de dados pode no existir (figura (a) )
ii) A moda de um conjunto de dados pode no ser nica (figura (c) )
Exemplo: Determine a moda dos seguintes conjuntos de dados abaixo
a) 2, 2, 3, 3, 5, 5, 8, 8 No existe moda.
b) 2, 2, 3, 5, 5, 5, 8, 8 Mo = 5
c) 2, 2, 2, 3, 3, 5, 5, 5, 8 Mo = 2 e Mo = 5
- CLCULO DA MODA PARA DADOS AGRUPADOS
Em uma distribuio de frequncias com dados agrupados em classes,
denominamos classe modal que possui a maior frequncia, e, conseqentemente, ser esta
classe que conter a moda.
FRMULA de CZUBER (interpretao
geomtrica atravs de Histograma)
Mo L h
mo mo
= +
+
|
\
1
1 2
onde:
L
mo
: limite inferior da classe modal
h
mo
: amplitude da classe modal
1
= f
modal
- f
anterior
2
= f
modal
- f
posterior
22
Exemplo: Utilizando os dados apresentados na tabela 1.4, determine a ALTURA MODAL
dos 29 estudantes de Clculo das . Probabilidades. e Estatstica I - Turno: Manh, Turma:
04, Perodo: 97.1
Classe modal (2
a
.) 164 |----- 171 , L
mo
= 164 , f
mo
= 12 , h
mo
= 7
1
12 4 8 = = = f f
max ant
;
2
12 9 3 = = = f f
max post
Logo, Mo cm = +
+
|
\
| = 164
8
8 3
7 169 1 , ou Mo = 169 cm
VANTAGENS E DESVANTAGENS DA MODA
1. No depende de todos os valores do conjunto de dados, podendo mesmo no se alterar
com a modificao de alguns deles.
2. No influenciada por valores extremos (grandes) do conjunto de dados.
3. Pode ser calculada para distribuies com limites indeterminados (indefinidos) na
maioria dos casos.
3. MEDIANA
Definio 5.3: Considere uma srie (conjunto de dados) ordenada, constitudo de n
valores. A mediana, denotada Me , o valor que divide o conjunto em duas
partes iguais ( isto , em duas partes de 50% cada).
Exemplos:
a) Calcular a mediana do seguinte conjunto de dados: 2, 3, 5, 8, 9, 11, 13 (n = 7
mpar)
Me = 8 (termo de ordem central )
b) Calcular a mediana do seguinte conjunto de dados: 2, 3, 5, 8, 9, 11, 13, 15 (n = 8
par)
Me =
+
|
\
| =
8 9
2
8 5 , (Mdia aritmtica dos termos de ordens centrais)
Verificamos que, estando ordenados os valores de uma srie (conjunto de dados) e
sendo n o nmero de elementos da srie, o valor mediano ser:
- o termo de ordem central
n +1
2
, Me X
n
=
+1
2
se n for mpar;
23
- a mdia aritmtica dos termos de ordem
n n
2 2
1 e + , Me
X X
n n
=
+
+
2 2
1
2
se n for par.
CLCULO DA MEDIANA NUMA DISTRIBUIO DE FREQUNCIAS
a) Dados No-agrupados
Neste caso, para a srie de valores ordenados em ordem crescente de grandeza (i. e.,
em um rol), a mediana o valor mdio ou a mdia aritmtica dos valores centrais, caso
tenhamos um nmero mpar ou par de valores na srie.
b) Dados Agrupados em Classes
No caso de dados agrupados, relembramos que uma distribuio de frequncias
pode ser representada por meio de um Histograma. Dizemos ento que a mediana ser o
valor de X (abscissa) cuja ordenada divide a rea total do Histograma em duas partes
iguais.
Assim, para dados agrupados, a mediana obtida atravs de interpolao de acordo
com a seguinte frmula:
Me L
n
F
f
h
me
ant
me
me
= +
|
\
|
|
|
2
onde:
Exemplo: Determinar a ALTURA MEDIANA dos 29 estudantes da turma de Cal. Prob. Est
I, Turno: Manh, Turma: 04, Perodo: 97.1 - Turno da tarde, conforme os dados
agrupados na tabela 1.4 (estendida).
L
me
o limite inferior da classe mediana;
fme a frequncia simples da classe mediana;
F
ant
a frequncia acumulada da classe anterior
classe mediana;
h
me
a amplitude da classe mediana; n o total de
observaes.
24
Conjunto A ====> 7, 7, 7, 7, 7
Conjunto B ====> 5, 6, 7, 8, 9
Conjunto C ====> 4, 5, 7, 9, 10
Conjunto D ====> 0, 5, 10, 10, 10
n/2 = 29/2 = 14,5 (50%) ====> Classe mediana (2a.) : 164 |----- 171 (Classe mediana:
primeira classe que ultrapassar 50% (n/2) ou mais das
observaes)
L
me
= 164 ; f
me
= 12 ; h
me
=7 ; F
ant
= 5
Md cm = +
|
\
| = + = 164
14 5 5
12
7 164 55 169 5
,
, ,
ou Md = 170cm
PROPRIEDADES DA MEDIANA
i) A mediana no influenciada por valores extremos (grandes) de uma srie ou conjunto
de dados.
ii) A mediana de uma srie de dados agrupados de classes extremas indefinidas pode ser
calculada.
Na seo anterior, aprendemos a calcular e entender convenientemente as medidas de
posio representativas de um determinado conjunto de dados, onde destacamos a mdia, a
moda e a mediana.
Sejam quatro conjuntos A, B, C e D com os seguintes valores:
Observando-os mais detalhadamente, notamos que em cada grupo os valores se distribuem
diferentemente em relao mdia 7. Necessitamos assim de uma medida estatstica
complementar para melhor caracterizar cada conjunto apresentado.
As medidas estatsticas responsveis pela variao ou disperso dos valores de um
conjunto so as medidas de disperso ou de variabilidade, onde se destacam a amplitude
total, a varincia, o desvio padro e o coeficiente de variao. Em princpio, diremos que
entre dois ou mais conjuntos de dados, o mais disperso ( ou menos homogneo ) aquele
que tem a maior medida de disperso.
1 - A AMPLITUDE TOTAL
Medida j apresentada na elaborao de uma distribuio de frequncias com dados
agrupados em classes, denotamos AT.
6. MEDIDAS DE DISPERSO
Para representarmos cada conjunto, podemos
calcular a sua respectiva mdia
(Eq.(1)),encontrando
X X X X A B C D = = = = 7.
Vemos assim que apesar de constitudos
de valores diferentes, os grupos revelam uma
mesma mdia aritmtica.
25
AT X X
mx mn
= , onde X
mx
= maior valor do conjunto e X
mn
= menor valor do
conjunto.
2- A VARINCIA
A varincia de um conjunto de dados ( amostra ou populao ) mede a variabilidade
do conjunto em termos de desvios quadrados em relao mdia aritmtica do conjunto.
uma quantidade sempre no negativa e expressa em unidades quadradas do conjunto de
dados, sendo de difcil interpretao.
Definio 6.1:
a) Seja um conjunto ( populao ) constitudo de N elementos X
1
, X
2
, . . ., X
N
. Sua
varincia denotada
2
, definida por:
( )
2
2
=
X
N
i
Eq (5) , onde =
X
N
i
a mdia populacional
b) Seja um conjunto ( amostra ) constitudo de n elementos X
1
, X
2
, . . . , X
n
. Sua
varincia, denotada S
2
, definida por:
( )
S
X X
n
i
2
2
1
=
Eq (6) , onde X
X
n
i
=
a mdia amostral
OBS.: A equao (6) utilizada quando nosso interesse no se restringe descrio dos
dados mas, partindo da amostra, visamos tirar inferncias vlidas para sua respectiva
populao. No caso de estarmos interessados apenas na descrio dos dados,
podemos usar no divisor n em lugar de n - 1
Exemplo 2: Determine a varincia do seguinte conjunto (amostra) X
i
: 2, 3, 5, 7, 8
De acordo com a equao (6) temos:
( ) ( ) ( ) ( ) ( )
S
2
2 2 2 2 2
2 5 3 5 5 5 7 5 8 5
5 1
=
+ + + +
, onde X
X
n
i
= = =
25
5
5
( ) ( ) ( ) ( ) ( )
=
+ + + +
=
+ + + +
= S
2
2 2 2 2 2
3 2 0 2 3
4
9 4 0 4 9
4
26
4
=====> S
2
= 6,5
CLCULO DA VARINCIA EM UMA DISTRIBUIO DE FREQUNCIAS
( Caso de amostra )
Analogamente, a definio apresentada na Equao (6), temos
26
( )
S
X X f
n
i i
2
2
1
=
Eq. ( 7 ) , onde f
i
: frequncias de classes e n f
i
=
OBS.: No caso de dados agrupados os X
is '
so os pontos mdios de classes.
FRMULA ALTERNATIVA derivada da Equao ( 7 ) :
( )
S
X f
X f
n
n
i i
i i
2
2
2
1
=
ou
( )
( )
S
n X f X f
n n
i i i i
2
2
2
1
=
Eq. ( 8 )
3 - O DESVIO PADRO
uma outra medida de disperso mais comumente empregada do que a varincia, por
ser expresso na mesma unidade do conjunto de dados. Mede a "DISPERSO
ABSOLUTA" de um conjunto de valores e obtida a partir da varincia.
Desvio Padro = + Varincia ( Raiz quadrada positiva da Varincia )
Conforme, o conjunto de dados, trate-se de uma populao ou uma amostra, teremos o
desvio padro dado por:
Populao =====>
( )
X
N
i
2
Amostra ======>
( )
S
X X
n
i
=
1
2
Do exemplo 2 , dado acima, temos o desvio padro dado por S = 6 5 , ====> S = 2,55
Exemplo 3: Calcular a varincia e o desvio padro para a distribuio de frequncias das
ALTURAS dos 29 estudantes de Clculo das Probabilidades e Estatstica I -
Turno: Manh, Turma: 04, Perodo: 97.1.
ALTURAS
(cm)
No. Est
f
i
P. Mdio
X
i
X
i
2
X f
i i
X f
i i
2
150 |---- 157 1 153,5 23562,25 153,5 23562,5
157 |---- 164 4 160,5 25760,25 642 103041,0
164 |---- 171 12 167,5 28056,25 2010 336675,0
171 |---- 178 9 174,5 30450,25 1570,5 274052,25
178 |---- 185 3 181,5 32942,25 544,5 98826,75
Total ou 29 4920,5 836157,5
Varincia
==> S
n X
i
f
i
( X
i
f
i
)
n (n )
, ( , ) ,
,
2
2
2
1
29 836157 25 4920 5
2
29 28
37239 95
812
4586 =
=
= =
27
Portanto, a varincia das alturas ser: S , cm
2
4586
2
=
Desvio Padro ====> S cm cm = = = Varincia 4586 6 77
2
, ,
4 - O COEFICIENTE DE VARIAO
uma quantidade adimensional e serve para comparar dois ou mais conjuntos de
dados de unidades diferentes. Mede a "DISPERSO RELATIVA" de um conjunto de
dados. expresso, usualmente, em percentagem ( % ).
Populao ====> CV =