Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
=
TABELA PRIMITIVA OU DADOS BRUTOS: uma tabela ou relao de elementos
que no foram numericamente organizados. difcil formarmos uma idia exata do
comportamento do grupo como um todo, a partir de dados no ordenados
Ex :45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
ROL: a tabela obtida aps a ordenao dos dados (crescente ou decrescente).
Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
Dados Freqncia
Freqncia
Acumulada
Freqncia
Relativa
41 3
3 0,15
42 2
5 0,10
43 1
6 0,05
44 1
7 0,05
45 1
8 0,05
46 2
10 0,10
50 2
12 0,10
51 1
13 0,05
52 1
14 0,05
54 1
15 0,05
57 1
16 0,05
58 2
18 0,10
60 2
20 0,10
Total 20
- 1,00
Distribuio de freqncia COM INTERVALOS DE CLASSE: Quando o tamanho da
amostra elevado, mais racional efetuar o agrupamento dos valores em vrios
intervalos de classe.
12
Classes Freqncias
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20
Pode-se agrupar os elementos em funo de seus valores (quando
quantidades) ou atributos (quando qualidades), criando-se, desta forma, classes.ou
intervalos.
Via de regra, as variveis quantitativas contnuas s podem ser descritas
graficamente quando agrupadas em classes ou intervalos. O nmero de classes a
ser dividido um conjunto de informaes ou dados varia em decorrncia de muitos
fatores, como o grau de preciso requerido, a relevncia do estudo, mas,
fundamente depende do nmero de dados.
Definio do Nmero de Classes
-
1
2
3
4
5
6
7
8
9
10
0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300 320
Quantidade de Dados (n)
N
d
e
C
l
a
s
s
e
s
13
Mtodo prtico para construo de uma Distribuio de Freqncias c/ Classe
1 - Organize os dados brutos em um ROL.
2 - Calcule a amplitude amostral AA.
No nosso exmplo: AA = 60 - 41 = 19
3 - Calcule o nmero de classes atravs da "Regra de Sturges":
N de classes = 1+ 3,3 x log n de dados ou a identificao utilizando-se o baco j
exposto que expressa graficamente esta equao.
4 - Decidido o n de classes, calcule ento a amplitude do intervalo de classe (h).
No nosso exemplo: AA / n de classes = 19/5 = 3,8. Utilizaremos ento h = 4.
5 - Temos ento o menor n da amostra, o n de classes e a amplitude do intervalo.
Podemos montar a tabela, com o cuidado para no aparecer classes com
freqncia = 0 (zero).
No nosso exemplo: o menor n da amostra = 41 + h = 45, logo a primeira
classe ser representada por 41 |------- 45. As classes seguintes respeitaro o
mesmo procedimento.
O primeiro elemento das classes seguintes sempre sero formadas pelo
ltimo elemento da classe anterior.
N de
Classes
Classes fi
1 41 |------- 45 7
2 45 |------- 49 3
3 49 |------- 53 4
4 53 |------- 57 1
5 57 |------- 61 5
Total 20
As freqncias podem ser descritas sobre forma de Tabelas ou de Grficos, grficos
estes chamados de Histogramas.
4 4 4 5 5 6
1
3
5
7
Pt. Mdio
fi
classe
14
Polgono de freqncia (ou distribuio de freqncia)
Outra forma de representao dos valores ou atributos formado pela unio
dos pontos mdios dos intervalos de classe de um Histograma. Podem ser de dois
tipos:
- Funo Densidade: - freqncia f(x)
- Funo Distribuio: f acumulada: f(x) dx
Em teoria da probabilidade, a funo distribuio acumulada (fda) descreve
completamente a distribuio da probabilidade de uma varivel aleatria de valor
real X. Para cada nmero real x, a fda dada por
onde o lado direito representa a probabilidade de que a varivel X tome um valor
inferior ou igual a x
4 4 4 5 5 6
1
3
5
7
fi
classes
15
4. CARACTERSTICAS NUMRICAS OU PARMETROS OU MEDIDAS DE UMA
DISTRIBUIO DE FREQNCIAS:
Alm da viso que se tem a partir dos grficos, devem ser realizadas medidas
especficas, de cunho numrico, sendo estas medidas :
a) De Posio;
b) De Disperso;
c) De Simetria;
d) De Curtose (ou achatamento).
4.1. Medidas de Posio:
So valores concretos da grandeza, caracterstica ou atributo, que servem
para localizar a distribuio de freqncias sobre o eixo de variao desta da
varivel em estudo.
Existem vrias destas medidas:
- Mdia: uma medida de tendncia central. Podendo assumir as seguintes
definies: - Aritmtica; Interna; Quadrtica; Geomtrica e Harmnica.
- Mdia Aritmtica (Notao: X): a mais usual das mdias, obtida da seguinte forma:
a soma de todos os valores desta caracterstica ou varivel dividido pelo nmero
total de elementos observados. Se os dados aparecem agrupados em classes de
freqncias, pode-se obter a mdia aritmtica pela soma dos valores (ou dos valores
mdios de cada classe) ponderados com suas freqncias relativas.
N
X
X
n
i
i
=
=
1
onde Xi so os valores da varivel e n o nmero de valores.
ou ainda
i
n
i
i i
f
X f
X
=
=
1
onde Xi o ponto mdio da classe.
A mdia aritmtica pode ser Simples ou Ponderada.
16
- Mdia Interna (Notao: XI): calcula a mdia aritmtica de um conjunto de dados
excluindo-se uma certa percentagem dada ou definida (por exemplo 10%) dos
extremos inferiores e superior.
- Mdia Mvel (Notao: XM): calcula a mdia aritmtica (geralmente simples, mas
pode tambm ser ponderada) de parte de um conjunto de dados, dependendo da
ordem denominada N, que definir a quantidade de dados utilizada para calcular a
mdia.
A Mdia Mvel Simples pode ser unilateral ou bilateral.
XM =
N
X
XM
T
N T i
i
+ =
=
1
Unilateral
N
X
XM
N T
N T i
i
+
=
=
2 / ) ! (
2 / ) 1 (
Bilateral
Ver Apostila UPV pg. 116
- Mdia Quadrtica (Notao:
2
X ou R.M.Q.): tambm conhecida como raiz
quadrtica mdia. obtida da seguinte expresso:
- Mdia Geomtrica (Notao: G): a raiz de ordem N do produto dos valores (ou
dados), sendo calculada pela seguinte expresso:
ou ainda
Ver Apostila UPV pg. 39
N
X
X RMQ
N
i
=
= =
1
2
1
2
17
- Mdia Harmnica (Notao: H): a recproca da mdia da mdia aritmtica das
recprocas (ou inversas) dos valores (ou dados).
ou ainda
- Mediana (Notao: Md): o valor ou grandeza que separa a metade dos
elementos (da amostra ou da populao, conforme o caso), isto , 50% dos
elementos se encontram acima desta medida e 50% abaixo. Quando o nmero de
elementos par, se considera o ponto mdio do intervalo. calculada com base na
ordem de grandeza dos valores, isto , em um rol.
Md = ( n + 1 ) / 2
Ex: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 2, 5 }
1 - ordenar a srie { 0, 0, 1, 1, 2, 2, 3, 4, 5 }
n = 9 logo (n + 1)/2 dado por (9+1) / 2 = 5, ou seja, o 5 elemento da srie
ordenada ser a mediana
A mediana ser o 5 elemento = 2.
Se a srie dada tiver nmero par de termos, o valor mediano ser o termo de
ordem dado pela frmula:
Md = [( n/2 ) +( n/2+ 1 )] / 2
Ex: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }
1 - ordenar a srie { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }
n = 10 logo a frmula ficar: [( 10/2 ) + (10/2 + 1)] / 2
[( 5 + 6)] / 2 ser na realidade (5 termo+ 6 termo) / 2
5 termo = 2
6 termo = 3
A mediana ser = (2+3) / 2 ou seja, Md = 2,5 . A mediana no exemplo ser a
mdia aritmtica do 5 e 6 termos da srie.
18
Outras medidas similares a mediana, que divide o conjunto de elementos em
duas partes iguais. Por extenso a esta, pode-se tambm dividir os elementos em
quatro partes iguais. Estes valores que representam estas quatro partes so
chamados Quartis (Q1 = primeiro quartil, Q2 = segundo e Q3 = terceiro), sendo o
valor de Q2 igual a mediana (Md).
Pode-se ainda dividir em 10 partes (decis) e at em 100 partes (percentis).
- Moda (Notao: Mo): o valor ou a classe mais freqente em um conjunto de
dados (ou valores), ou seja, o que ocorre com maior freqncia. A moda pode no
existir, e as vezes pode no ser nica, isto , podem existir mais de uma.
Ex: Na srie { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda igual a 10.
No caso de dados agrupados em que foi construda uma curva de freqncias que a
eles se ajuste, a moda ser o valor (ou os valores no caso de mais de uma moda) de
X (abcissa) correspondente ao ponto de ordenada mxima.
Relao Emprica entre Mdia Aritmtica (X), Mediana (Md) e Moda(Mo):
X - Mo = 3 (X - Md)
- H sries nas quais no exista valor modal, isto , nas quais nenhum valor aparea
mais vezes que outros. Ex: { 3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie
amodal.
- Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos,
ento, que a srie tem dois ou mais valores modais.
Ex: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A srie
bimodal.
- Com intervalos de classe: A classe que apresenta a maior freqncia
denominada classe modal. Pela definio, podemos afirmar que a moda, neste
caso, o valor dominante que est compreendido entre os limites da classe modal.
O mtodo mais simples para o clculo da moda consiste em tomar o ponto mdio da
classe modal. Damos a esse valor a denominao de moda bruta.
Mo = ( l* + L* ) / 2
onde l* = limite inferior da classe modal e L* = limite superior da classe modal.
19
4.2. Medidas de Disperso:
So elementos complementares s medidas de posio (em especial a
mdia), e indicam o quanto os dados, ou ainda, ou os valores destes dados se
apresentam dispersos ou espalhados em relao a regio central ou de tendncia
central. Caracterizam o grau de variao existente no conjunto de valores.
Existem diversas medias de disperso, sendo as mais importantes: a
amplitude; a varincia; o desvio padro e o coeficiente de variao.
Observao: outras medidas de disperso tais como desvio mdio e amplitude
interquatil, embora existam, no sero abordadas por serem de menor aplicao em
estatstica.
- Amplitude (Notao: R): a diferena entre o maior e o menor valores do
conjunto.
- Varincia (Notao: S
2
): a mdia dos quadrados das diferenas dos valores em
relao sua mdia (aritmtica), isto :
( )
n
X X
S
i
2
2
= ou ainda
( ) [ ]
fi
fi X X
S
i
=
.
2
2
As formulaes acima so aplicveis quando o conjunto de dados for a
populao. Quando os dados caracterizarem uma amostra, o denominador (N) deve
ser substitudo por N-1, por motivos a serem posteriormente explicados.
( ) [ ]
1
.
2
2
=
fi
fi X X
S
i
A varincia uma medida muito importante na teoria estatstica, porm, em
termos prticos, ele possui o inconveniente de se expressar na unidade quadrdica
em relao da varivel em estudo.
R = X
MAX
- X
MIN
20
- Desvio Padro (Notao: S): a raiz quadrada positiva da varincia. Como o
desvio padro se expressa na unidade da varivel, mais interessante sua
aplicao nos casos prticos. tambm chamado erro padro.
) ( ) (
2
x S x S =
- Coeficiente de Variao (Notao: cv): o quociente entre o desvio padro e a
mdia aritmtica. Freqentemente expresso em porcentagem.
X
x S
x CV
) (
) ( =
Relao Emprica entre Desvio Padro e Amplitude:
4.3. Medidas de Simetria:
So elementos complementares s medidas de posio e de disperso e
indicam o quanto distribuio de freqncias (representada pelo polgono de
freqncias) dos dados, ou ainda dos valores destes dados, se afasta da condio
de simetria. Considera-se a distribuio simtrica quando seus valores se
distribuem igualmente para cima e par baixo da mdia, coincidindo os valores desta
(mdia) com o da mediana.
Assimetria , desta forma, o grau de desvio ou afastamento da simetria de
uma distribuio.
Se a curva ou polgono de freqncias de uma distribuio tem uma "cauda"
mais longa direita da ordenada mxima, diz-se que desviada para a direita ou
ainda que tem assimetria positiva. Se ocorrer o inverso, diz-se que desviada para
a esquerda e que tem assimetria negativa.
R < S < R
6 3
21
Uma distribuio com classes simtrica quando :
Mdia = Mediana = Moda
Uma distribuio com classes :
- Assimtrica esquerda ou negativa quando: Mdia < Mediana < Moda
- Assimtrica direita ou positiva quando: Mdia > Mediana > Moda
- Coeficiente de assimetria: A medida anterior, por ser absoluta, apresenta a mesma
deficincia do desvio padro, isto , no permite a possibilidade de comparao
entre as medidas de duas distribuies. Por esse motivo, daremos preferncia ao
coeficiente de assimetria de Pearson:
- Primeiro Coeficiente de Pearson:
- Segundo Coeficiente de Pearson:
- Coeficiente de Simetria:
3
3
1
) (
1
1
S
X X
N
N
I
i
=
ASSIMETRIA = 3 ( MDIA MEDIANA) = 3 (X - Md)
DESVIO PADRO S
FUNO SIMETRICA E ASSIMETRICA
VALORES
F
R
E
Q
U
E
N
C
I
A
ASSIMETRIA = MDIA MODA = X - Mo
DESVIO PADRO S
22
4.4. Medidas de Curtose ou Achatamento:
Complementando os parmetros que ensejam uma idia da distribuio, se
define a curtose que reflete a elevao ou achatamento dos valores em relao a
"distribuio normal". calculada pela seguinte frmula:
3
) (
1
1
.
4
1
4
=
=
S
X X
N
deCurtose Coef
N
I
I
Se o coeficiente acima calculado for maior do que zero a distribuio
chamada de leptocrtica, se igual a zero de mesocrtica (ou normal) e se menor do
que zero platicrtica.
5. A CURVA NORMAL OU DISTRIBUIO DE GAUSS:
A distribuio simtrica, onde mdia, mediana e moda so iguais, e que
definida pela seguinte equao:
z
x
x f
2
) (
2
2
1
) (
= l
Onde: Desvio padro
- Mdia
chamada de "Curva Normal" ou "Distribuio de Gauss".
VALORES
CURTOSE
F
R
E
Q
U
E
N
C
I
A
S
____ NORMAL
_ _ _PLATICRTICA
____ LEPTOCRTICA
23
A varivel X pode ser expressa em termos de unidade reduzida, z = (X-m)/,
ficando a equao da distribuio de Gauss substituda pela denominada forma
reduzida:
2
2
1
2
1
z
y
= l
A vantagem da forma reduzida que qualquer distribuio pode ser expressa
graficamente de forma genrica:
CURVA NORMAL OU DE GAUSS
CURVA NORMAL OU DE GAUSS REDUZIDA
MEDIANA X X = =
68,27%
1S
1S
1S
1S
1S
Valores
95,45%
99,73%
1S
Y
68,27%
Z
95,45%
99,73%
0,4
0,3
0,2
0,1
0
-3
-2 -1
1 2 3
24
Outras Distribuies:
De Poisson, Binomial, de Exponencial, Beta.
Distribuio de Bernoulli com n = 25.
Distribuio Binomial com n = 10 e p= 0,35.
25
BIBLIOGRAFIA
- SILVA, P. N. - Estatstica (auto-explicativa). Editora rica LTDA. So Paulo. 1998.
- MILONE, GILSEPPE; ANGELINI, FLVIO Estatstica Geral. Editora Atlas. Volume 1. So
Paulo. 1998.
- SPIEGEL, M. Estatstica. 2 ed. Editora McGraw-Hill (Coleo Shaum). So Paulo. 1979.
- SPIEGEL, M. Teoria e problemas de probabilidade e estatstica, Editora Bookman (Coleo
Shaum), Porto Alegre, 2004.
- SEGURA, B. Tratamiento Cuantitativo para Tasadores, Editorial Universidad Politcnica de
Valencia, 2002.
- http://www2.ufpa.br/dicas/biometria
- http://www.csr.ufmg.br/geoprocessamento/centrorecursos/apostilas/estatistica1.pdf