Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
(Y / N )
i
i =1
[O smbolo
a soma de valores]
representa a mdia aritmtica dos valores Y1, Y2, ...,YN e ser a mdia aritmtica da
populao, se N representar todos os elementos medidos desta populao. Entretanto, esta situao muito raramente possvel. Normalmente, o que se tem disponvel uma pequena poro (alguns elementos de uma populao), ou seja, uma
amostra. Se esta amostra for representada por Y1, Y2, ...,Yn , sendo n o nmero de
elementos ou de unidades amostrais desta amostra, ento a quantidade
n
Y
i =1
= 3 + 4 + 5 + 4 + 3 = 19, tem-se
Y = 19/5 = 3,80
O valor 3,80 uma estimativa da mdia da populao de onde a amostra
foi colhida.
evidente que diversas amostras aleatrias podem ser obtidas de uma mesma populao. Se esta populao infinita, a rigor, podese imaginar tambm um
nmero infinito de amostras de tamanho n, ou seja, um grande nmero de amostras, cada uma, com n unidades amostrais. As estimativas das mdias destas amostras aleatrias no sero todas numericamente iguais, e todas elas tm o mesmo
valor com representante, ou estimativa, da mdia da populao. Um experimento
cientfico constitui-se uma amostra, que se espera aleatria, de uma populao,
muitas vezes infinita. Este conceito ser fundamental mais frente, quando sero
apresentados e discutidos os testes de hiptese, como anlise de varincia e anlise
de regresso, e procedimentos para comparao de mdias.
Y = ( f i .Yi )/ fi
i =1
Por exemplo, 50 consumidores provaram uma amostra de sorvete e atriburam nota para aceitao de acordo com uma escala hednica de cinco categorias (Yi
= 0, 1, 2, 3 ou 4). As frequncias das notas ocorreram da seguinte forma: 11 consumidores atriburam o escore zero, 23 atriburam nota 1, 12 consumidores deram
a nota 2, 3 deram nora 3 e 1 deu nota 4. Os dados e os clculos necessrios para
estimar a mdia aritmtica encontram-se no quadro a seguir:
Yi
0
1
2
3
4
fi
11
23
12
3
1
50
fi.Yi
0
23
24
9
4
60
Y = 60/50 = 1,20
Este valor 1,20, portanto, uma estimativa da verdadeira mdia () dos escores sensoriais para aceitao do nosso sorvete. Claro que este valor desconhecido, caso contrrio no haveria necessidade do teste. Este simples teste de
aceitao sensorial de sorvete um experimento cientfico. Esta amostra de 50 pessoas que participaram do teste espera-se seja representante da populao consumidora deste produto. Caso contrrio, o teste deixa de ser um experimento cientfico e passa a ser apenas uma brincadeira agradvel de degustao de sorvete.
evidente que se pode imaginar um nmero muito grande de diferentes amostras de
50 consumidores para participarem do teste sensorial. Cada uma delas gerando um
valor diferente para a estimativa da mdia dos escores de aceitao sensorial, todas
elas com o mesmo valor cientfico de estimativa da verdadeira e desconhecida mdia da populao de consumidores do sorvete. H que se entender tambm, neste
exemplo, que a amostra de sorvete utilizada no teste tem que representar a populao de sorvetes do tipo testado. Assim, neste experimento h basicamente duas
populaes envolvidas, a dos consumidores e a do tipo de sorvete.
Ponto central da
classe (Ci)
28
32
36
40
44
48
52
56
Frequncia (fi)
fi.Ci
3
29
39
41
19
12
4
3
150
84
928
1404
1640
836
576
208
168
5844
Y = 38,96
Ponto mdio
PM
1
3
5
7
9
11
13
15
17
19
21
23
25
27
Frequencia
fi
11
53
47
37
21
16
13
8
10
1
2
1
0
1
221
Desvio
di
-4
-2
0
2
4
6
8
10
12
14
16
18
20
22
FrequenciaxDesvio
fi.di
-44
-106
0
74
84
96
104
80
120
14
32
18
0
22
494
em que, Z
rena entre o ponto mdio de cada classe e a mdia arbitrria inicial, e N = fi, o
nmero total de observaes.
Y = 7,24
www.dzetta.com.br
Yi =
mG =
mula:
3 x 4 x5 x 4 x3 =
720 = 3,73
A mG pode tambm ser computada utilizando logaritmo, pela seguinte frLog mG = (log Y1 + log Y2 + ... + log Yn)/n
0,571466
= 3,73
mG = 3,73
Noutro exemplo, para os valores R$ 1,00; R$ 3,00; e R$ 9,00 a mdia geomtrica
ser:
mG =
1x3 x9 =
27 = R$ 3,00
Como se observa, o logaritmo da mdia geomtrica igual a mdia dos logaritmos dos n elementos da amostra ou da populao (N). A mdia geomtrica pode
ser computada tambm para dados agrupados, utilizando tcnicas semelhantes s
da mdia aritmtica, exceto que so usados os logaritmos dos valores dos pontos
centrais das classes.
a) Pode ser considerada um valor mdio mais tpico, por ser menos afetada pe
los valores extremos.
b) A mdia geomtrica pode ser trabalhada algebricamente.
Vantagens da mdia geomtrica
mH = 1/0,2733 = 3,66
O emprego da mdia harmnica recomendado para dados de classificao,
ou ordinais.
1.1.5 Mediana
A mediana o valor que ocupa a posio central dos dados, quando eles so
arranjados em ordem (crescente ou decrescente) de magnitude. Se o nmero de
elementos no rol par, a mediana tomada como sendo a mdia aritmtica dos
dois valores centrais. Se ocorrerem valores iguais (empates) na srie, utiliza-se a
mdia das ordens que seria caso no houvesse empates. Pode-se dizer que a mediana uma mdia de posio, enquanto a mdia aritmtica um valor mdio calculado. Outra forma de expressar a mediana como o quinquagsimo percentil de
uma srie de dados. Dada uma srie de valores numricos observados, a mediana
aquele valor que no nem maior do que a metade deles nem menor que a outra
metade.
Para dados agrupados em classes, a mediana assim computada:
Determine o nmero do elemento mdio desejado usando a formula n/2, sendo n o
nmero de elementos na distribuio ou rol. H discusso sobre o uso de n/2 ou
(n+1)/2 para localizar o nmero do elemento da mediana. Se a varivel na distribuio considerada contnua, recomenda-se usar n/2, caso contrrio, se a varivel
considerada discreta, use (n+1)/2. A maioria dos autores usa n/2 para localizar a
mediana. Para a distribuio dada na tabela a seguir, o elemento mediano o septuagsimo quinto, ou seja, n/2 = 150/2 = 75.
Encontre o intervalo de classe no qual o septuagsimo quinto elemento est presente, adicionando as frequncias de cada classe, em ordem. Na tabela, a soma das
frequncias para os nove primeiros intervalos 61, e a soma para as 10 primeiras
classes 79. Assim, o septuagsimo quinto elemento encontra-se na dcima classe.
Considere que os valores dos elementos no intervalo de classe esto distribudos
uniformemente entre os limites inferior e superior, e use a interpolao linear para
determinar o valor da mediana. Na tabela do exemplo, o limite superior da nona
classe 70, havendo 61 elementos nas primeiras nove classes. O limite superior da
dcima classe 75 (Para especificar um intervalo de classe, o valor 74,9 de fato
74,999... Do ponto de vista prtico, 75 usado aqui). H 79 elementos nos primei-
ros 10 intervalos de classe. A mediana, ento, o valor do elemento que corresponde ao septuagsimo quinto. Esta informao pode ser tabulada como a seguir:
Valor
70
?
75
Elemento
Sexagsimo primeiro
Septuagsimo quinto
Septuagsimo nono
Para encontrar o valor da mediana por interpolao, os seguintes passos devem ser
seguidos:
a) Determine a frao de distncia de 61 a 75 no dcimo intervalo de classe.
N. de casos necessrios/N. de casos no grupo = (75 61) / (79 61) = 14/18 =
i/f
b) Encontre a diferena entre os limites no valor do intervalo de classe.
75 70 = 5 = H
c) Multiplique o valor da frao encontrada em a pela diferena detectada em b, e
adicione este produto ao menor limite. Esta soma a mediana.
Mediana = Lmc + (i/f) H = 70 + (14/18) 5 = 73,89.
Intervalo de classe
25 - 29,9
30 - 34,9
35 - 39,9
40 - 44,9
45 - 49,9
50 - 54,9
55 - 59,9
60 - 64,9
65 - 69,9
70 - 74,9
75 - 79,9
80 - 84,9
85 - 89,9
90 - 94,9
95 - 99,9
-
Frequncia
2
4
5
9
8
7
8
4
14
18
24
21
14
7
5
150
Freq. acumulada
2
6
11
20
28
35
43
47
61
79
103
124
138
145
150
-
10
Caractersticas da mediana
a) A mediana uma mdia de posio.
b) O valor da mediana afetado pelo nmero de itens e no pelos valores dos
dados extremos.
c) A soma dos desvios da mediana, em valores absolutos, ser sempre menor
que a soma dos desvios em relao a qualquer outro ponto.
d) A mediana valor mais tpico quando usada para descrever distribuies de
dados cujos valores centrais esto mais agrupados.
e) Um valor selecionado por acaso tem a mesma chance de estar localizado
abaixo ou acima da mediana. s vezes portanto, a mediana chamada de
valor provvel.
Vantagens da mediana
a) A mediana um valor facilmente calculado.
b) Sua estimativa no afetada por itens muito diferentes na srie.
c) A mediana , s vezes, um valor mais tpico da srie do que qualquer outro
valore mdio, em razo de sua independncia dos valores estranhos.
d) A mediana pode ser estimada mesmo nos casos de intervalos abertos, ou valores no quantitativos.
Desvantagens da mediana
a) A mediana no to familiar como a mdia aritmtica.
b) Os dados precisam ser arranjados de acordo com sua magnitude para a determi
nao da mediana.
c) A mediana tem valor de erro padro de mdia maior do que o da mdia
aritmtica.
d) A mediana no pode ser manipulada algebricamente. A mdia das medianas de
subgrupos, por exemplo, no a mediana do grupo.
1.1.6 Moda
A moda definida como o valor mais frequente ou mais comum que ocorre
em uma grande srie de dados. Tambm pode ser entendida como o valor mximo
em uma distribuio de frequncia.
No h dificuldades para encontrar o(s) valor(es) da(s) moda(s) em uma srie de dados no agrupados. Basta localizar o valor ou valores que ocorrem com
maior frequncia na distribuio. Por exemplo, no rol 3, 5, 7 e 9 no h moda, pois
todos os dados tm a mesma frequncia, igual a um. No rol 3, 5, 5, 7 e 9 a moda
5, pois o valor mais freqente. No rol 3, 5, 5, 7, 7 e 9 h duas modas, 5 e 7. Se
h duas modas, a srie chamada bimodal.
Para dados agrupados no h uma determinao matemtica exata para a
moda. H vrios mtodos disponveis para uma estimativa aproximada nesses casos. Por exemplo, o mtodo de momento forado assim descrito:
11
fi
19
43
32
27
0,40 0,49
17
0,50 0,59
21
0,60 0,69
14
0,70 0,79
0,80 0,89
0,90 0,99
1,00 1,09
1,10 1,19
1,20 1,29
187
12
dados (moda) tender para o intervalo de classe superior, e estar, portanto, acima
do ponto mdio do grupo modal.
Assim, o valor da moda da distribuio acima pode ser aproximado pela formula:
Moda = Lmo + [fa/(fa + fb)].C = 0,10 + [32/(32 + 19)] x 0,10 = 0,163
Moda = 0,163
Lmo = limite inferior do intervalo da classe modal.
fa = frequncia do intervalo acima da modal.
fb = frequncia do intervalo de classe abaixo da modal.
C = amplitude ou tamanho do intervalo de classe.
Caractersticas da moda
a) Por definio, a moda o valor mais comum, usual ou tpico da distribuio. Sob
certas circunstncias, ele pode ser considerado o valor normal.
b) O valor da moda totalmente independente dos valores extremos da
distribuio.
c) A moda, assim como a mediana, uma mdia de posio.
Vantagens da moda
a) Por ser o valor mais tpico da distribuio, a moda o seu valor mais descritivo.
b) A moda o valor facilmente aproximvel quando se tem um pequeno nmero de
casos, isto , amostras pequenas.
Desvantagens da moda
a) A moda pode estimada corretamente apenas quando se tem pequeno nmero de
dados.
b) Seu significado limitado quando a amostra pequena ou muito pequena.
c) Se no h repetio de dados a moda no existe.
13
Os percentis dividem a distribuio em 100 partes, de modo que cada percentil contem 1% dos casos. Uma diviso to detalhada s deve ser usada quando
h grande nmero de casos (talvez, pelo menos 1000).
Os quartis, decis e percentis so calculados pela mesma tcnica usada para a
mediana. Para os quartis n/4 usado para localizar Q1, e 3n/4 usado para localizar o terceiro quartil Q3. De forma semelhante, n/10 utilizado para localizar o primeiro decil. A quantidade 2n/10 localiza o segundo decil, 3n/10 localiza o terceiro
decil, e assim por diante. Para os percentis, n/100 localiza o primeiro percentil,
2n/100 localiza o segundo, 3n/100 localiza o terceiro, e assim por diante. Em geral,
substituio na frmula
L + (i/f) C,
em que L limite inferior do intervalo de classe no qual o quartil, decil e percentil
desejado se localiza, resultaro nos valores desejados.
Um exemplo um individuo A obteve escore 236 em um teste. Onze outros indivduos obtiveram escores 210, 245, 220, 225, 233, 216, 252, 228, 215, 230 e 241.
Qual o percentil do individuo A dentre os doze?
Qual o valor do 25. percentil no teste?
Resposta primeiro coloque as doze observaes em ordem crescente, como segue
210, 215, 216, 220, 225, 228, 230, 233, 236, 241, 245, 252.
Verifica-se que o escore do individuo A o nono pode-se ento dizer que este escore (236) o 75, uma vez que 9/12 ou 75% dos escores so menores ou iguais
ao do individuo A;
Como h um total de 12 escores, o 25 percentil fica entre as observaes ordenadas em 3 e em 4 posies. O 25 percentil pode assim ser especificado como o
valor entre 216 e 220, 218, por exemplo.
14
cionados mdias amostrais (1.1.1 e 1.1.2), os valores mdios de amostras diferentes, tambm so diferentes, mesmo que as amostras sejam provenientes de
uma mesma populao. Isto porque, a distribuio dos valores medidos nos itens de
uma mesma populao no uniforme. Os mtodos estatsticos de inferncia ou
descritivos se justificam neste fato de os elementos de uma populao no serem
idnticos. Em qualquer populao h sempre diferena entre seus elementos. Os
profissionais, em qualquer rea de conhecimento, precisam estar atentos a esta variao. Eles precisam compreend-la. Se a disperso dos dados em torno de uma
medida de tendncia central muito grande, ento esta medida tpica, por si s, ter pouco valor. Desta forma necessria uma medida quantitativa desta disperso
ou variao dos dados em torno de um valor tpico.
A varincia matematicamente definida como a soma de quadrados dos desvios em relao mdia dividida pelos graus de liberdade. Dada a srie Y1, Y2, ...,
YN, a SQD (soma de quadrados dos desvios em relao mdia) dada por
SQD =
(Yi - Y )
i =1
15
S =
i =1
V (Y ) , ou
tra grega sigma minscula). Desta forma, as unidades do desvio padro sero as
mesmas da varivel Y. O desvio padro uma forma especial dos desvios em relao mdia. Ele mede a variao (diferena) entre cada observao (valor
individual) e a mdia destas observaes (Yi - ).
Para amostras, a quantidade
S=
Preo R$
Yi
1
2
3
4
5
6
7
8
9
10
11
12
Total
Mdia
14
29
26
15
40
41
17
30
10
21
12
34
289
24,1
Desvio da mdia
(Yi - Y )
10,1
4,9
1,9
-9,1
15,9
16,9
-7,1
5,9
-14,1
-3,1
-12,1
9,9
0,0
-
Quadrado do desvio
(Yi - Y )
102,1
24,1
3,61
82,81
252,81
285,61
50,41
34,81
198,81
9,61
146,41
98,01
1 288,92
107,41
16
S =
117,17 = R$ 10,8
Para dados pareados a formula do desvio padro tem uma pequena diferena. Por exemplo, em um experimento em que um mesmo individuo usado para
testar o efeito de determinado tratamento, dez elementos (indivduos) foram utilizados e os resultados esto apresentados na tabela a seguir.
R_ANTES
8
10
5
8
9
7
9
10
6
8
R_DEPOIS
9
8
4
8
10
6
6
7
6
7
d / 2n
i
di
-1
2
1
0
-1
1
3
3
0
1
di
1
4
1
0
1
1
9
9
0
1
27
17
Sd =
d / 2n .
i
Sd =
27 / 2 x10 =
Mdia
Mtodo A
Dup 1 Dup 2
14,0
14,5
14,5
15,0
13,8
14,2
15,2
14,8
13,6
13,4
14,0
14,5
15,0
15,2
16,2
15,6
16,0
16,5
15,5
15,0
17,5
17,3
16,8
17,0
15,9
16,4
13,8
14,6
12,5
13,1
15,04
di
0,5
0,5
0,4
0,4
0,2
0,5
0,2
0,6
0,5
0,5
0,2
0,2
0,5
0,8
0,6
di
0,25
0,25
0,16
0,16
0,04
0,25
0,04
0,36
0,25
0,25
0,04
0,04
0,25
0,64
0,36
3,34
Dup 1
15,1
14,8
14,3
15,8
14,0
14,8
16,0
17,2
16,5
16,4
18,0
17,0
16,5
14,0
13,5
Mtodo B
Dup 2
di
14,5
0,6
15,2
0,4
14,0
0,3
16,4
0,6
14,8
0,8
15,4
0,6
16,5
0,5
16,5
0,7
16,0
0,5
16,8
0,4
17,0
1,0
17,0
0,0
17,0
0,5
15,0
1,0
14,5
1,0
15,68
di2
0,36
0,16
0,09
0,36
0,64
0,36
0,25
0,49
0,25
0,16
1,00
0,00
0,25
1,00
1,00
6,37
18
SdA =
SdB =
d / 2n
i
O erro padro de mdia EPM uma medida de variao das mdias amostrais
que leva em conta o tamanho da amostra. O EPM mede as diferenas entre mdias
amostrais e a mdia da populao de onde as amostras foram retiradas. Matematicamente o EPM igual ao desvio padro dividido pela raiz quadrada do nmero de
elementos da amostra. O EPM tende para zero quando o tamanho da amostra n
tende para a populao N.
S( Y ) = S/
No exemplo em que a mdia 24,1; para varincia 117,17 e n = 12, tem-se desvio
padro S = 10,82. A estimativa do EPM seria:
S( Y ) = 10,82/
S( Y ) = R$ 3,12
O EPM preferido em artigos em muitos peridicos pelo fato de sua estimativa considerar o
tamanho da amostra.
Coletadas vrias amostras de uma mesma populao, o EPM mede a diferena (variao) entre as mdias amostrais e a mdia da populao.
versus Ha: 1 2
19
i =1
20
P[ Y - Z /2 (S/ n ) Y + Z /2 (S/ n )] = 1 -
de que o in-
21
83
62
59
38
46
71
63
42
44
35
41
44
18
33
25
68
33
62
34
55
37
53
49
54
32
50
38
52
23
Soluo:
a) Y = (
36
S =
ou seja Y = 44,06
36
(Y Y ) /(36-1) = 281,54
i =1
S = 16,78
EPM = S/ n = 16,78/ 36 = 2,80
b) O intervalo de confiana de 90% ( = 0,10) para pequenas amostras ser
P[ Y - t/2(S/ n ) Y + t /2 (S/ n )] = 1 -
36 )] = 1 0,10,
21
= 100 98 = 2% e /2
( fo fe) / fe
22
C=
/( N + )
Produto A
Produto B
Produto C
Observados - fo
30
18
12
Esperados - fe
20
20
20
23
= 0,35
X ( X ) ][ nY (Y ) ]
um
24
Referncias Bibliogrficas
.ARKIN, H. & COLTON, R.R. Statistical methods. Fifth Barnes & Noble Books Edition.
Harper & Row Publishers, Inc., 1970. 344p.
.BETHEA, R.M.; DURAN, B.S. & BOULLION, T.L. Statistical Methods for Engineers
and Scientists. 2a. Ed. Marcel Dekker, Inc., New York. P1-5.
.GACULA, Jr., M.C. & SINGH, J. 1984. Statistical Methods in Food and Consumer
Research. Academic Press, Inc., Orlando, FL. P15-18.