Bioestatistica Atd2 PDF

A) Mediana (Md)
Num conjunto de dados ordenados, a mediana é o valor

que vem seguido e precedido pelo mesmo número de
observações.
Posição da mediana = (n+1)/2
Exemplos:
1) Amostra (3,3,5,6,7,8,9)
Posição da mediana = 7+1 = 40 dado , Md = 6
2
2) (1,2,3,4,6,6,7,9)
Posição da mediana = 8+1 = 4,5o dado = 4o dado + 5o dado = 4 + 6 = 5
2 2 2
*A mediana pode ser um valor que não ocorre na amostra.
3) P ara os dados do Quadro 2

Posição da md = 50+1 = 25,5o dado = 25o dado + 26o dado
= 29,5 + 29,5 = 29,5 Kg
2 2
2
Mediana em dados agrupados
É necessário calcular antes a distribuição de freqüência

acumulada para baixo.
Ex. Distribuição de freqüência acumulada para baixo dos

pesos ao nascer, em Kg, de 50 bezerros Guzerá
Pesos (em Kg) Fc 
Menores que 23,0 -
Menores que 25,0 2
Menores que 27,0 7
Menores que 29,0 19
Menores que 31,0 35
Menores que 33,0 45
Menores que 35,0 49
Menores que 37,0 50
Para dados agrupados a posição da mediana é = n

2
Ex. 50/2 = 25
A mediana será o 25o dado Classe mediana [ 29,0; 31,0 )
A mediana é obtida pela fórmula: Md = Li + x , onde:

Li é o limite inferior da classe mediana;
x é o resultado de uma interpolação linear
Ex. Li = 29,0
Fc 
Menores que 29 19
Menores que 31 35
2 Kg 16
x 6
x = 0,75
Md = 29 + 0,75 = 29,75 Kg
B) Moda (Mo)
A moda de um conjunto de dados é o valor mais freqüente.
Ex. amostra (2,3,4,4,4,5,6) Mo = 4 conjunto unimodal

amostra (3,4,4,5,6,7,7,9) Mo = 4 e 7 conjunto bimodal
amostra (2,3,4,5,6) Mo = não existe.
Moda em dados agrupados
A moda se localiza na classe de maior freqüência.
A1
Mo = Li + c
A1 + A2
onde:
Mo = moda;
Li = é o limite inferior da classe modal;
A1 = é a diferença entre a freqüência da classe modal e a
freqüência da classe imediatamente anterior
A2 = é a diferença entre a freqüência da classe modal e a
freqüência da classe imediatamente posterior
c = é a amplitude da classe modal.
Ex. Para a distribuição de freqüência dos pesos ao nascer , em Kg, de 50
bezerros Guzerá, tem-se:
Freqüência
Classe modal [ 29,0; 31,0 ) 16
Classe imediatamente anterior [ 27,0; 29,0 ) 12
Classe imediatamente posterior [ 31,0; 33,0 ) 10
A1 = 16 – 12 = 4
A2 = 16 – 10 = 6
C=2
4
Mo = 29 2
4+6 = 29,8 Kg
Para os dados originais (Quadro 2)

Mo = 30,2 Kg
A diferença entre os valores se deve ao erro de agrupamento.
2.3 MEDIDAS DE DISPERSÃO
As medidas de posição não informam sobre a

variabilidade dos dados e são insuficientes para
sintetizar as informações amostrais. Para
exemplificar este fato, tem-se as seguintes
amostras com mesma média:
Considere as amostras referentes aos pesos, em Kg,
de novilhos representando três raças bovinas
Nelore 185 185 185 MédiaN = 185 Kg

Gir 182 184 189 MédiaG = 185 Kg
Hereford 176 180 199 MédiaH = 185 Kg
Baseando a análise apenas pela média as três raças são consideradas como
tendo o mesmo peso. As medidas de posição são de tendência central e
nada informam sobre a variabilidade dos dados. Na raça Nelore, todos os
animais da amostra apresentaram pesos iguais a média. Na raça Gir,
percebe-se uma
ligeira dispersão nos dados que é mais expressiva na raça Hereford.
Variabilidade = é a dispersão dos dados de um conjunto ao redor de um

valor central.
Para as amostras das três raças, os desvios em relação a média são:
di = xi - x
Nelore 0 0 0
Gir -3 -1 +4
Hereford -9 -5 +14
Os desvios indicam a existência da variabilidade, mas não podem ser

utilizados como medida pois somam zero. É importante salientar que na
agropecuária a variabilidade dos dados, na maioria dos casos, é muito mais
importante que a média dos mesmos.
As principais medidas de dispersão são:
A) Amplitude total (A)
É a diferença entre o maior e o menor dado de uma amostra. Para dados

agrupados, é a diferença entre o ponto médio da 1a e da última classe.
Ex. Para as amostras das três raças:
Nelore: A = 185 – 185 = 0 Kg
Gir: A = 189 – 182 = 7 Kg
Hereford: A = 199 – 176 = 23 Kg
Para expressar variabilidade de amostras não é recomendável usar

amplitude, pois ela se baseia em apenas dois dados da amostra.
B) Variância e desvio-padrão
Variância
Numa população, a variância é definida pela razão entre a soma de

quadrados dos desvios tomados em relação a média e o n o total de
obsevações.
População  X1, X2, ...., Xn
N
X i
Média  µ = M= i=1
N
N = Tamanho da população
desvio em relação a média  Xi - µ
desvio ao quadrado  (Xi - µ)2
soma de quadrados dos desvios  SQD

N
SQD =  ( X - µ)2
i =1
i
SQD
 ( X −m) i
2
var (x) =o 2= =
N N
Na prática, trabalha-se com amostras
Amostra  X1, X2, ...., Xn
X i
Média  x= i=1
n
n = Tamanho da população
desvio em relação a média  Xi - X
soma de quadrados dos desvios  SQD

n
SQD =  ( X - X)2
i =1
i
n
SQD  ( X −x )
i
2
var(x) = s2= = i =1
n −1 n −1
(^) estimativa
(n-1)  número de graus de liberdade
Para as amostras das três raças bovinas:
Nelore: s2N = SQD = 02 + 02 +02 = 0 Kg2

n-1 3-1
Gir: s2G = SQD = (-3)2 + (-1)2 +(4)2 = 13 Kg2

n-1 3-1
Hereford: s2H = SQD = (-9)2 + (-5)2 +(+14)2 = 151 Kg2

n-1 3-1
As vacas Hereford tem maior variância que as raças Gir e Nelore,

indicando que seus dados dispersam mais em torno da média. A variância é
expressa na unidade dos dados ao quadrado.
n
Desenvolvendo a fórmula SQD =  ( Xi - X)2
i =1
obtém-se
2
 n 
  xi 
n
 
SQD =  xi − i =1
2
i =1 n
Sendo s2 = SQD
n-1
Então s2:
2
 n 
  xi 
n n
 
 ( xi − x )  xi − i =1
2 2
i =1 n
A) s2 = ou B) s2 = i =1
n −1 n −1
A fórmula (B) é chamada fórmula prática (+ rápida)
Desvio-padrão
É a raiz quadrada da variância
População = +  2
Amostra s = + s 2
Ex.: O desvio-padrão nas três raças:

Nelore : sN = 02 = 0 Kg
Gir: sG = 132 = 3,6 Kg
Hereford: sH = 1512 = 12,3 Kg
Cálculo para dados agrupados em distribuição de frequência:
  n  
2
n   fi x  
1  f  i =1 i  
i i
2
s2 = x −
n − 1  i =1 n  s = s2
 
 
onde:
xi = ponto médio da classe i;

fi = frequência da classe i;
Ex.: Seja a distribuição de freqüência dos pesos ao nascer (em Kg) de 50

bezerros Guzerá:
Fi xi fixi fixi2
Classes
[ 23,0; 25,0 ) 2 24 2.24 = 48 2.(24)2 = 1152
[ 25,0; 27,0 ) 5 26 5.26 = 130 5.(26) 2 = 3380
[ 27,0; 29,0 ) 12 28 12.28 = 336 12.(28)2 = 9408
[ 29,0; 31,0 ) 16 30 16.30 = 480 16.(30)2 =14400
[ 31,0; 33,0 ) 10 32 10.32 = 320 10(32) 2 =10240
[ 33,0; 35,0 ) 4 34 4.34 = 136 4(34) 2 = 4624
[ 35,0; 37,0 ) 1 36 1.36 = 36 1(36) 2 = 1296
Total 50 Ʃ fixi =1486 Ʃ fixi2 = 44500
Portanto,
1
s2 = [44500 – (1486)2/50)] = 6,85
50 − 1
Kg2 = variância
2
s = 2,62 Kg = desvio-
padrão
C) Coeficiente de variação (C.V.)
É uma medida de dispersão relativa, que emprega o desvio

padrão em termos da média de forma percentual.
CV = S/µ
Onde:
CV = Coeficiente de variação;
s = desvio-padrão;
Basicamente, o C.V. é utilizado em duas situações:
A) O C.V. tem grande aplicação na experimentação, em

geral, servindo para avaliar a precisão dos ensaios.
Quanto menor for o valor do C.V., mais preciso será o
experimento.
Ex. Em um trabalho de avaliação de quatro rações para
cães; o experimento teve um C.V. de 10%. Isto é, 10% das
variações medidas no experimento, não foram ocasionadas
pelo efeito das rações, e sim por outros fatores. Portanto, a
precisão do experimento foi de 90%.
B) É usado também para comparar a variabilidade entre

amostras, de unidades e médias diferentes. Neste caso,
quanto maior o C.V. maior a variabilidade relativa.
Agora, se as amostras tiverem mesma unidade e mesma
média, a variabilidade é avaliada pelo desvio-padrão.
Ex. Dados referentes à temperatura e preciptação num determinado
período.
Estatísticas amostrais Temperatura Preciptação
o
Média 22 C 800 mm
o
S 5 C 100 mm
CV 22,7% 12,5%
Verifica-se que a temperatura apresentou uma maior variabilidade relativa
que a preciptação, pois o CV foi maior.
D) Erro padrão da média. ( S )

É uma medida de dispersão que dá idéia da precisão com
que a média populacional foi estimada.
É obtida pela expressão : S = s x
n
Sendo:
s = desvio – padrão da amostra;
n = tamanho da amostra.
Ex. L
avoura de milho amostra n=30 plantas

(mediu-se a variável altura)
média = 208 cm ; s = 12 cm
Qual é a verdadeira média de todas as plantas da lavoura?
Uma outra amostra n=30 daria a mesma média? Não, pois
certamente existe uma variação da média devido ao acaso.
Calculando o erro padrão da média:
s
S =
x = 12 = 2,2cm
n 30
Este resultado indica que a média populacional foi

estimada com um erro de 2,2 cm.
 + s(  ) = 208  2 ,2cm
205,8 cm 210,2 cm
Espera-se que o verdadeiro valor da média populacional esteja neste

intervalo.
1. PROBABILIDADE
3.1 NOÇÕES DE PROBABILIDADE (CONCEITOS

BÁSICOS)
A) Importância
Na experimentação agropecuária um dos principais
objetivos é a retirada de conclusões a partir de
experimentos que envolvem incertezas. Na obtenção das
conclusões é necessário o uso da teoria da probabilidade.
B) Experimento estatístico
Qualquer fenômeno ou ação que pode ser repetido cujo
resultado é casual ou aleatório.
C) Espaço amostral
Conjunto de todos os possíveis resultados de um
experimento estatístico.
Ex. O lançamento de um dado é um experimento. Neste
caso, o espaço amostral é:
S = {1,2,3,4,5,6}
D) Evento
Subconjunto do espaço amostral que representa um
resultado definido.
No lançamento de um dado, pode-interessar, por exemplo,
somente a ocorrência de um número ímpar. O subconjunto
A ={1,3,5} do espaço amostral S representa o evento A,
definido pelo resultado OCORRÊNCIA DE FACE
ÍMPAR.
E)Ponto amostral
É apenas um elemento do espaço amostral S. Um evento
pode Ter um ou mais pontos amostrais.
F) Probabilidade
Num espaço amostral S, a probabilidade de ocorrer um
evento A, representado por P(A), é dada pela medida de A
em S atendendo às seguintes condições:
1- A medida de S vale 1.
2- A medida de A é não negativa – P(A)  0
Das duas condições, obtém-se:
0  P( A)  1
No lançamento de um dado imparcial, a probabilidade de
ocorrer face ímpar é:
P(A) = 1/2 = 0,5 ou 50%
1.2 VARIÁVEIS ALEATÓRIAS
As variáveis aleatórias podem assumir qualquer

valor de um determinado conjunto de dados,
denominado de domínio da variável aleatória.
Ex. Sabe-se que um rebanho bovino apresenta 75%

dos animais infectados pelo vírus da febre aftosa.
Logo, um animal tomado neste rebanho pode ser:
Sadio: S ➔ P (S) = 25% ou 0,25 ou 1/4
Doente : D ➔ P(D) = 75% ou 0,75 ou 3/4
Para uma amostra de n=2 animais extraída do

rebanho, o espaço amostral é:
S = {SS, DS, SD, DD}
Quais são as probabilidades dos pontos amostrais?

P(SS) = 1/4 x 1/4 = 1/16
P(SD) = 1/4 x 3/4 = 3/16
P(DS) = 3/4 x 1/4= 3/16
P (DD) = 3/4 x 3/4 = 9/16
Pode-se construir uma tabela, onde:

x = número de animais sadios que podem ocorrer
numa amostra de n=2 bovinos
F(x) = a probabilidade de ocorrer um valor X
X 0 1 2
F(x) 9/16 6/16 1/16
Nesta tabela, a variável x assume os valores (0,1 e2),

sendo estes valores numéricos que descrevem os
resultados da experiência, logo x corresponde a uma
variável aleatória.
“Uma função que transforma todos os resultados de
um espaço amostral em números, chama-se variável
aleatória”
As variáveis aleatórias podem ser classificadas em:
variáveis aleatórias discretas e variáveis
aleatórias contínuas.
Varíavel qualitativa : Não são mensuradas em

números, são atributos. Ex. Profissão, cor, gênero,
sexo, etc...
1.2.1 Variável aleatória discreta
Quando assume apenas valores inteiros dentro de

seu campo de variação. Associada com o ato de
contar.
Ex. no de bovinos sadios numa amostra de n=4
animais;
no de frutos maduros numa árvore;
no de ervas daninhas num canteiro;
no de meninos numa família de três filhos;
etc...
1.2.2 Variáveis aleatórias contínuas
Quando assume qualquer valor real (infinitos

valores) dentro do seu campo de variação. Associada
com o ato de medir.
Ex. altura das plantas de milho de uma lavoura;
consumo de ração de um animal;
área foliar de uma planta de café;
produção de leite de uma vaca;
etc...
1.3 DISTRIBUIÇÕES DE PROBABILIDADES

DISCRETAS E CONTÍNUAS
1.3.1 Conceitos
1.3.1.1 Distribuições de probabilidades discretas
Se uma variável X pode assumir um conjunto de

valores X1, X2....., Xn com probabilidades P1, P2....,
PN, sendo  P = 1, diz-se que está definida uma
1
distribuição de probabilidade de X (Obs.: binomial,

poisson e uniforme)
1.3.1.2 Distribuições de probabilidades
contínuas
Neste caso, X pode assumir um conjunto contínuo

de valores. O polígono de frequência amostral torna-
se no limite de uma população de uma curva
contínua.
A área sob a curva limitada pelo eixo X é igual a 1. E a área entre a e b

fornece a probabilidade de X estar entre a e b. (Obs.: distribuição normal)
1.3.2
1.3.3
1.3.4
1.3.5
1.3.6Distribuições de probabilidades discretas e
contínuas
A) Distribuição uniforme
É a mais simples das distribuições. Todos os valores da

variável aleatória são assumidos com a mesma
probabilidade.
Exemplo: Lançamento de um dado imparcial, onde X
representa a face voltada para cima. Assim, X assume os
valores 1,2,3,4,5 e 6 com a mesma probabilidade 1/6. A
distribuição uniforme, neste caso, é definido por:
f(x) = 1/6; x = 1,2,3,4,5 e 6
Generalizando, obtém-se a função de probabilidade
F(x) = 1/K , x = x1,x2, xK.
F(x) depende de K.
B) Distribuição Binomial – estudar pelo caderno
Distribuição Normal
A distribuição de frequência na maioria dos

dados de observação (variáveis aleatórias
contínuas) mostra uma pronunciada
concentração próximos de um valor central. Ao
se afastar para os extremos deste valor central, a
concentração diminui. Esta característica
chama-se TENDÊNCIA CENTRAL DOS
DADOS.
Exemplo: Distribuição dos pesos de 50 bezerros

Guzerá. Aumentando o tamanho da amostra
(n=500, n=800) e a precisão das medidas, a
representação gráfica da distribuição tenderá a
ser uma curva simétrica de forma campanular.
Esta curva tem expressão matemática definida
por:
x− 2
1 (

)
e−1/ 2
f(x) =  2
onde:
x= qualquer valor real;
 = desvio-padrão da distribuição;
µ = média da distribuição;
 = 3,14159....
e = 2,718....
Se uma variável aleatória apresenta esta

distribuição de probabilidade ela tem
DISTRIBUIÇÃO NORMAL.
A distribuição normal é a mais importante da

Estatística, pois a maioria dos dados tem esta
distribuição, além disso, a maioria dos métodos
estatísticos se baseiam nesta distribuição.
Propriedades da distribuição normal:
i) É simétrica em relação a x = µ
ii) O ponto máximo de f(x) ocorre para x = µ. A média (µ), a mediana

(Md) e a Moda (Mo) são iguais.
iii) Para definir a equação da distribuição basta conhecer a µ e o  dos

dados
x− 2
1 (

)
e−1/ 2
f(x) =  2
Uma vez encontrado µ e  , qualquer valor de f(x) pode ser calculado.
iv) A área total sob a curva e o eixo x vale 1.
i) A área sob a curva normal entre µ -  e µ +  é de 68,27%, entre µ -

2  e µ +2  é de 95,45% e entre µ + 3  e µ - 3  é de 99,74%.
Cálculo da probabilidade na Distribuição Normal
A área compreendida entre duas ordenadas levantadas sobre dois pontos a e

b do eixo x da curva normal expressa a probabilidade da variável x assumir
valores no intervalo (a,b)
Devido a grande aplicação prática da distribuição normal na estatística,

procurou-se fazer uma tabela que fornecesse valores de integração
conforme a que está indicada para a área S. Este tabelamento encontrou
dificuldades devido à infinidade de valores que µ e  podem assumir.
Seria necessário uma tabela para cada (µ e  ).
µ - média da distribuição
 - desvio-padrão da distribuição.
Exemplo:
Num rebanho bovino, os pesos são

valores de uma variável x que tem
distribuição normal com média µ =
200Kg e variância  100 Kg2 . Qual a 2=
probabilidade de um animal deste

rebanho ter peso entre 190 e 195
K g?
x−
Estudos mais profundos mostraram que a variável Z = , chamada

variável reduzida ou padronizada, transforma todas as distribuições
normais possíveis numa única distribuição normal reduzida ou padronizada
que tem média µ = 0,0 e variância 
2=
1,0.
Para o rebanho bovino:

x−
Padronizando os valores de x Z=

Z1 = (190 – 200 / 10 ) = -1,0

Z2 = (195 – 200/ 10) = -0,5
P (190 < x < 195) = P (Z1 < Z < Z2) Entre 0,0 e –1,0 Área =
0,3413
= P (-1 < Z < 0,5) Entre 0,0 e –0,5 Área =
0,1915
“A tabela informa a área entre 0,0 e o valor de Z.” A tabela vale para a
metade da curva, mas a curva é simétrica. Para consultá-la, ignora-se o
sinal.
P (190 < x < 195) = P (Z1 < Z < Z2)

= P (-1< Z < -0,5)
= P (-1< Z < 0,0) – P (-1< Z < 0,0)
= 0,3413 – 0,1915
= 0,1498 = 14,98 %
Exemplos:
A) Qual a probabilidade um bovino pesar menos de 190 Kg?

B) Qual a probabilidade de um bovino pesar mais de 195Kg?
Caso um abatedouro de suínos se interesse por animais

com peso mínimo de 90 Kg, qual a porcentagem de
indivíduos que estará apta para o abate quando a média do
lote for 95 Kg e o desvio-padrão 15 Kg?

Bioestatistica Atd2 PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Bioestatistica Atd2 PDF

Caricato da

Copyright:

Formati disponibili

A) Mediana (Md)

Num conjunto de dados ordenados, a mediana é o valor

*A mediana pode ser um valor que não ocorre na amostra.

3) P ara os dados do Quadro 2

Mediana em dados agrupados

É necessário calcular antes a distribuição de freqüência

Ex. Distribuição de freqüência acumulada para baixo dos

Para dados agrupados a posição da mediana é = n

A mediana é obtida pela fórmula: Md = Li + x , onde:

Ex. amostra (2,3,4,4,4,5,6) Mo = 4 conjunto unimodal

amostra (2,3,4,5,6) Mo = não existe.

Moda em dados agrupados

A moda se localiza na classe de maior freqüência.

Para os dados originais (Quadro 2)

2.3 MEDIDAS DE DISPERSÃO

As medidas de posição não informam sobre a

Nelore 185 185 185 MédiaN = 185 Kg

Variabilidade = é a dispersão dos dados de um conjunto ao redor de um

Para as amostras das três raças, os desvios em relação a média são:

Os desvios indicam a existência da variabilidade, mas não podem ser

As principais medidas de dispersão são:

A) Amplitude total (A)

É a diferença entre o maior e o menor dado de uma amostra. Para dados

Para expressar variabilidade de amostras não é recomendável usar

Numa população, a variância é definida pela razão entre a soma de

desvio em relação a média  Xi - µ

desvio ao quadrado  (Xi - µ)2

soma de quadrados dos desvios  SQD

Na prática, trabalha-se com amostras

Amostra  X1, X2, ...., Xn

desvio em relação a média  Xi - X

soma de quadrados dos desvios  SQD

Para as amostras das três raças bovinas:

Nelore: s2N = SQD = 02 + 02 +02 = 0 Kg2

Gir: s2G = SQD = (-3)2 + (-1)2 +(4)2 = 13 Kg2

Hereford: s2H = SQD = (-9)2 + (-5)2 +(+14)2 = 151 Kg2

As vacas Hereford tem maior variância que as raças Gir e Nelore,

A fórmula (B) é chamada fórmula prática (+ rápida)

Ex.: O desvio-padrão nas três raças:

Cálculo para dados agrupados em distribuição de frequência:

xi = ponto médio da classe i;

Ex.: Seja a distribuição de freqüência dos pesos ao nascer (em Kg) de 50

C) Coeficiente de variação (C.V.)

É uma medida de dispersão relativa, que emprega o desvio

Basicamente, o C.V. é utilizado em duas situações:

A) O C.V. tem grande aplicação na experimentação, em

B) É usado também para comparar a variabilidade entre

D) Erro padrão da média. ( S )

avoura de milho amostra n=30 plantas

Este resultado indica que a média populacional foi

Espera-se que o verdadeiro valor da média populacional esteja neste

3.1 NOÇÕES DE PROBABILIDADE (CONCEITOS

As variáveis aleatórias podem assumir qualquer

Ex. Sabe-se que um rebanho bovino apresenta 75%

Para uma amostra de n=2 animais extraída do

Quais são as probabilidades dos pontos amostrais?

Pode-se construir uma tabela, onde:

Nesta tabela, a variável x assume os valores (0,1 e2),

Varíavel qualitativa : Não são mensuradas em

1.2.1 Variável aleatória discreta

Quando assume apenas valores inteiros dentro de

Quando assume qualquer valor real (infinitos

1.3 DISTRIBUIÇÕES DE PROBABILIDADES