Sei sulla pagina 1di 38

BIOESTATSTICA

BOTUCATU
2008
MATERIAL DIDTICO PARA A
DISCIPLINA DE BIOESTATSTICA
OFERECIDA AOS ALUNOS DE
GRADUAO EM CINCIAS
BIOLGICAS E DA SADE PELO
PROF. DR. CARLOS ROBERTO
PADOVANI, DEPARTAMENTO
BIOESTATSTICA - IB / UNESP.
Introduo
O que estatstica? E a Bioestatstica? Considerando o conceito de que a Cincia o
aprendizado adquirido por meio da experimentao e dos dados observados, segundo o qual a
procura das causas, das leis, traduz-se num processo iterativo de observao do real, da
realizao de experimentos confirmatrios e da avaliao quantitativa dos fenmenos em estudo,
o paradigma da Estatstica, em particular a Estatstica Aplicada s Cincias Biolgicas
Bioestatstica, consiste em construir o conjunto unificado de mtodos e tcnicas de planejamento
e anlise de dados experimentais e observacionais.
O grande desafio que se torna imperativo diz respeito a como desenvolver as atividades
de ensino de Estatstica, sob as exigncias de um modelo referencial de conceitos matemticos e
probabilsticos no cotidiano da formao da estrutura lgica de raciocnio dos estudantes das
reas biolgicas e da sade, e qual linguagem e motivao devem ser colocadas em prtica para
ministrar o contedo programtico?
Botucatu, maro de 2008
Prof. Dr. Carlos Roberto Padovani
Introduo Bioestatstica
Prof. Dr. Carlos Roberto Padovani
Prof. Titular de Bioestatistica IB/UNESP , Botucatu-SP
Definio de Estatstica
A Estatstica constitui-se em uma cincia destinada a:
I. Decidir o melhor plano (experimental ou observacional) para a execuo de
uma pesquisa metodologia cientfica.
II. Organizar e resumir dados de contagem, mensurao e classificao
raciocnio dedutivo.
III. Inferir sobre populaes de unidades (indivduos, animais, objetos) quando
uma parte (amostra) considerada raciocnio indutivo.
ESTATSTICA: CINCIA + TECNOLOGIA + ARTE
Definio de Bioestatstica
a metodologia estatstica aplicada s cincias biolgicas, com a finalidade planejar,
coletar, organizar, resumir, analisar e interpretar os dados, permitindo tirar concluses biolgicas
sobre populaes a partir do estudo de amostras.
Em 1829, Pierre Charles Alexandre Louis (1787-1872), afirmou: Eu sei que a verdade est
nos fatos e no na mente que os julga, e quanto menos eu introduzir da minha opinio pessoal
nas concluses, mais prximo estarei da verdade (Louis, considerado o pai da bioestatstica).
BIOESTATSTICA: VIDA + ESTATSTICA
Varivel Biolgica (Conceito)
Quando se estuda uma varivel biolgica, o maior interesse do pesquisador conhecer o
comportamento dessa varivel, analisando a ocorrncia de suas possveis realizaes.
O estudo de bioestatstica compreende o planejamento e a anlise estatstica (estatstica
descritiva e inferencial), mas voltado s informaes biolgicas contidas nas variveis em
considerao, transformadas em dados coletados para a operacionalizao dos mtodos
estatsticos.
Anlise Descritiva
Organizao dos dados coletados por meio de classificao, contagem ou mensurao. Os
dados devem ser apresentados de forma clara por meio tabelas, grficos e medidas resumo
(posio e variabilidade), no permitindo, no entanto, concluses analticas.
Anlise Inferencial
Permite realizar inferncias (concluses e analticas) a respeito de populaes a partir de
amostras pela aplicao de testes de hipteses e/ou construo de intervalos de confiana. Deve
ser considerado que est utilizando-se amostras para inferir aos dados reais da populao
( parmetros), portanto existindo nestas estatsticas (dados obtidos de amostras) uma margem de
erro. A exceo o censo, quando toda a populao pesquisada.
Planejamento
Consiste em estabelecer o desenho amostral com poder adequado para os testes de
hipteses e estimaes sem vises (distores). Deve ser considerado o clculo do tamanho da
amostra (tamanho tico e estatstico) e a definio da forma de coleta de dados ( tcnicas de
amostragem).
Tipos de varivel
Variveis so caractersticas que assumem valores diferentes de um indivduo para outro
ou no mesmo indivduo ao longo do tempo.
Em relao participao no estudo, as variveis podem ser classificadas em:
I. Independente, explicativa ou preditora: permite predizer uma resposta (causas).
II. Dependente ou resposta: evento que se pretende estudar (efeitos).
III. Varivel de controle: deseja-se que esteja homogeneamente distribuida nos grupos,
pois poderia interferir nos resultados (atuando, por exemplo, como uma varivel de
confuso). No tem interesse para estudo.
Observaes:
I. Dependo do objetivo do estudo, uma mesma varivel pode ser preditora, resposta ou de
controle.
II. As variveis preditoras, resposta e de controle devem ser indicadas pelo pesquisador
(biologia), nunca pelo estatstico.
III. O nmero excessivo de variveis dificulta a anlise estatstica e torna menor o poder da
amostra.
IV. O estatstico capaz de coordenar o planejamento de uma pesquisa e realizar a anlise.
Escala de Variveis
Quanto escala utilizada, tm-se variveis:
Nominal ( classificao sem ordem definida)
Categricas
(Qualitativas)
Ordinal ( classificao com ordem definida)
Discreta ( contagem, correspondendo a nmeros inteiros)
Numricas
(Quantitativa ou
Intervalar)
Contnua ( mensurao, correspondendo a nmeros reais)

Observaes:
I. A unidade de medida mostra a diferena entre as numricas discreta e contnua.
II. Escore no contagem ( no confundir variveis categricas nominais expressas por
nmeros com variveis discretas).
III. Pode-se transformar uma varivel numrica em categrica (lembrar que h perda de
informaes).
IV. Para variveis categricas a anlise estatstica limitada. Se as variveis dependentes e
independentes forem todas categricas, s ser possvel utilizar testes no paramtricos,
que apresentam menor poder.
Estatstica Descritiva
Consiste na organizao dos dados obtidos por meio de classificao, contagem ou mensurao.
Os dados so apresentados em medidas resumo, tabelas e grficos, no permitindo, no entanto,
concluses analticas.
Medidas Resumo ( Posio e Variabilidade)
Mdia
Tendncia Central Moda
Mediana
Posio
Quartis
Separatizes
Percentis

Mdia: soma dos valores divididos pelo nmero de observaes (centro de massa).
Observaes:
I. A mdia afetada por valores extremos.
II. A mdia bastante utilizada em distribuies simtricas.
III. No utilizvel em variveis categricas.
IV. A mdia pode ser utilizada para variveis discretas, inclusive com decimais.
Moda: Valor mais freqente no conjunto de observaes ( valor tpico, valor mais comum).
Observaes:
I. Um conjunto pode apresentar mais de uma moda.
II. A moda pode ser calculada para variveis numricas e categorizada.
III. Pode existir conjunto sem moda (amodal).
Mediana: valor que divide as observaes, ordenadas de forma crescente, em igual nmero de
observaes acima e abaixo.
Observaes:
I. No utilizvel em variveis categricas.
II. Pouco afetada por valores muito discrepantes.
III. Bastante utilizada para distribuio assimtrica.
Finalizando para decidir se a medida de tendncia central apropriada deve ser mdia ou
mediana, considere:
Distribuio simtrica mdia.
Distribuio assimtrica mediana.
No caso de distribuio simtrica, mdia, moda e mediana so equivalentes ( x =Mo=Me). Quando
existe assimetria, a mdia e a mediana desviam-se na direo dos valores extremos ( Mo < Me <
x ou x < Me < Mo).
Separatrizes: Quartis e Percentis
Quartis: so valores que dividem a amostra em quatro partes com o mesmo nmero de
observaes.
Q1 Limita os 25% dos menores valores (ou 75% doa maiores valores).
Q2 Limita os 50% dos menores valores (ou 50% dos maiores valores).
Q3 Limita os 75% dos menores valores (ou 25% dos maiores valores).
Percentis: so valores que dividem mostra em cem partes.
Amplitude Total
Amplitude Interquartil
Individual Varincia
Desvio Padro
Coeficiente Variao
Variabilidade
Erro padro
Amostral
Erro amostral
Amplitude Total: expressa a variao mxima, obtida pela diferena entre o maior e menor valor.
Amplitude Interquartlica: expressa a variao de 50% de amostra ao redor da mediana. Seu
valor dado pela diferena entre o terceiro e primeiro quartil.
Varincia e Desvio padro: indicam como os valores variam entre si, por meio do afastamento
dos valores em relao mdia.
Observaes:
I. A varincia apresenta unidade quadrtica.
II. Quanto mais afastado o valor se encontrar em relao mdia, maior ser sua
contribuio para o valor da varincia (desvio-padro).
III. Ambas as medidas (varincia e desvio-padro) indicam a variao absoluta.
Coeficiente de Variao: expressa, a razo entre o desvio padro e a mdia.
Observaes:
I. Quanto menor o coeficiente de variao, mais homogneo o conjunto de valores.
II. Trata-se de uma medida de variao relativa e adimensional.
Erro padro: medida de variabilidade da mdia amostral (expressa como a mdia varia de uma
amostra para outra).
Observaes:
I. A margem de erro que se comete em estimar a mdia populacional pela mdia de uma
amostra dada pelo erro padro.
II. O valor do erro padro dado em funo do tamanho amostral. Ou seja, inversamente
proporcional raiz quadrada do tamanho amostral.
Erro Amostral: medida do afastamento da mdia amostral em relao mdia da populao,
associada a um nvel de confiana.
Observaes:
I. O erro amostral proporcional ao erro padro
II. A constante de proporcionalidade fica estabelecida pelo nvel de confiana.
III. Erro amostral proporcional ao erro padro equivale a:
EA = EP
Se = 1,00 Nvel de confiana 68%
Se = 1,64 Nvel de confiana 90%
Se = 1,96 Nvel de confiana 95%
Quanto maior o valor de ,maior o nvel de confiana na estimao da mdia
populacional.
Outras medidas: Coeficiente de Assimetria e Coeficiente de Curtose
Coeficiente de Assimetria: mede a assimetria da distribuio em torno da mdia, sendo
assimetria positiva quando existe desvio para a direita e negativa, quando h para a esquerda.
Coeficiente de Curtose: mede a relao entre a altura e largura da curva, ou seja, o grau de
achatamento da curva. O padro de achatamento pode indicar curva: leptocrtica, mesocrtica ou
platicrtica.
Tabelas e Grficos: so formas de apresentao do resumo dos dados, devendo ser auto-
explicativas.
Observaes:
I. A construo de grficos e tabelas estabelecida por meio de regras,sendo as mais
comuns: IBGE e ABNT.
II. Um tipo especial de tabela consiste na tabela de contingncia, onde as linhas e colunas
so compostas por freqncias de ocorrncias dos atributos.
III. Os grficos mais usuais para variveis numricas so histogramas, barras com haste e
diagrama de caixas (box plot).
IV. Para as variveis categricas os grficos de setores circulares (do tipo pizza) e os
grficos em barras (vertical e horizontal).
V. Uma aplicao interessante do box plot consiste em identificar valor discrepante
(outlier). A maioria dos programas de anlise estatstica define outliers como valores
fora do intervalo (Q1 1,5 Q; Q3 + 1,5 Q), onde Q= Q3 - Q1, denomina-se amplitude
interquartis.
Exemplos:
Tabela 1 Distribuio de freqncias do peso (kg) de recm-nascidos
Classes i
x
i
f
i i
x f
( ) x x f
i i

2
i i
x f
2
) ( x x f
i i

20 , 3 00 , 3
3,10 2 6,20 -0,752 19,22 0,282752
40 , 3 20 , 3
3,30 7 23,10 -1,232 76,23 0,216832
60 , 3 40 , 3
3,50 10 35,00 0,240 122,50 0,005760
80 , 3 60 , 3
3,70 4 14,80 0,896 54,76 0,200704
00 , 4 80 , 3
3,90 2 7,80 0,848 30,42 0,359552
Total 25 86,90 0,000 303,13 1,065600

211 , 0 0444 , 0
24
0656 , 1
24
476 , 3 25 13 , 303
2
2

+
s s

476 , 3 x
25 n
25 , 4
20 , 3
7
20 , 3 40 , 3
) 25 , 6 ( ) 4 / 25 ( ) (
1
1


Q
Q
321 , 3
7
25 , 4 20 , 0
20 , 3
1
+
x
Q
25 n
50 , 3
40 , 3
10
40 , 3 60 , 3
) 5 , 12 ( ) 2 / 25 ( ) ( ) (
2


Me
Me Q
47 , 3
10
50 , 3 20 , 0
40 , 3 +
x
Me
25 n
50 , 3
60 , 3
4
60 , 3 80 , 3
) 5 , 22 ( ) 100 / 25 90 ( ) 90 (
90


P
x P
775 , 3
4
50 , 3 20 , 0
60 , 3
90
+
x
P
Moda de Czuber
) 6 (
60 , 3
) 3 (
40 , 3
2 1


Mo Mo
DEC ABC
47 , 3
9
2 , 31
3 80 , 10 40 , 20 6 Mo Mo Mo
Geral
2 1
1
1
2 1
1
2 1
1
2 1
2
1
2
1
2
2
1
1
2 1
2
1
+

+


h
l Mo
l Mo
h
h
h h
h
h h h
h l L h h
Mo L h
L Mo h
mo
Mo
Mo Mo
Mo
Mo
Tabela 2. Colesterol total de indivduos sadios (mg/dL) e indicativos de referncia
180 182 184 190 186 192 188 186 186
Colesterol Total Desejvel < 200 mg/dL
Glicose Normal 70 a 110 mg/dL
HDL Colesterol Desejvel 40 a 60 mg/dL
LDL Colesterol timo < 100mg/dL Desejvel 100 a 129 mg/dL
Triglicrides TG/5 = COLTOT HDL LDL
X(1) = 180 X(2) = 182 X(3) = 184 X(4) = 186 X(5) = 186 X(6) = 186
X(7) = 188 X(8) = 190 X(9) = 192
N = 9 (mpar)
1 Quartil =
( ) 183 50 , 2
4
1
1

,
_

+
X
n
X Q
Valor mnimo = X(1) = 180 Mediana =
186 ) 5 (
2
1
2

,
_

+
X
n
X Q
Valor mximo = X(9) = 192
3 Quartil =
( )
( ) 189 5 , 7
4
1 3
3

,
_

+
X
n
X Q
Moda = Mo = 186
Mdia = 186
9
1674
X
Varincia = 14
8
112
8
186 9 311476
2
2

x
s
Desvio padro = 74 , 3 14 + s
Tabela 3. Dados brutos e distribuio de freqncia da massa corprea de Rattus
norvegicus(Wistar)
0,300 0,317 0,320 0,322 0,324 0,325 0,328 0,337 0,339 0,340 0,344 0,346 0,347
0,350 0,352 0,352 0,358 0,358 0,359 0,361 0,367 0,369 0,377 0,384 0,400
Classes (kg) i
x
i
f (%)
i
fr (%)
i
facr
i i
x f
2
i i
x f
320 , 0 300 , 0
0,310 2 8,00 8,00 0,62 0,1922
340 , 0 320 , 0
0,330 7 28,00 36,00 2,31 0,7623
360 , 0 340 , 0
0,350 10 40,00 76,00 3,50 1,2250
380 , 0 360 , 0
0,370 4 16,00 92,00 1,48 0,5476
400 , 0 380 , 0
0,390 2 8,00 100,00 0,78 0,3042
Total 25 100,00 8,69 3,0313
k = 1+3,2 log 25 = 5,47 5 h = 0,100/5 = 0,020 kg
x = 0,3476 kg; Me = 0,437 kg; Mo = 0,347 kg
2
s = 0,00045 kg
2
; s = 0,022 kg; CV(%)=6,32 %
Probabilidades
1. Introduo
Fenmeno Aleatrio (Casual): refere-se situao ou acontecimento cujos resultados no podem
ser previstos com certeza.
Exemplo: - Alterao do ritmo cardaco de indivduos submetidos prova de exausto.
- Configurao do gnero de casais com quatro filhos.
Experimento: qualquer processo que permite ao pesquisador fazer observaes.
Evento: uma coleo de resultados de um experimento.
Evento Simples ou Elementar (A) : um resultado, ou um evento, que no comporta mais
qualquer decomposio.
Espao Amostral ( ): consiste de todos os possveis eventos simples de um experimento.
2. Definio
Uma funo P(.) denominada probabilidade se satisfaz as condies:
I.
1 ) ( A P O
, AC
II.
1 ) ( P
III.

n
j
n
j
Aj P Aj P
U
1 1
) ( ) (
, com os Ajs mutuamente exclusivos.
Espao Amostral Equiprovvel: todos os pontos (eventos) tm a mesma probabilidade
,
_

n
P
1
(.)
. Se um evento A tem m pontos amostrais,ento
n
m
A P ) ( , ou seja, P(A) = nmero de casos
favorveis / nmero total. Essa a definio que aproxima a probabilidade freqncia relativa
(definio frequentista de probabilidade).
Leis do Grandes Nmeros: Quando se repete um experimento um grande nmero de vezes, a
probabilidade pela freqncia relativa de um evento tende a probabilidade terica.
3. Probabilidade Condicional e Independncia
Em muitas situaes prticas, os fenmenos aleatrios considerados podem ser
separados em etapas consecutivas. A informao do que ocorreu em uma determinada etapa
pode influenciar nas probabilidades de ocorrncias das prximas etapas. Com este ganho de
informao pode-se recalcular as probabilidades de interesse, cujos resultados recebem o nome
de probabilidade condicional. Dados dois eventos A e B, a probabilidade condicional de A dado
que ocorreu B obtida por P(A/B) =
) ( / ) ( B P B A P
, com P(B) > 0.
A regra do produto de probabilidades pode ser deduzida da expresso anterior,ou seja P(A
B) = P(A/B)P(B), com P(B) > 0. Se a informao da ocorrncia ou no de B no altera a
probabilidade da ocorrncia de A, deve acontecer que P(A/B) = P(A), ou equivalentemente,
) ( ) ( ) ( B P A P B A P
, com P(B) > 0, mostrando a independncia probabilstica entre os
eventos A e B.
4. Teorema de Bayes
Seja a participao C1,C2,...,Cn do espao amostral
,
_

i
n
i
i i
C U i i C C
1
'
; ' ,
e as
seguintes probabilidades conhecidas P(
i
C
) e P(A/
i
C
), i=1,..., n.
Ento para qualquer j=1,...,n, tem-se:

n
i
i i
j j j
j
C P C A P
C P C A P
A P
A C P
A C P
1
) ( ) / (
) ( ) / (
) (
) (
) / (
Exemplos:
1) Um teste de proficincia in loco, avaliou a competncia dos tcnicos que analisavam o
Papanicolau para anormalidades. Os tcnicos de 306 laboratrios de citologia foram avaliados e
revelaram:
P(Ca feminino no colo do tero) = 0,000083;
P(Teste negativo/cncer) = 0,1625 (falso negativo);
P(Teste positivo/cncer) = 0,8375 (sensibilidade);
P(Teste positivo/sem cncer) = 0,1864 (falso positivo);
P(Teste negativo/sem cncer) = 0,8136 ( espeficidade).
Qual a probabilidade de uma mulher com Papanicolau positivo para o cncer ter realmente a
doena?
) ( ) / ( ) ( ) / (
) ( ) / (
) / (
Cncer Sem P Cncer Sem Pos Teste P Cncer P Cncer Pos Teste P
Cncer P Cncer Pos Teste P
positivo Teste Cncer P
+ +

) ( 999983 , 0 ) / (
) ( 000373 , 0
1864 , 0 999917 , 0 8375 , 0 000083 , 0
8375 , 0 000083 , 0
negativo teste um de preditivo Valor negativo Teste Cncer Sem P
positivo teste um de preditivo Valor
x x
x


2) Levantamento Nacional de Entrevistas de Sade (MS )
Condio de Emprego Amostra Debilidade Auditiva (Leso)
Atualmente Empregado (
1
E )
400000 60000
Atualmente Desempregado(
2
E )
38000 950
Fora de Fora de Trabalho(
3
E
)
227000 2270
Total 665000 63220
Evento P(evento) P(Deb/Evento) ) (
i
E D P
1
E 0,6015037 0,150 0,0902255
2
E 0,0571428 0,025 0,00142857
3
E 0,3413533 0,010 0,00341353
D (debilidade) 0,0950676 0,0950675
) ( ) ( ) ( ) (
3 2 1
E D P E D P E D P D P + +
3) Sensibilidade e Especificidade
Teste Doena Probabilidade Sensibilidade(S) e
Especificidade (E) so
caractersticas fixas dos testes
diagnsticos.Os valores
preditivos do teste, porm,
dependem da prevalncia da
doena.
Presente(D) Ausente(
D
)
Positivo (T+)
P(
+
T D ) P(
+
T D ) P(
+
T )
Negativo (T-)
P(

T D ) P(

T D ) P(

T )
Probabilidade P(D) P(
D
)
Falso Positivo = ) ( / ) ( ) / ( D P T D P D T P
+ +

Falso Negativo = ) ( / ) ( ) / ( D P T D P D T P


Correto Positivo =
ade Sensibilid D P T D P D T P
+ +
) ( / ) ( ) / (
.
Correto Negativo = dade Especifici D P T D P D T P

) ( / ) ( ) / (
Valor Preditivo Positivo = ) ( / ) ( ) / (
+ + +
T P T D P T D P
Valor Preditivo Negativo = ) ( / ) ( ) / (

T P T D P T D P
Considerando os resultados do exemplo 1
P(
+
T D/ )= 0,000373 (VPP) Para cada 1 milho (1000000) de Papanicolau positivos, somente
373 representam casos verdadeiros (corretos) de cncer no colo(colon) uterino.
P(

T D/ ) = 0,999987(VPN) Para cada 1 milho de Papanicolau negativos, 999987
representam casos verdadeiros de ausncia de cncer no colo uterino.
4)Dois equipamentos, A e B, para processamento de dosagens bioqumicas so colocados para
teste de controle de qualidade por 120 horas. A probabilidade de que um erro de clculo acontea
em um equipamento do tipo A de 1/30; no tipo B, 1/80 e em ambos, 1/1000. Qual a
probabilidade de que:
a) Pelo menos um dos equipamentos tenha apresentado erro?
04483 , 0 24000 / ) 24 300 800 (
1000
1
80
1
30
1
) ( + + B A P
b) Nenhum equipamento tenha apresentado erro?
95517 , 0 ) ( 1 ) ( ) ( B A P B A P B A P
c) Apenas o equipamento A tenha apresentado erro?
) ( ) ( ) ( :
03233 , 0 3000 / ) 3 100 (
1000
1
30
1
) ( ) ( ) (
B A B A B B A A A Observao
B A P A P B A P


Modelos Probabilsticos
Variveis Aleatrias Discretas
Uma quantidade X, associada a cada possvel resultado do espao amostral,
denominada de Varivel Aleatria Discreta (VAD) se assume valores num conjunto enumervel
com certa probabilidade.
Exemplos:
- Nmero de filhos em famlias.
- Nmero de gestaes.
A funo de probabilidade atribui a cada valor da VAD sua probabilidade. A notao para a funo
feita como:
i i i
p x p x X P ) ( ) (
i =1....,n; onde
1 0
i
p
e

n
i
i
p
1
1
Modelos Discretos mais Comuns
1. Modelo Uniforme (Equiprovvel)
Todos os valores ocorrem com a mesma probabilidade.
n
x X P
i
1
) ( , para i=1,...,n.
2. Modelo de Bernoulli (Ensaio de Bernoulli)
Uma VAD segue o modelo Bernoulli quando o espao amostral tem alternativas
dicotmicas, que genericamente podem ser representadas por respostas tipo sucesso-fracasso.
( )
x x
p p x X P


1
1 ) ( para x=0,1, com 0<p<1, sendo x = 0 (fracasso) e x = 1
(sucesso).
3. Modelo Binomial
Constitui-se pela repetio de n ensaios independentes de Bernoulli,sendo todos com a
mesma probabilidade de sucesso(p). A varivel aleatria X que conta o nmero total de sucessos
denominada Binomial com parmetros n e p.
A funo de probabilidade dada por:
k n k
p p
n
X P

,
_

) 1 ( ) (

, com k=0,1,...,n ; 0<p<1 e


n
k
k X P
0
1 ) (
Exemplos:
1. Sabe-se que a eficincia de uma vacina 80%. Um grupo de trs indivduos sorteado, dentre
a populao vacinada, e submetido a testes para verificar se a imunizao foi efetiva. Construa as
probabilidades para o nmero de indivduos imunizados no sorteio.
X 0 1 2 3
P(X=x) 0,008 0,096 0,384 0,512
2. Uma certa doena pode ser curada por meio de procedimento cirrgico em 96% dos
casos.Dentre os que tm a doena, sorteamos 10 pacientes que sero submetidos cirurgia.
Qual a probabilidade de:
I. Todos serem curados?
6648 , 0 ) 10 ( X P
II. Pelo menos 8 curados?
9937 , 0 ) 8 ( 6648 , 0 2770 , 0 0519 , 0 ) 8 ( + + x P X P
3. Para casal com trs filhos construa a funo de probabilidades para o gnero feminino.
X(F) Nenhuma Uma Duas Trs
P(X=x) 1/8 3/8 3/8 1/8
Variveis Aleatrias Contnuas (VAC)
So variveis cujos possveis valores ocorrem aleatoriamente e pertencem a um intervalo
dos nmeros reais (a resposta observada est associada a um procedimento de mensurao).
Exemplos:
- Nvel de colesterol total (mg/dL) mtodo qumica seca.
- Peso (kg) mtodo balana.
- Existncia de um grande lenol de gua no subsolo de uma regio cuja profundidade no foi
determinada; porm, sabe-se que est situada entre 25 a 160 metros. Dispe-se de uma sonda
que, ao fazer a perfurao, detecta com preciso a profundidade do reservatrio de gua
(X:profundidade; 160 25 x ) mtodo perfurao.
Funo Densidade de Probabilidade (FDP)
A funo f(x) uma FDP ou uma funo contnua de probabilidade para uma VAC, se
satisfaz as condies:
I.
0 ) ( x f
, para todo x ;
II.


1 ) ( dx x f .
Observao: Para calcular as probabilidades utiliza-se a rea sob a curva, ou seja, se b a ento


b
a
dx x f b x a P ) ( ) ( . Lembrar que sendo a rea no ponto igual a zero, tem-se
) ( ) ( ) ( ) ( b x a P b x a P b x a P b x a P < < < <
.
Exemplo: Arquelogos estudaram uma certa regio e estabeleceram um modelo terico para o
comprimento (C) de fosseis da regio(cm). Sendo C uma VAC com a seguinte FDP:

'

,
_

+ 1
10 40
1
) (
c
c f
, se 20 0 c e 0, caso contrrio.
Determinar:
I. O grfico de f(c)
II. P(C<8)
III.

=E(C)=


dc c f ) (
IV.


dc c f c C Vac ) ( ) ( ) (
2 2

2 2
8
0
9 / 275
3 / 35
25 / 7 ) ( ) 8 (
cm
cm
dc c f C P

<

Modelo Gaussiano ou Modelo Normal


A varivel X tem distribuio normal ou gaussiana com parmetros
2
e , se sua FDP
dada por . 0 ; ,
2
1
) (
2
) ( 2 / 1
> < < < <

e u x e x f
u x
Caractersticas da distribuio normal
I. f(x) simtrica em relao mdia.
II. f(x) 0 quando x t .
III. o valor mximo de f(x) se d para x=

.
IV.
X de mdia X E : ) (
.
: ) (
2
X Var varincia de X .
V. Mdia = Moda = Mediana.
VI. O coeficiente de assimetria varia de -2 a +2.
VII. O coeficiente de curtose varia de 1 a 5 (mede a relao entre altura e a largura da curva).
Observaes interessantes:
I. Por conveno, costuma-se considerar que os indivduos que representam os 5%
extremos de uma distribuio (2,5% para casa extremidade so anormais esprios).
Lembre-se que esta afirmao (2,5% nas extremidades) s pode ser assegurada quando a
distribuio de uma varivel numrica normal.
II. Este intervalo que inclui 95% das observaes no deve ser confundido com o intervalo de
confiana 95% para a mdia, que representa a margem de erro para a mdia calculada
(preciso da mdia).
III. Outro ponto fundamental da distribuio normal decidir que tipo de teste estatstico pode
ser aplicado, embora este problema possa ser contornado utilizando-se amostras de
tamanho adequado, quando se torna possvel aplicar o teorema do limite central.
Distribuio Normal Padro (Z) ou Normal Reduzida ou Normal Standard
uma distribuio normal com mdia nula ( 0
z
) e varincia unitria ( 1
2

z
).
Observao Importante:
sempre possvel transformar uma varivel ) , ( ~
2
N X em uma varivel normal
reduzida
) 1 , 0 ( ~ N Z
. Para isso, deve-se usar a transformao

x
Z (simplesmente
uma mudana escalar).Os resultados das probabilidades para a varivel Z encontram-se
tabelados.
Exemplos:
1) Considere o peso X, em gramas, de cobaias com distribuio N (200g;144g
2
). Calcule as
probabilidades de cobaias com peso:
a) maior que 232g;
b) menor que 218g;
c) entre 185 e 216g;
d) maior que 192g.
2) Uma clnica de emagrecimento recebe pacientes adultos com peso N (130kg;400kg
2
). Para
efeito de determinar o tratamento mais adequado, os 25% pacientes de menor peso so
classificados de magros, enquanto os 25% de maior peso de obesos. Determinar os pesos que
delimitam cada classe.
3) A classificao do indivduo quanto ao valor de referncia do LDL Colesterol o seguinte:
timo < 100 mg/dL
Desejvel 100 mg/dL a < 130 mg/dL
Limite 130 mg/dL a 159 mg/dL
Aumentado > 159 mg/dL
Sabendo-se que em determinado grupo o LDL ~N(115;484), qual a porcentagem de indivduos em
cada categoria de referncia?
4) Em populaes indgenas do Xingu, 20,90% dos homens adultos tm comprimento do fmur
superior a 34cm e 10,20%, inferior a 19 cm. Supondo a distribuio normal:
I. calcule a mdia e a varincia do comprimento do fmur;
II. encontre os limites inferior e superior que incluem 95% dos comprimentos distribudos
simetricamente ao redor da mdia.
Teorema Limite Central
Quando so retiradas amostras aleatrias de uma populao com distribuio normal, a
distribuio das mdias amostrais tambm ser normal (distribuio exata).
O mais importante que, se o tamanho da amostra for suficientemente grande (n 30),
as mdias amostrais tero distribuio normal independentemente da distribuio original da
varivel (em resumo; para amostras de tamanho maior que 30, podem ser utilizados testes
paramtricos para a comparao de mdias amostrais, mesmo que no se conhea a distribuio
da varivel em estudo).
Observao Interessante: O teorema do limite central no garante que a distribuio da varivel
na populao seja normal. Apenas garante a normalidade assinttica para os testes paramtricos.
Transformao de Variveis
Vrios procedimentos estatsticos baseiam-se na suposio de normalidade dos dados ou
pelo menos na simetria deles. Porm, nem sempre estas situaes esto configuradas nas
variveis numricas pesquisadas. Uma alternativa consiste em efetuar uma transformao das
observaes, de modo a se obter uma distribuio mais simtrica e prxima do normal.
Essa transformao pode se dar elevando os valores a uma potncia (positiva ou negativa)
ou calculando o logaritmo natural dos valores. O auxlio de grficos (histogramas, disperso,
desenhos esquemticos, ...) torna-se muito til para indicar a transformao mais apropriada aos
dados. Porm, deve-se tornar muito cuidado nas concluses face a transformao realizada e
atentar complexidade de interpretao, em alguns casos.
Estimao de Parmetros-Inferncia
Introduo
Resumidamente, a Inferncia Estatstica objetiva estudar a populao por meio de
evidncias fornecidas pela amostra. a amostra que contm os elementos que podem ser
observados e onde as quantidades de interesse podem ser medidas.
Observao:
I. Evidncia trata-se da qualidade do objetivo ( a plena certeza com que a verdade nos
aparece e determina a adeso do esprito).
II. Certeza trata-se do estado sujeito ( o estado de esprito que afirma sem o temor de
enganar-se).
Parmetros, Estimadores e Estimativas
As quantidades da populao em geral desconhecidas e sobre as quais tm-se interesse,
so denominadas parmetros (representaes:
,... , ,
).
combinao dos elementos da amostra, construda com a finalidade de representar, ou
estimar, um parmetro de interesse na populao, denomina-se estimador (representaes:
,... , ,

).
Aos valores numricos assumidos pelos estimadores denominamos estimativas pontuais
ou, simplesmente, estimativas.
Tabela 1. Principais estimadores pontuais
Parmetro Estimador Propriedades

(mdia populacional)
X
No viciado e Consistente
(proporo pop.) p = freq. relativa No viciado e Consistente
2
(varincia pop.)
2
S
No viciado e Consistente
Observao:
I. Um estimador

no-viciado (imparcial ou no-viesado) para um parmetro se


)

( E (seu valor esperado coincide como parmetro de interesse).


II. Um estimador

consistente medida que o tamanho da amostra aumenta, seu valor


converge para o parmetro de interesse e sua varincia converge para o zero. Ou seja:


)

( lim E
n
e
0 )

Var( lim

n
.
Distribuies Amostrais
Os estimadores so funes de variveis aleatrias e, portanto, so variveis aleatrias.
Neste sentido, torna-se muito interessante obter a distribuio probabilstica dos estimadores.
Mdia Amostral ( X)
Considere uma amostra aleatria de tamanho n de uma varivel X ~ N (
2
, ), ento,
mostra-se que:
I. X ~ Normal;
II.
X

) ( X E ; ). ; ( ~
2
n
N X

III.
2
X

=Var( X ) =
n
2

.
Observao Importante: medida que o tamanho amostral cresce a probabilidade de a mdia
amostral estar na proximidade da mdia populacional maior.
Exemplo: O Biotrio possui uma mquina para encher pacotes de rao com peso que se
comporta como uma v.a. normal com mdia 200g desvio padro 10g. Uma amostra aleatria de
25 pacotes sorteada e pergunta-se:
I. Qual o nmero esperado de pacotes da amostra com peso inferior a 205g?
29 , 17 . 69146 , 0 ) 50 , 0 ( ) 205 ( < < ESP N Z P X P
pacotes.
II. Qual a probabilidade de que o peso mdio dos pacotes da amostra no exceder 205g?
. 99379 , 0 ) 50 , 2 ( ) 205 ( < < Z P X P
Proporo Amostral (p)
Para uma amostra de tamanho n retirada de uma populao qualquer com mdia

e
varincia
2
, a distribuio de
X
, pelo teorema TLC, para n tendendo a infinito normal
padro, ou seja, .
X
X
X



). 1 , 0 ( ~ N Z
Considerando
) (

n amostra da Tamanho
Y ticas caracters a com dada amostra na indivduos de N
p
0, caso contrrio.
e para o i-simo individuo
i
Y
=
1, se o individuo apresentar a caracterstica (sucesso),
ento Y
n
Y Y
p
n

+ +

...

1
.
Cada
i
Y
Bernoulli, ou seja,
p Y E
i
) (
e
) 1 ( ) ( p p Y Var
i

, para i=1,...,n. Logo, para
n
Y Y ,...,
1
uma seqncia de variveis aleatrias independentes de Bernoulli, tem-se:
E(
p
) = E(
y
) = p;
Var(
p
) = Var(
y
) =
n
p p ) 1 (
.
Para n suficientemente grande, pelo TLC:
n
p p
p p
y
y
y
) 1 (

Z ~ N (0,1).
Exemplo: Um laboratrio farmacutico afirma que sua vacina contra gripe imuniza em 80% dos
casos. Uma amostra de 25 indivduos que tomaram a vacina foi sorteada e testes foram feitos
para verificar a imunizao ou no desses individuos. Se o fabricante estiver correto, qual a
probabilidade da proporo de imunizados na amostra ser inferior 0,75? E superior 0,85?
p = 0,80 1-p = 0,20 E(
p
) = E(
y
) = 0,80
Var(
p
) = Var(
y
) = 0,0064
P(
p
< 0,75) = P(
625 , 0 < Z
) = 0,26435
P(
p
> 0,85) = P(
625 , 0 > Z
) = 0,26435
Estimao por intervalo
Os estimadores pontuais fornecem como estimativa um nico valor numrico para o
parmetro de interesse (aspecto no muito interessante do ponto de vista biolgico). Por serem
variveis aleatrias, os estimadores possuem uma distribuio de probabilidades e, levando este
fato em considerao, pode-se apresentar uma estimativa mais informativa para o parmetro de
interesse que inclua uma medida de preciso do valor obtido. Esse mtodo de estimao,
denominado intervalo de confiana, incorpora, estimativa pontual do parmetro, informaes a
respeito de sua variabilidade.
IC Mdia Populacional (
2
conhecido)
Objetiva-se construir um intervalo simtrico ao redor de

que contenha a massa ou


rea
1
.
Isto ,


< < < < ) ( 1 ) (
2 2
z Z z P b X a P
.
O intervalo de confiana para
)) ; ( ( IC
, com coeficiente de confiana
1
,
dado por
n z x LI /
2


e
n z x LS /
2

+
.
Interpretao de IC(
;
): quando se considera vrias amostras de mesmo tamanho e
para cada amostra calcular os respectivos limites de confiana, com coeficiente de confiana

,
espera-se que a proporo de intervalos que contenham o valor de

seja igual a

.
Observao: Para o nvel de 95% de confiana tem-se para os tamanhos amostrais 10, 100 e
1000 os seguintes limites de confiana com os respectivos comprimentos do intervalo
(amplitude/intervalo):
n Limites de 95% confiana Amplitude
10 t x 0,620

1,240

100 t x 0,196 0,392


1000 t x 0,062

0,124

Exemplo:
1) Os comprimentos de jacars adultos de uma certa raa tm distribuio normal com mdia


desconhecida e varincia igual a 0,01m
2
. Uma amostra de 10 animais foi sorteada e forneceu
mdia 1,69m. Estabelea os limites de confiana 95% para o comprimento dos jacars.

=0,95
96 , 1
2

z
IC(

): 1,69 t 0,06
m m 75 , 1 63 , 1
Amplitude do intervalo =
m
n
z 12 , 0 2
2

Semi-amplitude = 0,06m = Erro envolvido na estimao


IC para proporo de sucessos (Aproximao/TCL)
)
) 1 (
, ( ~
n
p p
p N p

Otimista
IC(p;

):
n
p p
z p
) 1 (

t


n
p p
z p
) 1 (

t

Conservativo

n
z p
4
1

t

Exemplo:
Estimar a proporo de cura de um certo medicamento em doentes contaminados com cercria
( uma das formas do verme da esquistossomose) administrado, ao acaso, em 200
pacientes.Considere para a estimao o nvel de confiana 95% e que foi verificada a cura em
160 pacientes.
95 , 0

80 , 0 p
e
96 , 1
2

z
Soluo Otimista
855 , 0 745 , 0 055 , 0 80 , 0 : ) 95 , 0 ; ( t p p IC
.
Soluo Conservadora
869 , 0 731 , 0 069 , 0 80 , 0 : ) 95 , 0 ; ( t p p IC
.
IC para mdia populacional com
2
desconhecido
IC(
;
):
n
s
t x
n ) 1 ,
2
(
t
onde

,
_

1 ,
2
n
t

corresponde ao quantil de ordem 100(1-
2

)% da
distribuio t de Student(William Gosset) com (n-1) graus de liberdade.
Exemplos:
1) Para a populao de bebs submetidos a cirurgia fetal para anomalias congnitas, a
distribuio das idades gestacionais ao nascer aproximadamente normal. Uma amostra
aleatria de 16 desses bebs tem uma idade gestacional mdia de 29,6 semanas e desvio
padro de 3,6 semanas. Construa um intervalo de 95% confiana para a idade gestacional
mdia populacional.
n=16 e
95 , 0
( )
131 , 2
15 ; 025 , 0
t
IC(
95 , 0 ;
): 29,6 t1,9 27,7sem

31,5sem
2) Doze ratos foram alimentados com uma dieta experimental, desde seu nascimento at a idade
de trs meses.Os aumentos de pesos(g) foram os seguintes: 77; 68; 66; 75; 74; 70; 68; 71;
72; 69; 73; 75. Determine um intervalo de confiana de 95% para a mdia dos aumentos de
peso.
n=12 e

=0,95 ( )
201 , 2
11 ; 025 , 0
t
40 , 3 56 , 11 ; 5 , 71
2
s e s x
2 , 2 5 , 71 : ) , ( t IC g g 7 , 73 3 , 69
Consideraes Finais
I. Os estimadores pontuais especificam um nico valor para o estimador, impossibilitando
julgar qual o erro que se comete no processo de estimao.
II. Com os intervalos de confiana a magnitude do erro pode ser mensurada (probabilidade
de cometer erros de determinadas magnitudes).
III. O intervalo pode ou no conter o parmetro, mas sua construo assegura que tm-se 100

%=100(1- )% de confiana que contenha.


IV. Se T for um estimador do parmetro , chama-se erro padro de T a quantidade EP(T) =
) (T Var
.
Exemplos: T= X EP( X )=
n

erro padro de X .
T=
^
p
EP(
^
p
)=
n
p p ) 1 (
erro padro de p.
T= MED EP( MED )
n 2

erro padro de MED .


V. Desigualdade de Chebyshev
Se E(x) =

e Var(x) =
2
finita, ento, para todo 0 > , P(
| | x
)
2
/ ) ( x Var
.
VI. Lei dos Grande Nmeros(LGN)
Considere n ensaios de Bernoulli com p= P(Sucesso), e seja o nmero de sucessos
nas n provas. Para n grande, a proporo de sucessos
n

estar prximo de
p=P(Sucesso). Ou seja,
2 2
) 1 (
) | (|

n
p p
p
n
P

.
VII. Uso da LGN para o clculo de tamanho amostral. Qual o n a fim de que
n

defira de p
menos de , com probabilidade maior ou igual a

.
2
) 1 (
1 ) | (| ) | (|


n
p p
p
n
P p
n
P
LGN

<

<

2 2 2
) 1 ( 4
1
) 1 (
) 1 ( ) 1 (
1

n
p p
n
n
p p
.
Testes de Hipteses
A idia de teste de uma hiptese ser introduzida por meio de um exemplo, partindo de
uma situao simples para a tomada de deciso (deciso popular e natural), sendo gradualmente
ampliada para atender situao geral de testes de hipteses.
Considere que o colesterol total (mg/dL) tenha distribuio normal de probabilidade e
ainda:
A: Alunos de Educao Fsica ~ N(145;144)
B: Alunos de Cincias Biolgicas ~ N(155;400).
Um grupo de 25 alunos do mesmo curso forneceu uma mdia de 148 mg/dL para o
colesterol total. Qual deve ser o curso de origem dos alunos?
1 idia (Deciso Popular e Natural)
Regra de Deciso: Se
Fsica Educao dL mg x / 150
Se
Biolgicas Cincias dL mg x > / 150
Observao: Deve ser considerado que possvel encontrar uma amostra de 25 alunos de
Cincias Biolgicas que apresente mdia de 148 mg/dL. Assim como, mdia acima de 150 mg/dL
para um grupo de alunos de Educao Fsica. Neste sentido, a regra de deciso estabelecida fica
mais informativa quando so associados os erros que podem ser cometidos.
Ou seja,
Erro tipo I: dizer que os alunos so de Educao Fsica(A), quando no realidade so de Cincias
Biolgicas (B).
Erro tipo II: dizer que os alunos so de Cincias Biolgicas (B), quando na realidade so de
Educao Fsica (A).
Para estabelecer a magnitude desses erros considere as seguintes hipteses:
H0 : Os alunos so de Cincias Biolgicas (B)
dL mg / 155
e
dL mg / 20
.
H1 : Os alunos so de Educao Fsica (A)
dL mg / 145
e
dL mg / 12
.
P(Erro tipo I) = P (A/B verdade) = P ( 150 x / H0 verdade)
= P ( )
25
400
, 155 ( ~ / 150 N x x ) = P(
25 , 1 Z
).
Portanto,

= P(Erro tipo I) = 0,10565.


P(Erro Tipo II) = P(B/A verdade) = P( 150 > x / H1 verdade)
= P( 150 > x / )
25
144
, 145 ( ~ N x ) = P(Z> 2,08).
Portanto,

= P(Erro tipo II) = 0,01876.


O seguinte quadro de probabilidades indica os erros e acertos para a deciso tomada.
Curso (Origem do grupo) Deciso (H0 ou H1)
H0: Cincias Biolgicas H1: Educao Fsica
Educao Fsica (A) Erro Tipo II (1,876%) Correta (98,124%)
Cincias Biolgicas (B) Correta (89,435%) Erro Tipo I (10,565%)
A regra de deciso, de certo modo, privilegia a afirmao de que os alunos so de Educao
Fsica (o erro tipo I apresenta-se com maior probabilidade do que o erro tipo II).
2 idia: Estabelecer uma regra de deciso em que a probabilidade de errar contra Cincias
Biolgicas seja a mesma de errar contra Educao Fsica (

).
= P(Erro Tipo I) = P(
C
x x
/ H0 verdade) = P (Z
4
155

C
X
)

= P(Erro Tipo II) = P(


C
x x >
/ H1 verdade) = P (Z
4 , 2
145
>
C
X
)
75 , 148
4 , 6
952
4 , 2
145
4
155


C
C C
X
X X
mg/dL.
Ou seja, se
C
X
= 148,75 mg/dL, tem-se
% 94 , 5
.
O quadro de probabilidades para a 2 idia fica constitudo como:
Curso (Origem do grupo) Deciso (H0 ou H1)
H0: Cincias Biolgicas H1: Educao Fsica
Educao Fsica (A) Erro Tipo II (5,94%) Correta (92,07%)
Cincias Biolgicas (B) Correta (95,00%) Erro Tipo I (5,94%)
3 Idia: Fixar um dos erros e estabelecer a regra de deciso (Opo: fixar erro tipo I).
Seja

= P(Erro Tipo I ) = 0,05 P(Z < -1,645) = 0,05


= P(
0
/ H x x
C

verdade) = P(Z
4
155

C
x
) 42 , 148 645 , 1
4
155

C
C
x
x
mg/dL.
Portanto,

= P(Erro Tipo II) = P(


1
/ 42 , 148 H x > verdade) = P(Z > 1,425)=0,00793 = 7,93%
Tem-se, o seguinte quadro de probabilidade
Curso (Origem do grupo) Deciso (H0 ou H1)
H0: Cincias Biolgicas H1: Educao Fsica
Educao Fsica (A) Erro Tipo II (7,93%) Correta (95,00%)
Cincias Biolgicas (B) Correta (92,07%) Erro Tipo I (5,00%)
Procedimento Geral do Teste de Hipteses
H0:
0

(Hiptese Nula)
(Existe uma varivel X associada a dada populao e tem-se uma hiptese sobre
determinado parmetro dessa populao. A hiptese de H0 afirma que o verdadeiro valor de
0

).
H1:
0

(Hiptese alternativa bilateral)
(O valor de diferente de
0

).
ou
0
>
(Hiptese alternativa unilateral direita)
(O valor de maior que
0

).
ou
0
<
(Hiptese alternativa unilateral esquerda)
(O valor de menor que
0

).
A deciso pela hiptese alternativa depende do interesse e da informao e da biolgica
que a situao oferece.
Erros que so cometidos para qualquer deciso tomada:
Erro Tipo I: Rejeitar H0 quando esta verdadeira.

=P(Erro Tipo I) = P(Rejeita H0/ H0 Verdade) = nvel de significncia do teste estatstico


(valor arbitrrio).
Erro Tipo II: No Rejeitar H0 quando H0 falsa.

= P(Erro Tipo II) = P(No Rejeita H0/H0 Falsa).


O objetivo do teste estatstico dizer, usando uma estatstica

(estimador no-viesado e
consistente de

, cuja estimativa (o valor) ser obtida na amostra fornecida pelo pesquisador),


se a hiptese H0 ou no aceitvel.
A deciso deve ser tomada por meio de critrio objetivo, ou seja, estabelecido a partir do
risco que se quer cometer. Nesse sentido, estabelece-se a regio de rejeio de H0 (regio crtica
ou regio de rejeio do teste), construda considerando
0
/

( H RC P verdade), com
fixado a priori. Um fato importante ressaltar que a regio crtica sempre construda sob a
hiptese de H0 ser verdadeira. O resultado da amostra tanto mais significante para rejeitar H0
quanto menor for esse nvel

. Ou seja, quanto menor for o

, menor a probabilidade de se
obter uma amostra com estatstica(

) pertencente a regio crtica, sendo pouco verossmil a


obteno de uma amostra da populao para qual H0 seja verdadeira.
Principais Testes de Hipteses
1. Teste sobre a mdia de uma populao com varincia conhecida
Exemplo: Uma companhia de cigarros afirma que a quantidade mdia de nicotina dos cigarros que
produz apresenta-se abaixo de 20mg por cigarro. Um laboratrio realiza nove analises dessa
quantidade, obtendo: 23, 20, 22, 18, 19, 19, 19, 23, 20. Sabe-se que a quantidade de nicotina se
distribui normalmente, com varincia 3,24mg
2
. Pode-se aceitar no nvel de 5%, a afirmao do
fabricante?
H0:

= 20mg (A afirmao do fabricante verdadeira).


H1:

> 20mg (A afirmao do fabricante falsa).


) 05 , 0 ( 29116 , 0 ) 55 , 0 (
) , ( ~
2
> >

P Z P
n
N
n
x
Z

No rejeita-se H0.
2.Teste sobre a mdia de uma populao com varincia desconhecida.
Exemplo 1: Um bilogo deseja estudar o efeito de certa substncia no tempo de reao de seres
vivos a um certo tipo de estmulo. Um experimento desenvolvido com cobaias, que so
inoculadas com a substncia e submetidas a um estmulo eltrico, com seus tempos de reao
(em segundos) anotados. Os tempos obtidos foram: 9,1; 9,3; 7,2; 7,5; 13,3; 10,9; 7,2; 9,9; 8,0; 8,6.
Admitindo-se que o tempo de reao segue distribuio normal com mdia 7,6 segundos, verificar
<


crit calc
z z 55 , 0
3
8 , 1
20 33 , 20
33 , 20
9
183
9
645 , 1 05 , 0
z
x
n
z
se o tempo mdio sofre alterao por influncia da substncia, no nvel de 5% de significncia.
Cobaias Normais Amostra (#10)
(Controle) Substncia Inoculada 9,1;...;8,6

seg. 6 , 7

. seg 91 , 1
seg. 1 , 9

s
x
Teste t de Student para uma amostra (William S. Gosset, 1876-1937. A origem do teste t deve-se
a busca da melhor variedade de cevada para a produo de cerveja).
0 0
H
0 1
H

0
>

0
<
Sob a veracidade de H0, a estatstica do teste dada por t =
) 1 (
0
~
) (

n
t
S
n x
, com a regra de
deciso habitual.
Hipteses Regra de Deciso (Habitual)
H0:
0

x H1:
0

Rej. H0 se |t| >

,
_

2
, 1
t

n
H0:
0

x H1:
0
>
Rej. H0 se t > ( ) , 1
t
n
H0:
0

x H1:
0
<
Rej. H0 se -t > ( ) , 1
t
n
H0:

= 7,6 seg. H1: 7,6 seg.


t = 48 , 2
91 , 1
10 ) 6 , 7 1 , 9 (

| t | > 2,26; Rej.-se H0.


9 1
05 , 0

t(9;0,025) = 2,26
P( |t(9)| < 2,48 ) = P( -2,48 < t(9) < 2,48) = 0,965 p = 0,035 (<

)
Exemplo 2. Uma firma comercial sustenta que seus cigarros contm no mais que 30 mg de
nicotina.Uma amostra de 25 cigarros forneceu mdia de 31,5 mg e desvio-padro de 3mg.
Considerando a distribuio normal de probabilidades para a quantidade de nicotina, no nvel de
5% de significncia, os dados contestam ou no a afirmao do fabricante?
H0:

= 30 mg (afirmao favorvel firma)


H1:

> 30 mg (afirmao desfavorvel firma)


24 1
05 , 0

t(24;0,05) = 1,71 t > t(24;0,05) Rej.-se H0.


t = 50 , 2
3
25 ) 30 5 , 31 (

No nvel de 5% de significncia, h evidncias de que os cigarros contenham, em mdia, mais de


30 mg de nicotina.
Observao P(t(24) 2,50) = 0,0098 p = 0,0098 (
<
)
3. Teste para Proporo
Exemplo 1. Um relatrio de uma ONG afirma que 40% de toda a gua obtida, por meio de poos
artesianos no nordeste, salobra (levemente salgada). H muitas controvrsias sobre essa
informao, alguns dizem que a proporo maior, outras que menor. Para dirimir as dvidas,
400 poos foram sorteados e observou-se, em 152 deles, gua salobra. Qual a concluso no nvel
de 5% de significncia?
H0:
0

H1:
0

(bilateral)
ou
0
>
(unilateral direita)

0
p p

0
<
(unilateral esquerda)
Utilizando o TLC, a estatstica
) ( p
, a proporo amostral, tem distribuio aproximadamente
normal com E( ) = (p) e Var( ) =
n
) 1 (
.
Portanto, sob a veracidade de H0, tem-se Z=
) 1 (
) (
0 0
0

n
N(0,1), com a regra de
deciso habitual, a estatstica do teste de proporo.
H0:

= 0,40 (favorvel afirmao da ONG).


H1:

0,40 (desfavorvel afirmao da ONG).
n
= 400
38 , 0
z =
82 , 0
60 , 0 40 , 0
400 ) 40 , 0 38 , 0 (

x
(bilateral)(p = 0,412)
x
= 152

= 0,05
96 , 1
2

z
| z | <
2

z
no se rejeita H0.
No nvel de 5% de significncia, os dados no possibilitam refutar informao fornecida pela
ONG.
Exemplo 2. Um professor aplica um teste envolvendo 10 questes do tipo certo-errado. Ele quer
testar hiptese a estudante est adivinhando chutando certo.
Seja

(= p) a probabilidade de o estudante responder corretamente a uma questo.


Hiptese H0: = 0,50 (casual) (est adivinhando).
Como so 10 questes (supondo independncia nas respostas), se H0 for verdadeiro, o
nmero esperado de sucessos dever estar prximo de np = 5 = E(X).
Suponha que o professor adote a seguinte regra de deciso: Se oito ou mais respostas
esto corretas, o estudante no est adivinhando, enquanto que se, menos do que oito esto
corretas, o estudante est adivinhando
= P(Rejeio de H0 / H0 verdade) = P(X=8 ou 9 ou 10) = 054 , 0
128
7
.
Interpretao do resultado: Se o teste fosse aplicado 128 vezes, o professor esperaria
rejeitar H0 (o aluno est adivinhando) quando H0 verdadeira, 7 vezes. O erro que se comete com
probabilidade 7/128; chama-se nvel de significncia do teste (no caso, teste unilateral).
Observaes:
1) Alteraes na regra de deciso provocam mudanas nas probabilidades de erro.
2) As regras de deciso podem envolver tomadas bilaterais, caso a situao problemtica
permita.
Aprofundando um pouco na discusso do exemplo, suponha, que o aluno acertou apenas
6 questes (pela considerao anterior, no h razo para rejeitar H0), mas que ele no esteja
adivinhando, ou seja, p > 0,50. Portanto, h um outro erro que est envolvido na tomada
deciso: aceitar uma hiptese H0, sendo ela falsa. Para efeito de estudo, suponha que na
realidade p = 0,80. Ento, tem-se a seguinte formulao:
H0: p = 0,50 e H1: p = 0,80.
O clculo da probabilidade de aceitar H0, quando H1 verdadeira, para 054 , 0
128
7

(regio crtica definida pela regra de deciso) dada por:

= P(No rejeitar H0 / H1 verdade)


= P(X 7 / p = 0,8) 0,322. Tem-se o seguinte quadro:
Deciso Realidade
p = 0,50 p = 0,80
Aceitar H0 Deciso Correta Erro II (
322 , 0
)
Aceitar H1 Erro I (
054 , 0
) Deciso Correta
Como j relatado, conforme mudamos a regio crtica, as probabilidades e

so
alteradas. Por exemplo:
Regio Crtica
{7,8,9,10} 0,17 0,121
{8,9,10} 0,054 0,322
{9,10} 0,01 0,624
Relao entre Intervalo de Confiana e Teste de Hipteses
Considerando o exemplo anterior, seja n = 10 e

= 0,05.
Supondo
p
= 0,6, o intervalo de confiana para p, com coeficiente de pelo menos 95%
confiana so dados pelos limites:
LI = 0,60 1,96 30 , 0
10
4 , 0 6 , 0

x
LS = 0,60 + 1,96 90 , 0
10
4 , 0 6 , 0

x
IC(p): [0,30;0,90] com
95 , 0
.
Este intervalo corresponde aceitao da hiptese, ao nvel de 5%. Isto , obtendo-se
p
= 0,6, no se rejeita a hiptese H0: p = p0, para p0 assumindo valor fixado entre 0,30 e 0,90.
De modo geral, a regio de aceitao de um teste tipo o exemplificado de nvel

,
corresponde a um intervalo de confiana p, com

= 1- .
4. Teste para a comparao de mdias de duas populaes normais independentes,
com varincias desconhecidas e iguais
Antes do teste de mdias tem que ser considerado a homogeneidade ou no das
varincias.
Para isto, tem-se
H0:
2 2
2
2
1
(varincias homogneas = homocedasticia).
H1:
2
2
2
1
(varincia heterogneas = heterocedasticia).
O teste de hipteses da homogeneidade pode ser construdo considerando
F=
) , ( menor
) , ( maior
2
2
2
1
2
2
2
1
S S
S S
, onde
2
1
S e
2
2
S so as respectivas varincias amostrais.
Sob a veracidade de H0, a estatstica F ~F(g.l. numerador,g.l. denomidador), tem distribuio F (Fisher-
Snedecor) com parmetros g.l. numerador (
1
) e g.l. denominador (
2
). A regra de deciso a
habitual, ou seja, se

,
_

>
2 1
; ;
2

F F
, rej.-se H0.
Para o teste de mdias considere o seguinte exemplo:
Um estudo sobre hipertenso induzida por gravidez considerou um grupo de 23 mulheres
com essa disfuno tratado com baixa dose de aspirina e um segundo, com 24 mulheres nas
mesmas condies, que receberam placebo. A presso sangnea arterial dos grupos est
descrita no quadro a seguir.
Grupo n x (mmHg) s(mmHg) s
2
(mmHg)
2
Aspirina 23 109 7 49
Placebo 24 111 8 64
No nvel de 5% de significncia os grupos diferem quanto a presso arterial sangnea?
H0:
2 1
H1:
2 1
Pop1~N(
2
1 1
, )
>
2 1
Pop2~N(
2
2 2
, )
<
2 1

Se
2 2
2
2
1
, o teste estatstico descrito como
( )
) 2 (
2 1
2
2 1
2 1
~
1 1
+

,
_

n n
t
n n
S
x x
t
, onde
2
) 1 ( ) 1 (
2 1
2
2 2
2
1 1 2
+
+

n n
S n S n
S
(varincia amostral comum).
A regra de deciso habitual
Hipteses Rejeitar H0 se
H0:
2 1
x H1:
2 1

,
_

+
>
2 ;
2
2 1
| |
n n
t t

H0:
2 1
x H1: >
2 1

( ) 2 ;
2 1
+
>
n n
t t

H0:
2 1
x H1: <
2 1

( ) 2 ;
2 1
+
>
n n
t t

Teste de homogeneidade
H0:
2
2
2
1
H1:
2
2
2
1

F = 31 , 1
49
64
) , ( menor
) , ( maior
2
2
2
1
2
2
2
1

S S
S S
(p = 0,530)
23
.

num

F < F
2

05 , 0

344 , 2
) 22 ; 23 ; 025 , 0 (
F
Homogneas
22
.

den

H0: 0
2 1
(Asp = Placebo)
H1: 0
2 1
(Asp Placebo)
91 , 0
)
24
1
23
1
( 67 , 56
111 109
67 , 56
45
64 * 23 49 * 22
2

+


+
t s
(p = 0,37)
45 2
05 , 0
2 1
+

n n

( )
01 , 2
45 ; 025 , 0
t
2
| |

t t <
, no se rejeita H0.
No nvel de 5% de significncia no foi possvel verificar diferena na presso mdia
arterial dos grupos.
5. Teste para a comparao de mdias de duas populaes normais independentes,
com varincias desconhecidas e desiguais.
Exemplo: Acredita-se que o nvel mdio de carboxihemoglobina dos fumantes seja mais alto do
que o nvel mdio dos no-fumantes. A seguir so apresentados os resultados de dois grupos.
Grupo n x s s
2
No-fumante 121 1,8% 1,0% 1,00(%)
2
Fumante 75 4,1% 1,6% 2,56(%)
2
H0:
2 1
H1:
2 1

>
2 1

<
2 1

Se
2
2
2
1
, o teste estatstico descrito como
2
2
2
1
2
1
2 1
n
S
n
S
) X X (
t
+

~ ) (
t
, onde
( )
) 1 ( ) 1 (
2
2
1
2
2

n
B
n
A
B A

, sendo
1
2
1
n
S
A
e
2
2
2
n
S
B
.
A regra de deciso habitual.
No exemplo, tem-se:
H0:
2
2
2
1
(Varincias Homogneas)
H1:
2
2
2
1
(Varincias Heterogneas)
56 , 2
00 , 1
56 , 2
) , ( menor
) , ( maior
2
2
2
1
2
2
2
1

S S
S S
F
2

F F >
, rej.-se H0 (Varincias Heterogneas).
p = 0,0000044 ( <

)
( )
50 , 1
120 ; 74 ; 025 , 0
F
H0: NF) (F 0
2 1
H1: NF) (F 0
2 1
> <
17 , 11
75
56 , 2
121
00 , 1
1 , 4 8 , 1

+

t
(p < 0,000001)
00826 , 0
121
00 , 1
A 03413 , 0
75
56 , 2
B
110 17 , 110
0000157 , 0 000000569 , 0
04239 , 0
2

+

05 , 0
( ) ( )
t t t > | | 6 , 1
110 ; 05 , 0 rej.-se H0.
110
No nvel de 5% de significncia, conclu-se que o nvel mdio de carboxihemoglobina
mais alto nos fumantes.
6. Teste para a comparao de mdias de duas populaes normais dependentes
(amostras pareadas, amostras emparelhadas) e varincias desconhecidas.
Exemplo: Verificar, no nvel de 5% de significncia, se o calibre da veia esplnica , em mdia, o
mesmo, antes e depois da ocluso da veia porta a partir dos seguintes dados de ces.
Co 1 2 3 4 5 6
Antes da ocluso 75 50 50 60 50 70
Depois da ocluso 85 75 70 65 60 90
H0:
D
H1:
D

>
D

<
D

Seja uma amostra com n pares (


i i
Y X ,
). Definindo Di=
i i
Y X
, i=1,...,n, a estatstica do teste de
hipteses da comparao de mdias dependentes dada por:
) 1 (
~
) (

n
D
t
S
D n
t , onde
n
D
D
n
i
i

1
e
1
2
1
2
2

n
nD D
S
n
i
i
D
.
A regra de deciso a habitual.
Hipteses Rejeita-se H0 quando
H0:
D
x H1:
D

,
_

<
1 ;
2
| |
n
t t

H0:
D
x H1: >
D

( ) 1 ;
>
n
t t

H0:
D
x H1: <
D

( ) 1 ;
>
n
t t

No exemplo, tem-se
D1=10; D2=25; D3=20; D4=5; D5=10 e D6=20, sendo Di = Depois Antes.
H0:
D
(Depois = Antes)
H1:
D
(Depois Antes)
0 , 15 d 74 , 4
0 , 60
150 * 6
60
5
0 , 15 * 6 1650
2
2

t S
d
(p = 0,0052)
05 , 0
( ) 0
1 ,
2
5 ; 025 , 0
H se rej. | | 57 , 2 >

,
_

n
t t t

.
5 1 n
No nvel de 5% de significncia conclui-se que o calibre da veia esplnica, em mdia,
difere pela ocluso da veia posta.
Exemplo 2. Os dados seguintes foram obtidos a partir de amostras de gua, coletas em oito locais
diferentes de um rio, antes e depois de dois anos de incio de uma campanha para a despoluio.
Os valores so obtidos combinando-se vrios indicadores de poluio e quanto maior o valor,
maior o grau de poluio. No nvel de significncia 0,05, verificar se a campanha foi produtiva.
Local L1 L2 L3 L4 L5 L6 L7 L8
Antes 88,4 68,9 100,5 81,4 96,3 73,7 65,1 72,1
Depois 87,1 69,1 91,1 75,6 96,9 69,2 66,3 68,3
Depois - Antes -1,3 0,2 -9,4 -5,8 0,6 -4,5 1,2 -3,8
H0: 0
D
H1: 0 <
D

61 , 13
7
) 85 , 2 ( 8 22 , 160
85 , 2
8
8 , 22
2
2

d
s d
19 , 2
61 , 13
) 85 , 2 ( 8

t
(p = 0,032)
( )
. H se rej.
0 1 ,
>
n
t t

7 1
05 , 0

( )
90 , 1
7 ; 05 , 0
t
No nvel de significncia 0,05 a campanha foi produtiva.
Bibliografia
BUSSAB, W. O.; MORETTIN, P.A. Estatstica bsica 5ed., So Paulo, Editora Saraiva, 2003.
CAMPANA, A.O.; PADOVANI, C.R.; TIMO-IARA, C.; FREITAS,C.B.D.; PAIVA, S.A.R.;
HOSSNE, W.S. Investigao cientfica na rea mdica. So Palo, Editora Manole, 2001.
DAWSON, B.; TRAPP, R.G. Bioestatistica bsica e clnica, 3ed. Rio de Janeiro, Editora Mc Graw-
Hill Interamericana do Brasil Ltda, 2003.
CAMPBELL, J.M.; CAMPBELL, J.B. Matemtica de laboratrio Aplicaes mdicas e biolgicas,
3 ed., So Paulo, Editora Roca Ltda, 1993.
MOORE, D. A estatstica bsica e sua prtica. Rio de Janeiro, Editora LTC, 2000.
NORMAN, G.R.; STREINER, D.L. Bioestatstica The bare essentials, St.Louis, Mosby-Year
Book, Inc., 1994.
PAGANO, M.; GAUVREAU, K. Princpios de bioestatstica. So Paulo, Editora Thomson, 2004.
VIEIRA, S. Introduo bioestatstica, 2 ed., Rio de Janeiro, Editora Cmpus, 1911.
VIEIRA, S. Elementos de estatstica, 3 ed., So Paulo, Editora Atlas, 1999.
Texto apresentado pelo Prof. Dr. Carlos Roberto Padovani, Prof. Titular de Bioestatstica, e
apostilado por Arthur Bestana Bentivenha, funcionrio Tcnico de Laboratrio, lotados no
Departamento de Bioestatstica do IB- UNESP, Campus de Botucatu.
Departamento de Bioestatstica
Instituto de Biocincias
Distrito Rubio Junior
CEP 18618-000
CP 510
Fone (14) 3811.6272
(14) 3811.3744
E-mail: bioestatistica@ibb.unesp.br

Potrebbero piacerti anche