Sei sulla pagina 1di 24

UNIVERSIDADE FEDERAL DE GOIS

FACULDADE DE NUTRIO

KAENNY DAMACENO MARTINS

BIOESTATSTICA

Goinia
2017

KAENNY DAMACENO MARTINS

BIOESTATSTICA
Trabalho para complemento parcial de nota da
disciplina de Bioestatstica, ministrado ao curso de
Nutrio pelo Prof. M.e Joelmir Carlos.

Goinia
2017

SUMRIO

1 Introduo ...................................................................................................... 03

2. Teste Qui-Quadrado de independncia ...................................................... 04


2.1 Restries na aplicao do teste Qui-Quadrado ............................................. 07
2.2 Contagem dos graus de liberdade .................................................................. 07
2.3 Etapas do Teste ............................................................................................. 07
2.4 Exemplo ......................................................................................................... 09

3. Teste de Shapiro Wilk para normalidade .................................................... 10


3.1 Execuo do Teste .......................................................................................... 11
3.2 Como realizar o teste ...................................................................................... 12
3.2 Exemplo .......................................................................................................... 15

4. Anlise de varincia com um fator de classificao ................................. 17


4.1 Modelo e anlise de varincia ......................................................................... 18
4.2 Exemplo .......................................................................................................... 20

5 Concluso ...................................................................................................... 22

Referncias Bibliogrficas .................................................................................... 23

1 INTRODUO

Um dos principais objetivos de se estudar bioestatstica com o objetivo de se


analisar a distribuio conjunta de duas variveis qualitativas, descrever a
associao entre elas. Ou seja, de certo modo esperamos que haja uma certa
dependncia entre as varivel, por exemplo, sexo e ramo de atividade.
Desta forma, nosso foco ser buscar evidncia estatstica e aprofundar em
trs mtodos especficos de teste. Ao fazer esse tipo de investigao em busca de
evidncia estatstica, estamos realizando um Teste de Hipteses e resoluo de
variveis.
4

2 Teste Qui-Quadrado de Independncia

O teste de independncia Qui-Quadrado usado para descobrir se existe


uma associao entre a varivel de linha e coluna varivel em uma tabela de
contingncia construdo partir de dados da amostra. A hiptese nula de que as
variveis no esto associadas, em outras palavras, eles so independentes.
A hiptese alternativa de que as variveis esto associadas, ou
dependentes.
Os dados so selecionados aleatoriamente.
Todas as frequncias esperadas so maiores do que ou igual a 1 (isto

, ).
No mais de 20% das frequncias esperadas so inferiores a 5.

Para realizao do teste, se faz necessrio calcular o valor esperado de cada


clula. Supondo-se que as variveis sejam independentes, o valor esperado de cada
clula ser:

Figura 1

E1,1=(648)(376)/1551=157,09
E1,2=(648)(643)/1551=268,64
Podemos calcular todos os outros valores de forma similar.

Utilizaremos uma medida global para verificar se existe associao entre as


variveis. Esta medida ser dada atravs do afastamento global entre valores
observados e valores esperados.
Os estimadores de mxima verossimilhana de e so:
5

Ento se a hiptese de independncia so vlidas, os estimadores de


mxima verossimilhana de sero:

e os estimadores de verossimilhana das frequncias esperadas sero:

Seja representa o vetor de contagens

observadas com distribuio multinomial, representa as frequncias esperadas


e admintindo vlida a hiptese de independncia dos critrios de classificao, a
estatstica:

tem distribuio assinttica Qui-Quadrado com graus de liberdade.

Esta medida chamada de Pearson (Qui-quadrado de Pearson), em que

e so, respectivamente, as frequncias observadas e esperadas da r-sima


linha e j-sima coluna. Se a hiptese de independncia (no-associao) for
verdadeira, o valor da estatstica de teste ser prximo de zero. Pela

estatstica podemos entender qual a regio crtica do teste de independncia.


Quando no ocorre independncia natural que as frequncias
6

observadas sejam substancialmente diferentes das frequncias

esperadas que esperamos observar quando a independncia ocorre. Ento


devemos rejeitar a hiptese de independncia dos critrios de classificao

quando a estatstica maior que um ponto crtico usando a Tabela da


distribuio Qui-Quadrado usando a Tabela da distribuio Qui-Quadrado ou usando
o software Action.
Assim, dado um nvel de significncia , o p-valor determinado por

Figura 1.1: Teste Qui-Quadrado de Pearson

2.1 Restries na aplicao do teste Qui-Quadrado

clssico afirmar que o valor mnimo de deve ser superior a 10 numa


tabela de contingncia , e superior a 5 se o nmero de graus de liberdade for

2 ou mais. Quando abaixo daqueles valores, habitual fundir as classes em


que tal acontece com outras, afim de se obter novas classes com frequncias
esperadas superior a 10 se trabalharmos com 1 grau de liberdade, superior a 5 no
7

caso geral. Este procedimento totalmente incorreto, visto que afeta a aleatoriedade
da amostra, alm de, eventualmente, haver perda de informao na fuso de
categorias. Alm disso, em tabelas , o teste Qui-Quadrado pode ser usado
com xito se a menor frequncia esperada for 1, e ainda existe evidncia emprica
de que na maior parte das tabelas o uso do teste Qui-Quadrado legtimo se as
estimativas das frequncias esperadas excederem 0,5. No entanto, neste caso, o

nmero de graus de liberdade a usar deve ser inferior a , embora


parea no haver atualmente um acordo sobre qual deve ser usado.

2.2 Contagem dos graus de liberdade

O nmero total de clulas em uma tabela de contingncia .


Conhecendo os totais das linhas, ficam imediatamente conhecidos
dos valores das clulas (um de cada linha). Ento o nmero de clulas
independentes passar a . Se considerarmos os totais das colunas,
percebemos que apenas deles devem ser considerados. Cada um
destes totais, fixa um valor de clula em cada coluna. Ento o nmero de

termos independentes passar a ser

2.3 Etapas do Teste

Etapa 1: Definio das hipteses


H0: As variveis so independentes.
H1: As variveis no so independentes.

Etapa 2: Estabelecer o nvel de significncia ()


(Definida pelo pesquisador)

Etapa 3: Determinar a distribuio amostral

2 [;(r-1)(c-1)]

Etapa 4: Determinar o valor crtico (Tabela qui-quadrado): (Figura 1.1)


8

Etapa 5: Determinar a regio de rejeio (Ver grfico)

Etapa 6: Calcular a estatstica do teste (Valor )

Etapa 7: Tomada de deciso. Verificar se a estatstica do teste cai na regio de


rejeio ou no.

Etapa 8: Interpretao do teste


9

2.4 Exemplo

Um pesquisador deseja identificar se h dependncia no consumo de seus


chocolates e as cidades de sua regio.

Cidades do Vale do Taquari


Sabor do chocolate Lajeado Santa Estrela Taquari
Cruz
Chocolate com caju 60 30 20 40 150
Chocolate com 45 35 20 10 110
amendoim
Chocolate com flocos 55 25 47 13 140
Chocolate com passas 70 35 25 20 150
230 125 112 83 550

H0: A preferncia pelos sabores independe da cidade


H1: A preferncia pelos sabores depende da cidade.
= 0,05
= (4 1) (3 1) = 6, onde Qui quadrado tabelado igual a 12,6.

Calculo dos valores


Cidades do Vale do Taquari
esperados (E).
Sabor do chocolate Lajeado Santa Estrela Taquari
Cruz
Chocolate com caju 62,7 34,1 30,5 22,6
Chocolate com
46,0 25,0 22,4 16,6
amendoim
Chocolate com flocos 58,5 31,8 28,5 21,1
Chocolate com passas 62,7 34,1 30,5 22,6

2 = (60 62,7)2/62,7 + [(30 34,1) 2/34,1 ...[(20 22,6) 2/22,6 =


10

0,11+0,49+3,61+13,39+0,02+4+0,25+2,62+0,21+1,45+12+3,11+0,85+0,32+0,99+0,2
9 = 43,72

Conclui-se que o Qui quadrado calculado (43,72) maior do que o tabelado


(12,6), rejeita-se H0 em prol de H1. Portanto h diferena significativa, ao nvel de
0,05, para as cidades.

3. Teste de Shapiro Wilk para normalidade.

Os testes de normalidade so usados para determinar se um conjunto de


dados de uma dada varivel aleatria, bem modelada por uma distribuio normal
ou no, ou para calcular a probabilidade da varivel aleatria subjacente estar
normalmente distribuda.
Mais precisamente, os testes so uma forma de seleo de modelos, e
podem ser interpretados de vrias maneiras, dependendo de como cada um
interpreta as probabilidades. Os resultados do teste indicam se voc deve rejeitar ou
deixar de rejeitar a hiptese nula de que os dados so provenientes de uma
populao distribuda normalmente. Voc pode fazer um teste de normalidade e
produzir um grfico de probabilidade normal na mesma anlise. O teste de
normalidade e o grfico de probabilidade geralmente so as melhores ferramentas
para avaliar a normalidade.

O teste de Shapiro Wilk um dos inmeros testes de normalidade, proposto


em 1965, baseado na estatstica W dada por:
11

em que xi so os valores da amostra ordenados (x(1) o menor). A constante b


determinada da seguinte forma:

em que an-i+1 so constantes geradas pelas mdias, varincias e covarincias das


estatsticas de ordem de uma amostra de tamanho n de uma distribuio normal.
O objetivo deste teste fornecer uma estatstica de teste para avaliar se uma
amostra tem distribuio Normal. O teste pode ser utilizado para amostras de

qualquer tamanho. onde a varivel aleatria observada e so coeficientes


tabelados.

3.1 Execuo do Teste

Para calcular a estatstica W, de uma mostra aleatria de tamanho , dada

por , procede-se da seguinte forma:

Ordenar as observaes em ordem

decrescente: .

Calcular

Se n par, , faz-se
12

os valores de so tabelados.

Se mpar, , os clculos permanecem os mesmos,

exceto que,

Calcular

Avaliar a estatstica do teste atravs do P-valor. No caso de uma valor


significativo para a estatstica do teste, isso indica falta de normalidade para a
varivel aleatria analisada.

3.2 Como realizar o teste

Para realizar o teste de Shapiro-Wilk, devemos:


1. Formulao da Hiptese:

2. Estabelecer o Nvel de significncia do teste (), normalmente 0,05;


3. Calcular a estatstica de teste:
Ordenar as n observaes da amostra: x(1), x(2), x(3), ..., x(n);

4. Calcular ;
13

5. Calcular b;
6. Calcular W.
7. Tomar a deciso: Rejeitar H0 ao nvel de significncia se Wcalculado < W (os
valores crticos da estatstica W de Shapiro-Wilk so dados na Tabela
abaixo).

8. Nvel de significncia

N 0,01 0,02 0,05 0,1 0,5 0,9 0,95 0,98 0,99

3 0,753 0,756 0,767 0,789 0,959 0,998 0,999 1,000 1,000

4 0,687 0,707 0,748 0,792 0,935 0,987 0,992 0,996 0,997

5 0,686 0,715 0,762 0,806 0,927 0,979 0,986 0,991 0,993

6 0,713 0,743 0,788 0,826 0,927 0,974 0,981 0,986 0,989

7 0,730 0,760 0,803 0,838 0,928 0,972 0,979 0,985 0,988

8 0,749 0,778 0,818 0,851 0,932 0,972 0,978 0,984 0,987

9 0,764 0,791 0,829 0,859 0,935 0,972 0,978 0,984 0,986

10 0,781 0,806 0,842 0,869 0,938 0,972 0,978 0,983 0,986

11 0,792 0,817 0,850 0,876 0,940 0,973 0,979 0,984 0,986

12 0,805 0,828 0,859 0,883 0,943 0,973 0,979 0,984 0,986

13 0,814 0,837 0,866 0,889 0,945 0,974 0,979 0,984 0,986

14 0,825 0,846 0,874 0,895 0,947 0,975 0,980 0,984 0,986

15 0,835 0,855 0,881 0,901 0,950 0,975 0,980 0,984 0,987

16 0,844 0,863 0,887 0,906 0,952 0,976 0,981 0,985 0,987

17 0,851 0,869 0,892 0,910 0,954 0,977 0,981 0,985 0,987

18 0,858 0,874 0,897 0,914 0,956 0,978 0,982 0,986 0,988

19 0,863 0,879 0,901 0,917 0,957 0,978 0,982 0,986 0,988

20 0,868 0,884 0,905 0,920 0,959 0,979 0,983 0,986 0,988


14

21 0,873 0,888 0,908 0,923 0,960 0,980 0,983 0,987 0,989

22 0,878 0,892 0,911 0,926 0,961 0,980 0,984 0,987 0,989

23 0,881 0,895 0,914 0,928 0,962 0,981 0,984 0,987 0,989

24 0,884 0,898 0,916 0,930 0,963 0,981 0,984 0,987 0,989

25 0,888 0,901 0,918 0,931 0,964 0,981 0,985 0,988 0,989

26 0,891 0,904 0,920 0,933 0,965 0,982 0,985 0,988 0,989

27 0,894 0,906 0,923 0,935 0,965 0,982 0,985 0,988 0,990

28 0,896 0,908 0,924 0,936 0,966 0,982 0,985 0,988 0,990

29 0,898 0,910 0,926 0,937 0,966 0,982 0,985 0,988 0,990

30 0,900 0,912 0,927 0,939 0,967 0,983 0,985 0,988 0,990

31 0,902 0,914 0,929 0,940 0,967 0,983 0,986 0,988 0,990

32 0,904 0,915 0,930 0,941 0,968 0,983 0,986 0,988 0,990

33 0,906 0,917 0,931 0,942 0,968 0,983 0,986 0,989 0,990

34 0,908 0,919 0,933 0,943 0,969 0,983 0,986 0,989 0,990

35 0,910 0,920 0,934 0,944 0,969 0,984 0,986 0,989 0,990

36 0,912 0,922 0,935 0,945 0,970 0,984 0,986 0,989 0,990

37 0,914 0,924 0,936 0,946 0,970 0,984 0,987 0,989 0,990

38 0,916 0,925 0,938 0,947 0,971 0,984 0,987 0,989 0,990

39 0,917 0,927 0,939 0,948 0,971 0,984 0,987 0,989 0,991

40 0,919 0,928 0,940 0,949 0,972 0,985 0,987 0,989 0,991

41 0,920 0,929 0,941 0,950 0,972 0,985 0,987 0,989 0,991

42 0,922 0,930 0,942 0,951 0,972 0,985 0,987 0,989 0,991

43 0,923 0,932 0,943 0,951 0,973 0,985 0,987 0,990 0,991

44 0,924 0,933 0,944 0,952 0,973 0,985 0,987 0,990 0,991


15

45 0,926 0,934 0,945 0,953 0,973 0,985 0,988 0,990 0,991

46 0,927 0,935 0,945 0,953 0,974 0,985 0,988 0,990 0,991

47 0,928 0,936 0,946 0,954 0,974 0,985 0,988 0,990 0,991

48 0,929 0,937 0,947 0,954 0,974 0,985 0,988 0,990 0,991

49 0,929 0,938 0,947 0,955 0,974 0,985 0,988 0,990 0,991

50 0,930 0,939 0,947 0,955 0,974 0,985 0,988 0,990 0,991

3.3 Exemplo
Avaliar a normalidade dos dados referentes medio de 10 peas.

1,90642 2,22488

2,10288 1,69742

1,52229 3,15435

2,61826 1,98492

1,42738 1,99568

Vamos testar

1. Primeiramente os dados da amostra:

x(1) 1,42738

x(2) 1,52229

x(3) 1,69742

x(4) 1,90642

x(5) 1,98492
16

x(6) 1,99568

x(7) 2,10288

x(8) 2,22488

x(9) 2,61826

x(10) 3,15435

2. Temos que e

i n-i+1 an-i+1 x(n-i+1) x(i) an-i+1(x(n-i+1)-x(i))

1 10 0,5739 3,15435 1,42738 0,991108

2 9 0,3291 2,61826 1,52229 0,360684

3 8 0,2141 2,22488 1,69742 0,112929

4 7 0,1224 2,10288 1,90642 0,024047

5 6 0,0399 1,99568 1,98492 0,000429

3. Desta forma, segue que b = 1,484197 e, por fim, W dado por

4. Pela regra de deciso do teste, Wcalculado = 0,927 > W(0,05;10) = 0,842, com o p-valor
calculado por P[W > Wcalculado] = 0,4162 > = 0,05. Assim, podemos afirmar com
nvel de significncia de 5% que a amostra provm de uma populao normal.
Veja a seguir os resultados obtidos pelo software Action.
17

4. Anlise de Varincia com um fator de classificao

A Anlise de Varincia (ANOVA) um procedimento utilizado para comparar


trs ou mais tratamentos. Existem muitas variaes da ANOVA devido aos
diferentes tipos de experimentos que podem ser realizados. Nesse curso ser
estudado apenas a anlise de varincia com um fator.
Inicialmente, so apresentados alguns conceitos utilizados em planejamento
de experimentos e na anlise de varincia. Modelos de anlise de varincia
constituem uma classe de modelos que relacionam uma varivel resposta contnua
com variveis independentes categricas nominais. Na verdade, os modelos focam
a anlise das mdias e a variabilidade entre estas mdias.
As covariveis nos modelos ANOVA designam pertinncia a grupo, por
exemplo raa, gnero, situao de residncia, tipo de tratamento, situao
empregatcia etc. Tais covariveis so denominadas fatores ou variveis de classe.
Determinados valores assumidos por um fator so chamados de nveis deste fator.
18

Exemplo: Situao de residncia: 1 = rural; 2 = subrbio; 3 = urbana


Anlise de Varincia Genero: 0 = Feminino 1 = Masculino
Na ANOVA, os fatores so todos variveis nominais pode ser pensada
como caso especial da anlise de regresso. Porm, permite anlise sob uma tica
diferente.
Nmero de Fatores Modelos ANOVA so classificados segundo o nmero de
fatores:
1 fator one-way ANOVA
2 fatores two-way ANOVA
3 fatores three-way ANOVA
A abordagem usada nos modelos de anlise de varincia so idnticos abordagem
usada em anlise de regresso:
Descrio dos dados
Formulao do Modelo
Ajuste do modelo e estimativa dos parmetros
Anlise de varincia (deviance) e inferncia
Anlise de resduos

4.1 Modelo e anlise de varincia

Em um experimento, cada observao Yij pode ser decomposta conforme o modelo


a seguir:

Yij = + i + eij i = 1 , . . . , I e j = 1 , . . . , J (

em que:
Yij a observao do i-simo tratamento na j-sima unidade experimental ou
parcela;
o efeito constante ( mdia geral) ;
i o efeito do i-simo tratamento;
eij o erro associado ao i-simo tratamento na j-sima unidade experimental ou
parcela assumido como:
19

eij IID N( 0, 2 ).
Aqui, IID significa que os erros devem ser independentes e identicamente
distribudos.
Em um experimento, existe o interesse em testar se h diferenas entre as mdias
dos tratamentos, o que equivale a testar as hipteses:

em que:
i = + i i = 1 , 2, . . . , I.

De forma equivalente, podemos escrever tais hipteses da seguinte forma:

Note que, se a hiptese nula for verdadeira, todos os tratamentos tero uma mdia
comum .
A anlise de varincia, baseia-se na decomposio da variao total da varivel
resposta em partes que podem ser atribudas aos tratamentos (varincia entre) e ao
erro experimental (varincia dentro) . Essa variao pode ser medida por meio das
somas de quadrados definidas para cada um dos seguintes componentes:

a soma de quadrados dos resduos pode ser obtida por diferena:


SQRes = SQTotal SQTrat.

A SQTrat tambm chamada de variao Entre, que a variao existente


entre os diferentes tratamentos e a SQRes chamada de variao Dentro uqe
funo das diferenas existentes entre as repeties de um mesmo tratamento.
Essas somas de quadrados podem ser organizadas em uma tabela,
denominada tabela de Analise de Varincia. Convm lembrar que esse teste vlido
se os pressupostos assumidos para os erros do modelo estiverem satisfeitos.
20

em que QMTrat=SqTrat/(I-1) e QMRes/(I(J-1)).


Pode-se mostrar que o quociente QMTrat/QMRest tem distribuio F com (I-
1) e I(J-1) graus de liberdade, suponde que Yij so variveis aleatrias
independentes, todos os tratamentos tem varincias iguais a 2 e Yij N( i, 2 ).
Por esses motivos, os pressupostos da ANOVA devem ser testados ou avaliados em
qualquer anlise.
Se Fcalculado>Ftabelado rejeitamos a hiptese de nulidade H0, ou seja,
existem evidencias de diferena significativa entre tratamentos, ao nvel de
significncia escolhido. Caso contrario, no se rejeitamos a hiptese de nulidade Ho,
ou seja, no ha evidencias de diferena significativa entre tratamentos, ao nvel de
significncia escolhido.

4.2 Exemplo

Considere o seguinte experimento que foi conduzido, considerando um


delineamento inteiramente casualizado. Foram comparados 4 tratamentos (tipos de
cultivo: gar (A), Cssia (C), Guar (G), Leucena (L)). Mediu-se o crescimento em
gramas, de explantes de morango:

Para este experimento, consideramos o modelo:


21

i = 1 , 2, . . . , 4 tratamentos;
j = 1 , 2, . . . , 8 repeties;
yij o peso em gramas correspondente ao i-simo tratamento na j-sima unidade
experimental;
i o efeito do i-simo tratamento;
eij o erro experimental associado ao i-simo tratamento e a j-sima repetio
As hipteses testadas neste experimento so:
22

CONCLUSO

O estudo da bioestatstica envolve grandes responsabilidades e


conhecimento. A partir deste trabalho, pude compreender algumas das opes para
se analisar variveis ou no variveis, clculo de normalidade e independncia,
sendo estes apenas um pouco dos inmeros testes existentes.
23

REFERNCIAS BIBLIOGRFICAS

TESTE DE INDEPENDNCIA. LIMA, Luis. Disponvel em:


<http://www.de.ufpb.br/~luiz/AED/Aula10.pdf >. Acesso em: 03 dez. 2017.

TESTE QUI QUADRADO PARA INDEPENDNCIA. PORTAL ACTION. Disponvel


em: < http://www.portalaction.com.br/844-22-teste-qui-quadrado-para-
independ%C3%AAncia>. Acesso em: 03 dez. 2017.

TESTE QUI QUADRADO PARA INDEPENDNCIA (DUAS AMOSTRAS). S


MATEMATICA. Disponvel em: < http://www.somatematica.com.br/estat/ap28.php>.
Acesso em: 03 dez. 2017.

TESTE DE SHAPIRO-WILK. PORTAL ACTION. Disponvel em:


<http://www.portalaction.com.br/inferencia/64-teste-de-shapiro-wilk>. Acesso em: 03
dez. 2017.

TESTE DE SHAPIRO-WIL PARA NORMALIDADE. DOS ANJOS, Adilson Disponvel


em: < https://docs.ufpr.br/~aanjos/CE213/ce213/node8.html>. Acesso em: 03 dez.
2017.

PAPEL DE PROBABILIDADE. PORTAL ACTION. Disponvel em:


<http://www.portalaction.com.br/content/61-papel-de-probabilidade#Exemplo6.1.1>.
Acesso em: 03 dez. 2017.

ANLISE DE VARINCIA. UFPR. Disponvel em:


<http://www.est.ufpr.br/ce003/material/cap7.pdf>. Acesso em: 03 dez. 2017.

ANLISE DE VARINCIA. UFRJ. Disponvel em:


<http://www.iesc.ufrj.br/cursos/cabds/4_A_Variancia_2009.pdf>. Acesso em: 03 dez.
2017.

Potrebbero piacerti anche