Sei sulla pagina 1di 78

Reviso Estatstica

Universidade Estadual do Sudoeste da Bahia


Departamento de Cincias Biolgicas
Gentica Quantitativa
Paulo L. S. Carneiro

INTRODUO
Processo de raciocnio indutivo, em que se
procuram tirar concluses indo do particular
para o geral;
Utiliza-se quando se pretende estudar uma
populao, estudando s alguns elementos,
ou seja, uma amostra;
Serve para, a partir das propriedades
verificadas na amostra, inferir propriedades
para a populao.
INTRODUO
INTRODUO
Teste estatstico:
uma regra decisria que nos permite rejeitar
ou no rejeitar uma hiptese estatstica com
base nos resultados de uma amostra;
Hipteses so, em geral, sobre parmetros
populacionais e a realizao do teste se baseia
na distribuio amostral dos respectivos
estimadores.
ALGUNS CONCEITOS
Parmetro
Parmetro uma funo de valores
populacionais, sendo em geral, um
valor desconhecido associado
populao. Por exemplo, na distribuio
normal os parmetros so a mdia e a
varincia.
) X ( E m = =
) X ( V
2
= o
ALGUNS CONCEITOS
Estimador
Representa uma dada frmula de clculo
que fornecer valores que sero
diferentes, conforme a amostra
selecionada.
n
X
X m

n
1 i
i
=
= = =
1 n
) X X (
s
n
1 i
2
i
2 2

= = o

=
1 n
n
) X (
X
n
1 i
n
1 i
2
i
2
i

=


=
=
ALGUNS CONCEITOS
Estimativa
Valor numrico assumido pelo
estimador, quando os valores X1,
X2,...,Xn so considerados (para
uma determinada amostra).

42 , 10 X = 67 , 4 s
2
=
ALGUNS CONCEITOS
Estatstica:
Usada como sinnimo de estimador
(frmula);
As vezes como sinnimo de estimativa;

Estatstica: caracterstica numrica da
amostra,
Parmetro: caracterstica numrica da
populao.



ALGUNS CONCEITOS
ALGUNS CONCEITOS
Hiptese Estatstica
Hiptese estatstica uma suposio
quanto ao valor de um parmetro
populacional, que ser verificada por um
teste paramtrico, ou uma afirmao quanto
natureza da populao, que ser
verificada por um teste de aderncia. As
hipteses estatsticas devem ser
formuladas de modo a minimizar os erros
de deciso.
Exemplos
A mdia populacional da altura dos brasileiros
adultos 1,65 m, isto ;
A distribuio dos pesos dos alunos da
Universidade Estadual do Sudoeste da Bahia
normal.
A proporo de indivduos com a doena X
3%, ou seja, p = 0,03.
m 65 , 1 =
Hiptese de Nulidade
Tambm chamada de hiptese bsica ou
hiptese nula, a hiptese estatstica a ser
testada;
Os testes so construdos sob a
pressuposio de ser verdadeira;
O teste de hiptese consiste em verificar se
determinado valor estimado a partir da
amostra obtida difere significativamente do
seu resultado esperado sob .






( )
0
H
( )
0
H
Exemplos
Um fabricante informa que a tenso mdia
de ruptura dos cabos 50 kgf. 2
A informao de um fabricante, quanto
durabilidade mdia de suas lmpadas, de
6.000 horas
Duas marcas de raes, 1 e 2, para leites
em fase de crescimento, propiciam em
mdia o mesmo ganho de peso
50 : H
0
=
000 . 6 : H
0
=
2 1 0
: H =
Teste de Hipteses (ou teste de
significncia ou regra decisria)
um procedimento que mediante
informaes obtidas de amostras, permite
decidir em rejeitar ou no-rejeitar
0
H
Regio Crtica
a faixa de valores da estatstica do teste
que nos levam rejeio da hiptese
Se o valor da estatstica do teste (z, t, qui-
quadrado, F) obtido com base na amostra,
pertena regio crtica, rejeita-se , caso
contrrio no rejeitamos
Qualquer deciso tomada implica na
possibilidade de cometer basicamente, dois
tipos de erros: erro tipo I e erro tipo II.
0
H
0
H
Erro Tipo I () e Erro Tipo II ()
= P(cometer o erro tipo I) = nvel de
significncia.
P-value (ou valor p)
= P (cometer o erro tipo I) = nvel de
significncia;
p-value: para um a dado valor observado de
uma estatstica do teste, o p-value
corresponde ao menor nvel de
significncia para a qual H0 poderia ter sido
rejeitada (nvel mnimo de significncia para
rejeio de H0).
Se p-value <= (rejeita-se H0);
Se p-value >= (aceita-se H0).

PRINCPIOS BSICOS DA
EXPERIMENTAO
Estudo dos experimentos (planejamento,
execuo, anlise dos dados obtidos e
interpretao dos resultados).
Alguns conceitos bsicos
Experimento ou ensaio: um trabalho
previamente planejado, que segue
determinados princpios bsicos e no
qual se faz a comparao dos efeitos
dos tratamentos.

Alguns conceitos bsicos
Tratamento: o mtodo, elemento ou
material cujo efeito desejamos medir ou
comparar em um experimento.
(variedades de milho, nveis de protena
na rao, tipos de aleitamento de
bezerros, diferentes tempos e
temperaturas de pasteurizao do leite e
outros).


Alguns conceitos bsicos
Unidade experimental ou parcela: a
unidade que vai receber o tratamento e
fornecer os dados que devero refletir o
seu efeito. (Raes: 1 leito ou um grupo de
leites), etc
Alguns conceitos bsicos
Delineamento experimental: o plano
utilizado na experimentao e implica na
forma como os tratamentos sero
designados s unidades experimentais.
Delineamento inteiramente casualizado
(DIC);
Delineamento em blocos casualizados
(DBC);
Delineamento em quadrado latino (DQL).
PRINCPIOS BSICOS DA
EXPERIMENTAO
Repetio;
Casualizao;
Controle local.
Princpio da Repetio
Consiste na reproduo do experimento
bsico;
Finalidade propiciar a obteno de uma
estimativa do erro experimental;
A repetio consiste em aplicar o mesmo
tratamento a vrias parcelas ou unidades
experimentais num mesmo experimento.
Princpio da Repetio
Regra prtica GOMES (1987): os
experimentos devem ter pelo menos 20
parcelas e 10 graus de liberdade para o
resduo.
maior o nmero de repeties maior
ser a preciso do experimento?
Princpio da Casualizao
Propiciar, a todos os tratamentos, a mesma
chance de serem designados a qualquer
uma das unidades experimentais;
Evita que nenhum dos tratamentos seja
sistematicamente favorecido ou
desfavorecido por fatores externos;
Necessrio para que as variaes que
contribuem para o erro experimental, sejam
convertidas em variveis aleatrias.
Princpio da Casualizao
Permite obter uma estimativa vlida do erro
experimental;
Garante o uso de testes de significncia por
tornar os erros experimentais
independentes;
Obs: sem os princpios bsicos da
repetio e da casualizao no existe
experimentao.
Princpio do Controle Local
Muito usado, mas no obrigatrio;
Dividir um ambiente heterogneo em
sub-ambientes homogneos e tornar o
delineamento experimental mais
eficiente, pela reduo do erro
experimental;
Princpio do Controle Local
Fontes de variao de um
experimento
Premeditada
aquela introduzida pelo
pesquisador com a finalidade de
fazer comparaes. Por exemplo:
tratamentos.

Fontes de variao de um
experimento
Sistemtica
Variaes no intencionais, mas de
natureza conhecida;
Variao inerente ao material
experimental;
Podem ser controladas pelo
pesquisador (heterogeneidade do
solo, tamanho de semente, idade
dos animais, grupo gentico dos
animais etc.)
Fontes de variao de um
experimento
Aleatria
So variaes de origem desconhecida,
no podendo ser controladas;
Constituem o erro experimental
(variaes no material experimental e
falta de uniformidade nas condies
experimentais);
Nem sempre possvel distinguir
claramente este tipo de variao da
anterior.

DELINEAMENTO INTEIRAMENTE
CASUALIZADO (DIC)
A distribuio dos tratamentos s
unidades experimentais feita
completamente ao acaso;
Repetio e casualizao;
Indicado quando as condies
experimentais so homogneas
(laboratrio).
MODELO ESTATSTICO
Modelo estatstico: visa identificar que fatores
esto influenciando a varivel em estudo.
ij i ij
e t m Y + + =
O erro experimental se refere s variaes
observadas entre as repeties do mesmo
tratamento.
Soma de quadrados do resduo: Representa a variao dentro dos tratamentos, isto , a
variao entre as unidades experimentais com o mesmo tratamento, ou seja a variao
devida ao erro experimental, que no de responsabilidade dos tratamentos.

Quadro de tabulao dos dados
I tratamentos e J repeties.
Anlise de Varincia
uma tcnica de anlise estatstica que
permite decompor a variao total;
Pressuposies:
1a) os efeitos do modelo estatstico devem
ser aditivos;
2a) os erros experimentais devem ser
normalmente distribudos, independentes,
com mdia zero e com varincia comum
(pressupe homogeneidade de varincias).
ANOVA
SQTotal = SQTratamentos + SQResduo
IJ
Y
Y SQTotal
J I
j i
ij
J I
j i
ij
2
,
1 , 1
,
1 , 1
2
|
|
.
|

\
|
=

= =
= =


=
= =
|
|
.
|

\
|
=
I
i
J I
j i
ij
i
IJ
Y
J
T
SQTrat
1
2
,
1 , 1
2
Nmero de repeties varia de
acordo com o tratamento


=
= =
|
|
.
|

\
|
=
I
1 i
2
r , I
1 j , 1 i
ij
i
2
i
N
Y
r
T
SQTrat
i
SQResduo = SQTotal - SQTrat
Nvel de significncia pr-estabelecido: Ftab (5%, 3,20) =
3,10 (rejeita-se H0). Os softwares j trazem o p-value.
Exemplo: Diminuio da presso arterial em mmHg,
segundo o tratamento (5 drogas e 1 placebo)
T1 T2 T3 T4 T5 Cont.
25 10 18 23 11 8
17 -2 8 29 23 -6
27 12 4 25 5 6
21 4 14 35 17 0
15 16 6 33 9 2
FV GL SQ QM F
Tratamento
Resduo
Total
5
24
29
2.354,16
864,04
3.218,20
470,8
36,0
13,07
IJ
Y
Y SQTotal
J I
j i
ij
J I
j i
ij
2
,
1 , 1
,
1 , 1
2
|
|
.
|

\
|
=

= =
= =
(25
2
+ 17
2
+ 27
2
+ 21
2
+ 15
2
+ 10
2
+ (-2)
2
+ 12
2
+ 4
2
+ 16
2
+ 18
2
+ 8
2
+ 4
2
+ 14
2
+ 6
2
+ 23
2
+ 29
2
+ 25
2
+
35
2
+ 33
2
+ 11
2
+ 23
2
+ 5
2
+ 17
2
+ 9
2
+ 8
2
+ (-6)
2
+ 6
2
+ 0
2
+ 2
2
) -
(25

+ 17

+ 27

+ 21

+ 15

+ 10

+ (-2)

+ 12

+ 4

+ 16

+ 18

+ 8

+ 4

+ 14

+ 6

+ 23

+ 29

+ 25

+ 35

+ 33

+ 11

+
23

+ 5

+ 17

+ 9

+ 8

+ (-6)

+ 6

+ 0

+ 2)
2
/ 30


=
= =
|
|
.
|

\
|
=
I
1 i
2
r , I
1 j , 1 i
ij
i
2
i
N
Y
r
T
SQTrat
i
N =IJ= 30
GL tot = N-1 = 30 - 1 = 29
K = i = 6
GL tto = K-1 = 6 -1 = 5 GL res = GLTot - GLtto = 29 - 5 = 24
r = j = 5
(25

+ 17

+ 27

+ 21

+ 15)
2
/5 + (10

+ (-2)

+ 12

+ 4 + 16)
2
/5 + (18

+ 8

+ 4

+ 14

+ 6 )
2
/5

+
(23

+ 29

+ 25

+ 35

+ 33)
2
/5

+ (11

+ 23

+ 5

+ 17

+ 9 )
2
/5

+ (8

+ (-6)

+ 6

+ 0

+ 2 )
2
/5 -
(25

+ 17

+ 27

+ 21

+ 15

+ 10

+ (-2)

+ 12

+ 4

+ 16

+ 18

+ 8

+ 4

+ 14

+ 6

+ 23

+ 29

+ 25

+ 35

+ 33

+ 11

+
23

+ 5

+ 17

+ 9

+ 8

+ (-6)

+ 6

+ 0

+ 2)
2
/ 30
SQ res = SQ tot SQ tto = 3.218,20 2.354,16 = 864,04
QM tto = SQ tto/GL tto = 2.354,16 / 5 = 470,8
QM res = SQ res/GL res = 864,04 / 24 = 36,0
Fcalc = QM tto/QM res

= 470,8 / 36,0 = 13,07
Hipteses para o teste F
Regra decisria para o teste F
F calculado for maior ou igual ao valor do F
tabelado (rejeita-se )
Concluso: tratamentos tem efeito diferenciado ao
nvel de significncia em que foi realizado o teste;
F calculado for menor que o valor do F tabelado
(no rejeita-se );
Concluso: os tratamentos tm efeitos iguais ao
nvel de significncia em que foi realizado o teste.
0
H
0
H
Deciso
Fcalc = 13,07
F
0.01
(5,24) = 3,9
Fcalc = 13,07 > F
0.01
(5,24) = 3,9
A diferena entre mdias de tratamentos significativa (p< 0.01) ;
Rejeita-se H
0
Testes de mdias
F significativo (quando temos mais de dois
nveis para os tratamentos)
Tukey, Duncan, t, etc;
Coeficiente de Variao
FV GL SQ QM F
Tratamento
Resduo
Total
5
24
29
2.354,16
864,04
3.218,20
470,8
36,0
13,07
36
13,83

= (6/13,83) . 100 = 43,38%

Exemplo :
Coeficiente de Variao
Exemplo: Para estudar a poluio de um rio, um cientista mediu a concentrao de um
determinado composto orgnico (Y) e a precipitao pluviomtrica na semana anterior (X)
X Y
1 0,91 0,10
2 1,17 1,00
3 1,33 1,10
4 1,86 2,60
5 2,68 2,10
6 4,19 3,40
0,91 1,17 1,33 1,86 2,68 4,19
0,10
1,00
1,10
2,10
2,60
3,40
1
2
3
4
5
6
Diagrama de disperso
X
Y
X- Y -
1 -1,11 -1,62
2 -0,85 -0,72
3 -0,69 -0,62
4 -0,16 0,88
5 0,66 0,38
6 2,17 1,68
(X-)(Y -) (X -)
2
(Y -)
2
1 1,80 1,23 2,62
2 0,61 0,72 0,52
3 0,43 0,48 0,38
4 -0,14 0,03 0,77
5 0,25 0,44 0,14
6 3,65 4,71 2,82
6,6 7,61 7,25
X Y
1 0,91 0,10
2 1,17 1,00
3 1,33 1,10
4 1,86 2,60
5 2,68 2,10
6 4,19 3,40
2,02 1,72
6,6
7,61 x 7,25
0,89 6,6 / 7,42
= = =
Coeficiente de determinao (r
2
)
Valor percentual que explica Y em funo de X

No exemplo : r
2
= 0,89
2
= 0,7921 ou seja:

79,21 % da variao de da concentrao do composto
orgnico em estudo (Y) est sendo explicado pela
precipitao pluviomtrica da semana anterior (X)
64
SAS - Statistical Analysis System
Combina um pacote estatstico, sistema gerenciador de dados e
uma linguagem de programao de alto nvel (mais distante da
linguagem de mquina).

Sistema integrado de software que fornece um controle sobre o
acesso de dados, manipulao, anlise e apresentao.
65
Utilizando o SAS
66
Descrio das Janelas
As principais janelas do SAS so:

Explorer;
Results;
Editor;
Log;
Output.
67
Descrio das Janelas
Janela Explorer
Nesta janela pode-se ver os arquivos, criar arquivos SAS (programa
fonte, p. ex.) e bibliotecas (libraries);

Biblioteca semelhante a um diretrio. Entretanto, ao se criar
uma biblioteca o programa cria um atalho ou ponteiro de
localizao lgica para os arquivos e no um espao reservado
no HD propriamente dito.

Abrir e gerenciar arquivos SAS (mover, copiar e apagar).
68
Descrio das Janelas
Janela Program Editor
Permite entrar, editar e submeter programas SAS;

69
Descrio das Janelas
Janela Log

o local onde o SAS escreve mensagens aps o usurio
executar um determinado programa.

Caracteres em vermelho significam mensagens de erro;

Caracteres em azul so notas informativas, por exemplo,
verso do software, nmero do site do usurio, sistema
operacional, tempo de execuo, descrio dos dados e dos
subprogramas usados;
70
Descrio das Janelas
Janela Log

Caracteres em verde significam mensagens de advertncia;

Caracteres em preto com linhas numeradas a esquerda o
programa editado pelo usurio.

Nota: muitos programadores de SAS ignoram esta sada. Procure sempre verificar se
o programa foi executado conforme planejado. E leia com ateno as relevantes
informaes complementares.
71
Descrio das Janelas
Janela Output
Aps submeter um programa e se, ele gera qualquer sada, os
resultados sero apresentados nesta tela.

Janela Results
Permite navegar e gerenciar as sadas geradas pelo seu
programa;

Parece como um ndice com sees que expandem ou
contraem. Pode-se ver, salvar e imprimir individualmente os
itens da sada.
72
Importando os dados
O usurio pode importar os dados num formato de arquivo
padro ou num formato especial usando o assistente de
importao (Import Wizard) do SAS.

Importando um arquivo padro
(1) Selecione File Import Data para abrir a janela Import
Wizard;
(2) Clique na seta para abrir a lista das fontes de dados;
(3) Clique Next para continuar e clique Browse para encontrar
o arquivo; Selecione myexport;
73
Importando os dados
Importando um arquivo padro (cont.)

(4) Clique Next para continuar e digite Mylib para o nome da
biblioteca e MyImport para o nome do arquivo (Member name);
(5) Clique Next para continuar;
O assistente de importao pergunta se o usurio gostaria de
criar um arquivo com as instrues para o PROC IMPORT.
(6) Clique Finish para terminar e transpor a opo anterior.
Nota: Se os dados no esto num formato padro ento utilize a
External File Interface (EFI) para realizar a importao.
74
Comando Data
Comando de definio;
Sempre inicia um data Step;
DATA <nome do arquivo>;
75
Comando Infile
Comando de definio;
Comando que identifica e abre um arquivo externo de
dados, somente para leitura (no em formato SAS);
Normalmente um arquivo de dados no formato texto;
INFILE <nome do arquivo de dados> [opes] ;


Exemplo:
76
Exemplo:
Comando Set
Comando de execuo;
Abre um arquivo de dados DATA Set (formato sas),
somente para leitura
SET <nome do arquivo> ;


77
Comando INPUT
Descreve ao SAS como esto armazenados e organizados os
dados em arquivos texto, que foram especificados pelo
comando INFILE ou pelos dados digitados no programa
aps o comando CARDS;

Todo arquivo aberto pelo comando INFILE, sempre
necessitar de um comando INPUT para ler seu contedo
78
Comando INPUT
INPUT listado
INPUT colunado
79
INPUT listado
L as variveis na ordem que aparecem na linha de dados,
de acordo com um delimitador. Os dados no precisam estar
alinhados e colunados;


INPUT <varivel> [$];

80
Exemplo:
INPUT listado
81
INPUT colunado
L as variveis especificando a sua posio na linha de dados
(posio inicial e final).
As variveis precisam estar alinhados e colunadas;

INPUT <varivel> [$] <incio> - <fim> [.decimal]

$ indica que a varivel s ir conter dados alfanumricos
incio valor que indica a posio inicial da varivel na linha de dados
incio valor que indica a posio final da varivel na linha de dados
.decimal valor opcional, indica o nmero de posies decimais de uma
varivel numrica

82
INPUT colunado
Importando um arquivo XLS

PROC IMPORT OUT= WORK. <nome do arquivo SAS>
DATAFILE= <endereo do arquivo.xls>
SHEET=<nome da planilha>

Exemplo:

Potrebbero piacerti anche