Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Piracicaba - SP 1997
ii
Sumrio
1. Por que Bioestatstica Florestal? 2. Tipos de Informaes. 3. Resumindo a Informao: Tabelas
Variveis discretas. Definindo as Classes para Variveis Contnuas. Nmero de Classes.
iii
Apndices: A. Respostas de Exerccios Selecionados B1. Tabelas da Distribuio Normal Padronizada B2. Tabela da Distribuio t de Student B3. Tabela da Distribuio F B4. Tabela da Distribuio de Qui-Quadrado
1-1
Exemplos Profissionais
CASO FLORESTAL 1 Voc diretor de uma fbrica de chapas de madeira (chapas duras). A companhia deseja duplicar a produo da sua fbrica pois o mercado est em franca expanso. Estudando o processo de produo na sua fbrica voc chega concluso de que o consumo de madeira crescer em 1.300.000m3 de madeira/ano com a duplicao. O gerente florestal afirma que as florestas da companhia so capazes de produzir at 1.320.000m3 de madeira/ano a mais do que vm produzindo.
1. 2. Voc faz a duplicao da fbrica ? Por que ? Qual a diferena na maneira que o seu nmero (1.300.000 m3/ano) e o do gerente florestal (1.320.000 m3/ano) foram gerados ?
CASO FLORESTAL 2 Uma pesquisadora deseja estimar o tamanho da populao de Furnarios rufus (Joo-de-barro) numa dada localidade do interior de Minas Gerais. Num primeiro levantamento, a pesquisadora capturou 31 pssaros e marcou a todos com uma anilha. Num segundo levantamento, ela capturou 47 pssaros dos quais 12 possuam a anilha referente ao primeiro levantamento.
1. 2. Qual o tamanho da populao de Furnarios rufus nessa localidade ? O que a pesquisadora deve assumir como verdadeiro para que a partir desses nmeros ela possa chegar a uma estimativa do tamanho da populao ?
1-2
CASO FLORESTAL 3 Eucalyptus grandis uma das espcies arbreas de maior produtividade quando plantada no Estado de So Paulo. Entretanto, um experimento mostrou que quando a floresta plantada sem preparo de solo e sem adubao inicial, Eucalyptus cloeziana pode alcanar produtividades de 15 a 20% maiores que E. grandis.
1. Como base nessa informao voc indicaria E. cloeziana em lugar de E. grandis para pequenos proprietrios rurais que no possuem condies de fazer o preparo de stio adequado para E. grandis ? Que informaes adicionais so necessrias para tomar uma deciso?
2.
CASO FLORESTAL 4 Sabe-se que numa floresta tropical no perturbada a abundncia de espcies pioneiras fica em torno de 10%. Com aumento de perturbaes antrpicas a abundncia dessas espcies tende a crescer. Na demarcao de uma reserva florestal com rea total de 50.000 ha, ecologistas e engenheiros florestais discutem a incorporao de uma rea de 7.500 ha onde o levantamento de campo revelou uma abundncia de 15% de espcies pioneiras. O objetivo da demarcao da reserva proteger reas representativas de ecossistemas locais que no sofreram influncia antrpica significativa.
1. 2. A rea de 7.500 ha deve ou no deve ser incorporada reserva ? Que informaes adicionais so necessrias para se tomar uma deciso ?
Concluso
Todo profissional florestal lida com uma grande quantidade de informaes qualitativas e quantitativas. A tomada de deciso envolve a anlise destas informaes. O raciocnio quantitativo a base da anlise de informaes que gera subsduos tomada de deciso. Esta anlise envolve necessariamente um alto grau de incerteza quanto s informaes disponveis, pois estas sempre so incompletas e limitadas.
Conceitos-Chave
1-3
INFORMAO QUANTITATIVA - INFORMAO QUALITATIVA - TOMADA DE DECISO - ANLISE DE INFORMAO INCERTEZA - RACIOCNIO QUANTITATIVO
Exerccios
1.1 Voc foi contrato para ser coordenador de uma equipe de profissionais com a misso de realizar um diagnstico das unidades de conservao no Estado de So Paulo. Que informaes de ordem qualitativa voc necessitaria.? Que informaes de ordem quantitativa seriam necessrias? 1.2 Enumere trs justificativas para o Engenheiro Florestal conhecer Bioestatstica. 1.3 So pr-requisitos para Bioestattica Florestal disciplinas de Matemtica e Clculo. Reflita sobre o seu conhecimento nessas disciplinas. Quantifique a proporo dos temas que voc realmente domina dentre os tratados nessas disciplinas.
Leitura Sugerida
[WALLIS & ROBERTS, 1964] Cap. 1 (p.21-38) O Campo da Estatstica. Cap. 2 (p. 39-52) Estatstica: Como us-la devidamente.
2-1
Introduo
O termo informao algo bastante vago na linguagem contidiana. Informao sinnimo de esclarecimento, notas, argumentos e at fornecimento de dados. Este ltimo sinnimo o que interessa Bioestatistica Florestal. Informao deve ser entendida portanto como dados sobre uma realidade ou situao que so fornecidos ou obtidos atravs de observaes ou medies. A Bioestatstica Florestal procura manipular as informaes (os dados) de modo que elas possam ser mais protamente utilizadas na tomada de deciso. O primeiro passo na manipulao da informao saber reconhecer os tipos bsicos que existem.
Escalas Fundamentais
ESCALA NOMINAL
Conjunto de ATRIBUTOS sem qualquer relao clara entre si. Espcies arbreas numa floresta. Procedncias de uma espcie Classificao dos solos
Informao Qualitativa
Conjunto de ATRIBUTOS que se apresentam em uma ORDEM (crescente ou decrescente). Julgamentos do tipo: Bom/Mdio/Ruim Notas de qualidade de fuste das rvores Classes de fertilidade dos solos
ESCALA ORDINAL
2-2
ESCALA DE INTERVALO
Os ATRIBUTOS so quantitativos (nmeros) organizados numa escala onde o INTERVALO entre dois valores tem significado real, mas o PONTO ZERO da esca;a arbitrrio. Temperatura Horrio do dia Azimute
Informao Quantitativa
Os ATRIBUTOS so quantitativos (nmeros) organizados numa escala onde tatno o INTERVALO entre dois valores quanto o PONTO ZERO tem significado real. Medidas numricas em geral Dados de contagem/enumerao Propores (porcentagens)
ESCALA DE RAZO
P ARA REFLETIR Voc pode dizer que uma rvore de 30 metros tem o dobro de altura de uma rvore de 15 metros, ou que um peixe com 9 kg trs vzes mais pesado que um de 3 kg. Por que no faz sentido dizer que 40oC duas vzes mais quente que 20oC ? Ou que 6:00 horas um horrio trs vzes mais cedo que 18:00 hs ?
Exemplo
2.A Classifique as variveis abaixo de acordo com as quatro escalas fundamentais. Nmero de chamadas telefnicas: ____________________ __ Horrio de visitao dos polinizadores de cedro: ____________________ __ Localizao de um formiqueiro numa floresta: ____________________ __ Tempo de abate de uma rvore: ____________________
2-3
__ Porcentagem de mortalidade de mudas num viveiro: ____________________ __ Sabores de sorvete na sorveteria Paris: ____________________ __ Grau de infestao de cupim numa estante: ____________________ __
Variveis
VARIVEL um outro termo que utilizamos em Bioestatstica para designar informao. Resultam de observaes nas escalas Nominal e Ordinal VARIVEIS QUALITATIVAS Tambem chamadas de VARIVEIS CATEGRICAS
De representao matemtica direta: X = nmero de rvores com cancro numa amostra de 10 rvores: M = taxa de mortalidade das rvores numa floresta nativa:
X {0,1,2,3,4,5,6,7,8,9,10}
A [0,2 ]
M [ 0,1]
Os atributos so representados por escalas numricas VARIVEL DISCRETA : escala pode ser representada por uma quantidade contvel de nmeros (conjunto dos nmeros Naturais): * X o nmero de rvores com cancro numa amostra de 10 rvores:
X {0,1,2,3,4,5,6,7,8,9,10}
Z {0.0,0.1,0.2 ,0.3,0.4,0.5,0.6,0.7,0.8,0.9,10 . }
Y {0,1,2,3,4,5,..., }
2-4
VARIVEL CONTNUA : escala representada por uma quantidade incontvel de nmeros (conjunto dos nmeros Reais): * D o dimetro das rvores de uma floresta plantada: * W a biomassa (ton/ha) num ecossistema florestal:
D [10,50]
W [500,5000] S [0,1]
Exemplos
2.B Classifique as variveis abaixo em termos de variveis categrias e variveis discretas/contnuas. Volume de madeira numa floresta. ____________________ __ Classes de declividade do solo segundo o Cdigo Florestal Brasileiro ____________________ __ Peso seco das folhas numa rvore. ____________________ __ Nmero de rvore mortas em 1 ha de floresta nativa. ____________________ __
2.C Determine as escalas que melhor representam as variveis quantitativas da questo anterior.
Variveis Multidimensionais
Variveis multidimensionais resultam da combinao de duas ou mais variveis qualitativas e quantitativas:
LME 216 - INTRODUO BIOESTATSTICA FLORESTAL * Localizao de uma rvore numa parcela de floresta de 500 x 1000 m: S = ( X , Y ) , onde X e Y so variveis quantitativas que representam as coordenadas num plano cartesiano: X [ 0,500 ] ; Y [ 0 ,1000]
2-5
* Atributos relacionadas com cada uma das rvores numa amostra: A = ( D , H , S ) , onde D o dimetro da rvore (var. quantitativa contnua), H a altura (var. quantitativa contnua) e S a espcie (var. categrica/nominal)
Conceitos-Chave
ESCALAS FUNDAMENTAIS - ESCALA NOMINAL - ESCALA ORDINAL - ESCALA DE INTERVALO - ESCALA DE RAZO - VARIVEL QUALITATIVA -VARIVEL CATEGRICA - VARIVEL QUANTITATIVA - VARIVEL DISCRETA - VARIVEL CONTNUA
Leitura Essencial
[OLIVEIRA 1977] Cap. 2 (p.5-7) Estatstica Descritiva. [IEMMA, 1992] Cap. I (p.4-8) Noes Introdutrias.
Exerccios
2.1 Classifique as variveis abaixo segundo as escala fundamentais: (a) (b) (c) (d) (e) (f) (g) (h) rvore classificada como Morta ou Viva: ____________________ __ Densidade da madeira: ____________________ __ Formaes vegetais brasileiras: ____________________ __ Crescimento de uma florestas em termos de volume de madeira: ____________________ __ Formas de vida presente numa floresta nativa: ____________________ __ Tipos de dormncia de sementes: ____________________ __ Abundncia de uma planta herbcea: ____________________ __ Tipos de deformaes numa pea de madeira durante a ____________________ secagem: __
2-6
Risco de incndio no dia de hoje numa floresta plantada: ____________________ __ Diversidade de espcies arbreas na bacia do rio Amazonas: ____________________ __ Nmero de caladodos estudantes da ESALQ: ____________________ __ Lista dos 10 livros mais lidos na semana: ____________________ __ Figuras de linguagem: ____________________ __
2.2 Represente as escalas apropriadas para as seguintes variveis quantitativas: H = altura das rvores de uma floresta nativa (m); V = volume de madeira em 1ha de floresta plantada (m3); X = nmero de rvores de mogno numa floresta nativa; I = posio de insero dos ramos de uma rvore ao longo da circunferncia do tronco (radianos); Y = nmero de folhas numa muda de Eucalyptus camaldulensis; S = taxa de sobrevivncia das rvores numa floresta nativa; A = proporo de areia num solo; E = taxa de autopolinizao de uma espcie florestal; C = Dimetro das copas das rvores numa floresta de pinus; D1 = Declividade do terreno (graus) medida em pontos especficos de uma floresta; D2 = Declividade do terreno (%) medida em pontos especficos de uma floresta; F = face de exposio de uma encosta (graus).
3-1
Introduo
Talvez a principal tarefa da Bioestatstica a de resumir uma grande quantidade de informao de modo que se torne mas fcil a compreenso dos fenmenos envolvidos e a tomada de deciso. A maneira mais simples de resumirmos a informao contida numa varivel quantitativa com um grande nmero de dados atravs de tabelas.
O que se pode dizer sobre a floresta com base nestes dados ? possvel ter uma idia clara apenas observando os nmeros?
Estes mesmos dados resumidos numa tabela se tornam mais informativos: Com uma rpida olhada na tabela j notamos que a maioria das rvores se concentram nas menores classes de dimetro e que so poucas as rvores grande dimetro. Voc seria capaz de observar isto nos dados originais ?
FREQNCIA 40 21 10 10 8 4 3 4 100
3-2
Variveis Categricas
As variveis categricas podem ser representadas em tabelas sem perda de informao, pois elas so representadas por classes.
Nmero de Espcies 7 19 25 41
A natureza das variveis categrias sugere que elas sejam sempre apresentadas na forma tabular.
Variveis Quantitativas
Var. Discretas : nmero contvel de valores As variveis quantitativas podem assumir um grande nmero de valores Var. Contnuas : nmero infinito (no contvel) de valores.
DEFINIO DAS CLASSES Devem ser agrupadas em CLASSES antes de serem tabeladas 1. Nmero de Classes: nCLASSES (Algoritmo de Ramsdall) 2. Amplitude dos Dados:
= 1 + 3.33log 10 N OBSERVA E S
A = X MXIMO X MNIMO
3. Amplitude das Classes: a = A / nCLASSES . Arredonde esta amplitude encontrada para um valor conveniente. 4. Organizar as classes de modo que a primeira classe contenha X MNIMO e a ltima classe contenha X MXIMO .
3-3
1) Encontre o nmero de classes para a construo de uma tabela para estes dados:
1 2 3 4 5 6 7
0.6 + 0.7 = 1.3 1.3 + 0.7 = 2.0 2.0 + 0.7 = 2.7 2.7 + 0.7 = 3.4 3.4 + 0.7 = 4.1 4.1 + 0.7 = 4.8 4.8 + 0.7 = 5.5
5) Construa a tabela com a freqncia e a freqncia acumulada. Classe Contagem Freq. Freq. Acumulada
0.6 - 1.3 1.3 - 2.0 2.0 - 2.7 2.7 - 3.4 3.4 - 4.1 4.1 - 4.8 4.8 - 5.5
3 6 12 9 9 0 1 40
3 9 21 30 39 39 40 --
3-4
Variveis Discretas
NMERO DE BROTOS DEIXADOS EM CEPAS DE EUCALYPTUS GRANDIS APS O PRIMEIRO CORTE Dados Brutos:
2 1 2 2 0 3 3 2 1 1 2 2 0 1 1 3 1 2 1 1 2 0 0 3 2 1 2 2 3 0 2 3 3 0 3 2 2 0 1 1 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3
Neste caso, elas so tabuladas como se fossem variveis categricas. Cada valor assumido tomado como uma classe.
0 1 2 3
7 11 14 8
7 18 32 40
Classes
Amplitud e
(i)
(fi )
1 2 3 4 5 6 7 0.6 - 1.3 1.3 - 2.0 2.0 - 2.7 2.7 - 3.4 3.4 - 4.1 4.1 - 4.8 4.8 - 5.5
TOTAL
(Fi )
3 9 21 30 39 39 40 --
(pi )
0.075 0.150 0.300 0.225 0.225 0.000 0.025 1.000
(Pi )
0.075 0.225 0.525 0.750 0.975 0.975 1.000 --
3 6 12 9 9 0 1 40
LME 216 - INTRODUO BIOESTATSTICA FLORESTAL Relao entre a Freqncia Absoluta e Freqncia Relativa:
3-5
pi = f i / N OBS . Pi = Fi / N OBS.
Conceitos-Chave
TABELA - NMERO DE CLASSES - ALGORITMO DE RAMSDALL - AMPLITUDE DOS DADOS - AMPLITUDE DE CLASSE - FREQNCIA - FREQNCIA ACUMULADA - FREQNCIA ABSOLUTA - FREQNCIA RELATIVA
Leitura Essencial
[IEMMA, 1992] Cap. II: p.20-24. Cap. III: p37-41. Cap. IV: p55-62.
Exerccios
3.1 Construa tabelas (freq. absoluta e relativa) para resumir a informao contida nos seguintes conjuntos de dados: (a) Nmero de plntulas num rea de 2 x 2 m:
4 8 15 18 7 13 15 1 1 6 0 17 7 9 8 8 16 3 12 4 8 3 8 20 18 7 8 7 4 2
(e) Classes de capacidade de uso do solo (SR= sem restries; RCA = com restries a culturas anuais; P=pastagens; CP=culturas perenes; F=atividades florestais):
P F P P RCA P CP CP CP RCA P CP CP P CP CP F RCA RCA CP P SR P CP P CP CP RCA P SR P CP CP P CP CP CP RCA F RCA SR P SR CP CP F F SR P CP F CP RCA F RCA SR F F CP CP P F F RCA RCA RCA P
4-1
TABULAR GRFICA
Apresentao da distribuio de uma varivel
4-2
Grfico Linha
o mtodo mais simples de representao grfica de uma varivel.
taeda
26 21 21 26 28 34 25 25 27 26 27 23 26 25 27 14 23 23 24 24
Dados Brutos
28 22 17 28 22
23 25 25 25 24
25 25 24 24 27
25 23 26 21 26
30 23 27 24 23
24 24 26 23 26
X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X
X X X X X X X X X
X X X X X X
14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
4-3
Grfico Ramo-Folha
outra forma de representar a distribuio de uma varivel quantitativa mantendo os valores originais da varivel. P ESO (kg) DE ALUNOS DE ENGENHARIA FLORESTAL Dados Brutos:
45 66 67 78 52 75 68 79 53 53 68 79 56 57 55 55 69 74 82 107 58 58 74 60 64 74 65 65 75 65 66 75
Uma linha vertical divide os valores das observao numa determinada unidade. No grfico ao lado a linha representa dezenas de kilogramas (10kg): 4|5 45kg 10 | 7 107 kg
4 5 6 7 8 9 10
CONSTRUO DE UM GRFICO RAMO -FOLHA 1) Definir a unidade de medida que dividir cada valor em duas partes: ramo e folha. No exemplo acima a diviso foi feita em 10kg: 45 kg ==> ramo = 4 / folha = 5 107 kg ==> ramo = 10 / folha = 7 2) Escrever os ramos em ordem crescente verticalmente e passar uma linha vertical direta deles. 3) Associar cada folha ao respectivo ramo. 4) Ordenar, em cada ramo, as folhas em ordem crescente da direita para esquerda.
4-4
1) Unidade de media para separao ramo e folha: ________________________ 2) Escrever os ramos verticalmente com uma linha direita deles:
4) Analise o grfico resultante e responda: a) Qual a amplitude de variao da altura dos alunos ? b) Ocorre observaes extremas nestes dados? Quais? c) Ocorre diferenciao de grupos de alunos?
4-5
4-6
Bimodal e Assimtrica
Uniforme
Em forma de U
4-7
Histogramas
Histogramas so representaes grficas de tabelas de freqncia: DIMETRO (cm) DAS RVORES NUMA FLORESTA NATIVA
FREQNCIA 40 21 10 10 8 4 3 4 100
4-8
ESCALA ADEQUADA DOS EIXOS DO HISTOGRAMA Eixo-Y (ordenadas) com a Freqncia Relativa facilita a comparao de variveis com unidades de medidas distintas
Eixos exageradamente grandes em relao amplitude dos dados geram grficos cheios de vazio que dificultam a observao da forma da distribuio.
4-9
Conceitos-Chave
DISTRIBUIO DE VARIVEIS - GRFICO RAMO-FOLHA - OBSERVAO EXTREMA - OUTLIER - FORMA DA DISTRIBUIO - UNIMODAL/BIMODAL - SIMETRIA - ASSIMETRIA DIREITA - ASSIMETRIA ESQUERDA UNIFORME - HISTOGRAMA
Leitura Essencial
[IEMMA, 1992] Cap. IV: p58-66.
Exerccios
4.1 Os dados abaixo se referem produo de resina (kg) de rvores de Pinus elliotti. Construa um grfico ramo-folha e analise o comportamento desta varivel.
0.71 2.04 3.09 2.67 2.63 2.16 2.16 2.18 3.63 4.05 3.94 3.93 1.94 1.80 2.06 3.34 3.69 2.22 3.55 2.78 2.77 2.06 3.56 3.26 1.42 1.20 3.57 3.06 2.48 1.67 2.39 3.32 3.77 5.41 2.48 3.37 2.75 1.57 1.53 0.75
4.2 O dimetro de algumas rvores de duas floresta foi medido num levantamento, obtendo-se os seguintes valores:
4-10
FLORESTA A
16 49 9 17 16 12 21 32 30 52 38 28 22 34 23 30 42 48 33 42 50 60 49 63 29 12 96 12 44 42 43 31 26 37 27 23 23 29 25 29 13 7 31 11 22 29 87 16 13 35 32 46 27 36 38 40 43 29 42 37 8 5 107 34 10 76 29 29 56 25 18 27 32 30 23 15 35 30 30 29 5 9 27 19 17 10 77 7 112 31 47 33 23 41 25 23 28 21 22 32 77 30 56 12 36 106 6 20 38 127 33 33 46 16 33 47 31 32 17 49 93 8 26 40 42 52 9 37 15 9 38 38 30 7 30 35 35 28 40 17 27 51 55 28 214 43 21 76 56 21 27 24 9 33 36 39 33 31 39 22 57 41 10 6 7 17 18 47 17 5 50 33 36 50 27 41 30 36 36 48 28 33 18 19 10 16 6 6 34 154 34 23 47 11 32 46 30 22 55 31 24 62 7 10 29 51 15 17 43 13 34 16 21 27 23 35 49 26 29 42 16 35 24 50 14 19 161 35 6 7 31 42 61 7 25 30 34 41 40 38
FLORESTA B
a) b) c) d)
Descreva a forma da distribuio nas duas florestas. Qual floresta tem maior disperso no valor dos dimetros? Por que? Existe observaes extremas nesses conjuntos de dados? Quais? Que tipo de florestas so estas (nativa ou plantada)? Por que?
5-1
Introduo
Vimos que a informao contida num conjunto de dados pode ser resumida na forma de tabelas e grficos. Freqentemente, entretanto, necessitamos de um ndice que expresse a certa propriedade dos dados. Por exemplo, numa floresta cada rvore cresce num ritmo particular que depende do seu vigor e da situao ambiental em que est. Como poderamos representar o crescimento individual tpico das rvores da floresta ?
ESTATSTICAS . As Estatsticas so ndices numricos que representam propriedades especficas das variveis.
Medidas de Posio X1
A primeira propriedade de uma varivel que normalmente estamos interessados se refere a posies especficas na distribuio desta varivel.
Qual o significado dos valores de X1 e X2 na distribuio? Que locais da distribuio eles representam ?
X2
5-2
Mdia Aritmtica
A mdia aritmtica (ou simplesmente mdia) a medida de posio mais utilizada pois indica uma posio central nos dados. Nmero de brotaes por cepa de Eucalyptus grandis: 0, 2, 3, 1, 0, 1, 2, 2, 3, 1, 2, 3, 2, 1.
x=
O valor
PESOS
TRAVE
1.64
PONTO DE EQUILBRIO POSIO CENTRAL DA MDIA ARITMTICA
5-3
A mdia aritmtica nem sempre est no CENTRO Nmero de brotaes por cepa de Eucalyptus saligna: 0, 2, 3, 1, 0, 1, 2, 2, 3, 1, 2, 3, 2, 25.
x=
0 + 2 + 3+ 1+ 0 +1+ 2 + 2 + 3+ 1+ 2 + 3+ 2 + 25 = 336 . 14
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
3.36
Somatrios e suas Propriedades
A mdia obtida atravs do somatrio dos valores observados. Se X uma varivel quantitativa, ento, sua mdia ser:
x=
x1 + x 2 + x3 + x4 + x5 + ...+ xn
n
x
i =1
PROPRIEDADES :
x = x + x
i 1 i =1
+ x3 + x4 + x5 + ...+ xn
5-4
k = k + k + k + k + k + ...+
i =1
k = nk
n vzes
Somatrio de n observaes de k X:
kx = k x + k x
i 1 i =1
+ k x3 + k x4 + ...+ k xn =
n
= k (x 1 + x2 + x3 + x4 + ... + xn) = k xi
i =1
Somatrio de n observaes de (X - Y) :
( x y ) = ( x y ) + (x y ) + (x y ) + ...
i i 1 1 2 2 3 3 i =1
+ (xn yn) =
x y
i i =1 i =1
( x k ) = ( x k) + (x
i 1 i =1
= ( x1 + x 2 + x3 + ... + x n) ( k + k + k + ... + k) =
Somatrio de n observaes da varivel X (soma de quadrados):
2
x nk
i i =1
x
i =1
2 i
2 2 2 = x1 + x2 2 + x 3 + ... + x n
5-5
n xi = ( x1 + x2 + i =1 2 Somatrio de n observaes de (X - k) :
2 n n 2
x3 + ... + xn) 2
(x k ) = ( x
i =1 i i =1
2 i
2 xi k + k ) = x 2 k xi nk 2
2 i =1 2 i i=1
x y
i=1
i i
= x1y1 + x2 y2 + x3 y3+...+ xn yn
Somatrio de n observaes de k X:
Somatrio de n observaes de (X - Y) :
Somatrio de n observaes de (X - k) :
5-6
x=
i=1 k
f x f
i =1
i i i
f x + f x + f x +...+ f x n n = 11 2 2 3 3 f + f + f +...+ f
1 2 3 n
10 20 30 40 50 60 70 80
a a a a a a a a
20 30 40 50 60 70 80 90
cm cm cm cm cm cm cm cm TOTAL
D= D=
5-7
Mediana
M EDIANA Divide as observaes em dois grupos de igual tamanho, isto , 50% das observaes esto abaixo da mediana e 50% esto acima.
Dados em ordem: 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3,
Dados em ordem: 0, 0, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 25
Se n impar:
Exemplo: {19, 20, 23, 23, 24, 25, 32, 36, 39, 40, 41}
Se n par:
x MED =
5-8
Exemplo: {19, 20, 23, 23, 24, 25, 32, 36, 39, 40, 41, 44}
xMED =
x[6] + x[7]
2
25 + 32 2
= 28.5
Moda
M ODA o valor que ocorre com maior freqncia nas observaes de uma varivel. Nmero de Brotos 0 1 MOD Freqncia 2 4
Dados em ordem:
0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3.
2
3 TOTAL
5
3 14
Nas Variveis Categricas a moda a classe ou categoria de maior freqncia, sendo a Estatstica de posio mais apropriada para esse tipo de varivel. MODA
Tolerantes
TOTAL
25
41
5-9
Simtrica
QUARTIS Os Quartis so as posies na distribuio de uma varivel que a divide em quartos. PRIMEIRO QUARTIL (Q1): 25% das observaes so menores que ele. SEGUNDO QUARTIL (Q2): 50% das observaes esto abaixo dele (mediana). TERCEIRO QUARTIL (Q3): 75% das observaes esto abaixo dele.
5-10
25%
25%
25%
25%
xQ1
xQ2
xQ3
Embora possamos calcular os quartis diretamente a partir das observaes, mais prtico realizar o clculo a partir de dados agrupados (Tabela de Freqncia).
F F Q k 1 xQ = lk + fk
) a
FQ3 =
3n 4
5-11
Fk 1 = freqncia acumulada at a classe anterior classe quartil; f k = freqncia da classe quartil; a k = amplitude da classe quartil.
CLASSES QUARTIS
10 20 30 40 50 60 70 80
a a a a a a a a
20 30 40 50 60 70 80 90
cm cm cm cm cm cm cm cm TOTAL
Q1 Q2 Q3
F F Q1 0 xQ 1 = l1 + f1 xQ 2
) a
F F Q2 1 = l2 + f2 F F Q3 3 = l4 + f4
) a ) a
xQ 3
5-12
Percentis
PERCENTIS Os Percentis so uma generalizao dos Quartis. Na distribuio de uma varivel quantitativa, o percentil representa a posio abaixo da qual est uma dada porcentagem dos dados. Por exemplo: o percentil 13% o valor abaixo do qual esto 13% das observaes; o percentil 64.9% o valor abaixo do qual esto 64.9% das observaes; e assim por diante . . .
A frmula de clculo dos percentis (dados tabelados) anloga frmula dos quartis:
x P = percentil desejado;
( F Fk 1 ) x P = lk + P ak f k
k = classe percentil, isto , a classe que contm o percentil; lk = limite inferior da classe percentil; FP = ( P / 100)n = freqncia acumulada at o percentil, sendo P o percentual correspondente ao percentil: Fk 1 = freqncia acumulada at a classe anterior classe percentil; f k = freqncia da classe percentil; a k = amplitude da classe percentil.
Exemplo 5.D: Desbaste numa Floresta Plantada
Um Engenherio Floresta deseja fazer um desbaste numa floresta plantada, retirando 25% das rvores das menores rvores. Qual o dimetro abaixo do qual todas rvores sero removidas?
F25% =
25 196 = 49 100
CLASSE P ERCENTIL
5 10 15 20 25 30 35 40
a a a a a a a a
10 15 20 25 30 35 40 45
cm cm cm cm cm cm cm cm
P=25%
5-13
x25%
( F25% F2 ) = l3 + a 3 = f3
PARA REFLETIR Uma Engenheira Florestal deseja construir uma casa de madeira. Sua opo utilizar madeira tratada devido ao menor custo em relao madeira de essencias nativas. Ela consultou trs fornecedores de madeira, que apresentaram preos semelhantes, mas as garantias da vida til da madeira tratada foi bastante distinta: Fornecedor A: vida til mdia 25 anos. Fornecedor B: vida til mediana 25 anos. Fornecedor C: percentil 70% da vida til 25 anos. De qual fornecedor ela deve adquirir a madeira? Por que?
5-13
Medidas de Disperso
Uma Estatstica de disperso se refere variabilidade ou heterogeneidade dos dados. Nas duas distribuies (A e B) qual tem maior disperso ? Qual mais varivel.
x
Exemplo 5.E: Controle de Qualidade
GRAMATURA DO PAPEL PRODUZIDO EM DIFERENTES MQUINAS Uma Empresa de Papel realizou testes para comparar trs mquinas de produo de papel. Em cada mquina foram tomadas 5 amostras conforme a figura ao lado. Qual das mquinas a empresa deve adquirir? Por que? Amostra 1 2 3 4 5 Mdia A 200 210 190 215 185 200 Mquinas B 152 248 260 200 140 200
5-14
A = x MXIMO x MNIMO
DIQ = xQ 3 xQ1
Varincia
Ponto Especfico na Distribuio
Outra forma de se medir a variabilidade de uma varivel quantificando a disperso das observaes em relao a um ponto espefico na distribuio.
MDIA:
DESVIO:
(x
x)
ALTURA DE CEPAS DE Eucalyptus grandis Observae s 1 2 3 4 5 6 7 SOMA Desvio (10.1 - 12.21) = -2.11 (11.1 - 12.21) = -1.11 (10.7 - 12.21) = -1.51 (13.1 - 12.21) = 0.89 (14.5 - 12.21) = 2.29 (13.5 - 12.21) = 1.29 (12.5 - 12.21) = 0.29 0.03 Quadrado do Desvio (10.1 - 12.21)2 = 4.45 (11.1 - 12.21) 2 = 1.23 (10.7 - 12.21) 2 = 2.28 (13.1 - 12.21) 2 = 0.79 (14.5 - 12.21) 2 = 5.24 (13.5 - 12.21) 2 = 1.66 (12.5 - 12.21) 2 = 0.08 15.75
Melhor utilizar a SOMA DE QUADRADOS DOS DESVIOS que ser sempre positiva.
5-15
VARINCIA
SOMA DE QUADRADOS
2
s2 =
( x
n i =1
x)
SQ = ( xi x )
n i =1
n 1
Desvio Padro
Como as variveis que trabalhamos na Engenharia Florestal possuem UNIDADES DE MEDIDA, importante consider-las quando medimos a heterogeneidade dos dados. A varincia sempre elava ao quadrado as unidades de medida, gerando escalas sem sentido prtico Varivel Unidade de Medida cm kg m3/ha mg/cm3 ppm lb/pol2 kg/cm2 ano m2/ha Unidade da Varincia cm2 kg2 m6/ha2 mg2/cm6 ppm2 lb2/pol4 kg2/cm4 ano2 m4/ha2
altura de cepas peso seco de folhas produo de madeira concentrao de N concentrao de Z presso de pneu resistncia a compresso idade de corte rea basal
DESVIO PADRO
s = s2 =
( x x )
n i =1 i
n 1
mede a variabilidade independentemente do nmero de observaes (n) e com a mesma unidade de medida da mdia.
5-16
SQ = ( xi x )
n i =1
xi n i =1 = xi2 n i =1
n
SQ = f i ( xi x )
k i =1
VARINCIA
VARINCIA
s2 =
SQ n 1
2
s2 =
SQ k f i 1 i=1
DESVIO PADRO
DESVIO PADRO
s= s
s = s2
Mdia:
Soma de Quadrados:
Varincia:
Desvio Padro:
5-17
fi xi
17( 5) = 21( 7) = 35( 9) = 40(11) = 38(13) = 24(15) = 13(17) = 8(19) =
fi ( xi x )
17( 521( 735( 940(1138(1324(1513(178(19)= )= )= )= )= )= )= )= 17( 521( 735( 940(1138(1324(1513(178(19-
fi ( xi x ) 2
)2 = )2 = )2 = )2 = )2 = )2 = )2 = )2 =
Qual a varincia?
Coeficiente de Variao
COEFICIENTE DE VARIAO O Coeficiente de variao uma forma de se medir a variabilidade de uma varivel de modo independente da UNIDADE DE MEDIDA utilizada ou da ORDEM DE GRANDEZA dos dados. Razo entre desvio padro e mdia torna o CV um nmero puro
CV =
s 100 x
mede a variabilidade numa escala percentual, independe da unidade de medida ou da ordem de grandeza da varivel.
5-18
Mdia
26.4 m 3.3 m 26.8cm
Desvio Padro
8.66 m 1.76 m 9.07cm
CV (%)
32.8 53.2 33.8
x = 164 .
x = { 0, 2, 3, 1, 0, 1, 2, 2, 3, 1, 2, 3, 2, 1}
sX = 101 .
y=
y = { 5, 7, 8, 6, 5, 6, 7, 7, 8, 6, 7, 8, 7, 6}
sY =
W=X-1?
Z = 2X
z= sZ =
z = { 0, 4, 6, 2, 0, 2, 4, 4, 6, 2, 4, 6, 4, 2}
= -7X
5-19
TRANSFORMAO LINEAR
y = ax + b sY = a sX
desvio padro:
Padronizao
Faamos uma transformao expecial nos dados originais de nmero de brotos por cepa: Dados Originais (x )
0 2 3 1 0 1 2 2 3 1 2 3 2 1
MDIA DESVIO PADRO
xx
xx 1 = sX sX
x x + sX
ax + b
1.64 1.01
PADRONIZAO o processo de transformar uma varivel de modo que ela fique com mdia zero e desvio padro 1. Se X a varivel que desejamos padronizar, ento a VARIVEL PADRONIZADA ser:
xx sX
5-20
Conceitos-Chave
ESTATSTICAS - MEDIDAS DE POSIO - MDIA - SOMATRIOS - SOMA DOS QUADRADOS - QUADRADO DA SOMA MEDIANA - MODA - QUARTIS - PERCENTIS - MEDIDAS DE DISPERSO - AMPLITUDE DE VARIAO - DISTNCIA INTERQUARTIL - DESVIO - SOMA DE QUADRADOS - VARINCIA - DESVIO PADRO - COEFICIENTE DE VARIAO TRANSFORMAO LINEAR - PADRONIZAO
Leitura Essencial
[IEMMA, 1992] Cap. VI: p.87-103. Cap. VII: p109-119. Cap. VIII: p123-126.
Leituras Adicionais
[ROCHA, 1975] Cap. 9: p.69-89 (especialmente p87-88). Cap. 10: p90-94. [AZEVEDO & CAMPOS, 1987] Cap. 6: p.127-172..
Exerccios
5.1 Considere os seguintes dimetros (cm) das rvores de uma floresta de Pinus caribaea hondurensis.
21.8 23.9 27.7 21.8 12.3 10.8 16.0 11.5 35.5 19.3 12.7 16.3 32.2 21.4 33.0 17.5 22.3 16.4 15.1 28.8 24.9 18.2 13.2 17.0 18.2 27.3 10.8 21.7 13.2 20.3 26.4 9.4 18.0 14.5 28.0 9.0 10.7 19.4 20.1 17.6
b) Calcule a mediana. c) Encontre o primeiro e terceiro quartil. e) Calcule a varincia f) Calcule o desvio padro.
5.2 Considere a produo de madeira (m3/ha) de diferentes talhes de Eucalyptus camaldulensis aos 7 anos.
220 174 201 221 223 223 232 271 271 201 218 171 238 183 245 216 225 132 148 198 228 208 270 221 245 246 245 256 275 166 250 248 189 186 228 261 214 199 208 204 276 204 143 198 224 239 270 218 237 166
b) Calcule a mediana. c) Encontre o primeiro e terceiro quartil. e) Calcule a varincia f) Calcule o desvio padro.
5.3 Considere os seguintes dados de resistncia a compresso (kg/cm2) de amostras de madeira de Ocotea porosa (peroba).
5-21
b) Calcule a mediana. c) Encontre o primeiro e terceiro quartil. e) Calcule a varincia f) Calcule o desvio padro. h) Encontre o percentil 20%.
5.4 Um fornecedor de peas para estruturas de madeira recebeu um lote de peroba de onde foram retiradas as amostras do exerccio anterior. Para fins de venda das peas qual a resitncia compresso do lote inteiro que este vendedor anunciar: mdia, mediana, percentil 75% ou percentil 20% ? Por que ? 5.5 Uma srie de amostras de solo resultaram na seguinte distribuio para os valores de pH de um solo latossol vermelho-amarelo. Classes de pH Freqncia 4.6 - 5.0 7 5.0 - 5.4 14 5.4 - 5.8 23 5.8 - 6.2 32 6.2 - 6.6 19 6.6 - 7.0 8 7.0 - 7.2 2 Total 105 Encontre: a) a mdia b) a mediana c) o primeiro e terceiro quartil d) os percentis: 10%, 35%, 75%, 95% e) a varincia f) o desvio padro g) o coeficiente de variao.
5.6 A distribuio dos dimetros das rvores de uma floresta nativa segue a seguinte tabela: Classes de Dimetro (cm) 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 Total Freqncia 351 160 86 40 20 4 4 3 1 669
a) Qual o dimetro mdio e o dimetro mediano desta floresta? Qual dos dois maior? b) Qual o desvio padro dos dimetros desta floresta ?
5-22
c) Um Engenheiro Florestal deseja fazer um corte seletivo retirando 20% das maiores rvores. Qual o dimetro mnimo das rvores a serem removidas ? d) Uma Engenheira Florestal deseja fazer um corte seletivo retirando 40% das menores rvores. Qual o dimetro mnimo das rvores remanescentes? 5.7 A distribuio dos dimetros das rvores de uma floresta plantada segue a seguinte tabela: Classes de Dimetro (cm) 4 - 10 10 - 14 14 - 18 18 - 22 22 - 26 26 - 30 Total Freqncia 10 172 210 144 125 67 728
a) Qual o dimetro mdio e o dimetro mediano desta floresta? Qual dos dois maior? b) Qual o desvio padro dos dimetros desta floresta ? c) Um Engenheiro Florestal deseja fazer um corte seletivo retirando 20% das maiores rvores. Qual o dimetro mnimo das rvores a serem removidas ? d) Uma Engenheira Florestal deseja fazer um corte seletivo retirando 40% das menores rvores. Qual o dimetro mnimo das rvores remanescentes?
x
i =1
= 35;
y
i =1
= 57 ; n = 23 ; k = 8 .
b) y1 + y2 + y3 +...+ yn e)
h) k)
a) x1 + x2 + x3 +...+ xn d) g)
j)
c)
k
i =1 n 2
kx
i =1 n i =1 n
x
i =1 n i =1 n
2 i
f) xi i =1
n i
x y
i =1 i
i i
( x y )
i
i) l)
( x y )
i =1 i i
( x k )
( x k )
i =1 i
2 2 2 y12 + y2 + y3 +...+ yn
5.9 Com base nas propriedades dos somatrios, deduza a frmula prtica para clculo da Soma de Quadrados dos Desvios. 5.10 Com base nas propriedades dos somatrios, demonstre que a mdia da varivel Y = aX + b (transformao linear de X ) de fato y = ax + b , onde a e b so constantes e x a mdia da varivel X .
6-1
Mas ser que o censo sempre o melhor mtodo para obtermos informaes teis? TESTE:
Observe o pargrafo abaixo por 30 segundos e conte quantos s ocorrem. SEMPRE QUE SE FAZ AMOSTRAGEM DEVEMOS TER EM MENTE A REPRESENTATIVIDADE DAS OBSERVAES REALIZADAS. Ser que se chegou ao nmero certo? Tentemos novamente:
sempre que se faz amostragem devemos ter em mente a representatividade das observaes realizadas.
E agroa, se chegou ao nmero certo? Tentemos mais uma vez:
Sempre que Se faz amoStragem devemo S ter em mente a repreSentatividade daS obServaeS realizadaS.
6-2
Limitaes do Censo
Impossvel: no diagnstico e monitoramento de populaes extremante dinmicas. Impraticvel: custo e tempo de execuo em geral so excessivos.
Terminologia em Amostragem.
AMOSTRAGEM Consiste em observar parte da populao para se fazer inferncias (concluir algo) a respeito de toda a populao.
Alguns termos utilizados em amostragem so semelhante a termos utilizados no dia-a-dia, mas o significado destes termos bem preciso no caso de amostragem:
POPULAO: Conjunto completo de tens sobre os quais desejamos alguma informao. UNIDADE AMOSTRAL: Um tem individual da populao. AMOSTRA: Parte da populao que de fato utilizada para se obter a informao desejada. VARIVEL: A caracterstica de interesse que medida/observada em cada unidade amostral.
UNIDADE AMOSTRAL
POPULAO
6-3
AMOSTRA importante fazermos uma distino da informao (e todo resumo dela) que se obtem a partir da POPULAO e que se obtem a partir da AMOSTRA .
Populao
PARMETRO
Resumo numrico que se calcularia a partir da populao e que descreve uma caracterstica de interesse
Amostra
ESTATSTICA
6-4
6-5
Populao
PARMETRO
Amostra
ESTATSTICA
A minha opinio sobre como anda a administrao da cidade depende dos lugares onde vou e das ruas por onde passo. Ser que os lugares e ruas que conheo representam todos os lugares/ruas da cidade?
A minha noo da opinio pblica baseada na opinio das pessoas com que convivo. Ser que os meus conhecidos e amigos representam a populao brasileira?
AMOSTRAGEM DE CONVENINCIA
So observadas as unidades mais acessveis da populao . A seleo das unidades da amostra realizada segundo a convenincia.
No importa quo grande seja a amostra, amostragem de convenincia nunca ser totalmente representativa da populao.
6-6
VIS
Tendenciosidade presente no processo de amostragem que impede que a amostra seja perfeitamente representativa da populao, independentemente do tamanho da amostra.
VIS DE SELEAO Tendncia sistemtica de subrepresentar ou excluir da amostra um certo tipo de unidade. Ex .: Pesquisas de opinio por telefone. Exemplo 6.F: Voc decide!
VIS DE NO -RESPOSTA Numa pesquisa de opinio, o resultado de pessoas no responderem s questes do entrevistador. Ex .: Pesquisas de opinio pelo correio.
VIS DE RESPOSTA Numa pesquisa de opinio, a forma de apresentao das questes so e a atitude do entrevistador podem influenciar a resposta. Ex .: Ordem do nome dos candidados numa pesquisa de intenso de voto.
Pesquisa cientfica mostra que o uso do cinto de segurana na cidade reduz o nmero de acidentes com acidentados graves. Se voc for a favor do uso do cinto de segurana na cidade ligue para 0-800-552-4949, se for contra ligue para 0-800-552-4950, ligao gratuita. Enumere as razes pelas quais esta pesquisa de opinio certamente enviesada.
Estudando a influncia do sistema de amostragem no estrutura de tamanho das rvores de uma floresta tropical, um Ecologista tomou 10 Amostras compostas de 5 rvores, 10 amostras compostas de 20 rvores e 10 amostras compostas de 40 rvores (tabela ao lado). Qual o efeito do tamanho da amostra (nmero de rvores) no resultado nos resultados obtidos?
Amostras
1 2 3 4 5 6 7 8 9 10
Tamanho das Amostras (nmero de rvores) 5 20 40 26.6 34.1 30.5 32.9 31.2 29.8 39.2 40.1 37.3 30.3 30.4 29.4 31.8 29.7 32.7 48.0 38.8 31.5 37.7 37.3 29.3 20.0 35.6 30.6 31.8 37.7 31.2 33.2 26.7 29.3
6-7
Para um mesmo tamanho de amostra, sistemas diferentes de amostragem podem resultar em preciso diferente.
Amostras de maior tamanho sempre produzem Estatsticas com menor variabilidade entre amostras. Amostras maiores so sempre mais precisas .
PRECISO
Capacidade dos sistemas de amostragem de gerar Estatsticas com pequena variabilidade entre amostras (de mesmo tamanho) tomadas numa mesma populao.
x x x x x x x xx xx xxx
x x xx x xxx x x x xxx
6-8
Uma equipe de cientstas deseja monitorar as mudanas ecolgicas numa floresta aps a fragmentao desta devido a converso da rea floresta para rea agrcola. A equipe se encontra dividida entre duas alternativas de amostragem: Monitorar um grande nmero de fragmentos que sejam de fcil acesso e que representem o atual estado da regio. Monitorar um nmero pequeno de fragmentos que sejam uma amostra representativa da floresta original, independentemente da facilidade de acesso. Quais as vantagens e desvantagens das duas alternativas?
6-8
Mtodos de Amostragem
Existe vrios Mtodos de Amostragem utilizados nas Cincias Florestais. Todos tm como objetivo gerar informaes sem vis e com a maior preciso possvel. Mtodos de Amostragem utilizados nas Cincias Florestais.
Todas unidades da populao possuem uma certa chance de serem selecionadas na amostra. Esta chance conhecida e diferente de zero.
Para estes mtodos seremos capazes de calcular a preciso de uma dada estatstica para representar o parmetro da populao.
M TODOS DE AMOSTRAGEM: Amostragem Aleatria Simples Amostragem Aleatria Estratificada Amostragem Sistemtica Amostragem em Mltiplos Estgios
O PROCESSO ALEATRIO de seleo das unidades elimina qualquer interferncia de escolha humana na escolha dos elementos da amostra.
6-9
Uma urna contendo os nmeros: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Antes de cada sorteio, os nmeros so mixturados na urna. Ao sortear um nmero ele pode: * ficar em separado ==> Amostragem Sem Reposio; * retornar urna ==> Amostragem Com Reposio.
LME 216 - INTRODUO BIOESTATSTICA FLORESTAL B) Selecionar uma amostra de tamanho n: 1. Iniciar num ponto aleatrio da Tabela de Nmeros Aleatrios. 2. Ler os rtulos sistematicamente seguindo as linhas ou colunas da Tabela. 3. Se um rtulo j lido surgir novamente ou se aparecer um rtulo que no est presente na populao, ignor-lo e seguir para o prximo. 4. Continuar at que n unidades sejam selecionadas.
6-10
6-11
Quando o tamanho da populao muito pequeno em relao ao nmero de rtulos, muito tempo gasto saltando rtulos que no so teis. Para evitar isto podemos utilizar o seguinte procedimento: Selecionar uma amostra de tamanho n quando o nmero de rtulos muito maior que o tamanho da populao (N): 1. Iniciar num ponto aleatrio da Tabela de Nmeros Aleatrios. 2. Ler os rtulos sistematicamente seguindo as linhas ou colunas da Tabela. 3. Se um rtulo j lido surgir, ignor-lo e seguir para o prximo. 4. Se aparecer um rtulo maior que o maior rtulo utilizado, dividir o rtulo que surgiu por N e tomar o resto da diviso como rtulo . 5. Continuar at que n unidades sejam selecionadas.
6-12
AMOSTRAGEM ALEATRIA ESTRATIFICADA (AAE) A populao sub-divida em grupos mutuamente exclusivos chamados ESTRATOS . Uma ASS tomada dentro de cada estrato, e as estimativas dos estrato so combinadas. Como os grupos so mutuamente exclusivos, cada unidade da populao pertence a um nico estrato. Se os estratos forem internamente mais homogneos que a populao em termos da varivel sendo medida, a AAE ser mais precisa que a ASS.
6-13
Estrato A 30 ha V = 50 m3/ha
A) Realize 2 AAS de tamanho 6 com base na rea total da floresta (100ha). Qual a varincia das estimativas da produo mdia (m3/ha)?
B) Realize 2 AAE de tamanho 6 (duas unidades por estrato). Como a mdia da AAE calculada?
Qual a varincia das estimativas da produo mdia (m3/ha)? CCULO DA M DIA NA AAE
N1 N2 Nk 1k x = x1 + x2 +...+ xk = N i xi N N N N i =1 x a mdia da AAE xi a mdia estimada para o estrato i. N o tamanho da populao (nmero total de unidades) Amostragem N Sistemtica (AS) i o tamanho do estrato i (nmero de unidades no estrato k)
LME 216 - INTRODUO BIOESTATSTICA FLORESTAL A amostragem sistemtica uma maneira mais prtica de selecionar as unidades de uma populao. AMOSTRAGEM SISTEMTICA Inicialmente, as unidades da populao so colocadas numa certa ordem.. Para uma amostra sistemtica de 1-em-cada-k-unidades, voc primeiro seleciona aleatoriamente uma das k primeiras unidades. A partir da unidade selecionada toma-se sempre a k-sima unidade. NOTE: somente a primeira unidade selecionada aleatoriamente, todas as demais so tomadas sistematicamente.
6-14
R 18
S 19
6-15
6-16
Conceitos-Chave
CENSU - AMOSTRAGEM - POPULAO - UNIDADE AMOSTRAL - AMOSTRA - VARIVEL - PARMETRO ESTATSTICA - AMOSTRAGEM DE CONVENINCIA - VIS - VIS DE SELEO - VIS DE NO-RESPOSTA - VIS DE RESPOSTA - PRECISO - MTODOS DE AMOSTRAGEM - AMOSTRAGEM ALEATRIA SIMPLES - PROCESSO ALEATRIO - TABELA DE NMEROS ALEATRIOS - AMOSTRAGEM ALEATRIA ESTRATIFICADA AMOSTRAGEM SISTEMTICA - AMOSTRAGEM EM MLTIPLOS ESTGIOS
Leitura Essencial
[OLIVEIRA, 1977] p.39-43.
Exerccios
6.1 O Diretor deseja saber a opinio do corpo discente sobre uma nova proposta de procedimento de matrcula. Para obter a informao rapidamente decidiu-se por amostragem. a) Qual a populao? b) Quais so as unidades amostrais? c) Qual a varivel? d) Qual mtodo de amostragem deve ser utilizado? Explique. 6.2 Uma empresa florestal pretende definir o nvel de infestao de formigas nas suas florestas. a) Qual a populao? b) Quais so as unidades amostrais? c) Qual a varivel? d) Qual mtodo de amostragem deve ser utilizado? Explique. 6.3 Um candidato a governador do Estado deseja saber suas chances de vencer na prxima eleio e encomendou uma pesquisa de intenso de voto. a) Qual a populao? b) Quais so as unidades amostrais? c) Qual a varivel? d) Qual mtodo de amostragem deve ser utilizado? Explique. 6.4 Uma Engenheira Florestal realizou um estudo sobre o vandalismo nas trilhas de um Parque Nacional. Nesse estudo ela se aproximava anonimamente a grupos de pessoas caminhando nos fins-de-semana e fazia a caminhada com o grupo observando-os. Existe algum tipo de vis neste estudo? Qual? Explique. 6.5 Num estudo de ciclagem de nutrientes, o pequisador deseja saber o teor mdio de fsforo na serrapilheira de uma floresta. Para isso ele seleciona pequenas reas de 1m2 distantes 3 metros da trilha utilizada adentrar na floresta. Em cada rea de 1m2, toda serrapilheira removida e levada ao laboratrio para anlise. Existe algum tipo de vis neste estudo? Qual? Explique. 6.6 Num levantamento da avifauna do sub-bosque de uma mata seca no Estado de Mato Grosso, um pesquisador utiliza um gravador de alta sensibilidade para gravar o canto dos pssaros. Posteriormente, as fitas so analisadas em laboratrio para identificao das espcies. Existe algum tipo de vis neste levantamento? Qual? Explique. 6.7 A Empresa Abril Cultura e Revista Playboy realiza anualmente o ranking das melhores escolas de Engenharia Florestal. O ranking se baseia num formulrio enviado a uma amostra aleatria de profissionais formados que so
LME 216 - INTRODUO BIOESTATSTICA FLORESTAL convidados a classificar a escola onde se formaram. Existe algum tipo de vis neste levantamento? Qual? Explique. 6.8 A tabela abaixo mostra a produo por parcelas de 1ha de uma floresta de Eucalyptus grandis.
6-17
a) Realize 5 AAS de tamanho 8. Em cada amostra estime a produo mdia da floresta. b) Realize 5 AAE de tamanho 8 (2 unidades/estrato). Em cada amostra estime a produo mdia da floresta. c) Compare a variao das estimativas obtidas pela AAS e pela AAE, em torno do valor do parmetro. Qual dos mtodos apresenta maior preciso. Explique. Idade (anos) 3 Parcela (1ha) 1 2 3 4 5 6 1 2 3 4 5 1 2 3 1 2 3 4 5 Produo (m3/ha) 50 55 56 67 48 69 150 148 120 160 130 250 210 205 310 280 300 320 340
6.9 Um Engenheiro Florestal deseja realizar uma AAS de tamanho 3 no talho da figura abaixo. Cada unidade amostral consiste de uma parcela de 20 x 30 m (600m2). Realize essa amostragem. Explique detalhadamente o processo utilizado. TALHO C A R R E A D O R C A R R E A D O R
500m
6-18
ESTRADA 6.10 A base na tabela abaixo apresenta o dimetro (cm) de uma populao de 200 rvores. a) Calcule o dimetro mdio da populao. 1000m b) Realize 5 amostras aleatrias simples de tamanho 10. Para cada amostra estime a mdia da populao. Analise a distribuio das mdias e sua relao com a mdia da populao. c) Realize 5 amostras sistemticas de tamanho 10. Para cada amostra estime a mdia da populao. Analise a distribuio das mdias e sua relao com a mdia da populao. d) Existe alguma diferena entre a distribuio das estimativas obtidas por AAS e por AS? Explique.
Linhas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 16.0 83.7 11.9 20.3 38.9 22.4 21.9 35.7 56.5 12.3 26.5 58.3 14.7 15.5 25.8 33.4 19.6 15.3 25.7 25.3 2 54.7 10.8 49.8 20.6 21.7 21.2 30.2 41.3 21.6 23.1 117.8 34.3 10.3 19.8 21.7 75.4 92.4 20.8 16.9 10.3 3 27.7 17.6 15.5 48.3 12.6 14.9 14.6 13.0 17.1 34.2 14.7 15.6 15.3 14.6 62.2 20.2 12.7 14.3 15.2 17.4 4 29.2 31.6 22.5 26.0 52.9 20.0 37.0 11.4 27.3 13.6 15.4 11.0 27.0 50.0 94.5 11.8 20.6 30.3 10.7 38.5 Colunas 5 6 10.7 38.9 27.9 20.1 17.6 36.7 76.4 56.0 24.6 39.7 12.2 27.7 24.3 10.5 16.6 31.2 13.5 13.6 34.3 91.7 25.9 12.9 24.8 11.6 18.2 59.1 10.2 24.6 116.7 23.5 16.7 49.4 14.9 10.7 25.8 17.5 10.6 19.1 16.4 48.8
7 24.3 36.8 56.1 18.5 12.1 28.2 15.1 14.3 37.3 81.1 123.2 22.9 129.0 20.0 96.7 29.2 10.1 10.2 24.8 16.8
8 38.2 39.8 15.8 44.8 34.4 43.3 18.0 38.2 18.3 39.6 16.8 12.7 16.7 10.9 10.4 26.7 15.6 25.8 12.8 30.1
9 11.8 11.6 28.8 37.3 70.4 40.7 16.2 11.2 39.4 15.6 20.1 19.2 12.9 16.9 68.7 27.5 14.2 12.3 21.5 17.1
10 24.0 22.6 20.9 51.7 42.8 43.4 16.1 30.3 22.0 54.5 30.1 42.2 23.9 11.0 15.8 32.1 26.2 61.3 16.5 42.4
7-1
3. Agrupe os nmeros de acordo com planejamento do casal para simular as diferentes possibilidades de filhos. Numere cada simulao como uma famlia:
1 M 1 2 F 1 7 M 2 0 F 2 3 M 3 7 M 3 1 M 3 4 F 3 5 M 4 6 F 4 3 M 5 5 M 5 0 F 5 6 F 6 2 F 7 7 M 8 2 F 8 1 M 9 5 M 9 9 M 9
No exemplo acima, a simulao gerou 9 famlias. 4. Calcule a probabilidade do casal ter uma filha: 9/9 = 1.
Ser que a probabilidade de 100% ? Ser que se selecionarmos um outro conjunto de 20 nmeros aleatrios obteremos a mesma probabilidade?
Repetindo a simulao com vrios grupos:
Grupo No. de Famlias No. de Famlias c/ Filhas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Total
Probabilidade por simulao = Total de Famlias / Total de Famlias c/ Filhas = ______/______ = __________ Probabilidade exata = 0.938
LME 216 - INTRODUO BIOESTATSTICA FLORESTAL Num jogo semelhante Loteria Federal um jogador comprou o bilhete 123456. Este jogador receber: R$ 50000,00 R$ 5000,00 R$ 500,00 R$ 50,00 se o se o se o se o bilhete sorteado for bilhete sorteado for bilhete sorteado for bilhete sorteado for 123456 X23456 XX3456 XXX456
7-2
(X representa qualquer dgito sorteado no correspondente ao bilhete). 1. Elabore um sistema para simular uma rodada da loteria utilizando a tabela de nmeros aleatrios. 2. Simule 5 rodadas da loteria e anote os nmeros sorteados. 3. Em quantas rodadas o bilhete 123456 foi sorteado? Qual o valor dos prmios? 4. Junte o resultado de suas simulaes com o de outros alunos da sala:
Aluno No. de rodadas No. de rodadas c/ o bilhete sorteado 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Total
5. Com base nas simulaes de todos os alunos, qual a probabilidade do bilhete 123456 ser sorteado?
2. Quantos destes bilhetes pagaro algum prmio? R$ 50000,00 R$ 5000,00 R$ 500,00 R$ 50,00
1 9 9 x 9 = 81 9 x 9 x 9 = 729
7-3
Nmero resultante do lanamento de um dado. Os nmeros numa tabela de nmeros aleatrios. EXPERIMENTO ALEATRIO Processo estocstico (aleatrio) em que o resultado final incerto devido ao prprio processo. O nmero de rvores com cancro numa parcela de floresta de eucalipto. As produtividades de diferentes reas de floresta de Pinus que receberam adubao.. As espcies de aves que so capturadas numa rede-neblina armada no sub-bosque de uma floresta nativa
ESPAO AMOSTRAL ( S ) Conjunto de todos os resultados possveis de um experimento aleatrio. Alguns experimentos aleatrios podem ter um nmero infinito de resultados, por hora veremos experimentos apenas com um nmero contvel de resultados.
S=
Se no lanamento de 3 moedas justas, definirmos o resultado como o nmero de caras, o espao amostral fica:
S = { 0, 1, 2, 3 }
7-4
O espao amostral no precisa ser necessariamente um conjunto de nmeros, mas um sistema de cdigos deve ser estabelecido quando os resultados no so numricos. Dois aspectos fundamentais na representao do
ESPAO AMOSTRAL
A definio do que representa um resultado do experimento aleatrio fundamental na definio do espao amostral.
S={
Lanamento de dois dados:
S={ ( , ) ( , ) ( , ) ( , ) ( , ) ( , )
( ( ( ( ( , , , , , ) ) ) ) ) ( ( ( ( ( , , , , , ) ) ) ) ) ( ( ( ( ( , , , , , ) ) ) ) ) ( ( ( ( ( , , , , , ) ) ) ) ) ( ( ( ( ( , , , , , ) ) ) ) ) ( ( ( ( ( , , , , , ) ) ) ) )
No lanamento de dois dados o resultado definido como a soma dos nmeros obtidos:
S={
Um conjunto de 10 rvores, selecionadas aleatriamente, tomado numa floresta de Eucalyptus urophylla . O resultado definido como o nmero de rvores bifurcadas.
S={
Um estudante de Bioestatstica Florestal selecionado aleatoriamente. O resultado definido como o nmero de horas que o estudante dedicou Bioestatstica nas ltimas 24 horas.
S={
Uma parcela de 1ha locada aleatoriamente numa floresta nativa. O resultado definido como o nmero de rvores na parcela.
S={
Um aluno da ESALQ selecionado ao acaso. O resultado definido como o nmero de crditos que este aluno est cursando no atual semestre.
S={
Um aluno da ESALQ selecionado ao acaso. O resultado definido como o nmero de crditos necessrios para este aluno se graduar.
7-5
S={ Evento
EVENTO Eventos so sub-conjuntos do espao amostral e so geralmente representados por letras maisculas, como A, B, C, ...
Eventos possveis : O resultado um nmero impar: A = { 1, 3, 5 } O resultado menor do que 5: B = { 1, 2, 3, 4 } O resultado um nmero primo: C = { 1, 2, 3, 5 }
Se um dado lanado e o resultado um elemento de A, dizemos que o evento A ocorre . Se o resultado no for um elemento de A, dizemos que o evento A no ocorre .
Conceito de Probabilidade
O termos probabilidade utilizado com diferentes sentidos na linguagem do dia-a-dia: A previso do tempo indica 70% de probabilidade de chuvas no prximo fim-de-semana. O jogador sente que esta noite as chances de levar uma grande bolada na roleta so altas. Ao jogar uma moeda justa, a chance de coroa de 1/2. Se uma pessoa sofreu um acidente fatal, as chances de que este acidente ocorreu em casa so de 10.5%. das pessoas consideram o elogio do chefe como um importante componente na satisfao profissional. O sexismo latino-americano est comprovado: o nvel de analfabetismo na Amrica Latina de 17% entre mulheres e de 14% entre homens. Apesar das mulheres comporem aproximadamente 50% da poplao eleitoral na Europa, apenas 11% dos cargos eletivos eram ocupados por mulheres em 1995.
7-6
As pessoas expressam julgamento subjetivo de possibilidades na forma percentual ou probabilidade. Embora apresentado de forma quantitativa, o conceito subjetivo no deve ser confundido com o conceito de probabilidade utilizado na Bioestatstica. Alguns mtodos de gerenciamento, incorporam o conceito subjetivo de probabilidade sem, entretanto, eliminar o seu aspecto subjetivo.
CONCEITO SUBJETIVO
Pelo conceito clssico a probabilidade definida com base em dados do experimento aleatrio. A probabilidade obtida antes que do experimento ser realizado e, portanto, o nome a priori. CONCEITO CLSSICO OU A PRIORI O conceito clssico surgiu no sculo XVII a partir dos jogos de azar e define a probabilidade do evento A como sendo:
P( A) =
TAMANHO DO EVENTO
A S
Mas como podemos calcular as probabilidades a priori nas seguintes situaes: Uma pessoa que fuma um pacote de cigarros por dia desenvolver cancer. Ocorrer uma geada no prximo inverno. Haver uma exploso na populao de desfolhadores presente numa floresta de eucalipto. Encontrar um rvore de mogno num parcela de 1ha numa floresta nativa. A produo mdia de uma floresta superar 400m3/ha.
7-7
A probabilidade dos eventos definida com base em registros da ocorrncia dos eventos.
A nica forma de se conhecer as intenses de voto da populao brasileira entrevistando uma amostra dela. impossvel saber a opinio das pessoas a priori. Numa floresta nativa ou plantada, as nicas informaes que dispomos so provenientes de levantamentos (amostras).
Os experimentos aleatrios passam a ser ensaios conduzidos repetidamente em condies relativamente uniformes, da o nome de probabilidade a posteriori.
A probabilidade de um evento definida como a freqncia relativa de ocorrncia do evento num srie de ensaios ou simulaes, da o nome frequentista.
Axiomas de Probabilidade
Axioma I
Independentemente do conceito utilizado, clssico ou freqntista, o modelo de probabilidade em Bioestatstica ter sempre uma COERNCIA INTERNA que resulta dos AXIOMAS de probabilidade:
0 P ( A) 1
Axioma II
P (S ) = 1 P () = 0
CONCEITO CLSSICO
P(A) = Tamanho A / Tamanho S P(A) tem que ser necessariametne um nmero entre 0 e 1.
7-8
CONCEITO FREQENTISTA
Diagramas de Venn
Os diagramas de Venn so utilizados para se visualizar os conceitos de bsicos de probabilidade.
S A a B
. . .
b c
a, b, c = resultados
A, B = eventos
S = espao amostral
UNIO DE 2 EVENTOS
7-9
AB
INTERSECO DE 2 EVENTOS
AB
7-10
AB= A
SUB-CONJUNTOS :
B A
BI A= B BU A = A
AB
A B
COMPLEMENTO:
AC AC U A = S
7-11
A AC = S AC
7-11
P( A U B) = P( A) + P( B) P ( A I B)
P( A) = 18 / 36 18 + 11 6 23 P( B) = 11 / 36 P( A U B) = = 36 36 P( A I B) = 6 / 36
7-12
A e B disjuntos A I B = P( A I B) = 0 P( A U B) = P( A) + P( B)
P( A) = 15 / 36 15 6 21 P( B) = 6 / 36 P( A U B) = + = 36 36 36 P( A I B) = 0
Desigualdade de Boole
REGRA 2: PROBABILIDADE DA DE UMA SEQNCIA DE EVENTOS DISJUNTOS Se
Ai ) = P ( Ai )
i =1
A1 , A2 , A3 ,..., An , P (U
n i= 1
Ai ) P ( Ai )
i =1
LME 216 - INTRODUO BIOESTATSTICA FLORESTAL Numa floresta de Eucalyptus grandis, foram coletadas amostras de folhas de 100 rvores (selecionadas aleatoriamente) para anlise foliar. A anlise revelou deficincia de alguns nutrientes. Qual a probabilidade de uma rvore selecionada aleatoriamente nesta floresta estar com deficincia de macro-nutrientes?
7-13
Nutrientes
Macro
Micro
N P K B Zn Mn
A Desigualdade de Boole implica que a probabilidade de no mximo 60%, isto , que no mnimo 40% das rvores no tem deficincia de macro-nutrientes.
Probabilidade do Complemento
No lanamento de duas moedas temos: A = pelo menos uma cara, B = duas coroas. Qual a probabilidade duas coroas ou pelo menos uma cara ? Moeda 1 C K Moeda 2 C K CC CK KC KK
P( A) = 3 / 4 3 1 4 P( B ) = 1 / 4 P( A U B) = + = = 1 4 4 4 P( A I B) = 0
A e B so complementares P( A) + P( B) = P( S ) = 1
P ( S ) = P ( A) + P ( A C ) = 1 P ( A) = 1 P( AC )
Exemplo 7.I: Lanamento de Um Dado Um dado lanado 10 vzes, qual a probabilidade de A = pelo menos um 6?
5 5 5 5 5 5 5 5 5 5 510 9765625 A = nenhum 6= = 10 = = 01615 . 6 6 6 6 6 6 6 6 6 6 6 60466175
C
7-14
Probabilidade Condicional
A ocorrncia de um evento altera a probabilidade de ocorrncia de outro evento PROBABILIDADE CONDICIONAL
No estabelece relao de causa-efeito entre os eventos, simplesmente relaciona as probabilidades dos eventos ocorrerem.
P( A) =
30 3 = 50 5
TOTAL 30 20 50
P( B) =
32 16 = 50 25 NOTAO
Se o aluno selecionado for do 1o. grau, qual a probabilidade dele preferir atividades artsticas?
27 9 = 30 10
Se o aluno preferir atividades artsticas, qual a probabilidade dele ser do 1o. grau?
27 32
P( A I B) P( B) P( A I B) P( B| A) = P( A) P( A| B) =
7-15
A dado B = aluno do primeiro grau dado que o aluno prefere atividades artsticas P( A I B ) 27 / 50 27 P( A| B) = = = P( B) 16 / 25 32 B dado A = aluno prefere atividades artsticas dado que o aluno do primeiro grau P( A I B) 27 / 50 27 9 P ( B| A) = = = = P( A) 3/5 30 10
P ( B| A) =
Qual a probabilidade de vencer a primeira concorrncia dado que ela vence a segunda?
7-16
P ( A| B) =
A probabilidade condicional nos permite calcular diretamente a probabilidade da interseco de dois eventos.
P( A I B) P( A I B) = P ( B| A) P ( A) P( A) P( A I B) P ( A| B) = P( A I B) = P ( A| B) P ( B ) P( B) P ( B| A) =
P( A I B) = P( A| B) P( B) = P( B| A) P( A)
P( A I B) = P( B| A) P( A) = (0.5)(0.6) = 030 .
Qual a proporo da populao que qualificaria para um emprego de embaladora (mulher no fumante)? A = mulher: P ( A) = 0.4 B = mulher no fumante: P ( B| A) = 0.8
P( A I B) = P( B| A) P( A) = ( 0.4)( 08 . ) = 0.32
7-17
Independncia de Eventos
quando:
P( A| B) = P( A) P( B| A) = P( B)
P( B| A) =
Os eventos A e B no so independentes.
2 1 2 = P( B) = 4 2 5
Se bolas forem retiradas com reposio qual probabilidade de B dado A ? Se A ocorreu, mas a bola preta retornou a urna, a configurao da urna permanece 2 brancas e 3 pretas, logo
P( B| A) =
Os eventos A e B so independentes.
2 2 = P( B) = 5 5
7-18
P( A I B) = P( A) P( B)
Exemplo 7.N: Cruzamento Aleatrio
Uma certa planta anual, possui um gene com dois alelos: o dominante (A) e o recessivo (a). Como cada indivduo possui dois alelos, os gentipos possveis numa populao so AA, Aa e aa. Numa dada populao, as propores destes gentipos so: 1/2, 1/4 e 1/4, respectivamente. Assumindo que os indivduos desta populao se cruzem de modo totalmente aleatrio, quais as propores dos gentipos na prxima gerao? Gentipo Criao dos Gametas pelos Gentipos A => (1/2) * (1/2) = 1/4 A => (1/2) * (1/2) = 1/4 A => (1/4) * (1/2) = 1/8 a => (1/4) * (1/2) = 1/8 a => (1/4) * (1/2) = 1/8 a => (1/4) * (1/2) = 1/8 Proporao de Gametas A => 5/8 Gentipos na Prxima Gerao AA => (5/8)*(5/8) = 25/8 Aa => 2*(5/8)*(3/8) = 30/8 a => 3/8 aa => (3/8)*(3/8) = 9/8
AA Aa aa
P ( Ai ) =
1 23750
P ( Bi ) =
4658 170000000
Concluso o fenmeno ( Ai I Bi ) extremamente raro!! Concluso 1 vez a cada 5 dias o fenmeno ( Ai I Bi ) ocorre!!
Mas a populao grande, ser que a ocorrncia simultnea ainda rara na populao?
7-19
Conceitos-Chave
SIMULAO - EXPERIMENTO ALEATRIO - ESPAO AMOSTRAL - EVENTO - CONCEITO CLSSICO DE PROBABILIDADE - PROBABILIDADE A PRIORI - CONCEITO FREQENTISTA DE PROBABILIDADE - PROBABILIDADE A POSTERIORI - AXIOMAS DE PROBABILIDADE - DIAGRAMS DE VENN - UNIO DE EVENTOS - INTERSECO DE EVENTOS - EVENTOS DISJUNTOS - EVENTOS MUTUAMENTE EXCLUSIVOS - SUB-CONJUNTOS - COMPLEMENTO PROBABILIDADE DA UNIO - PROBABILIDADE DA SEQNCIA DE EVENTOS DISJUNTOS - DESIGUALDADE DE BOOLE - PROBABILIDADE DO COMPLEMENTO - PROBABILIDADE CONDICIONAL - PROBABILIDADE DA INTERSECO EVENTOS INDEPENDENTES - PROBABILIDADE DA INTERSECO DE EVENTOS INDEPENDENTES
Exerccios
7.1 Numa floresta nativa a taxa de ocorrncia de espcies arbreas pioneiras de 20%. Atravs de simulaes (utilizando a tabela de nmeros aleatrios), estime a probabilidade de numa amostra aleatria de 10 rvores se encontrar no mnimo trs rvores de espcies pioneiras. 7.2 Esquematize um processo de simulao (utilizando nmeros aleatrios) para a amostragem de rvores numa floresta nativa onde: 10% das rvores so de espcies pioneiras; 20% das rvores so de espcies secundrias iniciais; 30% das rvores so de espcies secundrias tardias; 40% das rvores so de espcies primrias. O objetivo simular uma amostra aleatria de 20 rvores desta floresta. 7.3 Uma urna contm trs bolas: uma azul (A), uma verde (V) e uma rosa (R). Duas bolas so selecionadas aleatoriamente da urna. O resultado representado pela combinao da letra das cores, por exemplo, se as bolas selecionadas forem a azul e a verde o resultado (A,V). Represente o espao amostral para este experimento nas seguintes situaes: a) Amostragem com reposio onde a ordem importante; b) Amostragem com reposio onde a ordem no importante; c) Amostragem sem reposio onde a ordem importante; d) Amostragem sem reposio onde a ordem no importante. 7.4 Num levantamento da avifauna, as aves foram classificadas segundo a sua dieta preferencial em insentvoras (I) e frugvoras (F). a) Represente o espao amostral para uma amostra de trs aves; b) Represente o evento A = pelo menos uma ave frugvora; c) Represente o evento B = exatamente duas aves so frugvoras. 7.5 Considere com experimento aleatrio o lanamento de dois dados balanceados. a) Represente o espao amostral; b) Represente o evento A = exatamente 1 dado trs; c) Represente o evento B = exatamente 2 dados so trs; d) Represente o evento C = pelo menos um dos dados trs; e) Represente o evento D = a soma dos dados seis. 7.6 Considere com experimento aleatrio o lanamento de dois dados justo. Calcule a probabilidade dos seguintes eventos:
LME 216 - INTRODUO BIOESTATSTICA FLORESTAL A. B. C. D. E. = nenhum trs; = exatamente um trs; = exatamente dois trs; = pelo menos um trs; Compare 1 - P(A) com P(D).
7-20
7.7 Num levantamento em floresta de Pinus oocarpa, foram observadas 830 rvores, segundo a tabela abaixo. Os defeitos so excludentes, isto , cada rvore foi classificada em apenas uma das quatro classes de defeito. Classes de Defeito do Tronco Tortas Rabo-de-raposa 91 78 74 76 165 154
Bifurcada 24 36 60
Considere os seguintes eventos: A. = rvore jovem; B. = rvore madura; C. = rvore bifurcada; D. = rvore torta; E. = rvore com rabo-de-raposa; F. = rvore jovem e bifurcada; G. = rvore madura e torta; H. = rvore jovem sem defeitos. Estabelea a relao entre os seguintes eventos: a) A e B; b) A e G; c) C e F; d) D e E; e) B ! D e G; f) A !(C " D " E) e H. 7.8 Considerando as informaes do exerccio anterior calcule as seguintes probabilidades: a) P(A " C) b) P(B " E) c) P(D " F) d) P(C " G ) e) P(B " H ) f) P(C " D " E) g) P(A !(C " D " E)) 7.9 Uma indstrias de mveis de Pinus fez um levantamento no ptio de secagem para analisar a incidncia de defeitos nas peas de madeira secas ao ar. Todos os defeitos de cada pea amostrada (amostra aleatria em 3 lotes) foram anotados, isto , uma mesma pea pode ter mais de um defeito. O resultado encontrado foi. Defeitos Freqncia Relativa Lote 1 Lote 2 Lote 3
LME 216 - INTRODUO BIOESTATSTICA FLORESTAL Manchamento Empenamento Longitudinal Empenamento Transversal Ns Mortos Perfurao por Brocas Rachaduras de Topo Madeira Juvenil 0.23 0.07 0.09 0.01 0.02 0.17 0.08 0.19 0.03 0.03 0.02 0.05 0.20 0.08 0.35 0.12 0.10 0.05 0.20 0.25 0.17
7-21
a) Qual a proporo de peas em cada lote que apresentam defeitos de empenhamento ? Por que? b) Qual dos lotes est em melhores condies, isto , apresenta a menor proporo defeituosa ? Por que? 7.10 Um estudo do coportamento social de capivaras produziu o seguinte resultado: Comportamento Agressivo No Agressivo 22 5 20 12 42 17
Total 27 32 59
Se um animal for selecionada aleatoriamente deste grupo: a) Qual a probabilidade deste animal estar num ambiente restrito? b) Qual a probabilidade deste animal ter um comportamento agressivo? c) Se este animal est num ambiente restrito, qual a probabilidade dele ter um comportamento agressivo? d) Se este animal est num ambiente restrito, qual a probabilidade dele ter um comportamento no agressivo? e) Se este animal tem um comportamento agressivo, qual a probabilidade dele estar num ambiente restrito? f) Se este animal tem um comportamento agressivo, qual a probabilidade dele estar num ambiente amplo? 7.11 Um aluno de Engenharia Florestal considera as chances de conseguir dois estgios prtico. As chances dele conseguir o estgio numa empresa florestal so de 80%, enquanto que as chances de conseguir um estgio num parque nacional so de 70%. As possibilidades de conseguir ambos os estgios, entretanto, so de 50%. Pergunta-se: a) Qual a probabilidade do aluno conseguir o estgio no parque nacional, dado que ele conseguiu o estgio na empresa? b) Qual a probabilidade do aluno conseguir o estgio na empresa florestal, dado que ele conseguiu o estgio no parque nacional? c) Qual a probabilidade do aluno conseguir pelo menos um dos estgios? 7.12 Uma fbrica de peas possui duas linhas de produo. A linha A produz 5% das peas da fbrica e destas 10% so defeituosas. J a linha B produz 95% das peas com uma taxa de defeitos de apenas 2%. a) Qual a proporo de peas defeituosas que deixam a fbrica? b) Se a pea defeituosa, qual a probabilidade dela ter saido da linha de produo A? c) Se a pea defeituosa, qual a probabilidade dela ter saido da linha de produo B? d) Se a pea no defeituosa, qual a probabilidade dela ter saido da linha de produo A? e) Se a pea no defeituosa, qual a probabilidade dela ter saido da linha de produo B?
7-22
7.13 Numa floresta de Pinus elliottii, 30% das rvores foram resinadas. Das rvores no resinadas, 70% so apropriadas para serraria, enquanto que dentre as resinadas apenas 10% o so. Assumindo que uma rvore desta floresta for selecionada ao acaso, pegunta-se: a) Qual a probabilidade dela ser apropriada para serraria? b) Qual a probabilidade dela ter sido resinada e ser prpria para serraria? c) Qual a probabilidade dela ter sido resinada e no ser prpria para serraria? d) Qual a probabilidade dela no ter sido resinada e ser prpria para serraria? 7.14 Sabe-se que numa regio de florestas tropicais em condies primitivas 75% das rvores so de espcies raras, mas em reas que sofreram distrbios antrpicos a proporo de espcies raras cai para 30%. Considere uma reserva florestal onde 20% da sua rea foi alterada antropicamente. Qual a probabilidade de um rvores selecionada aleatoriamente nesta reserva ser de espcie rara ? 7.15 Um dado lanado 20 vzes, qual a probabilidade de pelo menos um dos lanamentos resultar num seis? 7.16 Numa floresta de Eucalyptus grandis a taxa de ocorrncia de cancro de 2.5%. Num levantamento foram selecionadas ao acaso 30 rvores, qual a probabilidade de pelo menos uma ter cancro? 7.17 Uma festa reune 23 pessoas. Assumindo que as datas de nascimento das pessoas ocorre de modo totalmente aleatrio, qual a probabilidade de pelo menos duas pessoas terem nascido no mesmo dia do ano? 7.18 Sabe-se que as rvores de uma certa espcie arbrea produzem em mdia 2000 frutos no estgio inicial de desenvolvimento. Quando os frutos amadurecem, aproximadamente 27 sementes por fruto so disseminadas. Outras informaes sobre a biologia reprodutiva desta espcie incluem: 55% dos frutos em incio de desenvolvimento so abortados. Dos frutos verdes (no abortados), 70% so predados antes de amadurecer. Dos frutos que amadurecem, 50% das sementes so eficientemente disseminadas. Qual a quantidade de sementes por rvore que auxiliar efetivamente na regenerao natural desta espcie. 7.19 Num sistema de iluminao, foram instaladas em srie 15 lmpadas, de modo que se uma delas queimar todas as lmpadas apagam. Cada lmpada tem probabilidade de 0.99 de no queimar nas primeiras 300 horas de funcionamento. Assumindo que as lmpadas se comportam de modo independente, qual a probabilidade do sistema no falhar nas primeiras 300 horas ? 7.20 Um lote de sementes de Eucalyptus saligna com uma proporo de 5% de sementes hbridas (E. saligna x E. cloeziana) foi utilizado para a implantao de uma floresta. Se dez rvores desta floresta forem selecionadas ao acaso qual a probabilidade de: a) nenhuma delas ser hbrido; b) pelo menos uma delas ser hbrido; c) todas elas serem hbridos.
11-1
Histrico
A distribuio Normal tambem conhecida como distribuio Gaussiana como homenagem a Karl F. Gauss (1777-1855), brilhante matemtico e fsico alemo, que a desenvolveu no incio do sculo XIX. Entretanto, Abraham de Moivre (1667-1754) foi o primeiro a anunciar a equao da distribuio em 1733 e Pierre-Simon Marquis de Laplace (1749-1827), famoso matemtico e fsico francs, a redescobriu na mesma poca que Gauss. Para evitar uma questo internacional de originalidade o famoso estatstico ingls Karl Pearson passou a cham-la de distribuio Normal em 1920.
funo de densidade
f(x)
1 1 f ( x) = e 2
Define a
1 x 2
forma da distribuio
11-2
P ( x1 < x < x2 ) =
f(x)
x2
x1
f ( t ) dt =
x2
x1
1 1 e 2
1 t 2
dt
x1
x2
1 < 2 < 3
11-3
1 < 2 < 3
4) UNIDADES PADRES : o desvio padro define unidades padres na distribuio a partir da mdia, isto , a
disperso dos dados controlada pelas unidades de desvio padro.
66%
95% 99.7% 2 + + 2
+ 3
11-4
Todas elas podem ser reduzidas a uma nica distribuio Normal atravs da Padronizao.
PADRONIZAO
X N ( X , X ) X X Z= Z N ( 01 ,) X
66%
95% 99.7% -3 -2 -1 0 1 2 3
De modo inverso, a Varivel Normal Padronizada (Z) pode ser transformada em qualquer Varivel Normal:
Z N (0,1) X = X ( Z ) + X X N ( X , X )
11-5
Valor de z
P(Z<z) rea
-3
z
-3.0 -2.9 -2.8 -2.7 -2.6 -2.5 -2.4 -2.3 -2.2 -2.1 -2.0 -1.9 -1.8 -1.7 -1.6 -1.5 -1.4 -1.3 -1.2 -1.1 -1.0 -0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0.0
-2
P(Z<z)
0.0013 0.0019 0.0026 0.0035 0.0047 0.0062 0.0082 0.0107 0.0139 0.0179 0.0228 0.0287 0.0359 0.0446 0.0548 0.0668 0.0808 0.0968 0.1151 0.1357 0.1587 0.1841 0.2119 0.2420 0.2743 0.3085 0.3446 0.3821 0.4207 0.4602 0.5000
-1
0
z
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0
P(Z<z)
0.5000 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 0.9987
11-6
Valor de z
P(Z<z) rea
-3
-2
-1
P(Z<z)
1.0 2.5 5.0 10.0 20.0 30.0 40.0 50.0 60.0 70.0 80.0 90.0 95.0 97.5 99.0
z (percentil)
-2.33 -1.96 -1.64 -1.28 -0.84 -0.52 -0.25 0.00 0.25 0.52 0.84 1.28 1.64 1.96 2.33
11-7
f) P( Z < z ) = 0.75 z = ?
11-8
e) Qual o QI que uma criana deve possuir para estar entre os 1% mais inteligentes da populao?
11-9
j) Se 25% das menores rvores forem cortadas, qual o dimetro mnimo das rvores remanescentes?
k) Qual o dimetro mnimo para uma rvore estar entre as 5% maiores rvores?
l) Se 35% das menores rvores forem cortadas, qual o dimetro mnimo das rvores remanescentes?
m) Qual o dimetro mnimo para uma rvore estar entre as 1% maiores rvores?
11-10
Conceitos-Chave
VARIVEL ALEATRIA CONTNUA - FUNO DE DENSIDADE - FUNO DE DENSIDADE NORMAL PROBABILIDADE NA DISTRIBUIO NORMAL - PROPRIEDADES DA DISTRIBUIO NORMAL - PADRONIZAO DISTRIBUIO NORMAL PADRONIZADA - CLCULO DE PROBABILIDADES NA NORMAL PADRONIZADA CLCULO DE PROBABILIDADES COM A DISTRIBUIO NORMAL
Leitura
[WALLIS & ROBERTS , 1964] volume 2, p.470-498. [ROCHA, 1975] p.234-241
Exerccios
11.1 As rvores de uma floresta de Eucalyptus grandis tm altura com distribuio Normal de mdia 27m e desvio padro 3m. Pergunta-se: a) Esquematize o grfico da distribuio. Qual a proporo das rvores com altura: b) maior que 30m; c) menor que 20m; d) maior que 25m; e) menor que 35m; f) entre 20 e 30m; g) entre 24 e 30m; h) entre 20 e 25m; i) entre 30 e 35m. Qual a altura mnima da floresta se forem cortadas j) 10% menores rvores; k) 30% menores rvores; l) 40% menores rvores; m) 50% menores rvores. Qual a altura que uma rvore precisa ter para estar entre n) as 10% mais altas; o) as 5% mais altas; p) as 1% mais altas. 11.2 Uma floresta de Pinus taeda tem o DAP (dimetro a altura do peito) que segue distribuio Normal com mdia de 21cm e desvio padro de 5cm. a) Se todas as rvores com DAP < 18cm forem cortadas qual a proporo de rvores cortadas? b) Se um melhorista florestal selecionar as 2.5% maiores rvores da floresta, qual o DAP mnimo das rvores selecionadas? c) Um Engenheiro Florestal deseja cortar 20% das rvores a partir das menores rvores. Qual o DAP mximo das rvores a serem cortadas? d) Uma fbrica de laminao s processa rvores com DAP entre 18 e 27cm. Qual a proporo de rvores desta floresta que poderiam ser utilizadas na fbrica? 11.3 A precipitao anual numa dada localidade segue distribuio Normal com mdia de 1200mm e desvio padro de 150mm. Pergunta-se: a) Qual a precipitao para um ano que voc consideraria extremamente chuvoso? Explique. b) Qual a precipitao para um ano que voc consideraria extremamente seco ? Explique. 11.4 Y uma varivel aleatria contnua com distribuio Normal e mdia 20 e varincia 4. Calcule: a) P( 18< Y < 23) b) P( 12 < Y < 19) c) P( 21 < Y < 23) d) P(Y < 21 | Y > 18 ) e) P( Y > 19 | Y < 23 ) 11.5 X uma varivel aleatria com distribuio Normal de mdia 100 e varincia 36. Calcule: a) P(X < 95) b) P(X > 110) c) P(90 < X < 108) d) P(90 X 108) e) P( X > 92 | X < 110) f) P( X < 100 | X > 90 )
12-1
1.
X = 2 = X
2.
X = n n
Se o tamanho da amostra cresce, o desvio padro da mdia amostral decresce. 3. Se a populao original tem distribuio Normal, ento X n tambm tem distribuio Normal:
2 X n Normal ( , ) n
2
Xn
2 n
12-2
4. Teorema Central do Limite: Se a populao original tem uma distribuio qualquer, para n SUFICIENTEMENTE GRANDE X n ser APROXIMADAMENTE Normal:
2 X n aproximadamente Normal ( , ) n
2
"aproxima damente"
Xn
2 n
LME 216 - INTRODUO BIOESTATSTICA FLORESTAL b) A proporo de rvores que produz mais do que 2.8kg ser maior ou menor do que 0.5? Por que ?
12-3
d) Foi realizado uma amostra aleatria de 16 rvores. mais provvel ou menos provvel (em relaao ao item (b)) que a produo mdia das 16 rvores amostradas seja maior do que 2.8 kg? Desenhe uma figura para embasar a sua resposta.
e) Qual a probabilidade de que a produo mdia das 16 rvores amostradas seja maior que 2.8 kg?
f) Uma amostra aleatria de 49 rvores foi tomada. mais provvel ou menos provvel (em relaao ao item (d)) que a produo mdia das 16 rvores amostradas seja maior do que 2.8 kg? Desenhe uma figura para embasar a sua resposta.
g) Qual a probabilidade de que a produo mdia das 49 rvores amostradas seja maior que 2.8 kg?
12-4
Distribuio Amostral de Propores p a proporo das unidades de uma populao que possuem uma certa
caracterstica (proporo de sucessos), como por exemplo: rvores com cancro numa floresta de eucalipto; rvores cobertas por cips numa mata; capivaras do sexo masculino.
Se amostras aleatrias de tamanho n forem tomadas de uma populao com proporo p , ento a distribuio amostral de
$n p
1.
p $n $ = p p p $ =
2.
p(1 p ) n
Se o tamanho da amostra cresce, o desvio padro da proporao amostral decresce. 3. Se a populao original tem uma distribuio qualquer, para n $ n ser APROXIMADAMENTE NORMAL: SUFICIENTEMENTE GRANDE, p
$ n aproximadamente Normal ( p, p
p(1 p ) ) n
b) Qual a probabilidade que na amostra de 200 visitantes pelo menos 40% favoream a cobrana de taxas?
LME 216 - INTRODUO BIOESTATSTICA FLORESTAL c) Qual a probabilidade que na amostra de 200 visitantes, a proporo dos que favorecem a cobrana de taxas fique entre 35 e 39% ?
12-5
d) Uma nova amostra de 10 visitantes foi tomada. Qual a probabilidade de que pelo menos 50% dos visitantes na amostra favoream a cobrana de taxas ? vlido utilizar o mesmo mtodo utilizado em (b) e (c) ? Por que? Qual mtodo deveria ser utilizado neste caso para encontrar a probabilidade?
Conceitos-Chave
DISTRIBUIO AMOSTRAL DA MDIA - TEOREMA CENTRAL DO LIMITE - DESVIO PADRO DA MDIA AMOSTRAL - SUFICIENTEMENTE GRANDE - APROXIMADAMENTE NORMAL - DISTRIBUIO AMOSTRAL DE PROPORES - DESVIO PADRO DE UMA PROPORO
Exerccios
12.1 Seja X o nmero de rvores de cedro por hectare numa regio de floresta tropical. Suponha que X tem mdia igual a 2.2 e desvio padro igual a 1.4. Seja X o nmero mdio de rvores de cedro por hectare numa reserva de 100 ha (n=100). a) Qual a distribuio de X ? Desenhe um grfico e explique. b) Qual a probabilidade do nmero mdio de rvores de cedro por hectare na reserva seja menor do que 2? c) Qual a probabilidade do nmero total de rvores de cedro na reserva ser 195? 12.2 Numa floresta de Eucalyptus saligna, a proporo de rvores mortas de 4%. Foi tomada uma amostra aleatria de 100 rvores. a) Qual a distribuio aproximada da proporo de rvores mortas na amostra de 100 rvores? Desenhe uma figura e explique. b) Qual a probabilidade de que no mximo 7% das rvores na amostra estejam mortas? c) Qual a probabilidade de que a proporo de rvores mortas na amostra fique entre 2 e 6%. d) Qual o intervalo centrado na mdia que compreende a proporo de rvores mortas na amostra com uma probabilidade de 95%? e) Uma nova amostra aleatria de 8 rvores foi tomada. Qual a probabilidade de que haja no mximo uma rvore morta nesta amostra? Pode ser utilizado o mesmo mtodo utilizados nos itens anteriores? Por que ?
13-1
EXEMPLOS : a) Um estudo sugere que tomando um comprimido de aspirina a cada dois dias durante 20 anos pode reduzir o risco de contrair cancer no clon pela metade. Contudo, os benefcios s comeam a aparecer aps uma dcada. O risco de se desenvolver cancer no clon durante a vida de 1 para 16. H0 : O risco de cancer no clon ainda 1 em 16. H : O risco de cancer no clon menor que 1 em 16. b) Os mtodos tradicionais de colheita de madeira em florestas tropicais tm grande impacto sobre a estrutura da floresta. Em geral, a retirada de 10 rvore/ha (dimetro > 50cm) danifica 20% da cobertura da floresta. Mtodos alternativos afirmam que possvel uma reduo sensvel nesse impacto quanto a localizao das rvores a serem abatidas mapeada e as trilhas de entrada e saida das mquinas planejada. H0 : A colheita danifica 20% da cobertura da floresta. H : O dano da colheita menor que 20% da cobertura da floresta.
13-2
c) O conhecimento popular costuma dizer que o desmatamento provoca seca. Entretanto, estudos indicam que, numa bacia hidrogrfica, o corte de reas florestadas costuma aumentar a quantidade de gua nos rios, desde que o impacto do corte sobre o solo seja pequeno. H0 : A quantidade de gua no rio antes e depois do corte no se altera. H : A quantidade de gua no rio aps o corte maior do que antes.
d) Estudos recente indicam que adubao com boro (um micronutriente) aumenta marcantemente a sobrevivncia de rvores de Eucalyptus durante perodos de seca. H0 : A mortalidade de rvores durante a seca a mesma em florestas adubadas e no adubadas. H : A mortalidade de rvores durante a seca a menor em florestas adubadas.
Erro Tipo I No rejeitarmos uma H0 falsa (ou rejeitarmos uma H verdadeira) Erro Tipo II
Rejeitarmos uma H0 verdadeira (ou aceitarmos uma H falsa) A V ERDADEIRA HIPTESE Nula H0 Alternativa H
A S UA ESCOLHA
Nula H0
Sem erro
Erro Tipo II
Alternativa H EXEMPLO:
Erro Tipo I
Sem erro
Hoje noite voc vai a uma festa. A previso do tempo diz que h 80% de possibilidade de chuva. Voc leva um guarda-chuva? H0 : Vai chover hoje noite. H : No vai chover hoje noite. Erro Tipo I: Voc rejeita H0 e, portanto, acredita que no vai chover. Sai sem o guarda-chuva e se molha !
13-3
Erro Tipo II: Voc no rejeita H0 e, portanto, aceita que vai chover. Passa a noite carregando um guarda-chuva sem usa-lo.
Rejeitar a Hiptese Nula significa, geralmente, mudar um procedimento tradicional em favor de um novo procedimento. Esta mudana sempre acarreta custos e evita-se mudar quando no se tem certeza que o novo procedimento ser de fato melhor que o tradicional. Assim, na maioria das pesquisas estamos mais preocupados em controlar o Erro Tipo I. Em estatstica, se utiliza a seguinte terminologia para designar a probabilidade de se cometer um erro no teste de hipteses: - a probabilidade de se cometer um Erro Tipo I (nvel de significncia), a chance de se rejeitar H0 quando ela verdadeira (se aceitar uma H falsa).
13-4
HIPTESES Um pesquisador deseja iniciar um projeto sobre o impacto urbano da cidade do Rio de Janeiro sobre a Floresta da Tijuca. O projeto, entretanto, deve ser instalado em rea de floresta nativa. O pesquisador possue como informao inicial os grficos abaixo que apresentam a frequncia de rvores observadas em diferentes classes de tamanhos, em reas plantadas e reas nativas. Na escolha da rea apropriada para o projeto, o pesquisador trabalha com a seguintes hipteses:
H0 : A rea escolhida de floresta nativa. H : A rea escolhida de floresta plantada.
A partir de mapas o pesquisador selecionou uma certa rea. Quais os erros que podem ocorrer: Erro tipo I = Rejeita H0 quando H0 verdadeira = Conclue que a rea plantada, quando de fato a rea nativa = Procura uma nova rea, embora a rea selecionada seja nativa. = Aceita H0 quando H verdadeira (No rejeita H0 quando H0 falsa) = Conclue que a rea nativa, quando de fato a rea plantada = Estabelece o projeto na rea errada.
Erro tipo II
Regra de deciso
Selecionada a rea, o pesquisador sortea uma rvore e a mede (amostra de tamanho n=1). Suponha que a rvore sorteada tenha dimetro de 80 cm. Voc concluiria que a rea nativa ou plantada ? Por que ? E se a rvore sorteada tivesse 20 cm ? REGRA DE DECISO: Regra que estabelece, com base em dados obtidos, quando a hiptese nula (H0 ) rejeitada.
13-5
Vrias regras de deciso diferente so possveis e os nveis de e dependem de qual regra de deciso utilizada. Verificando a chance de se sortear rvores de diferentes tamanhos em ambas reas de floresta podemos verificar isso: Tamanho da rvore Sorteada (dimetro em cm) 20 40 60 80 100 120 Total Chance da rvore ser da rea: Nativa Plantada 22 / 40 3 / 40 10 / 40 7 / 40 4 / 40 12 / 40 2 / 40 11 / 40 2 / 40 5 / 40 0 / 40 2 / 40 40 / 40 40 / 40
Exerccio: Suponha que a H0 fosse rejeitada se a rvore sorteada tivesse dimetro de 60 cm ou mais. Estabelea os nveis e . Rejeita H0 se o dimetro 60 cm = 8 / 40 = 0.20 = 10 / 40 = 0.25
Exerccio: O que aconteceria com e se a regra de deciso estabelece um dimetro limite maior para rejeitar H0 ? Rejeita H0 se o dimetro 100 cm = 2 / 40 = 0.05 = 33 / 40 = 0.83
Exerccio: No exemplo acima, possvel se manter simultaneamente e pequenos ? No. Eles esto relacionados de modo inverso. Ao se diminuir a chance de um erro tipo I () se aumenta a chance de um erro tipo II (). A nica maneira trabalhar com o tamanho da amostra.
Nvel de Significncia
Para que as decises tomadas por diferentes pessoas tenha uma certa coerrncia entre si, cada ramo de atividade costuma estabelecer nveis mnimos para a ocorrncia do erro tipo I ().
13-6
Esse nvel chamado de nvel de significncia . Na rea florestal, as decises devem ser tomadas com um nvel de significncia () de pelo menos 0.05 (5%). Um teste de hiptese chamado significativo quando H0 rejeitada por uma regra de deciso que possui = nvel de significncia (0.05 na rea florestal). NVEL DE SIGNIFICNCIA: o nvel de (chance de se cometer um erro tipo I) associado com uma regra de deciso.
Exerccio: Qual o nvel de significncia para as seguintes regras de deciso: a) Rejeita Rejeita H0 se o dimetro 40 cm. b) Rejeita Rejeita H0 se o dimetro 60 cm. c) Rejeita Rejeita H0 se o dimetro 100 cm. Qual das regras acima deveria ser utilizada, considerando que a hiptese sendo testada da rea de cincias florestais ?
Valor-p
Digamos que a regra de deciso estabelecida tem nvel de significncia de 10% ( = 0.10), isto , a regra : Rejeita H0 se o dimetro da rvore selecionada for 80 cm. Caso 1: a rvore selecionada tem dimetro de 60 cm. Nesse caso, H0 no rejeitada, pois 60 cm < 80 cm. Entretanto, se ignorarmos a regra estabelecida, e rejeitarmos H0 as chance de cometermos um erro tipo I ser = 8 / 40 = 0.20. Caso 2: a rvore selecionada tem dimetro de 100 cm. Nesse caso, H0 rejeitada, pois 100 cm > 80 cm. As chance de cometermos um erro tipo I ser = 2 / 40 = 0.05. VALOR-P: Valor de associado aos dados observados, isto , chance do erro tipo I caso se H0 com base nos dados observados.
rejeitada
H0 rejeitada H0 no rejeitada
13-7
Portanto, podemos ignorar o fato que no estaremos selecionando a mesma rvore duas vzes. Dimetros das Duas rvores Pssiveis de Serem Selecionadas 20 20 20 20 20 20 40 40 40 40 40 60 60 60 60 80 80 80 100 100 120 20 40 60 80 100 120 40 60 80 100 120 60 80 100 120 80 100 120 100 120 120 Valor Mdio dos Dimetros 20 30 40 50 60 70 40 50 60 70 80 60 70 80 90 80 90 100 100 110 120 Nmero Total Nmero de Possibilidades de se selecionar 2 rvores Nativa Plantada 484 220 88 44 44 0 100 40 20 20 0 16 8 8 0 4 4 0 4 0 0 1104 9 21 36 33 15 6 49 84 77 35 14 144 132 60 24 121 55 22 25 10 4 976
13-8
Sumarizando os resultados em termos apenas de valor mdio dos dois dimetros temos:
Valor Mdio dos Dimetros (cm) 20 30 40 50 60 70 80 90 100 110 120 Nmero Total Nmero de Possibilidades de se selecionar 2 rvores Nativa Plantada 484 220 188 84 80 28 12 4 4 0 0 1104 9 21 85 117 236 173 195 79 47 10 4 976
Exerccio: Utilizando a tabela acima, resolva os exerccios: 1) Qual o nvel de significncia para as regras de deciso: a) Rejeita H0 se a mdia dos dimetros for 100 cm. b) Rejeita H0 se a mdia dos dimetros for 80 cm. c) Rejeita H0 se a mdia dos dimetros for 60 cm. 2) Qual o nvel de associado a cada regra de deciso no exerccio anterior. O que acontece com medida que o limite para rejeio diminui ? 3) Suponha que as duas rvores selecionadas tiveram mdia de dimetro igual a 70cm. a) H0 rejeitada ao nvel de 5% de significncia? b) Qual o valor-p ? 4) Para o nvel de significncia de 5%: a) Estabelea a regra de deciso quando quando o tamanho da amostra de uma rvore. b) Estabelea a regra de deciso quando quando o tamanho da amostra de duas rvore. c) O que acontece com (mantendo-se = 0.05 fixo) quando o tamanho da amostra (n) aumentado ?
13-9
15
10
13-10
Conceitos-Chave
HIPTESES - HIPTESE NULA - HIPTESE ALTERNATIVA - ERRO TIPO I
SIGNIFICNCIA - ALFA ( ) - TAMANHO DE AMOSTRA - DIFERENA SIGNIFICATIVA - TESTE SIGNIFICATIVO RESULTADO ESTATISTICAMENTE SIGNIFICATIVO - RESULTADO IMPORTANTE
Exerccios
13.1 Nos casos abaixo, defina a hiptese nula (H0) e a hiptese alternativa (H) apropriadas. a) Alguns mdicos afirmam que no possvel tratar resfriados e que o prprio organismo desenvolve defesas para neutraliz-lo. Entretanto, uma companhia farmacutica deseja lanar no mercado o remdio Resfriatim, que num prazo de 5 a 7 dias cura qualquer resfriado. Voc foi encarregado de organizar um experimento para testar o Resfriatim. b) Um dos grandes problemas sociais do Brasil a concentrao de renda. O governo alega que aps o plano real houve uma sensvel melhora desse problema. Como voc testaria as alegaes do governo ? c) Com base em pesquisa de opinio realizada no 19o. Salo Internacional do Automvel (So Paulo, 1996), a Chevrolet anuncia: Vectra, o melhor carro. A pesquisa consultou 439 pessoas e o Vectra foi apontado por 24% dos entrevistados como o melhor carro nacional. Vectra o melhor carro nacional ? d) Voc diretor de uma fbrica de chapas de madeira (chapas duras). A companhia deseja duplicar a produo da sua fbrica pois o mercado est em franca expanso. Estudando o processo de produo na sua fbrica voc chega a concluso de que o consumo de madeira crescer em 1.300.000m3 de madeira/ano com a duplicao. O gerente florestal afirma que as florestas da companhia so capazes de produzir at 1.320.000m3 de madeira/ano a mais do que vm produzindo. Ser que a floresta de fato capaz de produzir madeira suficiente para duplicao? e) Eucalyptus grandis uma das espcies arbreas de maior produtividade quando plantada no Estado de So Paulo. Entretanto, um experimento mostrou que quando a floresta plantada sem preparo de solo e sem adubao inicial, Eucalyptus cloeziana pode alcanar produtividades de 15 a 20% maiores que E. grandis. Quais as hipteses de um experimento cujo objetivo comparar essas duas espcies? f) Sabe-se que numa floresta tropical no perturbada a abundncia de espcies pioneiras fica em torno de 10%. Com aumento de perturbaes antrpicas a abundncia dessas espcies tende a crescer. Na demarcao de uma reserva florestal com rea total de 50.000 ha, ecologistas e engenheiros florestais discutem a incorporao de uma rea de 7.500 ha onde o levantamento de campo revelou uma abundncia de 15% de espcies pioneiras. Ser que a rea de 7.500 ha foi perturbada ? 13.2 Considere as hipteses nulas abaixo e escreva as hipteses alternativas apropriadas. Explique. a) H0 : A diversidade de espcies arbreas em floresta tipo cerrado igual diversidade em matas ciliares. b) H0 : A taxa de incidncia de cancro numa floresta plantada de E. grandis de 3%. [Voc deseja verificar se est ocorrendo um surto de cancro na floresta.]
13-11
c) H0 : Em termos de infraestrutura em parques nacionais, as expectativas de visitantes que chegam de nibus so iguais s expectativas de visitantes que chegam com veculo prprio. d) H0 : O novo processo de branqueamento da pasta de celulose produz um mesmo nvel de branqueamento que o processo tradicional. [Voc deseja provar que o novo processo melhor.] e) H0 : O instrumento a laser para medio de rvores resulta no mesmo tempo de instrumentos pticos. [Voc deseja mostrar que o instrumento a laser melhor.] 13.3 O princpio da justia que todo acusado inocente at que seja provado culpado. a) Qual a hiptese nula e a hiptese alternativa num julgamento criminal ? b) Quais so as consequncias equivalentes aos erros tipo I e II ? 13.4 Uma empresa florestal deseja introduzir um novo clone de E. saligna nas suas plantaes comerciais. Foi realizado um experimento comparando o novo clone com o clone tradicionalmente utilizado. As hipteses nesse experimento foram: H0 : A produtividade do novo clone e do clone tradicional so iguais. H : A produtividade do novo clone maior do que a do clone tradicional. a) Descreva as conseqncias do erro tipo I. b) Descreva as conseqncias do erro tipo II. c) O experimento resultou numa diferena estatsticamente significativa entre os clones. Qual a hiptese rejeitada ? Por que ? 13.5 Uma serraria que fornece peas de madeira para diversas fbricas de mveis recebeu vrias reclamaes de que as peas de largura de 10 cm tm apresentado em mdia uma largura menor do que 9 cm. Voc responsvel por verificar essas reclamaes a partir de dados da linha de produo. a) Quais so as hipteses nula e alternativa ? b) Qual o erro tipo I e as suas consequncias ? c) Quais as consequncias do erro tipo II ? d) Suponha que os dados coletados resultaram num teste estatisticamente significativo. Qual a hiptese que seria rejeitada ? 13.6 Numa floresta plantada, foi realizado um levantamento para se verificar a existncia de um surto de cancro. A taxa normal de ocorrncia de cancro de 2%, assim as hipteses testadas foram: H0 : A taxa de cancro na floresta de 2%. H : A taxa de cancro na floresta maior do que 2%. a) Quais os erros tipo I e II ? b) Quais as consequncias de ambos tipos de erro ? c) Se o teste de hiptese no for estatisticamente significativo, qual hiptese ser rejeitada ? 13.7 O IBAMA o orgo federal responsvel pelo controle de desmatamento. Um proprietrio s pode ser multado por desmatamento ilegal se esse for comprovado em campo. Na regio amaznica, entretanto, o controle medio dos
13-12
por visitas a propriedades praticamente impossvel. Com a ajuda da NASA, o IBAMA tem utilizado uma areonave de alta altitude equipada com radar. Essa aeronave indica reas provveis de terem sofrido desmatamento no autorizado e uma equipe de terra do IBAMA visita a propriedade em questo. Caso o desmatamento seja comprovado na visita, o proprietrio multado. Suponha que uma dada rea foi indicada como desmatamento ilegal provvel. a) Defina as hipteses H0 e H . b) Defina as consequncias do erro tipo I. c) Defina as consequncias do erro tipo II. d) Quais consequncias so mais piores ? 13.8 O nmero de peas defeituosas produzida por uma destopadeira segue os grficos apresentados abaixo: REGULADA DESREGULADA x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x ----------------------------------------------------------------------------------------------------1 2 3 4 5 6 1 2 3 4 5 6
peas defeituosas/hora peas defeituosas/hora
a) Utilizando um nvel de significncia de 5% ( ), qual hiptese seria rejeitada se a regra de deciso fosse: Rejeitar H0 caso ocorra 6 ou mais peas defeituosas numa hora. b) Qual a probabilidade de um erro tipo II ( ) para a regra de deciso acima ? c) Utilizando um nvel de significncia de 10% ( ), qual hiptese seria rejeitada se a regra de deciso fosse: Rejeitar H0 caso ocorra 4 ou mais peas defeituosas numa hora. d) Qual a probabilidade de um erro tipo II ( ) para a regra de deciso acima ? e) Quais as consequncias dos erros tipo I e II ? f) Qual seria o valor-p para a seguinte regra de deciso: Rejeitar H0 caso ocorra 5 ou mais peas defeituosas numa hora? H0 seira rejeitada num nvel de significncia de 10%? Por que ? g) Qual seria o valor-p para a seguinte regra de deciso: Rejeitar H0 caso ocorra 3 ou mais peas defeituosas numa hora? H0 seira rejeitada num nvel de significncia de 10%? Por que ? 13.9 Impactos ambientais em florestas tropicais resultam, em geral, numa reduo no nmero de espcies arbreas. A tabela abaixo apresenta a freqncia com que se observar um dado nmero de espcies em parcelas
LME 216 - INTRODUO BIOESTATSTICA FLORESTAL de 1 hectare em florestas maduras e florestas degradadas. A questo bsica detectar se uma dada rea florestal foi degradada, portanto, as hipteses sendo testadas so: H0 : No houve degradadao da floresta. H : Houve degradao da floresta. Nmero de Espcies Arbrea em parcelas de 1 hectare 40 50 60 70 80 90 100 110 120 Total de parcelas Floresta Madura Floresta Degradada
13-13
1 2 4 8 10 13 17 20 25 100
25 20 17 13 10 8 4 2 1 100
Parte I: Apenas uma parcela foi observada. A regra de deciso Rejeitar H0 se o nmero de espcies na parcela for 50 ou menos. a) Qual o valor-p dessa regra? H0 seria rejeita para = 0.05 ? b) Qual o valor de correspondente a regra de deciso acima? c) Qual a regra de deciso que garante nvel de significncia de 1% ?
Estabelece uma relac~ ao de desigualdade entre duas quantias Porb. erro tipo I
N vel de ^ ncia Significa
Hipotese Nula H
Ao testarmos uma hipotese estat stica podemos cometer dois tipos de erro
3 QQ QQ QQ s
Na Engenharia Floresta o n vel de signi c^ ancia e de 5%, isto e, a probabilidade de erro tipo I aceitavel e de no maximo 5% ( = 0:05)
Aula 14 2
Aula 14 3
3. a distribuic~ ao de p b sera aproximadamente Normal. Com base nestas propriedades sabemos que a variavel aleatoria:
p b; p Z = p p(1 ; p)=n
tera distribuic~ ao aproximadamente Normal Padronizada, isto e, distribuic~ ao Normal com media 0 e desvio padr~ ao 1.
Assumindo que a hipotese nula e verdadeira (H0 : p = 0:75), p b seria aproximadamente Normal com media 0.75 e desvio padr~ ao 0:75(1 ; 0:75) 30 (distribuic~ ao ao lado). Podemos agora quanti car, sob as condic~ oes de H0 , a probabilidade de observarmos um valor de p b = 0:80 ou mais extremo, .
r
0.59
0.75
0.91
) Pp b 0:80]
) Pp b 0:80] = P Z
"
0:63] = 0:2643
Portanto, sob H0 , a probabilidade de se observar um valor de p b ou maior e 0.2643. Se rejeitarmos H0 com base no valor observado de p b = 0:80, teremos a probabilidade de 0.2643 de cometermos um erro tipo I. Logo, 0.2643 e o valor-p, mas a margem de erro tipo I aceitavel nas Ci^ encias Florestais e de 0.05 (alpha - n vel de signi c^ ancia). Como o valor-p (0.2643) e bem maior do que o n vel de signi c^ ancia ( = 0:05) nos n~ ao rejeitamos H0 e podemos concluir que, do ponto de vista estat stico, a a rmac~ ao da Eng. Florestal n~ ao procede.
Aula 14 4
onde p0 e o valor hipotetizado para p na hipotese nula (H0). Esta quantia padronizada e chamada de estat stica de teste e sua distribuic~ ao sob H0 e aproximandamente Normal, com media 0 e desvio padr~ ao 1. O valor-p para o teste e calculado com base em como a hipotese alternativa (H ) e expressa. Decis~ ao: um valor-p menor que o n vel de signi c^ ancia implica em rejeitar H0 . No exemplo acima, no entanto, o valor-p foi maior que o n vel de signi c^ ancia e H0 n~ ao foi rejeitada, concluindo-se que a a rmac~ ao da Eng. Florestal n~ ao tem embasamento estat stico.
p b ; p0 p0(1 ; p0 )=n
versus H :
Aula 14 5
H : p > p0
valor-p
H : p < p0
Valor-p: area da cauda a esquerda do valor observado para estat stica de teste sob H0 . Valor-p: area nas duas caudas (extremo em ambas direc~ oes) fora da regi~ ao de nida pelo do valor observado para estat stica de teste sob H0. Como a distribuic~ ao Normal(0,1) e simetrica, isto implica em dobrar a area de uma das caudas.
valor-p
-Zobs
H : p 6= p0
valor-p/2
valor-p/2
-Zobs
Zobs
Aula 14 6
a. Existe evid^ encia, ao n vel de 5% de probabilidade, de que a moeda n~ ao e justa? Hipoteses: Dados: p b= Estat stica: Z = Valor-p:
Decis~ ao: b. Existe evid^ encia, ao n vel de 5% de probabilidade, de que o numero de \caras" e maior do que o esperado? Hipoteses: Dados: p b= Estat stica: Z = Valor-p:
Decis~ ao:
Aula 14 7
tera distribuic~ ao Normal com media 0 e desvio padr~ ao 1. Poder amos utiliza-la para testar H0. Estas considerac~ oes apresentam um problema: a hipotese nula (H0) nos fornece uma indicac~ ao para a media da populac~ ao ( ), mas n~ ao nos da qualquer dica sobre o desvio padr~ ao da populac~ ao ( ). O desvio padr~ ao da populac~ ao ( ) permanece desconhecido e, n~ ao modo de se obter a estat stica Z com base na amostra tomada pelo cient sta.
Aula 14 8
Estat stica t
Este tipo de problema ja foi estudado no comeco do seculo pelo matematico ingl^ es William Gosset, que usava o pseud^ onimo \Student" para publicar os seus trabalhos. Student desenvolveu a seguinte estat stica:
t= xn ; p sn = n
onde sn e o desvio padr~ ao amostral (amostra de tamanho n). A estat stica t e uma variavel aleatoria cuja distribuic~ ao tem as seguintes propriedades: 1. Tem forma de sino (como a dist. Normal). 2. E simetrica em relac~ ao ao zero (como a dist. Normal Padronizada). 3. E mais \achatada" no centro e tem as caudas mais \pesadas". 4. Possui somente um par^ ametro: = n ; 1 chamado de graus de liberdade. 5. A medida que ! 1, ent~ ao t ! Z , isto e, para grandes amostras a distribuic~ ao de t se aproxima da Normal Padronizada.
Normal(0, 1)
t (n=3) t (n=5)
t (n=20)
-3
-2
-1
E importante notar que para cada valor dos graus de liberdade ( = n ; 1) temos uma distribuic~ ao diferente para o t de Student. A distribuic~ ao Normal Padronizada e uma unica distribuic~ ao (o valor dos par^ ametros s~ ao xos), mas a distribuic~ ao t de Student e na verdade uma fam lia de distribuic~ oes, pois cada valor particular de gera uma distribuic~ ao distinta das demais. Nesta situac~ ao, torna-se imposs vel existir uma tabela que apresente todos os valores de todas as distribuic~ oes t poss veis. O Anexo C, no entatno, apresenta os quantis da distribuic~ ao t de Student para alguns valores particulares de (probabilidade na cauda) e uma serie de valores distintos de .
Aula 14 9
) P x < 6:14] ) P t < ;3:61] ) P t > 3:61] (Simetrica em relac~ ao ao zero) ) P t > 3:61] = valor-p
=0:05 =4
P t > 3:61] < P t > 2:13] ) P t < ;3:61] < P t < ;2:13] ) valor-p < = 0:05
t = -3.61 t = -2.13
= 0.05
-4
-3
-2
-1
Decis~ ao: Rejeita-se H0 (ao n vel de 5% de probabilidade) e conclu -se que existe evid^ encia estat stica para a rmar que o pH medio do solo e menor que 7.
Aula 14 10
Note que as hipoteses se referem a media da populac~ ao e n~ ao da amostra. A decis~ ao a respeito de foi baseada na media da amostra xn . Mais precisamente na estat stica t observada na amostra:
t = xn ; 0 p sn = n
onde 0 e o valor hipotetizado para na hipotese nula (H0). Sob a hipotese nula, a estat stica t tem distribuic~ ao t de Student com par^ ametro = n ; 1 (graus de liberdade. O valor-p para o teste e calculado com base em como a hipotese alternativa (H ) e expressa. Decis~ ao: um valor-p menor que o n vel de signi c^ ancia ( ) implica em rejeitar H0. Foi exatamente o que ocorreu no exemplo do pH. Quando o valor-p e maior que o n vel de signi c^ ancia, H0 n~ ao e rejeitada.
Conceitos-Chave
hipoteses estat sticas - hipotese nula - hipotese alternativa - erro ^ncia - proporca ~ o nula populaca ~o tipo I - valor-p - n vel de significa ~o amostral - distribuica ~o amostral de uma proporca ~o proporca ~o - teste monocaudal - teste valor extremo - teste Z para proporca ~o - media amostral - distribuica ~o bicaudal - media da populaca ~o t de amostral da media - estat stica t de Student - distribuica ~ o. Student - teste t para media de uma populaca
Exerc cios
14.1 Acredita-se que a proporc~ ao de tabuas de Eucalyptus grandis que apresentam serios
problemas de rachadura de topo apos o desdobro e da ordem de 85%. Uma pesquisa com 100 tabuas de um clone de E. grandis resultou numa proporc~ ao de 78% das tabuas com
Aula 14 11
rachadura de topo. O melhorista orestal garante que este ganho e \signi cativo", o responsavel pela serraria acredita que essa diferenca e \devida ao acaso". Qual dos dois tem embasamento estat stico? Explique.
embaralhar um baralho com cartas de cinco naipes (ondas, estrelas, c rculos, quadrados e cruzes). A medida que o pesquisador vira uma carta e se concentra nela, a pessoa sendo pesquisada tenta advinhar o naipe da carta. Uma pessoa sem PES tem probabilidade de 1/5 (0.20) de acertar por pura sorte. Ja uma pessoa com PES devera acertar com mais frequ^ encia. Isadora acertou 36 em 50 tentativas. Teste ao n vel = 0:01 se Isadora tem PES. Encontre o valor-p e estabeleca as suas conclus~ oes.
hipotese H0 : p = 0:50 contra a hipotese H : p > 0:50 (teste monocaudal). O programa foi alimentado com 500 observac~ oes de uma amostra simples aleatoria e o programa retornou o seguinte resultado: Estat stica Observada: Z = 0:44 valor-p=0.33 a. Baseado no valor-p acima, o estudante concluiu que existe uma probabilidade de 33% da hipotese nula ser verdadeira. Voc^ e concorda ? Explique. b. Qual seria o valor-p se o teste fosse bicaudal (hipotese alternativa H : p 6= 0:50)?
Aula 14 12
responsavel pela area de colheita deseja saber se ele pode elaborar orcamento anual assumindo que o tempo medio de quebra e de 100 horas.
controle de qualidade de sua fabrica, ele amostra toda semana pacotes de 20kg de cola para veri car se o peso dos pacotes n~ ao difere muito do peso nominal. Se os pacotes forem mais leves os clientes reclamam, se forem mais pesados a empresa perde dinheiro. Em ambos os casos a maquina de empacotamento teria de ser desligada para investigar o que esta ocorrendo. Estabeleca as hipoteses apropriadas. Quais as pressuposic~ oes necessarias para testar estas hipoteses? Como um Erro Tipo I afetaria a companhia ? Como um Erro Tipo II afetaria a companhia ? A amostra semanal de 25 pacotes resutou numa media de 19.6kg e num desvio padr~ ao de 0.9kg. Realize o teste e encontre o valor-p. f. Baseado no resultado do teste, qual seria a sua recomendac~ ao? 14.8 S~ ao 12:30 hs e voc^ e esta na la do RUCALQ, com 33 pessoas na sua frente. Voc^ e esta ansioso pois tem um compromisso as 13:00 hs. Um aluno de PG do Departamento de Estat stica tem acompanhado o tempo de atendimento na la e obteve os seguintes resultados: Numero de Pessoas Tempo para Atend^ e-las (minutos) 35 28 40 30 30 25 39 32 24 20 Sera que voc^ e estara almocando ate as 13:00 hs? a. b. c. d. Estabeleca as hipoteses apropriadas. Quais as pressuposic~ oes necessarias para testar as hipoteses? Efetue o teste e encontre o valor-p. Com base no teste, qual a sua decis~ ao? a. b. c. d. e.
15. Infer^ encia sobre os Par^ ametros de uma Populac~ ao: \Intervalo de Con a ^nca
Teste de Hipoteses
O teste de hipoteses (H versus H ) envolve: (1) o par^ ametro da populac~ ao (p.ex.: media ) (2) informac~ oes de uma amostra A (p.ex.: media x e desvio padr~ ao s) A (3) um estat stica cujo o comportamento e conhecido A A sob H (p.ex.: estat stica t). A
0 0
H0 e rejeitada se:
valor-p
U A
-4
-3
-2
-1
Aula 15 2
e. Decis~ ao: Rejeita-se H0. Ha evid^ encias estat sticas de que a produc~ ao n~ ao e igual a 300 st/ha.
Existe outra forma de se veri car quando a hipotese nula e rejeitada utilizando apenas a informac~ ao do n vel de signi c^ ancia ( ).
Testes Monocaudais
; t = x s=pn
-
c = Valor Cr tico
Rejeita H0 se t c
Qual o valor cr tico (c) que corresponde a uma probabilidade de Erro Tipo de I de 5% ?
= P Erro Tipo I ] = P Rejeita H jH verdadeira ] = P t cjt t de Student( = 19)] = 0:05
0 0
Aula 15 3
t(0.95; 19) = 1.73
-4
-3
-2
-1
Testes Bicaudais
No exemplo de produc~ ao temos Hipoteses Testadas: H0 : = 300 H : 6= 300 Neste caso: Rejeita H0 se x for mais extremo que . (\muito maior" ou \muito menor") Rejeita H0 se o valor de t e \extremo" Rejeita H se jtj c ) t c
0
Estat stica: t = x ; ]= s= n]
jtj c ) t c
ou
95%
-4
-3
-2
-1
Aula 15 4
Regi~ ao de Rejeic~ ao
t(0.95 ; )
H : >
Rejeita H se t c onde c = t ;
0 (1 )
( = 0.05) -4 -3 -2 -1 0 1 2 3 4
t (0.95 ; )
H : <
(1
( = 0.05) -4 -3 -2 -1
t (0.95 ; )
t(0.95 ; )
H : = 6
Rejeita H se t c ou t ;c onde c = t ; =
0 (1
2)
( = 0.025) -4 -3 -2 -1 0 1 2
( = 0.025) 3 4
Podemos de nir intervalo simetrico ao redor da media amostral (x) que contem valores \plaus veis" para a media populacional ( ).
Este intervalo pode ser de nido de acordo com um dado \n vel de con anca".
Aula 15 5
; t= x s=pn
H0 : x = versus H : x 6=
num determinado n vel de signi c^ ancia ( ). Assumindo H0 como verdadeiro sabemos que a estat stica t segue a distribuic~ ao t de Student. Portanto: P t( =2) t t(1; =2) ] = 1 ;
P ;t(1; P ;t(1; P
h h
=2) =2)
t
x; p s= n
t(1; t(1;
s p n s p n
=2) =2)
]=1; ]=1;
=2) =2)
x;
t(1; t(1;
]= 1;
P ; psn t(1;
h
;x
=2)
;x]= 1;
=2)
P x ; psn t(1;
x + psn t(1;
Intervalo de Confianca
]= 1;
s t p n
(1
; =2)
e chamado de Intervalo de Con anca de 100(1 ; )%, onde e o n vel de signi c^ ancia.
=2)
Aula 15 6
Quest~ ao 1: O I.C. de 95% contem a media populacional ( )? N~ ao sabemos. Quest~ ao 2: O I.C. de 95% signi ca que existe 95% de probabilidade da media
populacional ( ) estar dentro do intervalo 268.3 , 291.7 ]?
IJH=I ! " #
Se repertirmos o mesmo procedimento de amostragem e construc~ ao do Intervalo de Con anca varias v^ ezes, Esperamos que em 95% das v^ ezes o Intervalo de Conanca construido contera a media populacional ( ).
''
Aula 15 7
X
Comprimento (cm) Peso (kg )
Limite Superior
b. Qual variavel tem o maior intervalo de con anca? c. Como voc^ e interpreta o resultado da quest~ ao anterior?
Conceitos-Chave
^ncia - valor-p teste de hipoteses - erro tipo I - n vel de significa ~o de rejeica ~o - teste abordagem classica - valor cr tico - regia monocaudal - teste bicaudal - estimativa pontual - intervalo de ~ o - interpretaca ~o do confianca para a media de uma populaca intervalo de confianca
Exerc cios
15.1 Em orestas nativas a \domin^ ancia" das especies arboreas e medida pela somatoria
das areas seccionais das arvores (area basal). Num levantamento em fragmento orestal, as medic~ oes em 7 parcelas resultou nos seguintes dados: Area Basal (m2=ha) Media Desvio Padr~ ao Jatoba 2.5 0.4 Embauba 1.2 0.3 Jequitiba 5.7 1.8 Especie
Aula 15 8
a. Encontre o Intervalo de Con anca de 90% para area basal de cada uma das especies. b. Qual das especies tem maior intervalo de con anca? O que signi ca isso?
15.2 Num estudo sobre o peso medio de capivaras, a pesquisadora encontrou o seguinte
intervalo de Con anca 95%: 4:5 7:8]. A pesquisadora deseja saber agora se o peso medio da populac~ ao estudada e estat sticamente diferente de 5kg. a. Estabeleca as hipotese nula e alternativa para a pergunta da pesquisadora. b. E poss vel responder esta pergunta? Explique. c. Se for poss vel responder, qual seria o resultado do teste de hipotese. 15.3 Uma fabrica de paneis de madeira deseja duplicar a sua produc~ ao. A duplicac~ ao acarretaria num consumo adicional de 1300000 m3 =ano de madeira. Com base no sistema de inventario da empresa, que disp~ oe de 1500 parcelas, o gerente orestal encontrou que as orestas da empresa t^ em uma capacidade excedente de produc~ ao media de 1320000 m3 =ano com desvio padr~ ao de 170000 m3=ano. A empresa deve fazer a duplicac~ ao? Explique. \pioneiras" ca em torno de 10%. Com aumento de perturbac~ oes antropicas, a abund^ ancia destas especies tende a crescer. Na demarcac~ ao de uma reserva orestal de area total de 50000 ha, ecologistas e engenheiros orestais discutem a incorporac~ ao de uma area extra de 7500 ha onde o levantamento de campo (50 parcelas) revelou abund^ ancia media de especies pioneiras de 15% (desvio padr~ ao de 9%). O objetivo da demarcac~ ao da reserva e proteger \areas representativas de ecossistemas locais que n~ ao sofreram in u^ encia antropica marcante". A area extra de 7500 ha deve ou n~ ao deve ser incorporada a reserva? Justi que estatisticamente a sua resposta.
15.4 Sabe-se que numa dada oresta tropical n~ ao perturbada a abund^ ancia de especies
(jo~ ao-de-barro) numa dada localidade do interior de Minas Gerais. Num primeiro levantamento, a pesquisadora capturou 30 passaros (n1 ) e marcou-os todos com anilhas. Num segundo levantamento, a pesquisadora capturou 40 passaros (n2 ) dos quais 12 (m) possu am a anilha referente ao primeiro levantamento. A teoria de marca-e-recaptura estabele que o tamanho da populac~ ao (valor amostral) e sua vari^ ancia devem ser obtidos pelos estimadores: (n1 + 1)(n2 + 1) ; 1 b = Tamanho de populac~ ao : N (m + 1) (n1 + 1)(n2 + 1)(n1 ; m)(n2 ; m) Vari^ ancia : s2 b= N (m + 1)2(m + 2)
b Intervalo de Con anca de 95% : N 2 s2 b N q
a. Qual o intervalo de con anca de 95% para o tamanho desta populac~ ao ? b. A pesquisadora pode considerar a populac~ ao de Furnarius rufus como tendo 100 passaros ? Explique.
Amostra (x1 , s2 1 , n1 )
Amostra (x2, s2 2 , n2 )
Aula 16 2
Teste Bicaudal
H0 : 12 = 22 H : 12 6= 22
Teste Monocaudal
s2 = F= 1 2 s2 =
2 2
s2 1= = s2 2=
2 2
s2 1 = s2 2
Se H e verdadeira, ambas amostras foram obtidas de duas populac~ oes \Normais" com igual vari^ ancia ( ).
0 2
~o F , a qual tem as seguintes Nesta situac~ ao a estat stica F tem Distribuica propriedades:
F so assume valores positivos, pois e uma raz~ ao de duas vari^ ancias (0 < F < +1)
Possui dois par^ ametros: = n ; 1 ) Graus de Liberdade do Numerador = n ; 1 ) Graus de Liberdade do Denominador A distribuic~ ao F e unimodal assimetrica a direita, tendo o gra co:
1 2 1 2
Aula 16 3
O Anexo D apresenta uma tabela da distribuic~ ao F para alguns valores de graus de liberdade para o n vel de signi c^ ancia de 5%.
^ ncias Dista
^ ncia Varia
46.5 58.3
H0 : H :
Estat stica F amostral:
= 2 1 6=
1
2
2 2
2 2
=4e
10
Aula 16 4
* Os valores da estat stica F observada s~ ao menos extremos que os quantis * N~ ao se rejeita H0.
Teste F Bicaudal Note que os valores na tabela do Anexo D apresentam apenas um valor (quantil 95% ou 97.5%). Para simpli car os calculos e o teste de hipotese, devemos utilizar o seguinte procedimento: 1. Calcular a estat stica F sempre na forma:
2 maxfs2 1 s2 g 2 minfs2 1 s2 g
F=
0
2. Rejeitar H quando o valor da estat stica for maior que o quantil (1 ; =2)100%:
F1; =2
1 2
Tradicional 120 140 80 75 110 150 6 937.5 Novo 105 95 108 120 90 5 137.3 Hipoteses:
Gramatura (g=m2)
s2
H0 : H :
Estat stica F amostral:
T T
2
>
N N
2
Aula 16 5
=5e = 4.
10
Como 6:8281 > 6:256 (F > F0:95 5 4), rejeita-se H0 e conclui-se que o metodo tradicional tem vari^ ancia maior que o novo.
Teste F Monocaudal No caso do teste F monocaudal, devemos utilizar o seguinte procedimento: 1. Calcular a estat stica F segundo a forma como a hipotese alternativa e estabelecida:
s2 H : =) F = s12 2 s2 2 2 H : 1 < 2 =) F = 2 s2 1
2 2 1 > 2
2. Rejeitar H quando o valor da estat stica for maior que o quantil (1 ; )100%:
0
F1;
1 2
. Comparac~ ao de Medias
A comparac~ ao de medias geralmente envolve as hipoteses: H : 1= 2) 1; 2=0 H : 1 6= 2 ) 1 ; 2 6= 0
0
Aula 16 6
O que implica que as medias dos tratamentos s~ ao iguais. Uma forma mais generica de se estabelecer estas hipoteses e a rmar que as medias diferem uma certa quantia , onde = 0 e uma das possibilidades: H : 1; 2= H : 1 ; 2 6=
0
A estat stica utilizada para testar estas hipoteses e (x ; x ) ; t= q 1 2 d V ar(x1 ; x2 ) A estat stica t assim calculada dependera de como a estimativa da vari^ ancia da d diferenca das media (Var(x1 ; x2)) e obtida. Como as amostras que geraram x1 e x2 s~ ao independentes temos que: Var(x1 ; x2) = Var(x1) + Var(x2) Se
1
2
= 2 , ent~ ao
2
1+ 1 Var(x1 ; x2) = n + n = n n
1
2
2 2
e 2:
2
d x1 ; x2 ) = Var(
2
1 +1 s n n C (n ; 1)s1 + (n ; 1)s2 sC = n +n ;2
1 2 2 1 2
Se
6= 2 , ent~ ao
2
e a estimativa ca:
Var(x1 ; x2) = n1 + n2
1
s2 s2 1 d Var(x1 ; x2) = n + n2 1 2
Aula 16 7
Amostra (x1 , s2 1 , n1 )
manipulac~ ao experimental.
Amostra (x2, s2 2 , n2 )
unica populac~ ao , toma uma amostra e aplica nesta amostra dois diferentes tipos de
O contexto experimental, portanto, implica em: 1. As Unidades Experimentais (n1 + n2 ) foram tomadas aleatoriamente de uma mesma populac~ ao. 2. Os Tratamentos (manipulac~ ao experimental das unidades) foram atribuidos de modo aleatorio a cada uma das unidades experimentais. 3. Os tratamentos foram repetidos em mais de uma undade experimental. 4. A aplicac~ ao do tratamento em uma das unidades experimentais e completamente independente da aplicac~ ao dos tratamentos nas demais unidades.
Aula 16 8
PPPP PPP q P
Tratamento 2 (x2, s2 2 , n2 )
0
Tratamento 1 (x1 , s2 1 , n1 )
Note que no contexto experimental, a rejeic~ ao da hipotese H : que os tratamentos aplicados s~ ao diferentes.
; 2 ja implica
2
Consideraremos agora como o teste de medias deve ser aplicado em diferentes situac~ oes de pesquisas observacionais e experimentais.
Aula 16 9
Assim, o teste t para observac~ oes pareadas se resume ao teste t para uma populac~ ao testando hipotese nula da media diferencas ser igual a uma certa quantia .
d; t= p 2 sd =n
Utilizando Range nder 25 30 16 13 21 21.0 46.5 Utilizando Trena 20 31 18 10 23 20.4 58.3 Diferenca 5 -1 -2 3 -2 0.6 10.3 Hipoteses:
s2
H0 : H :
Estat stica:
R; T
=0 R ; T 6= 0
Aula 16 10
Conclus~ ao: Como j0:418j < 2:776, n~ ao se rejeita H0 . Conclui-se que n~ ao ha evid^ encias de que os dois metodos sejam diferentes entre si.
H0 : H :
0
= 2 1 6=
1
2
2 2
2 2
Se H n~ ao for rejeitada, assumimos que as vari^ ancias s~ ao iguais e comparamos as medias atraves da estat stica: (x ; x ) ; t= q 1 2 d x1 ; x2 ) Var( onde a vari^ ancia da diferenca das medias e obtida por: 1 +1 s d x ;x ) = Var(
1 2
2
s2 C
Sob H , a estat stica t calculada seguira a distribuic~ ao t de Student com graus de liberdade = n + n ; 2.
0 1 2
A B
45.6 42.1 44.9 45.1 47.6 46.7 45.5 48.9 45.8 4.1114 30.1 21.6 27.6 27.3 30.4 31.4 34.1 30.6 29.1 13.8512
s2
Aula 16 11
H0 : H :
Estat stica:
= 2 A 6=
A
2
B B
2
Regi~ ao de Rejeic~ ao: Conclus~ ao: Como 3:369 < 4:995 n~ ao se rejeita H0 . Assume-se que as vari^ ancias s~ ao iguais.
Comparando as Medias
Hipoteses:
H0 : xA ; xB = 10 H : xA ; xB > 10
Estat stica:
1
2
d x1 ; x2) = ) Var(
2 1 + 1 (n1 ; 1)s2 1 + (n2 ; 1)s2 n1 n2 n1 + n2 ; 2 1 + 1 (8 ; 1)4:11114 + (8 ; 1)13:8512 = 2:2453 d x1 ; x2) = Var( 8 8 8+8;2 (xA ; xB ) ; = (45:8p ; 29:1) ; 10 = 6:7 = 4.471 t = q 1:4984 2:2453 d x1 ; x2) Var(
t t1;
2(
n;1)
)t t :
0 95 14
) t 1:761
Conclus~ ao: Como 4:471 > 1:761, rejeita-se H0 ao n vel de 5% de probabilidade. Conclui-se ha evid^ encias para se a rmar que a proced^ encia mais produtiva excede a menos produtiva em mais de 10 st=ha:ano.
Aula 16 12
O comportamento da estat stica t sob H , no entanto, dependera se o tamanho de amostra para as duas medias e igual ou diferente.
0
2 s2 1 +s2 n
Sob H , a estat stica t tera distribuic~ ao t de Student com graus de liberdade = 2(n ; 1).
0
No caso das amostras terem tamanhos diferentes, a estat stica t ca: (x1 ; x2) ; t= q s2 s2 1 2 n1 + n2 a qual tera distribuic~ ao t de Student sob H com graus de liberdade igual a: =
2 2 s2 1 + s2 n1 n2 2 2 s2 s2 1 2 n1 n2 n1 ;1 + n2 ;1
0
Aula 16 13
A B
2326 2206 1835 1434 1629 1761 1511 2146 1548 1821.778 108740.944 6006 3455 3115 3376 2609 2582 3674 2648 2012 3275.222 1324733.194
~o de Resina(g) Produca
s2
H0 : H :
Estat stica: Regi~ ao de Rejeic~ ao:
= 2 A 6=
A
2
B B
2
Conclus~ ao: Como 12:182 > 4:357, rejeita-se H0. Assume-se que as vari^ ancias s~ ao diferentes.
Comparando as Medias
Hipoteses:
H0 : xA = xB H : xA 6= xB
Estat stica:
2 2 d x1 ; x2) = s1 + s2 = 1324733:194 + 108740:944 = 159274:9034 Var( n1 n2 9 9 x ; x ) ; (1821 : 778 ; 3275 :222) ; 0 = ;1453:444 = -3.642 ( p = t = qA B 399:0926 159274:9034 d x1 ; x2) Var(
Aula 16 14
jtj t ;
1
=2 2(n;1)
) jtj t :
0 975 16
) jtj 2:120
Conclus~ ao: Como j ; 3:642j > 2:120, rejeita-se H0 ao n vel de 5% de probabilidade. Conclui-se ha evid^ encias para se a rmar que os metodos de resinagem s~ ao diferentes.
H0 : H :
Os resultados obtidos foram:
Processo
T; N
=0 T ; N 6= 0
Tradicional 120 140 80 75 110 150 6 112.5 937.5 Novo 105 95 108 120 90 5 103.6 137.3 Estat stica:
d x1 ; x2) = 937:5 + 137:3 = 183:711 Var( 6 5 112 : 5 ; 103 :6 = 8:90 = 0.657 t = p 13:554 183:711 "; #
Gramatura (g=m2)
s2
2 937:5 2 137:3 2 137 : 3 937 : 5 6 = 6;1 + 55 = 6 + 5 ;1 :3641 = 6:655 ! 6 = 33749 5071:3254 jtj t0:975 6 ) jtj > 2:447
Conclus~ ao: Como j0:657j < 2:447, n~ ao se rejeita H0 e conclu-se que n~ ao ha evid^ encia (ao n vel de 5% de probabilidade) para a rmar que os processos produzem papel com gramaturas medias diferentes.
Aula 16 15
Conceitos-Chave
~ o F - regia ~o de rejeica ~o na distribuica ~o F estat stica F - distribuica teste F bicaudal - teste F monocaudal - estat stica t para ~o de duas medias - varia ^ncia da diferenca das medias comparaca contexto observacional - contexto experimental teste t pareado ^ncias homog^ ^ncias heterog^ teste t para varia eneas - teste t varia eneas ^ ^ com amostras de mesmo tamanho - teste t variancias heterogeneas com amostras de tamanhos diferentes
Exerc cios
16.1 Acredita-se que a adubac~ ao de cobertura em Eucalyptus grandis nem sempre produz
um ganho na produc~ ao mas aumenta a homogeneidade das arvores. Formule hipoteses estat sticas apropriadas e teste-as utilizando os dados da tabela abaixo.
Floresta Adubada DAP (cm)
14.9 18.6 16.8 14.6 13.8 20.7 15.8 20.1 19.4 18.4 18.5 15.3 16.6 18.9 18.1 14.4 14.5 14.0 16.3 17.6 17.6
~ o Adubada Floresta Na
21.6 25.8 18.7 16.7 23.1 14.6 6.4 12.2 31.5 4.1 11.5 27.2 8.0 22.5 25.1 16.8 17.4 20.7 14.8 15.8 9.3
marcante na grau de rachadura de topo de Eucalyptus saligna. Comparando dois grupos de arvores o pesquisador obteve os dados na tabela abaixo. Teste as hipoteses apropriadas e estabeleca as suas conclus~ oes.
Numero de Rachaduras / cm2 ~ o melhoradas Arvores na Arvores melhoradas
0.2 6.6 8.0 2.2 1.9 6.8 1.7 6.3 1.4 2.6 4.6 4.8 4.3 4.4 3.1 3.8
16.3 Um engenheiro orestal deseja comparar a domin^ ancia de duas especie nativas. Num
levantamento com 31 parcelas, a especie A teve domin^ ancia media de 5.3 m2 =ha (desvio 2 padr~ ao de 1.2) e a especie B teve media de 6.7 m =ha (desvio padr~ ao de 2.1). Estabeleca a hipoteses estat sticas apropriadas. Teste as hipoteses e estabeleca as suas conclus~ oes.
dos produtos qu micos na utlima semana. Suspeitando que este aumento se deve ao fato da madeira dos lotes mais recentes possuir densidade maior que a madeira dos lotes mais
Aula 16 16
antigos, ele veri cou as tabelas de controle de densidade da madeira feita no patio da fabrica (tabela abaixo). O aumento de produtos qu micos no processo de fabricac~ ao poderia ser atribuido a um aumento na densidade da madeira entrando na fabrica ?
Ultima Semana Densidade da Maderia (g=cm3)
0.645 0.711 0.705 0.549 0.676 0.662 0.709 0.637 0.711 0.728 0.575 0.613 0.880 0.625 0.684 0.622 0.579 0.490 0.529 0.626 0.619 0.696 0.642 0.687 0.603 0.708 0.667 0.425 0.665
Semana Anterior
0.856 0.704 0.755 0.582 0.836 0.550 0.819 0.741 0.681 0.713 0.882 0.844 0.601 0.627 0.628 0.691 0.599 0.669 0.746 0.607 0.547 0.680 0.654 0.701 0.741 0.563 0.723 0.719 0.675 0.620
16.5 Com o objetivo de veri car o efeito da exposic~ ao do solo sobre a microfauna do solo,
uma pesquisadora fez levantamentos de microfauna antes e depois da exposic~ ao do solo em areas desmatadas de varios tipos de ecossistemas (tabela abaixo). Teste as hipoteses apropriadas e estabeleca a sua conclus~ ao. No. de Micro-organismos/cm3 Antes Depois Campo Limpo 1430 780 Cerrado 2500 1020 Restinga 732 640 Caatinga 640 680 Floresta Estacional 10530 2520 Floresta Pluvial 21883 2302 Ecossistema
O teste de Qui-Quadrado (teste 2) foi construido para comparar dois grupos de frequ^ encias. Exemplo 17.A Distribuic~ ao dos Di^ ametros das Arvores numa Floresta
Um engenheiro orestal deseja saber se a distribuic~ ao Normal e um bom modelo estat stico para os di^ ametros das arvores de uma oresta plantada de Eucalyptus camaldulensis. Classes de Di^ ametros (cm) Frequ^ encia Lim. Inferior Lim. Superior (arv=ha) 10.0 12.5 4 12.5 15.0 23 15.0 17.5 50 17.5 20.0 132 20.0 22.5 224 22.5 25.0 286 25.0 27.5 295 27.5 30.0 243 30.0 32.5 161 32.5 35.0 73 35.0 37.5 9 1500 A tabela acima apresenta a frequ^ encia observada para cada classe de di^ ametro. As hipoteses sendo testadas s~ ao:
H0 : H :
b b
onde fi e a frequ^ encia observada e fi e a frequ^ encia que esperamos para dados com distribuic~ ao Normal. Para veri carmos se as frequ^ encias observadas e as frequ^ encias esperadas est~ ao proximas, devemos calcuar as frequ^ encias esperadas. Para cada classe de di^ ametro fazemos os seguintes calculos: Valores da Normal Padronizada para os Limites:
Aula 17 2
bb b
q q
Classes Di^ ametros (cm) Frequ^ encia Normal Padronizada Probab. Frequ^ encia (i) Limite Limite Observada Limite Limite por Classe Esperada Inferior Superior (arv=ha) Inferior Superior (arv=ha) 1 2 3 4 5 6 7 8 9 10 11
dapI i
10.0 12.5 15.0 17.5 20.0 22.5 25.0 27.5 30.0 32.5 35.0
dapS i
12.5 15.0 17.5 20.0 22.5 25.0 27.5 30.0 32.5 35.0 37.5
fi
-3.28 -2.74 -2.20 -1.67 -1.13 -0.59 -0.05 0.48 1.02 1.56 2.10
zI i
-2.74 -2.20 -1.67 -1.13 -0.59 -0.05 0.48 1.02 1.56 2.10 2.63
zS i
0.0108 0.0336 0.0817 0.1484 0.2025 0.2043 0.1617 0.0945 0.0415 0.0136 0.9952
b 0.0026
pi
3.90 16.20 50.40 122.55 222.60 303.75 306.45 242.55 141.75 62.25 20.40 1492.8
fi
X2 =
X (f ; fb) b f
k i i i=1 i
que so podera assumir valores positivos. Grandes valores de X 2 indicam que as frequ^ encias s~ ao bastante distintas, levando-nos a rejeitar H0. Sob H0, a estat stica X 2 segue a distribuic~ ao de Qui-Quadrado ( 2 ). Esta distribuic~ ao tem as seguintes propriedades:
2
Aula 17 3
a distribuic~ ao e unimodal, assimetrica a esquerda possui um unico par^ ametro: graus de liberadade = n ; 1 ; p, onde p e o numero de par^ ametros estimados para encontrar as frequ^ encias esperadas.
= 10 = 20 = 30
10
20
30
40
50
Classes Di^ ametros (cm) Frequ^ encia Frequ^ encia X2 (i) Limite Limite Observada Esperada Inferior Superior (arv=ha) (arv=ha) (fi ; fi )2 1 2 3 4 5 6 7 8 9 10 11
dapI i
10.0 12.5 15.0 17.5 20.0 22.5 25.0 27.5 30.0 32.5 35.0
dapS i
12.5 15.0 17.5 20.0 22.5 25.0 27.5 30.0 32.5 35.0 37.5
fi
3.90 16.20 50.40 122.55 222.60 303.75 306.45 242.55 141.75 62.25 20.40 1492.8
fi
0.003 2.854 0.003 0.729 0.009 1.037 0.428 0.001 2.614 1.856 6.371 15.905
fi
b b
A valor cr tico para 2 ao n vel de 5% de probabilidade e com = 11 ; 1 ; 2 = 8 graus de liberdade e 15.507. Como
2 = 15.507
10
20
30
= 15:507 rejeitamos H0 e conclu mos que ha evid^ encias (ao n vel de 5% de probabilidade) de que o di^ ametro das arvores da oresta n~ ao segue a distribuic~ ao Normal.
2 0:95 =8
X 2 = 15:905 >
A-1
Colunas 16 17 18 19 20
A-2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
42165 17186 88019 73984 64178 60987 62759 69098 09690 34934 76303 02455 83810 27329 41187 74140 69008 70862 93192 16146 16218 50985 88210 26357 16629 89864 41764 49543 92900 81910 07273 44744 59049 91194 63395 96776 65703 33982 62800 01650 18034 33755 68668 85164 35409
53648 35082 44552 06982 29530 63701 39064 47903 10998 04670 96793 23467 82163 89043 42664 30401 40976 79284 64786 24939 64385 84421 60901 51990 91364 82058 11638 58827 95237 00774 14043 75503 26420 35877 59659 91429 22165 14156 01895 24083 04957 31725 55013 40008 43191
23781 11609 01298 57401 11201 64052 69267 57767 81103 94135 01008 51836 28566 60936 02228 40969 23097 88385 14476 79222 76563 69289 00889 46249 73398 23929 98271 21371 86410 04190 80432 30140 56665 82939 54752 80951 91226 05501 26926 23285 47794 34521 52031 83167 80299
61440 21142 92145 46327 11848 03482 45633 00789 29359 30083 57706 46352 15985 61771 81133 24053 67454 87849 06706 31585 55292 09914 36179 62216 13823 00999 81056 75317 15652 33528 33541 01920 02075 56681 83240 20937 96651 02125 98283 11298 60553 76179 86387 27823 29665
07050 49037 22778 33441 23831 15119 21715 00197 73418 42034 93717 71524 28592 73344 27379 03853 08611 67488 88219 52940 44910 85585 95595 85683 19038 69219 78376 91602 21033 18807 95806 66214 73873 26239 40201 51148 77591 42252 19411 14134 05921 50793 55883 21266 28438
37998 59028 16430 39177 35181 67928 51964 94958 53278 02213 15862 91560 67643 97478 08643 61559 12703 23064 33105 01301 31658 88017 97065 21568 40454 39167 32132 48134 43878 64371 29973 43834 37727 43530 75321 22800 39259 45740 58220 36497 40798 72683 96150 65425 01645
91935 60429 75500 73562 71664 85876 24053 91347 41076 21936 00642 69802 96112 49700 74930 05995 25426 17334 13158 70503 27920 02160 91100 33080 96427 12819 91701 09999 43415 78867 20871 01562 51442 29668 06777 93427 83294 74129 11773 27930 21115 54808 63309 90630 03950
77759 64920 03045 34604 13627 28907 42376 17714 48164 03303 81828 22287 45673 09037 54711 24126 51482 92617 03142 82704 14819 03604 93526 05738 90364 63579 82895 08958 77988 49337 49814 22678 25202 97729 97949 42432 52333 89349 07989 00930 69277 85102 91525 21315 82683
19704 16096 05800 94405 47908 78476 17255 12752 20004 92272 73887 57267 35587 64897 03608 17948 10591 97037 67513 39142 12959 84955 73198 38108 18166 68274 30675 70837 22126 69665 61299 78464 49659 35020 29375 39814 92003 95643 25152 95384 79212 54916 74170 21833 14189
74933 86919 10042 54252 38205 78618 74126 71803 07060 00319 76319 87487 89684 34947 91965 14561 43370 01607 39149 12421 90258 53730 12242 66755 55014 95242 24803 57100 42693 38686 06543 32970 39004 00290 45443 03188 55615 91532 65949 94789 18303 20944 20909 94512 47057
B-1
C-1
0.600 0.3249 0.2887 0.2767 0.2707 0.2672 0.2648 0.2632 0.2619 0.2610 0.2602 0.2596 0.2590 0.2586 0.2582 0.2579 0.2576 0.2573 0.2571 0.2569 0.2567 0.2566 0.2564 0.2563 0.2562 0.2561 0.2560 0.2559 0.2558 0.2557 0.2556 0.2550 0.2549 0.2547 0.2546 0.2545 0.2544 0.2543 0.2542 0.2542 0.2541 0.2541 0.2541 0.2540 0.2538 0.2537 0.2535 0.2533
D-1
1
1 2 3 4 5 6 7 8 9 10 20 30 40 50 60 70 80 90 100 1 161.448 199.500 215.707 224.583 230.162 233.986 236.768 238.883 240.543 241.882 248.013 250.095 251.143 251.774 252.196 252.497 252.724 252.900 253.041 254.314 2 18.513 19.000 19.164 19.247 19.296 19.330 19.353 19.371 19.385 19.396 19.446 19.462 19.471 19.476 19.479 19.481 19.483 19.485 19.486 19.496 3 10.128 9.552 9.277 9.117 9.013 8.941 8.887 8.845 8.812 8.786 8.660 8.617 8.594 8.581 8.572 8.566 8.561 8.557 8.554 8.526 4 7.709 6.944 6.591 6.388 6.256 6.163 6.094 6.041 5.999 5.964 5.803 5.746 5.717 5.699 5.688 5.679 5.673 5.668 5.664 5.628
2
5 6.608 5.786 5.409 5.192 5.050 4.950 4.876 4.818 4.772 4.735 4.558 4.496 4.464 4.444 4.431 4.422 4.415 4.409 4.405 4.365 6 5.987 5.143 4.757 4.534 4.387 4.284 4.207 4.147 4.099 4.060 3.874 3.808 3.774 3.754 3.740 3.730 3.722 3.716 3.712 3.669 7 5.591 4.737 4.347 4.120 3.972 3.866 3.787 3.726 3.677 3.637 3.445 3.376 3.340 3.319 3.304 3.294 3.286 3.280 3.275 3.230 8 5.318 4.459 4.066 3.838 3.687 3.581 3.500 3.438 3.388 3.347 3.150 3.079 3.043 3.020 3.005 2.994 2.986 2.980 2.975 2.928 9 5.117 4.256 3.863 3.633 3.482 3.374 3.293 3.230 3.179 3.137 2.936 2.864 2.826 2.803 2.787 2.776 2.768 2.761 2.756 2.707 10 4.965 4.103 3.708 3.478 3.326 3.217 3.135 3.072 3.020 2.978 2.774 2.700 2.661 2.637 2.621 2.610 2.601 2.594 2.588 2.538
1
1 2 3 4 5 6 7 8 9 10 20 30 40 50 60 70 80 90 100 20 4.351 3.493 3.098 2.866 2.711 2.599 2.514 2.447 2.393 2.348 2.124 2.039 1.994 1.966 1.946 1.932 1.922 1.913 1.907 1.843 30 4.171 3.316 2.922 2.690 2.534 2.421 2.334 2.266 2.211 2.165 1.932 1.841 1.792 1.761 1.740 1.724 1.712 1.703 1.695 1.622 40 4.085 3.232 2.839 2.606 2.449 2.336 2.249 2.180 2.124 2.077 1.839 1.744 1.693 1.660 1.637 1.621 1.608 1.597 1.589 1.509 50 4.034 3.183 2.790 2.557 2.400 2.286 2.199 2.130 2.073 2.026 1.784 1.687 1.634 1.599 1.576 1.558 1.544 1.534 1.525 1.438
2
60 4.001 3.150 2.758 2.525 2.368 2.254 2.167 2.097 2.040 1.993 1.748 1.649 1.594 1.559 1.534 1.516 1.502 1.491 1.481 1.389 70 3.978 3.128 2.736 2.503 2.346 2.231 2.143 2.074 2.017 1.969 1.722 1.622 1.566 1.530 1.505 1.486 1.471 1.459 1.450 1.353 80 3.960 3.111 2.719 2.486 2.329 2.214 2.126 2.056 1.999 1.951 1.703 1.602 1.545 1.508 1.482 1.463 1.448 1.436 1.426 1.325 90 3.947 3.098 2.706 2.473 2.316 2.201 2.113 2.043 1.986 1.938 1.688 1.586 1.528 1.491 1.465 1.445 1.429 1.417 1.407 1.302 100 3.936 3.087 2.696 2.463 2.305 2.191 2.103 2.032 1.975 1.927 1.676 1.573 1.515 1.477 1.450 1.430 1.415 1.402 1.392 1.283
3.841 2.996 2.605 2.372 2.214 2.099 2.010 1.938 1.880 1.831 1.571 1.459 1.394 1.350 1.318 1.293 1.274 1.257 1.243 1.003
D-2
1
1 2 3 4 5 6 7 8 9 10 20 30 40 50 60 70 80 90 100 1 647.789 799.500 864.163 899.583 921.848 937.111 948.217 956.656 963.285 968.627 993.103 1001.414 1005.598 1008.117 1009.800 1011.004 1011.908 1012.612 1013.175 1018.258 2 38.506 39.000 39.165 39.248 39.298 39.331 39.355 39.373 39.387 39.398 39.448 39.465 39.473 39.478 39.481 39.484 39.485 39.487 39.488 39.498 3 17.443 16.044 15.439 15.101 14.885 14.735 14.624 14.540 14.473 14.419 14.167 14.081 14.037 14.010 13.992 13.979 13.970 13.962 13.956 13.902 4 12.218 10.649 9.979 9.605 9.364 9.197 9.074 8.980 8.905 8.844 8.560 8.461 8.411 8.381 8.360 8.346 8.335 8.326 8.319 8.257
2
5 10.007 8.434 7.764 7.388 7.146 6.978 6.853 6.757 6.681 6.619 6.329 6.227 6.175 6.144 6.123 6.107 6.096 6.087 6.080 6.015 6 8.813 7.260 6.599 6.227 5.988 5.820 5.695 5.600 5.523 5.461 5.168 5.065 5.012 4.980 4.959 4.943 4.932 4.923 4.915 4.849 7 8.073 6.542 5.890 5.523 5.285 5.119 4.995 4.899 4.823 4.761 4.467 4.362 4.309 4.276 4.254 4.239 4.227 4.218 4.210 4.142 8 7.571 6.059 5.416 5.053 4.817 4.652 4.529 4.433 4.357 4.295 3.999 3.894 3.840 3.807 3.784 3.768 3.756 3.747 3.739 3.670 9 7.209 5.715 5.078 4.718 4.484 4.320 4.197 4.102 4.026 3.964 3.667 3.560 3.505 3.472 3.449 3.433 3.421 3.411 3.403 3.333 10 6.937 5.456 4.826 4.468 4.236 4.072 3.950 3.855 3.779 3.717 3.419 3.311 3.255 3.221 3.198 3.182 3.169 3.160 3.152 3.080
1
1 2 3 4 5 6 7 8 9 10 20 30 40 50 60 70 80 90 100 20 5.871 4.461 3.859 3.515 3.289 3.128 3.007 2.913 2.837 2.774 2.464 2.349 2.287 2.249 2.223 2.205 2.190 2.179 2.170 2.085 30 5.568 4.182 3.589 3.250 3.026 2.867 2.746 2.651 2.575 2.511 2.195 2.074 2.009 1.968 1.940 1.920 1.904 1.892 1.882 1.787 40 5.424 4.051 3.463 3.126 2.904 2.744 2.624 2.529 2.452 2.388 2.068 1.943 1.875 1.832 1.803 1.781 1.764 1.751 1.741 1.637 50 5.340 3.975 3.390 3.054 2.833 2.674 2.553 2.458 2.381 2.317 1.993 1.866 1.796 1.752 1.721 1.698 1.681 1.667 1.656 1.545
2
60 5.286 3.925 3.343 3.008 2.786 2.627 2.507 2.412 2.334 2.270 1.944 1.815 1.744 1.699 1.667 1.643 1.625 1.611 1.599 1.482 70 5.247 3.890 3.309 2.975 2.754 2.595 2.474 2.379 2.302 2.237 1.910 1.779 1.707 1.660 1.628 1.604 1.585 1.570 1.558 1.436 80 5.218 3.864 3.284 2.950 2.730 2.571 2.450 2.355 2.277 2.213 1.884 1.752 1.679 1.632 1.599 1.574 1.555 1.540 1.527 1.400 90 5.196 3.844 3.265 2.932 2.711 2.552 2.432 2.336 2.259 2.194 1.864 1.731 1.657 1.610 1.576 1.551 1.531 1.516 1.503 1.371 100 5.179 3.828 3.250 2.917 2.696 2.537 2.417 2.321 2.244 2.179 1.849 1.715 1.640 1.592 1.558 1.532 1.512 1.496 1.483 1.347
5.024 3.689 3.116 2.786 2.567 2.408 2.288 2.192 2.114 2.048 1.708 1.566 1.484 1.428 1.388 1.357 1.333 1.313 1.296 1.004
Bibliografia
(Em Reserva na Biblioteca Helldio do Amaral Mello) [AZEVEDO & CAMPOS, 1987] Azevedo, A.G. de; Campos, P.H.B. de 1987 Estatstica Bsica. Rio de Janeiro: Livros Tcnicos e Cientficos Editora Ltda. [BEIGUELMAN, 1994] Beiguelman, B. 1994 Curso Prtico de Bioestatstica. (3a. edio). Ribeiro Preto: Sociedade Brasileira de Gentica. Iemma, A.F. 1977 Estatstica Descritiva. Piracicaba: Publicaes. [MENDENHALL, 1985] Mendenhall, W. 1984 Probabilidade e Estatstica (vol. 2). Rio de Janeiro: Editora Campus. [OLIVEIRA ,1977] Oliveira Costa, Neto, P.L. de 1977 Estatstica. So Paulo: Edgard Blcher. [ROCHA, 1975] Rocha, M.V. da 1975 Curso de Estatstica. Rio de Janeiro: Fundao Instituto Brasileiro de Geografia e Estatstica.. [WALLIS & ROBERTS, 1964] Wallis, W.A.; Roberts, H.V. 1964 Curso de Estatstica. Rio de Janeiro: Editora Fundo Cultural. [IEMMA, 1992]
2.1 (a) nominal; (b) de razo; (c) nominal; (d) de razo; (e) nominal; (f) nominal; (g) de razo; (h) nominal; (i) ordinal; (j) de razo; (k) ordinal; (l) ordinal; (m) nominal. 2.2 H [0,100]; V [ 0,1000] ; X {0,1,2,..., } ; I {0,2 }; Y {0,1,2 ,..., }; S [0,1] ; A [ 0,1] ; E [0,1] ; C [ 0,30] ; D1 [0,360] ; D2 [ 0,100] ; F [ 0,360]
7.3 (a) S={ (A,A); (A,V); (A,R); (V,A); (V,V); (V,R); (R,A); (R,V); (R,R) } (b) S={ (A,A); (A,V); (A,R); (V,V); (V,R); (R,R) } (c) S={ (A,V); (A,R); (V,A); (V,R); (R,A); (R,V) } (d) S={ (A,V); (A,R); (V,R) } 7.4 (a) S={III; IIF; IFI; FII; IFF; FIF; FFI; FFF} (b) A={IIF; IFI; FII; IFF; FIF; FFI; FFF} (c) B={IFF; FIF; FFI} 7.6 (a) (5/6) 2 = 25/36 (b) 10/36 (c) 1/36 (d) 11/36 (e) 1 - P(A) = P(D) = 11/36 7.7 (a) disjuntos (b) disjuntos (c) C subconjunto de F, ou F implica C (d) disjuntos (e) idnticos (f) disjuntos 7.8 (a) 410/830 (b) 534/830 (c) 189/830 (d) 225/830 (e) 637/830 (f) 379/830 (g) 193/830 7.9 (a) Lote 1 0.16; Lote 2 0.6; Lote 3 0.22 (desigualdade de Boole) (b) Lote 2, menor soma das probabilidades (desigualdade de Boole) 7.10 (a) 27/59 (b) 42/59 (c) 22/27 (d) 5/27 (e) 22/42=11/21 (f) 20/42=10/21 7.11 (a) 0.6550 (b) 0.7143 (c) 1 7.12 (a) 0.0240 (2.4%) (b) 0.2083 (c) 0.7917 (d) 0.0461 (e) 0.9539 7.13 (a) 0.52 (b) 0.03 (c) 0.27 (d) 0.49 7.14 0.66 7.15 1 - (5/6) 20 7.16 1 - (0.975) 30 7.17 1 L 365 365 365 365 7.20 (a) (0.95) 10 (b) 1 - (0.99) 10
(c) (0.05) 10