Sei sulla pagina 1di 69

A Conduo da Anlise 2014/2

Thierry R. Gasnier/ Universidade Federal do Amazonas

A Conduo da Anlise

2014/2

em Cincias Biolgicas I - Base Conceitual

Thierry R. Gasnier
Universidade Federal do Amazonas

A Conduo da Anlise I- 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

Sumrio
Introduo ............................................................................................. 3
1 Estatstica na perspectiva do usurio ........................................... 4
1.1 A cincia e a estatstica............................................................. 4
1.2 Questo, hiptese, previso e evidncia. ................................ 6
1.3 Tipos de evidncias ................................................................... 9
1.4 Tipos de validao de evidncias .......................................... 13
1.5 Estatsticas intuitiva e frequentista..................................... 18
2 Do problema biolgico ao estatstico........................................... 22
2.1 Entidades ................................................................................. 22
2.2 Propriedades ........................................................................... 23
2.3 Tabelas e grficos EPR .......................................................... 24
2.4 Relaes entre variveis ......................................................... 24
2.5 A estatstica para estabelecer relaes. ................................ 25
3 Confiana na medida e independncia ....................................... 29
3.1 Nveis e escalas de medida ..................................................... 29
3.2 Atribuio de nveis nominais e ordinais ............................. 31
3.3 Exatido, preciso e acurcia. ............................................... 32
3.4 Distribuies de frequncias .................................................. 36
3.5 Parmetros populacionais ..................................................... 38
3.6 Intervalos de confiana de parmetros. ............................... 39
3.7 Independncia para parmetros univariados ..................... 43
3.8 Independncia em anlises de relaes ................................ 44
3.9 Consideraes complementares ............................................ 46
4 A lgica dos testes de hipteses .................................................... 51
4.1 O mtodo hipottico dedutivo ............................................... 51
4.2 Estabelecendo hipteses de trabalho .................................... 53
4.3 Descartando hipteses com procedimentos ..................... 55
4.4 Descartando a hiptese do acaso ........................................... 57
4.5 Nvel de significncia e tipos de erros................................... 59
4.6 Consideraes complementares ............................................ 61

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

5 Diversidade de testes e suas premissas ....................................... 69


5.1 Ecologia e diversidade dos testes estatsticos. .................. 69
5.2 Testes com apenas uma varivel ........................................... 69
5.3 Testes com duas variveis ...................................................... 70
5.4 Premissas dos testes paramtricos ........................................ 71
5.5 Transformao de dados ....................................................... 75
5.6 Outras premissas .................................................................... 75
5.7 Contrastes ................................................................................ 77
6 Planejamento Amostral ................................................................ 79
6.1 Independncia entre unidades amostrais............................ 79
6.2 A coleta parecia apropriada, mas... ...................................... 79
6.3 Tipos de variveis dentro de mapas conceituais. ................ 82
6.4 Controle: tratamento, funo e estratgia ........................... 85
6.5 Escolha a sua abordagem ...................................................... 90
6.6 O experimento como modelo na pesquisa de relaes. ....... 90
6.7 Abordagens quase experimentais. ........................................ 91
6.8 Abordagens no experimentais ............................................. 92
6.9 Independncia pela distncia ................................................ 95
7 Maximizando o poder do teste ..................................................... 98
7.1 Testes unicaudais e testes bicaudais ..................................... 98
7.2 Testes pareados e testes em blocos ........................................ 99
7.3 Nveis fixos e nveis livres..................................................... 101
7.4 Relaes retilineares, curvilineares e monotonicidade. .... 102
7.5 O poder e os tipos de teste ................................................... 102
7.6 O poder e os nveis das variveis em estudo ...................... 104
7.7 Perdas voluntrias de poder ................................................ 105
7.8 Testes mltiplos .................................................................... 106
8 Glossrio ...................................................................................... 108
9 Bibliografia citada e recomendada ........................................... 112
Anexo:

Chaves e Guias para uso de testes e grficos

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

Introduo

tramos nas questes conceituais sobre a forma


correta de utiliz-la.

Utilizei o ttulo A Conduo da Anlise porque


gosto de comparar a anlise na pesquisa cientfica
com outra atividade complexa do cotidiano: a conduo de um veculo (carro, bicicleta, etc.). Acho
incrvel como um condutor consegue pensar ao
mesmo tempo no seu objetivo, no caminho e manter
distncia segura dos outros veculos. A anlise de
dados vista em uma perspectiva ampla, que vai do
planejamento e escolha de medidas, at a interpretao e comunicao dos resultados, tambm exige
esta forma complexa de pensar. Dirigir uma atividade quase assustadoramente complexa a princpio,
mas, depois de algum tempo de treinamento, vai
ficando cada vez mais fcil, mesmo sem deixar de
ser complexa, tendendo a tornar-se agradvel. O
mesmo pode ocorrer com a habilidade de analisar
dados. Analisar dados no pode ser um trauma, tem
que ser uma atividade natural, tranquila, e at divertida do cotidiano da pesquisa.

Para a parte prtica, apresentamos um texto anexo


com instrues para a escolha de muitos testes e
grficos; uma caixa de ferramentas bsica para
anlises e apresentao de resultados. Estas instrues servem para qualquer programa estatstico.
Adicionalmente, inclumos neste anexo as instrues especficas sobre como fazer esses teste e
grficos no programa MYSTAT12, que pode ser
baixado gratuitamente pela internet.

Este livro no uma introduo estatstica, uma


introduo bioestatstica aplicada, isto , ao uso
de ferramentas estatsticas para a resoluo de
problemas biolgicos. importante separarmos dois
contextos da estatstica, o contexto da criao e
fundamentao matemtica e o contexto da aplicao. H profissionais que desenvolvem ferramentas
estatsticas e avaliam suas aplicaes e limitaes,
mas h tambm pessoas que sabem utilizar estas
ferramentas com competncia apenas com a base
necessria para o seu uso. O primeiro como um
engenheiro de carros ou um construtor de instrumentos musicais e o segundo como um piloto ou
um msico. Quando uma pessoa que conhece a
fundamentao e a aplicao vai ajudar outra pessoa com um problema estatstico, no se espera
que a primeira explique noes de clculo de probabilidade e faa demonstraes de frmulas (questes mecnicas), espera-se que ela v direto ao
assunto e explique qual a ferramenta apropriada,
quais suas premissas e limitaes, como se realiza
o teste em um programa estatstico e quais so os
grficos mais apropriados para comunicar os resultados (questes de conduo). Por isto, o contedo
de um livro de apoio na formao de estatsticos
(como para engenheiros ou construtores de instrumentos) deve ser diferente de um livro de apoio para
usurios (como para pilotos ou msicos). Podemos
ganhar muito se terceirizamos a parte matemtica
da estatstica para os computadores e nos concen-

Este livro foi desenvolvido ao longo de mais de 15


anos ministrando aulas de bioestatstica em graduao e ps-graduao na Universidade Federal do
Amazonas (UFAM) e no Instituto Nacional de Pesquisas da Amaznia (INPA). Devo aos alunos pelo
estmulo e ajuda na busca de contedos mais apropriados para uma estatstica aplicada pesquisa. O
amadurecimento do texto foi um processo longo e
se deveu muito contribuio de vrias pessoas.
Pelas discuties de questes bsicas que nortearam a redao, agradeo a William Magnusson,
Donald Macnaughton, Cintia Cornlius, Jos Luiz
Camargo e Paulo Estefano. Agradeo pelas sugestes e crticas a verses anteriores do texto a Bruno
Spacek, Cecilia Roma, Erika Portela, Fabrcio Baccaro, Jos Cardoso Neto e Srgio Rodrigues da
Silva.
Este texto usado em disciplinas da UFAM continuar em processo de
aperfeioamento. Verses mais recentes podero ser obtidas no site
www.intertropi.ufam.edu.br/ docs.html. Neste site tambm esto as
ltimas verses das apostilas para escolha de grficos e testes e outros
anexos. Sugestes podero ser enviadas para o email tgasnier@ufam.edu.br. Os direitos autorais desta apostila pertencem ao
autor e Universidade Federal do Amazonas. permitida a cpia sem
fins lucrativos desde que a fonte seja citada.

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

podem ser barreiras para uma compreenso


mais produtiva para usurios de Estatstica.

1 Estatstica na
perspectiva do usurio

Muitas pessoas consideram a estatstica como


uma especialidade da matemtica, mas podemos consider-la um ramo da lgica que faz
uso intensivo de matemtica. Vista em seu sentido amplo, a estatstica lida com pensamento
complexo. Isto no significa que seja uma forma
diferente de pensar, pois tambm complexo
nosso pensamento cotidiano.

1.1 A cincia e a estatstica


A cincia uma descrio da realidade. Como
qualquer descrio, ela idealizada, pois o que
chamamos de realidade sempre uma interpretao. No qualquer descrio, uma descrio crtica, o que significa que coletiva e que
segue normas consensuais de lgica e de validao de evidncias. Os aspectos da realidade
descritos so escolhidos por sua relevncia.
Portanto, a cincia uma descrio idealizada
crtica de aspectos relevantes da realidade.

Por exemplo, chegar a um lugar determinado


em uma cidade uma atividade complexa
(Fig. 1.1). Em primeiro lugar voc precisa conhecer a cidade, ou ter um mapa dela e saber
se orientar pelo mapa. Depois, voc precisa
saber o local exato onde voc est e aonde
quer chegar. Se for de carro, precisa saber dirigir o veculo, o que inclui aspectos de legislao (como saber que no se deve dirigir na
contramo), aspectos psicomotores (como
saber dominar o veculo em uma curva) e o uso

Este um livro sobre mtodos, especificamente


sobre o uso de mtodos estatsticos bsicos em
Biologia. H um risco em se entrar neste assunto destes antes de se v-lo em uma perspectiva
maior, podemos terminar achando que estes
mtodos so A base da cincia. por
isto que comeamos com uma definio
de cincia que determina o que, como e
por que algo cincia em nosso ponto de
vista. Na escolha de um tema de pesquisa, o mais importante o porqu de estudar este tema, a relevncia do que vai ser
estudado. Este o centro do universo em
uma pesquisa. O mtodo necessariamente crtico para ser considerado cientfico, mas, alm disto, no podemos falar
em O mtodo cientfico, mas em mtodos cientficos. O que costuma ser chamado de abordagem estatstica ou quantitativa de anlise de dados apenas uma
caixa de ferramentas metodolgica para
apoiar anlises crticas de dados. uma
caixa de ferramentas extremamente poderosa para algumas situaes, intil em
outras e at perigosa se mal utilizada.
Estatstica significa anlise de dados. Pelo
menos, neste sentido que usaremos a
palavra neste livro. Antes de discutirmos uma
definio mais informativa, vamos refletir sobre
preconceitos acerca do que ela , pois eles

Figura 1.1- A soluo de problemas complexos envolve diferentes nveis de conhecimento, desde os mais "moleculares" at os
mais "globais", como ocorre quando conduzimos um carro at
um endereo ou quando conduzimos uma pesquisa..

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

to do referencial terico do assunto de pesquisa, pois sem ele estamos perdidos. Nosso referencial terico como um mapa necessrio a
cada momento, e dele que nascem as questes de pesquisa. Cada pesquisa tem o seu
referencial, por isto, neste texto comearemos
discutindo sobre uma base comum do que so
questes e hipteses de pesquisas (cap. 1 e 4).
Nas pesquisas que pedem anlises estatsticas
de dados necessrio saber como organiz-los
(cap. 2). Precisamos entender bem as medidas
e as formas de coletar os dados apropriados
para responder questes (Cap. 3 e 6). Finalmente, precisamos saber realizar testes e preparar grficos para uma anlise e comunicao
apropriadas (cap. 5 e 7 e Guia de testes). isto
que um usurio de estatstica precisa saber
fazer bem. Para a maioria dos problemas, o
usurio no precisa lidar diretamente com frmulas ou com algoritmos complexos e menos
ainda com a compreenso de por que as frmulas so vlidas. Este conhecimento matemtico
e de programao pode ajudar, mas tambm
pode atrapalhar, por desviar a ateno do principal. necessrio que se reconhea que os
conhecimentos fundamentais para o estatstico
no coincidem com os conhecimentos fundamentais necessrios para o usurio de estatstica.

correto dos instrumentos (como o freio ou o


limpador de para-brisa). Estamos utilizando
pensamento complexo quando temos que
integrar conhecimentos de diversos aspectos da realidade para atingir um determinado
objetivo. Complexo no significa necessariamente difcil. Muita gente consegue chegar a
um endereo sem muita dificuldade, embora
seja um problema que envolve vrios tipos de
conhecimento. Lidamos com problemas complexos no dia a dia e precisamos aprender a
lidar com problemas complexos na pesquisa.
Hoje em dia no precisamos ter muito conhecimento de mecnica para dirigir um carro e chegar a um endereo. Normalmente basta saber
que temos que colocar gasolina, trocar o leo e
calibrar os pneus ocasionalmente. Pessoas com
conhecimento de mecnica de automveis fazem a manuteno de nossos carros. Engenheiros desenvolvem novas tecnologias com base
em um conhecimento de fsica e de qumica que
os cientistas esto aprofundando nos institutos
de pesquisa e universidades. Estas pessoas,
portanto, nos ajudam a atingir nossos objetivos,
pois nos entregam resolvidos os nveis mais
moleculares ligados ao funcionamento do
veculo. A nossa responsabilidade na conduo
de um veculo, portanto, deve se concentrar no
domnio dos nveis mais globais do problema
de como chegar ao endereo.
Uma concepo equivocada da maioria dos
livros e cursos de Bioestatstica dos ltimos 40
anos que necessrio e suficiente dominar o
nvel molecular da matemtica, como o clculo
de probabilidades, para conduzir uma anlise
de dados. Nesta concepo, coloca-se um peso
desproporcional neste nvel de anlise em detrimento de nveis mais importantes para quem
conduz uma anlise de dados. Felizmente esta
viso est comeando a mudar, mas ainda
preponderante em muitos cursos.

Depois destas consideraes, podemos passar


para uma definio, ... ou duas. Em um sentido
amplo, a Estatstica uma rea do conhecimento que lida com a medida, atribuio de
categorias, coleta, organizao, apresentao, interpretao e apresentao de dados.
O termo tambm pode ser utilizado em um sentido mais estrito referindo-se prioritariamente
matemtica da anlise dos dados, mas fcil
perceber a diferena dentro do contexto em que
o termo est sendo utilizado. A definio ampla
explica o que estatstica pela sua utilidade,
mas ela realmente to necessria?

Para formar usurios de estatstica, necessria uma abordagem que leve em conta que a
pesquisa semelhante forma cotidiana complexa de se pensar. Quando fazemos pesquisa
precisamos, em primeiro lugar, ter conhecimen-

De fato, nem toda a pesquisa precisa da estatstica no sentido estrito do termo, tanto que a
cincia avanou no passado sem ela. Entretanto, por que no aprender a usar uma ferramenta
poderosa que pode nos ajudar em muitas situa-

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

es? Talvez a resposta mais comum seja que


o assunto costuma ser desanimadoramente
chato; mas ningum o acha intil. Se pensar
bem, a competncia de analisar dados no
uma necessidade apenas para quem vai fazer
pesquisas, uma necessidade para qualquer
pessoa. Precisamos de reformulaes sobre o
que ensinado em cursos de estatstica e como, mas este um conhecimento que no deve
ser considerado opcional pelos estudantes.
Naturalmente, a competncia na anlise de
dados ainda mais importante para os interessados em fazer pesquisas.

perceber que a maioria das trepadeiras em uma


floresta sobe na hospedeira girando em sentido
anti- horrio, surge a questo por que isto
acontece? A resposta para esta pergunta no
bvia e a questo relevante porque pode revelar algum aspecto de fisiologia e ecologia de
trepadeiras que so um componente importante
das florestas.
As questes de pesquisa podem ser simples,
mas as respostas podem ser muito complexas.
As questes podem ser amplas (e. g. Por que
os dinossauros desapareceram?) ou restritas a
um contexto menor (e. g. Como possvel a
coexistncia de determinadas espcies de camares que usam o mesmo recurso limitante
em um riacho). Algumas vezes as questes
surgem inesperadamente, como quando surgem pessoas com uma doena estranha desconhecida, mas o mais comum na atividade
cientfica irmos atrs das questes. Levantar
boas questes envolve a capacidade de observao e o conhecimento do referencial terico,
inclusive para perceber que a questo relevante e merece ser estudada. A boa questo
no garante uma boa pesquisa, mas difcil
imaginar uma boa pesquisa sem uma questo
relevante bem definida e original.

Podemos comparar a estatstica com um microscpio, outra ferramenta de pesquisa do


bilogo. O microscpio necessrio para vermos organismos e estruturas muito pequenos e
a estatstica necessria para vermos o que h
por trs de dados. verdade que nem sempre o
microscpio ou a estatstica so necessrios,
mas preciso ter claro que o problema que
define esta necessidade. Uma pessoa que optou por no aprender estatstica est limitando
sua capacidade de analisar dados e de resolver
problemas. A boa notcia, principalmente para
quem no gosta de fazer clculos, que dominar o uso da estatstica hoje depende muito
pouco de se entender as suas bases matemticas, em funo do desenvolvimento dos programas aplicativos de estatstica, o que permite
um melhor aprofundamento nas questes conceituais essenciais de anlise.

Em funo disto, importante refletirmos um


pouco sobre como criamos questes. Saber
criar boas questes uma arte, mas h algumas diretrizes (e. g. texto Writing Good Questions, Hypotheses and Methods disponvel na
internet). Durante a elaborao de um projeto
voc precisa levantar o referencial terico sobre
o assunto, isto , consolidar a base conceitual
consultando pessoas e com uma pesquisa bibliogrfica sria. Levantamento bibliogrfico
uma tarefa intil se voc no estudar o material.
E estudar no apenas ler, dificilmente se consegue elaborar um projeto interessante sem um
grau de envolvimento emocional com o problema. A informao no vem apenas de livros,
necessrio desenvolver a capacidade de observar. Isto significa estar atento, procurar oportunidades de ver fenmenos de interesse e tentar
aplicar a teoria aprendida na leitura para interpretar suas observaes. Este o momento de

A base da estatstica como objeto de estudo


para os estatsticos pode at ser a matemtica.
Entretanto, para o usurio de estatstica, que a
utiliza como uma ferramenta de pesquisa, a
base outra: as questes de pesquisa. por
isto que comearemos por esta base.

1.2 Questo, hiptese, previso e


evidncia.
As questes na pesquisa so perguntas
temticas relevantes sobre a realidade, que
geralmente comeam com como, por
que, o que, quando, onde ou qual,
e cuja resposta no bvia. Por exemplo, ao

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

para aquela questo, mas como um fato inquestionvel e um dos pilares da Biologia moderna.
Portanto, o que era hiptese tornou-se descrio, pois faz parte do que aceitamos como realidade.

gestao da pesquisa, quando ela precisa tomar forma. Esta etapa demanda tempo e muita
concentrao, esquea o estilo de vida Fast
Food quando estiver elaborando um projeto.
Na pesquisa h respostas de dois tipos: descritivas e hipotticas. As respostas descritivas no
envolvem hipteses, como na questo como
o tubo digestivo desta espcie de formiga?.
Basta desenhar ou fotografar e destacar o que
for considerado mais importante. Algumas descries envolvem ferramentas estatsticas, desde mdias aritmticas at grficos multivariados. A descrio de objetos de interesse cientfico, mesmo considerando a complexidade tcnica, costuma ser simples, no sentido de no
envolver hipteses. Talvez por esta simplicidade, as questes descritivas frequentemente
so consideradas inferiores na pesquisa por
algumas pessoas. Para derrubar esta ideia,
basta considerar o impacto que foi a inveno
do microscpio para a biologia, quando todo um
novo mundo de micro-organismos e microestruturas foi descoberto, ou a atual revoluo resultante da descrio de genomas.

Hipteses que no podem ser avaliadas atravs


da observao de fatos no entram na cincia
emprica, por isto, vamos nos referir a hiptese
como sinnimo de hiptese emprica. Hiptese (emprica) significa qualquer afirmao
simples ou complexa que tenha consequncias empricas constatveis (Diez & Molines,
2008). Neste contexto, tanto a teoria da evoluo como a sugesto que determinado comportamento de um inseto indica territorialidade so
hipteses, pois ambas tm consequncias empricas constatveis. Entretanto, mais comum
se usar o termo para ideias relativamente simples (como o exemplo do inseto), ficando o termo Teoria para uma rede complexa de ideias.
Pela definio acima, mesmo hipteses exaustivamente corroboradas so tecnicamente hipteses, mas na prtica, estas se tornam ideias
aceitas com o acmulo de evidncias, como
vimos com a teoria celular. No h verdades
definitivas na cincia, mas podemos falar que
uma hiptese transforma-se em conceito

Nossas descries da realidade param no momento que aparecem dvidas sobre o que estamos vendo. O que pensou o primeiro
bilogo que viu clulas em um microscpio? Provavelmente foi o que so estas
caixinhas?. Quando h questes sem
resposta imediata pela simples observao, criamos alternativas de respostas
possveis e investigamos se esto corretas ou no. Estas respostas possveis so
chamadas de Hipteses. Talvez a primeira
hiptese sobre as caixinhas tenha sido
que eram meras ornamentaes casuais
do primeiro tecido observado, mas esta
hiptese teria cado com as observaes
posteriores de outros organismos. Em
algum momento surgiu a hiptese que as
caixinhas eram uma espcie de diviso na
organizao de todos os organismos. Esta
hiptese se sustentou e foi fortalecida com
Figura 1.2- Uma hiptese avaliada pelo contraste entre suas previses e
as observaes posteriores e enriquecida
as observaes (evidncias). Neste exemplo, as evidncias no apoiam a
hiptese que passar sob uma escada d azar.
com detalhes. Hoje a teoria celular no
mais tratada como uma possvel resposta

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

Uma evidncia pode ser contrria, favorvel ou


indefinida em relao previso. As comparaes das Previses com as Evidncias so
denominadas Contrastes P-E e costumam
seguir regras pr-estabelecidas de anlise que
podem terminar com um aumento ou reduo
da credibilidade das hipteses. Se a credibilidade de uma hiptese aumentou muito, podemos
dizer que respondemos questo. Usarmos o
termo Resposta para denominar o final do
processo de criao cientfica centrado em
questes. No estamos implicando com isto que
a hiptese transformou-se, de forma definitiva,
na resposta para uma questo, apenas que ela
passou por um teste de qualidade rigoroso e a
evidncia serviu para decidirmos que podemos
recomendar a sua aceitao como uma verdade provisria.

cientificamente estabelecido, quando h um


conjunto de evidncias que apoia fortemente
a hiptese como resposta correta a uma
questo. Na realidade, no testamos diretamente hipteses, testamos as previses das
hipteses. Previses so consequncias empricas esperadas de hipteses, e algumas
delas podem ser usadas nos testes das hipteses. No teste de hipteses uma previso
comparada com uma evidncia.
Uma evidncia uma observao nica ou um
conjunto de observaes ou uma rede coesa de
argumentos que serve para propor, sustentar,
provar ou derrubar empiricamente hipteses. As
evidncias podem ser divididas em 3 tipos, a
evidncia inspiradora, que aquela que leva a
novas hipteses; a evidncia verificadora, que
aquela procurada e obtida quando se est
verificando uma hiptese e a evidncia inspiradora e verificadora, que uma descoberta
instantnea. Exemplos: Ao perceber casualmente que bactrias no cresciam prximas a
fungos contaminantes em placas de Petri, surgiu a hiptese que estes fungos poderiam servir
para produo de remdios (evidncia inspiradora). Para testar a hiptese, foram feitos numerosos experimentos que comprovaram que a
eficincia da substncia produzida por estes
fungos na cura de vrias doenas (evidncia
verificadora). Em 1938 foi descoberto um peixe
primitivo chamado Celacanto, que um peixe
filogeneticamente prximo dos primeiros tetrpodes terrestres. Fsseis deste peixe j eram
conhecidos h bastante tempo, mas a hiptese
que este peixe no estava extinto nem passava
pela cabea de ningum. Quando o pesquisador viu o peixe, ele imediatamente o identificou
com segurana. Portanto, ao mesmo tempo em
que esta hiptese nasceu ela j foi comprovada
(evidncia inspiradora e verificadora), e esta foi
uma das maiores descobertas da evoluo dos
vertebrados. Como no vamos trabalhar com
evidncias inspiradoras ou inspiradoras e verificadoras, vamos usar o termo evidncia daqui
para frente sempre no sentido de evidncias
verificadoras, para facilitar a fluncia do texto.

Se a evidncia corresponde ao previsto por uma


hiptese, ento ela apoia a hiptese, mas isto
no basta. Outra hiptese concorrente pode ser
compatvel com a mesma previso. Por isto,
quando temos hipteses concorrentes, temos
de procurar previses exclusivas para aquela
que acreditamos ser a correta. Por exemplo, ao
observar que duas espcies de plantas tendem
a ocorrer juntas, um pesquisador levanta a hiptese que elas tm uma relao mutualista. Para

Figura 1.3- Uma hiptese uma possvel resposta para uma questo.
Para avaliar se efetivamente ela a resposta correta, precisamos
contrastar previses exclusivas dela com os dados (evidncias).
Frequentemente a estatstica uma til ferramenta para realizar este
contraste.

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

testar a hiptese ele faz a previso que quanto


mais plantas de uma espcie houver em um
local, maior ser o nmero das plantas da outra
espcie. Ento, ele recolhe dados de 100 locais
distantes e encontra uma forte correlao positiva. O resultado parece apoiar a hiptese de
mutualismo, mas h um problema. Podemos
sugerir outra hiptese, que as plantas no so
mutualistas, so indiferentes ou at competidoras, e que pode se esperar uma correlao
positiva entre as suas abundncias porque as
duas respondem da mesma forma fertilidade
do solo. Como a evidncia compatvel com as
duas hipteses, o resultado no permite uma
escolha segura. Um teste mais efetivo de mutualismo seria plantar as duas juntas em densidades variveis. A previso pela hiptese de mutualismo que haveria um maior crescimento
de cada uma delas em funo do aumento na
abundncia da outra. Se isto for observado, a
nica hiptese alternativa que resta para explicar a evidncia que a diferena foi em direo
ao esperado por mero acaso. A estatstica til
nesta situao, como ferramenta para a excluso da possibilidade do resultado coincidir com
a previso apenas por acaso.

bairro, conta no paga, banco no repassou


pagamento, etc. Vimos que uma hiptese uma
suposio de um cenrio possvel do qual se
tira uma ou mais consequncias. Ento, voc
testa cada hiptese, por suas previses, at
descobrir qual a correta. Para a hiptese de
mau contato, voc meche nos contatos e verifica se a linha volta. Para a hiptese de problema
na rede telefnica, voc vai ao vizinho ver se
ele tambm est com problema. E assim por
diante, at resolver o problema.
Agora um exemplo biolgico. Algumas pessoas
levantaram a hiptese que pombos conseguiriam se orientar sem referenciais terrestres (possivelmente usando magnetismo). Sua previso
era que um pombo levado em uma caixa fechada de seu ninho na Frana encontraria o caminho de volta se levados Inglaterra, atravessando o mar sem referenciais terrestres. O
experimento foi feito e o pombo conseguiu retornar em poucos dias. No seria impossvel
que uma tempestade o arrastasse exatamente
para o local do seu ninho, mas isto seria to
improvvel que a evidncia foi considerada
conclusiva. De fato, outros pombos cruzaram o
mar, eliminando at as dvidas menos razoveis. Note que uma nica observao tem uma
fora de convencimento muito forte, pois qualquer hiptese alternativa seria extremamente
improvvel.

1.3 Tipos de evidncias


A estatstica uma ferramenta poderosa para
realizar contrastes em muitas situaes de pesquisa. Entretanto, importante reconhecer que
nem sempre ela aplicvel. Para entender isto,
vamos dividir as evidncias de outra forma, pela
sua natureza.

Evidncias factuais importantes so comuns na


histria da cincia. Quando cientistas observaram anomalias na rbita de Netuno ao redor do
Sol levantaram a hiptese que poderia ser uma
perturbao gravitacional causada por um planeta com rbita mais externa, calcularam aonde
o planeta deveria estar e encontraram um novo
planeta que chamaram de Urano. A passagem
do cometa Halley no ano previsto provou que
cometas so corpos celestes com passagens
peridicas; Pasteur derrubou a teoria da gerao espontnea com um simples experimento.
A ideia que a terra era redonda foi comprovada
com a primeira circunavegao.

Evidncia Factual. Uma evidncia factual


quando uma ou poucas
observaes so suficientes
para convencer que uma
hiptese est correta.
Considere primeiro um exemplo cotidiano. Suponha que seu telefone tenha deixado de funcionar. Sua questo : o que causou a interrupo no funcionamento?. Ento, voc pensa nas
possibilidades (hipteses): mau contato na tomada, aparelho quebrado, falta de servio no

Algumas vezes, uma descoberta uma evidncia factual que gera uma hiptese que ela

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

sentaremos um exemplo de evidncia frequentista, o conceito de independncia ser discutido no captulo 3.

mesma sustenta. o caso da descoberta do


peixe primitivo chamado Celacanto em 1938. A
ideia que este peixe no estava extinto nasceu
e se comprovou no mesmo momento em que o
peixe foi identificado como um verdadeiro Celacanto. Esta foi uma das maiores descobertas da
paleontologia, em funo da posio deste peixe na filogenia dos vertebrados. Dificilmente
esta ideia gerada da prpria evidncia seria
chamada de hiptese, mas a evidncia certamente do tipo factual, pois bastou uma observao para termos convico da afirmao.

Voc se questiona: o que a febre? Seria uma


resposta do corpo para ajudar na cura da doena? Ou seria uma reao induzida pelo agente
infeccioso que prolonga a doena? As duas
hipteses fazem sentido, mas como saber qual
a verdadeira? O fato de se observar uma cura
rpida em um paciente cuja febre no foi tratada
uma evidncia favorvel primeira hiptese,
mas muito fraca. Entretanto, um conjunto de
muitos pacientes escolhidos aleatoriamente
sem tratamento contra a febre com cura rpida
comparado com muitos pacientes escolhidos
aleatoriamente com tratamento e cura lenta
seria uma evidncia forte a favor da primeira
hiptese. Este princpio de repetir observaes
e avaliar a fora da evidncia sem precisar conhecer as caractersticas de cada unidade
amostral (no caso o sexo, idade, dieta, etc., das
pessoas) a razo de chamarmos esta evidncia de simples, ainda que a matemtica envolvida possa ser bastante complexa em alguns
casos.

Uma Evidncia Factual no significa uma evidncia definitiva e verdadeira, Colombo achava
que a terra era redonda e mostrou que o mundo
no terminava em um abismo no meio do Atlntico, mas errou ao achar que tinha chegado s
ndias. Evidncias factuais, como todas as outras, dependem de premissas vlidas, isto , de
condies explicitas ou no que justifiquem a
confiana na afirmao. Ainda que estejamos
sempre sujeitos a erros, no preciso muito
esforo para encontrar inmeros exemplos de
evidncias factuais que revolucionaram a cincia e que foram utilizadas para construir nossas
certezas de muitas questes do cotidiano.

Procedimentos, como a atribuio aleatria de


tratamentos, garantem a validade destas tcnicas, o que est restrito a estudos experimentais.
Entretanto, as tcnicas frequentistas simples
podem ser aplicadas em estudos observacionais (em que no manipulamos variveis) em
condies especiais.

Evidncia Frequentista (Simples). Para


facilitar a fluncia do texto, chamaremos as evidncias
frequentistas
simples apenas de evidncias frequentistas; e
chamaremos as evidncias frequentistas complexas de evidncias
contextuais; ambas envolvem mltiplas unidades amostrais. Uma evidncia frequentista
(simples) quando se baseia em vrias unidades
amostrais consideradas como independentes na anlise. As tcnicas associadas s
evidncias frequentistas so o principal assunto
dos cursos bsicos de estatstica, a tal ponto
que muitas pessoas acham que a independncia entre unidades amostrais uma exigncia
de qualquer tcnica estatstica, sem entender o
que esta independncia. Aqui apenas apre-

Evidncia Contextual. Uma evidncia contextual um tipo mais complexo de evidncia na


qual as unidades amostrais no podem ser
consideradas independentes. As evidncias contextuais precisam
incorporar informaes do contexto para evitar
interpretaes equivocadas ou incompletas
relacionadas com o posicionamento das unidades amostrais no tempo, no espao ou em

10

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

alguma forma de posicionamento funcional intrnseca relevante para a questo.

porque a reduo abrupta na abundncia de


dinossauros baseia-se em vrias medidas sucessivas de abundncia de dinossauros (unidades amostrais dependentes de momentos
seguidos no registro fssil ao longo do tempo)
cuja magnitude de variao pde ser considerada no aleatria. As quedas de meteoros
eram eventos comuns durante a formao da
terra, mas foram tornando-se raros at serem
muito raros. Esta tambm uma interpretao
contextual temporal. Portanto, o fato de haver
fortes indcios de uma grande coliso de um
meteoro com a terra nesta poca d muita fora
hiptese da grande extino ser consequncia
do impacto de um meteoro.

Existe uma relao entre a mortalidade por


doenas pulmonares e a sazonalidade climtica? A unidade amostral na figura 1.4 ms. O
padro cclico torna-se evidente pela comparao entre cada valor e o contexto dos demais
valores mais prximos e considerando a poca
do ano. Ao contrrio da evidncia frequentista
simples, os registros neste caso no podem ser
considerados independentes, pois tendem a ser
similares aos registrados no ms anterior e na
mesma poca. A falta de independncia no
necessariamente uma desvantagem. Neste
exemplo, foi justamente pelo fato de haver dependncia entre os valores que pudemos perceber a dinmica da taxa de mortalidade e inferir e dimensionar o efeito do inverno.

A necessidade de informaes de contexto


ocorre em muitos estudos observacionais com
mltiplas unidades amostrais, principalmente
nos fenmenos em que os valores de variveis
Assim como vimos para a evidncia factual, h
tm uma dependncia espacial ou temporal
casos em que a evidncia gera a prpria hiprelevante para o problema em questo. Entretese que ela sustenta. o caso da hiptese que
tanto, existem outras formas de posicionamenhouve uma extino abrupta da diversidade dos
tos intrnsecos entre unidades amostrais. Por
dinossauros h cerca de 50 milhes de anos
exemplo, quando trabalhamos com espcies
depois de reinarem por mais de 100 milhes de
como unidades amostrais, geralmente temos
anos (apenas restaram as aves como descenque levar em conta a posio filogentica da
dentes). um caso de evidncia contextual
espcie. Nos exemplos do pargrafo anterior
utilizamos avaliaes
contextuais qualitativas,
mas h casos em que
so utilizadas tcnicas
estatsticas mais precisas e complexas que
so especficas para
diferentes situaes (e.
g. Geoestatstica, Anlise de sries temporais,
Regresso filogentica).
No abordaremos estas
tcnicas, mas dedicaremos o captulo 6 a
estudos observacionais
em que o cuidado redobrado
com o contexto pode
Figura 1.4- Variao da mortalidade por doenas pulmonares no Reino Unido entre
1974 e 1979 (Daly,et al. 1996). As unidades amostrais ordenadas no tempo revelam um permitir a utilizao da estaevidente padro cclico anual com taxas de mortalidade mais altas no inverno. Nas
tstica frequentista simples.
evidncias contextuais, as informaes de posies (espaciais, temporais, etc.) so
essenciais para a anlise.

11

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

tes ou dependentes, ela mais ou menos convincente pela articulao das ideias.

Evidncia Sistmica (ou Evidncia por Coerncia em Rede). Evidncias sistmicas so


aquelas que encontram
suporte principalmente
na fora da articulao
de ideias e/ou fatos de natureza diferente. Embora sejam as evidncias mais complexas, temos alguma familiaridade com elas porque esto presentes em nosso cotidiano cada vez que
explicamos o motivo de acreditarmos em alguma coisa baseado em uma conjuno de argumentos.

As anlises que envolvem evidncias sistmicas sempre foram importantes na cincia. Uma
dificuldade em trabalhar com evidncias sistmicas que nem sempre fcil convencer pessoas, mesmo com vrios bons argumentos. O
desenvolvimento da estatstica frequentista no
sculo XX possibilitou a criao de critrios
poderosos e objetivos de avaliao de uma
evidncia (quando a evidncia for um conjunto
de dados independentes), a ponto de influenciar o conceito do que cincia. Para muitos
iniciantes, a cincia verdadeira aquela que
envolve estudos experimentais, repeties e
testes estatsticos. O problema que nem sempre a realidade se apresenta como um conjunto
de dados independentes, como ocorre em um
laboratrio. Como usar estatstica para analisar
a revoluo francesa? A exigncia de testes
para considerarmos uma teoria como cientfica
vlida somente se utilizarmos o termo teste
com um significado mais amplo que o de teste
estatstico. Hipteses na Histria, Arqueologia,
Sociologia, Geografia Humana, Economia, Astronomia, Evoluo e outras reas predominantemente no experimentais podem ser testadas
por contraste com outras hipteses comparando
a coerncia do conjunto de cada uma delas, e
lembrando que cada conjunto deve possuir
elementos empricos envolvidos. (e. g. documentos e fatos histricos, objetos arqueolgicos, observaes de corpos celestes).

O que determina a perda da fertilidade em mulheres na menopausa? A maioria das pessoas


acredita que apenas uma consequncia natural da idade, como se isto fosse fisiologicamente
inevitvel. Diamond (2010) sugere uma hiptese
diferente, que a menopausa um fenmeno
adaptativo para a espcie humana. No h
como se testar esta hiptese experimentalmente, mas a anlise possvel e tambm se baseia em comparao de previses. Se a menopausa fosse mero resultado do envelhecimento,
o que poderamos prever? Por exemplo, poderamos prever que a interrupo da fertilidade
fosse comum em outras espcies. Entretanto,
no o que ocorre, na grande maioria das espcies, as fmeas no param a reproduo ou
s deixam de reproduzir ao quando esto muito
velhas, quase morrendo. E se a hiptese de
Diamond estiver certa, o que podemos prever?
Poderamos prever que haveria vantagem na
menopausa relacionada a caractersticas distintas de nossa espcie. Diamond destaca duas
caractersticas: a) um beb to grande que a
chance de morte da me e do beb no parto
sempre foi alta (s reduziu recentemente devido
evoluo da medicina); b) o cuidado parental
dura anos, incluindo a educao. Da conclui
que a interrupo da fertilidade aps certa idade
seria vantajosa pelo aumento da probabilidade
da me conseguir sobreviver para criar todos os
filhos, mesmo perdendo a chance de ter mais
alguns filhos. Em resumo, parar a reproduo
aumentaria o sucesso reprodutivo. O importante
a notar aqui que a concluso no depende de
um fato ou de unidades amostrais independen-

Embora as evidncias possam ser divididas em


quatro tipos, h situaes intermedirias (fig.
1.5). Por exemplo, trs evidncias factuais com
o mesmo resultado so mais fortes que uma
evidncia factual; no chega a ser uma evidncia frequentista simples, mas vai nesta direo.
A dependncia entre unidades amostrais pode
ser considerada to fraca que um problema
contextual pode ser tratado como um problema
frequentista simples. Uma evidncia factual rica
em detalhes pode ser vista como uma evidncia
sistmica. H sempre consideraes sistmicas
em qualquer tipo de evidncia. Por exemplo,
voc confia que os dados de um estudo so

12

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

verdadeiros com base na reputao do pesquisador. Portanto, todas as evidncias so parcialmente sistmicas. As pesquisas costumam
envolver diversas hipteses avaliadas com evidncias factuais, frequentistas, contextuais e/ou
sistmicas. Na interpretao, necessrio se
encontrar coerncia e complementaridade entre
as evidncias, por isto, quase sempre as pesquisas so sistmicas.

1.4 Tipos de validao de evidncias


Quando a polcia chega cena de um crime,
imediatamente isola a rea. A entrada de alguma pessoa que pudesse mudar a posio da
arma do crime poderia anular a validade de uma
evidncia. Tambm na pesquisa necessrio
se verificar a validade de evidncias. Aps a
apresentao se seus resultados, as pessoas
podem te perguntar: voc tem certeza que os
instrumentos estavam calibrados corretamente?; Como voc coletou estas amostras?;
Que teste estatstico voc usou na anlise?,
etc. H diferentes tipos de validao, e falhas
em qualquer uma delas podem anular toda a
validade de um estudo.

Nesta seo vimos que a pesquisa no necessariamente utiliza estatstica (no sentido estrito
de anlise com clculos matemticos) at
mesmo em testes de hipteses. A prxima seo sobre condies necessrias para uma
evidncia (frequentista ou contextual) ser vlida.

1) Validao da medida. a explicao e a


demonstrao que as medidas utilizadas foram
tomadas de forma apropriada e realmente representam aquilo que pretendemos que representem (representatividade conceitual). Se h
dvidas sobre a calibragem de um instrumento,
a medida ter que ser descartada e o experimento repetido. Na hora de entrar dados em um
computador necessrio redobrar a ateno e
ainda assim temos que verificar cuidadosamente que no houve erros de digitao. Nem
preciso se explicar a importncia destes procedimentos em uma pesquisa sria. Estes so os
aspectos mais bvios da validao da medida, o
que no significa que no sejam muito importantes.

Figura 1.5- A diviso das evidncias em quatro tipos uma


simplificao didtica til. Entretanto, existem situaes
intermedirias entre estes quatro tipos (ver texto). Alm disto,
a diviso aplica-se aos testes de hipteses individualmente.
Em geral as pesquisas so sistmicas, pois envolvem vrias
hipteses relacionadas ao tema em estudo e uma busca de
harmonia entre as evidncias.
Figura 1.6- Um paqumetro simbolizando a validao da
medida.

13

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

res em uma praia pode ser considerado um


indicador de presso de predao sobre ovos
de tartaruga? A concentrao medida de fsforo
total no solo realmente reflete o fsforo disponvel para uma planta? As espcies do estudo
foram identificadas corretamente? Se as incertezas sobre medidas so uma fonte de dvida
(e isto bastante comum), essencial explicar
bem como ela feita nos mtodos e por que
voc acredita que sua medida representa bem o
que ela deveria representar. Algumas vezes,
parte do estudo inclui uma verificao disto. No
exemplo do estudo comparando a capacidade
de nadar de meninos e meninas, voc poderia
pedir para uma parte dos estudantes nadar em
uma piscina rasa. Sua medida ser vlida se
meninos e meninas no diferirem na taxa de
respostas falsas nos questionrios. (Obs: A
validao da medida refere-se a medidas individuais; a validao de medidas coletivas Validao Externa, o que ser explicado adiante.)

O que abordaremos aqui um aspecto mais


sutil da validao da medida: a representatividade conceitual, que a equivalncia entre
variveis operacionais e as respectivas variveis tericas. As variveis tericas so aquelas da hiptese e que dizem respeito relao em estudo, ainda que no possam ser
diretamente medidas. As variveis operacionais so aquelas efetivamente medidas (so
as variveis da previso e da evidncia). Quando uma varivel da hiptese pode ser medida
diretamente, no existe a distino, mas comum que haja a separao. Vejamos um exemplo. Sua hiptese que a Taxa de Atividade
(TA) de um lagarto insetvoro muda em relao
disponibilidade de alimento (DA). Para isto,
voc mede quanto cada lagarto se deslocou em
uma hora (D) e pesa os insetos (PI) que capturou com armadilhas de cola no centro do seu
territrio de forrageio. As medidas de D e PI
parecem ser equivalentes a TA e DA, mas no
so idnticas e as diferenas podem comprometer a interpretao. Por exemplo, voc no
encontra relao e considera isto evidncia
contrria sua hiptese. Entretanto, isto poderia ser um erro de escolha de varivel operacional. Imagine que a mudana de atividade ocorresse na durao da atividade diria e no em
deslocamento por hora e os insetos capturados
nas armadilhas podem no ser as mesmas
espcies da dieta do lagarto. A m escolha de
variveis operacionais pode levar a erros de
interpretao sobre relaes previstas para
variveis tericas.

2) Validao Externa. a explicao e a demonstrao que o conjunto de unidades amostrais selecionadas representativo do universo
que pretendemos estar envolvendo no estudo
(representatividade universal).
Segundo Motulsky (2010), o objetivo da anlise
estatstica de dados fazer as concluses mais
fortes possveis com segurana sobre uma populao estatstica com base nos dados disponveis (amostra ou amostras). Uma populao estatstica um conjunto completo de
entidades que se pretende estar envolvendo
em uma anlise. Em contraste, a amostra o
subconjunto da populao estatstica efetivamente utilizado na anlise. Se voc no
puder mostrar que a sua amostra representativa da populao estatstica (tambm denominada universo amostral), a generalizao (ou
externalizao) do que foi observado com os
seus dados suspeita.

A validao da medida no um problema apenas de variveis quantitativas. Imagine que


perguntamos para estudantes se eles sabem
nadar, juntamos os dados, analisamos com
testes estatsticos e conclumos que os meninos
sabem nadar com frequncia significativamente
maior que as meninas. Mas ser que o resultado indica uma maior habilidade em nadar ou
mais vergonha de admitir que no sabe?

Esta ideia talvez fique mais clara com um


exemplo. Considere duas amostras de intenes de voto para presidente do Brasil, uma de
1000 pessoas do Amazonas e outra de 1000
pessoas sorteadas de todo o pas. Qual delas

Em muitos estudos, a medida a maior fonte de


incertezas. Quando ns utilizamos um coeficiente de inteligncia, estamos realmente medindo
inteligncia? O nmero de pegadas de predado-

14

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

uma amostra mais confivel para falarmos da


inteno de votos dos brasileiros? Voc se surpreenderia se os resultados fossem muito diferentes? As duas amostras seriam igualmente
apropriadas se no houvesse fatores geogrficos influenciando as intenes de votos. Entretanto, naturalmente que h, e a tendncia mostrada pela amostra do Amazonas pode diferir
muito do resto do Brasil. Uma amostra de pessoas sorteadas tambm deve ter uma diferena
do resultado exato de toda a populao, mas
esta diferena quase certamente ser muito
menor e no tendenciosa.

Imagine a dificuldade de se obter uma amostra


aleatria de 1000 eleitores entre todos os eleitores do pais. Sortear os eleitores fcil, basta
pegar os nmeros dos ttulos e usar um computador para uma escolha aleatria. O difcil
chegar aos 1000 eleitores espalhados em todos
os cantos do pas para entrevistar, seria carssimo e alguns nem seriam encontrados. Uma
alternativa bem mais prtica seria sortear 10
pessoas de 5 capitais escolhidas aleatoriamente
e 10 pessoas de 5 zonas rurais escolhidas aleatoriamente e multiplicar os valores por fatores
proporcionais s populaes urbana e rural. H
muitas formas vlidas (e muitas invlidas) de se
realizar uma amostragem. Embora nenhuma
delas seja to boa quanto a aleatria universal,
pelo menos elas so realizveis, e vrias delas
chegam a resultados muito prximos ao ideal
terico.

H dois tipos de Validao Externa:


Validao externa por procedimentos. Quando temos acesso potencial a toda a populao
de interesse, usamos determinados procedimentos considerados vlidos para obter uma
amostra representativa. A amostra representativa ideal a escolha aleatria universal na qual
todos os elementos da populao tem a mesma
chance de serem sorteado para compor a
amostra. Entretanto, a amostra aleatria universal algo raro na pesquisa por questes prticas, de forma que foram desenvolvidas muitas
tcnicas de se obter amostras consideradas
satisfatoriamente prximas das amostras ideais.
H livros inteiros apenas sobre estas tcnicas
em funo de diferentes condies de coletas.
No vamos nos aprofundar nisto, apenas ilustrar com um exemplo.

Validao externa por razoabilidade. muito


comum que no tenhamos acesso a toda a
populao sobre a qual pretendemos falar. Alis, tirando as pesquisas eleitorais ou mercadolgicas, esta provavelmente a situao mais
comum na pesquisa. Mas podemos generalizar
a partir de uma amostra que no foi obtida de
forma descrita acima? Para responder esta
pergunta, tomemos um exemplo imaginrio.

Figura 1.7- Esquema representando a generalizao de um


estudo especfico para concluses mais gerais, simbolizando a validao externa.

15

Quando estudo o comportamento de uma espcie de borboleta de florestas, minha expectativa


que este estudo vai ajudar a entender a espcie, no apenas os indivduos estudados. Raramente possvel realizar coletas em toda a
rea de distribuio da espcie, o mais comum
nestes casos que o estudo seja feito em uma
nica rea de floresta. Se na minha amostra eu
concluir que machos so mais ativos que fmeas na rea de estudo durante coletas feitas
em janeiro de 2006, o que razovel se supor?:
a) Os machos desta espcie so mais ativos
que as fmeas todos os anos?; b) Os machos
desta espcie so mais ativos que as fmeas
durante o ano todo?; C) Os machos so mais
ativos que as fmeas em outras florestas a 1 km
dali? (e 10? e 100? e 1000?); d) Outras espcies do mesmo gnero tm machos mais ativos
em janeiro?; e) Espcies desta famlia tm ma-

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

mantidos a temperaturas baixas e voc conclui


que nesta espcie o sexo determinado pela
temperatura no desenvolvimento. Se esta for
sua concluso, voc estar extrapolando para a
espcie com base em apenas uma fmea e a
partir de um experimento em condies artificiais de laboratrio. Se esta no for a sua concluso, cuidado, voc est sofrendo de uma doena comum chamada paranoia metodolgica
disseminada at mesmo em alguns cursos de
metodologia e de estatstica superficiais. Generalizar a partir de um indivduo algo inaceitvel
em muitas situaes, mas no em todas, e no
nesta em particular. Ao demonstrar estatisticamente que isto ocorre em um indivduo, temos
evidncia factual para a espcie, pois sabemos
(com base em conhecimento terico prvio) que
a determinao do sexo uma caracterstica da
espcie que no varia entre indivduos. As condies artificiais de um laboratrio precisam ser
levadas em conta em muitos casos, mas difcil
imaginar como elas poderiam influir na razo
sexual se ela fosse cromossmica do tipo 1:1. O
contexto biolgico nunca deve ser esquecido
quando seguimos diretrizes metodolgicas.

chos mais ativos em janeiro? E se o estudo do


comportamento da borboleta fosse feito em um
laboratrio? As observaes ainda seriam representativas do comportamento na natureza?
As respostas para estas perguntas no se baseiam em tcnicas estatsticas, baseiam-se
principalmente no que se conhece sobre borboletas e em observaes complementares.
Evidentemente necessrio termos um cuidado
redobrado para generalizar sem o apoio de
tcnicas estatsticas de representatividade universal. Entretanto, negar a possibilidade de
generalizaes por razoabilidade to absurdo
quanto generalizar sem nenhum critrio. Se
negarmos completamente esta possibilidade,
estamos acreditando que no podemos ter nenhuma expectativa com base nos nossos dados
sobre o que aconteceria com outra amostra
obtida um minuto depois ou em uma rea vizinha. A generalizao por razoabilidade baseiase principalmente no conhecimento sobre o
assunto e na proximidade entre as condies
do estudo e as condies para as quais queremos generalizar. A generalizao por razoabilidade deve ser feita com uma postura conservadora e uma argumentao convincente que
justifique a crena sobre a validade da generalizao com base no conhecimento terico anterior e outras observaes complementares.
por isto que muitos estudos precisam descrever
a rea de estudo, clima, e outros aspectos relevantes interpretao dos dados. Alm da argumentao, se for considerado necessrio,
uma coleta adicional pode ser realizada em
outra rea ou poca para avaliar se a generalizao se sustenta com outras observaes.

A generalizao por razoabilidade parte intrnseca da pesquisa. Por exemplo, comum se

Este um assunto polmico, por isto, tomemos


um exemplo adicional mais extremo: a generalizao a partir de uma observao. Imagine que
voc encontrou uma tartaruga de uma espcie
rara colocando seus ovos em um ninho em uma
praia. Voc leva estes ovos para o laboratrio
para verificar se a determinao do sexo influenciada pela temperatura durante o desenvolvimento. Ao final do experimento, nasceram
apenas fmeas dos 20 ovos mantidos a temperaturas altas e apenas machos dos 20 ovos

Figura 1.8- Esquema de coleta simbolizando o planejamento amostral que objeto de anlise da validao
interna.

16

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

metades das duas regies. Desta forma, o efeito do pescador foi eliminado, ou melhor, ele
deixa de ser tendencioso. Novamente, se eu
encontrar uma diferena significativa no nmero
de peixes, eu poderei concluir com segurana
que lagos de uma regio tm mais peixes que
lagos da outra regio.

utilizar ratos para iniciar estudos sobre remdios


para humanos porque: a) a tica nos impede de
comear com humanos; b) o custo de manuteno de ratos em biotrios relativamente baixo;
c) os ratos tambm so mamferos, e devem ter
uma fisiologia semelhante em algum grau. Precisamos avaliar caso a caso at que ponto
razovel generalizar e ter conscincia que a
generalizao pode estar errada. A validao
externa por razoabilidade inclui argumentos,
citaes e dados adicionais que justifiquem a
generalizao.

Note que a medida de quantidade de peixes


capturados por uma pessoa diferente da medida de quantidade de peixes capturados por
outra pessoa, o que seria, a princpio, um problema de validao da medida. Entretanto, a
forma como os dados foram coletados pode
anular este problema, tornando as medidas
vlidas para esta comparao. Naturalmente, o
problema da comparao entre lagos no seria
apenas com diferenas entre pescadores; no
deve haver diferena em nenhum fator relevante que pudesse confundir a anlise, como diferenas nos instrumentos de captura ou nas
pocas do ano em que foram feitas as coletas
em cada lago. Nunca conseguimos igualdade
entre as coletas, mas podemos definir estratgias para conseguir uma equivalncia (ou paralelismo de condies) entre lagos que previna
as influncias tendenciosas. Estas estratgias
costumam ser chamadas de Desenho Amostral ou Desenho Experimental. A independncia interna geralmente simples em estudos
experimentais e mais complexas em estudos
observacionais. Ela ser discutida nos captulos
3 e 6.

3) Validao Interna Ao contrrio das outras


forma de validao, esta se aplica unicamente
para os estudos em que estamos avaliando
possibilidade de relaes causais entre variveis. De qualquer forma, estes so os estudos
mais comuns em pesquisas, de forma que esta
forma de validao muito importante. A validao interna a explicao e a demonstrao
que foram eliminadas influncias tendenciosas
de variveis de confundimento. Quando isto
feito, podemos dizer que existe representatividade paralela. Os conceitos de relao, variveis, variveis de confundimento e representatividade paralela sero explicados em outros
captulos. Nesta seo apenas apresentaremos
um exemplo simples para ilustrar a natureza da
validao interna.
Quando eu quero saber se alguma coisa tem
efeito sobre outra, eu busco dados que mostrem
uma relao. Por exemplo, se eu quero saber
se lagos na regio 1 (Alto Rio Negro) tm mais
peixes que lagos na regio 2 (Manacapur e
Janauac), eu posso pescar em lagos de cada
regio e chegar concluso que a abundncia
de peixes na regio 1 bem menor em mdia.
Entretanto, imagine que ao invs de ir pescar
pessoalmente nas duas regies eu pea para
voc pescar na regio 1 enquanto eu pesco em
na regio 2. Neste caso, ainda que a diferena
seja grande, surge uma dvida importante: a
diferena seria devido ao lago ou devido a diferenas de habilidade entre os pescadores. Imagine agora que eu tenha pescado em metade
dos lagos da regio 1 e em metade dos lados
da regio 2 e voc tenha pescado nas outras

4) Validao de anlise. As chamadas tcnicas


qualitativas (que lidam com evidncias factuais
e sistmicas) esto fora do escopo deste livro,
V. dep

Binrio
(Categ. de 2)

Categrico

Ordinal ou
Quantitativo
Condio NP

Quantitativo
Condio P

Tabela de
Contingncia (TC)
(b) Graf: Seo III

Mann- Whitney;
Cochrans TT (c)
Graf: Seo IV

Teste t (de 2
grupos) (d)
Graf: Seo IV

Tabela de
Contingncia (b)
Graf: Seo III
Dicotomizar VI ou
VD e usar teste
apropriado (Max.
Balano) (g)

Kruskal-Wallis
(e)
Graf: Seo IV

Anlise de
Varincia (f)
Graf: Seo IV

Correlao de
Postos/ RNL(h)
Graf: Seo V

Correlao de
Postos/ RNL(h)
Graf: Seo V

Correlao de
Postos/ RNL(h)
Graf: Seo V

Pearson/
Regresso
Linear/ RNL (j)
Graf: Seo V

V. ind.

Binrio
(cat. de 2)
Categrico

Teste de 2 prop.,
T. Exato de
Fisher ou T.C. (a)
Graf: Seo III
Tabela de
Contingncia (b)
Graf: Seo III

Ordinal

Mann- Whitney;
Cochrans TT (c)
Graf: Seo VI

Quantitativo

Regresso
Logstica (i)
Graf: Seo VI

Dicotomizar VI ou
VD (Max. Balano)
(g)

Figura 1.9- Esquema de uma tabela para escolha de testes


simbolizando a validao de anlise.

17

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

za que as regies diferem depende de quanto


de diferena existe entre os lagos e do nvel de
rigor do teste estabelecido pelo pesquisador.
Nestas anlises, a matemtica ajuda muito. A
lgica e a aplicao destes testes sero apresentadas nos captulos 4 e 5.

apenas abordaremos a validao de anlises


frequentistas (simples ou contextuais). As anlises frequentistas envolvem principalmente tratamentos matemticos com os dados para decidir se a evidncia obtida apoia significativamente uma hiptese. A validao da anlise geralmente envolve consideraes sobre as tcnicas
escolhidas (apresentadas na seo de mtodos) e a prpria anlise dos dados (na seo de
resultados). A profundidade destas consideraes nos mtodos varia bastante, podendo at
limitar-se nomeao do teste aplicado, se for
uma anlise tradicional em um contexto comum.
raro em estudos biolgicos empricos que a
validao da anlise envolva demonstraes
matemticas, mas comum que haja alguma
explicao quando se usa testes menos tradicionais.

1.5 Estatsticas intuitiva e frequentista


Alguns textos sugerem que cursos de estatstica
so necessrios devido dificuldade dos crebros humanos em lidar com probabilidades.
Ser que nossa estatstica intuitiva to ruim
assim? Ao contrrio, somos muito bons, pois a
sobrevivncia de animais em geral e dos animais com melhores capacidades cognitivas em
particular depende destes clculos intuitivos.
Acontece que h uma diferena entre a estatstica intuitiva e a formal mais utilizada em pesquisas. Veremos nesta seo como esta estatstica intuitiva est em nosso cotidiano e como
a estatstica formal mais comum difere dela.

Se estivermos tratando de um teste de hiptese


e j escolhemos a tcnica estatstica apropriada, o prximo passo a anlise em si, cujo
principal resultado se a evidncia apoia significativamente o previsto pela hiptese. Chegar
a um resultado significativo depende da quantidade de dados (entre outras coisas), por isto, a
significncia implica em representatividade
numrica para validar a concluso. A ausncia
de um resultado significativo pode indicar duas
coisas, que a hiptese estava errada ou que
estava certa, mas a quantidade de dados foi
insuficiente para uma deciso segura (dentro
dos critrios de risco assumidos).

Quando atravessamos uma rua, calculamos a


velocidade do carro que vem em nossa direo,
a sua distncia, o tamanho da rua e o tempo
que levaremos para chegar ao outro lado e
ento cruzamos a via, com a maior naturalidade. Imagine a complexidade e rapidez dos clculos que realizamos durante uma partida de
tnis ou para dirigir um automvel no meio de
outros carros e dos pedestres que atravessam a
rua. Esta matemtica instantnea e sem nmeros desenvolveu-se ao longo da evoluo, pois
quanto mais precisos os clculos intuitivos,
maior a chance de sobrevivncia, sucesso social e reprodutivo.

Aproveitando o exemplo da seo anterior sobre a comparao na quantidade de peixes


entre lagos das duas regies e admitindo que
os cuidados para a validao interna tenham
sido tomados, podemos agora analisar estatisticamente os dados. Voc no pode concluir que
h mais peixes em uma regio que na outra
com base em dois lagos de cada regio e dois
na outra. Pode acontecer de no haver nenhuma diferena na abundncia de peixes e por
acaso voc ter tido azar duas vezes em uma
regio e sorte duas vezes na outra. Entretanto,
no razovel ter azar muitas vezes em uma
regio e sorte muitas vezes na outra. Quantos
lagos so necessrios para concluir com certe-

Parte desta matemtica intuitiva transformada


em estatstica intuitiva, utilizada na tomada de
decises do cotidiano. Por exemplo, voc est
saindo de casa e percebe que h nuvens carregadas, volta e pega um guarda chuva. No mercado voc vai pagar as compras, escolhe a fila
com menos carrinhos, mas muda de fila porque
percebe que os carrinhos da frente esto muito
cheios. No caminho de volta, voc reconhece e
cumprimenta uma pessoa que no via h uns
10 anos; ela est um pouco diferente, mas qua-

18

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

se no envelheceu. Preparando a janta,


voc avalia que o peixe no forno ainda
no est pronto com base no cheiro e na
consistncia. Conclui ainda que est demorando e que a demora pode ter sido
por no ter coberto o peixe, mas acha que
valeu a pena porque ele est ficando mais
dourado que no seu preparo usual. Sua
me deveria ter chegado h meia hora,
esta observao te faz ligar para ela para
saber se houve algum problema. Cada
uma destas atitudes simples est carregada de estatstica intuitiva.

Figura 1.10- Trs tipos intuitivos de deciso utilizados em problemas


do cotidiano que tambm so usados na pesquisa.

No nos damos conta da complexidade


dos clculos envolvidos nas decises do
cotidiano. Usamos nossa estatstica intuitiva
para atribuir valores, sintetizar as informaes,
decidir se existe uma relao entre determinadas variveis e construir modelos de previso e
de controle. O termo estatstica intuitiva no
implica que nascemos com ela, da mesma forma que no nascemos andando, na verdade
nascemos com o potencial, mas uma capacidade que vamos desenvolvendo. Se pensarmos
bem a estatstica intuitiva, algo to impressionante como a nossa capacidade de andar sobre
duas pernas ou de nos comunicar com palavras.

Para entender como uma deciso envolve um


clculo, analise o exemplo do guarda chuva.
Depois da deciso de valor de considerar que o
que voc viu eram nuvens muito carregadas e
depois de ter estabelecido (ainda na sua infncia) a relao entre a quantidade de nuvens e a
probabilidade de chuvas, voc vai aplicar este
conhecimento a uma deciso de ao. A deciso de ao de pegar o guarda chuva depende
da avaliao do custo de pegar o guarda chuvas e no chover contra o custo de no pegar o
guarda chuva e chover. Comecemos pelos extremos: se pegar chuva fosse extremamente
perigoso e o guarda chuva fosse muito leve,
voc simplesmente o levaria sempre; se pegar
chuva no incomodasse em nada e carregar um
guarda chuvas fosse um estorvo, voc nunca o
levaria. Em casos intermedirios, precisamos de
um clculo, intuitivo ou formal. Ilustremos com
um clculo formal. Se voc acha que escapar
de uma chuva vale R$10,00 e que pagaria
R$2,00 para no ter que carregar o guarda chuvas por um dia, ento no levaria o guarda chuvas se a chance de chover fosse de 50% (pois
0,5 x R$10,00 > 0,5 x R$2,00), mas levaria se a
chance de chuva fosse de 90% (pois 0,1 x
R$10,00 < 0,9 x R$2,00). No d importncia
ao clculo exato, o objetivo aqui perceber que
a deciso depende de duas coisas: do custo
que representa cada alternativa de deciso e da
probabilidade de cada alternativa no momento
da deciso.

Podemos dividir estas decises em trs tipos de


Valor, de relao e de ao (Fig. 1.10). H decises de valor, como nas expresses nuvens
muito carregadas, carrinhos muito cheios ou
no reconhecimento de uma pessoa (esta pessoa=Joo). Parece natural, mas pense na complexidade que reconhecer uma pessoa. O
atraso da me foi percebido em funo de uma
medida de tempo mdio e de atraso mdio que
permitiu medir o atraso como acima do normal. Outras decises so de relaes entre
variveis, que nos so ensinadas ou que aprendemos ou percebemos por conta prpria. Por
exemplo, a relao entre a quantidade de nuvens e a probabilidade de chover ou entre o
cheiro do peixe e ele estar pronto para ser consumido. Outras decises so de ao, como
pegar o guarda chuvas, mudar de fila ou telefonar para a sua me.

19

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

para uma diversidade de situaes de tomada


de deciso.

importante iniciarmos valorizando nossa capacidade de tomar decises, para entendermos


que nossa lgica intuitiva no est errada, apenas difere na aplicao com o que mais feito
na cincia. Imagine que seu namorado ou namorada lhe pede em casamento. Digamos que
voc gostaria de casar, mas teme muito a possibilidade separao; qual a chance disto
ocorrer? Se voc quisesse uma avaliao do
tipo que se usa mais nas pesquisas cientficas,
voc teria que casar com ele (a) umas 30 vezes
em condies semelhantes atual e verificar a
taxa de sucesso para tomar uma deciso com o
tipo de estatstica que vamos trabalhar neste
curso. Naturalmente que isto impossvel neste
exemplo e em muitas situaes do cotidiano,
mas bem mais comum isto ser possvel na
pesquisa, especialmente em estudos experimentais.

A estatstica intuitiva mais comum uma forma


complexa vlida de pensar, tanto que tem um
equivalente formal, que a estatstica Bayesiana. Entretanto, em condies especiais, quando
podemos obter informaes de dados com repeties de unidades amostrais independentes,
e dentro de premissas metodolgicas bem definidas, temos uma alternativa bem mais objetiva
e poderosa para estabelecer relaes que
chamada Estatstica Frequentista. Vamos
explicar o seu funcionamento a partir do captulo 3. Neste livro, como na grande maioria dos
cursos bsicos de estatstica, apenas trataremos de clculos de probabilidades frequentistas. Entretanto, a estatstica intuitiva tambm
usada quando utilizamos a frequentista. No
faremos clculos matemticos Bayesianos, mas
utilizaremos avaliaes de premissas qualitativas que chamaremos de Razoabilidade, como
fizemos na seo 1.4 na validao externa por
razoabilidade.

Na deciso sobre um casamento, s lhe resta


uma abordagem sistmica na qual voc recolhe
informaes relevantes e procura fazer um clculo aproximado de probabilidades. Voc poderia partir das estatsticas de uma taxa recente
de divrcios no Brasil de 20% nos 10 anos iniciais. Entretanto, considerando sua faixa etria e
classe social, voc verifica na pesquisa que a
taxa de 30%, portanto, esta uma estimativa
mais apropriada. Este um risco alto, o que te
coloca em dvida. Ento, voc conversa com
amigos que te tranquilizam lembrando que seu
(sua) pretendente teve relacionamentos anteriores estveis e que no terminaram devido a
alguma briga irracional. Portanto, voc considera que a probabilidade de divrcio com ele (a)
bem inferior aos 30% e aceita a proposta. Esta
probabilidade estimada considerando as informaes contextuais no utilizada apenas no
cotidiano, tambm bastante usada em problemas aplicados, como no clculo do valor de
aplices de seguros, utilizando uma verso
matemtica mais precisa de nossa estatstica
intuitiva chamada Estatstica Bayesiana. Esta
a estatstica usada para medir a fora de evidncias factuais e sistmicas Sua utilizao na
pesquisa tem sido relativamente restrita, mas
tem crescido nos ltimos anos, medida que os
pesquisadores vo entendendo a sua utilidade

20

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

1.8- Qual a diferena entre um problema de


validao interna e um problema de validao
externa?
1.9- O que paranoia metodolgica?
1.10- Por que os problemas de validao da
medida e de validao interna normalmente so
mais graves do que problemas de validao
analtica e de validao externa ao longo de
uma pesquisa?
1.11- Por que evolumos com uma alta capacidade de realizar clculos estatsticos intuitivos e
falhamos em algumas questes estatsticas
cotidianas banais.
1.12- Cite exemplos originais de decises: a) de
valores; b) de relaes; c) de aes.
1.13- Explique a diferena entre a estatstica
intuitiva e a estatstica mais utilizada em pesquisas cientficas (frequentista).

Exerccios
1.1- O que um problema complexo e por que
o fato dele ser complexo no implica que seja
de difcil soluo.
1.2- Algumas pessoas afirmam que os homens
no conseguem desenvolver atividades complexas como as mulheres. Puro preconceito. Se
for dado tempo suficiente e assessoria adequada, os homens podem desenvolver atividades
igualmente complexas. Explique por que preparar uma festa de criana um problema complexo e quais partes deste problema podemos
terceirizar.
1.3- O uso da estatstica na pesquisa foi comparado com o uso de um microscpio. Explique a
analogia.
1.4 Reflita sobre os temas abaixo e pense em
um estudo (para cada um) na forma de um problema (um aspecto relevante do tema a ser
desenvolvido). Com base nisto: a) defina o problema que ser abordado; b) levante uma hiptese dentro deste problema; c) faa uma previso para testar esta hiptese.
1.4- a. Micorrizas: Suponha que voc descobriu
as Endomicorrizas*, mas ainda no sabe o que
so. O que voc percebeu foi a existncia de
muitos esporos de fungos no solo que aparentemente esto ligados s razes. (Se no sabe o
que so endomicorrizas, comece com uma pesquisa na internet)
1.4- b. Ninhos de cupins. Voc percebe que
algumas espcies de cupins fazem seus ninhos
no alto de rvores enquanto outras espcies
fazem ninhos no solo com uma parte do ninho
acima do solo e um terceiro grupo de espcies
fazem ninhos completamente subterrneos.
1.4- c. Lua: Voc sabe que a variao nas fases
da lua tem efeitos sobre muitos animais. Ento
voc se pergunta, ser que a lua tambm tem
efeito sobre plantas?
1.5- Explique o que uma previso exclusiva
1.6- Cite problemas originais que envolvam uma
evidncia: a) factual; b) frequentista simples; c)
contextual d) sistmica.
1.7- Explique um exemplo original de pesquisa
em que as concluses so suspeitas devido a
incertezas na validade das medidas.

21

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

2 Do problema
biolgico ao estatstico.
Os livros de estatstica vm com exemplos
prontos para a anlise de dados. Entretanto,
uma das maiores dificuldades dos estudantes
a transformao de problemas biolgicos (ou de
outras cincias, ou cotidianos) em problemas
estatsticos. Neste captulo, descreveremos
sucintamente a Abordagem EPR (Entidade,
Propriedade e Relao) de Macnaugton (2002)
que ajuda a transformar problemas biolgicos (e
outros) em problemas estatsticos. Macnaughton mostrou que h alguns conceitos to
bsicos que passam despercebidos, e que so
chaves para se compreender como se monta
um problema antes de iniciar o planejamento de
coleta de dados e para determinar quais sero
os testes mais adequados anlise dos dados
obtidos. Vejamos estes conceitos.

Figura 2.1- Entidades so "coisas" em que pensamos, como


rvores, beijos e unidades amostrais, s quais podemos atribuir propriedades

tantivos, tanto para os tipos de entidades (gatos), como para uma entidade particular (gato
no23). Trata-se de um conceito to bsico, que
raramente discutido em metodologia e estatstica. Entretanto, como veremos, til deix-lo
explcito. As entidades tambm podem ser
chamadas de casos, membros de uma populao, indivduos, itens, espcimes, objetos, observaes, unidades amostrais, etc.

2.1 Entidades
Se voc prestar ateno aos seus pensamentos
cotidianos em um dado momento, provavelmente concordar que estamos pensando sobre
diversos tipos de coisas. Por exemplo, neste
minuto voc poderia estar pensando em um
amigo ou em um compromisso que tem marcado para a tarde. Estas coisas so exemplos de
entidades (Fig. 2.1).

Alguma confuso pode surgir quando h uma


derivao imprpria de um substantivo para um
adjetivo ou vice-versa. Por exemplo, a palavra
burro designa um animal, mas pode ser usada
como adjetivo, referindo-se a uma pessoa, e a
palavra azul normalmente um adjetivo, mas
na frase o azul lindo ela um substantivo.
Na frase o pssaro da cor azul a expresso
da cor azul tem a funo de adjetivo para pssaro. Na frase este pssaro da espcie Pitangus sulphuratus, estamos qualificando a
entidade pssaro com a expresso da espcie
P. sulphuratus, enquanto na frase P. sulphuratus uma espcie com distribuio ampla, P.
sulphuratus uma entidade. O que vale em
EPR a classe gramatical no contexto.

Existem muitos tipos de entidades: Objetos


fsicos reais simples (montanhas, automveis,
lagos, pessoas, rvores) ou coletivos (cadeias
de montanhas, florestas, alcateias, turma de
alunos; populao; conjunto de elementos em
um grupo, espcie biolgica); Objetos imaginrios (fadas, universos paralelos, teorias, conceitos); Processos/aes (um experimento, uma
reao qumica, uma reunio, um beijo; uma
viagem, a fora necessria para levantar certo
objeto). Cada tipo de entidade uma categoria
que nomeia diversas entidades unitrias (montanha 1, montanha 2, etc.)
As entidades tm um papel fundamental no
pensamento. Na gramtica so sempre subs-

22

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

Por exemplo, em um estudo sobre pessoas,


todas as entidades necessariamente possuem
as propriedades comuns aos Homo sapiens,
como respirar com pulmes e ser incapaz de
voar batendo os braos. No seu estudo, todos
os indivduos poderiam compartilhar a mesma
nacionalidade e o fato de possurem sapatos,
seja pela contingncia da populao acessvel
ao estudo, seja por uma definio prvia estabelecida por voc acerca de que caractersticas
teriam os indivduos selecionados para fazer
parte da amostra.

2.2 Propriedades
Cada tipo de entidade tem associado a ela uma
gama de atributos ou propriedades (Fig. 2.2).
Carros tm peso, cor, marca e ano de fabricao. rvores tm altura, nome da espcie, posio em um mapa. Bandos de passarinhos tm
um nome da espcie, um nmero de indivduos,
uma razo sexual. Cada entidade tem um valor
para cada propriedade (no existe carro sem
peso, podemos at no saber o valor, mas ele
existe).

Outras propriedades variam entre entidades,


como a altura, o sexo e o meio de transporte
mais utilizado por pessoas. Estas propriedades
so chamadas Variveis. A variao nestas
propriedades tem causas e consequncias que
podem ser investigadas. As propriedades a
serem avaliadas precisam variar no banco de
dados do estudo. Voc no poderia estudar a
diferena na utilizao de transporte pblico
entre os sexos se apenas entrevistar pessoas
de um sexo, nem poderia estudar o efeito de um
tratamento se no tiver indivduos sem o tratamento (controle).

Propriedades tambm so chamadas de aspectos, atributos, caractersticas, fatores, qualidades ou tratamentos. Os nomes das propriedades geralmente so substantivos abstratos que
nomeiam qualidades ou estados (localizao,
cor, beleza, idade, velocidade, quantidade, valor
de pH) de entidades. As propriedades tambm
podem ser aes realizadas ou sofridas (ou
no) por uma entidade. Por exemplo, tomar
chocolate (sim ou no) propriedade na frase
fulano tomou chocolate. Os nomes de propriedades tambm podem ser abreviaes de
aes. Por exemplo, a propriedade tomou chocolate (s/n) torna-se apenas Chocolate (s/n).
Os valores das propriedades so adjetivos
(vermelho, velho, rpido, grande, brasileiro,
estudioso), advrbios (aqui, agora, longe, mal,
sim, no, talvez, muito, pouco), numerais com
funes quantitativas, ordinais ou de rtuloplanta no 135 e datas), s vezes smbolos
(,, ou O+), e at substantivos. Quando os
valores so substantivos, eles tm funo qualificadora, isto , tem papel de adjetivo. As propriedades origem, local de formao e espcie
para a entidade pessoa tem os valores Brasil,
USP e Homo sapiens que substituem os adjetivos brasileiro, Uspiano e humano. Como vimos na seo anterior, a espcie Pitangus sulphuratus um substantivo, mas faz parte da
funo qualificadora na expresso aps o verbo
na frase este pssaro da espcie P. sulfuratus.

Figura 2.2- Propriedades so atributos das entidades.

Os valores das propriedades podem ou no


variar entre as entidades dentro de um estudo.

23

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

2.3 Tabelas e grficos EPR

2.4 Relaes entre variveis

As tabelas ou planilhas EPR so as tabelas com


nossos dados organizados em entidades (linhas), propriedades (colunas) e valores (clulas
da tabela). Em uma tabela EPR cada entidade
aparece apenas uma vez e as propriedades
so variveis que sero relacionadas ou que
participaro da anlise de outra forma. A tabela
EPR mais que um
local para depositar
os dados, ela uma
Tamanho Sexo
tabela conceitual que
12
m
sumariza o planeja10
m
mento do nosso pro11
f
jeto, de forma que
11
f
deve ser planejada
preferencialmente
antes da coleta de Figura 2-3- Nas tabelas EPR, as
so entidades e as colunas
dados, tendo em linhas
so propriedades. A seta indica
vista as relaes uma relao.
que queremos verificar.

Uma relao uma conexo entre dois objetos,


fenmenos ou quantidades, tal que a modificao de um deles importa na modificao do
outro. Hipteses so testadas a partir de suas
previses, e as previses mais comuns na pesquisa envolvem relaes causais entre duas
variveis, a Varivel Preditora (ou Independente), cuja variao influi sobre os valores de
uma Varivel Resposta (ou Dependente), se
sua hiptese estiver correta. Para determinar
quais so estas variveis em seu estudo, pergunte a si prprio: pela minha hiptese o qu
(qual fator ou varivel) influencia sobre o qu
(qual varivel)? Por exemplo, se estamos testando a capacidade de borboletas distinguirem
entre cores semelhantes pela previso que a
cor da armadilha (vermelhas ou amarelas- varivel preditora) atrai uma quantidade diferente
de borboletas (varivel resposta).
Os termos varivel preditora e varivel resposta
se aplicam quando h uma Relao Consequente (ou causal fig. 2.5) entre elas, isto ,
quando a causa da variao da segunda ,
direta ou indiretamente, a primeira. Quando esta
as duas variveis tem uma relao prxima,
ela chamada Relao de Causa Proximal, e
quando distante, chamada Relao de
Causa Final. Por exemplo, em anos com pouca
chuva, alguns lagos secam causando a mortalidade generalizada dos peixes. A causa proximal
da morte dos peixes a falta de gua para os
peixes poderem respirar e no ressecar e a
causa distal a variao climtica. Uma pessoa
pode perder seu emprego porque a sua produtividade foi abaixo da mdia (causa proximal),
mas isto s aconteceu em funo da necessidade do banco cortar custos devido crise bancria (causa final). Em estudos biolgicos, a
causa proximal costuma ser fisiolgica ou comportamental e a causa distal costuma ser ecolgica ou evolutiva.

Tamanho

Os grficos EPR so grficos cartesianos cujos


eixos so propriedades (as variveis em estudo)
e as entidades so representadas, cada uma
delas, por um ponto situado no grfico em funo dos seus valores das propriedades (e. g.
diagrama de disperso e dot density). Alm
dos eixos, as propriedades tambm podem ser
representadas por diferentes cores ou smbolos
(e. g. e ).
Janeiro ( ) Julho ( )
So grficos
mais ricos em
informao que
muitos grficos
tradicionais
utilizados na
apresentao
de resultados.
Machos

Fmeas

Figura 2-4- Nos grficos EPR, as variveis (propriedades)


so os eixos dos grficos e as entidades so os pontos.
Variveis adicionais podem ser apresentadas na forma de
cores ou simbolos.

24

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

Algumas previses envolvem duas variveis


(Covariveis) que tem uma Relao Inconsequente (ou correlao), isto , a variao em
uma no influi sobre o valor da outra, mas as
duas podem covariar (variar ao mesmo tempo)
em resposta a uma terceira varivel. Por exemplo, podemos verificar se existe uma relao
entre as cores das roupas que uma pessoa
prefere vestir e o seu sucesso em desempenhar
tarefas em grupo. A constatao que a relao
existe no implica que as cores causam o sucesso, mais provvel que uma terceira varivel, talvez o grau de otimismo da pessoa tenha
influncia sobre as cores que ela usa e sobre a
sua tendncia a ter sucesso em tarefas em
grupo. Estudos com previses conscientes sobre relaes inconsequentes so vlidos, como
no exemplo acima, entretanto, uma falha comum achar que a existncia de uma relao
implica uma causalidade, isto , mesmo encontrando a relao entre roupa e sucesso, no
podemos prever que mudando a cor da roupa
de uma pessoa haver mudana no sucesso
em atividades em grupo. Uma expresso importante em estatstica Correlao no implica
causalidade, isto , cuidado para no confundir
relaes inconsequentes com relaes consequentes.

a relao entre as variveis preditora e resposta


eliminando ou controlando o efeito das outras relaes. Em estudos experimentais, nos
quais manipulamos o valor da varivel preditora
(e. g. quantidade de certo elemento qumico em
vasos) e medimos a velocidade de crescimento
de uma planta, possvel ter segurana que a
relao encontrada, se houver, uma relao
consequente. Em estudos no experimentais,
isto , naqueles em que no manipulamos a
varivel preditora, normalmente no podemos
ter esta segurana. Por exemplo, se voc comparar a taxa de crescimento de plantas em funo da quantidade de certo elemento qumico
no solo na natureza, voc no pode ter certeza
que a relao encontrada, se houver, causal,
pois possvel que as duas variveis sejam
influenciadas por uma terceira varivel. Possivelmente a umidade no solo tenha um efeito
sobre o crescimento da planta e sobre a quantidade de algum elemento qumico, causando
uma relao inconsequente entre estas duas
variveis. Embora correlao no implique causalidade, ela pode ser uma evidncia importante
dentro de um estudo sobre relaes causais,
desde que tenhamos a conscincia que as concluses em estudos no experimentais dependem de cuidados redobrados (cap. 6).

A relao entre duas variveis pode ser obscurecida ou confundida pela existncia de outros
fatores (conhecidos ou no) influenciando nos
valores da varivel resposta, por isto, um dos
desafios em um estudo conseguir estabelecer

2.5 A estatstica para estabelecer


relaes.
Muitos estudos biolgicos envolvem previses
com uma varivel preditora e uma resposta ou
com duas covariveis. O conjunto de tcnicas
utilizadas nesta situao denominado Estatstica Bivariada (Fig. 2.6). Alguns problemas so
mais complexos, ou tratados de forma mais
complexa, incluindo na anlise mais de duas
variveis ao mesmo tempo para uma descrio
ou teste. O conjunto de ferramentas para estes
problemas denominado Estatstica Multivariada. A estatstica multivariada inclui anlises
com uma varivel resposta e mltiplas preditoras e anlises com mltiplas variveis preditoras
e respostas (muitas pessoas utilizam a expresso estatstica multivariada exclusivamente no
segundo caso). H ainda a Estatstica Univariada, que inclui as tcnicas para problemas que

Figura 2-5- Esquema representando diferentes tipos de


relaes (setas) entre variveis (letras A a F). As
relaes R1 a R5 so consequentes e as relaes r1 a r4
so inconsequentes. As relaes ligadas diretamente
por apenas uma seta so de causa proximal e as relaes entre A e D e entre A e F so de causa
final.

25

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

envolvem apenas uma varivel. Na estatstica


univariada, a relao avaliada no com outra
varivel, mas com um valor nico (ou uma distribuio de valores) de referncia ou esperado.
Por exemplo, quando queremos saber se o
nmero mdio de mosquitos da dengue por
armadilha em casas de um bairro est acima do
padro que indica risco de epidemia. Neste
livro, trabalharemos apenas com tcnicas de
estatstica univariada e bivariada (com nfase
na bivariada).

Tabela 2.1- Tabela EPR para avaliar a questo se a


ingesto de chocolate causa espinhas

O primeiro passo no estudo das relaes bivariadas (e multivariadas em geral) montar uma
tabela EPR. Comece com a hiptese (e. g. a
ingesto de chocolate causa espinhas), passe
para uma previso com uma varivel preditora
(tomou chocolate- sim/no) e uma varivel
resposta (nmero de espinhas). A entidade
inicialmente algum ou algo a quem estas
propriedades podem ser atribudas, no caso,
pessoa (pessoa 1, pessoa 2, etc.). Faa uma
coluna para numerar as entidades (opcional),

uma coluna para a varivel preditora e outra


para a varivel resposta e entre os valores para
cada entidade (Tab. 01). Outras colunas com
variveis adicionais (e. g. idade e sexo da pessoa) tambm podem ser includas, desde que
sejam apropriadas para a entidade em questo.
Uma nica planilha pode ser utilizada para testar todas as hipteses que tem a mesma entidade em um estudo, basta que as variveis
envolvidas estejam entre as colunas.
Na tabela EPR, uma entidade no pode
aparecer duas vezes. Se a mesma pessoa tomou chocolate mais de uma vez,
ento a entidade ingesto-pessoa-dia
(ingesto 1, ingesto 2, etc.), e pessoa
opcionalmente pode entrar na tabela
como mais uma propriedade (quem
ingeriu). (Considerando a importncia da
independncia entre unidades amostrais
(cap. 6), normalmente se evita incluir a
mesma pessoa em uma amostra de
vrias pessoas; a tabela pode ser montada, mas a anlise apropriada pode ser
complexa.) Outra possibilidade seria
realizar todo o estudo com uma nica
pessoa, utilizando como entidade dia
(dia 1, dia 2, etc.). Pode parecer estranho que tomou chocolate seja propriedade de dia, mas pense bem, no dia 3
algum tomou chocolate = sim e no dia
7 algum tomou chocolate = no. Esta abordagem de usar apenas uma pessoa tem vantagens e desvantagens que sero discutidas depois, o ponto a ressaltar aqui que diferentes

Figura 2-6- A estatstica bivariada a mais utilizada na


pesquisa, incluindo apenas uma varivel preditora e uma
resposta, entretanto, tambm h anlises que lidam com
mais variveis ou com apenas uma varivel.

26

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

plcita (tomou cerveja?- antes/ depois) e uma


varivel resposta implcita (velocidade).

planilhas EPR podem ser utilizadas para analisar a mesma previso (embora no seja exatamente a mesma quando as entidades so
diferentes).

Para MacNaughton (2002), o papel da pesquisa


emprica descrever relaes para predizer e
controlar valores de propriedades. A seu ver, as
hipteses so sobre relaes (entre variveis ou
em relao a um padro). O teste de sua hiptese feito com base em predies. Se as evidncias apoiam uma hiptese, ento ela pode
ser utilizada como base para outras hipteses e
em na aplicao em problemas prticos, pois
nos permite prever valores.

Nem sempre a determinao da entidade to


fcil como no exemplo do chocolate. Se sua
hiptese que o pH da gua onde as larvas de
mosquitos se desenvolve afeta a sua sobrevivncia, a varivel preditora o pH da gua e a
resposta a sobrevivncia do mosquito, mas
qual a entidade? Pode ser frasco, se voc tiver
vrios frascos diferindo no tipo de gua e com
larvas cuja sobrevivncia ser calculada ao final
do experimento. H outras possibilidades dependendo do que foi sua unidade amostral.
Cuidado com o que vai definir como unidade
amostral. Se voc quer saber se o investimento
em merenda escolar por escola influi no rendimento acadmico, sua unidade amostral escola, no aluno. Portanto, cada linha uma
escola e voc vai utilizar a mdia do rendimento
acadmico por escola.

Pense em problemas prticos. Neste lago pegaremos bastante peixe? Este paciente ser curado? A plantao produzir mais se plantarmos
em abril ou se esperarmos at setembro? Neste
local encontraremos cobras venenosas? Se no
sabemos as respostas (pois no temos uma
mquina de viajar no tempo ou um orculo) e
no podemos esperar o futuro para tomar decises, o que fazer? Se conseguirmos identificar
relaes entre variveis, podemos fazer previses. Se soubermos que lagos de gua branca
sempre tem muito peixe, e que um determinado
lago tem gua branca, ento podemos prever
que provavelmente haver muito peixe nele. Se
soubermos que pessoas que tm temperatura
alta geralmente esto com infeces, e que
uma determinada substncia controla infeces,
podemos predizer que ela provavelmente ter
diminuio na febre e se sentir melhor se tomar esta substncia. Esta ao aparentemente
banal de estabelecer relaes um dos pilares que sustenta a cincia. A explicao outro
objetivo da cincia, mas se pensarmos bem, ela
est intimamente ligada ao estabelecimento de
relaes.

Algumas hipteses envolvem apenas uma varivel, o que implica em uma coluna na planilha
EPR. Considere a hiptese a resistncia de
peixes ornamentais ao transporte influenciada
pelo sexo do peixe. Podemos testa-la com a
previso que partindo de uma populao de 50
machos e 50 fmeas, a proporo de fmeas ao
final ser maior. Sobrevivem 25 machos e 40
fmeas, que uma diferena estatisticamente
significativa. A forma de determinar isto ser
abordada no captulo 5, o que nos importa agora que a concluso baseia-se apenas na varivel sexo (a entidade peixe). H hipteses
com varivel preditora e varivel resposta que
utilizam testes univariados (testes pareados).
Considere a hiptese: a agilidade de adultos do
sexo masculino diminui aps a ingesto de
apenas uma lata de cerveja. Sua previso
que a velocidade na execuo de certa tarefa
complexa menor depois da ingesto de uma
lata de cerveja. Ento voc mede a diferena de
velocidade antes e depois da cerveja para vrias pessoas. Repare que sua anlise vai se
basear apenas em uma varivel, a diferena de
velocidade, mas h uma varivel preditora im-

27

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

c) Motoristas que utilizam insulfilme em seus


carros costumam realizar maior nmero
de contravenes em ambiente urbano.

Exerccios:
2.1- Cite exemplos originais de entidades do
tipo objeto fsico, do tipo entidade coletiva e do
tipo processo, com duas propriedades inerentes
a cada tipo de entidade.
2.2- Explique, com um exemplo original, por que
algumas palavras podem ter significados compatveis com entidades (substantivo) ou com
valores de propriedades (e. g. adjetivos) dependendo do contexto.
2.3- Monte uma tabela EPR que contenha quatro propriedades cujos valores das propriedades
sejam respectivamente adjetivos, advrbios,
numerais e smbolos. Duas destas propriedades
devem ser variveis e as outras duas no.
2.4- Defina uma hiptese, uma previso e faa
um esquema de uma tabela EPR com duas
colunas, a varivel preditora na coluna da esquerda e a varivel resposta na coluna da direita. Inclua valores para cinco entidades.
2.5- Faa um grfico EPR para a tabela da
questo anterior com os 5 valores da tabela e
outros 15 adicionais.
2.6- Qual a diferena entre variveis tericas
e operacionais e entre hipteses de relaes e
hipteses existenciais?
2.7- A frase correlao no implica causalidade est relacionada com a diferena entre relaes consequentes e inconsequentes? Explique
a frase com exemplos originais de relaes
consequentes e inconsequentes.
2.8- De um exemplo original de uma relao
proximal e uma distal para explicar o mesmo
fenmeno.
2.9- Qual a diferena entre as estatsticas
bivariada, univariada e multivariada.
2.10) Elabore tabelas e grficos EPR para a
lista de hipteses/ previses a seguir:

d) A taxa de decomposio da serrapilheira


varia em funo do ambiente (Campinarana, Baixio e Plat) na Amaznia Central.
e) A temperatura na sala de aula influi sobre o
desempenho de estudantes em provas.
f) O pH de um local no qual h acmulo de
gua de chuva afeta a sobrevivncia de
mosquitos Aedes aegypti.
g) H dimorfismo sexual de tamanho nas borboletas Capronnieria abretia.
h) A sobrevivncia de gafanhotos verdes
maior do que de gafanhotos marrons na
poca chuvosa na caatinga.
i) Cigarro causa cncer.
j) Passar por baixo de uma escada d azar.
k) Olho gordo seca pimenteira.
2.11) Construa uma tabela e um grfico EPR
para cada relao entre as variveis operacionais com dados imaginrios verossmeis.
(Quando necessrio, substitua variveis tericas por operacionais).
2.12) Escolha uma relao para explicar dificuldades com validao da medida, validao
interna e validao externa.
2.13) Construa uma tabela EPR e dois grficos
EPR para avaliar relaes em seu campo de
pesquisa (preferencialmente um trabalho que
esteja desenvolvendo).

a) O tamanho de indivduos da espcie de tartarugas Podocnemis expansa influi na


taxa reprodutiva.
b) A temperatura durante o desenvolvimento
embrionrio afeta a razo sexual em ninhos artificiais de P. expansa.

28

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

19 nveis efetivos. Cuidado, no so todos os


25 do eixo Y, pois a menor medida foi 4 mm, a
maior 22 mm, e a preciso da medida foi de
1mm (como pode se ver no grfico). Se a preciso fosse de 0,5mm, teramos aproximadamente o dobro de nveis efetivos.

3 Confiana na
medida e independncia
Neste captulo abordaremos: a) a incerteza em
medidas de valores individuais em funo da
forma de atribuir uma categoria ou da falta de
preciso ou de acurcia em instrumentos ou
procedimentos de medida; b) a variao natural
em valores quantitativos na forma de distribuies de frequncias; c) a incerteza na estimativa de parmetros populacionais e d) a importncia da independncia entre unidades amostrais na estimativa de parmetros populacionais. Para discutir estes assuntos sero apresentados alguns termos.

Em funo do tipo de valor utilizado, as variveis dividem-se em escalas de medida da


seguinte forma:
Binrias: Possuem apenas dois nveis efetivos.
Por exemplo: sim ou no; presena ou ausncia; macho ou fmea; macrofauna ou mesofauna; controle ou tratamento. Tambm so
binrias as variveis quantitativas que assumem
apenas dois valores em uma analise (e. g. comparao entre tratamentos com 1 mg ou 2 mg
de um medicamento).

3.1 Nveis e escalas de medida

Categricas: Assumem valores qualitativos


(no quantitativos) sem uma ordem intrnseca
natural entre os nveis, ou possuem uma ordem,
mas esta pode ser ignorada na anlise. Por
exemplo: tipos sanguneos (A, B, AB e O), marcas de fertilizante, habitat e nome do coletor
(podem ser ordenadas alfabeticamente, por
exemplo, mas esta ordem irrelevante para a
anlise). Nmeros podem ser utilizados para
rotular entidades (e. g. 135= planta # 135), por

Nveis efetivos de medida so os


diferentes valores de uma varivel
efetivamente includos em uma
anlise. Para saber o nmero de
nveis efetivos (NE) em variveis
categricas ou ordinais (veremos
a diferena adiante), basta contarmos as categorias utilizadas.
Em variveis quantitativas ele
calculado com esta frmula simples: NE= (max-min+1)/preciso
(ou conta-se diretamente do grfico ou da base de dados). Por
exemplo, na figura 3.1, a varivel
Ms tem 6 nveis efetivos e a
varivel Tamanho da Aranha tem

Tamnho da aranha(mm)

Dizer que uma pessoa alta ou que mede


1,80m so duas formas vlidas de falar sobre
altura, mas com poder informativo diferente e
que recebem tratamentos estatsticos diferentes. Nas duas formas, estamos falando de variveis, pois so propriedades que variam entre
unidades amostrais. Se voc divide as pessoas
em dois grupos, altas e baixas, ter dois nveis
de medidas; se voc dividir em 3 grupos, altas,
mdias e baixas, ter trs nveis. Se medir com
uma fita mtrica, ter vrios nveis
de medida (e. g. 1,73 m, 1,82 m).

Phoneutria reidyi

25
20

v
?

15
10
5
0

Jun Ago Out Jan

Abr

Ago

Ms da coleta 2001/2002
Figura 3.1- Neste grfico EPR h seis nveis na varivel Ms da coleta, 19
nveis na varivel Tamanho da aranha e trs nveis na varivel Sexo.

29

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

como se fossem buracos na estrada de nossos


carros estatsticos. Por exemplo, o nmero de
ovos uma varivel quantitativa descontnua,
pois no existem 3,5 ovos, h um salto entre
os nveis 3 e 4. Segundo estes livros, o peso de
um ovo seria uma varivel quantitativa contnua,
pois h valores intermedirios entre 40 e 41 g
(como 40,555 g).

isto a propriedade nmero da planta categrica, j que no uma quantidade sujeita a


operaes matemticas (a planta #1 no igual
planta#136 menos a planta#135). Variveis
binrias sempre podem ser tratadas como categricas, mas diferem das categricas com mais
de dois nveis efetivos por possuir uma maior
flexibilidade em anlises estatsticas, o que
justifica uma escala separada. As escalas Binria e Categrica juntas so chamadas de Escala Nominal.

A descontinuidade efetivamente algo que


deve ser levado em conta em anlises estatsticas. Entretanto, o problema no se resolve com
esta diviso em dois tipos de nmeros. Esta
diviso inapropriada porque: a) na prtica, no
existe nenhuma medida continua, tudo contagem, pois todo equipamento ou procedimento
tem um limite de preciso. Por exemplo, no
caso de pesos ns contamos as microgramas
do ltimo dgito de uma balana, com saltos
de 40,555 para 40,556 mg; b) contagens com
muitos nveis (e. g. posturas de peixes com 623,
1.544, etc., em nmero de ovos) tm propriedades matemticas semelhantes em anlises
estatsticas s dos nmeros descontnuos
(equivalem a 0,623 e 1,544, etc., em milhares
de ovos); c) mesmo para uma varivel considerada contnua (nmeros Reais), pode haver
problema de descontinuidade at para instrumentos de preciso se o nmero de nveis efetivos for pequeno. Por exemplo, se voc obtiver
apenas os trs nveis efetivos 0,01; 0,02 e 0,03
g em todas as suas medidas (note que no so
nmeros Inteiros) haver descontinuidade. Ao
invs de separar as estradas em lisas (contnuas) e esburacadas (descontnuas), seria
melhor classificar as estradas em funo dos
tamanhos dos buracos, pois microburacos sempre existem sem ser necessariamente um problema. Veremos no captulo 5 que na prtica o
problema da descontinuidade na varivel resposta irrelevante acima de 20 nveis efetivos,
pequeno at 10 nveis e vai tornando-se gradualmente grave a muito grave medida que temos menos nveis efetivos, exigindo ajustes na
tcnica de anlise.

Ordinais: Existe uma sequncia ordenada relevante entre os nveis na anlise. A diferena
entre um nvel e o prximo de posio apenas, no h uma quantificao. Por exemplo,
no podemos saber se o segundo lugar em uma
corrida chegou mais prximo do primeiro ou do
terceiro apenas com a posio da chegada.
Outros exemplos: abundncia na escala nula,
rara, intermediria, comum ou muito comum;
vento na escala fraco, moderado, forte, violento
e furaco; notas na escala A, B, C, D ou reprovado; idade na escala filhote, jovem pr
reprodutivo, adulto novo, adulto velho; tipo de
solo na escala arenoso, intermedirio arenoso,
intermedirio argiloso ou argiloso. Voc pode
usar nmeros nestas escalas, mas preciso
lembrar que estes nmeros no so quantidades.
Quantitativas: Variveis quantitativas possuem
valores numricos que efetivamente representam quantidades. No so variveis quantitativas aquelas que possuem valores numricos
que representam apenas ordem ou rtulo de
uma categoria.
Muitos livros de estatstica dividem a escala
quantitativa em duas: Razo e Intervalar. Esta
separao envolve um detalhe matemtico que
raramente relevante para o uso das tcnicas
estatsticas que abordaremos, de forma que no
a utilizaremos. Outra separao comum na
escala quantitativa entre nmeros contnuos
(nmeros Reais) e descontnuos (nmeros
Inteiros). A questo da continuidade relevante
porque os saltos dos nmeros entre nveis
podem exigir ajustes nos clculos estatsticos.

Outras escalas. H trs escalas de medida


especiais com as quais no trabalharemos, mas
que precisam ser conhecidas, uma vez que

30

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

(Zar, 1984) so necessrios para analisar dados


nesta escala. Entretanto, variveis como meses
e horas deixam de ser circulares se h uma
referncia sequencial adicionada informao
(e. g. fevereiro de 2008, 23 horas do terceiro
dia).
As escalas de medida normalmente so tratadas como se fossem excludentes entre si, isto
, que se um valor pertencesse a uma no pertenceria a outra, mas no assim (Fig. 3.2).
Uma escala quantitativa tambm ordinal, pois
os nmeros que representam quantidades esto
ordenados (mas nem toda sequncia ordinal
quantitativa). As escalas quantitativa e ordinal,
tambm so categricas, pois cada valor numrico ou de ordem, pode ser visto como uma
categoria. A binria est includa em todas, pois
dois valores podem ser obtidos em qualquer
escala. Muitos textos dividem os valores em
quantitativos e qualitativos, o que nos induz a
pensar que quantidades no so qualidades.
Entretanto, dizer que uma pessoa tem 1,80 m
s uma maneira mais precisa de dizer que ela
alta. Portanto, quantidades tambm so qualidades. A compreenso que algumas escalas de
medida esto dentro de outras e que qualquer
atribuio de valor uma atribuio de uma
qualidade ser importante quando abordarmos
lgica e a flexibilidade na escolha de testes
estatsticos (captulo 5).

Figura 3.2-. Do ponto de vista lgico, as escalas de medida


no so auto excludentes, algumas esto contidas em
outras, e a Binria (Bi) se encontra dentro de todas.

requerem mtodos estatsticos prprios. Algumas vezes estas escalas podem ser tratadas
como se fossem uma das escalas apresentadas
anteriormente, entretanto, no o ideal. A Escala Proporo para valores do tipo x de n
(e. g. 15/28 sementes sobreviveram no vaso 1)
ou do tipo que varia de 0 a 1 ou de 0 a 100%.
Muitas vezes estes valores so tratados como
quantitativos, mas h formas mais apropriadas
de lidar com eles (Warton & Hui, 2011). Na Escala Hierrquica a ordem entre os nveis
efetivos hierrquica (grupos dentro de grupos). O exemplo mais comum em biologia a
varivel espcies (pois as espcies se agrupam de forma hierrquica em gneros, famlias,
etc.). A varivel local, como em casas em um
estudo sobre dengue em vrios municpios
tambm hierrquica, pois as casas podem ser
agrupadas em vrios nveis espaciais (bairro,
municpio, estado). As tcnicas especficas so
diversas em funo do problema especfico (e.
g. Anova hierrquica; Regresso Filogentica,
Anlise de Correspondncia Cannica). Na
Escala Circular os nveis so cclicos, isto
seguem uma determinada ordem at chegar a
um ltimo nvel e retornar ao primeiro. Os
exemplos mais comuns envolvem medidas de
tempo, como hora do dia, dia da semana,
ms. Direes angulares (como a direo do
voo indivduos em migrao) tambm esto em
escala circular. Mtodos de Estatstica Circular

3.2 Atribuio de nveis nominais e


ordinais
Em escalas nominais (binrias ou categricas) e
ordinais no h uma quantificao; os nveis
so atribudos por um reconhecimento ou interpretao que determinada unidade amostral
pertence a uma categoria ou grupo definido ou
que est dentro de uma posio em uma escala
ordinal. Muitas vezes isto simples, como ao
registrar o local de uma coleta ou o se um peixe
morreu ou est vivo ao final de um experimento
de ecotoxicologia. Entretanto, frequentemente a
atribuio de nveis nominais ou ordinais uma
das partes mais sensveis de um estudo.

31

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

pessoas entrevistadas de outra cidade gostam


da qualidade de vida, no podemos saber se a
qualidade de vida melhor na primeira cidade
ou se as pessoas so mais exigentes na segunda. Uma pessoa pode achar que h poucas aves em um local quando estiver comeando a observar aves, e perceber que h muitas depois de adquirir mais experincia.

Imagine que voc quer saber se a proporo de


meninos que sabe nadar diferente da proporo de meninas que sabem nadar. Voc realiza
entrevistas e pergunta a muitas crianas se elas
sabem nadar. Dos 300 meninos, 66% responderam sim (sabem nadar), muito mais que os
33% de 300 meninas que responderam sim.
Embora a diferena seja estatisticamente significativa, h uma dvida importante antes de se
concluir que mais meninos que meninas sabem
nadar. O significado de um sim de um menino
realmente comparvel ao significado de um
sim de uma menina? Possivelmente os meninos tenham mais vergonha em admitir que no
sabem nadar e respondam sim mesmo sem
saber, enquanto as meninas apenas respondem
sim se nadam bem. Este exemplo ilustra o tipo
de problema que pode acontecer em entrevistas, mas o problema no se restringe a entrevistas.

Abordamos aqui as incertezas na atribuio de


valores nominais e abordaremos na prxima
seo incertezas em preciso e acurcia de
valores quantitativos. Terminamos esta seo
destacando que tambm os valores quantitativos podem ter incertezas de atribuio, por
exemplo, o nmero de aes agressivas por dia
depender do que se considera um comportamento agressivo, como j foi discutido acima.
Portanto, sempre importante refletir bem sobre a possibilidade de erros de atribuio comprometendo a interpretao no seu estudo.

Por serem interpretaes, as atribuies nominais e ordinais sempre esto sujeitas a erros,
como na identificao de uma espcie, na determinao de qual doena um paciente teve,
ou no sentido de um sim no pargrafo anterior.
importante definir cuidadosamente os critrios
de atribuio, principalmente quando a subjetividade pode ter um papel importante na deciso
de valor. Em muitos estudos de comportamento,
importante se detalhar o significado de categorias de comportamento utilizadas para permitir comparaes (etograma). Se voc chamar de
comportamento agressivo apenas quando
animais efetivamente lutam, vai considerar o
comportamento mais raro do que outra pessoa
que considere qualquer demonstrao de
agressividade.

3.3 Exatido, preciso e acurcia.


Uma medida um valor de uma propriedade de
uma entidade obtido com o uso de instrumentos, protocolos e procedimentos que podem ser
bons ou ruins em diferentes graus e aspectos
que sero tratados aqui.
A exatido de uma medida, na teoria, a proximidade entre o valor obtido e o valor real. Na
prtica, uma medida considerada mais ou
menos exata conforme o procedimento (instrumento, protocolo, etc.) para obt-la for considerado mais ou menos exato. Imagine que voc
comprou um medidor de presso arterial digital
baratinho na farmcia. Chegando em casa,
como qualquer consumidor vido, a primeira
coisa que voc faz medir a tua presso com o
novo brinquedo. O resultado te assusta: presso alta, de 140:90 (mmHg sistlica: diastlica),
acima do ideal de aproximadamente 120:80.
Ser que voc ter que ir ao mdico? ...ou ser
que a medida que est errada? Para saber se
a medida est errada, voc teria de saber a
medida real. Mas se voc soubesse a medida
real, no precisaria do aparelho. Se um especialista tiver te recomendado este aparelho por-

Quando trabalhamos com nveis ordinais os


resultados so muito mais confiveis se sempre
forem definidos pela mesma pessoa suficientemente treinada, ou se houver uma tabela de
referncia bem definida (como uma tabela de
cores de solo). Mais difcil interpretar nveis
ordinais que variam entre pessoas ou circunstncias envolvidas na coleta dos dados. Se 60%
das pessoas entrevistadas de uma cidade gostam da qualidade de vida e apenas 30% das

32

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

possvel que o aparelho est descalibrado. Neste caso, talvez seja bom ir ao hospital e obter
uma medida confivel. Se o hospital confirmar a
presso alta, pelo menos voc sabe que pode
confiar na acurcia do aparelho para as prximas medidas.

que alm de barato ele muito exato, ento


voc aceitaria a medida sem questionar. Do
contrrio, voc mesmo pode avaliar a exatido
instrumental nos seus dois aspectos: sua preciso e sua acurcia.
A PRECISO de um procedimento o grau em
que conseguimos com ele medidas quantitativamente prximas entre si em condies estveis e homogneas. A primeira coisa que faramos com nosso medidor de presso seria repetir a medida vrias vezes. improvvel que a
tua presso varie muito em poucos minutos, de
forma que podemos desprezar a variao natural, e o esperado seria vrias medidas iguais ou
muito prximas se o aparelho for muito bom.
Para simplificar, vamos considerara apenas os
valores da presso sistlica. Se voc obtivesse
os valores 140, 139, 140, 140, 141, 140, 140,
139, isto indicaria que o instrumento tem muita
preciso. Se os resultados fossem 140, 113,
125, 99, 137, 119, 121, 108, isto estaria mostrando que a preciso do instrumento baixa.

Uma forma didtica de representar a preciso e


a acurcia atravs de tiros a um alvo. Quanto
maior a preciso menor a disperso dos valores. A preciso nos tiros ao alvo com o instrumento espingarda costuma ser alta comparada com a baixa preciso com o instrumento
revolver para o mesmo atirador mesma distncia (Fig. 3.3). O resultado que os tiros da
espingarda ficam mais concentrados que os do
revolver (alvos superiores). Entretanto, a espingarda pode estar desajustada (alvo superior
direito), o que significa que a mira precisa ser
ajustada para obter maior acurcia. Note que
no podemos distinguir se o desvio de um tiro
foi por falta de preciso ou por falta de acurcia
se no tivermos um conjunto de tiros.
Preciso e a acurcia podem ser medidas. No
exemplo da espingarda e do revolver, considerando que o nmero de tiros semelhante, voc
pode dizer que a espingarda tem mais preciso
porque o tamanho do segmento entre os tiros
mais distantes menor na espingarda que no

A ACURCIA de um procedimento o seu grau


de ajustamento mdio em relao ao valor real. Uma balana pode ter alta preciso, porque
sempre d o mesmo resultado, mas pode estar
descalibrada e dar um resultado 15 gramas
superior ao real em todas as medidas. Um relgio de alta preciso atrasado 10 minutos vai
apresentar este erro por anos se no for ajustado para o horrio correto. Alguns equipamentos
de medida, como uma trena, no precisam de
calibragem, outros, como balanas e pHmetros,
precisam de verificaes peridicas, por isto,
so vendidos juntos com padres para calibrao, como metais com pesos conhecidos. Mas
como faramos no caso do nosso aparelho de
medir presso? O ideal seria comparar uma
medida deste aparelho com a medida para a
mesma pessoa imediatamente depois com outro aparelho reconhecidamente preciso e calibrado. Se no houver outro aparelho deste tipo
disponvel, uma alternativa seria medir a presso de outras pessoas ao seu redor. Se todos
tiverem presso normal e voc for o nico com
presso alta, provvel que o aparelho esteja
correto. Se todos tiverem presso alta, bem

Figura 3.3- Ilustrao sobre dois conceitos de incerteza


instrumental pela analogia com tiros de uma espingarda
(acima) e de um revolver (abaixo).

33

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

Figura 3.4- Representao de medidas relacionadas exatido:


1) desvio de um tiro (ou inexatido pontual); 2) impreciso de
uma espingarda (disperso de valores ou impreciso instrumental); 3) descalibragem ou tendenciosidade instrumental (inacurcia instrumental). A impreciso e a inacurcia so os dois aspectos da inexatido instrumental.

revolver. Voc pode dizer que a acurcia da


espingarda maior quanto menor a distncia
entre o centro do alvo e o centro dos tiros (fig.
3.4).

dados ao redor do valor central. A medida mais


simples de disperso a amplitude total, isto
, a diferena entre o maior e o menor valor
(Fig. 3.5). Podemos comparar a preciso de um
aparelho de medir presso com outro pela amplitude das medidas tiradas da mesma pessoa
em poucos minutos. Um aparelho que apresentasse os valores {140, 139, 140, 140, 141, 140,
140, 139 em mmHg} teria uma amplitude total
de 2mmHg, enquanto um aparelho com os valores {140, 113, 125, 109, 137, 119, 121, 118
mmHg} teria uma amplitude total de 31 mmHg,
isto , o segundo teria uma preciso bem menor. Esta medida de disperso (e preciso) tem
alguma utilidade quando h muitos dados, mas
simplista demais e ruim para a maioria das
situaes, pois a amplitude total no varia apenas com a preciso do instrumento, ela tambm
varia (tende a aumentar) com o nmero de medidas.
Uma soluo para este problema utilizar uma
amplitude parcial central dos dados por excluso de uma porcentagem dos extremos. Neste
contexto descritivo de preciso, o mais comum
costuma ser a amplitude parcial central excluindo-se dos menores valores e dos maiores
valores, que chamada Amplitude do Intervalo Interquartil (fig. 3.5). Com a excluso de
uma proporo fixa de extremos, a amplitude
parcial dos dados no aumenta com o nmero
de dados, como costuma acontecer com a am-

A medida da acurcia til para corrigir distores pela calibragem. Em equipamentos, como
vimos acima, comum haver padres para a
calibragem, mas ocasionalmente precisamos
calibrar procedimentos de outras formas. Imagine que voc tivesse que estimar visualmente
tamanhos de jacars distncia. Neste caso,
voc pode calibrar esta capacidade estimando
tamanhos de objetos semelhantes a jacars
(como troncos) distncia e depois verificar
como est se saindo medindo os objetos com
uma trena. Se tiver tendncia a superestimar o
tamanho, reduza suas estimativas e se tiver
tendncia a superestimar, aumente as estimativas. Se puder capturar jacars, conveniente
repetir a avaliao para melhorar a sua capacidade de estimar. Ningum consegue acertar
precisamente todas as medidas, mas voc pode
se considerar calibrado quando a quantidade
de subestimativas semelhante quantidade
de superestimativas.

Figura 3.5- Medio da preciso de um aparelho de medir


presso arterial por mltiplas medidas de presso em condies estveis. A Amplitude do Intervalo Interquartil,
obtido pela excluso de 25% dos valores inferiores e 25%
dos valores superiores uma medida melhor que a Amplitude Total porque no tende a aumentar com o nmero de
medidas.

A preciso costuma ser medida pelo seu inverso, a disperso dos valores (Fig. 3.4-2). Quanto menor a preciso, mais dispersos sero os

34

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

mento sobre preciso seja importante, ainda


mais importante o conceito de disperso de
valores que serve como base para entendermos
o assunto da prxima seo: a variao natural
e as distribuies naturais de frequncias.

plitude total. Isto , a amplitude Interquartil no


tende a ser maior ou menor se for determinado
com oito dados ou com 80; o maior nmero de
dados apenas aumenta a preciso desta medida de disperso. Portanto, a amplitude do intervalo interquartil uma forma apropriada de
medir a disperso dos dados. Apesar disto, esta
forma de medir a disperso dos dados pouco
utilizada.
Quanto maior a disperso dos dados, maior a
distncia de cada ponto do centro. Com base
nisto, foi criado outro ndice de disperso chamado de Desvio Absoluto Mdio (DAM) (Quadro
3.1). Esta medida uma forma bastante intuitiva
de medir disperso, mas tambm pouco utilizada. A medida de disperso mais utilizada
semelhante na essncia: a raiz quadrada da
mdia dos desvios ao quadrado, que chamada de Desvio Padro. O desvio padro realmente uma excelente medida de disperso em
muitas situaes, inclusive na medida da preciso de instrumentos e procedimentos, mas
necessrio algum cuidado. Primeiro quanto ao
nmero de valores usados em seu clculo. Bastam dois valores para um clculo de desvio
padro, mas clculos com menos que cinco
dados so muito pouco confiveis como medida
de disperso. Alm disto, ele pode no ser uma
boa medida de disperso dependendo da distribuio de frequncias da varivel em questo,
como veremos na prxima seo.

Quadro 3.1- A mdia aritmtica (1) um parmetro populacional utilizado em clculos de muitas medidas paramtricas.
Quando estimada com base em uma amostra, ela geralmente
simbolizada com um X ou um Y com uma barra encima. O
Desvio Absoluto Mdio (2) uma medida simples e intuitiva
de disperso. O Desvio Padro (3) uma medida bem mais
utilizada, com a mesma essncia do DAM. A frmula de DP
apresentada utilizada quando o determinamos com base em
uma amostra, que a situao mais comum. N= Tamanho
amostral; xi= cada valor registrado na amostra; = smbolo
matemtico de somatrio que significa que deve se somar os
termos a seguir na frmula. Curiosidade matemtica: a estatstica paramtrica utiliza estimativas inicialmente tendenciosas
que necessitam ajustes. o caso do desvio padro da amostra
com seu denominador (N-1). Por que no calculamos a mdia
dos desvios elevados ao quadrado com o denominador N? De
fato, no clculo de um desvio padro de um conjunto completo
de dados o denominador N. O problema que para determinar o desvio padro populacional com base em uma amostra
estaremos subestimando a disperso com o denominador N,
porque nossa mdia no a mdia real, mas uma estimativa
que necessariamente mais central ao conjunto de dados em
questo. Ao dividir por (N-1) temos um valor mais aproximado do DP da populao.

Na prtica, precisamos estar atentos para a


acurcia de nossos procedimentos, mas no
to comum precisarmos avaliar a preciso das
medidas que utilizamos. Em algumas situaes,
como no exemplo das estimativas de tamanhos
dos jacars, a impreciso da medida pode ser
muito importante e merece ateno especial.
Entretanto, em muitos estudos, os procedimentos e instrumentos so plenamente satisfatrios,
isto , sua impreciso irrelevante em comparao variaes naturais em estudo. Se sua
planta cresce 10cm entre cada medida, a preciso de 1 mm mais que suficiente para as tuas
anlises. Em outros casos, a preciso no to
boa, mas ela pode ser compensada por um
tamanho amostral maior. Embora o conheci-

35

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

resultado da variao natural dos tamanhos das


sementes. Ocasionalmente esta variao combinada (erro de medida + variao natural)
chamada de erro. Este um termo infeliz, pois
nos induz a pensar que a variao natural
parte de um erro da mesma forma que os erros
de instrumentos ou de mtodos de medida. Se
a preciso de medida for muito baixa, o erro de
medida pode prevalecer e obscurecer a variao natural, mas se a preciso de medida for
boa, a variao encontrada no um erro, mas
uma caracterstica importante da populao em
estudo.

3.4 Distribuies de frequncias


A partir do momento em que temos procedimentos calibrados e com preciso conhecida, podemos nos despreocupar com as medidas individuais e voltar a nossa ateno para a Variao Natural.
No se deve confundir a variao de medidas
em funo da preciso de instrumentos com a
variao natural. Poucas pessoas tm uma
altura que coincide com a mdia da populao,
mas isto no significa que a altura da maioria
das pessoas esteja errada. No uma questo
de erro de medida, algo natural. No exemplo
das sementes do incio da seo 3.3, estvamos realmente nos referindo a uma variao de
preciso de medida, ou erro de medida, porque
eram medidas da mesma semente. Entretanto,
se os alunos estivessem medindo sementes
diferentes, a variao encontrada seria tambm

O grfico mais comum para mostrar a variao


nos valores de uma varivel quantitativa chamado Histograma. Trata-se de um grfico de
distribuio de frequncias. Vamos ilustrar com
um conjunto de valores de tamanhos de peixes
e de salrios de uma amostra representativa de
funcionrios em uma grande corporao (Fig.
3.6). Analise o grfico com ateno, veja que no
eixo X (horizontal) da figura temos valores
quantitativos divididos em intervalos iguais e no
eixo Y (vertical) temos frequncia, que pode ser
a contagem das entidades por intervalo (frequncia absoluta) ou uma percentagem por
intervalo do total de entidades (frequncia relativa). Na figura 3.5 temos outra forma de apresentar dados de uma varivel, mas em histogramas o eixo Y com a frequncia d melhor
visibilidade forma como os dados se distribuem, especialmente quando temos muitos dados
e intervalos de classes pequenos, geralmente
lembrando uma montanha (distribuio unimodal- como nos dois grficos da figura).
Os histogramas mostram bem os dados de
amostras, mas so limitados para fazermos
inferncias populacionais. Por isto, geralmente
se faz inferncias modelando a distribuio
com curvas matemticas tericas ajustadas aos
valores obtidos, ou por procedimentos de reamostragem (seo 3.6), ou simplesmente assumindo um modelo matemtico, como veremos adiante. Na figura 3.6 as linhas com uma
forma de montanha foram construdas a partir
de modelos matemticos ajustados aos valores.
Na figura 3.7 so apresentados grficos de

Figura 3.6- Duas distribuies de frequncia com formatos


diferentes. Na figura A, a distribuio tem o formato aproximado de um sino. Na figura B a distribuio fortemente
assimtrica. As amplitudes com 95% dos dados foram
determinadas com clculo paramtrico em (1) e por excluso de extremos em (2).

36

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

verificao de premissas para a utilizao de


determinadas ferramentas de anlise estatstica, como veremos a seguir.
comum que a montanha da distribuio de
frequncia tenha um formato bastante simtrico
que lembra um sino, como vemos na figura
3.6 A e na figura 3.7. O modelo matemtico que
descreve esta forma de curva chamado modelo de Distribuio Normal (ou Gaussiano).
Muitas ferramentas estatsticas foram desenvolvidas para serem utilizadas quando os dados
tem normalidade (isto , quando razovel
assumir que a populao tem distribuio normal). Na prtica, nunca obtemos uma distribuio perfeitamente normal com nossos dados,
pois um modelo sempre uma aproximao da
realidade. Por exemplo, na natureza h limites
para tamanhos, mas na distribuio normal no
h. Para uma distribuio de frequncia de dados ser considerada do tipo normal no necessrio uma forma perfeita de sino, basta o
jeito (como na figura 3.6 A). Quando os dados no so suficientes para definir o jeito,
ainda podemos assumir a normalidade com
base na razoabilidade, isto , em motivos tericos ou de experincia anterior com dados da
mesma natureza. Mesmo quando evidente
que a distribuio no tem normalidade, mas
ela no se afasta muito da distribuio normal,
ainda razovel se utilizar tcnicas estatsticas
que tem a premissa da distribuio normal. O
problema trabalhar com dados assumindo
uma distribuio normal sem verificar a compatibilidade dos dados com esta distribuio ou
sem uma base na razoabilidade.

Figura 3.7- Exemplos grficos que ilustram modelos de


distribuies de probabilidades tericas. Estes modelos
servem como bases para utilizao de ferramentas estatsticas se podemos assumir que eles realmente so compatveis com a distribuio na populao.

modelos matemticos que podem ser ajustados


aos dados quantitativos obtidos. Naturalmente,
o modelo se aplica bem apenas em uma situao estvel, isto , quando a amostra foi retirada em uma condio na qual qualquer outra
amostra deveria mostrar um resultado bastante
similar. Por exemplo, se o tamanho mdio dos
peixes varia entre anos, no podemos modelar
apropriadamente para um ano com base nos
dados de outro ano.

Quando temos uma distribuio normal, ou


aproximada, o desvio padro uma excelente
medida de disperso dos dados. Conhecendo a
mdia e o desvio padro de uma populao,
pode-se determinar a proporo aproximada da
populao a um, dois ou trs desvios padres
da mdia (Fig. 3.8). O desvio padro calculado a partir da mdia, que um parmetro populacional, por isto, uma medida chamada de
paramtrica.

As distribuies de frequncia tem importncia


direta e indireta em estudos biolgicos. A importncia direta est na interpretao de causas e
consequncias do formato da distribuio. Por
exemplo: a) uma distribuio bimodal (fig. 3.7)
pode indicar uma seleo natural disruptiva em
um carter biolgico; b) pirmides etrias so
uma forma especial de histograma que revelam
importantes caractersticas de populaes, como o grau de desenvolvimento social de um
pais. A importncia indireta est em permitir a

37

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

A vantagem do desvio padro (DP) que uma


excelente medida de disperso para variveis
que tem normalidade. A desvantagem que
simplesmente no uma medida apropriada
quando a distribuio no normal. Voc pode
determinar o intervalo que contm 95% dos
dados por excluso de extremos (seo 3.3) ou
de forma paramtrica com base no desvio padro (Amplitude 95%= mdia1,96 DP), com
resultados semelhantes se a distribuio for
normal (Fig. 3.6 A). Entretanto, ao utilizarmos o
Desvio Padro para descrever uma distribuio
que no normal podemos chegar a resultados
estranhos, como incluir salrios negativos nos
limites de uma amplitude parcial central
(Fig. 3.6 B), o que nunca acontece com intervalos determinados por excluso de extremos.
Quando no h normalidade, h algumas alternativas: a) utilizar a amplitude interquartil como
medida de disperso; b) realizar uma transformao dos dados de forma a obter normalidade
(Cap. 5); c) apresentar a distribuio de frequncia ao invs de uma sntese numrica.

Figura 3.8- Quando temos uma distribuio normal, podemos determinar com base na mdia e no desvio padro
(DP), como os dados se distribuem e a proporo a cada
intervalo entre um, dois e trs desvios padres acima e
abaixo da mdia.

duos da populao estatstica (no confunda o


nmero de indivduos da populao com tamanho de uma amostra desta populao).
Os parmetros de proporo so contagens de
unidades amostrais de uma categoria divididos
por um total de unidades amostrais, como a
razo sexual de adultos e a taxa de sucessos
em um estudo sobre aprendizado (sucessos/
tentativas). Em variveis binrias s se apresenta um parmetro de proporo relevante (e.
g. razo sexual= machos/ total), pois o parmetro da outra categoria (fmeas/ total) seria redundante, de forma que voc pode escolher
qualquer um. Quando h mais de duas categorias em uma varivel, pode haver mais de um
parmetro relevante (e. g. azul/total, verde/total, amarelo/total). Embora isto possa ser
aplicado para categorias ordinais, normalmente
prefervel se usar outro parmetro que ser
apresentado adiante para esta escala.

3.5 Parmetros populacionais


Na Biologia, geralmente estamos mais interessados em caractersticas de populaes ou de
conjuntos de observaes ou eventos do que
em indivduos ou em eventos singulares. Algumas destas caractersticas so valores quantitativos denominados parmetros.
Quando temos um conjunto de valores (populao estatstica) com distribuio de frequncia
estatisticamente estvel, podemos estimar
apropriadamente alguns parmetros a partir de
subconjuntos representativos (amostras). Isto
muito til, j que raramente temos acesso a
toda a populao estatstica em que estamos
interessados em um estudo. Nesta seo sero
apresentados os parmetros populacionais mais
importantes. Os parmetros podem ser univariados (de contagem, de proporo, de variveis
ordinais, de variveis quantitativas) ou multivariados (de relao).

Os parmetros de variveis quantitativas envolvem contagens, como o nmero mdio de clulas brancas por campo em uma lmina de sangue, ou medidas contnuas, como o desvio
padro no tamanho (em m) de indivduos de
uma populao de Artemia salina. Note que as
contagens neste tipo de parmetro no so de
unidades amostrais, mas de algo que est em
cada unidade amostral. No exemplo da lmina

Os parmetros de contagem so totais para


toda a populao, como nmero total de indiv-

38

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

de sangue, a unidade amostral era campo e a


populao eram os campos daquela lmina.

chente de um rio para construirmos uma barragem segura.

Os parmetros de variveis ordinais e de variveis quantitativas mais importantes so de trs


tipos: de tendncia central, de disperso e extremos. As trs medidas de tendncia central
principais so a mdia, a mediana e a moda. A
mdia comum (tambm chamada de mdia
aritmtica) a soma dos valores divididos pelo
nmero de observaes (a princpio no deveria
ser aplicado para variveis ordinais). A mediana
divide os valores ordenados pela metade. Por
exemplo, se colocarmos 25 valores em ordem
crescente, a mediana ser o 13 valor. A moda
o valor mais frequente quando os dados quantitativos esto agrupados em intervalos. A mediana geralmente considerada uma medida
mais apropriada de centralidade quando no
temos uma distribuio normal ou aproximadamente normal, entretanto, a mdia sempre
uma medida significativa para medidas quantitativas, mesmo na ausncia de normalidade, pois
reflete um aspecto de centralidade que a mediana no reflete.

Parmetros multivariados envolvem mais de


uma varivel ao mesmo tempo. Por exemplo, a
diferena nos tamanhos mdios de machos e
fmeas de ratos silvestres em uma populao
(parmetro de grau de dimorfismo sexual em
tamanho) ou a inclinao (coeficiente angular)
da reta que descreve a relao entre o peso de
indivduos uma populao de ratos silvestres e
a quantidade de recursos alimentares em sua
rea de vida (parmetro em um modelo matemtico). So parmetros, pois so caractersticas quantitativas relacionadas a estas populaes, e so importantes nos estudos de relaes. H anlises em que diversos parmetros
so determinados ao mesmo tempo, como em
equaes que descrevem a relao entre uma
varivel resposta e diversas variveis preditoras
(regresso mltipla).

3.6 Intervalos de
parmetros.

confiana

de

Como j vimos, raramente trabalhamos com


parmetros, trabalhamos com estimativas de
parmetros e estas estimativas tem utilidade
limitada sem um intervalo de confiana.

Nas sees anteriores vimos medidas de disperso como o Desvio Padro e a Amplitude do
Intervalo Interquartil. Se a impreciso da medida
for pouco relevante em relao variao natural, estas medidas tambm so parmetros
populacionais (quando toda a populao foi
amostrada), ou estimativas de parmetros populacionais (quando o clculo foi feito por uma
amostra), pois a variao uma caracterstica
de uma populao.

Se voc est estudando um pequeno bando de


girafas de uma reserva, basta cont-las para
obter o valor do parmetro nmero de indivduos. Entretanto, se quiser estimar a populao de gafanhotos na mesma rea, a contagem
de todos provavelmente seria impraticvel. Voc poderia dividir a rea em muitas partes, sortear algumas, realizar contagens apenas nestas, tirar uma mdia e multiplicar pelo nmero
de partes. Neste caso, voc no teria o valor do
parmetro, mas uma estimativa. A chance de
voc acertar exatamente extremamente baixa,
por isto qualquer estimativa de parmetro
praticamente intil sem um intervalo de confiana.

Parmetros quantitativos extremos so o mximo e o mnimo populacional para uma varivel.


No nos referimos a mdias de mnimos ou de
mximos, mas a estimativas de mnimos e mximos absolutos a partir de amostras. Sua determinao bem mais incerta e complexa do
que para medidas de centralidade e de disperso. Por este motivo, raramente so tratados
em cursos bsicos, entretanto, so parmetros
extremamente importantes. Por exemplo, precisamos ter estimativas do valor mximo da en-

Um intervalo de confiana uma extenso da


nossa estimativa para uma amplitude ao invs
de um valor pontual, tendo um grau de rigor pr-

39

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

estabelecido para seu clculo. Os intervalor de


confiana mais utilizados so IC99%, IC95%,
IC90% e o erro padro (ou IC68,27%). Um
IC95% de um parmetro significa que o intervalo foi calculado de forma a ter 95% de chance
do intervalo de conter o parmetro. Por exemplo, uma estimativa de mdia de gafanhotos por
100 m2 de 12,3 com IC95% entre 8,5 e 20,3 nos
d uma ideia bastante precisa de at que ponto
nossa estimativa pontual confivel. A figura
3.9 ilustra uma utilizao de intervalos de confiana para mostrar mudanas temporais. Os
intervalos permitem avaliar as mudanas nas
mdias de volume de nctar por horrio de forma objetiva. O aumento entre 5:00 e 6:00 horas
incerto, mas podemos dizer com segurana
que houve reduo entre 6:00 e 7:00 horas.

populao. No exemplo dos gafanhotos, quanto


mais reas de certo tamanho voc tiver, maior
preciso ter. Neste exemplo, tambm teremos
maior preciso quanto maior for cada rea, pois
isto tende a diminuir a variao nos valores
entre reas e a cobertura da rea coletada. (A
representatividade em distribuio um conceito diferente relacionado com acurcia da estimativa que ser tratado na prxima seo.)
O conceito de intervalo de confiana essencial
ao usurio de estatstica, mas o seu clculo no
, por isto no entraremos em detalhes sobre a
forma de calcular intervalos de confiana de
parmetros de contagens e de parmetros de
propores. Estes intervalos podem ser facilmente
calculados
em
sites
como
www.graphpad.com/quickcalcs/confInterval1
(Motulsky, 2010). Entretanto, entraremos um
pouco nos detalhes de como obter intervalos de
confiana de parmetros de variveis ordinais e
quantitativas, pois h conceitos relevantes ao
usurio que precisam ser tratados.

40

10
:0
0

09
:0
0

08
:0
0

07
:0
0

06
:0
0

05
:0
0

Volume de Nectar (L)

Quanto menor o intervalo de confiana obtido


para um parmetro, melhor a estimativa, isto
maior a sua preciso. A preciso de um parmetro depende da preciso das medidas individuais, da variao natural entre unidades
amostrais e da representatividade numrica.
H diferentes formas de se determinar intervaAbordamos preciso das medidas individuais na
los de confiana. As mais utilizadas para o paseo 3.3. bom termos medidas individuais
precisas, mas a impreciso e a variao
12
natural no clculo de
parmetros podem
10
ser compensadas por
uma maior represen8
tatividade numrica.
A representativida6
de
numrica.tem
dois elementos prin4
cipais, o tamanho da
2
amostra (nmero de
unidades amostrais)
0
e o tamanho da unidade amostral (quando ela varia em taHorrio da manh
manho). Basicamente, quanto maior o
tamanho da amostra,
Figura 3.9- Variao na quantidade de nctar (L) em flores de Ficus devendus entre as 5:00
e as 10:00 horas da manh. A barra horizontal representa a medida paramtrica do Intervalo
maior a certeza de
de Confiana de 95% da Mdia. O IC95% paramtrico simtrico, mas foram omitidos os
que a estimativa do
valores negativos no grfico.
parmetro est prxima do valor real da

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

rmetro mdia tm sido o Erro Padro (Quadro


3.2) e uma estimativa paramtrica do Intervalo
de Confiana da Mdia (ICM) de 95% (ou
IC95% da mdia) calculada a partir do valor do
erro padro. importante no confundir o erro
padro com o desvio padro. O desvio padro
uma medida de disperso de valores da populao; uma caracterstica desta populao que
ganha preciso quanto maior a amostra usada
para estim-lo. O erro padro um intervalo de
confiana da mdia (equivale a um IC68%) que
diminui quanto maior for o tamanho da amostra
utilizada na estimativa. Sempre que usar um ou
outro obrigatrio explicitar de qual se trata.

de intervalos de confiana assimtricos ajustados aos dados. A lgica do funcionamento do


Bootstrap bastante intuitiva e apresentada
na legenda do Quadro 3.3. Quando h normalidade, suas estimativas so to boas quanto as
obtidas por mtodos paramtricos e quando no
h normalidade suas medidas so sempre melhores. Outra vantagem do Bootstrap que esta
tcnica no se restringe a avaliaes da mdia,
permite a determinao de intervalos de confiana para qualquer parmetro das escalas
quantitativa e ordinal.
Embora seja uma tcnica antiga, raramente
apresentada em cursos introdutrios de estatstica, porque os contedos destes cursos foram
definidos h uns 30 anos, quando o acesso ao
poder de computao era mais restrito, e esta
tcnica exige este poder. Entretanto, j faz tempo que isto no um fator limitante e trata-se de
uma tcnica valiosa, de forma que lentamente
est vencendo o tradicionalismo e comeando a
ser incorporada aos cursos bsicos.

O erro padro e o intervalo de confiana paramtrico so simtricos acima e abaixo da media. Este um dos problemas desta forma de
calcular intervalos de confiana que fica claro
no exemplo da figura 3.8. Note que foi omitida a
parte negativa do intervalo de confiana no
horrio 10:00hs. Isto foi feito porque sabemos
que no existe quantidade negativa de nctar.
Quando a distribuio de frequncias muito
assimtrica, como ocorreu neste exemplo, medidas paramtricas de intervalos de confiana
devem ser evitadas.

A nica premissa do bootstrap que a amostra


tenha uma distribuio semelhante distribuio da populao. Por exemplo, voc no pode
calcular uma velocidade mdia (e seu intervalo
de confiana) de um animal que se desloca
raramente se suas observaes no inclurem
alguns destes deslocamentos (esta premissa
tambm vale para testes paramtricos). Se a
distribuio dos dados for normal, podemos
determinar intervalos de confiana com boa
segurana a partir de 10 valores. Entretanto, se
a distribuio dos dados no tiver normalidade,
necessrio ampliar a amostra at que tenha
distribuio representativa da populao de
valores. Quando temos tamanhos amostrais
menores que 10 e representatividade de distribuio, o intervalo de confiana pode ser utilizado, mas muito importante tambm apresentar os dados brutos, como foi feito na figura 3.9,
onde os valores de cada observao so mostrados. Tamanhos amostrais pequenos no so
um pecado acadmico, mas est errado esconder do leitor as incertezas nos dados.

A tcnica chamada Bootstrap (Quadro 3.3)


permite obter uma estimativa no paramtrica

Quadro 3.2- Clculo paramtrico do Intervalo de Confiana IC95% da mdia. O clculo do Desvio Padro foi apresentado no Quadro 3.1.

41

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

Quadro 3.3- Determinao de Intervalos de Confiana pela tcnica de Reamostragem chamada Bootstrap. Funciona
como se o computador clonasse os dados vrias vezes, recriando algo semelhante populao original (como os
nmeros na tabela acima). Tendo esta populao, o computador retira uma amostra do mesmo tamanho amostral da
amostra inicial (representada em destaque na tabela) e calcula o valor do parmetro (e. g. a mdia). Depois repete o
processo muitas vezes (e. g. 1000 vezes), obtendo repeties de estimativa do parmetro. Ento retira uma porcentagem
dos valores extremos (e. g.. 5% para obter um IC95%) e obtm os limites do Intervalo de Confiana.

42

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

3.7 Independncia para parmetros


univariados
Os valores de parmetros univariados e seus
Intervalos de Confiana apenas so vlidos se
as amostras utilizadas para as estimativas forem baseadas em amostras representativas
em distribuio na populao em questo.
Uma amostra com representatividade em distribuio aquela obtida de forma a se obter uma
estimativa no tendenciosa de um parmetro
univariado. A forma mais conhecida de se obter
uma amostra representativa em distribuio
pela aleatorizao (isto , pelo sorteio) de quais
unidades amostrais de toda a populao sero
includas na amostra. Esta no a nica forma
vlida de obter amostras representativas em
distribuio, uma coleta sistemtica apropriada
tambm permite isto (Fig. 3.11). Por que isto
importante? Suponha que voc quisesse estimar a produtividade vegetal mdia em uma
fazenda e realizasse todas as coletas na margem leste desta fazenda por uma questo de
convenincia (proximidade da estrada de acesso). O problema que esta produtividade poderia ser influenciada pela fertilidade do solo que
no necessariamente homognea e poderia
*variar em gradiente de uma margem a outra da
rea. Isto no uma questo de paranoia metodolgica (seo 1.4), uma possibilidade
concreta que no pode ser desprezada. A possibilidade da estimativa do parmetro ser desviada por qualquer varivel de confundimento que
possa ter algum padro espacial ou temporal
anulada se a coleta for feita de uma forma
apropriada, como em uma coleta aleatria ou
sistemtica na rea de estudo. Algo semelhante
acontece com coletas realizadas ao longo do
tempo.

Figura 3.11- Trs formas de coletar dados. X= unidades


amostrais selecionadas para compor a amostra. Neste
caso, a amostra sistemtica no representativa da borda
da rea e a amostra de convenincia s representativa de
uma borda.

populao masculina adulta do Brasil por sorteio de toda a populao ter uma amostra excelente para calcular a mdia de alturas. Se
voc utilizar os dados de toda a populao
masculina adulta de um nico estado, como
So Paulo, esta medida no ser representativa
da mdia nacional, mesmo contendo cerca de
20% da populao do Brasil. Quando h representatividade em distribuio as unidades

A qualidade de uma estimativa de parmetro


univariado depende, primariamente, das unidades amostrais terem sido obtidas de uma forma
bem distribuda no universo amostral (representatividade em distribuio) e, secundariamente,
da porcentagem da populao que foi amostrada (representatividade numrica). Por exemplo,
se voc conseguir dados de altura de 0,01% da

43

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

amostrais, frequentemente se diz que so independentes. O que significa independentes?


Independentes umas das outras? No, nem
poderiam, j que estamos falando de uma populao e todas devem pertencer mesma populao. O termo Independncia significa fora da
influncia de um fator de confundimento.

cada nvel da varivel preditora possuem a


mesma representatividade em distribuio entre
si, ainda que nenhum destes nveis seja vlido
como representatividade em distribuio de
toda a populao estatstica. Esta situao ser
explicada com exemplos experimentais, pois
neles mais simples se obter esta condio.

3.8 Independncia em anlises de


relaes

Vamos comparar trs experimentos para testar


a hiptese que a Vermiculita (um mineral semelhante mica usado na agricultura) adicionada
ao solo influi sobre a produtividade de soja.
Para testar esta hiptese voc vai comparar o
crescimento de plantas em vasos sem vermiculita (controle) com o crescimento de plantas em
vasos com 50 g de Vermiculita adicionada ao
solo. No primeiro experimento voc utiliza apenas sementes saudveis de soja de um pacote
que comprou em um supermercado. Ao final, as
plantas nos vasos com o tratamento cresceram
significativamente mais e a resposta para sua
questo, dentro de critrios estatsticos, sim,
pelo menos para este pacote. Note que um
pacote no pode ser considerado representativo
das plantas de soja do mundo, entretanto o
resultado positivo pode ser considerado uma
evidncia relevante do efeito da vermiculita para
alm deste pacote. A lgica que, neste contexto, costuma ser mais razovel imaginar que a
diferena uma caracterstica genrica da soja
do que particular ao pacote. Voltaremos a isto
adiante.

As anlises mais comuns em estudos biolgicos


envolvem a avaliao de relaes que implicam
causalidade (relaes consequentes). Nestas
anlises so calculados parmetros multivariados (e seus intervalos de confiana), incluindo
diferenas de mdias entre grupos, coeficientes
de correlao ou coeficientes para cada varivel
de uma equao em modelos matemticos mais
complexos. Nesta situao, podemos falar em
independncia quando h representatividade
paralela (Fig. 3.12). Na representatividade
paralela ideal, os conjuntos de unidades amostrais de cada nvel da varivel preditora (ou
combinaes de nveis das variveis preditoras,
se houver mais de uma) possuem representatividade em distribuio vlida em relao populao estatstica. Esta situao rara, como
veremos adiante, de forma que geralmente se
busca nesta situao uma representatividade
paralela parcial e generalizaes com base na
razoabilidade. Na representatividade paralela
parcial, os conjuntos de unidades amostrais de

Agora imagine que voc tem dois pacotes de


sementes de soja, um de um lote brasileiro e
outro de um lote japons. Voc escolhe (ou
sorteia) qual deles vai ser utilizado no controle e
o outro vai para o tratamento. Ao final, as plantas nos vasos com o tratamento cresceram
significativamente mais. O problema que voc
no sabe se cresceram mais em funo do
tratamento ou em funo do lote. No h representatividade paralela porque os nveis da varivel preditora diferem em algo que relevante
alm da prpria varivel em estudo. O sorteio
foi uma aleatorizao irrelevante, pois no foi
para cada semente e sim para cada pacote, de
forma que no permitiu a homogenizao da
representatividade entre os nveis. A varivel

Figura 3.12- A representatividade paralela ocorre quando


os conjuntos de unidades amostrais de cada nvel da
varivel preditora (linhas paralelas) possuem a mesma
representatividade universal. Isto ocorre, por exemplo,
quando selecionamos aleatoriamente as unidades amostrais que sero utilizadas em cada tratamento em um
experimento.

44

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

lote igualmente entre tratamento e controle.


Tecnicamente dizemos que realizamos atribuio aleatria de qual semente vai para cada
nvel de tratamento. Em uma linguagem mais
simples, a gente simplesmente mistura bem as
sementes e distribui entre os tratamentos. Apenas em estudos experimentais temos este poder de atribuio aleatria de tratamentos. Em
estudos no experimentais precisamos encontrar outras formas de anular ou reduzir o efeito
de variveis de confundimento que trataremos
no captulo 6, mas a essncia de se buscar
representatividade paralela a mesma.

lote neste caso uma varivel de confundimento porque gera uma indefinio, j que
uma explicao alternativa ao tratamento com
Vermiculita para explicar a diferena entre tratamento e controle. Portanto, este segundo
experimento inconclusivo.
Em um terceiro experimento, voc sorteia de
qual dos dois lotes, do Brasil ou do Japo, sair
cada uma das sementes que ir para o tratamento e para o controle. Desta forma, ter uma
mistura dos dois lotes tanto no controle como no
tratamento. Ao final, as plantas nos vasos com
o tratamento cresceram significativamente mais
e a resposta para sua questo sim, pelo menos para esta mistura de dois pacotes. Assim
como o primeiro experimento, este tambm
vlido.

Alm de anular o efeito de potenciais variveis


de confundimento, h uma segunda preocupao que precisa ser levada em conta em estudos de relaes: a representatividade. Como j
comentamos acima, o experimento 1 com as
sementes foi considerado vlido, mas baseouse em apenas um lote de sementes de soja. O
ideal no seria que fosse utilizada uma amostra
aleatria de todas as sementes de soja do
mundo? Isto seria muito difcil, mas pelo menos
no deveramos tentar misturar vrios lotes
diferentes?

Note que em nenhum desses experimentos


temos garantia de representatividade em distribuio das amostras em relao a todas as
plantas de soja do mundo, mas isto no to
importante quanto a representatividade paralela.
Vejamos por qu.
Nos estudos de relaes entre uma varivel
preditora e uma varivel resposta no h apenas duas variveis em jogo, h muitas outras
variveis influindo sobre a varivel resposta,
que podem atrapalhar na avaliao sobre a
relao em estudo. O primeiro e o terceiro experimentos so considerados vlidos porque a
representatividade em distribuio entre os
nveis da varivel preditora idntica. Isto ,
ainda que no tenham representatividade em
distribuio da populao, no diferem de forma
potencialmente tendenciosa, pois no existe um
fator que afeta o grupo do tratamento de forma
diferente da que afeta o grupo controle. Assim,
o nico fator que influi no sentido de causar
uma diferena entre o tratamento e o controle
o prprio efeito do tratamento em estudo.

Para responder estas perguntas, precisamos


levar em conta conhecimentos biolgicos e
razoabilidade. A rigor, a concluso a que chegamos com um lote aplica-se apenas ao lote de
sementes que estudamos. Entretanto, este nvel
de rigor exagerado. Podemos e devemos
utilizar a validao externa por razoabilidade
(seo 1.4). Com base em nossos conhecimentos biolgicos, devemos ser cautelosos em generalizar o resultado para toda a espcie em
qualquer clima e solo, mas muito razovel
generalizar para a variedade e para o mesmo
clima e solo. Poderamos ter feito uma mistura
de lotes diferentes, o que realmente aumenta o
poder de generalizao, entretanto, isto introduz
rudo na anlise. Rudo a variao ocasionada
por incluir o efeito de outras variveis, ainda que
de forma no tendenciosa, o que leva ao obscurecimento do efeito em estudo. A deciso de
misturar alguns lotes razovel e precisa ser
ponderada pelo pesquisador, levando em conta
se ir priorizar o poder do teste ou a generaliza-

No segundo experimento o potencial efeito do


lote tornou o resultado inconclusivo, mas no
terceiro experimento o efeito do lote foi anulado
porque o sorteio garantiu a representatividade
balanceada, isto , a distribuio do efeito do

45

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

o. Entretanto, considerando que normalmente


queremos generalizar nossas concluses para o
futuro, e que no podemos viajar no tempo, a
representatividade paralela ideal raramente
possvel e geralmente teremos que julgar com
base na razoabilidade at onde podemos generalizar as concluses de um estudo.

compartilhados que so fatores comuns a cada


lote de sementes (constituio gentica, riqueza
do solo onde foram geradas, tempo de armazenamento, qualidade obtida em funo da forma
de colheita e transporte, etc.).
Definio 2: Em probabilidade e estatstica,
independncia entre variveis aleatrias ou
eventos significa que a partir do resultado de
um deles no possvel inferir nenhuma concluso sobre o outro (Wikipdia). A Wikipdia
uma valiosa fonte para tirar dvidas de estatstica, mas no ajudou. O que significa a partir do
resultado de um deles? Com dependncia ou
sem, nunca podemos inferir um valor a partir de
outro. E se considerarmos vrios valores, o
conceito no se sustenta logicamente nem nos
exemplos de jogos de azar. O que significa no
possvel inferir nenhuma concluso sobre o
outro? Se eu jogar um dado muitas vezes
(eventos independentes) posso verificar que h
seis nmeros diferentes com frequncias semelhantes de ocorrncia e posso concluir que a
chance de cair qualquer um deles na prxima
jogada de 1/6, ao contrrio do que prope a
definio.

Em resumo: em estudos de relaes, o aspecto


mais importante proceder de forma a anular
todas as potenciais variveis de confundimento
(aquelas que podem causar tendenciosidades).
Desta forma, teremos a segurana de que as
diferenas significativas nas variveis respostas
apenas possam ser atribudas s variveis preditoras estabelecidas no estudo. Adicionalmente, preciso refletir at que ponto as unidades
amostrais representam o universo amostral
inferido pelo estudo.

3.9 Consideraes complementares


3.9.1- Sobre o significado do termo Independncia.
Como vimos, o termo independncia tem significados diferentes, o que gera confuso. Nesta
seo analisaremos o uso do termo e sintetizaremos o que vimos nas duas sees anteriores.
Mesmo nos melhores textos de bioestatstica o
conceito de independncia apresentado de
forma pouco esclarecedora.

surpreendente que um termo to importante


na estatstica no seja definido de forma mais
apropriada. Estas definies provavelmente
refletem uma viso de estatstica predominantemente inspirada em jogos, mas que no se
encaixa bem em situaes de pesquisa.

Definio 1: Por independncia queremos dizer


que as observaes coletadas em uma rplica
no tem influncia sobre as observaes coletadas em outra (Gotelli e Elison 2010). Mesmo
neste excelente livro, a definio no clara.
difcil entender como observaes coletadas
podem influir sobre outras observaes coletadas. Com esta definio, somos induzidos a
achar que no haveria problema de independncia no segundo experimento da seo anterior, pois no h nenhuma influncia de uma
semente sobre a outra, cada uma est em um
vaso separado. Entretanto, o problema das
sementes no estaria na influncia presente de
uma rplica sobre outra durante o experimento,
mas em potenciais diferenas nos passados

A dificuldade existe porque se utiliza um termo


para quatro conceitos diferentes: a independncia genrica, a independncia absoluta, a independncia induzida de amostragens e a independncia induzida de relaes.
A Independncia (genrica) um termo que se
aplica quando se obtm as condies necessrias para anlises estatsticas no tendenciosas.
Entretanto, o termo normalmente no utilizado
estritamente com este sentido. A expresso
independncia entre unidades amostrais
utilizada com frequncia, como se fosse uma
caracterstica intrnseca das unidades amostrais. Mas importante entendermos que duas

46

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

Esta forma de independncia necessria para


estimativas de medidas coletivas (parmetros)
de uma populao.

unidades amostrais nunca so independentes


sob todos os aspectos imaginveis. Voc poderia considerar independentes duas unidades
amostrais obtidas em lados opostos do mundo,
mas elas seriam dependentes em algum outro
aspecto, como, por exemplo, por terem sido
medidas no mesmo ano. Na realidade, entre as
unidades amostrais tem que haver uma dependncia fundamental: todas devem pertencer
mesma populao, que delimitada por muitas
caractersticas comuns. Na forma como o termo
costuma ser usado, no fica claro que estas
condies variam em funo do tipo de anlise
que estamos fazendo.

Existe independncia induzida de relao por


representatividade balanceada em estudos com
variveis preditoras e varivel resposta quando
a relao entre cada varivel preditora e a varivel resposta no influenciada ou por uma
varivel de confundimento ou at mesmo pelo
efeito de uma varivel preditora sobre a outra. A
forma ideal de se obter isto pela aleatorizao
da atribuio de tratamentos descrita na seo
anterior que pode ser obtida em estudos experimentais, mas h outras abordagem que podem se aproximar deste ideal.

Dois eventos so absolutamente independentes se a ocorrncia de ambos aleatria dentro


do mesmo universo de possibilidades delimitado. Depois de tirar uma carta do baralho (e ver
o que ela era), o universo de possibilidades da
segunda retirada diferente (uma carta conhecida est fora), logo os dois eventos no so
absolutamente independentes, pois um influi
sobre o outro. Apenas com condies idnticas
temos independncia absoluta entre eventos.
Este conceito de independncia aplicvel em
jogos e em muitos experimentos em fsica e
qumica. Algo prximo a isto pode ocorrer em
laboratrios de biologia quando possvel considerar todas as condies biolgicas idnticas
(condies climticas estritamente controladas,
ao se utilizar clones, eficincia do manipulador
padronizada, etc.). Se houver qualquer dvida
sobre eventuais efeitos de mudanas temporais,
espaciais, genticas, de eficincia, etc., dentro
do laboratrio, que no seja o tratamento em
estudo, melhor realizar a pesquisa com o
conceito de representatividade balanceada.

Alta preciso e acurcia so caractersticas


desejveis em medidas, mas no existe medida
perfeita e qualidade tem seu preo, sejam elas
medidas de propriedades de unidades amostrais ou medidas de propriedades de populaes. Por exemplo, vale a pena gastar metade
do dinheiro de um projeto para trocar um instrumento de baixa preciso por outro de alta
preciso, comprometendo uma verba que permitiria mais idas ao campo? razovel delimitarmos o tamanho de um transecto de 200 m
usando passos, ou necessrio sempre utilizarmos da preciso de uma trena? Se uma
amostra aleatria invivel, podemos utilizar
uma amostra menos representativa ou melhor
desistir do estudo? Um experimento deve ser
cancelado se questes logsticas nos impedem
de realizar as medidas do tratamento e do controle na mesma semana?

Existe independncia induzida de amostragem


quando as unidades amostrais includas na
amostra foram selecionadas de forma representativa do universo amostral (representatividade
em distribuio). O modelo ideal de independncia induzida de amostragem a amostra
aleatria na qual cada unidade amostral tem
igual chance de ser escolhida para fazer parte
da amostra. Entretanto, h outras formas de se
obter independncia induzida de amostragem.

Administrar projetos de pesquisa uma atividade complexa, de forma que no podemos ignorar custos, tempo, praticidade e questes logsticas na determinao da preciso e acurcia
que ser utilizada. importante conhecer ideais
metodolgicos (e. g. medidas precisas e no
tendenciosas, tamanhos amostrais grandes,
amostragens aleatrias, etc.), mas estes ideais
no so leis metodolgicas absolutas, so apenas diretrizes que devem ser levadas muito a

3.9.2- O preo a pagar pela qualidade.

47

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

variaes aleatrias, sejam elas naturais ou de


medida. A falta de preciso pode contribuir para
no termos sucesso em provar uma determinada relao, em funo de uma amostragem
insuficiente. Isto considerado um erro menos
srio do que provar equivocadamente uma
relao que no existe, como veremos no captulo 4. Em outras palavras, a falta de preciso
pode atrasar a obteno de resultados significativos, mas no aumenta a chance de um falso
positivo. Por outro lado, a falta de acurcia no
pode ser compensada por um aumento no nmero de unidades amostrais medidas. Portanto,
uma fonte de preocupaes nas trs situaes.

srio. Acontece que h limites logsticos, fsicos


e morais que ocasionalmente nos impedem de
medir e coletar dados da forma ideal. essencial entender a diferena entre um comportamento cuidadoso para evitar interpretaes
equivocadas e uma paranoia metodolgica (seo 1.4). Um treinamento metodolgico no
pode te proibir de agir nestas condies, mas
ensinar como redobrar o cuidado quando for
necessrio. No existe uma nica metodologia
correta, existem metodologias apropriadas (ou
no) considerando o contexto e as alternativas
disponveis para resolver um problema.
Vamos abordar situaes concretas. necessrio diferenciar trs situaes nas medidas individuais: a) quando h uma deciso importante a
cada medida; b) quando h dificuldade em se
obter os objetos a serem medidos; c) quando o
estudo permite obter vrias medidas independentes.

importante que o cuidado com a qualidade da


medida no se torne obsessivo, isto , prejudicial ao prprio estudo. Por exemplo, digamos
que voc esteja fazendo um trabalho de ecologia vegetal no Pico da Neblina e seu tempo
muito curto por questes logsticas. vlido
medir transectos com passos para economizar
o tempo de estender a trena em cada transecto? Vimos que a falta de preciso no um
problema srio, mas e se neste processo inconscientemente obtivermos uma medida tendenciosa que subestima o tamanho do transecto? Digamos que esta falta de acurcia resulte
em transectos com 190 m em mdia ao invs
de 200 m. Qual a gravidade disto? Depende da
questo em estudo. Se voc estiver querendo
comparar a densidade de plantas em diferentes
altitudes e cometer o mesmo erro, ento a falta
de acurcia seria irrelevante, pois todos os transectos sero do mesmo tamanho, que o que
importa para que sejam comparveis. Entretanto, se o objetivo for obter medidas precisas de
densidade para comparar com outros locais,
ento quanto maior for o desvio, maior ser o
problema com o resultado. Provavelmente, uma
sub-estimativa de 5% na rea de cada transecto
no tenha muita relevncia, neste exemplo em
particular.

Nas duas primeiras situaes, a prioridade na


preciso mais alta que na terceira. Por exemplo, se estivermos selecionando atletas para
uma olimpada, no aceitvel a excluso de
um atleta por erro de medida (cada medida leva
a uma deciso importante). Quando temos dificuldade em obter os objetos ou encontrar as
situaes de interesse da pesquisa, cada oportunidade deve ser aproveitada ao mximo. O
que se ressalta aqui que apenas nos casos
em que cada medida for muito importante ou
difcil de ser obtida, a alta preciso justifica alta
prioridade de investimento. Naturalmente, no
uma questo de investir ou no na qualidade,
mas de quanto investir.
Na terceira situao, temos que separar preciso de acurcia. Por causar desvios aleatrios
(i. e. no tendenciosos), a falta de preciso
normalmente no um problema to grave na
pesquisa. um problema indesejvel, mas frequentemente pode ser compensado por uma
amostragem maior (com a vantagem de melhor
representatividade). Isto ocorre porque nos
testes de hipteses estatsticas, as concluses
so tomadas quando uma tendncia (relao
em estudo) to forte que pode ser distinta de

Alguns dos problemas mais graves ligados


qualidade dos dados aparecem quando estamos tomando uma medida por outra. Um exemplo clssico a utilizao de provas para medir

48

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

tendenciosos) ou de acurcia (se forem tendenciosos).

coeficientes de inteligncia, como se uma prova


destas conseguisse captar conjuntamente a
complexidade dos diferentes tipos de inteligncia. O mximo que estes testes poderiam medir
a capacidade das pessoas de se sarem bem
neste tipo de teste. Podemos considerar problemas deste tipo como falta de acurcia por
indefinio de um padro de referncia para
calibrar as medidas. Na seo 1.4 vimos outros
problemas de validao da medida ligados a
esta falta de acurcia inclusive um com varivel
binria. Ao perguntarmos a meninos se eles
sabiam nadar, a resposta (sim ou no) era tendenciosa (muitos no sabiam, mas tinham vergonha de responder a verdade), a das meninas
tambm era, mas de forma menos intensa. Desta forma, mesmo sem diferena na habilidade
de nadar, concluiramos que os meninos tm
mais habilidade. Este exemplo ilustra os riscos
da falta da acurcia em medidas em qualquer
escala.

Como vimos na seo 3.6, a acurcia na medida de um parmetro maximizada quanto melhor a representatividade amostral. Se a amostragem aleatria no possvel, o que muito
comum, procure o mtodo de coleta que mais
se aproxima daquilo que voc esperaria obter
em uma amostra que fosse aleatria. H muitas
formas sistemticas de coletar os dados que
permitem obter amostras representativas. Tambm h formas de analisar os dados para obter
resultados mais representativos (e. g. a mdia
ponderada). Se nada disto for possvel, procure
coletar amostras o mais distante possvel dentro
da rea de estudo. Tente evitar associar alguma
varivel que poderia dar um vis coleta. Por
exemplo, se quer investigar o interesse de uma
populao por futebol, o ltimo lugar onde vai
obter uma amostra representativa em um
estdio de futebol. Entrevistar pessoas na rua
em diferentes bairros no o ideal, pois exclui
grupos de pessoas que andam pouco na rua,
como idosos. Telefonar para pessoas tambm
pode excluir pessoas que no tem dinheiro ou
interesse em ter um telefone. Entretanto, se
voc fizer as duas coisas e os resultados forem
semelhantes, ento tem uma indicao que
estas formas de amostrar no foram to ruins.
Outra opo simplesmente reduzir o universo
de estudo ao grupo com o qual se pode trabalhar e tirar concluses apenas sobre este grupo.
Por exemplo, seu estudo pode ser sobre o interesse em futebol das pessoas que andam na
rua.

Os conceitos de preciso e acurcia aplicam-se


melhor a valores quantitativos, mas podem ser
generalizados para outras escalas de medida.
Quando estamos com uma varivel ordinal,
podemos obter maior preciso quanto maior for
o nmero de categorias ordinais. Por exemplo,
se queremos avaliar a sensao trmica de
pessoas, teremos menos preciso com uma
escala de trs nveis efetivos (quente, agradvel, frio) do que uma de cinco nveis efetivos
(muito quente, quente, agradvel, frio e muito
frio). Entretanto, escalas ordinais exigem um
cuidado redobrado na anlise, pois muitas vezes difcil avaliar acurcia nestas condies
(e. g. qual o valor real de muito frio?). Quando
falamos em escala categrica, temos uma situao similar. Nem sempre os limites de uma
categoria so claros. Qual o limite onde o
vermelho deixa de ser vermelho para se tornar
laranja? O resultado de um exame de sangue
pode ser positivo ou negativo (logo binrio) para
malria, entretanto, h uma incerteza (pode ser
um falso positivo) que diminui em funo da
quantidade de amostras e da experincia de
quem analisa o exame. Por isto, os erros de
atribuio de categorias tambm podem ser
considerados erros de preciso (se no forem

Como vimos na seo 3.8, a questo da independncia no estudo de relaes um problema fcil de resolver em abordagens experimentais normais, nas quais podemos escolher aleatoriamente quais entidades recebero quais
tratamentos. Entretanto, quando isto no possvel bem mais complicado analisar causalidade. Este assunto ser aprofundado no captulo 6.

49

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

perado para uma populao com distribuio


normal. Coloque nomes nos eixos ilustrando um
exemplo de um estudo biolgico imaginrio.

Exerccios:
1) O que so escalas de medida? Apresente um
exemplo original de propriedade com alguns
valores para cada uma delas.

11) Cite usando exemplos de variveis originais


a) um parmetro populacional para uma varivel
binria; b) dois parmetros populacionais para
uma varivel ordinal; c) trs parmetros populacionais para uma varivel quantitativa; d) um
parmetro multivariado.

2) Faa um grfico EPR com trs nveis de medida ordinais no eixo x e com cinco nveis quantitativos no eixo Y. Represente 20 entidades
neste grfico.

12) Quando a mediana e a moda so medidas


mais teis?

3) Explique por que dividir a escala quantitativa


em nmeros contnuos e nmeros descontnuos no resolve o problema da descontinuidade.

13) Para que utilizamos intervalos de confiana


em estudos biolgicos?

4) O fato de um valor pertencer a uma escala


no implica que ele no possa pertencer a outra
escala ao mesmo tempo. Explique.

14) Qual a diferena na utilidade do desvio padro e do erro padro.


15) No Bootstrap, o computador cria pseudopopulaes pela clonagem dos dados. Explique como isto permite determinar intervalos de
confiana pela excluso de extremos.

5) Explique e exemplifique as incertezas na


atribuio de valores nominais e ordinais.
6) Faa uma ilustrao representando alvos
atingidos por uma espingarda com a) alta preciso e alta acurcia; b) alta preciso e baixa
acurcia; c) baixa preciso e alta acurcia;
d) baixa preciso e baixa acurcia.

16) Explique por que acurcia mais importante


que a preciso quando estamos estimando
parmetros populacionais?
17) Explique as diferenas de definio e uso
da representatividade numrica, representatividade universal e da representatividade paralela.

7) Explique porque o Intervalo Interquartil uma


medida de disperso (ou impreciso) melhor
que a amplitude total para comparar a disperso
de amostras com nmero de observaes diferentes.

18) Explique a dificuldade que existe na definio do termo independncia em contextos


estatsticos.

8) Em que o desvio padro mais conveniente


que intervalos interquartis como medida de
disperso e quando a utilizao de desvios
padres no apropriada.

19) O que paranoia metodolgica e por que


nem sempre podemos seguir ideais metodolgicos?

9) Alguns textos usam o termo erro para a


disperso de dados em funo da impreciso
da medida e para a variao natural. Explique
por que isto no apropriado.

20) Podemos falar em preciso e acurcia em


escalas de medidas ordinal, categricas e binrias?

10) Faa um histograma com 24 valores que


represente uma distribuio bastante prxima
do esperado para uma populao com distribuio normal e um segundo histograma com 24
valores com uma distribuio muito fora do es-

50

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

4 A lgica dos testes


de hipteses
Uma das funes mais importantes da estatstica fornecer ferramentas que ajudem a testar
hipteses. O assunto to central em livros e
cursos de estatstica que algumas pessoas
acham que se trata de um assunto dentro da
estatstica (Fig. 4.1-A). Em funo disto, conveniente esclarecer que o teste de hiptese
algo mais amplo que o teste estatstico (Fig.
4.1-B). Um julgamento da hiptese que um crime foi cometido por determinada pessoa ilustra
melhor a complexidade do que um teste de
hipteses do que a comparao dos tamanhos
de plantas que cresceram sob dois tratamentos
diferentes. Neste captulo abordaremos a lgica
dos testes estatsticos dentro do contexto mais
amplo dos testes de hipteses.

Figura 4.1- O assunto teste de hipteses no algo que est


dentro da estatstica como simbolizado na figura A. O teste
de hipteses algo mais amplo que pode utilizar importantes ferramentas estatsticas (rea de sobreposio na figura
B).

do do cotidiano e do tribunal, onde todos so


inocentes at a prova do contrrio.

Outro esclarecimento para evitar mais um mal


entendido comum. Testes so processos para
provar empiricamente uma hiptese, se ela for
verdadeira. Quando dizemos que provamos
alguma coisa na pesquisa, estamos nos referindo a provas empricas. Provas lgicas puras
existem em campos como a geometria e o clculo, onde h raciocnios inteiramente dedutivos. Uma prova emprica diferente, ela usa
lgica, mas ela no inteiramente dedutiva,
mesmo no mtodo hipottico-dedutivo, pois ela
no logicamente necessria (Diez e Moulines,
2007). A prova emprica uma prova considerada satisfatria dentro de critrios rgidos, e
pode ser extremamente convincente, mas a
cincia sempre questionvel, pois no deduo pura. Se fosse deduo pura, a observao no seria necessria. comum lermos
frases como impossvel voc provar uma
hiptese na cincia. A frase s est correta se
a palavra provar estiver com o significado de
prova lgica pura. Entretanto, no h nada de
errado em se dizer que se provou empiricamente uma hiptese se seguirmos os critrios de
validao que a comunidade cientfica da rea
do assunto em questo tiver determinado. A
palavra provar na pesquisa tem o mesmo senti-

4.1 O mtodo hipottico dedutivo


Chamaremos a hiptese emprica que queremos testar de hiptese de trabalho. Como vimos
na seo 1.2, uma hiptese (de trabalho) emprica uma afirmao que tem consequncias
empricas constatveis. O teste de uma hiptese baseia-se justamente na deduo de previses desta hiptese e na verificao que as
previses realmente ocorrem. Parece fcil, mas
tem dois problemas.
O primeiro problema que observar qualquer
coisa que a hiptese prev no evidncia
suficiente para provar que a hiptese est correta. As previses para testes precisam definir
condies especiais para reduzir incertezas ao
mnimo. A fase dedutiva do mtodo hipottico
dedutivo termina na previso; mas o que vem
depois? A prova emprica baseia-se na coerncia entre previso e evidncia e na confiana
que podemos considerar excludas todas as
outras possibilidades de se obter este mesmo
resultado.

51

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

to no mostrar que no h nenhuma outra hiptese razovel para explicar a evidncia obtida.

O segundo problema que no observar o que


a hiptese prev tambm no prova que a hiptese esteja errada. O que fazemos quando no
conseguimos provar a hiptese de trabalho?
Devemos abandona-la? A deciso ao final do
teste de hiptese nem sempre um sim ou um
no claros, e temos que refletir sobre o que
fazer com o talvez. Este segundo problema
ser tratado ao final do captulo.

Segundo exemplo. Um bilogo estudava uma


espcie de formiga que caa em grupos de
cerca de 20 indivduos, captura cupins a at 200
m de distncia do ninho e depois retorna ao
ninho. Ele se perguntou: como elas acham o
caminho de volta? (Questo). Ele sabia que as
formigas utilizam pistas qumicas, mas h um
risco alto delas acidentalmente perderem a
trilha, por isto achou que elas poderiam estar
utilizando outras pistas para encontrar seus
ninhos. Ento, ele levantou a hiptese que elas
usavam tambm referenciais espaciais (rvores
e arbustos ao redor) para achar o caminho de
volta. Para testar a hiptese, ele esperou as
formigas se afastarem 100 m do ninho e prendeu-as sob um balde, retirou toda a camada
superficial de solo da rea ao redor do ninho,
marcou as formigas com uma tinta no txica e
soltou-as. No dia seguinte, ele voltou ao formigueiro e encontrou as formigas marcadas l.
Desta forma, ele concluiu que as formigas so
capazes de encontrar o ninho mesmo sem as
pistas qumicas e devem possuir uma capacidade de orientao com base em referncias
espaciais. Veja como este procedimento envolve contrastes de previses.

Vamos ilustrar um pouco da complexidade dos


testes de hiptese com dois exemplos. Voc
sabe que estudar ajuda a tirar notas mais altas,
mas imagine que este fosse um fato desconhecido e vamos tratar esta afirmao como uma
hiptese de trabalho. Como mostrar que ela
verdadeira? Uma previso que algum que
estude muito ter uma nota mais alta que algum que estude pouco. Ento imagine que
Joo estudou muito e tirou 9,0 e Jos no estudou e tirou 4,0, como seria esperado pela hiptese de trabalho. Entretanto, podemos imaginar
muitas outras razes que poderiam explicar o
sucesso de Joo e o fracasso de Jos. Logo,
no podemos afirmar com base nestes dados
que estudar faz diferena. Por isto, a sua previso no pode se restringir a duas pessoas, sua
previso tem que ser que vrias pessoas que
estudarem muito tero em mdia notas maiores
que vrias pessoas que estudarem pouco. Voc
ainda precisa eliminar outras possibilidades:
desde que as provas dos dois grupos comparados sejam controladas para prevenir cola;
desde que o grupo dos que estudaram seja
equivalente ao grupo dos que no estudaram
(por exemplo, por escolha aleatria dos membros de cada grupo); desde que a prova seja
sobre o assunto estudado, etc. Veja que h
uma srie de condicionais para a sua previso
ser considerada uma previso vlida para teste,
isto , uma previso exclusiva da hiptese de
trabalho. Algum poderia invalidar a concluso
do teu estudo se mostrasse que o grupo que
estudou mais fez a prova em uma sala ar condicionado e o grupo que no estudou fez a prova
em uma sala quente. A diferena poderia ter
sido pelo desconforto do segundo grupo, e voc
no prova empiricamente uma hiptese enquan-

A previso da hiptese era que as formigas


conseguiriam retornar ao ninho (pois podem
utilizar referenciais espaciais). Entretanto, a
mera observao das formigas de volta no ninho no teria nenhum valor sem a eliminao
dos rastos com a remoo do solo, pois elas
poderiam ter retornado utilizando apenas as
pistas qumicas. O bilogo ainda marcou as
formigas para eliminar a possibilidade de estar
confundindo os indivduos do estudo com outras
formigas do ninho, ou at com formigas de outro
ninho que tivessem aproveitado a oportunidade
do ninho vazio. Algum poderia questionar a
validade de um experimento que prendeu formigas sob um balde, trocou o solo e as marcou
com tinta, o que certamente poderia ter afetado
o comportamento delas. Entretanto, estas criticas no comprometem a interpretao do resultado, pois o que poderamos prever desta per-

52

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

aspas, so antes possibilidades que precisam


ser consideradas no processo, por isto utilizamos as aspas. Por outro lado, no est errado
cham-las de hipteses, j que so afirmao
que tem consequncias empricas constatveis.

turbaes que elas apenas poderiam atrapalhar as formigas, de nenhuma forma poderiam
ajud-las. O fato que mesmo com estas perturbaes, elas conseguiram chegar ao formigueiro. Outra pessoa poderia questionar a interpretao dizendo que as formigas poderiam ter
se orientado com base no eixo magntico da
terra, utilizando uma bssola interna. Ele poderia ter respondido que esta possibilidade no
pode ser excluda, mas que no parece razovel, pois j foi demonstrada a capacidade de
orientao por referenciais espaciais em outros
himenpteros, mas nunca foi demonstrada a
capacidade de orientao magntica em insetos. Algumas descobertas incrveis, como a
capacidade de ecolocao em morcegos demoraram a ser aceitas. Entretanto, geralmente
uma boa deciso no comear seriamente com
ideias muito radicais sem ter bons motivos para
isto, especialmente quando sua hiptese de
trabalho parece muito mais provvel.

Na realidade, o processo completo de teste de


hipteses comea antes da hiptese de trabalho. A escolha de uma hiptese no algo aleatrio, e importante que no seja. A seleo
preliminar de hipteses relevantes e objetivas
parte essencial do processo de pesquisa.

4.2 Estabelecendo hipteses de


trabalho relevantes
Uma diretriz da pesquisa testar hipteses
relevantes, no valor e na chance de serem
verdadeiras. Podemos exercitar estatstica com
testes irrelevantes, mas ai no pesquisa para
valer. Podemos considerar como vlido um
mtodo de investigar muitas possibilidades em
uma fase preliminar de um estudo, mas no
devemos chamar a cada uma destas investigaes de teste. O motivo que realizar inmeros
testes irrelevantes causa inflao de testes,
que uma ampliao exagerada na chance de
falsos positivos.

Ainda h uma hiptese a considerar: as formigas poderiam ter conseguido retornar por sorte.
Poderiam ter andado a esmo pela rea e por
acaso encontrado a pequena abertura do formigueiro. Entretanto, procure imaginar a situao,
no eram 2m ou 10 m, eram 100 m. uma
distncia enorme para as formigas andarem ao
acaso e encontrarem o formigueiro apenas
por sorte. Seria muito mais provvel que
elas simplesmente se perdessem se no
tivessem orientao. A hiptese de terem
encontrado ao acaso to improvvel que
pode ser tranquilamente descartada.
Para aprofundar a ideia do mtodo hipottico dedutivo, vamos representa-la de forma mais visual (fig. 4.2) e vamos ver as
partes envolvidas. A hiptese de trabalho
tem uma posio central no processo, o
que natural, porque ela que est sendo
testada e dela que partem as previses
que sero utilizadas. Vemos no esquema
que existem vrias hipteses que poderiam competir com ela como explicaes
alternativas para o que se encontrou como
evidncias. No so hipteses de interesse
prprio de pesquisa, por isto utilizamos as

Figura 4.2- Uma prova emprica no mtodo hipottico dedutivo tem a


hiptese de trabalho como centro e outras hipteses que precisam ser
eliminadas por procedimentos, clculos e/ou razoabilidade. Na realidade, o procedimento de escolher hipteses relevantes j faz parte do
processo, pois diminui a chance de falsos positivos.

53

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

um conceito importante, mas esta hiptese no


seria testada seriamente porque nossos referenciais tericos cientficos nos levam a considerar este teste como irrelevante. Este teste
apenas se justificaria se realmente considerssemos esta hiptese como possvel, ainda que
muito improvvel.

Pense no processo utilizado na soluo de crimes. A princpio, quando ainda no temos nenhuma informao, qualquer habitante da terra
poderia ser o culpado de um determinado assassinato (= bilhes de hipteses). No podemos julgar o mundo inteiro, por isto precisamos
de uma investigao para chegar a um suspeito
ou a um grupo de suspeitos que trabalhou junto
para realizar o crime (= 1 hiptese de trabalho).
Depois, h uma busca de evidncias que apoiem a hiptese e ento o caso levado a julgamento. No momento do julgamento ns nos
concentramos em uma nica pessoa ou grupo
de pessoas que poderia ter trabalhado junto
para realizar o crime. Reduzimos bilhes de
hipteses a apenas duas: os rus so culpados
ou os rus so inocentes.

Vamos tomar dois exemplos para entendermos


o poder dos mltiplos testes irrelevantes em
distorcer a realidade. Suponha que voc considerasse possvel que capacidades extrasensoriais pudessem ajudar na soluo de crimes? Isto pode ser testado? Claro que sim.
Chame a pessoa que diz ter estes poderes,
escolha um crime no resolvido aleatoriamente
e pea para ela predizer com preciso onde
est um corpo desaparecido. Se ela conseguir
prever que o corpo est enterrado do lado do
terceiro pinheiro esquerda da caverna do urso, pode contrat-la. Algum dir: Por que
perder tempo com este teste se j h vrios
registros confiveis de pessoas que previram
coisas que resolveram crimes; estes registros
no bastam para provar a existncia da mediunidade? O problema que estes registros no
teriam se tornado notcia se a adivinhao no
tivesse sido correta, teriam cado no esquecimento, de forma que no sabemos a taxa de
fracasso. Imagine que milhares de pessoas
fazem centenas de previses ousadas. Fatalmente algumas destas previses sero corretas
eventualmente. Por isto, no basta te mostrarem alguns registros impressionantes, isto no
prova nada. Nossa estatstica intuitiva fraca
para lidar com alguns tipos de clculos de probabilidade e h coisas em que queremos acreditar ignorando o razovel. Por que pessoas
com alegadas capacidades extra-sensoriais
nunca decidem quebrar a banca dos cassinos
ao invs de tentar nos convencer dos seus poderes? Tomamos decises com base em probabilidades isoladas, mas tudo muda quando
temos muitos testes. As observaes do passado so teis para levantar hipteses (e. g. de
possveis mdiuns), mas devem ser vistas com
muita desconfiana como provas se no tivermos informaes adicionais suficientes.

A fase da determinao de qual o principal


suspeito de cometer um crime pode ser to
simples que acontece inconscientemente ou to
complexa que nem conseguimos chegar a um
suspeito qualificado. Certamente nossa primeira
opo recair sobre uma pessoa agressiva do
convvio da vtima e com motivo que na possibilidade de ter sido uma simptica velhinha desconhecida da vtima. Nesta fase, difcil colocar
regras, pois at descobertas casuais podem ser
vitais. Entretanto, certamente h diretrizes de
aes, como entrevistar conhecidos da vtima,
recolher materiais da cena do crime, etc., juntando peas at comear a se formar um quadro. Em situaes complexas, importante
comear com a mente aberta para qualquer
possibilidade razovel e submet-las a o processo de competio de hipteses, como em
um campeonato para ver o melhor time, frequentemente com diferentes etapas at chegar
ao suspeito qualificado (ou grupo suspeito que
trabalhou junto). Se no houver base suficiente,
ningum ir a julgamento.
Parece um processo restritivo demais. Compreensvel para tribunais, mas no podemos ser
mais complacentes na cincia? Pode ser em
grau, mas no em princpio. Um exemplo ilustrativo de hiptese do captulo 1 era que passar
sob uma escada dava azar. Foi apenas um
recurso didtico de usar humor para fixar bem

54

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

Na bolsa de valores h corretores que so considerados geniais com base na proporo das
aes que eles recomendaram e que tiveram
lucros excepcionais, e eles so contratados com
salrios milionrios. Ser que eles valem estes
salrios ou so simplesmente os ganhadores na
loteria das bolsas? Estudos mostraram que,
depois dos sucessos excepcionais, estes corretores brilhantes no tinham mais sucesso que
corretores medianos. No percebemos isto
porque nossas convices que o sucesso est
ligado competncia so to fortes que nos
cegam para perceber que muitas vezes o sucesso fortemente influenciado pelo acaso.
Resultados extremamente positivos so evidncia de competncia, mas a evidncia torna-se
fraca se o nmero de tentativas for elevado.
Achamos que alguns corretores so brilhantes
com base em seus resultados extremamente
positivos porque esquecemos que h milhares
de corretores realizando milhes de operaes
durante anos.

4.3 Descartando hipteses


procedimentos

com

A primeira preocupao de um avaliador externo sobre os resultados de um trabalho se os


procedimentos foram vlidos. Se houver dvida
sobre algo importante nos procedimentos, o
resultado favorvel hiptese de trabalho perde
seu valor. A diferena de nota entre dois grupos
de alunos deixa de ser uma boa evidncia do
efeito de uma tcnica de ensino sobre o aprendizado se a correo de cada grupo for feita por
um avaliador diferente (considerando uma prova
com perguntas subjetivas). O avaliador pensa
assim: De fato, houve uma diferena de nota, o
que apoia a hiptese de trabalho. Entretanto,
imaginando que esta hiptese fosse falsa, seria
possvel chegar-se a este resultado por um erro
de procedimento? Note que neste momento
deixamos a hiptese de trabalho de lado e dirigimos nossa ateno para outra hiptese que
explicaria o mesmo resultado. A hiptese de
erro procedimental uma possibilidade que
precisa ser eliminada testando instrumentos e
avaliando procedimentos. Nem sempre um avaliador externo consegue perceber um erro, mas
lendo os mtodos, ele pode imaginar onde um
erro poderia estar escondido, como ao verificar
que no se detalhou como foi feita a correo

Erros assim tambm ocorrem na cincia. A


inflao de testes certamente a principal causa de falsas evidncias no intencionais publicadas em artigos cientficos. Trata-se de um
problema real que no recebe a ateno devida
em cursos de metodologia. A principal forma de
minimizamos a hiptese da inflao de testes
evitar o uso exagerado de teste de hipteses. A hiptese da inflao de teses
um complemento da hiptese do acaso.
Se voc ficar testando muitas possibilidades, voc vai distorcer no conjunto o
significado de cada teste individual. Uma
pesquisa no precisa se restringir a uma
hiptese de trabalho. Pode haver vrias
questes e hipteses envolvendo o tema
em estudo, mas importante restringir os
testes a hipteses relevantes para no
escolher apenas os resultados significativos. Voltaremos a este assunto quando
abordarmos testes mltiplos no captulo 7.
Figura 4.3- Evidncias favorveis hiptese de trabalho no tem validade
se no houve procedimentos apropriados.

55

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

duo de rudo). H situaes em que se pode


descartar esta hiptese por razoabilidade, mas,
principalmente em estudos com hipteses univariadas, necessrio levar esta hiptese muito
a srio.

da prova, e pedir para o autor reescrever com


mais detalhes para eliminar esta potencial varivel de confundimento. Se o erro de fato ocorreu, o pesquisador provavelmente teria de refazer a coleta. O pesquisador competente descarta estas hipteses de erro procedimental planejando bem seu estudo e o conduzindo com seriedade e depois defende o que fez explicando
tudo que for relevante para o avaliador poder
concluir que realmente o procedimento foi vlido.

A hiptese do acaso ocasionalmente descartada por procedimentos, criando uma situao


que dificilmente poderia ocorrer por acaso, como no exemplo das formigas. Entretanto, sempre que for possvel se obter vrias observaes de um mesmo fenmeno, recomendvel
se utilizar uma abordagem estatstica para lidar
com ela. Na prxima seo veremos como a
hiptese do acaso pode ser descartada estatisticamente.

As validaes da medida, interna e externa so


as formas de se prevenir contra estas hipteses
de erros. Vamos record-las: A validao da
medida envolve problemas de atribuio de
nveis nominais e ordinais, calibragem de instrumentos e procedimentos e variveis operaciAntes de entrarmos no principal assunto do
onais no apropriadas como medidas das varicaptulo, que o descarte da hiptese do acaveis tericas respectivas. A validao interna
so, importante apontarmos outra possibilidao conjunto de procedimentos para evitar prode incomum no nosso esquema: sempre pode
blemas com a hiptese das outras causas (varihaver um erro no paradigma, isto , na base
veis de confundimento). Este tipo de problema
conceitual. Isto especialmente difcil de percepode ser facilmente eliminado em estudos expeber se a evidncia coincide com a previso da
rimentais, pela aleatorizao da atribuio de
hiptese de trabalho. Por exemplo, confiamos
tratamentos por unidade amostral (seo 3.8) e
muito em provas de amostras de DNA, ainda
por cuidados posteriores aleatorizao para
mais se a vitima do crime tiver reconhecido o
manuteno da representatividade paralela. Em
suspeito. A chance de coincidncia de DNA
estudos amostrais o problema das potenciais
quase nula, mas a chance de troca de amostras
variveis de confundimento bem mais comno to baixa e a vtima pode estar influenciaplexo e ser tratado no Captulo 6. No que se
da se souber que o exame foi feito e ser psicorefere a procedimentos, a validao externa lida com a representatividade universal.
A amostra obtida no estabelecimento de
um parmetro precisa ser bem distribuda
(idealmente de forma aleatria) no Universo Amostral. Normalmente, isto se torna
um problema com amostras com unidades
amostrais agrupadas em uma situao de
variaes nos valores da varivel em estudo no distribudas homogeneamente no
espao e/ou no tempo. A melhor forma de
lidar com isto a busca de unidades
amostrais escolhidas aleatoriamente em
toda a populao estatstica em considerao, mas ainda h outras tcnicas vlidas conforme a situao (seo 3.7). Fre- Figura 4.4- Algumas vezes uma pesquisa leva a descobertas que extrapoquentemente, isto no possvel, e muitas lam o paradigma (concepo do mundo) vigente. Trata-se de algo raro,
mas este esquema no estaria completo sem incluir esta possibilidade.
vezes no feito por razes tcnicas (re- Evidncia favorveis Hiptese de trabalho no tem validade se no

56

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

logicamente influenciada reconhecer a vtima


por uma vaga semelhana.
No exemplo das formigas, voc inicialmente
pode achar que a nica explicao para as formigas acharem o caminho de volta seria a capacidade delas de reconhecer referenciais espaciais. Entretanto, novos experimentos poderiam demonstrar que elas no tm realmente
esta capacidade. Surge um paradoxo. Ento
como elas acharam o caminho? E ento, voc
comea a considerar o inesperado, que as formigas possivelmente possam se orientar por
campos eletromagnticos da terra. Normalmente, nossas pesquisas so feitas dentro de um
paradigma, isto , dentro de uma concepo de
mundo. Entretanto, h momentos em que as
pesquisas mostram que o paradigma estava
errado e que ele precisa ser reformulado. Por
ser uma situao rara, no entraremos em mais
detalhes sobre esta possibilidade.

Figura 4.5- Depois de escolher bem a hiptese e de tomar


cuidados com procedimentos, o processo de teste costuma
terminar pela excluso da hiptese do acaso, mais conhecida
pelos estatsticos como Hiptese Nula.

resultados inferiores ou superiores a algum


valor ou entre grupos. Por exemplo, se sua
hiptese de trabalho que certo remdio tem
um efeito melhor do que outro em determinado
sintoma, e voc prev uma a cura mais frequente ou rpida com ele, ento a hiptese nula ser
que o remdio no melhor (ele igual ou pior). Problemas que envolvem hipteses de trabalho sobre semelhanas so menos comuns e
um pouco mais complexos. No d para provar
uma hiptese de trabalho de igualdade (e. g. o
efeito deste remdio exatamente igual ao
outro), o que pode ser feito nesta direo
provar uma hiptese de trabalho de semelhana, desde que uma diferena mxima seja estabelecida (e. g. o efeito deste remdio no
mais que 5% melhor do que o outro). Esta no
uma situao comum, de forma que no costuma estar em cursos mais bsicos de estatstica.

4.4 Descartando a hiptese do acaso


Quando sua pesquisa permite a observao de
vrios casos (entidades, unidades amostrais) de
um mesmo tipo de fenmeno, a forma mais
tradicional de derrubar estatisticamente a hiptese do acaso chamada de Teste de Significncia de Hiptese Nula. (TSHN- Wood, 2012).
A abordagem parte do princpio que os problemas na obteno de dados discutidos anteriormente foram todos eliminados por procedimento
(a amostra representativa, a medida foi apropriada, no houve inflao de testes e o desenho amostral exclui a possibilidade de variveis
de confundimento). Portanto, se o observado
coincide com o previsto pela hiptese de trabalho, restam apenas duas opes: a hiptese de
trabalho est certa ou foi uma coincidncia (mero acaso). Neste ponto entra a caracterstica
marcante do TSHN: o clculo da probabilidade
do obtido ter ocorrido por acaso e a comparao desta probabilidade com um valor limite
pr-definido.

A hiptese nula uma ideia que se transforma


em um modelo matemtico de frequncias esperadas (probabilidades). Voc faz de conta
que ela verdadeira, considera as caractersticas dos dados da sua amostra e calcula a probabilidade associada quela situao. Podemos
calcular a probabilidade esperada de 8 de 10
plantas terem alto crescimento no tratamento
contra 2 de 10 no controle quando no h efeito
de tratamento (hiptese nula de propores
iguais; P<0.01- para diferenas iguais ou mais
extremas; teste de 2 propores de duas cau-

A Hiptese Nula, geralmente simbolizada como


Ho, a negao de uma hiptese de trabalho
afirmativa prevendo diferenas ou prevendo

57

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

ramente convencido que a pessoa possui a tal


habilidade. verdade que no se pode descartar totalmente a hiptese do acaso, mas a
chance de acertar 10 vezes seguidas por acaso
menor que uma em 1.000 (Tab. 4.1). Embora
a habilidade de controlar o lance de moeda seja
impressionante, menos impressionante do
que acertar um nmero em mil na primeira tentativa. Se uma hiptese de trabalho estiver certa, quanto mais informao obtiver, maior ser o
acmulo de informao contrria hiptese do
acaso. importante entender este conceito, que
a base do processo de rejeio do TSHN.
(No se preocupe com as frmulas matemticas
que eventualmente apaream no texto, como na
Tab. 4.1 e no Quadro 4.1, mais importante
entender o processo.). Repare que no estamos calculando a probabilidade dela ter a
habilidade, mas dos dados apoiarem a hiptese que ela tem quando na realidade no
tem.

das). No se preocupe agora como se chega a


estas probabilidades, o que importa entender
que a previso da hiptese nula so valores de
frequncia esperados para cada resultado possvel. Uma probabilidade bastante baixa serve
como justificativa para voc rejeitar a hiptese
nula. Voc entende por qu? Se ainda no entendeu, no se preocupe, isto no to intuitivo, procure entender acompanhando os prximos exemplos.
A abordagem TSHN poderosa a ponto de
provar o improvvel. Se uma pessoa disser
que desenvolveu a habilidade de controlar a
forma de jogar a moeda para cair cara, voc
desconfia. Qual a probabilidade dela realmente ter a habilidade? Posso achar improvvel
porque nunca ouvi falar que algum pudesse
fazer isto e porque imagino que a preciso necessria ao jogar uma moeda e obter uma face
escolhida esteja alm da capacidade humana.
Por outro lado, sei que a pessoa que disse isto
hbil. Ainda assim, acho extremamente improvvel e presto ateno na demonstrao.
Esta probabilidade intuitiva no deve ser subestimada, como discutimos na seo 1.5. Entretanto, a intuio pode ser muito subjetiva e incerta. H outra forma melhor de saber se
verdade: pedir para ela jogar a moeda. Tudo
bem, mas como avaliamos?

A situao foi colocada de forma muito rigorosa


na Tabela 4.1, a pessoa teria de acertar todas
as vezes. Mas e se ela errar de vez em quando? Digamos que acerte 19 de 20 jogadas.

Nmero de acertos
seguidos
1
2
3
4
5
6
7
8
9
10

A pessoa te mostra que a moeda tem cara e


coroa (descartando a hiptese de moeda com
duas caras). A moeda d vrias voltas no ar e
cai com a face cara para cima. Voc sorri, mas
no se convence. Voc sorri porque pensa que
deve ser uma coincidncia, mas no se convence porque no uma coincidncia to improvvel para te impressionar. Voc no acredita que uma pessoa possa ter tanta habilidade
para contar o nmero de voltas e parar a moeda
do lado escolhido. Trata-se de uma hiptese
que parece muito improvvel com base no seu
conhecimento cotidiano. Entretanto, ela lana a
moeda mais vezes e continua acertando. Voc
para de sorrir e comea a ficar cada vez mais
impressionado (a) a cada novo acerto. E depois
de 10 lances voc mudou de ideia, abandonou
a hiptese do acaso completamente e est intei-

Probabilidade
0.5
0.25
0.125
0.0625
0.03125
0.015625
0.0078125
0.00390625
0.001953125
0.000976563

Tabela 4.1 Sabemos intuitivamente que a probabilidade


de acertar ao acaso vrios lances seguidos de moeda
diminui com o nmero de lances, mas normalmente
subestimamos o quanto um resultado improvvel. A
matemtica uma ferramenta essencial para avaliaes
precisas e objetivas. Neste caso, a probabilidade calculada pela frmula P= 1/(2)n..

58

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

Ainda convincente que ela tem a habilidade.


Mas e se ela acertar 70%? E se ela acertar
55%? Certamente seria algo bem menos convincente, mas pelo menos serve como evidncia de algum efeito de habilidade? Chega de
moedas, passemos para um exemplo biolgico.
No muito diferente, mas imagine agora que
sua hiptese que as formigas rainha jovens ao
fundar uma colnia preferem solo argiloso ao
solo arenoso. Para testar isto, voc pega rainhas recm fertilizadas e coloca-as em arenas
que possuem solo argiloso de um lado e solo
arenoso do outro, e ai voc registra qual solo
elas escavaram para iniciar seus ninhos. Vamos
imaginar possveis resultados.

solo argiloso sem ter escolhido este solo (isto ,


ao acaso) vai diminuindo at valores absurdamente improvveis. E quando a probabilidade
do resultado ocorrer ao acaso muito pequena,
ela descartada.

4.5 Nvel de significncia e tipos de


erros.
Vimos que a hiptese nula rejeitada quando
obtemos um valor baixo de probabilidade com
base nos dados obtidos. Isto naturalmente nos
leva a uma questo prtica: qual o valor de
referncia abaixo do qual podemos rejeitar a
hiptese nula?

Suponha que tenhamos realizado o experimento com 8 rainhas jovens e tenhamos obtido 5
(62,5%) que escavaram em solo argiloso e 3
(37,5%) que escavaram em solo arenoso. O
esperado, supondo que no haja preferncia
por solos, seria que 50% das formigas escavariam em solo arenoso e a outra metade em solo
argiloso. O resultado obtido foi na direo da
previso da hiptese de trabalho. O problema
que esta diferena tambm compatvel com a
hiptese nula. No quadro 4.1 realizamos o clculo de probabilidade para a mesma diferena
percentual com tamanhos amostrais diferentes.
O que vemos que a probabilidade de se obter
a mesma proporo de formigas escavando em

No existe um valor mgico universal que separe meros indcios de evidncia segura, a ideia
de definir um valor que regras objetivas precisam ser definidas antes do jogo (o termo tcnico a priori). O valor limite pr-determinado
de probabilidade abaixo do qual se rejeita a
hiptese nula chamado Nvel de Significncia, e representado pela letra grega (alfa).
Os valores mais utilizados so 0,05; 0,01 e (raramente) 0,001, dependendo do grau de rigor
que se quer assumir. Algo parecido acontece
quando determinamos a nota mnima abaixo da
qual reprovamos o aluno, que pode ser 5, 6 ou
7. Ao escolher um nvel de significncia voc
est definindo sua chance de errar, ou melhor,
voc est definindo qual tipo de erro
voc est mais disposto a aceitar.
isto que ser explicado adiante.

Quadro 4.1 Probabilidade calculada pelo mtodo 2com base no obtido (O)
o esperado central (E). .

59

Ao tomar uma deciso estatstica, os


dois tipos de erro que podemos cometer so o Erro Tipo I, que consiste em rejeitar a hiptese nula quando
ela verdadeira, e o Erro Tipo II,
que consiste em aceitar a hiptese
nula quando ela falsa. Como a
rejeio errada da hiptese nula leva
a uma deciso errada favorvel
hiptese de trabalho, o Erro Tipo I
tambm chamado de Falso Positivo e o Erro Tipo II tambm chamado de Falso Negativo.

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

Nas situaes em que a prudncia exige no


aceitar uma mudana de posio sem forte
evidncia favorvel deciso, a prioridade
evitar o Erro Tipo I, como em tribunais e na
maioria das situaes de pesquisa. Nas situaes em que a prudncia exige uma ao preventiva, ainda que a evidncia favorvel seja
fraca, a prioridade evitar o Erro Tipo II, como
quando vigias ouvem um barulho estranho, ou
quando uma criana chega ao hospital com
suspeita de intoxicao. E h situaes em que
os dois tipos de erro seriam graves, como ao se
decidir sobre o resultado de um exame sobre
uma doena muito sria quando h indcios de
positividade. Podemos ver na tabela 4.2 como a
anlise e a ao de processos decisrios dependem da importncia de cada tipo de erro e
do tempo (etapas, oportunidades) que temos
para obter mais dados. As situaes mais comuns na pesquisa esto em destaque na tabela. Abordaremos unicamente estas situaes
neste livro, mas importante termos conscincia que estes mtodos no so os mais apropriados em outras situaes, inclusive de pesquisa. Vamos analisar mais profundamente os dois
tipos de erro com nfase na situao mais comum na pesquisa, mas ilustrando com o funcionamento do processo decisrio em um tribunal.

cesso civilizatrio. Acontece que crimes costumam deixar pistas e bom lembrar que um dia
poderamos ser ns mesmos em um banco de
rus. Enfim, a regra que toda pessoa deve ser
considerada inocente at que haja uma evidncia realmente convincente de que ela culpada.
Entretanto, por melhor que seja a justia, ela
nunca ser perfeita e h quatro resultados possveis em um julgamento: 1) podemos mandar
prender uma pessoa inocente (injustia);
2) Podemos mandar prender um assassino;
3) Podemos libertar uma pessoa inocente e
4) podemos libertar um assassino (impunidade).
A tabela 4.3 resume estas possibilidades.
Basicamente, queremos evitar erros. Uma forma de evitar erros de deciso obter mais informao relevante. H tcnicas (subutilizadas)
de amostragem at atingir critrios de deciso
(e. g. amostragem sequencial). Entretanto, o
mais comum que a informao seja limitada
(por tempo, dinheiro ou porque todas as pistas
foram exaustivamente exploradas). A forma de
agir neste caso depende da prioridade que damos em evitar o Erro Tipo I e em evitar o Erro
Tipo II. Ao assumir como premissa a inocncia
do ru, estamos dando prioridade em evitar o
Erro Tipo I. A nica forma de evitar o Erro Tipo I
de forma absoluta seria decidir pela inocncia
sem julgamento e independente de provas, o
que no aceitvel. Existe sempre o risco de
inocentes serem presos, mas podemos e devemos reduzir esta probabilidade a uma possibilidade remota, e isto feito ao dar ampla chance de defesa e conservadorismo em aceitar
apenas provas muito fortes e claras. A chance

Um assassino solto algo ruim e deve ser evitado. Entretanto, um inocente preso por assassinato algo mais grave. Por que assumir que a
inocncia de uma pessoa tem prioridade sobre
o risco para resto da populao? Parece estranho, mas esta foi a concluso de um longo proRealidade

Inocente

Culpado

Culpado

Injustia

Deciso
Correta

Inocente

Deciso
Correta

Impunidade

Deciso

Realidade
Deciso

H0 Verdadeira

H0 Falsa

Rejeita H0

Erro tipo I

Deciso
Correta

Aceita H0

Deciso
Correta

Erro tipo II

Tabela 4.4 Decises e tipos de erros na pesquisa..


Tabela 4.3 Decises e tipos de erros em um tribunal..

60

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

de Erro Tipo I limitada a priori pelo princpio


da inocncia, e quanto mais rigorosos formos
em evitar a chance de erro tipo I, maior a chance de um erro do tipo II. como se no jogo
entre defesa e promotoria a defesa tivesse a
vantagem do empate. Cabe ao promotor a responsabilidade de mostrar informao suficiente
para virar o jogo, de forma a evitar o Erro Tipo
II.

nao reflete principalmente a obrigatoriedade


de indcios fortes de culpa antes de se levar um
ru a julgamento.

4.6 Consideraes complementares


Nas sees anteriores vimos o essencial sobre
testes de hipteses que precisa ser entendido
por todos os usurios de estatstica. Entretanto,
h vrios aspectos adicionais importantes para
uma compreenso mais profunda do tema que
sero tratados nesta seo.

Ao propor uma hiptese de trabalho, fazemos


previses que algo acontecer de certa forma.
Entretanto, o fato disto acontecer no significa
nada se o previsto puder acontecer por outras
razes ou ao acaso. Vimos nas primeiras sees do captulo que precisamos tomar algumas
atitudes preventivas para excluir hipteses concorrentes, mas ainda resta avaliar se as previses poderiam ser obtidas por mero acaso. Na
analogia com o tribunal, como se a hiptese
nula fosse o ru. A princpio, a hiptese nula
deve ser considerada verdadeira at a prova do
contrrio, de forma a evitar o Erro Tipo I. Cabe
ao pesquisador obter informaes suficientes
para derrubar a hiptese nula.

a) adequando alfa hiptese


Vimos na seo anterior e na tabela 4.2 que em
alguns contextos a prioridade no evitar os
falsos positivos, mas em tribunais e na maioria
das pesquisas . Por isto usamos valores bem
baixos de alfa (Nvel de Significncia) em nossos testes. O valor mais tradicional 0,05 (aqui
estamos falando de testes isolados, a questo
do nvel de significncia de testes mltiplos ser
discutida no captulo 7). Raramente se discute
em que situaes devem ser utilizados os nveis
mais baixos de 0,01 ou 0,001. Testes com hipteses de trabalho tidas como quase certas normalmente tem uma funo de apenas comprovar algo, podemos dizer que a hiptese nula
est em um grupo de alto risco de ser rejeitada. Uma hiptese de trabalho ousada bem
mais incerta, e est em um grupo de risco intermedirio e uma hiptese muito ousada tem
um risco muito baixo de ser rejeitada. Com
base nisto, deveramos utilizar respectivamente
0,05; 0,01 e 0,001 como Nveis de Significncia
para cada um destes casos. Para entender por
que, veja como devemos interpretar resultados
de exames considerando o grupo de risco (Mlodinov 2008).

Uma diferena entre o tribunal e a pesquisa


que nesta muitas vezes podemos definir a
chance de Erro Tipo I de forma quantitativa. O
Nvel de Significncia (ou alfa) a chance de
Erro Tipo I que estamos dispostos a aceitar, um
grau de rigor que se estabelece a priori. Na
pesquisa, o mais comum se utilizar um
=0,05, que significa que aceitamos cometer
um Erro do Tipo I para cada 20 testes em que a
hiptese nula era verdadeira. como aceitar
mandar uma pessoa inocente de cada 20 inocentes que a gente julgar. Se utilizarmos um
=0,01, como se estivssemos mandando um
inocente para cadeia de cada 100 inocentes
julgados. Este nvel aceitvel para a pesquisas, mas no aceitvel na justia. As provas
em um tribunal devem ser mais contundentes, a
chance de mandar um inocente para cadeia
deveria ser inferior a 1:1000. No confunda, um
=0,01 no significa que vamos cometer um
erro a cada 100 julgamentos, pois em muitos
julgamentos o ru era realmente culpado. O fato
de muitos julgamentos terminarem em conde-

Suponha que a probabilidade de um falso positivo em um exame de AIDS tenha sido estabelecida em 0,7%. O que significa isto? Significa
que a chance dela ter Aids de 99.3%. Com
base no resultado do exame qualquer pessoa
tem a mesma chance de receber um falso positivo? As respostas so no e no. Muitos se
surpreendem ao saber que a chance de ser um

61

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

falso positivo depende de quem a pessoa que


fez o exame.

mos de falso positivo para um teste isolado com


a chance de um positivo no meio a muitos testes ser realmente um positivo. Um positivo verdadeiro pode ser muito mais raro que o nmero
de negativos multiplicado pela chance de falsos
positivos isolados.

Acompanhe este raciocnio. Duas pessoas recebam um resultado positivo em um exame de


AIDS, a primeira pertence a um grupo de risco
(usurio de drogas que no pratica sexo seguro
em uma metrpole com alta incidncia de
AIDS), e a segunda no pertence ao grupo de
risco. Imagine que no grupo de risco a incidncia de AIDS seja de 1/10, enquanto no grupo de
baixo risco ela seja de 1/10.000.

Uma situao anloga pode ser considerada


para a pesquisa. Uma hiptese razovel, como
uma formiga preferir um tipo de solo (arenoso
ou argiloso) para fundar uma colnia cai no
grupo de risco das hipteses razoveis, das
quais boa parte deve ser realmente verdadeira,
digamos em uma proporo entre 1/2 a 1/10.
Entretanto, uma hiptese que testasse se o
comportamento da formiga influenciado por
pequenas diferenas nos teores de cobre ou por
um leve campo magntico prximo das arenas
experimentais no solo soa estranho com base
no que se sabe sobre formigas. Estas hipteses
parecem muito improvveis, talvez 1/50 a
1/1000 possam ser realmente ser corretas. Como as situaes so anlogas, a chance de um
falso positivo em hipteses ousadas ou bizarras
muitas vezes maior para o mesmo alfa.

Milhares de pessoas fazem exames de AIDS.


Quantos so os falsos positivos de cada grupo?
Considere 10.000 pessoas no caso do grupo
com incidncia 1/10 (Quadro 4.2), teremos 1000
positivos e 9000 negativos. Dos 9.000 negativos, 0.7% (63) tero falsos positivos. Portanto, a
chance deste positivo ser realmente um positivo de 1000/(1000+63) isto , 94%. Agora considere 10.000 pessoas no grupo com incidncia
1/10.000. Teremos um positivo e 9.999 negativos. Destes, 0,7% tero falsos positivos (70
pessoas). Portanto, a chance deste positivo
ser realmente um positivo de 1/(1+70), isto
1,41%. Portanto, a probabilidade da primeira
pessoa ter AIDS quase 70 vezes maior!

No fcil medir o quanto nossas hipteses


so razoveis ou bizarras, entretanto, podemos
chegar a uma diretriz aproximada. Se sua hiptese de trabalho tratar de uma tendncia que
voc considera intuitivamente muito razovel,
pode usar um alfa de 0,05. Se for uma ideia
um pouco mais ousada, mas no extraordinria, use 0,01. Se for uma hiptese extravagante que abala conceitos estabelecidos
dentro da sua rea de pesquisa, melhor utilizar 0,001. Hipteses ousadas no devem ser
evitadas, pois muitas vezes marcam revolues na cincia, entretanto, devem ser tratadas com maior rigor para no criar falsos
mitos. A estatstica no s um jogo, nossas
expectativas precisam ser levadas em conta.

O problema que confundimos o que chama-

Quadro 4.2 Clculos mostrando que a chance de um falso positivo


muito maior em um grupo de alto risco que em um grupo de baixo risco
para o mesmo teste. A chance de falso positivo neste exemplo foi quase
70 vezes maior no grupo de baixo risco. A mesma lgica pode ser aplicada para testes estatsticos.

62

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

Como nos testes de hipteses nulas, em uma


prova com alternativas sempre existe um componente de sorte (aleatoriedade). Uma pessoa
que acertou a metade das perguntas em uma
prova do tipo verdadeiro ou falso no demonstra nenhum conhecimento, pois este o esperado de acertos por mero acaso. Portanto, s
temos indcios de conhecimento acima de 50%
de acerto. Mesmo um acerto de 60 a 80% pode
acontecer s por acaso em uma prova com
poucas questes. Uma pessoa at poderia
acertar 100% das questes por pura sorte em
uma prova com 5 questes, mas isto seria praticamente impossvel em uma prova com 50
questes.

b) O valor de P uma medida de certeza?


Ao definir um nvel de significncia qualquer,
digamos 0,05, existe uma diferena se nosso
teste apresentar uma probabilidade P=0,04 ou
uma probabilidade P=0,0004? A resposta no
em termos do teste, a hiptese nula foi reprovada em ambos, mas h uma diferena. Uma nota
4,5 significa reprovao, mas interessante
saber que o aluno no estava longe do limite.
Uma nota Dez significa aprovao, mas uma
aprovao bem mais segura do que um 5,0.
Em sntese, devemos utilizar critrios definidos
antecipadamente para decidir pelo sim ou pelo
no, mas no devemos ignorar o valor da probabilidade calculada no teste. Como interpretar
o valor da probabilidade calculada (P) em um
teste de significncia da hiptese nula? Vimos
que um valor baixo de P uma evidncia contrria hiptese nula. Podemos ir mais longe,
quanto mais prximo de zero for o valor de P,
mais forte a evidncia contra a hiptese nula
(Fig. 4.3). Para entender esta relao, faremos
uma analogia com uma prova de alternativas.

P uma medida de certeza, mas deve ser vista


com cuidado. P=0,04 no significa que a chance da hiptese de trabalho estar correta de
96%. bem mais complicado que isto. Entretanto, podemos dizer que a chance da hiptese
de trabalho estar correta maior em P=0,0004
que em P=0,04.

Evidncia contra Ho

Muito Forte

Forte

Mdia

Nvel de aprendizado

a) Peso da evidncia
contra a Hiptese Nula

b) Analogia
(prova de 100 questes de
Verdadeiro ou Falso)

Muito Alto
Alto
Mdio

0
Negativo?

50%

100%

Erros

0
Negativa?

0.05
0.001 0.01

0.5

Probabilidade calculada (P)

Figura 4.3 A probabilidade calculada em um teste estatstico serve como medida do peso da evidncia contrria Hiptese Nula. Quanto menor o valor de P, maior a evidncia contrria Hiptese Nula. Valores intermedirios de P indicam situao indefinida e valores muito altos so estranhos. Ver a explicao no
texto com uma analogia com uma prova com alternativas do tipo verdadeiro ou falso.

63

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

bm a forma mais natural para apresentar resultados que utilizam tcnicas de reamostragem,
como o Bootstrap (seo 3.6). A terceira vantagem que mais fcil se realizar um teste de
hipteses de trabalho de semelhana.

c) O que significam valores altos de P?


E quanto aos valores altos de P? Voltando
analogia, qual seria a interpretao para a prova
de uma pessoa que errou mais que 50% das
questes? A princpio, significa duas coisas: a
pessoa no tem nenhum conhecimento e ainda
teve algum azar. Considerando que qualquer
um pode ter azar, at quem tem algum conhecimento e acertou 50%, uma nota abaixo de
50% um indcio mais forte de ausncia de
conhecimento que exatamente 50% de acerto,
entretanto, no indcio de conhecimento negativo, pois isto no existe. Agora uma nota prxima de 100% de erro seria algo muito estranho. Se o nmero de questes for grande, podemos at suspeitar que a pessoa sabia tudo e
errou propositalmente. interessante verificar a
possibilidade de alguma anomalia deste tipo
quando temos valores muito altos de P (como
P>0,95). Entretanto, em geral, simplesmente
um acaso que acontece quando estamos fazendo muitos testes.

Outra abordagem alternativa em crescimento


a utilizao de Anlises Bayesianas (Gotelli &
Ellison, 2011), que uma forma bem diferente
de calcular probabilidade. No TSHN calculamos
a probabilidade de obter uma diferena observada se a hiptese nula for verdadeira, isto
simbolizado como P (dadoshiptese nula). Na
anlise Bayesiana, calculamos a probabilidade
da hiptese aplicando os dados fornecidos, o
que simbolizado P (hiptese de trabalhodados). uma estatstica mais semelhante
nossa forma intuitiva de pensar. Na seo 4.1
comentamos que a escolha da hiptese de trabalho baseia-se na nossa intuio. A escolha de
uma hiptese que formigas usam referenciais
espaciais baseou-se em um clculo. Parece
improvvel que formigas usem apenas pistas
qumicas, aqui chove muito, a chance de perderem a trilha grande, alm disto, podem passar
por um tronco e ele cair. J li que outros himenpteros (vespas) so capazes de usar referencias espaciais, etc. Por outro lado, a hiptese
que as formigas utilizam o magnetismo terrestre
lhe parece muito improvveis. Voc junta informaes e pode tomar decises sobre a probabilidade de uma hiptese estar correta. Esta
abordagem tambm mais apropriada quando
estamos comparando duas hipteses de trabalho concorrentes, para ver qual delas se ajusta
melhor aos dados.

d) abordagens alternativas ao Teste de Significncia de Hiptese Nula


O teste de significncia de hiptese nula uma
abordagem to preponderante na anlise estatstica de dados que muita gente acha que a
nica. por isto que tanto espao foi dedicado
a esta abordagem neste captulo. Entretanto h
outras duas abordagens que esto crescendo e
possivelmente vo super-la em importncia em
testes de hipteses do acaso.

e) entre o sim e o no existe um vo

A primeira alternativa a utilizao de intervalos


de confiana de parmetros ao invs de clculos de probabilidades associados a hipteses
nulas (van Belle, 2008; Wood 2012). Uma vantagem a riqueza da informao fornecida. Ao
invs de dizermos Houve um efeito significativo
do tratamento em relao ao controle
(F1,20=6,53; p<0.05), diramos Houve um efeito significativo do tratamento em relao ao
controle (Diferena= 1,25; IC95%= 0.90 a
1,60). A segunda vantagem que esta tam-

Quando tomamos decises, informaes complexas podem ser transformadas em Sim ou


No, que levaro a duas diferentes possibilidades de ao. Ocasionalmente, temos trs opes: Sim, Talvez ou No. Podemos ainda
decidir em mais categorias: o sim forte, o sim
fraco, o Talvez, o no fraco e o no forte.
Eventualmente, h decises em que se utiliza
uma escala quantitativa entre os extremos (e.g.
custo de aplices de seguro em funo do ris-

64

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

co). Nesta seo, vamos nos concentrar em


decises com trs possibilidades.

uma doena muito grave, como Cncer ou


AIDS, mas os nveis no so to elevados a
ponto de ter certeza. Se voc apresentar o resultado como positivo e for um falso positivo, a
pessoa passar por uma angustia profunda
para depois descobrir que no tinha a doena.
Por outro lado, se apresentar o resultado como
negativo, pode estar adiando a chance da pessoa se tratar e ter uma sobrevida mais longa e
melhor ou at uma cura. O que fazer? Nesta
situao, a ao em caso de Sim (iniciar o
tratamento) diferente da ao no caso de
No (liberar o paciente), que tambm difere no
caso de Talvez (realizar mais exames).
Tambm h situaes em que o Erro Tipo II
um risco de gravidade muito maior que do Erro
Tipo I. Imagine que tenha havido um caso de
Doena de Chagas aparentemente adquirida
pelo consumo de aa em um bairro de Manaus.
Em casos deste tipo, comum que a ao anteceda a coleta de dados, com a proibio imediata da venda de aai. Em uma anlise preliminar, o rgo responsvel pela vigilncia sanitria recolhe amostras de aa de 10 vendedores e no encontra nenhuma amostra infectada.
Portanto, no h evidncia que a doena tenha
sido transmitida desta forma. Entretanto, se este
resultado for um falso negativo (Erro Tipo II), h
risco de transmisso de uma doena grave para
outras pessoas, portanto, o consumo no
liberado at o trmino de uma investigao
exaustiva. Lidar com alto custo de Erro Tipo II
sempre muito complicado. difcil se definir
quanto esforo de investigao ser suficiente
para uma concluso segura, e temos que lembrar que a suspenso da venda tambm est
prejudicando pessoas.
Para separar o No do Talvez, normalmente
precisamos de mltiplas etapas de coleta de
dados, como mais exames no exemplo da
suspeita de doena ou continuao exaustiva da coleta de dados no exemplo do aai.
A nova coleta de dados no precisa ser da
mesma natureza dos dados anteriores. No
caso de exames sobre doenas, muitas
vezes se realiza repete exames de outra
natureza para avaliar um sintoma complementar da mesma doena. No caso do
aa, importante investigar outras possibi-

No caso da pesquisa, vamos chamar de Sim a


rejeio da hiptese nula (Sim, a evidncia
suficiente para rejeitarmos a hiptese nula). No
tribunal, Sim significa Sim, temos evidncia
suficiente para declar-lo culpado. importante
ressaltar que o Sim no significa Definitivamente sim, significa Tenho convico que
sim, e os graus de convico dependem da
situao, como vimos na seo anterior. Note
que no sistema de deciso que descrevemos
para tribunais e para a maioria das pesquisas o
Talvez tratado como um No (em caso de
dvida prevalece a inocncia/ aceitamos a hiptese nula). Como nesta abordagem apenas
levamos em conta o Alfa (Nvel de Significncia), podemos denomin-la Abordagem Alfacntrica.
A abordagem alfacntrica apropriada quando
temos prioridade em evitar o Erro Tipo I e vamos tomar uma deciso com a informao que
foi coletada em uma nica etapa anterior ao
Julgamento Centrado. Estas condies ocorrem
em tribunais e em projetos de pesquisa ou dissertaes ou teses em que temos um tempo
determinado para coletar os dados. A desvantagem da abordagem alfacntrica que aceitar
a hiptese nula um resultado de pouco valor,
pois no sabemos se temos um No ou Talvez, e um Talvez pode ser um Sim. Entretanto, vimos na Tabela 4.2 que h outras abordagens.
Vejamos agora uma situao em que precisamos separar o No do Talvez. Imagine que
voc trabalha em um laboratrio de anlises
clnicas e tem em mos um resultado com nveis elevados de uma substncia que indica

65

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

lidades de contgio. Se a coleta de dados for da


mesma natureza, a hiptese nula pode acabar
sendo aceita aps uma coleta exaustiva, considerando que j deveria ter sido rejeitada se
fosse falsa.
S possvel se definir quantos dados precisamos coletar para considerar uma coleta suficientemente exaustiva para dar um veredito
No se tivermos um valor de efeito mnimo
de referncia. Por exemplo, digamos que voc
queira saber o efeito de uma substncia sobre a
presso sangunea de ratos. Se a substncia
aumentar a presso da grande maioria dos
ratos, ter rejeitado a hiptese nula. Se no
obtiver nenhuma diferena significativa (isto ,
alm do que esperamos ao acaso), aceitar a
hiptese nula. No entanto, no pode dizer que
no haja efeito, pois ele pode ser to sutil que
no pde ser detectado com o tamanho amostral do experimento. Por outro lado, se voc
perguntar se existe um efeito de aumentar pelo
menos 10% a presso sangunea, e tiver algumas informaes sobre os dados, ento poder
calcular o tamanho amostral necessrio a partir
de uma probabilidade de Erro Tipo II (ou Beta,
) pr definida por voc.
No entraremos nos detalhes de como se realizam as abordagens da Tabela 4.2. Entretanto,
bom ter conscincia que a abordagem alfacntrica no se aplica a todas as situaes, at
mesmo na pesquisa podemos ter que utilizar
outra abordagem.

goricamente (com sim ou no) se evidncias


para a existncia de uma relao so significativas. No temos um critrio semelhante para
atribuirmos o valor biolgico para um teste.
uma questo de bom senso. A relao entre
tamanho de qualquer espcie e seu peso
sempre fortemente significativa, mesmo com
poucos dados, de forma que no nada surpreendente obter-se um P<0,001 para esta
relao. Um efeito significativo obtido apenas
com um tamanho amostral imenso pode significar variveis de rudo interferindo muito ou simplesmente um efeito biologicamente irrelevante
de uma varivel sobre outra. O valor calculado
de P tem relao com a fora da evidncia,
no tem relao com a relevncia da questo.

g) Efeitos colaterais
Em algumas situaes, particularmente no desenvolvimento de remdios, alimentos ou produtos que possam oferecer riscos ambientais ou
sade humana, temos de ir alm das consideraes sobre o erro tipo I e tipo II. Imagine uma
substncia com potencial para diminuir os enjos durante a gravidez. Podemos testar estatisticamente se o remdio efetivo fixando o erro
tipo I e at o erro tipo II, definindo um tamanho
amostral apropriado com base em coletas preliminares. Esta anlise permitir que se defina
dentro dos critrios discutidos neste captulo se
o remdio efetivo ou no para reduzir o enjo.
Entretanto, este teste s avalia o enjo, no
garante que este remdio no tenha contra
indicaes. Um remdio chamado Talidomida
foi usado na dcada de 1960 contra enjo na
gravidez e causou malformaes em muitos
bebs.

f) Significativo sinnimo de relevante?


O uso da estatstica cresceu e as revistas cientficas e bancas de avaliao acadmica passaram a exigir que testes fossem utilizados para
mostrar que tendncias tinham relevncia estatstica. Esta presso pelo uso da estatstica
contribuiu para a qualidade da pesquisa, mas
tambm levou a alguns desvios, como a busca
pelo resultado significativo independente da
questo. Alguns acreditam que o melhor teste
dentro de um estudo aquele que foi mais significativo.

Ignorar efeitos colaterais no cometer um erro


tipo I ou tipo II, cometer um erro que extrapola
o teste. Pelo princpio da prudncia, temos at
que considerar provas circunstanciais, como
uma acusao improvvel de uma pessoa que
consumiu um remdio ou indcios de algum
impacto ambiental, como uma evidncia que a
ateno deve ser redobrada. A anlise de efeitos colaterais pode ser complexa. Embora haja
ferramentas estatsticas para ajudar nesta tare-

Um aspecto psicologicamente forte no teste de


previso de hipteses que ele responde cate-

66

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

fa, cada potencial efeito (podemos mesmo listar


todos?) deveria ser analisado separadamente e,
como vimos anteriormente, difcil separar o
talvez do no. No possvel se obter uma
garantia que nenhum efeito colateral v ocorrer,
mas essencial que se considere qualquer
indcio de problema e se faa um levantamento
exaustivo de todas as possibilidades razoveis
de efeitos colaterais. Novas tecnologias, como a
transgenia, j provaram que funcionam, entretanto, um acompanhamento necessrio pois
ainda no sabemos quais so os riscos ambientais e para a sade. Os farmacuticos tm muito
mais trabalho com a anlise de cada possvel
efeito colateral do que da comprovao dos
efeitos positivos. importante no se confundir
o poder da estatstica em avaliar efeitos especficos com uma garantia sobre aspectos que
extrapolam cada teste particular.

4.8- Como devemos ajustar o Nvel de Significncia em funo da ousadia de uma hiptese
de trabalho.
4.9- Como devemos proceder quando o custo
do Erro Tipo II elevado?
4.10- O que so efeitos colaterais e como devemos lidar com eles?

Exerccios
4.1- A lgica dos testes de hipteses um assunto mais amplo do que a utilizao de clculos estatsticos em testes de hipteses. Explique.
4.2- Qual o risco da inflao de testes e como
ele pode ser evitado?
4.3- Quais hipteses costumam ser descartadas por procedimentos preventivos durante um
planejamento experimental? Explique.
4.4- Como descartada a hiptese do acaso? Utilize na sua resposta os conceitos de
a) Hiptese Nula; b) Probabilidade calculada;
c) Nvel de significncia ().
4.5- Por que precisamos de um nvel de significncia em um processo de deciso.
4.6- Explique a relao entre o valor calculado
de probabilidade em um teste (P) e seu peso
como evidncia contra a hiptese nula.
4.7- Explique a diferena entre Erro Tipo I (falso
positivo) e Erro Tipo II (falso negativo) em processos decisrios em tribunais e na pesquisa
cientfica.

67

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

Tabela 4.2 Anlise e ao em diferentes situaes em funo do custo do Erro Tipo I (falso positivo) e do Erro Tipo II
(falso negativo) e do nmero de etapas de coleta de dados. As formas de analisar os dados mais comuns na pesquisa
esto em destaque.

Alto ou Mdio

Baixo

Baixo ou mdio

Muito Alto ou
Alto
Mdio

Mdio

Muito Alto ou Alto

Custo
Falso
Negativo

Baixo

Muito Alto ou Alto

Muito Alto

Custo
Falso
Positivo

Tempo

Exemplo

Anlise e Ao

nico

Tratamento de grave intoxicao sem


causa bem definida (usar remdio
forte que tem com contra
indicaes?)

Anlise de risco emergencial; Priorizar a velocidade


da concluso mas com o mximo de certeza possvel.
Sobre o diagnstico. Importante haver preparo
antecipado para decises rpidas e corretas.

Paciente com sintomas de possvel


doena grave de tratamento
Poucas Etapas
agressivo;
Pesquisa de um remdio promissor
Muitas Etapas com potenciais efeitos colaterais
graves.
Julgamento em tribunais criminais.
Estudos acadmicos com propostas
nico
polmicas. O tempo nico refere-se
anlise nica (no dividida em etapas
decisrias) e defesa nica.
Exames complexos para possveis
doenas de gravidade intermediria
Poucas Etapas
em estgios iniciais.

Avaliao em etapas (poucas). Indcios fracos de


positivo justificam exames complementares.
Continuar os testes at ter segurana suficiente sobre
o diaqgnstico.
Avaliao em etapas (muitas); Descobrir um remdio
algo importante, mas a certeza da ausncia de
efeitos colaterais tem prioridade.
Assumir postura fortemente conservadora em
relao ao falso positivo (e.g. princpio da inocncia a
priori) ; Estatstica com Alfa rigoroso (0,01) ou muito
rigoroso (0,001). Tamanhos amostrais e testes
geralmente definidos a priori .
Avaliao em etapas (poucas). Indcios de positivo
justificam exames complementares. Continuar os
testes at ter segurana suficiente sobre o
diaqgnstico.
Avaliao em etapas. Amostragem sequencial e
Mtodos de controle de processos estatsticos
(deteco de anormalidades) podem ser teis
conforme o problema.
Conservadorismo para prevenir falsos positivos, mas
no to extremo a ponto de frear muito a pesquisa.
Estatstica com Alfa Rigoroso (0,01) ou comum (0,05).

Pesquisa de mercado para lanar um


novo produto. Pesquisa sobre
Muitas Etapas
intenes de votos durante processo
eleitoral.
Maior parte dos trabalhos
acadmicos; Problemas cotidianos
nico
que exigem nvel mediano de certeza
antes de afirmar algo.
Problemas cotidianos que exigem
Avaliao em etapas. Coletas preliminares +
nvel mediano de certeza com
Estatstica alfacntrica (duas etapas); Amostragem
Em Etapas
evidncia acumulada gradualmente. sequencial (testando uma questo); Mtodos de
controle de processos estatsticos (deteco de
anormalidades); etc.
Relatrio de avaliao de impacto
Assumir postura mais conservadora contra falsos
ambiental e ecotoxicologica; Evento negativos. Anlise de Risco rigorosa; Valorizar toda
nico
suspeito durante vigilia policial
informao relevante disponvel. Considerar uso de
(bandido ou s gato?). Emitir alarme Estatstica Bayesiana; Medidas preventivas rigorosas;
contra catstrofes (e.g. terremoto).
Monitoramento ambiental e
Avaliao em etapas. Mtodos de Controle de
sanitrio. Monitoramento de
Processos Estatsticos; Anlise de Riscos; Medidas
Em Etapas
qualidade de processos de alto risco preventivas rigorosas para falsos negativos;
(e.g. funcionamento de usna
Considerar uso de Estatstica Bayesiana.
atmica)
Deciso de realizar um evento com
Anlise de riscos simples; Medidas preventivas para
nico
base em previso de tempo.
falsos negativos.
Monitoramentos cotidianos de
Avaliao em etapas. Testes mltiplos em etapas.
qualidade de processos de mdio ou Amostragem sequencial; Mtodos de Controle de
Em Etapas
baixo risco (e.g. eficincia em linha Processos Estatsticos. Monitoramento simples.
de produo e satisfao de
clientes).

68

Potrebbero piacerti anche