Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
3 Confiana na
medida e independncia
Neste captulo abordaremos a confiana que
podemos ter em medidas. Quanto de confiana
ou incerteza podemos ter em um valor? Comearemos vendo que h tipos diferentes de valores que chamaremos de escalas de medidas.
Abordaremos a atribuio de valores categricos e as incertezas ligadas a esta atribuio.
Para falar nas incertezas de valores quantitativos introduziremos os conceitos de exatido,
preciso e de acurcia e a importncia de examinarmos distribuies de frequncias. Estudamos populaes, mas geralmente por amostras, por isto precisamos entrender o que so
parmetros populacionais, como so estimados
e a importncia de intervalos de confiana. Finalmente, veremos que h dois conceitos diferentes quando estamos falando em independncia estatstica.
Phoneutria reidyi
Tamnho da aranha(mm)
v
?
Abr
Ago
Ms da coleta 2001/2002
Figura 3.1- Neste grfico EPR h seis nveis na varivel Ms da coleta, 19
nveis na varivel Tamanho da aranha e trs nveis na varivel Sexo.
29
As escalas de medida normalmente so tratadas como se fossem excludentes entre si, isto
, que se um valor pertencesse a uma no pertenceria a outra, mas no assim (Fig. 3.2).
Uma escala quantitativa tambm ordinal, pois
os nmeros que representam quantidades ou
dimenses esto ordenados (mas nem toda
sequncia ordinal quantitativa). As escalas
quantitativa e ordinal, tambm so categricas,
pois cada valor numrico ou de ordem, pode ser
visto como uma categoria. A binria est includa em todas, pois dois valores podem ser obtidos em qualquer escala. Muitos textos dividem
os valores em quantitativos e qualitativos, o que
nos induz a pensar que quantidades no so
qualidades. Entretanto, dizer que uma pessoa
tem 1,80 m s uma maneira mais precisa de
dizer que ela alta. Portanto, quantidades tambm so qualidades. A compreenso que algumas escalas de medida esto dentro de outras
e que qualquer atribuio de valor uma atribuio de uma qualidade ser importante quando abordarmos a flexibilidade na escolha de
testes estatsticos (captulo 5).
30
Por serem interpretaes, as atribuies nominais e ordinais sempre esto sujeitas a erros,
como na identificao de uma espcie, na determinao de qual doena um paciente teve,
ou no sentido de um sim dado por um entrevistado. importante definir cuidadosamente os
Critrios de Atribuio de Categorias (CAC),
31
mentos de medida, como uma trena, no precisam de calibragem, outros, como balanas e
pHmetros, precisam de verificaes peridicas,
por isto, so vendidos junto com padres para
calibrao, como metais com pesos conhecidos.
Mas como faramos no caso do nosso aparelho
de medir presso? O ideal seria comparar algumas medidas deste aparelho com algumas
medidas com outro aparelho reconhecidamente
preciso e calibrado realizadas de forma alternada em curto espao de tempo. A mdia da diferena entre os dois aparelhos, digamos
10mmHg a mais no teu aparelho novo, a descalibragem, e deveria ser subtrada das suas
medidas.
A PRECISO de um instrumento/procedimento
o grau em que conseguimos com ele medidas
quantitativamente prximas entre si em condies estveis e homogneas. A primeira coisa
que faramos com nosso medidor de presso
seria repetir a medida vrias vezes. Para isto,
precisamos primeiro assumir que a tua presso
varia muito pouco nos poucos minutos do experimento, de forma que podemos desprezar a
variao natural da presso, e o esperado seria
vrias medidas iguais ou muito prximas se o
aparelho for muito bom.
A ACURCIA de um instrumento/procedimento
o seu grau de ajustamento mdio em relao
ao valor real. Uma balana pode ter alta preciso, porque sempre d o mesmo resultado, mas
pode estar descalibrada e dar um resultado 15
gramas superior ao real em todas as medidas.
Um relgio de alta preciso atrasado 10 minutos
vai apresentar este erro por anos se no for
ajustado para o horrio correto. Alguns equipa-
32
A medida da acurcia til para corrigir distores pela calibragem de armas e de equipamentos. Em equipamentos, como vimos acima,
comum haver padres para a calibragem, mas
ocasionalmente precisamos calibrar procedimentos de outras formas. Imagine que voc
tivesse que estimar visualmente tamanhos de
jacars distncia. Neste caso, voc pode calibrar esta capacidade estimando tamanhos de
objetos semelhantes a jacars (como troncos)
distncia e depois verificar como est se saindo
medindo os objetos com uma trena. Se tiver
tendncia a superestimar o tamanho, reduza
suas estimativas e se tiver tendncia a superestimar, aumente as estimativas. Se puder capturar jacars, conveniente repetir a avaliao
para melhorar a sua capacidade de estimar.
Ningum consegue acertar precisamente todas
as medidas, mas voc pode se considerar calibrado quando a quantidade de subestimativas
semelhante quantidade de superestimativas.
A medida da preciso importante para fabricantes de instrumentos, mas a maioria dos instrumentos tem uma preciso fixa, de forma que
ns, os usurios, no temos que nos preocupar
com ela no dia a dia, como ocorre com a calibragem. Entretanto, entender a medida de preciso importante porque nos ajuda a entender
a medida da variao (Fig. 3.4-2), que fundamental em estatstica.
A preciso costuma ser medida pelo seu inverso, a disperso dos valores. Quanto menor a
33
suficiente para as tuas anlises. Em outros casos, a preciso no to boa, mas ela pode ser
compensada por um tamanho amostral maior.
Embora o conhecimento sobre preciso seja
importante, ainda mais importante o conceito
de disperso de valores.
Quadro 3.1- A mdia aritmtica (1) um parmetro populacional utilizado em clculos de muitas medidas paramtricas.
Quando estimada com base em uma amostra, ela geralmente
simbolizada com um X ou um Y com uma barra encima. O
Desvio Absoluto Mdio (2) uma medida simples e intuitiva
de disperso. O Desvio Padro (3) uma medida bem mais
utilizada, com a mesma essncia do DAM. A frmula de DP
apresentada utilizada quando o determinamos com base em
uma amostra, que a situao mais comum. N= Tamanho
amostral; xi= cada valor registrado na amostra; = smbolo
matemtico de somatrio que significa que deve se somar os
termos a seguir na frmula. Curiosidade matemtica: a estatstica paramtrica utiliza estimativas inicialmente tendenciosas
que necessitam ajustes. o caso do desvio padro da amostra
com seu denominador (N-1). Por que no calculamos a mdia
dos desvios elevados ao quadrado com o denominador N? De
fato, no clculo de um desvio padro de um conjunto completo
de dados o denominador N. O problema que para determinar o desvio padro populacional com base em uma amostra
estaremos subestimando a disperso com o denominador N,
porque nossa mdia no a mdia real, mas uma estimativa
que necessariamente mais central ao conjunto de dados em
questo. Ao dividir por (N-1) temos um valor mais aproximado do DP da populao.
34
apenas dois nmeros, a mdia e o desvio padro. Nesta curva, aproximadamente 68% dos
dados esto a um desvio padro da mdia, 95%
a dois desvios e 99% a trs desvios padres.
35
Figura 3.8- Quando temos uma distribuio normal, podemos determinar com base na mdia e no desvio padro
(DP), como os dados se distribuem e a proporo a cada
intervalo entre um, dois e trs desvios padres acima e
abaixo da mdia.
Vamos voltar nossa curva normal. Este formato de curva muito importante em todas as
reas, e isto no diferente na Biologia. Na
Engenharia, ela muito utilizada para medir
preciso de instumentos, como discutimos na
seo anterior. Talvez em funo disto, esta
variao seja confundida frequentemente com a
idia de erro. importante ressaltar que na
Biologia esta variao raramente indica erro,
geralmente
indica principalmente uma
VARIAO NATURAL. Se voc medir a altura
de vrias pessoas, certamente haver um pequeno erro de medida, entretanto, a maior parte
da variao que vai encontrar variao natural, uma caracterstica biolgica relevante em
uma populao.
36
Os parmetros de variveis quantitativas envolvem contagens, como o nmero mdio de clulas brancas por campo em uma lmina de sangue, ou medidas contnuas, como o desvio
padro no tamanho (em m) de indivduos de
uma populao de Artemia salina. Note que as
contagens neste tipo de parmetro no so de
unidades amostrais, mas de algo que est em
cada unidade amostral. No exemplo da lmina
de sangue, a unidade amostral era campo e a
populao eram os campos daquela lmina.
Nas sees anteriores vimos medidas de disperso como o Desvio Padro e a Amplitude do
Intervalo Interquartil. Se a impreciso da medida
for pouco relevante em relao variao natural, estas medidas tambm so parmetros
populacionais (quando toda a populao foi
amostrada), ou estimativas de parmetros populacionais (quando o clculo foi feito por uma
amostra), pois a variao uma caracterstica
de uma populao.
Parmetros quantitativos extremos so o mximo e o mnimo populacional para uma varivel.
No nos referimos a mdias de mnimos ou de
37
mximos, mas a estimativas de mnimos e mximos absolutos a partir de amostras. Sua determinao bem mais incerta e complexa do
que para medidas de centralidade e de disperso. Por este motivo, raramente so tratados
em cursos bsicos, entretanto, so parmetros
extremamente importantes. Por exemplo, precisamos ter estimativas do valor mximo da enchente de um rio para construirmos uma barragem segura.
Parmetros multivariados envolvem mais de
uma varivel ao mesmo tempo. Por exemplo, a
diferena nos tamanhos mdios de machos e
fmeas de ratos silvestres em uma populao
(parmetro de grau de dimorfismo sexual em
tamanho) ou a inclinao (coeficiente angular)
da reta que descreve a relao entre o peso de
indivduos uma populao de ratos silvestres e
a quantidade de recursos alimentares em sua
rea de vida (parmetro em um modelo matemtico). So parmetros, pois so caractersticas quantitativas relacionadas a estas populaes, e so importantes nos estudos de relaes. H anlises em que diversos parmetros
so determinados ao mesmo tempo, como em
equaes que descrevem a relao entre uma
varivel resposta e diversas variveis preditoras
(regresso mltipla).).
38