Sei sulla pagina 1di 39

Apresentao da disciplina

Amigos estudantes!
Bem-vindos disciplina de Estatstica aplicada Sade Pblica, que trata especialmente
os conceitos de Bioestatstica e suas aplicaes, visando reforar as noes de estatstica bsica,
sendo, portanto, essa retomada essencial para compreenso dos contedos da disciplina como
um todo.
Neste sentido, o material que voc est adquirindo apresenta um breve histrico da
Estatstica, suas subdivises e como podemos utiliz-la no Curso de Gesto em Sade Pblica.
Abordaremos tambm as diversas fases do mtodo estatstico e a distino das tcnicas de
amostragem para a escolha de elementos que comporo as amostras dos objetos de estudo
escolhidos por cada um de ns.
Para que nosso estudo se torne proveitoso e prazeroso, o tema desta disciplina foi
organizado em tpicos, por sua vez, divididos em algumas sees, visando atender aos objetivos
do processo de ensino-aprendizagem.
Esperamos que, at o final da disciplina possamos:
- Ampliar a compreenso sobre os conceitos fundamentais da estatstica;
- Identificar as caractersticas que podem ser observadas em uma populao ou em uma amostra,
classificando as variveis quantitativas e qualitativas;
- Estabelecer critrios para fazer uma coleta de dados, bem como transformar dados em
informaes e poder fazer inferncias sobre a populao;
- Realizar anlise grfica de conjunto de dados, elaborar hipteses e realizar testes de hipteses,
reconhecendo em quais situaes utilizar os testes de hipteses;
- Identificar situaes onde se pode utilizar anlise de varincia, anlise de regresso e
aplicaes das leis de probabilidade.
Importa lembrar que, em meio a tantos desafios que a vida moderna nos apresenta, voc
fez a melhor das escolhas, portanto seja disciplinado e persistente, afinal o bom xito depender
tambm da dedicao de cada um.
Certos do seu sucesso, bons estudos!

INTRODUO
Nas diversas reas de estudo, ao se conduzir uma pesquisa, objetivando realizar uma
avaliao com concluses precisas necessitamos utilizar as tcnicas do mtodo cientifico e lanar
mo de algumas bases estatsticas. Como por exemplo, para a determinao da eficcia de um
agente ou procedimento de natureza preventiva e/ou curativa ou ainda na realizao de um
diagnstico, o estudo ir requer a comparao entre dois ou mais grupos ou amostras (grupo
tratado e grupo controle, que no submetido interveno). A comparao entre tais grupos
possibilitar avaliar a eficcia significativa do tratamento, no entanto, o pesquisador deve observar
a existncia de variveis interferentes nos resultados, como, variaes amostrais, diferenas
existentes entre os grupos, alm de outras.
A Estatstica uma ferramenta indispensvel para qualquer profissional que precisa
analisar informaes, tomar decises no trabalho ou mesmo na vida pessoal. Muitas vezes, essas
decises e anlises devem ser rpidas, seguras e precisas.
A estatstica pode ser utilizada simplesmente para descrever conjuntos de dados,
mostrando sua distribuio, mdia, disperses, etc. Mas, pode ir alm, pode estar presente nas
diversas etapas de uma pesquisa, desde o seu planejamento, at na interpretao de seus
resultados, podendo ainda, influenciar na conduo do processo da pesquisa.
O desenvolvimento tecnolgico (computadores, linguagens de programao e softwares)
ajudaram e muito o crescimento, divulgao e a aplicao da Estatstica.
1. Definio:
Estatstica: um conjunto de conceitos e mtodos cientficos para a coleta, a organizao, a
descrio, a anlise e a interpretao de dados experimentais, que permitem concluses
vlidas e tomadas de decises razoveis.
2. Classificao: Usualmente, a estatstica dividida em trs grandes reas que atuam em
conjunto.
- Planejamentos de Experimentos e Amostragem;
- Estatstica Descritiva e,
- Estatstica Inferencial.
Estatstica Descritiva: aquela que se preocupa com a coleta, organizao, classificao,
apresentao, interpretao e anlise de dados referentes ao fenmeno atravs de grficos e
tabelas alm de calcular medidas que permita descrever o fenmeno.
Estatstica Indutiva (Amostral ou Inferencial): a aquela que partindo de uma amostra,
estabelece hipteses, tira concluses sobre a populao de origem e que formula previses
2

cuida

da

fundamentando-se na teoria das probabilidades. A estatstica indutiva


anlise e interpretao dos dados.

O processo de generalizao do mtodo indutivo est associado a uma margem de


incerteza. Isto se deve ao fato de que a concluso que se pretende obter para o conjunto de todos
os indivduos analisados quanto a determinadas caractersticas comuns baseia-se em uma
parcela do total de observaes.
A seguir apresentamos alguns conceitos bsicos e princpios da estatstica que nos
auxiliaro na conduo das pesquisas acadmicas ao longo do curso.
3. Populao - o conjunto de elementos (pessoas, coisas, objetos) que tm em comum uma
caracterstica em estudo. A populao pode ser:
- Finita: quando apresenta um nmero limitado de indivduos.
Ex.1: a populao constituda por todos os parafusos produzidos em uma fbrica em um dia.
Ex. 2: nascimento de crianas em um dia no municpio de Piripiri/PI.
- Infinita: quando o nmero de observaes for infinito.
Ex.1: a populao constituda de todos os resultados (cara e coroa) em sucessivos lances de uma
moeda.
4. Amostra - refere-se a um subconjunto com menor nmero de elementos do que a populao,
ou seja, elementos retirados da populao, suficientemente representativos dessa populao.
Atravs da anlise dessa amostra estaremos aptos para analisar os resultados da mesma
forma que se estudssemos toda a populao.
Obs. A amostra sempre finita. Quanto maior for a amostra mais significativa o estudo.
Independncia das amostras: as amostras so ditas independentes quando os grupos
selecionados recebem tratamento distinto; as amostras so ditas dependentes quando para cada
elemento do "grupo tratamento" existir um novo grupo controle com caractersticas semelhantes
(sexo, idade, etc) ou quando se realiza a comparao intra-indivduo, ou seja, um grupo
submetido ao tratamento e ele o seu prprio controle.
Em algumas situaes a populao heterognea ou subdividida segundo algum fator de
interesse da pesquisa. Nessas situaes, amostras so retiradas de cada uma das
subpopulaes e comparadas, como possvel observar na figura 2, abaixo.

5. Parmetro - uma caracterstica numrica estabelecida para toda uma populao. So


por exemplo as medidas populacionais quando se investiga a populao em sua totalidade,
neste caso impossvel fazer inferncias, pois toda a populao foi investigada.
6. Estimador - uma caracterstica numrica estabelecida para uma amostra. So medidas
obtidas da amostra, torna-se possvel neste caso utilizarmos as teorias inferncias para que
possamos fazer concluses sobre a populao.

7. Unidade de Amostragem - a unidade a ser selecionada para se chegar aos


elementos da populao. Pode ser os prprios elementos da populao, ou, outras unidades
fceis de serem selecionadas e que, de alguma forma, estejam associadas aos elementos da
populao.
8. Dado Estatstico - sempre um nmero real.
- Primitivo ou Bruto: aquele que no sofreu nenhuma transformao matemtica. Ex: nmero
direto.
- Elaborado ou secundrio: aquele que sofreu transformao matemtica.
Ex: porcentagem, mdia, etc.
Outros tipos de dados:
- Ranks ou postos: ocasionalmente, os dados representam a posio relativa dos membros de
um grupo com relao a algum ranking. A posio de um indivduo neste ranking chamado de
posto.
- Porcentagens: necessrio ter cuidado quando os dados com os quais se trabalha so
porcentagens observadas.
4

Ex: notar que,


para uma presso arterial sistlica (PAS) inicial de 150 mmHg, um
aumento
de
20% significa que a PAS vai para 180 mmHg e uma diminuio
subsequente de 20% leva a PAS para 144 mmHg.
- Escores: So usados quando no possvel fazer medies diretas. Em sua forma mais
simples, estes sistemas numricos classificam uma caracterstica em diversas categorias
segundo a opinio de um indivduo.

Ex: a dor de um ferimento pode ser classificada como leve, moderada ou severa, podendo ser
designado um valor numrico a cada categoria. Deve ser notado que estas escalas so
subjetivas.

- Arredondamento de dados
Quando o primeiro algarismo aps aquele que vai ser arredondado for 0, 1, 2, 3 e 4
despreza-se este algarismo e conserva-se o anterior.
Ex.1: 5,733958 = 5,73.
Ex.2: 78,846970 = 78,8.
Quando o primeiro algarismo aps aquele que vai ser arredondado for 5, 6, 7, 8 e 9
aumentamos uma unidade no algarismo anterior.
Ex.1: 5,735958 = 5,74.
Ex.2: 78,886970 = 78,9.
9. Variveis
So caractersticas possveis de observar atravs dos dados estudados, como por
exemplo: mortalidade infantil, eficincia de medicamentos, incidncia de doenas, causas de
mortes, etc.
Apresentam-se em trs tipos: qualitativas, ordinais e quantitativas.
9.1 Varivel qualitativa:
Os dados podem ser distribudos em categorias mutuamente exclusivas.
Exemplo: Sexo - permite distinguir duas categorias, masculina e feminina.
Outros exemplos: cor, causa de morte, grupo sanguneo.
9.2 Varivel ordinal:
Os dados podem ser distribudos em categorias mutuamente exclusivas que tm
ordenao natural.

Exemplo: grau
de instruo (as pessoas podem ser distribudas em categorias
mutuamente
exclusivas, na seguinte ordem: ensino fundamental, ensino mdio e
superior), aparncia, status social, estgio da doena.
9.3 Varivel quantitativa ou contnua: os dados so expressos por nmeros.
Exemplo: idade, estatura, peso corporal.

10. Apresentao dos dados em tabelas


- Componentes das tabelas: Ttulo - Corpo - Cabealho - Coluna indicadora. Componente
opcional: fonte, notas (esclarecem aspectos relevantes da apurao) e chamadas
(esclarecimentos sobre os dados em algarismos arbicos escritos entre parnteses).

TABELA 1: Nascidos vivos em hospitais / maternidade, segundo o ano de registro.


Nascidos vivos no municpio de Piripiri/PI.
Ano de registro
Frequncia
Frequncia relativa (%)
2006 (1)
986
34,95
2007 (1)

906

32,12

2008 (1)

929

32,93

Total

2.821

100

Fonte: SINASC. Situao da base de dados nacional em: 14/12/2009. (1): RN < 500g no foram includos. Nota:
dados de 2008 so preliminares.

Ttulo: explica o contedo da tabela.


Ex: Nascidos vivos em hospitais / maternidade, segundo o ano de registro.
Corpo: formado pelas linhas e colunas dos dados.
Ex: No de nascidos vivos: 986 / 906 / 929 RN.
Cabealho: especifica o contedo das colunas.
Ex: Ano de registro frequncia / frequncia relativa.
Coluna indicadora: especifica o contedo das linhas.
2006
2007
2008
As tabelas podem apresentar, alm da frequncia, a frequncia relativa que obtida pelo
quociente da frequncia desta categoria pela soma das frequncias, multiplicado por 100. No
exemplo a frequncia relativa referente a 2006 foi de 34,95% (986 2.821 X 100).
- Toda tabela deve ser delimitada por traos horizontais.
- O cabealho separado do corpo por um trao horizontal.
- O total de colunas escrito entre dois traos horizontais.
6

- Tabelas de
contingncia ou tabelas de dupla entrada: estas tabelas referem-se a
elementos da amostra ou da populao que so classificados de acordo com dois fatores; nestas
tabelas, cada entrada relativa a um dos fatores.
Veja o exemplo:
TABELA 2: Gestantes sem pr-natal / Gestantes com pr-natal e mortalidade perinatal.
Fator
Mortalidade Perinatal Total
Sim
No
Gestante sem pr-natal
55
883
938
Gestantes com pr-natal
156
6.720
6.876

Como estudaremos mais adiante, as tabelas de dupla entrada possibilitam o clculo de riscos, ou
seja, clculos de frequncia (incidncia) entre expostos e no expostos a um determinado fator.
No exemplo que estamos estudando, a incidncia de morte perinatal em gestante sem
pr-natal (que um fator de risco) : 55 / 938 = 5,86% e nas gestantes com pr-natal, a
incidncia de morte perinatal 156 / 6.876 = 2,3%.
Assim, dizemos que o risco relativo de morte perinatal nas gestantes que no fizeram o
pr-natal maior (na verdade 2,3 vezes mais: 5,86 / 2,3 = 2,3) em relao s gestantes que
fizeram o pr-natal.
10.1 Tabelas de distribuio de frequncia
- Frequncia absoluta: o nmero de vezes que uma determinada caracterstica ou valor
numrico observada.
- Frequncia relativa: a proporo, do total, em que observada uma determinada
caracterstica. Sob determinadas condies, as frequncias relativas podem ser usadas para
estimar quantidades importantes.
Ex.1: Em epidemiologia, a prevalncia, incidncia, coeficientes de mortalidade e natalidade;
Ex.2: Em testes clnicos de diagnstico se tem sensibilidade, especificidade, valor preditivo
positivo e valor preditivo negativo.
- Frequncia acumulada: para um determinado valor numrico ou dado ordinal, a soma das
frequncias dos valores menores ou iguais ao referido valor.
Ex: Distribuio de mulheres idosas segundo a altura.
7

10.2 Distribuio de frequncias agrupadas: utilizada para variveis numricas


contnuas, ou quando existem muitos valores possveis para uma varivel discreta.
As tabelas de distribuio de frequncias do ao leitor uma viso rpida e global do
fenmeno. Observe a tabela abaixo com os pesos ao nascer de 100 RN.
Tabela 3. Peso ao nascer de nascidos vivos, em Kg.
2,522
2,720
3,125
2,250
3,220
3,000
3,725
2,890
3,110
3,520
3,100
3,200
2,780
3,155
2,150
3,300
3,250

3,200
3,720
2,800
2,900
2,950
2,480
3,800
2,500
3,550
3,000
4,100
3,200
3,450
3,100
3,150
2,800
2,900

1,900
3,600
3,200
3,300
2,900
2,500
3,600
2,500
2,300
2,950
3,000
3,750
3,150
3,200
2,500
2,900
3,200

4,100
2,400
2,700
2,450
3,400
2,400
3,120
3,400
3,200
2,700
3,150
2,800
2,700
3,300
3,200
3,200
2,800

4,600
1,720
2,750
4,200
2,100
4,450
2,900
2,920
2,720
2,900
2,00
2,720
2,480
3,900
2,500
2,480
2,450

3,400
3,400
1,570
3,800
2,700
2,900
3,700
2,120
3,150
2,400
3,450
3,120
2,120
2,450
2,700
-

Para transformar a tabela acima em uma tabela de distribuio de frequncias fazemos o


seguinte procedimento.

Definir

as faixas de peso (classes). Observem que o menor peso e 1.570Kg e o


maior

4.600Kg, podendo ento ser definidas classes de 1,5Kg a 2kg, 2Kg a


2,5Kg, e assim por diante.
1,5 /----- 2,0 (RN com peso de 1,5Kg at 1,999Kg)
2,0 /----- 2,5 (RN com peso de 2,0 Kg at 2,499Kg)
2,5 /----- 3,0
3,0 /----- 3,5
3,5 /----- 4,0
4,0 /----- 4,5
4,5 /----- 5,0
Observem que cada intervalo de classe de 0,5Kg ( o intervalo coberto por cada classe).
Os extremos de classe so os limites dos intervalos de classe. A anotao 1,5 /---- 2,0 significa
que o intervalo fechado esquerda, isto , pertencem classe os valores iguais ao extremo

inferior (valor 1,5Kg), mas no pertencem classe os valores iguais ao extremo superior (valor
2,0Kg).
Na tabela a seguir dada a distribuio das frequncias:
CLASSE
1,5 /------ 2,0

FREQUNCIA
3

2,0 /------ 2,5

16

2,5 /------ 3,0

31

3,0 /------ 3,5

34

3,5 /------ 4,0

11

4,0 /------ 4,5

4,5 /------ 5,0

Nota: a frequncia foi determinada pela contagem de casos, Tabela 2.

Ponto mdio:
dado pela soma dos extremos da classe, dividida por 2. Para a classe de 1,5/---- 2,0 o
ponto mdio 1,5 + 2,0 = 1,75
2

Portanto, uma tabela tpica de distribuio de frequncias tem 3 colunas:


a
da
esquerda, corresponde s classes, a do meio, aos pontos mdios e a da
direita, s frequncias (o nmero de elementos de cada classe). Observem na tabela 3:

Tabela 4: Nascidos vivos segundo o peso ao nascer em Kg.


Classe
1,5/ ---- 2,0
2,0/ ---- 2,5
2,5/ ---- 3,0
3,0/ ---- 3,5
3,5/ ----4,0
4,0/ ---- 4,5
4,5/ ---- 5,0

Ponto mdio
1,75
2,25
2,75
3,25
3,75
4,25
4,75

Frequncia
3
16
31
34
11
4
1

Nota: foram definidas 7 classes.

As tabelas de distribuio de frequncia mostram a distribuio da varivel, mas perdem na


exatido, pois todos os dados passam a ser representados pelo ponto mdio da classe a que
pertencem.

O nmero de classes em geral de 5 a 20 classes, podendo ser determinado pela frmula:


K = 1 + 3,222 x log n (o n de classes um inteiro prximo de K) e n.: n0 de dados.
No exemplo da Tabela 2, com n= 100, temos:
K = 1 + 3,222 x log 100 = 7,444 (ou seja, devem ser construdas 7 ou 8 classes).
importante lembrar que cabe ao pesquisador determinar o n 0 de classes que pretende
organizar.
10.3
Distribuio de Frequncias no-agrupadas: este tipo de distribuio utilizada quando o
nmero de valores possveis da varivel em estudo reduzido.
Ex.1: Em uma escola do municpio de Teresina, foram avaliadas 145 crianas com idade entre 6 e
10 anos, calculando-se o estado nutricional segundo os critrios da OMS. Para estas crianas, as
tabelas de distribuio de Frequncias das variveis estado nutricional e idade aparecem a seguir
na Tabela 4:
Tabela 5: Estado nutricional de crianas do municpio de Teresina segundo critrios da OMS.
10

Categoria
Baixo peso
Normal
Sobrepeso
Obeso
Idade
6
7
8
9
10

Fr

11
105
25
4
145
f
11
27
16
19
26
99

0,08
0,72
0,17
0,03
1,00
Fr
0,11
0,27
0,16
0,19
0,27
1,00

F
11
38
54
73
99

Fr
0,11
0,38
0,54
0,73
1,00

Nota: f a frequncia absoluta, fr a frequncia relativa, F a frequncia


absoluta acumulada e Fr a frequncia relativa acumulada.

11. Apresentao dos dados em grficos


A representao grfica de um fenmeno deve seguir os seguintes critrios, para atender
aos objetivos da representao estatstica:
a) Simplicidade: o grfico deve ser isento de detalhes secundrios, traos em excesso que
dificultam a leitura e de detalhes que desviem a ateno do leitor.
b) Clareza: o grfico deve possibilitar uma correta interpretao dos valores representativos do
fenmeno estudado.

c) Veracidade: o grfico deve expressar a verdade do fenmeno pesquisado.


As informaes podem ser visualizadas de forma mais fcil atravs da
utilizao de grficos que representem o conjunto de dados coletados.
Todo o grfico deve apresentar ttulo (pode ser colocado tanto acima como abaixo) e
escala (crescem da esquerda para a direita e de baixo para cima). As legendas devem ser
colocadas direita do grfico.
11.1

Grfico de barras ou colunas

usado para apresentar variveis qualitativas ou variveis ordinais. Num dos eixos
coordenados so representadas as frequncias e no outro os valores das variveis.
Obs: No existe diferena entre o grfico de barras e o de colunas a no ser pela troca
de variveis nos eixos coordenados.
Figura 1. Casos de Leishmaniose Visceral por faixa etria, segundo sexo Piau, 2009.
11

Fonte: SINAN/SVS/SM.

11.2 Grfico de setores


usado para apresentar variveis qualitativas ou variveis ordinais. Popularmente
conhecidos como grficos de pizza. Podem ser utilizados para representar dados
categricos ou inclusive alguns dados numricos em que existem poucos valores
possveis.
A figura 2 representa os dados colhidos na Tabela 4, que descreve o exemplo do estado
nutricional de crianas do municpio de Teresina segundo critrios da OMS.
Figura 2: Estado nutricional de crianas do municpio de Teresina segundo critrios da OMS.

12

Estado nutricional de crianas - Teresina /PI

Observaes:
1- Todos os grficos que tm o formato retangular devem manter a proporcionalidade da altura ser
um valor entre 60% a 80% do valor escolhido para a base.
2- Os grficos necessitam tambm ter ttulo.
3- O mais importante para os pesquisadores que tomam decises fazer uso adequado dos
grficos estatsticos, conseguindo interpretar a realidade mostrada por este recurso da estatstica
e a partir dessa leitura, posicionar-se sobre a realidade.
11.3 Grficos de disperso
So utilizados para representar as relaes existentes entre duas variveis numricas e para
tal utiliza-se um grfico em que cada eixo representa uma varivel. Um exemplo pode ser visto no
grfico da figura 3, onde para cada par de dados de um indivduo gera um ponto no grfico, de
forma que, ao observar a nuvem de pontos gerados, tem-se uma ideia da relao entre as
variveis representadas.

13

Relao Peso x Altura de estudantes do sexo masculino do municpio de Piripiri/PI


2.00
1.90
1.80

Altura (m)

1.70

Linear (Altura
(m))

1.60
1.50
1.40
40 50 60 70 80 90 100

11.4Histograma
Os dados apresentados em tabelas de distribuio de frequncia so apresentados
graficamente em histogramas. Na tabela 3, estudada anteriormente no tpico 10.2, apresentamse dados sobre o peso de recm-nascidos vivos em Teresina. A seguir estes dados so
representados na forma de um histograma.
Histograma

1.

Peso

ao

nascer

de

40
35
30
25
20
15
10
5
0
1

Frequncia

14

nascidos

vivos,

em

Kg,

Teresina/PI.

Peso ao nascer
Se os intervalos de classe so diferentes, ao se construir um histograma, deve-se calcular
as densidades de frequncia relativa (quociente da frequncia relativa e o intervalo de classe) que
determinam as alturas. Observe a tabela 6, onde os intervalos de classe so diferentes e o
histograma, referente a esta tabela representando os dados. As densidades de classes esto
apresentadas na tabela.
Tabela 6. Mulheres com 30 anos de idade segundo a presso sangunea sistlica, em milmetros
de mercrio.
Classes
Frequncia
Frequncia
Densidade
Relativa
90/ ------100
6
6
0,6
100/ ---- 105
11
11
2,2
105/ ---- 110
12
12
2,4
110/ ---- 115
17
17
3,4
115/ ---- 120
18
18
3,6
120/ ---- 125
11
11
2,2
125/ ---- 130
9
9
1,8
130/ ---- 135
6
6
1,2
135/ ---- 140
140/ ---- 150
150/ ---- 160
160 e mais

4
4
1
1

4
4
1
1

0,8
0,4
0,1
0,1

Histograma 2: Mulheres com 30 anos de idade segundo a presso sangunea sistlica, em


mmHg.

15

11.5Polgono de frequncia:
Os dados apresentados em tabela de distribuio de frequncias tambm podem ser
apresentados em grficos denominados polgonos de frequncia. Aps serem marcados os
pontos na abscissa (pontos mdios das classes) e na ordenada (frequncia relativas), fechar o
polgono unindo os extremos nos pontos de abscissas iguais aos pontos mdios de uma classe
imediatamente inferior a primeira e de uma classe imediatamente superior ltima. Veja o
Polgono a seguir construdo para apresentar os dados da tabela 3 (tpico 10.2).

Nota: Nascidos vivos segundo o peso ao nascer, em quilogramas.

MEDIDAS ESTATSTICAS
As medidas estatsticas tm por objetivo descrever um conjunto de dados de forma
organizada e compacta que possibilita a visualizao do conjunto estudado por meio de suas
medidas estatsticas.
Estudaremos dois tipos fundamentais de medidas estatsticas: medidas de tendncia
central e medidas de disperso.
I) As medidas de tendncia central mostram o valor representativo em torno do qual os dados
tendem a agrupar-se, com maior ou menor frequncia. So utilizadas para sintetizar em um nico
nmero o conjunto de dados observados.
16

II)
As
observados

medidas de disperso mostram o grau de afastamento dos valores


em relao quele valor representativo.

I) MEDIDAS DE TENDNCIA CENTRAL


1) Mdia aritmtica simples
A mdia aritmtica simples de um conjunto de valores o valor obtido somando-se todos eles e
x
dividindo-se o total pelo nmero de valores. denotada por (leia-se x barra)
x
x
n
, onde x so os valores observados.
x

x .f
f
i

, se os dados estiverem organizados em distribuio de frequncia.

Onde xi e fi so os valores do ponto mdio e da frequncia absoluta da classe i-sima


respectivamente.
Exemplos:
1) Calcule a mdia aritmtica dos valores
abaixo:
X = {0, 6, 8, 7, 4, 6}
Y = {25, 16, 29, 19, 17}
Z = {105, 123, 98, 140}

2) Encontre a mdia para o salrio destes


funcionrios.
Salrios semanais para 100 operrios no
especializados
17

Salrios
semanais
140 |-- 160
160 |-- 180
180 |-- 200
200 |-- 220
220 |-- 240
240 |-- 260

xi

xi.fi

fi
7
20
33
25
11
4
100

18

ROTA ASSESSORIA EDUCACIONAL LTDA

2) Mediana
A mediana um valor central de um rol, ou seja, a mediana de um conjunto de valores
ordenados (crescente ou decrescente) a medida que divide este conjunto em duas partes
iguais.
Exemplo: Calcule a mediana dos conjuntos abaixo:
X = {3, 7, 4, 12, 15, 10, 18, 14}
Y = {29, 33, 42, 38, 31, 34, 45, 51, 95}
Z = {29, 33, 42, 38, 31, 34, 45, 120, 95}
3) Moda
Seja X um conjunto de dados estatsticos. Define-se Moda de X, denotada por Mo como
sendo o elemento mais frequente no conjunto.
Um conjunto de dados pode ter:
- Nenhuma moda (amodal);
- Uma moda (unimodal);
- Duas ou mais modas (multimodal).
Ex: Calcule a moda para os conjuntos abaixo:
X = {2, 3, 4, 3, 7, 8, 9, 14}.
Y = {2, 4, 6, 2, 8, 4, 10}.
Z = {32, 56, 76, 4, 8, 97}.
OBS:
1. No h regra para se dizer qual a melhor medida de tendncia central.
2. Em cada situao especfica o problema deve ser analisado pelo estatstico, que concluir pela
medida mais adequada a situao. Assim que:
A MA a medida mais adequada quando no h valores errticos ou aberrantes.
A mediana deve ser usada sempre que possvel como medida representativa de distribuies com
valores dispersos, como distribuio de rendas, folhas de pagamentos, etc.

Agora vamos testar seus conhecimentos


1) Encontre a mdia dos seguintes conjuntos de observaes.
X = {2, 3, 7, 8, 9}.
Y = {10, 15, 22, 18, 25, 16}.
Z = {1, 3, 6, 8}.
T = {1, 3, 6, 100}.
2) Encontre a mdia das notas na disciplina de Epidemiologia.
- Notas obtidas na disciplina de Epidemiologia.
Notas fi
5 |-- 6 18
6 |-- 7 15
7 |-- 8 12
8 |-- 9 03
9 |--10 02
--

ROTA ASSESSORIA EDUCACIONAL LTDA

Fonte: Dados hipotticos.

3) Dados os conjuntos abaixo, calcule a mdia aritmtica, mediana e moda.


A = {3, 5, 2, 1, 4, 7, 9}.
B = {6, 12, 15, 7, 6, 10}.
C = {10, 5, 11, 8, 15, 4, 16, 5, 20, 6, 13}.
D = {4, 4, 10, 5, 8, 5, 10, 8}.

4) Calcule a mdia aritmtica das distribuies de frequncias dos exerccios 1 e 2.

ROTA ASSESSORIA EDUCACIONAL LTDA

MEDIDAS DE TENDNCIA CENTRAL


As medidas de tendncia central do o valor do ponto em torno do qual os dados se
distribuem.
A mdia d a abscissa em torno do qual os dados se distribuem, sendo importante que
seja avaliado o grau de disperso de um conjunto de dados, ou seja, quanto cada dado se
desvia em relao mdia ( o que chamamos de varincia e desvio padro).
Clculo da mdia aritmtica: a soma de todos os dados dividido pelo nmero deles. A
mdia d a abscissa do centro de gravidade do conjunto de dados.
A Tabela 7, fornece o peso ao nascer em kg de 10 RN.
Tabela 7: Peso ao nascer em kg de 10 RN.
2,5
3,0
3,5

2,0
1,0
1,5

3,0
1,5
2,5

A mdia aritmtica (representa-se por


10

4,0
-

) : 2,5 + 3,0 + 3,5 + ...... 4 = 2,45

Clculo da mdia de dados em tabela de distribuio de frequncia.


Considere os dados da Tabela 8. Nascidos vivos segundo o peso ao nascer, em
quilogramas.
Classe

Ponto Mdio

Frequncia

1,5/ ---- 2,0

1,75

2,0/ ---- 2,5

2,25

16

2,5/ ---- 3,0

2,75

31

3,0/ ---- 3,5

3,25

34

3,5/ ---- 4,0

3,75

11

4,0/ ---- 4,5

4,25

4,5/ ---- 5,0

4,75

O nmero de nascidos vivos nesta amostra :


n = 3 + 16 + 31 + 34 + 11 + 4 + 1 =100

ROTA ASSESSORIA EDUCACIONAL LTDA

X
A mdia
dos pesos ao nascer dos nascidos vivos da amostra calculada multiplicandose o ponto mdio de cada classe pela respectiva frequncia, somando-se a seguir os
produtos e dividindo a soma por n:
X

= 1,75 x 3 + 2,25 x 16 + ......... 4,25 x 4 + 4,75 x 1 = 300 = 3 Kg


100
100

II) MEDIDAS DE DISPERSO


Nota-se que os valores da srie a esto mais concentrados em torno da mdia 31,
do que a srie b. Precisamos medir a disperso dos dados em torno da mdia, para isto
utilizaremos as medidas de disperso.
Medidas de disperso para uma amostra
As medidas de disperso so indicadores do grau de variabilidade demonstrada
pelos indivduos em torno das medidas de tendncia central.
Servem para verificarmos a representatividade das medidas de posio, pois muito
comum encontrarmos sries que, apesar de terem a mesma mdia, so compostas de
maneira distinta.
Assim, para as sries:
25, 28, 31, 34, 37
17, 23, 30, 39, 46
x a xb 31
temos
.

Varincia
Os dados se distribuem em torno da mdia; medindo os desvios em relao
mdia (diferena entre cada dado e a mdia) estamos avaliando o grau de disperso de
um conjunto de dados. No h mdia dos desvios, porque a soma sempre igual a zero.
Exemplo: 0,4,6,8,7
- Mdia: X = 0 + 4+ 6 + 8 + 7 = 25 = 5
5
5
- Desvio em relao mdia: (X X):
05=-5
4 5 = -1
6-5= 1
85= 3
75= 2
- A soma dos desvios igual a zero: - 5 1 +1 3 + 2 + - 6 + 6 = 0

ROTA ASSESSORIA EDUCACIONAL LTDA

- Soma de quadrados dos desvios


Tabela 9. Clculo da soma de quadrados dos desvios
Dados
(x)

Desvios
(x x)

Quadrado dos desvios


(X X ) 2

0
4
6
8

-5
-1
1
3

25
1
1
9

x=5

(x x) = 0

(x x) 2 = 40

A soma de quadrados dos desvios no usada como medida de disperso porque


seu valor cresce com o nmero de dados. Vamos entender esta ideia: pesos de 2 grupos
de pessoas:
Grupo A: 60, 70 e 80 Kg.
Grupo B: 60, 60, 70, 70, 80, 80,...
Veja na tabela 8 que a disperso dos dados em torno da mdia a mesma em
ambos grupos, mas a soma de quadrados dos desvios maio no grupo B, pois este grupo
tem mais dados.
Tabela 10 Clculo da soma de quadrados dos desvios.
Grupo I
X
60
70
80

Grupo II

(x - x)
- 10
zero
10

(x x) 2
100
Zero
100

Zero

200

X
60
60
70
70
80
80

(x - x)
- 10
- 10
zero
zero
10
10
zero

(x x) 2
100
100
zero
zero
100
100
400

Assim, para medir a disperso dos dados em relao mdia, usamos a Varincia
(S ), que leva em considerao o tamanho da amostra.
2

S 2 = soma de quadrados dos desvios


n1

ROTA ASSESSORIA EDUCACIONAL LTDA

Clculo da S 2 dos dados: 0,4,6,8 e 7 , colocados na tabela 9.


S 2 = 40 = 40 = 10
5 -1 4

- Desvio padro
a raiz quadrada positiva da mdia aritmtica dos quadrados das diferenas entre cada

valor e a mdia aritmtica do conjunto e denotada por . Assim,


(x

x) 2

(x x)
f
i

fi

, se os dados estiverem organizados em distribuio de frequncia.

Exemplo 1:
Salrios semanais para 100 operrios no especializados.
x
x
Salrios
fi
xi
(xi- )2
(xi- )2fi
semanais
140 |-- 160
7
160 |-- 180
20
180 |-- 200
33
200 |-- 220
25
220 |-- 240
11
240 |-- 260
4
100

Encontre o desvio padro para o salrio destes funcionrios.

- Coeficiente de variao: (CV)


O CV a razo entre o desvio padro (s) a mdia.
(

) x 100 (resultado em porcentagem).

CV = s x 100
X

Para melhor entender. Observe o ex: dados dois grupos de pessoas com idades:

ROTA ASSESSORIA EDUCACIONAL LTDA

Grupo A: 3,1,5 ----- X : 3 anos ; s2 = 4


Grupo B: 55, 57,53 ----- X: 55 anos ; s2 = 4
Observem que a disperso dos dados em ambos os grupos a mesma (a varincia S
igual a 4, j os CV so diferentes.

No 1o grupo, o CV :
2/3 x100 = 66,67%
No 2o grupo, o CV :
2/55 x 100 = 3,64% .
Vejam que no 1o grupo (grupo A), a disperso os dados em relao mdia
grande, ou seja, a disperso relativa alta.
Na tabela a seguir, o peso de 10 RN. Calcular mdia e o desvio padro dos dados
Peso ao nascer de recm- nascidos vivos
2,5
2,0
3,0
1,0
3,5
1,5

3,0
1,5
2,5

4,0

Para calcular:
X (mdia)

X
os desvios em relao mdia: X
a soma de quadrados dos desvios
a s2 (varincia): soma de quadrados de desvio
n1
2
o desvio padro (s) = s
coeficiente de variao CV = s x 100
X
Teste de Hipteses
Na maioria das vezes, o pesquisador toma deciso para toda populao, tendo
examinado apenas parte desta populao (amostra). Este processo chama-se de
inferncia. Na pesquisa cientfica, a inferncia feita com a ajuda de testes estatsticos.
Para a compreenso de um teste estatstico preciso que entendamos o que vem a
ser Hiptese Nula (H0) e Hiptese Alternativa (H1).
Hiptese uma conjectura, uma resposta presumida e provisria que, de acordo
com certos critrios, ser ou no rejeitada.

ROTA ASSESSORIA EDUCACIONAL LTDA

Hiptese Nula (H0): aquela que simplesmente afirma que no h diferena entre os
grupos estudados; trata-se de uma hiptese que atribui ao acaso a ocorrncia do
fenmeno ou resultado observado.
Hiptese Alternativa ou experimental (H 1): aquela que afirma que h diferena
entre os grupos estudados.
O principal objetivo de testar uma hiptese responder seguinte questo: dadas
duas amostras so elas realmente diferentes ou pertencem a uma mesma populao, ou
em outras palavras, as diferenas encontradas entre duas ou mais amostras so
verdadeiras ou podem ser explicadas pelo acaso.
O processo de testar hiptese consiste em seis etapas:
1.
2.
3.
4.
5.

Estabelecer a H1 (se l ag 1).


Estabelecer a H0 (se l ag zero).
Determinar o tamanho da amostra.
Colher os dados.
Realizar teste estatstico para verificar a probabilidade de que a H 0 seja
verdadeira.
6. Rejeitar ou no a H0.
Pode dizer que todo experimento existe somente com o propsito de dar aos fatos
uma oportunidade de afastar a hiptese nula. Ao afastar a hiptese nula, estamos
afirmando a validez da hiptese alternativa.
Todo experimento realizado para testar uma hiptese. O pesquisador formula uma
hiptese, observa, analisa e em seguida conclui. Aps observar, o pesquisador descreve e
mede.
Jamais atribuindo juzos de valor ao que est sendo visto; o pesquisador pode
decidir erroneamente e rejeitar a hiptese nula sendo ela verdadeira (Erro tipo I). Assim, o
pesquisador aceita como verdade uma diferena que na realidade no existe e que na
verdade, se deve variabilidade das amostras. Quando a hiptese H 0 falsa e o
pesquisador no a rejeita, dizemos que ele cometeu um Erro tipo II, significando que
existia, de fato, uma diferena que no foi reconhecida.
Assim:
Erro tipo I: rejeita a H0 sendo verdadeira (fato obtido por (erro
alfa) azar: rara ocorrncia estatstica)
Erro tipo II : aceita a H0 sendo falsa (erro mais frequente) (erro
beta)

A probabilidade (p) de rejeitar a H 0 quando a H0 verdadeira, o que chamamos de


nvel de significncia do teste. O estatstico no sabe quando rejeita a H 0, se est ou no
cometendo erro, mas sabe a probabilidade de cometer este tipo de erro. Se a probabilidade
for suficientemente pequena (< 5%), a deciso de rejeitar a H 0 est bem fundamentada. O

ROTA ASSESSORIA EDUCACIONAL LTDA

nvel de significncia representado pela letra grega (l-se alfa). O nvel de significncia
o nome com que se designa a probabilidade .
Vejamos o exemplo:
Feito um experimento com duas drogas (A, B), o pesquisador pergunta se a droga A
cura tanto quanto a droga B.
O estatstico v a pergunta do pesquisador como duas hipteses:
H0: a proporo de pacientes curados com a droga A igual proporo de pacientes
curados com a droga B
b) H1: a proporo de pacientes curados com a droga A diferente da proporo
de pacientes curados com a droga B.
Feitas as hipteses, o estatstico estabelece o nvel de significncia do teste. O nvel
de significncia seria a probabilidade (p) de afirmar que uma das drogas determina maior
proporo de curas, quando na verdade, a proporo de pacientes curados a mesma,
seja a droga A ou B. usual manter o nvel de significncia de 1% e 5% um de 5%
significa que cometemos um erro (tipo I) de 5% em rejeitar a H0 (sendo verdadeiro) e
aceitar H1 (1 em cada 20 se comete o Erro tipo I ao rejeitar a H 0). Um de 1% (0,01),
significa que ao rejeitar a H 0 e aceitar a H1, o risco de estarmos errando, ou seja,
cometendo um erro tipo I de 1%. O nvel de significncia representa a mxima
probabilidade de tolerar um erro tipo I. Assim:

erro I e erro II
erro I e erro II

Os erros ocorrem ao testar hipteses por diferentes motivos:


-

Erro tipo I: amostras pequenas (h uma maior chance de serem diferentes quanto
menores forem; numa amostra maior, estas diferenas se diluiriam).
Erro tipo II: amostras pequenas grande quantidade de amostras.

Algum erro sempre ocorre, sendo til admitir que para o Erro tipo I ou alfa,
considera-se que 5% aceitvel e para o tipo II ou beta, aceita-se geralmente 10 - 20%.
- Tamanho da Amostra
Para determinar o tamanho da amostra preciso estabelecer qual a diferena deve
ser considerada significativa. Esta uma deciso arbitrria do pesquisador, baseada na
experincia, na literatura e/ou na relevncia clnica.
Para determinar o tamanho da amostra, deve-se considerar o nvel de significncia
adequado: quanto de probabilidade aceitvel para que H 0 seja verdadeira. Geralmente
considera-se uma probabilidade menor ou igual a 5% como adequada (p 0,05). Deve-se
tambm definir um erro beta (erro tipo II) aceitvel: se aceitamos um erro beta de 0,1

ROTA ASSESSORIA EDUCACIONAL LTDA

estamos aceitando uma chance de 10% de deixar de reconhecer uma diferena que
realmente existe. Para fins prticos:
-

Amostras grande:
n > 100
Amostras mdias:
n > 30
Amostras pequenas:
n < 30
Amostras muito pequenas: n < 12

Lembrar que: 1) Quanto menor a diferena a ser detectada, maior dever ser o tamanho da
amostra. 2) Quando menor o nvel de significncia (p), maior deve ser o tamanho da
amostra.
A etapa seguinte consiste na coleta de dados, lembrando que maus dados levam
igualmente a ms concluses.
Uma vez obtidos os dados, faz-se a anlise estatstica aplicando-se testes
escolhidos em funo do tipo de dados disponveis.

Teste de Fisher ou da probabilidade exata


O teste de Fisher usado para amostras pequenas e produz menos erro tipo I e II
em relao ao teste do qui-quadrado. O teste de Fisher permite calcular a probabilidade de
associao das caractersticas que esto em anlise, ou seja, de elas serem
independentes. Assim, o teste de Fisher utilizado nas seguintes situaes:
- n < 20
- n > 20 e < 40 e a menor frequncia esperada for menor que 5.
O teste de Fisher calcula a probabilidade de que a matriz de deciso usada tenha
sido obtida por acaso e, portanto, sem mudar os totais das colunas e linhas, o teste de
Fisher contrai todas as tabelas possveis. Os softwares estatsticos, na sua maioria so
capazes de aplic-lo.
Vejamos os exemplos:
a) quando houver uma clula na matriz de deciso com o valor zero:
Supondo a presena de uma determinada enzima em pessoas submetidas a uma
reao sorolgica.

Reao

Enzima

Total

Presente

Ausente

ROTA ASSESSORIA EDUCACIONAL LTDA

Total

A probabilidade igual ao produto dos fatoriais dos totais marginais pelo fatorial do
total geral multiplicado pelo inverso dos produtos dos fatoriais dos valores observados em
cada classe.
P = (a + b !) x (c + d !) x (a + c !)x (b + d !)
n ! x 1 / a! b! c! d!
Aplicando a frmula temos:
P = [ (6! 3! 5! 4!)/ 9!] x [ 1/(5! 1! 0! 3!)] ...(consulte no final a tabela A-10 de fatoriais de 0 - 20).
P= [ (720 x 6 x 120 x 24)/ 362880] x [ 1/(120 x 1x 1x 6)]
! : fatorial; 0!: fatorial de 0 = 1
Resolvendo, temos: p = 0,046 = 4,76%.
Como este valor menor que 5%, a hiptese das caractersticas serem
independentes rejeitada dizendo-se que a sua associao no casual, ou seja, as
pessoas submetidas a uma reao sorolgica apresentam significativamente uma
determinada enzima (afastamos a H0).
b) se no houver clula com valor zero na matriz de deciso. Para isto devemos fazer:
1. calcular a probabilidade idntica ao escrito acima.
2. construir outra tabela 2 x 2, subtraindo-se uma unidade dos valores da diagonal. que
contenha o menor nmero de casos e adicionando esta unidade aos valores da outra
diagonal.
3. Calcular novamente a probabilidade.
4. Este processo continuar at que se atinja o valor 0.
5. Somar todas as probabilidades calculadas.
Exemplo: supondo que os valores obtidos sejam:
Reao
+
Total

Enzima
Presente
5
2
7

Total
Ausente
3
5
8

8
7
15

Calcularamos:
1 - Total
5 3
8
P = (8! 7! 7! 8!/15)
(1/5! 3! 2! 5!)
2 5 7
P = 0,1828
7
8
15
2 - Total
6 2
8Total P = (8! 7! 7! 8!/15)
(1/6! 2! 1! 6!)
1 6 7
P = 0,0305
7 8 15

3 - Total
7 1 8
P = (8! 7! 7! 8!/15)
(1/0! 7! 1! 7!)
0 7 7
P = 0,0012
7 8 15
Total

ROTA ASSESSORIA EDUCACIONAL LTDA

p = 0,1828 + 0,0305 + 0,0012 = 0,2145 = 21,45%


P > 5%.
Neste caso, como o valor encontrado de P maior que 5%, a hiptese das
caractersticas serem independentes aceita, dizendo-se que a sua associao casual,
ou seja, neste exemplo as pessoas submetidas a uma reao sorolgica no apresentam
significantemente uma determinada enzima (no afastamos a H 0).
ANOVA - Analysis of Variance
Anlise da Varincia
(Estatstica F)
Teste de Tukey
Discutimos formas de comparar dois grupos de pacientes ou duas amostras. Muitas
vezes torna-se necessrio comparar mdias de mais de duas populaes.
Ex: Suponhamos que queiramos testar quatro drogas diferentes ao mesmo tempo (quatro
diurticos diferentes A, B, C, D) e que desejamos avaliar o efeito de cada uma das drogas
sobre o dbito urinrio em 16 voluntrios.
Para sabermos se os grupos so significativamente diferentes uns dos outros, se
algum dos diurticos testados tem um efeito diurtico importante, utilizando o teste t,
podemos comparar os grupos dois a dois, por meio de 6 testes t separados, o que poder
revelar uma diferena significativa entre os diurticos. Alm da perda de tempo com este
procedimento, poderamos estar incorrendo num erro tipo I, pois ao aceitar 5% de erro em
cada uma das 6 anlises separadas, haveria uma chance de 30% (6 x 5%) de encontrar,
por mero acaso uma diferena estatisticamente significativa.
O uso da anlise da varincia indicar a probabilidade de que a hiptese nula seja
verdadeira, ou seja, probabilidade de que nenhuma diferena existe entre quaisquer dos
grupos. Se a hiptese nula (H 0) for rejeitada, ser o indcio de que h diferena de potncia
em algum dos diurticos testados. Para localizar o diurtico envolvido, ser necessrio um
teste ANOVA de comparao de pares.
Os testes de ANOVA se apiam na hiptese de que se os grupos so semelhantes,
a varincia em cada um (dentro) dos grupos semelhante quela entre os grupos; o que
estes fazem comparar a variabilidade das mdias de todas as amostras coma
variabilidade dentro das amostras.
Assim, o teste precisa determinar a variabilidade dentro de cada amostra, bem como
a variabilidade que existe entre mdias das amostras. Ao fazermos isto, geramos uma
estatstica chamada F, cuja frmula :

ROTA ASSESSORIA EDUCACIONAL LTDA

F=

estimao da varincia ENTRE os grupos


estimao da varincia DENTRO dos grupos

F: distribuio F de R.A Fischer;


Quando: o F observado ao F crtico, rechaa a hiptese nula de que no h diferena
entre as varincias.
Lembrem-se sempre que:

H0 (hiptese nula): no h diferena entre os grupos.


H1 (hiptese experimental): h diferena entre os grupos.

Vejamos um exemplo:
1. Trs grupos de crianas (ao acaso) receberam diferentes nveis de motivao para
aritmtica. Depois se fez um exame. H diferenas significativas entre os 3 nveis de
motivao (baixa, mdia e alta)?
Vejamos:
Grupo 1
4
5
4
3
6
10
1
8
4

16
25
16
9
36
100
1
64
25

X1 X12
X1 = 5,11

Grupo 2
12
8
10
5
7
9
14
81
4

144
64
100
25
49
81
1 96
981
16

X2 X22
X2= 8,67

Grupo
1 1
3 9
4 16
6 36
8 64
5 5 25
3 9
2 4
2 4

X : Mdia

X3 X32
X3 = 3,78

Anlise das Varincias do Exemplo acima:


Soma dos quadrados

Graus de liberdade

(SQ)

(GL)

Entre

K -1

Dentro

NK

Total

N1

(a) : (X1)2 + (X2)2 + ( X3)2 - (X total)2

quadrado mdio = estimao da


varincia (QM)

N1

N2

N3

ROTA ASSESSORIA EDUCACIONAL LTDA

(b): X2 - (X)2
N
c=b-a
K = nmero de grupos (no exemplo K =
3).

N = nmero de indivduos (no exemplo


N =27).
Graus de liberdade de F: F(K 1) (N K) = 2
(numerador) e 24 ( denominador).

Realizando os clculos:
- Clculo de (a): entre os grupos:
a = (46)2 + (78) 2 + (34) 2 + (158) 2 = 235,11 + 676 + 128,49 + 924,60
9
9
27
(a) = 114,96.
- Clculo de (b): total dos grupos
(b) = 292 + 756 + 168 - (46+78+34)2 = 1216 - 924,6
27
(b) = 291,4.

- Clculo de (c): dentro dos grupos


(c) = b - a = 291,4 - 114,96 = 176,45

- Estimao da varincia entre os grupos:


a
=
K- 1

14,96 = 57,48
3-1

- Estimao da varincia dentro dos grupos:


c
= 176,45 = 7,35
N-K
27 - 3

F = estimao da varincia (a) = 57,48 = 7,82


Estimao da varincia (c)
7,35
Consultando o valor de F na tabela (Fcrtico), observamos o valor de Fc de 3,37 ao nvel
de significncia de 5% com 2 e 24 de liberdade (Tabela A-4) no final.

- Graus de liberdade : K - 1 = 2 (numerador): entre.


N - K = 24 (denominador): dentro.

- Interpretao dos resultados:


Como o valor de F observado (7,82) foi maior que o valor de F encontrado na tabela dos
valores de F, podemos dizer que rechaamos a hiptese nula e podemos dizer que houve
diferenas significativas entre os grupos ao nvel de significncia de 5%.

Quanto maior for o valor do F observado, maior ser a variao entre os grupos em
relao variao dentro dos grupos e, consequentemente, maior probabilidade de rejeitar a
hiptese nula e aceitar a hiptese experimental.
A ANOVA informa somente se h ou no diferena estatisticamente significativa entre dois
ou mais grupos, mas no informa quais os grupos envolvidos. Para identificar os grupos, devese realizar uma comparao entre os pares - pair wise comparision test - que ir comparar cada
grupo com cada um dos outros. Entre os testes capazes de realizar esta anlise, vamos
comentar sobre o Teste de Tukey:
O Teste de Tukey (1953) permite estabelecer a diferena mnima significante, ou seja, a
menor diferena de mdias de amostras que deve ser tomada como estatisticamente
significante, em determinado nvel. Esta diferena (d.m.s) dado pela frmula:
d.m.s = q x

varincia estimada dentro dos grupos (c)


N

N => nmero de indivduos em cada estudo ou nmero de repeties de cada tratamento.


Valor obtido na tabela (Tabela A-7, no final) no nvel de significncia e graus de liberdade:

qK1, N K,
- No nosso exemplo: q3, 24,0,05

d.m.s = 3,53x

7,35 = 3,19
9

- Interpretao:
Como vimos, aplicando a ANOVA, as mdias dos 3 grupos no so estatisticamente
iguais. Mas qual ou quais so as mdias diferentes entre si?
De acordo com o Teste de Tukey, duas mdias so estatisticamente diferentes toda vez
que o valor absoluto da diferena entre eles for igual ou superior ao valor da d. m. s.
No nosso exemplo, o valor da d.m.s 3,19 e os valores absolutos das diferenas entre as
mdias so:
X1 - X2 = 5,11 - 8,67 = 3,56.
X2 - X3 = 8,67 - 3,78 = 4,89.
X1 - X3 = 5,11 - 3,78 =1,33.

X
X
X
versus 2 e 2 versus 3 so maiores que 3,19. Assim, vemos que as diferenas entre as
mdias dos grupos 1 e 2 e dos grupos 2 e 3 so estatisticamente significativas ao nvel de
1

significncia de 5% (0,05) o que no ocorreu entre os grupos 1 e 3, porque


que a d.m.s.

X
1

X
3

menor

Outros autores chamam esta diferena mnima significativa como prova da diferena
honestamente significativa (DHS).
ESCOLHA DO TESTE ESTATSTICO
Estabelecendo o nvel de significncia, o estatstico escolhe o teste apropriado. Existe
hoje grande variedade de testes disposio dos interessados. Todos tm indicao precisa e
todos tm vantagens e desvantagens. A escolha do teste exige conhecimento de estatstica.
A escolha de um teste de significncia depende de caractersticas dos dados coletados:
-

Tipos de dados: nominais, ordinais ou contnuos


Amostras isoladas, duas amostras ou mais de dois grupos
Emparelhamento ou no
Amostras grandes ou pequenas (dados nominais)
Distribuio normal ou no (dados contnuos)

O teste a ser aplicado varia em funo do tipo de dados, sendo ento a primeira etapa na
escolha do teste, caracterizar o tipo de dados. A deciso a seguir consiste em determinar
quantos grupos sero comparados. Quando se trata de dois grupos de dados, o teste de
significncia determina a probabilidade de eles se originarem ou no da mesma populao.
Quando se deseja comparar mais de dois grupos, s vezes 5 ,10 ou mais, deve-se usar anlise
de varincia.
Testes estatsticos no-paramtricos
Os estatsticos imaginaram testes quando a distribuio da populao altamente
assimtrica.
Quando em dvida, os estatsticos escolhem um teste paramtrico (a maioria dos testes
de hipteses vistos anteriormente) quando no esto seguros de que a distribuio normal foi
violada e testes no paramtricos porque no esto seguros de que a distribuio normal foi
encontrada (estes ltimos no so to eficientes quanto aos paramtricos para detectar
diferenas na populao).
Teste do Sinal - Sign Test: variveis qualitativas ou nominais. Este teste recebe este nome
porque a diferena em cada par convertida nos sinais de (+), de (-) ou (zero) - quando no
houver diferena.
H0: 1/2 dos sinais so (+) e 1/2 dos sinais so (-)
H1: a proporo de vezes (p) em que aparece o sinal (+) ou (-), seja igual a 0,5; valendo-se
disto, possvel gerar um escore Z, utilizando a frmula:

Z = 2 (p - 0,5)

n: nmero de
p,: a frequncia de sinais (+) ou negativos (-).

pares em que houve a diferena.

Este teste constitui uma alternativa no-paramtrica (menos poderosa) do teste t, para
amostras emparelhadas. Seja o exemplo:
Considere a populao em que se deseja escolher dois equipamentos de laboratrio, A e B
capazes de realizar 12 anlises diferentes e que a rapidez da execuo seja um ponto a ser
considerado. Foi feita uma aferio dos tempos gastos para executar cada tarefa, com a
finalidade de verificar se os equipamentos diferiam entre si.
Tarefa
1
2
3
4
5
6
7
8
9
10
11
12

Tempo A
40
22
22
45
68
33
48
75
41
44
47
31

Tempo B
29
16
29
41
61
24
54
68
36
36
42
25

Diferenas (A - B)
+
+
+
+
+
+
+
+
+
+

Aferio dos sinais negativos: p= 2/12 = 1/6


Z = 2 (1/6 - 0,5)12 = - 2,28
O valor crtico de Z para um alfa de 5% 1,96; logo, pode-se dizer que os equipamentos
de A e B diferem entre si quanto velocidade para um nvel de significncia de 5%.
Wilcoxon Signed Rank Sum Test: variveis ordinais
Este teste destina-se a comparar dois grupos emparelhados; usado exatamente da
mesma situao do teste t para amostras emparelhadas.
Como calcular:
- Calcular a diferena entre os valores.
- Atribuir postos aos valores absolutos das diferenas (a menor diferena recebe o posto 1).
- Somar todos os postos das diferenas positivas e das negativas obtendo-se somas chamadas
de T.
Na tabela apropriada (tabela A-8 no final), encontrar os valores de p correspondentes aos
valores dos T obtidos, considerando como n o nmero de pares em que a diferena 0. Se os
dois valores estiverem bastante afastados, o valor de p ser pequeno: algumas tabelas usam
apenas o menor valor de T.
Seja o exemplo:

Considere o estudo de um frmaco, em que os usurios do mesmo parecem ter o nmero


de certo tipo de clula sangunea alterada durante o seu uso e que se tenha obtido os seguintes
resultados:
Contagem do nmero de Clulas
Grupo Controle
1162
1095
1420
1361
1101
999
1333
1235
1000

Droga
890
800
1104
1002
1101
858
988
875
1000

Vamos calcular as diferenas e classific-las:


Controle
1162
1095
1420
1361
1101
999
1333
1235
1000

Droga
890
800
1104
1002
1101
858
988
875
1000

Diferena
- 272
- 295
- 316
- 359
0
-141
-345
-360
0

Classificao da diferena
-2
-3
-4
-6
-1 (a menor)
-5
-7 (a maior)
-

Vemos que as diferenas foram todas negativas ou nulas; a soma dos postos, rank, das
diferenas negativas (-28) (T=28) e a soma das classificaes das diferenas positivas zero
(no houve nenhuma). O n = (8 - 1) = 7 (foi excludo 1 par em que no houve diferena).
Consultando a Tabela A-8, obtm-se um valor de T = 2 (Tcrtico), considerado significativo, ou
seja, a droga provavelmente altera a contagem da clula sangunea estudada.
(Tobservado > Tcrtico).

Teste U de Mann-Whitney
Constitui a alternativa mais comumente usada para o teste t para amostras
independentes; um teste para provar se os dois grupos independentes tm sido tomados da
mesma populao. Todos os clculos tambm so feitos como postos (ranks) e no com os
valores reais.
Exemplo: aferiu-se a presso arterial de dois grupos de estudantes (A e B). Deseja-se saber se
h diferena estatisticamente significativa entre as medianas dos grupos A e B.
Resultado das presses arteriais para os grupos A e B com os respectivos postos.
Presses do Grupo A
Postos de A

110
5,5

90
2

100
4

85
1

95
3

Presses do Grupo B
Postos de B

110
5,5

150
10

125
9

120
8

115
7

Ao classificar os dados atribuindo postos aos mesmo, havendo valores iguais, atribui-se
aos valores empatados um posto igual mdia dos postos que seriam ocupados se no
houvesse empate.
A seguir, somam-se os postos dos dois grupos e assim obtm-se:
Grupo A: 5,5 + 2 + 4 + 1 + 3 = 15,5.
Grupo B: 5,5 + 10+ 9 + 8 + 7 = 39,5.
Para testar a diferena entre as somas dos postos, calcula-se o estatstico U para ambos
os grupos, utilizando as seguintes frmulas:
U1 = n1 n2 + n (n+ 1) R1
2

U2= n1 n2 + n2(n2+ 1) - R2
2

n1: tamanho da amostra menor.


n2: tamanho da amostra maior.
R1 e R2: soma dos postos de cada grupo.
Chama-se de U observado (U 0) o menor dos valores obtidos para U 1 e U2, o qual deve ser
comparado com o U crtico (Uc) obtido em tabela especfica, considerando os valores de n 2 e
alfa. (existem vrias tabelas de U em funo de n 2 ser menor que 8, estar entre 9 e 20 ou ser
maior que 20).
Fazendo os clculos:
U1 = (5 x 5) + 5 ( 5+1) - 15,5 = 24,5
2
U2 = (5 x 5) + 5 ( 5+1) - 39,5 = 0,5
2
Observando a tabela A-9 no final das probabilidades associadas ao U de Mann-Whitney
para n2 = 5. Vemos que a probabilidade para U 0 = 0,5 situa-se entre 0,004 e 0,008 e, portanto,
menor que 0,05. Assim, rejeita-se a H0 e considera a H1 em que a mediana das presses do
grupo B estatisticamente maior que a mediana das presses do grupo A. Toda vez que o valor
observado de U tem uma probabilidade associada igual ou menor que , rejeita-se a H0 e aceitase a H1.

REFERNCIAS BIBLIOGRFICAS
AYRES, M.; AYRES, M. J. R.; AYRES, D. L.; SANTOS, A. S. BioEstat 2.0: aplicaes
estatsticas nas reas das cincias biolgicas e mdicas. Belm: Sociedade Civil Mamirau;
Braslia: CNPq, 2000. (Programa de computador: software).
BARRETO, J. O. M.; SOUZA, N. M. Avanando no uso de polticas e prticas de sade
informadas por evidncias: a experincia de Piripiri-Piau. Cincia & Sade Coletiva, 18(1):2534, 2013.
CRESPO, A. A. Estatstica Fcil. 17 ed. So Paulo: Saraiva, 2002.
FERREIRA, D. F. Estatstica Bsica. UFLA, 2005.
GAUVREAU, K.; PAGANO, M. Princpios de Bioestatstica. ed. Pioneira, So Paulo, 2003.
JEKEL, J. F.; KATZ, D. L.; ELMORE, J. G. Epidemiologia, Bioestatstica e Medicina
Preventiva. 2 ed. Porto Alegre: Artmed, 2004.
LOPES, F. J. B.; DIAZ, F. Bioestatstica. Ed. Pioneira. So Paulo, 2006.
SABROZA. P. C. Os estudos epidemiolgicos e a natureza multidimensional dos problemas de
sade da populao brasileira. Epidemiol. Serv. Sade, Braslia , v. 14, n. 1, mar. 2005.
Disponvel em <http://scielo.iec.pa.gov.br/scielo.php?script=sci_arttext&pid=S167949742005000100001&lng=pt&nrm=iso>. acesso em 04 mar. 2016.
http://dx.doi.org/10.5123/S1679-49742005000100001.
ZAROS, L. G. Bioestatstica: EDUFRN Natal, 2011. 240p.

Potrebbero piacerti anche