Sei sulla pagina 1di 55

Curso de Pós Graduação em Gestão de Saúde Pública

com ênfase em PSF

BIOESTATÍSTICA

Eduardo Arrudas Ornelas


Biólogo
Mestre em Medicina Veterinária
á UFMG
Métodos
estatísticos

Estatística Estatística
Descritiva Inferencial
Estatística descritiva:
R ú
Reúne um conjunto
j t de d técnicas
té i para sumarizar
i os dados
d d
(tabelas, quadros e gráficos) e medidas descritivas que
permitem tirar muitas informações contidas nos dados.
dados

Inferência estatística :
Produzir afirmações sobre uma dada característica da
população, na qual estamos interessados, a partir de
informações
ç colhidas de uma p
parte dessa p
população.
p ç
Estatística Descritiva

• Envolve
–Coletar
C l dados
d d
–Apresentar dados
–Caracterizar dados

• Finalidade
–Descrever dados
Estatística Inferencial

• Envolve
–Estimativas
–Teste
Teste de hipótese

• Finalidade
–Tomar decisões sobre características
da população de uma coleta.
População e Amostra

• População (ou universo): todos os N


membros de uma classe ou grupo.

– Ex.: todos os alunos de pós graduação da


DOCTUM

• Amostra é uma parte da população,


população
denotada por n.

– Ex.: todos os alunos de pós graduação em


saúde pública com ênfase em PSF.
PSF
Características importantes dos dados

1. Localização: Um valor representativo


p ou médio
indica onde se situa o centro dos dados.

2. Variação:
2 V i ã : Uma
Um medida
m did do
d quanto
t os valores
l d
da
amostra variam entre si.

3. Distribuição: A natureza ou a forma de


distribuição dos dados (tal como em forma de sino,
uniforme ou assimétrica)

4. Tempo: Algumas características podem se alterar


4
ao longo do tempo.
Imp t t !!!
Importante!!!
POPULAÇÃO AMOSTRAGEM

n
N
Distribuição de Freqüência

lista dos valores dos dados


(ou individuais ou por grupos de
i t
intervalos),
l ) j t
juntamentet com as
correspondentes freqüências ou
contagens.
Os dados
O d d t bé
também podem
d ser resumidos
id
construindo uma tabela de distribuição de
f
freqüências.
üê i

Distribuição
Di t ib i ã de
d freqüências
f üê i de d uma variável
iá l é
uma lista dos valores que a variável pode
assumir,
i com as respectivas
ti f
freqüências
üê i d
de
ocorrência.
Tabelas de contingência
Tabela de contingência

Em estatística as tabelas de contingência são usadas para


registar e analisar o relacionamento entre duas ou mais variáveis,
variáveis
normalmente de escala nominal.

Suponhamos que temos duas variáveis,


variáveis sexo (masculino ou
feminino) e mão com que escreve (destro ou canhoto).
Observamos os valores de ambas as variáveis de uma amostra
casuall de
d 100 pessoas. Uma
U t b l de
tabela d contingência
ti ê i pode
d ser usadad
para expressar o relacionamento entre estas duas variáveis, como
se segue:

MASCULINO FEMININO TOTAL


DESTROS 43 9 52
CANHOTOS 44 4 48
TOTAL 87 13 100
T b l de
Tabela d contingência
ti ê i

VARIÁVEIS A B TOTAL
C AC BC AC + BC
D AD BD AD + BD
TOTAL AC + AD BC + BD A + B + C + D= N
Freqüência

Freqüênc a absoluta (fa)


Freqüência (fa): o resultado do número de vezes
que o valor é observado na população.

Freqüência
ê relativa
l (f ) o resultado
(fr): l d obtidod da
d divisão
d
entre a freqüência que o valor é observado na população
e a quantidade de elementos da população.
população
Geralmente é apresentada na forma de porcentagem.
fa (Skol)=9
( )

fr(Skol)=9/25 = 0,36 ou 36%


A interpretação da freqüência e distribuição da amostra

• Quando se faz inferências estatísticas do ponto de


vista da freqüência, nós assumimos que nossos dados são
amostras de uma população inteira.

• A população é descrita pela média


é e variância
â da
população que são desconhecidas.

• A amostra é descrita pela média e variância da amostra.


– A mmédiaa e variância
ar ânc a daa amostra pro
provêmm estimativas
st mat as
sobre a média e variância da população inteira.
– As estimativas são conhecidas com um grau de
incerteza.
Variáveis Quantitativas:

Medidas de Posição:
•Máximo
Mí i
•Mínimo
•Moda
•Média
•Mediana
Q , , Decil
•Quartil,Percentil,

Medidas
M did ded Di
Dispersão
ã
•Amplitude
Intervalo Interquartil
•Intervalo
•Variância
•Desvio Padrão
•Coeficiente de Variação
MEDIDAS DE
POSIÇÃO
ÇÃ
Medidas de tendência central

As medidas
did d tendência
da dê i centrall são
ã
parâmetros q
p que ppermitem qque se tenha
uma primeira idéia, um resumo, de como
se distribuem os dados de um
experimento.
Medidas de posição

Máximo (Max): a maior observação

Mínimo (Min): a menor observação

Moda (Mo): é o valor (ou atributo, caractrerística) que


ocorre com maior frequencia.
frequencia

Dados: 5,3,4,3,9,4,5,6,6,5,6,6,8,8

Max = 9
Min = 3
Mo = 6
Média

É a soma das medidas (resultados)


di idid pelo
dividida l número
ú d casos .
de

É a medida mais utilizada,


utilizada no entanto
sofre bastante influência de valores
extremos.
t È uma medida
did irreal.
i l
Mediana

É o valor da variável a partir da posição central de um


conjunto de dados n (dados ordenados) na qual a metade dos
casos
s s se
s encontra
t acima
i d l e a metade
dele t d se
s encontra
t abaixo.
b i

Obs: se o número de observaçõesç for ímpar,


p , a mediana será o
valor central da distribuição;
Se o número for par a mediana será a média dos valores
centrais.
centrais

Pouco afetada p por valores discrepantes


p existentes no
conjunto (que costuma distorcer substancialmente o valor da
média)

Posição da mediana = n+1 / 2


cv cv

cv cv cv cv cv

cv cv cv cv cv
Medidas separatrizes

Permitem identificar a posição de um valor(caso)


em relação ao conjunto de observações, além de
possibilitar comparações entre diferentes
séries de dados.

•Quartil
•Decil
•Percentil
Quartil (Q)

São representados pelo 11° (Q1),


(Q1) 2 °(Q2)
(Q2),3
3°(Q3)
(Q3).

O22°(Q2)
(Q2) quartil indica que abaixo existem 50%
da distribuição, logo, acima estão os outros 50%
dos dados os quartis dividem a base em 4
partes.
Decil (D)
( )

São representados por por um conjunto de dados


ordenados
d d D1 D2 D3
D1,D2,D3........e D9 decil.
d il
O 1° decil (D1) de um conjunto de dados informa que
abaixo estão localizados 10% dos dados do conjunto de
observações e , assim sendo, acima estão os 90%
restantes. Os outros decis são representados
p de
forma semelhante.

5° decil (D5)= valor Mediano (Md).


Percentil (P)
São representados
Sã t d por um conjunto
j t de
d dados
d d ordenados
d d
P1,D2,D3........e P99 percentil.
O 1° p percentil ((P1)) informa
f m qu que 1% dos dados estão
localizados abaixo desse valor, e, por seguinte os 99%
restantes estão acima. A interpretação dos demais é feita
de forma análoga.
análoga

Percentil (P50)= mediana ou segundo quartil (Md)

Percentil (P25)= primeiro quartil (Q1)

Percentil (P25)= primeiro quartil (Q1)

Percentil (P75)= terceiro quartil (Q3)

Percentil (P10)= primeiro decil (D1)


POPULAÇÃO
Ç

μ AMOSTRA

X
δ
S
P

p
Média Mediana Moda
Soma das medidas 
Valor mais 
Definição divida pelo número  Valor do meio.
freqüente.
de casos
de casos.
Pode existir, pode 
Existência Sempre existe. Sempre existe.
haver mais de uma.
Leva em conta  Não
Sim Não
todos os dados
p
Afetado por 
Não Não
valores  Sim
discrepados
Usado em muitos  Menos sensível a 
Apropriada a dados 
Vantagens métodos  valores 
qualitativos.
estatísticos. discrepados.
MEDIDAS DE
DISPERSÃO
Ã
Medidas de variabilidade (dispersão)

Tem como finalidade encontrar um valor que


resuma a variabilidade de um conjunto de dados.

Amplitude de variação (A)


•Amplitude
•Amplitude interquatil
Desvio Padrão (s ou DP)
•Desvio
•Variância (s2)
Coeficiente de variação (CV)
•Coeficiente
•Erro padrão (se ou e)
Amplitude

É a diferença entre o maior (Máximo) e o menor (Mínimo)


valor que foi observado para a variável,
variável servindo para
caracterizar a abrangência do estudo.

Amplitude de Variação(A)
Diferença entre o mínimo e o máximo do conjunto de
d d
dados.

Amplitude interquartil
É a diferença entre os valores correspondentes ao 1°(Q1) e
3°(Q3) qquartil (percentil
p (P25) e (P75). Esta medida não
considera os valore extremos do conjunto de dados.
Desvio Padrão (s)

É uma estimativa da variabilidade dos escores de


um grupo (amostra) em torno da média.

O desvio padrão (s ou DP) é a raiz quadrada da


variância.

A unidade do desvio padrão é igual a unidade de medida das


observações.
Variância (s2)

É a soma dos quadrados dos desvios de cada


ponto em torno da média aritmética.
Caracteriza a dispersão dos pontos de uma
amostra potencializando as diferenças.

Expressa a média aritmética dos quadrados. É o


desvio padrão elevado ao quadrado.
Coeficiente de variação (CV)

É uma medida de dispersão relativa que indica a


variabilidade da amostra em relação a média.
média
Resultado do desvio padrão dividido pela média
transformando em percentual.

Permite comparar a dispersão de diferentes


distribuições (com diferentes médias e desvios padrões.
Elimina o efeito da magnitude dos dados.
cv cv

cv cv cv cv cv

cv cv cv cv cv
Erro padrão (se ou e)

Quociente entre o desvio padrão e a raiz quadrada


do tamanho da amostra. É uma mediada de
variabilidade entre a média aritmética dos dados e
a média que poderia ser encontrada em outras
amostras do mesmo tamanho, na mesma população.
O erro amostral:

iinforma
f sobre
b o quanto ded erro nossas observações
b õ
apresentam sobre a realidade pesquisada. A estatística
baseia-se na medição do erro que existe entre a estimativa
de quanto uma amostra representa adequadamente a
população
p p ç da q
qual foi extraída. Assim o conhecimento de
teoria de conjuntos, análise combinatória e cálculo são
indispensáveis para compreender como o erro se comporta
e a magnitude
it d do
d mesmo. É o erro (erro
( amostral)
t l) que
define a qualidade da observação e do delineamento
experimental.
experimental
Ob i d !!!
Obrigado!!!

Eduardo Arrudas Ornelas
ornelasea@hotmail.com

Potrebbero piacerti anche