Sei sulla pagina 1di 41

UNIVERSIDADE FEDERAL DE PERNAMBUCO

CENTRO DE BIOCIÊNCIAS
DEPARTAMENTO DE BIOFÍSICA E RADIOBIOLOGIA

BIOESTATÍSTICA
Amostragem/Estatística Descritiva

Paulo E. Cabral Filho

pauloeuzebio03@gmail.com
Recife, 2018
UNIVERSIDADE FEDERAL DE PERNAMBUCO
CENTRO DE BIOCIÊNCIAS
DEPARTAMENTO DE BIOFÍSICA E RADIOBIOLOGIA

BIOESTATÍSTICA
Amostragem

Paulo E. Cabral Filho

pauloeuzebio03@gmail.com
Recife, 2017
População x Amostra
Podemos inferir (deduzir) determinadas características de uma
população se extrairmos uma amostra representativa desta.

Amostra: conjunto de dados ou


População: coleção de unidades
observações, recolhidos a partir de um
individuais (pessoas ou resultados) com
subconjunto da população, que se
uma ou mais características comuns,
estuda com o objetivo de tirar
que se pretende estudar.
conclusões para a população de onde
foi recolhida.
Amostragem

População

Amostra
(Tem que representar a população)
Amostragem

AMOSTRAGEM
Método pelo qual selecionamos a
amostra na população. Por exemplo:
-Médicos;
- Homens com mais de 65 anos;
- Mulheres grávidas que já tenham
filhos;
- outros....
Amostra aleatória estratificadas (Subgrupos)
Amostragem

Amostra

Representa a
população?
População

População Homogênea
Amostragem

Inferência*

Amostra

Representa a
população?
População

População Heterogênea
*Raciocínio concluído ou desenvolvido a partir de indícios: a dedução é um tipo de inferência.
*Processo intelectual segundo o qual é possível chegar a uma conclusão a partir de premissas.
Amostragem/Probabilidade

Qual a probabilidade de sair uma bola ?

Amostra Aleatória Simples!


Todos devem ter a mesma chance!!! - Casualização
Princípio da Experimentação

Casualização*
Probabilidade

Repetição

Estatística
Controle local

* Refere-se à distribuição aleatória dos tratamentos às parcelas de modo que todas as


parcelas tenham a mesma chance de receber qualquer um dos tratamentos. Com isso, a
casualização evita que determinado tratamento seja favorecido e garante que os erros sejam
independentes.
Princípio da Experimentação

Casualização
Probabilidade

Repetição *

Estatística
Controle local

* Os tratamentos devem ser repetidos, possibilitando, assim, estimar o erro experimental


sem o qual não seria possível realizar testes de hipóteses. O uso de um número adequado
de repetições, possibilita uma boa estimativa do erro experimental, melhorando as
estimativas de interesse.
Princípio da Experimentação

Casualização
Probabilidade

Repetição

Estatística
Controle local*

* - Partição do conjunto total de parcelas em subconjuntos (blocos) que sejam os mais


homogêneos possíveis.
- Este princípio é utilizado para atenuar problemas de heterogeneidade ambiental (por
exemplo de solo, de distribuição de água no caso de experimentos irrigados, etc).
Experimentação em Laboratório

Água Coca-Cola
Massa: 125 gramas
Massa: 395 gramas
Trabalho Científico
Estrutura de um Trabalho Científico

Introdução
Revisão de Literatura

Justificativa
Objetivos

Hipóteses
Amostragem / Teste e
Materiais e Métodos
Análise Estatística
Resultados e Discussão

Conclusões
Referências
Pesquisa de Opinião
Viés
Erro tendencioso Diferença sistemática entre as
características dos indivíduos da
Erro sistemático amostra e da população.

Evita semelhanças
Erros de coleta

Erro sistemático: a diferença entre a média de um número considerado


suficiente de medições e o resultado verdadeiro esperado.
Amostragem

Altura (m) – Frequência


Área
Amostra Ótima
= Variável Altura (m)
Amostragem

Quantos indivíduos utilizar para meu experimento?


Erro Amostral
Erro Amostral: é a diferença entre um resultado amostral e o verdadeiro resultado
populacional; tais erros resultam de flutuações amostrais aleatórias.
Ocorrem erros amostrais, quando:
• Os dados amostrais são coletados, registrados ou analisados incorretamente.
• Há uma utilização de um instrumento defeituoso durante a realização de
mensurações.
• Um questionário ou formulário possui questões formuladas de modo
tendencioso [Triola, 1999].
Tamanho da Amostra
O Poder das Estatísticas
Amostragem
1. Amostras Aleatórias Simples

Quem gosta de
matemática?

1.1. Sem reposição


1.2. Com reposição N =12 Alunos / n = 5 responderam
Amostragem
2. Amostras Sistemáticas

Quem gosta de
matemática?

É um processo em que selecionam os sujeitos a


incluir na amostra utilizando um critério
aplicado de forma sistemática a uma lista com
os nomes dos sujeitos incluídos na população
(por exemplo, uma lista telefónica, uma pauta
com o nome dos alunos de um curso,…)., N = 12 Alunos / n = 4 responderam / k = 2
Amostragem
3. Amostras Estratificadas

Escola Urbana Escola Rural

N = 24 Alunos N = 24 Alunos
n = 6, nf = 3 e nm = 3 n = 6, nf = 3 e nm = 3
k=2 k=2
Amostragem
4. Amostras Conglomerados

Critérios hierárquicos de sorteios

Exemplo:: Antigo Provão ENADE

200 Universidades
80 Cursos de Biologia (Licenciatura) N = 3.200

40 Alunos

n = 200
UNIVERSIDADE FEDERAL DE PERNAMBUCO
CENTRO DE BIOCIÊNCIAS
DEPARTAMENTO DE BIOFÍSICA E RADIOBIOLOGIA

BIOESTATÍSTICA
Estatística Descritiva

Paulo E. Cabral Filho

pauloeuzebio03@gmail.com
Recife, 2017
Estatística Descritiva
1. Dados Quantitativos

Variável Mensurável Variável Não-mensurável


(unidade métrica) (presença ou ausência – binário)

1.3 m Homem (0) e Mulher (1)

Tamanho do aluno
Sim (0) e Não (1)

Quem gosta de matemática?


Estatística Descritiva
1. Dados Quantitativos

Grupo Amostral

Homem Mulher
Controle Experimental

Plantas do Cerrado Plantas da Praia


Estatística Descritiva
2. Dados Qualitativos

Qualificam a população

Numérica
25% não
Não - numérica
comem de Pizza

Pesquisa Qualitativa

75% comem de Pizza


Estatística Descritiva
1. Médias Dados
Dados
ordenados
Aritmética = 5,7 7 2
7 3
7 4
Harmônica = 4,7
5 5
6 5
Geométrica = 5,3 9 6
5 7
8 7
2. Moda 3 7
4 8
3. Mediana
2 9
4. Amplitude total = (valor máximo – valor mínimo)
Estatística Descritiva
1. Médias

5 8 5 62 5 11 5 7
Volume de Madeira (m3)

MA
MG
MH

5 5 5 5 7 8 11 62
Estatística Descritiva
1. Médias

MA = 75kg

56 94 66 85 98 67 49
Peso (kg)

MA = 75kg

54 54 54 54 54 54 205
Estatística Descritiva
1. Médias

Vantagens da média
1. Seu cálculo leva em consideração os valores de todos indivíduos estudados;
2. É utilizada em boa parte dos testes estatísticos para calcular diferenças em um
estudo;
3. É mais facilmente compreendida pelos leitores e pesquisadores.

Desvantagens da média
1. É influenciada por valores extremos (conforme mencionado anteriormente);
2. Só deve ser utilizada quando a distribuição dos dados for simétrica (normal ou
Gaussiana)
Estatística Descritiva
2
4. Variância
Posição na coleta

5. Desvio-padrão
Quantifica variabilidade na população.
6. Erro Padrão
Quantifica a incerteza na estimativa da média.
7. Coeficiente de Variação (%)

Karl Pearson
1901
N = 20

3 4 5 6 7 8 9 10
Notas de Bioestatística
Estatística Descritiva
7. Coeficiente de Variação (%)

N = 20 Variável 1

3 4 5 6 7 8 9 10
Notas de Bioestatística
Variável 1 > Variável 2

Variável 2
N = 20

3 4 5 6 7 8 9 10
Estatística Descritiva
8. Coeficiente de Assimetria

N = 20

3 4 5 6 7 8 9 10
Notas de Bioestatística
9. Curtose

leptocúrtica
mesocúrtica
platicúrtica
Estatística Descritiva
11. Percentil

25% da média – 1°

75% da média – 3°
Média – 2°
Média – Desvio Padrão Média + Desvio Padrão

N = 20
Aluno

3 4 5 6 7 8 9 10
Notas de Bioestatística
Desvio interquartítico = 3°
3° Percentil – 1° Percentil
Estatística Descritiva
Estatística Descritiva
Estatística Descritiva - Exercício
1) Os níveis de ácido úrico em (mg/100mL), encontrados nos exames
bioquímicos de sangue de 10 pacientes do Laboratório de pesquisas
clínicas do Hospital escola da FMIt, são os seguintes:

Paciente AJF CHJ WT APC MD SEG HS BET RM CR


Ácido úrico 4,0 5,2 6,5 5,0 4,5 9,0 5,5 4,5 6,0 7,0

- Com base nestas informações, pede-se:


a) Calcule a taxa média de ácido úrico no sangue dos 10 pacientes;
b) Calcule a mediana dos valores referidos no quadro;
c) Calcule a moda das taxas de ácido úrico;
d) Qual das três MTC poderia ser convenientemente adotada como
valor típico ou referencial do grupo de pacientes? Porque?
Estatística Descritiva - Exercício
2) A carga viral de HIV-1 é um fator de risco conhecido como
transmissão sexual de HIV; pessoas com cargas virais maiores de
HIV-1 tem probabilidade significativamente maior de transmitir
vírus para seus parceiros não infectados. Thomas Quin e
colaboradores estudaram essa questão medindo a quantidade de
RNA de HIV-1 detectada no soro sanguíneo. Os dados a seguir
representam os níveis de RNA de HIV-1 no grupo cujos parceiros
tornaram-se soropositivos, significando que um parceiro não
infectado inicialmente se tornou HIV positivo durante o
desenvolvimento do estudo; 79,725, 12.862, 18.022, 76.712,
25.644, 14.013, 46.083, 6.808, 85.781, 1.251, 6.081, 50.397, 11.020,
13.633, 1.064, 496, 433, 25.308, 6.616, 11.220, 13900 cópias de
RNA/mL. Encontre a média, a mediana e o desvio-padrão dessas
concentrações.

Potrebbero piacerti anche