Sei sulla pagina 1di 73

EMENTA: Estatstica Descritiva; Clculo de Probabilidade;

Distribuies Amostrais; Estimao e Teste de Hiptese;



Amostragem.




Prof. MSc. MRCIO COUTO


FEDERAL DO AMAZONAS - COARI
INSTITUTO DE SADE E BIOTECNOLOGIA- ISB
PROBABILIDADE E ESTATSTICA

CONCEITO

Estatstica a cincia dos dados.
Envolve a coleta, a classificao, o
resumo, a organizao, a anlise e a
interpretao da informao numrica
oriunda de estudos ou experimentos,
realizado em qualquer rea do
conhecimento.
Populao: trata-se do conjunto de
indivduos ou objetos que apresentam em
comum determinadas caractersticas
definidas para o estudo. O tamanho da
populao (N) a quantidade de elementos
da populao.
Amostra: o conjunto dos elementos
extrados parcialmente da populao, e
que representar esta populao.



CONCEITO

CONCEITO

A Estatstica dividida em duas grandes reas:
Estatstica Descritiva utiliza mtodos
numricos e grficos para mostrar os
padres de comportamento dos dados, para
resumir a informao contida nesses dados
e para apresentar a informao de forma
conveniente.
Inferncia Estatstica utilizar dados de
amostras para obter estimativas sobre a
populao.
Portanto, varivel o conjunto de
resultados possveis de um fenmeno.

Uma varivel pode ser:
VARIVEIS
QUANTITATIVA
DISCRETA N de alunos
reprovados por perodo
CONTNUA Notas dos alunos
QUALITATIVA
NOMINAL Disciplinas do curso
ORDINAL Titulao dos
professores
TABELAS

Um dos objetivos da Estatstica
sintetizar os valores que uma ou
mais variveis podem assumir,
para que tenhamos uma viso
global da variao dessa ou dessas
variveis.
E isso ela consegue, inicialmente,
apresentando esses valores em
tabelas e grficos.
Exemplo:
Componentes das Tabelas

Tabela compe-se de:
Corpo conjunto de linhas e colunas que contm
informaes sobre a varivel em estudo;
Cabealho parte superior da tabela que especifica o
contedo das colunas;
Coluna Indicadora parte da tabela que especifica o
contedo das linhas;
Linhas retas imaginrias que facilitam a leitura, no
sentido horizontal, de dados que se inscrevem nos seus
cruzamentos com as colunas;
Clula espao destinado a um s nmero;
Ttulo precede a tabela e explica, em poucas
palavras, o dado em estudo; Se for o caso, indica o
tempo e o lugar a que os dados se referem.
Rodap espao destinado a informaes relevantes
dos dados.
TABELAS
De acordo com a resoluo 886 da Fundao IBGE
(Instituto Brasileiro de Geografia e Estatstica), nas
casas ou clulas devemos colocar:
Um trao horizontal ( ) quando o valor zero, no
s quando natureza das coisas, como quanto ao
resultado do inqurito;
Trs pontos ( ... ) quando no temos os dados;
Um ponto de interrogao ( ? ) quando temos dvida
quanto exatido de determinado valor;
Zero ( 0 ) quando o valor muito pequeno para ser
expresso pela unidade utilizada. Se os valores so
expressos em numerais decimais, precisaremos
acrescentar parte decimal um nmero
correspondente de zeros (0,0; 0,00; 0,000).
Tabelas de Contingncia
Desempenho de alunos de Medicina por turma
na disciplina Estatstica.
Situao
Curso
Total
Medicina Turma I



Medicina Turma II

Medicina Turma III

Aprovados 44
26
35 105
Reprovados 11
26
15 52
Fonte: Fictcios
Tabelas de Distribuio de
Freqncia
GRFICOS ESTATSTICOS

O grfico estatstico uma forma de
apresentao dos dados estatsticos,
cujo objetivo o de produzir, no
investigador ou no pblico em geral,
uma impresso mais rpida e viva do
fenmeno em estudo.
GRFICOS ESTATSTICOS
A escolha do grfico mais apropriado
ficar a critrio do analista. Contudo,
os elementos: simplicidade, clareza e
veracidade, devem ser consideradas
quando da elaborao de um grfico.
Grfico de Colunas
Fonte: IBGE, Pesquisa de Assistncia Mdico-Sanitria.

Nmero de estabelecimentos de sade no Brasil 2002
0
5000
10000
15000
20000
25000
30000
Norte Nordeste Sudeste Sul Centro-Oeste
regio
e
s
t
a
b
e
l
e
c
i
m
e
n
t
o
s
Grfico de Barras
Pessoas que procuraram por servio de sade nas ltimas
semanas, segundo o motivo principal da procura - Brasil - 2003
- 500.000 1.000.000 1.500.000 2.000.000 2.500.000
Somente atestado mdico
Reabilitao
Problema odontolgico
Pr-natal ou parto
Acidente ou leso
Fonte: IBGE, PNAD 2003.
Nota: Exclusive a populao rural de Rondnia, Acre, Amazonas, Roraima, Par e Amap.


Grficos em Colunas ou em
Barras Mltiplas
Distribuio da populao residente, por grupos de idade,
segundo cobertura de plano de sade - Brasil - 2003.
80,2
75,1
70,3 70,2
19,8
24,9
29,7 29,8
0
10
20
30
40
50
60
70
80
90
100
0 a 18 19 a 39 40 a 64 65 ou mais
Idade
%
Cobertos por plano de sade No cobertos por plano de sade
Fonte: IBGE, PNAD, 2003.
Nota: Exclusive a populao rural de Rondnia, Acre, Amazonas, Roraima, Par e Amap.


Grfico de Linha
Taxa de Natalidade no Brasil
20,3
20,4
20,5
20,6
20,7
20,8
20,9
21,0
21,1
21,2
2000 2001 2002 2003 2004
anos
%
Fonte: IBGE.
Grfico de Setores
Distribuio das pessoas que tiveram atendimento
de sade nas duas ltimas semanas, por
avaliao do atendimento - Brasil - 2003
11%
3%
86%
Bom
Regular
Ruim

Fonte: IBGE, PNAD, 2003.
Nacional por Amostra de Domiclios 2003.
Notas: 1. Exclusive a populao rural de Rondnia, Acre, Amazonas, Roraima, Par e Amap.
2. Exclusive as pessoas cujo principal atendimento de sade recebido foi a marcao de consulta.
.


Diagrama de Caixa (Box Plot)

DISTRIBUIO DE FREQNCIA

Um dos objetivos da Estatstica
Descritiva, neste caso, obter uma
significativa reduo na quantidade
de dados com os quais devemos
operar diretamente.

DISTRIBUIO DE FREQNCIA
Varivel Quantitativa

Uma maneira de reduzir a quantidade
de dados agrup-los em uma tabela
chamada distribuio de freqncia.
Na construo de uma tabela de
distribuio de freqncia devemos
levar em conta a quantidade de
valores distintos do conjunto de
dados.

DISTRIBUIO DE FREQNCIA

Se a quantidade de valores distintos
pequena, ento a tabela construda
atravs de uma varivel discreta.
Porm, se a quantidade de valores
distintos for grande, ento devemos
construir a tabela atravs de uma
varivel contnua.


DISTRIBUIO DE FREQNCIA
Varivel Discreta
Exemplo: A seqncia abaixo
representa as notas dos alunos da
UFAM na disciplina complementos de
matemtica e estatstica.

Para o exemplo estabelecido, a
distribuio de freqncia :


DISTRIBUIO DE FREQNCIA
Varivel Discreta
DISTRIBUIO DE FREQNCIA
Varivel Contnua
Agora se a observao das notas de
30 alunos em uma prova nos
conduzisse aos seguintes valores:

O Critrio da Raiz

1- Nmero de Classes K n =
30 5, 477 5 K Classes = = ~
As opes para K so: 4 ou 5 ou 6.


DISTRIBUIO DE FREQNCIA
Amplitude Total de uma Seqncia
a diferena entre o maior e o menor
elemento de uma seqncia.

As notas dos alunos observamos que,

t Mx Mn
A X X =
1
2
9, 5 2, 0 7, 5
2 |---- 9,5 29
10, 0 2, 0 8, 0
2 |---- 10,0 30
t c
t c
A Pontos
Observaes
A
Observaes
= =

= =

DISTRIBUIO DE FREQNCIA
Intervalo de Classe

A amplitude do intervalo de classe(h)
dado por
8
2
4
t
A
h
K
= = =
Portanto:


DISTRIBUIO DE FREQNCIA
Varivel Contnua
Existem outros critrios para a determinao do nmero de classes,
como por exemplo, a frmula de S
TURGES
. Segundo S
TURGES,
o nmero
K de classes dado por:

A frmula de STURGES.
1 3, 3log K n = +
Para valores de n muito grandes, esta frmula apresenta mais
vantagens que o critrio da raiz embora apresente o mesmo
problema de aproximao do valor de K, o Critrio da Raiz
mais utilizada por ser mais simples.
HISTOGRAMA

O histograma um diagrama de
colunas, formado por retngulos
verticais justapostos.
Ele um grfico que apresenta
dados organizados em uma tabela
de distribuio de freqncias.
HISTOGRAMA
Exemplo: considere a distribuio de
freqncia abaixo:

HISTOGRAMA


DISTRIBUIO DE FREQNCIA
Varivel Qualitativa


Dados sobre o grau de instruo do
chefe da casa, numa amostra de 40
famlias do bairro Parque Dez.

DISTRIBUIO DE FREQNCIA
Varivel Qualitativa

Cdigos:
1 - nenhum grau completo;
2 - primeiro grau completo;
3 - segundo grau completo.
Resultados observados em cada famlia:
3 3 2 2 3 1 3 3 3 2 2 1 2 2 3
2 3 3 3 3 3 3 3 2 2 3 1 3 2 3
3 2 3 1 1 1 3 3 3 3


DISTRIBUIO DE FREQNCIA
Varivel Qualitativa

Tabela 5.1: Distribuio de freqncias do grau de
instruo do chefe da casa, numa amostra de 40 famlias
do bairro Parque Dez.

Grau de instruo
Freqncia
simples
Freqncia
relativa (%)
Nenhum 6 15,0
Primeiro 11 27,5
Segundo 23 57,5
Total 40 100,0

MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
So medidas que possibilitam
representar um conjunto de dados
relativos observao de determinado
fenmeno de forma resumida.

Existem dois tipos fundamentais de
medidas estatsticas: medidas de
posio ou tendncia central e medidas
de disperso ou variabilidade.
As trs medidas mais usadas so a mdia,
a mediana e a moda.
n
x
x
n
i
i
=
=
1
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
Mdia: a soma de todos os dados
dividida pelo nmero deles.
Exemplo: Se o faturamento anual do
setor de sade de quatro hospitais de
8,3; 9,4; 6,5 e 7,6 (em milhes) ento o
faturamento mdio por hospital de

95 , 7
4
8 , 31
4
6 , 7 5 , 6 4 , 9 3 , 8
= =
+ + +
= x
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
Mediana: o valor que ocupa a posio
central do conjunto dos dados
ordenados.

Da definio de mediana, segue-se que
essa medida um valor tal que metade
dos dados so iguais ou menores do que
ela.
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
Para calcular a mediana o processo o
seguinte:

1. Organize os dados em ordem crescente;
2. Verifique o nmero de dados no conjunto.
Se o nmero mpar, a mediana o valor
que est no centro da srie;
3. Se o nmero de dados par, a mediana
a mdia dos dois valores que esto no
centro da srie.
Exemplo: Seja o faturamento anual do
setor de sade de sete hospitais (em
milhes):

5; 6; 6; 7; 8; 9; 9

A mediana
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
7
~
= x
Exemplo: Caso tivesses apenas seis
dados,
5; 6; 6; 8; 9; 9

a mediana seria calculada da seguinte
forma:
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
7
2
8 6
~
=
+
= x
Em algumas circunstncias a mediana
descreve melhor do que a mdia a
tendncia central dos dados. o caso
dos conjuntos com dados discrepantes,
isto , dos conjuntos com um, ou alguns
valores, muito maiores ou muito
menores que os demais. Veja o exemplo
a seguir:
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
Exemplo: Seja o conjunto de dados:

1; 3; 5; 7; 9; 9; 9; 62.
125 , 13
8
105
= = x 8
2
9 7
~
=
+
= x
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
Voc pode verificar que a media
relativamente alta (13,125) quando se
considera a maioria dos dados do
conjunto.

Isto acontece por conta do valor 62, que
puxa a mdia para cima.

Mas esse valor no afeta a grandeza da
mediana (8).
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
Moda: o valor que ocorre com maior
freqncia em um conjunto de dados.
Exemplo: Seja o conjunto de dados

0; 0; 2; 5; 3; 7; 4; 7; 8; 7; 9; 6

vemos que
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
7 =
o
m
Um conjunto de dados pode no ter
moda porque nenhum valor se repete,
ou ter duas ou mais modas.
Exemplos:
a) 0; 2; 4; 6; 8; 10 amodal.
b) 1; 2; 2; 3; 4; 4; 5; 6; 7 bimodal.
2 e 4
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
=
o
m
Medidas de Disperso

A sumarizao de um conjunto de
dados, atravs de uma nica medida
representativa de posio central,
esconde toda informao sobre a
variabilidade do conjunto de valores que
nos permita, por exemplo, comparar
diferentes valores segundo algum
critrio estabelecido.
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
O critrio freqentemente usado para tal
fim aquele que mede a concentrao
em torno de sua mdia, e as medidas
mais usadas so a amplitude, a
varincia, o desvio-padro e o
coeficiente de variao.

Amplitude: a diferena entre o maior
valor e o menor valor.
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
Exemplo: Considere o faturamento
anual do setor de transporte rodovirio
de carga de seis empresas em dois anos
(em milhes US$).
A (2005): 4; 6; 4; 6; 5; 5.
B (2006): 9; 1; 5; 5; 1; 9.

A amplitude para 2005 : 6 4 = 2.
A amplitude para 2006 : 9 1 = 8.
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS

A amplitude bastante utilizada porque
fcil de entender e de calcular.

No caso deste exemplo, fcil verificar que
os conjuntos A e B tm a mesma mdia e a
mesma mediana, no entanto, B tem maior
amplitude que A.
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
Varincia: a soma dos quadrados
dos desvios de cada observao em
relao mdia dividida por n 1.
( )
1
1
2
2

=

=
n
x x
s
n
i
i
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
Quando algum fala em varincia, tanto
pode estar se referindo a varincia de
uma amostra como a varincia de uma
populao.

Mas a varincia da amostra indicada
por e a varincia da populao
indicada por , que na prtica
desconhecida.
2
s
2
o
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
Desenvolvendo algebricamente a equao
original da varincia se obtm uma
segunda frmula que permite um nmero
menor de operaes matemticas. Ento,
prefira esta segunda frmula, se voc faz
clculos mo.
( )
2
1
2 2
1
1
1
n
n
i
i
i
i
x
s x
n n
=
=
(
(
=
(

MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
Exemplo: Vamos calcular a varincia
dos dados A(2005): 4; 6; 4; 6; 5; 5.
x x
2
4 16
6 36
4 16
6 36
5 25
5 25
30 154
2
2
30
154
6
0,8
5
s

= =
Observe que a varincia
s
2
= 0,8 US$ milhes
2
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
Desvio-Padro: a raiz quadrada da
varincia.








Exemplo: o desvio-padro do conjunto A
ser
US$ milhes
( )
( )
1 1
1
2
1
2
1
2

= =
=
n
n x x
n
x x
s
n
i
n
i
i i
n
i
i
0, 8 0, 89 s = ~
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
Coeficiente de Variao:
o quociente entre o desvio-padro e a
mdia aritmtica do conjunto de dados.
100
s
CV
x
=
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
Exemplo: Numa empresa, o salrio
mdio dos homens de R$ 4.000,00,
com desvio-padro de R$ 1.500,00, e o
das mulheres em mdia de R$
3.000,00, com desvio-padro de R$
1.200,00. Ento:

Homens:

Mulheres:
1500
100 37, 5%
4000
CV = =
1200
100 40, 0%
3000
CV = =
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS


Logo, podemos concluir que os salrios
das mulheres apresentam maior
disperso relativa que os dos homens.
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
Mdia: Neste caso, convencionamos
que todos os valores includos em um
determinado intervalo de classe
coincidem com o seu ponto mdio, e
determinamos a mdia, por meio da
frmula:



onde x
i
o ponto mdio da classe.

=
i
i i
f
f X
X
MEDIDAS ESTATSTICAS
DADOS AGRUPADOS
Exemplo: Considere a
movimentao dos
custos logsticos no
Brasil (em milhes de
dlares):
(US$ milhes) f
i
x
i
x
i
f
i

60 |---- 70 1 65 65
70 |---- 80 5 75 375
80 |---- 90 6 85 510
90 |---- 100 10 95 950
100 |---- 110 12 105 1260
110 |---- 120 19 115 2185
120 |---- 130 14 125 1750
130 |---- 140 3 135 405
Total 70 - 7500
107
70
7500
~ = x
MEDIDAS ESTATSTICAS
DADOS AGRUPADOS
1. Determinamos as freqncias acumuladas;
2. Calculamos ;
3. Marcamos a classe onde est a freqncia
acumulada = classe mediana;
4. Calculamos a seguinte frmula
Mediana
2
n
2
n
MEDIDAS ESTATSTICAS
DADOS AGRUPADOS
h
f
F
n
LI x
x
ant
x

+ =
~
~
2
~
limite inferior da classe mediana.

nmero de elementos.

freqncia acumulada da classe anterior classe
mediana.

freqncia simples da classe mediana.

amplitude do intervalo de classe.
=
x
LI ~
= n
=
ant
F
=
x
f ~
= h

MEDIDAS ESTATSTICAS
DADOS AGRUPADOS
Classe
Mediana
MEDIDAS ESTATSTICAS
DADOS AGRUPADOS
(US$ milhes) f
i
F
i

60 |---- 70 1 1
70 |---- 80 5 6
80 |---- 90 6 12
90 |---- 100 10 22
100 |---- 110 12 34
110 |---- 120 19 53
120 |---- 130 14 67
130 |---- 140 3 70
Total 70 -
Exemplo:
Considere os dados
dos custos
logsticos de 70
empresas.
35
2
=
n
A mediana ser:
( )
53 , 110 10
19
34 35
110
~
=

+ = x
MEDIDAS ESTATSTICAS
DADOS AGRUPADOS
Moda :
MEDIDAS ESTATSTICAS
DADOS AGRUPADOS
1. Determinamos a classe modal;
2. Calculamos a seguinte frmula
h
f f f
f f
LI m
pos ant m
ant m
m o
o
o
o

+

+ =
) ( 2
limite inferior da classe modal.
freqncia simples da classe modal.
freqncia simples da classe
anterior classe modal.
freqncia simples da classe
posterior classe modal.
amplitude do intervalo de classe.

o
m
LI =
o
m
f =
ant
f =
pos
f =
= h
MEDIDAS ESTATSTICAS
DADOS AGRUPADOS
Classe
Modal
MEDIDAS ESTATSTICAS
DADOS AGRUPADOS
(US$ milhes) f
i
F
i

60 |---- 70 1 1
70 |---- 80 5 6
80 |---- 90 6 12
90 |---- 100 10 22
100 |---- 110 12 34
110 |---- 120 19 53
120 |---- 130 14 67
130 |---- 140 3 70
Total 70 -
Exemplo: Os
custos logsticos de
70 empresas
novamente.
A moda ser
83 , 115 10
) 14 12 ( 19 2
12 19
110 =
+

+ =
o
m
MEDIDAS ESTATSTICAS
DADOS NO AGRUPADOS
( )
(
(

=
=
n
f x
f x
n
s
n
i
i i
n
i
i i
2
1
1
2 2
1
1
Varincia:




Exemplo: Vamos calcular a varincia
dos custos logsticos das 70 empresas.
MEDIDAS ESTATSTICAS
DADOS AGRUPADOS
MEDIDAS ESTATSTICAS
DADOS AGRUPADOS
(US$ milhes) f
i
x
i
x
i
f
i
x
i
2
f
i
60 |---- 70 1 65 65 4.225
70 |---- 80 5 75 375 28.125
80 |---- 90 6 85 510 43.350
90 |---- 100 10 95 950 90.250
100 |---- 110 12 105 1.260 132.300
110 |---- 120 19 115 2.185 251.275
120 |---- 130 14 125 1.750 218.750
130 |---- 140 3 135 405 54.675
Total 70 - 7.500 822.950
A varincia



US$ milhes
2

Mas como sabemos, essa medida est
ao quadrado, ento calculamos o seu
desvio-padro
US$ milhes
MEDIDAS ESTATSTICAS
DADOS AGRUPADOS
2
2
7.500
822.950
70
280,85
69
s

= ~
280, 85 16, 76 s = ~

Potrebbero piacerti anche