Sei sulla pagina 1di 87

ESTATÍSTICA I

Estatística I

Definição
Antonio A. Crespo define Estatística como :
 
Estatística é uma parte da matemática
aplicada que fornece métodos para a coleta,
a organização, a descrição, a análise e a
interpretação de dados quantitativos e
qualitativos, e a utilização desses dados para
a tomada de decisão.
Análise Exploratória de Dados

Introdução

População Técnicas de Amostra


(características) Amostragem

Análise
Exploratória

Conclusões Informações
sobre as Inferência
contidas nos
características dados
Estatística
da população
Análise Exploratória de Dados

Utilidade da Estatística na Gestão

Estatística permite:

Resolver problemas mediante a coleta de dados de boa qualidade

Argumentar utilizando dados

Analisar e interpretar dados

Detectar situações fora de controle e outras fontes de dificuldades que

requerem atenção e medidas corretivas

Coletar evidências para fins legais

Determinar ociosidade de recursos e eficiência na utilização dos


Análise Exploratória de Dados

Algumas Dificuldades com a Estatística

• Culturais / Rejeição às "matemáticas" / Contato


prematuro inadequado

• “Invisibilidade” da Estatística

• Armadilha da atividade
Método Estatístico

O método estatístico, diante da


impossibilidade de manter as causas
constantes, admite todas as causas
presentes variando-as, registrando essas
variações e procurando determinar, no
resultado final, que influências cabem a
cada uma delas.
MÉTODO ESTATÍSTICO
As fases são :
• Coletas de dados : é a obtenção, reunião e registro sistemático de
dados, com um objetivo determinado.
• Direta : quando é obtida diretamente da fonte e pode ser :
- Contínua : Obtida ininterruptamente
- Registro de nascimentos, etc.
- Periódica : em períodos curtos
- Censos
- Ocasional : esporadicamente
- Surto epidêmico
• Indireta : Quando é inferida ( deduzida ) a partir dos elementos
conseguidos pela coleta direta
- Mortalidade infantil
MÉTODO ESTATÍSTICO

Crítica dos dados : devem ser criticados à procura de


erros grosseiros ou de certos vultos, que possam influir
sensivelmente nos resultados como:

- Externa : Informante

- Interna : dados da coleta

Apuração dos dados :é a soma e o processamento dos


dados obtidos e a disposição mediante critérios de
classificação.
MÉTODO ESTATÍSTICO

Exposição dos dados : devem ser apresentados sob forma de


tabelas ou gráficos tornando mais fácil e
compreensão do objeto de tratamento
estatístico

Análise dos resultados : É o estudo dos resultados com o objetivo


de tirar conclusões sobre o todo
(população), a partir de informações
fornecidas por parte representativa do
todo ( amostra).
População e Amostra

População : é o conjunto de entes


portadores de , pelo menos, uma
característica comum

Amostra : é um subconjunto
finito de uma população
POPULAÇÃO E AMOSTRA
Devido a quantidade excessivamente grande de elementos
que constantemente fazem parte da população,
trabalhamos com uma amostra.
O aspecto comum dentre todas as técnicas existentes é a
aleatoriedade, isto é, a igual chance que cada elemento da
população deve ter de ser escolhido, as principais:

a) Casual Simples - sorteio


b) Sistemática - Os elementos já se encontram
ordenados e então, sorteamos um número e
sistematicamente os outros ficam determinados
c) Estratificada - Quando a população esta dividida em
estratos de acordo com o fato em estudo
Variável
Variável - é convencionalmente, o conjunto de
resultados possíveis de um fenômeno Tipos de
variáveis
Nominais

Qualitativas

Ordinais

Variáveis

Discretas
Quantitativas

Contínuas
Variável

Exemplo ( Variáveis em uma ficha cadastral PF )

  Variável Tipo
1 Número de dependentes   Quantitativa, discreta
2 Idade   Quantitativa, contínua
3 Local de nascimento   Qualitativa, nominal
4 Nível educacional   Qualitativa, ordinal
5  
6  
7  
8  
Variável
DISCRETA - É uma representação tabular de um conjunto de
valores em que colocamos na primeira coluna em ordem crescente
apenas os valores distintos de série e na segunda coluna
colocamos os valores das freqüências simples correspondentes.
Devemos optar por uma variável discreta na representação de uma
série de valores quando o número de elementos distintos da série
for pequeno
xi = número de fi = freqüência
filhos absoluta

0 1
1 5
2 6
3 10
total 22
Variável
CONTÍNUA - É uma representação tabular de um conjunto de
valores em que colocamos na primeira coluna faixa de valores
agrupados em ordem crescente da série e na segunda coluna
coloca os valores das freqüências simples correspondentes.
Devemos optar por uma variável contínua na representação de uma
série de valores quando o número de elementos distintos da série
for grande.
xi = número de fi = freqüência
filhos absoluta
2 /------ 4 4
4 /------ 6 12
6 /------ 8 10
8 /------ 10 4
total 30
Conceitos a serem aplicados
- Amplitude total de uma seqüência = é a diferença entre o Limite
superior e o Limite inferior de uma seqüência. At = Ls – Li
- Intervalo de Classe = é qualquer subdivisão da amplitude total de
uma série estatística. 2 /------ 4
- Limite de Classe = cada intervalo de classe fica caracterizado por
dois números reais. O menor valor chamado de Limite inferior (Li)
da classe e o maior valor chamado de Limite superior (Ls) da
classe. 2 = Li e 4 = Ls
- Amplitude do intervalo de classe = é a diferença entre o Ls e o Li
do intervalo de classe. A = Ls – Li  4-2 = 2  A = 2
- Freqüência simples ou absoluta de uma classe (fi) = é o número
de elementos da seqüência que são maiores ou iguais ao Li desta
classe e menores que o Ls desta classe.
Distribuição de Freqüências

Freqüência Relativa (fir%) = é a divisão


da freqüência simples deste elemento
pelo número total de elementos da série:
fir = fi / n onde n ou somatória de fi,
é o número total de elementos da série.
Ex: fir = 4 / 30 = 0,1333 ou 13,33%
Distribuição de Freqüências

Freqüência Acumulada (fiac) = é a


soma de fi simples deste elemento
com as fi dos elementos que o
antecedem.
fiac = fi1 + fi2 + fi3 ...fin
Freqüência acumulada relativa
(firac%) = é a divisão da freqüência
acumulada deste elemento pelo
número total de elementos da série.
Distribuição de Freqüências

xi fi fir% fiac firac%

0 1 3,33 1 3,33
1 5 16,67 6 20,00
2 6 20,00 12 40,00
3 10 33,34 22 73,34
4 4 13,33 26 86,67
5 4 13,33 30 100
Total 30 100    
Distribuição de Freqüências
xi fi fir% fiac firac%

2 /------ 4 4 13,33 4 13,33

4 /------ 6 12 40,00 16 53,33

6 /------ 8  10 33,34 26 86,67

8 /------ 10 4 13,33 30 100

Total 30 100    
         
         
Representação Gráfica -
Histograma
0,34
0,35

0,3
0,26

0,25

0,2
Proporção

0,16

0,15
0,12

0,1

0,04 0,04
0,05
0,02 0,02

0
5,5 13,5 21,5 29,5 37,5 45,5 553,5 61,5

Tributo ( % faturam ento )


Representação Gráfica -
Histograma
istograma

rea = 1.00 ( ou 100% )

rea ~ freqüência ( f ou p )

lasses de mesma amplitude : altura ~ freqüência ( f ou p )

otas :

Histograma é a representação gráfica adequada para o caso de


variáveis contínuas
Representação Gráfica
Polígono de % acumulada

100

90

80

70
% acumulada

60

50

40

30

20

10

0
1.5 9.5 17.5 25.5 33.5 41.5 49.5 57.5 65.5

Tributo ( % faturamento )
Representação Gráfica
Polígono de % acumulada

ostra a porcentagem de empresas cujo recolhimento


de tributos é menor ou igual a um dado valor

odemos ter também:

Polígono de freqüências acumuladas

Polígono de proporções acumuladas 


Alguns Padrões de Histogramas
Alguns Padrões de Histogramas
Alguns Padrões de Histogramas
Alguns Padrões de Histogramas
Alguns Padrões de Histogramas
Alguns Padrões de Histogramas
Medidas de Tendência Central

• Tendência Central de um conjunto de


dados é a tendência das medidas destes
dados em se acumular em torno de certos
valores numéricos.
Medidas de Tendência Central

• É a soma das medidas dividida pelo número


de elementos do conjunto de dados.
• Vantagens – reflete cada valor e possui
propriedades matemáticas atraentes.
• Limitações – é influenciada por valores
extremos.
Medidas de Tendência Central

Exemplo :
• Calcule a média dos seguintes grupos de
dados:
1, 2, 3, 4, 5
n e
∑ xi 2, 3, 3, 3, 4

x= i =1
n
Medidas de Tendência Central

Mediana - Para números aleatórios


• É o valor intermediário de um conjunto de medidas
colocadas em ordem crescente (ou decrescente).
Vantagens - muito interessante para grande
massa de dados
- divide a área do histograma em partes iguais.
- menos suscetível a valores extremos.
Limitações – difícil de determinar para grande
quantidade de dados.
Medidas de Tendência Central

Média e Mediana
Sua comparação indica a assimetria da distribuição.

Média Mediana
Medidas de Tendência Central

Moda - Para números aleatórios

• É a medida que ocorre com maior freqüência no


conjunto de dados.

– Exemplo:
notas de degustadores de vinho:
8, 7, 9, 6, 8, 10, 9, 9, 5, 7.
Moda: 9
Medidas de Tendência Central
Moda
• Vantagens
- indica onde os dados tendem a se concentrar.
- útil para dados qualitativos (Ex. notas de jurados).
- pode haver mais de uma ou não ter sentido (Ex.
pesquisa de lazer).

• Limitações
- não se presta a análise matemática;
- pode não ser moda para certos conjuntos de dados.
Medidas de Tendência Central

Exemplo:

• Preferência do produto A (em %) colhida em diversas


regiões do Brasil por meio de uma pesquisa de
mercado.
56, 63, 64, 65, 66, 69, 71, 57,
64, 66, 64, 65, 66, 66, 68 e 72.
N = 16
Σ x = 1042

Média = 65,125
Mediana = 65,5
Moda =66
Medidas de Tendência Central
Média Para variáveis discretas
• Se os dados estão apresentados na forma de uma variável
discreta, utilizamos a média ponderada, considerando as
freqüências (fi) como sendo as ponderações dos elementos
(xi) correspondentes.

xi = número de fi = freqüência fi *
filhos absoluta xi
0 1 0
Média =
1 5 5 47 / 22 =
2 6 12
3 10 30 2,14 filhos
total 22 47
Medidas de Tendência Central

Mediana para variáveis discretas


• Para encontrarmos a mediana, dividimos por dois o total das
freqüências absolutas ( 22 / 2 = 11) e calculamos a Freqüência
acumulada (fiac)
• Procuramos qual xi que conta o número (11) na Fi xi = 2

xi = número de fi = freqüência fiac


filhos absoluta
0 1 1
1 5 6 Mediana
Mediana = 2 6 12 =2
3 10 (11)
22 filhos
total 22
Medidas de Tendência Central

Moda para variáveis discretas


• Para encontrarmos a moda, basta verificar o elemento xi de maior
freqüência (fi).

xi = número de fi = freqüência
filhos absoluta
0 1
1 5 Moda = 3 filhos
2 6
Moda = 3 10
total 22
Medidas de Tendência Central

Média para variáveis contínuas


Se os dados estão apresentados na forma de uma variável
contínua,utilizaremos a média aritmética ponderada, considerando as
freqüências (fi) de cada classe ponderando com o ponto médio destas
classe. PM = ((Li + LS) / 2)
Média = Somatória de PM*fi / somatória de fi
 178 / 30 = 5,93 filhos
xi = número de Ponto fi = PM * fi
filhos Médio freqüência
2 /------ 4 (PM)
3 absoluta
4 12
4 /------ 6 5 12 60
6 /------ 8 7 10 70
8 /------ 10 9 4 36
total 30 178
Medidas de Tendência Central
Mediana para variáveis contínuas
• Para encontrarmos a mediana, dividimos por dois o total das freqüências
absolutas ( 30 / 2 = 15) e calculamos a Freqüência acumulada (fiac)
•Procuramos qual xi que conta o número (15) na fiac  xi = 4 /---6
Este será o intervalo que usaremos como base para resolvermos a fórmula
da mediana.
xi = número de fi = freqüência fiac
filhos absoluta
2 /------ 4 4 4
4 /------ 6 12 16
6 /------ 8 10 (15)
26
8 /------ 10 4 30
total 30
Medidas de Tendência Central

Mediana para variáveis contínuas


• Fórmula da Mediana para variáveis contínuas

n / 2 − fiacant
md = Li + .h
Onde : fi
Li = Limite inferior do intervalo de classe  4
n = Total de fi  30
fiacant = freqüência acumulada anterior ao intervalo de
classe  4
fi = freqüência do intervalo de classe  12
h = amplitude da classe = Ls – Li  6 – 4 = 2
Medidas de Tendência Central

Mediana para variáveis contínuas


• Então : 30 / 2 − 4
md = 4 + .2
12
md = 5,83

Obs: o valor obtido pela fórmula é um valor


aproximado
Medidas de Tendência Central
Moda para variáveis contínuas
• Fórmula da Moda para variáveis contínuas
fipost
mo = Li + .h
fipost + fiant
Onde :
Li = Limite inferior do intervalo de classe  4
fipost = freqüência absoluta posterior ao intervalo
de classe  10
fiant = freqüência absoluta anterior ao intervalo de
classe  4
h = amplitude da classe = Ls – Li  6 – 4 = 2
Medidas de Tendência Central

Moda para variáveis contínuas


Então:

10
mo = 4 + .2
10 + 4
mo = 5,43
Exercícios de aplicação
Medidas de Dispersão

• São medidas estatísticas utilizadas para avaliar o grau


de variabilidade ou dispersão, dos valores em torno da
média. Servem para medir a representatividade da
média.

• Desvio Médio
• Variância
• Desvio-Padrão
• Coeficiente de variação
Medidas de Dispersão

• Desvio Médio = é a média dos desvios dos


valores a contar de média. Ignorando-se o sinal
de diferença

∑ xi − x .fi
DM =
n
Medidas de Dispersão

• Variância = é a média dos quadrados dos


desvios dos valores a contar da média,
calculada usando-se n-1 em lugar de n, como
fator de ajuste.

2
S =
∑( xi −x )
2

.fi
n −1
Medidas de Dispersão

• Desvio-padrão = é simplesmente a raiz


quadrada positiva da variância.

s= s 2
Medidas de Dispersão

• Coeficiente de variação = trata-se de uma medida


relativa de dispersão útil para a comparação em
termos relativos do grau de concentração em torno
da média de séries distintas.

S
CV = .100
X
Medidas de Dispersão
xi = fi xi * xi - x /xi-x/ * (xi-x)2 *
número fi fi fi
de filhos
0 1 0 -2,14 2,14 4,58
1 5 5 -1,14 5,7 6,50
2 6 12 -0,14 0,84 0,12
3 10 30 0,86 8,6 7,40
total 22 47 17,28 18,6
Média=2,
14=
DM 0,79
S2 = 0,89
S= 0,94
CV = 43,93
%
Para variáveis contínuas xi = PM
Exercícios de aplicação
Probabilidade

•Freqüência e probabilidade

•Eventos

•Definição subjetiva de probabilidade


Freqüência é o percentual de ocorrencia de uma
determinada observação dentro de uma amostra

Resultados do lançamento de um dado (n=10 lançamentos)


Resultado Número de ocorrências Freqüência
do dado do resultado (f) (f/n)

1 1 0,1 ou 10%
2 0 0
3 1 0,1 ou 10%
4 2 0,2 ou 20%
5 3 0,3 ou 30%
6 3 0,3 ou 30%
A medida que a amostra cresce, a freqüência se
estabiliza: temos então a probabilidade
Resultados do lançamento de um dado
n = 50 lançamentos n=∞
Resultado  Núm. de ocorrências  Freq.  Número de ocorrências  Freqüência
do dado do resultado (f) Rela(f/n) do resultado (f) (f/n)

1 11 0,22 ou 22% 1/6 * n 16,7%

2 6 0,12 ou 12% 1/6 * n 16,7%

3 7 0,14 ou 14% 1/6 * n 16,7%

4 7 0,14 ou 14% 1/6 * n 16,7%

5 7 0,14 ou 14% 1/6 * n 16,7%


16,7%
6 12 0,24 ou 24% 1/6 * n

Portanto, a probabilidade pode ser encarada como o limite da freqüência


de um determinado evento dentro da população em estudo
A freqüência pode ser representada graficamente

Representação gráfica dos resultados obtidos no lançamento


repetido de um dado (n = número de lançamentos)
0,4

n = 10 n = 50 n = infinito

0,3

0,2

0,1

0,0
1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6
Probabilidade

• Freqüência e probabilidade
• Eventos
– Representações gráficas
– Compostos
– Condicionais
– Dependentes e independentes
• Definição subjetiva de probabilidade
Formas de representação gráfica de eventos

Diagrama de árvore Diagrama de Venn


A árvore permite a representação exaustiva dos
eventos

Representação dos eventos possíveis para o sexo de


cada criança de um casal que tenha três filhos

Resultado
Criança 1 Criança 2 Criança 3
final

M M, M, M
M F M, M, F
M M, F, M
M
F
F M, F, F
M M F, M, M
F F F, M, F
M F, F, M
F
F F, F, F
O diagrama de Venn é adequado ao agrupamentos dos
eventos de interesse

Agrupamento de casais segundo o sexo dos filhos

Casais com
meninos somente Casais com
meninas somente

Casais com
meninos e meninas
A combinação dos diagramas de árvore e de
Venn permite representações mais complexas
Agrupamento de casais com quatro filhos e pelo menos duas meninas
M M, M, M, M
M
F M, M, M, F
M
M M, M, F, M
F
F M, M, F, F
M M M, F, M, M
M
F M, F, M, F Agrupamento
F dos resultados
M M, F, F, M
F que apresentem
F M, F, F, F ao menos
duas meninas.
M F, M, M, M
M
F F, M, M, F
M
M F, M, F, M
F
F F, M, F, F
F M F, F, M, M
M
F F, F, M, F
F
M F, F, F, M
F F, F, F, F
F
Dependência e independência são termos que
obedecem a regras precisas

Exemplo de evento independente


Probabilidade de ocorrência do número 6 em um lançamento de dado,
condicionado ao resultado anterior ter sido 3.
Resultado 1 Resultado 2 Probabilidade

3 1 1/6
2 1/6

Lançamento 3 1/6
já realizado 4 1/6
e resultado 5 1/6
conhecido!
6 1/6

•O resultado conhecido do primeiro lançamento não altera a probabilidade de


ocorrência do número 6 no segundo lançamento
•Mais formalmente, o evento B é independente se: P(B) = P(B | A)
Dependência e independência são termos que
obedecem a regras precisas

Exemplo de evento dependente


•Probabilidade de uma pessoa consumir requeijão e manteiga,
dado que ela consome manteiga
R∩M = 50 •P(R∩M) = 50/300 = 
1/6
130 200 •P(R∩M | M) = 
(50/300) / (200/300) = 
1/4
Requeijão (R) Manteiga (M)
Não é consumidor: 20

•O resultado conhecido do consumo de manteiga altera a probabilidade


de ocorrência do consumo dos dois produtos
Mais formalmente, o evento B é dependente se:P(B) ≠ P(B | A)
Eventos compostos são formados por dois ou mais eventos

Exemplos de eventos compostos

• Um casal com três crianças ter somente meninos

• Um casal com três crianças ter uma ou duas

meninas

• Um consumidor comprar requeijão e manteiga


O termo eventos condicionais indica que a ocorrência
de um está condicionada à do outro

Descrição do caso Manteiga


• Uma pesquisa com 300 Tabela de To-
pessoas, realizada em um respostas tal
Sim Não
supermercado, teve os
seguintes resultados:
– 130 pessoas consomem
requeijão Sim 50 80 130
– 200 pessoas consomem
Requei-
manteiga jão
– 50 pessoas consomem os
dois produtos Não 150 20 170
– 20 pessoas não consomem
nenhum dos dois
• Sabendo que uma pessoa Total 200 100 300
escolhida ao acaso é
consumidora de manteiga, qual
Em casos como esse, uma parte da incerteza já foi
eliminada
Após a escolha do consumidor Antes da escolha do consumidor
R∩M = 50 R∩M = 50

130 200 200

Requeijão (R) Manteiga (M) Manteiga (M)


Não é consumidor: 20
•Probabilidade de a pessoa ser 
•Probabilidade de a pessoa ser 
consumidora dois produtos, condicionado a 
consumidora dois produtos: P(R∩M) =  ela consumir manteiga: P(R∩M | M) = 
50/300 = 1/6  50/200 = 1/4 
Neste caso, a incerteza é total.  Você não  Sinal “condicionado a”
sabe nada sobre a pessoa que foi escolhida. 
 Portanto, a probabilidade de que ela  •Neste caso, você sabe que pessoa consome 
consuma os dois produtos é simplesmente a  manteiga, portanto os outros grupos de 
freqüência de ocorrência desse tipo de  consumidores não devem ser considerados 
consumidor na amostra no cálculo.  Em outras palavras, uma parte 
da incerteza foi eliminada.
Às vezes, não se pode determinar a probabilidade de um
evento, ou pode ser muito demorado e custoso fazê-lo
Exemplos de eventos cuja probabilidade de ocorrência não pode ser
(facilmente) determinada
Evento Comentário

• Probabilidade não pode ser determinada


Probabilidade de um time ganhar de
outro em uma partida de futebol

• Probabilidade de o mercado Probabilidade não pode ser determinada


acionário subir amanhã
Probabilidade pode ser estimada através de
• Probabilidade de o lançamento de pesquisa de mercado, porém:
um novo produto ser um sucesso Estudo pode ser muito caro
Pesquisa não fornece, nem pode
fornecer, 100% de certeza sobre o
resultado do lançamento do produto
Probabilidade

• Distribuição de probabilidade
• Distribuições descontínuas de probabilidade
– Binomial
– Poisson
• Distribuições contínuas de probabilidade
– Normal
Probabilidade

• Distribuição de probabilidade

– Uma distribuição de probabilidade é


uma distribuição de freqüências para
os resultados de um espaço amostral
(isto é, para os resultados de uma
variável aleatória).
Probabilidade

• Distribuições descontínuas de probabilidade


– Binomial – Usa-se o termo binomial para
designar situações em que os resultados de
uma variável aleatória podem ser agrupados
em duas classes ou categorias.
– A utilização da binomial, exige certas hipótese
como:
• Há n observações ou provas idênticas
• Cada prova tem dois resultados possíveis, um
chamado “sucesso” e o outro “fracasso”.
• As probabilidades p de sucesso e 1 – p de fracasso
permanecem constantes em todas as provas.
• Os resultados das provas são independentes uns dos
outros.
Probabilidade

• Distribuições descontínuas de probabilidade


– Fórmula da Binomial

n x n-x
P( x) =   p ( sucesso). p ( fracasso)
 x
Onde:
n = numero de amostras
x = número de sucesso
p(s) = percentual de sucesso
p (f) = percentual de fracasso
Exemplo

• Binomial – suponha que 8% dos


cachorros-quentes vendidos num
estádio de beisebol sejam pedidosn-xsem
x
mostarda. Se sete pessoas pedem
cachorro-quente, determine a
probabilidade de que:
– Todos queiram mostarda
– Apenas um não queira
Exemplo

7  0 7
a- P ( x ) = 
0 (0,08).(0,92) =
  0,5578

7 
1 6
P ( x ) = 
1 (0,08).(0,92) =
b-  
0,3396
Probabilidade

• Distribuição de probabilidade
• Distribuições descontínuas de probabilidade
– Poisson – É útil para descrever as probabilidades
do número de ocorrências num campo ou intervalo
contínuo (em geral tempo ou espaço).
– A utilização da Poisson, exige certas hipótese
como:
• A probabilidade de uma ocorrência é a mesma
em todo o campo de observação.
• A probabilidade de mais de uma ocorrência num
único ponto é aproximadamente zero.
• O número de ocorrências em qualquer intervalo
é independente do número de ocorrências em
outros intervalos.
Probabilidade

• Distribuição de probabilidade
• Distribuições descontínuas de probabilidade
– Formula de Poisson


− (µ )x
P ( x) =
x
!
Onde: µ = média

x = número de ocorrências

e =µ
− valor tabelado
Exemplo

Poisson – Uma mesa telefônica recebe chamadas a razão de


4,6 chamadas por minuto. Determine a probabilidade de
cada uma das ocorrências abaixo:
1- Exatamente 2 chamadas
2 -Nenhuma chamada
2
0,0101( 4,6)
P( x) = =
•1 2 ! 0,1063

0
0,0101( 4,6)
•2 P( x) = =
0 ! 0,0101
Probabilidade

• Distribuições contínuas de probabilidade


– Normal – É a mais importante distribuição de probabilidade,
sendo aplicada em inúmeros fenômenos e utilizada para
desenvolvimento teórico da estatística.
– As características das curvas normais são:
• A curva normal tem forma de sino
• É simétrica em relação a média
• Prolonga-se de – infinito a + infinito
• Cada distribuição normal fica completamente
especificada por sua média e seu desvio padrão; há uma
distribuição normal distinta para cada combinação de
média e desvio padrão
• A área total sob a curva normal é considerado 100%
• A área sob a curva entre dois pontos é a probabilidade
de uma variável normalmente distribuída tomar um
valor entre esses pontos
Probabilidade

• Distribuições contínuas de probabilidade


– Normal Fórmula população
amostra

( x − x) ( x −µ)
z= z=
s σ
Onde:
Z= número de desvios padrões a contar da média
X = valor arbitrário
σ = o desvio padrão
µ = a média da distribuição normal
Exemplo

Normal – dado que uma população com média 25 e desvio


padrão 2 tem distribuição normal, determine os valores de z
para os seguintes valores da população:
a) 23,0
b)25,5
( 23 − 25) ( 25,5 − 25)
z= z=
2 2
z =−1,0 z =+0,1
Corresponde a 0,3413 ou Corresponde a 0,0398
34,13% da área sobre a ou 3,98% da área sobre
curva normal ou a a curva normal ou a
probabilidade, conforme probabilidade, conforme
tabela z tabela z
Desvio padrão : interpretação

• Regra de Chebyshev:
• Ao menos 3/4 estará dentro de 2 s.
• Ao menos 8/9 estará dentro de 3 s.
• P/ k>1, ao menos (1-1/k2) das medidas cairá dentro de k
desvios-padrão.

• Distribuição Normal
• Aproximadamente 68% das medidas caem dentro de 1 s.
• Aproximadamente 95% das medidas caem dentro de 2 s.
• Aproximadamente 99,7% das medidas caem dentro de 3 s.
• Aplicações de todos os conceitos
estudados em exercícios
práticos........