Sei sulla pagina 1di 53

Capítulo 3 Slide 1

Modelos Estatísticos

Resenha
Variáveis Aleatórias
Distribuição Binomial
Distribuição de Poisson
Distribuição Normal
Distribuição t de Student
Distribuição Qui-quadrado

Ana M. Abreu - 2006/07


Resenha Slide 2

Este capítulo aborda as

distribuições de probabilidade
tendo em conta os conhecimentos de
estatistica descritiva apresentados no
Capítulo 1 e os de probabilidade
apresentados no Capítulo 2 .
As Distribuições de Probabilidade descrevem
o que provavelmente acontecerá em vez de o
que realmente aconteceu.

Ana M. Abreu - 2006/07


Definições Slide 3

Uma variável aleatória é uma variável


(usualmente representada por X) que toma
um certo valor numérico, determinado pelo
acaso, de cada vez que a experiência é
realizada.

 Uma distribução de probabilidade é


um gráfico, tabela, ou fórmula que indica
a probabilidade correspondente a cada
valor da variável aleatória.

Ana M. Abreu - 2006/07


Definições Slide 4

Uma variável aleatória discreta toma um nº


finito ou infinito numerável de valores.

Uma variável aleatória contínua toma um nº


infinito não numerável de valores, os quais
podem ser associados com medidas numa
escala contínua.

Ana M. Abreu - 2006/07


Propriedades das Slide 5
Distribuições de Probabilidade

Σ P(x) = 1
onde x toma todos os valores possíveis.

0 ≤ P(x) ≤ 1
para qualquer valor de x.

Ana M. Abreu - 2006/07


Média, Variância e Slide 6

Desvio Padrão de uma Variável Aleatória

µ = Σ [x • P(x)] Média

σ = Σ [(x – µ) • P(x)]
2 2
Variância

σ = [Σ x • P(x)] – µ
2 2 2
Variância (forma reduzida)

σ = Σ [x 2 • P(x)] – µ 2 Desvio Padrão

Ana M. Abreu - 2006/07


Definição Slide 7

O Valor Esperado de uma variável aleatória


discreta é denotado por E, e representa a
média dos resultados. Determina-se através
do valor de Σ [x • P(x)].

E = Σ [x • P(x)]

Ana M. Abreu - 2006/07


Em resumo Slide 8

Até agora aprendemos sobre:


 Combinar os métodos da estatística descritiva
com os da probabilidade.
 Variáveis aleatórias e distribuições de
probabilidade.

 Propriedades da distribuição de probabilidade.


 Média, variância e desvio padrão de uma variável
aleatória.
 Valor esperado.

Ana M. Abreu - 2006/07


A Distribuição Binomial Slide 9

Ana M. Abreu - 2006/07


Definições Slide 10

A distribuição binomial verifica as seguintes condições:

1. A experiência tem um nº fixo de provas, n.


2. As provas são independentes. (O resultado de uma
prova não afecta a probabilidade de ocorrência das
restantes.)
3. Cada prova origina um de dois resultados possíveis:
sucesso ou insucesso.
4. A probabilidade de sucesso, denotada por p, é
constante em cada prova.

Ana M. Abreu - 2006/07


Notação para a Distribuição Slide 11

Binomial

n denota o nº de provas (valor fixo à partida).


x denota um nº específico de sucessos em n
provas, logo x pode ser qualquer nº entre 0 e
n, inclusive.
p denota a probabilidade de sucesso em cada
uma das n provas.
q denota a probabilidade de insucesso em cada
uma das n provas.
P(x) denota a probabilidade de obter exactamente x
sucessos em n provas (P(x)=P(X=x)).

Ana M. Abreu - 2006/07


Métodos para Determinar Slide 12

as Probabilidades com a
Distribuição Binomial

Vejamos três métodos possíveis para


determinar as probabilidades correspondentes
à variável aleatória X com distribuição binomial.

Ana M. Abreu - 2006/07


Método 1: Usando a
Slide 13
Fórmula da Probabilidade na
Distribuição Binomial

P(X=x) = n! • px • qn-x
(n – x)!x!

para x = 0, 1, 2, . . ., n
onde
n = nº de provas
x = nº de sucessos nas n provas
p = probabilidade de sucesso em cada prova
q = probabilidade de insucesso em cada prova (q = 1 – p)

Ana M. Abreu - 2006/07


Método 2: Usando uma Tabela Slide 14
de Probabilidades
Reproduz-se em baixo parte da tabela da binomial que
vamos usar. Com n = 5 e p = 0.2 na distribuição binomial,
as probabilidades de obter 0, 1, 2, 3, 4 e 5 sucessos são
0.3277, 0.4096 (=0.7373-0.3277), 0.2048 (=0.9421- 0.7373),
0.0512, 0.0064 e 0.0003, respectivamente.
n=5 p
x .01 .05 .10 .20
0 .3277
1 .7373
2 .9421
3 .9933
4 .9997
Ana M. Abreu - 2006/07
Método 3: Slide 15
Usando a Tecnologia

Software Estatístico, Excel e algumas calculadoras


fornecem-nos as probabilidades da distribuição binomial.

Ana M. Abreu - 2006/07


Distribuição Binomial: Slide 16

Fórmulas

Média µ =n•p

Variância σ 2 = n • p • q
Desvio Padrão σ = n•p•q
onde
n = nº de provas
p = probabilidade de sucesso em cada uma das n
provas
q = probabilidade de insucesso em cada uma das n
provas
Ana M. Abreu - 2006/07
Exemplo Slide 17

Determine a média e o desvio padrão para o nº de


raparigas em 14 nascimentos.

Esta situação pode ser resolvida através da


distribuição binomial onde:
n = 14
p = 0.5
q = 0.5
Usando as fórmulas da distribuição binomial, temos :

µ = (14)(0.5) = 7 raparigas
σ = (14)(0.5)(0.5) = 1.871 raparigas

Ana M. Abreu - 2006/07


Interpretação dos Resultados Slide 18

É especialmente importante interpretar os


resultados. Os valores dizem-se pouco usuais
se se encontrarem para além dos seguintes
limites:

Valores Máximos Usuais = µ + 2 σ


Valores Mínimos Usuais = µ – 2 σ

Ana M. Abreu - 2006/07


Exemplo Slide 19

Determine se é usual em 100 nascimentos, 68


serem raparigas.

Para esta distribuição binomial,


µ = 50 raparigas
σ = 5 raparigas
µ + 2 σ = 50 + 2(5) = 60
µ - 2 σ = 50 - 2(5) = 40
Em 100 nascimentos, é usual nascerem entre 40 e 60
raparigas. Assim, não é usual nascerem 68 raparigas.

Ana M. Abreu - 2006/07


Slide 20

A Distribuição de Poisson

Ana M. Abreu - 2006/07


Definição Slide 21

A distribuição de Poisson é uma distribuição discreta que


se aplica quando ocorre um acontecimento num intervalo
especificado. A variável aleatória X representa o nº de
ocorrências num determinado intervalo. O intervalo pode
se referir a tempo, distância, área, volume, ou algum tipo
de medida similar.

Fórmula

P(X=x)= µ x • e -µ onde e ≈ 2.71828


x!

Ana M. Abreu - 2006/07


Condições da Slide 22
Distribuição de Poisson
 A variável aleatória X designa o nº de acontecimentos
nalgum intervalo. Assim, pode tomar quaisquer dos
valores 0, 1, 2, …)
 Os acontecimentos têm que ser aleatórios.
 Os acontecimentos são independentes.

• Parâmetros
A média é µ.
 O desvio padrão é σ= µ.
Ana M. Abreu - 2006/07
Diferenças em relação à
Slide 23
Distribuição Binomial

A distribuição de Poisson difere da distribuição


binomial nos seguintes aspectos fundamentais:

 A distribuição binomial é caracterizada pela


dimensão da amostra n e pela probabilidade de
sucesso p, enquanto que a distribuição de Poisson
é caracterizada apenas pela média µ.
 Numa distribuição binomial, os valores que a
variável aleatória X pode tomar são 0, 1, . . . n,
enquanto que na distribuição de Poisson a variável
X toma os valores 0, 1, . . . , sem limite superior.

Ana M. Abreu - 2006/07


Exemplo Slide 24

Bombas da 2ª Guerra Mundial Em 1945 os alemães


bombardearam Londres com as bombas V2. A região
londrina está dividida em 576 distritos de superfícies
semelhantes, pelo que admitimos que cada distrito tem
igual probabilidade de ser bombardeado. Calcula-se que
o nº de bombas recebidas por Londres foi de 535.
Se um distrito for seleccionado ao acaso, determine
a probabilidade de ter sido bombardeado com
exactamente 2 bombas.
A distribuição de Poisson é adequada porque
estamos a lidar com uma situação de ocorrência de
acontecimentos (nº de bombas recebidas) num certo
intervalo (distrito).

Ana M. Abreu - 2006/07


Exemplo Slide 25

O nº médio de bombas por distrito é

µ = 535 = 0.929
576

Então, P(X=2) = 0.9292 e-0.929 = 0.170.


2!

Assim, a probabilidade de um qualquer distrito ser


atingido por exactamente 2 bombas é P(X=2) = 0.170.

Ana M. Abreu - 2006/07


Cálculo da probabilidade na Distribuição
Slide 26
de Poisson usando uma Tabela

Reproduz-se em baixo parte da tabela da distribuição de


Poisson que vamos usar. Com µ = 0.20, as probabilidades
de ocorrerem 0, 1, 2, 3 e 4 acontecimentos são
0.8187, 0.1638 (=0.9825-0.8187), 0.0164 (=0.9989- 0.9825),
0.001, e 0.0001, respectivamente.
µ
x .05 .10 .15 .20
0 .8187
1 .9825
2 .9989
3 .9999
4 1.0000
Ana M. Abreu - 2006/07
Distribuição Normal Slide 27

Ana M. Abreu - 2006/07


Caracterização Slide 28

 Variável aleatória contínua


 Distribuição Normal

-1 µ2
x-µ
2
( σ)
e
f(x) = σ 2π

Fórmula 3-1
Figura 3-1
Ana M. Abreu - 2006/07
Definições Slide 29

 Curva da Densidade (ou da função


densidade de probabilidade é o gráfico da
distribuição de probabilidade de uma
variável aleatória contínua).

1. A área total sob a curva é igual a 1.


2. Todo o ponto sob a curva deve ter uma
ordenada de valor igual ou superior a
zero.
Ana M. Abreu - 2006/07
Uso da Área para Slide 30
determinar a Probabilidade
Como a área total sob a curva é igual a 1, existe
uma correspondência entre a área e a
probabilidade.

Figura 3-2
Ana M. Abreu - 2006/07
Alturas de Homens e Mulheres
Slide 31

Figura 3-3

Ana M. Abreu - 2006/07


Definição Slide 32

Distribuição Normal Standard :


a distribuição Normal que tem
média 0 e desvio padrão 1.

Figura 3-4
Ana M. Abreu - 2006/07
Notação Slide 33

P(a < z < b)


denota a probabilidade de z tomar valores entre
aeb
P(z > a)
denota a probabilidade de z tomar valores maiores do
que a
P(z < a)
denota a probabilidade de z tomar valores menores do
que a

Ana M. Abreu - 2006/07


Cálculo do valor de z correspondenteSlide 34
a uma certa probabilidade

5% ou 0.05

(o valor de z será positivo) 1.645

Figura 3-5
Cálculo do Percentil 95
Ana M. Abreu - 2006/07
Cálculo do valor de z correspondenteSlide 35
a uma certa probabilidade

(Um dos valores de z será negativo e o outro positivo)

Figura 3-6
Cálculo dos Percentis 2.5% e 97.5%

Ana M. Abreu - 2006/07


Distribuições Normais Slide 36

não Standard

Se µ≠0 ouσ ≠1 (ou ambos), teremos que


converter os valores usando a Fórmula 3-2;
então, os procedimentos passam a ser os
mesmos do que os usados com a distribuição
Normal Standard.

x–µ
Fórmula 3-2 z= σ
Ana M. Abreu - 2006/07
Conversão para a Distribuição Slide 37

Normal Standard

x–µ
z=
σ

Figura 3-7

Ana M. Abreu - 2006/07


Precauções a ter em conta Slide 38

1. Não confunda valores de z com as correspondentes


áreas. Os valores de z são distâncias ao longo do eixo
horizontal enquanto que as áreas são regiões sob a
curva da distribuição Normal. A tabela usada apresenta
os valores de z na coluna à esquerda e na linha superior,
enquanto que as áreas se encontram no “meio” da
tabela.
2. Escolha o lado certo (direito/esquerdo) do gráfico.
3. Um valor de z deve ser negativo sempre que se
encontre na metade esquerda da distribuição Normal.
4. As áreas (ou probabilidades) têm valores positivos ou
nulos, mas nunca têm valores negativos.

Ana M. Abreu - 2006/07


Cálculos usando a Tabela da
Slide 39
distribuição Normal Standard
Seja Z a variável aleatória com distribuição Normal
standard, ou seja, com valor médio zero e desvio padrão 1.
Para calcular P(Z<0.32), é necessário consultar a tabela, na
página referente aos valores positivos de z, como a seguir
se indica:

z .00 .01 .02


0.0 .5080
0.1 .5478
0.2 .5871
0.3 .6255

Assim, P(Z<0.32)=0.6255.

Ana M. Abreu - 2006/07


Cálculos usando a Tabela da
Slide 40
distribuição Normal Standard
De modo análogo, P(Z<-1.51)=0.0655, mas onde agora se
consultou a mesma tabela, embora na parte referente aos
valores negativos de z.
Por outro lado, para encontrar o valor de z correspondente
a uma certa probabilidade, por exemplo, 0.975, o valor da
probabilidade tem que ser procurado no interior da tabela
para, só depois, determinar o valor de z que lhe
corresponde.
z … .05 .06
… …
1.8 .9686
1.9 .9750
Assim, o valor de z correspondente à probabilidade 0.975 é
1.96, ou seja, se P(Z<t)=0.975, então t=1.96.
Ana M. Abreu - 2006/07
Aproximação da Distribuição Binomial
Slide 41
pela Distribuição Normal se:

np ≥ 5 e
nq ≥ 5

então µ = np e σ = npq
e a variável aleatória tem uma

distribuição Normal

Ana M. Abreu - 2006/07


Procedimento para usar a Distribuição
Normal para Aproximar a Distribuição Slide 42

Binomial
1. Verifique que a distribuição Normal é uma aproximação
adequada à distribuição Binomial confirmando que np ≥ 5 e
nq ≥ 5.

2. Determine os valores dos parâmetros µ e σ calculando µ = np e


σ = npq.

3. Identifique o valor discreto de x (o nº de sucessos). Altere o


valor discreto x substituindo-o pelo intervalo x – 0.5 a x +0.5.
Represente a curva da Normal e assinale os correspondentes
valores de µ , σ, e de x – 0.5 ou x + 0.5, conforme a situação.

4. Determine a área correspondente à probabilidade desejada.

Ana M. Abreu - 2006/07


Definição Slide 43

Quando usamos a distribuição Normal


(que é uma distribuição contínua) para
aproximar a distribuição Binomial (que é
uma distribuição discreta), fazemos uma
correção de continuidade ao valor
discreto x na distribuição binomial
representando o valor x pelo intervalo de
x – 0.5 a x + 0.5.

Ana M. Abreu - 2006/07


x = pelo menos 120 Slide 44

= 120, 121, 122, . . .

x = mais do que 120


= 121, 122, 123, . . .

x = no máximo 120
= 0, 1, . . . 118, 119, 120

x = menos do que 120


= 0, 1, . . . 118, 119
Figura 3-8
Ana M. Abreu - 2006/07
Slide 45
x = exactamente 120

Intervalo que representa o valor discreto 120


Ana M. Abreu - 2006/07
Distribuição t de Student Slide 46

A distribuição t de Student é a designação


de uma família de distribuições indexada
pelo parâmetro ν, que representa o
número de graus de liberdade (g.l.).
Reproduz-se em seguida parte da tabela
desta distribuição.

Ana M. Abreu - 2006/07


Slide 47

Distribuição t de Student
α
ν … .025 .01
… …
9 2.8214
10 2.7638

Os valores indicados escrevem-se na forma

t(0.01; 10) = 2.7638

e lê-se: o percentil 0.01 da distribuição t de


Student com 10 graus de liberdade é 2.7638.
Ana M. Abreu - 2006/07
Slide 48
Distribuições t de Student
com n = 3 e n = 12

Ana M. Abreu - 2006/07


Características importantes da
distribuição t de Student Slide 49

1. A distribuição t de Student varia de acordo com a


dimensão da amostra (de acordo com a figura anterior,
para os casos n = 3 e n = 12).
2. A curva da distribuição t de Student tem a mesma forma
em sino da distribuição Normal, mas reflecte a maior
variabilidade (com curvas mais alargadas) que é de
esperar em amostras pequenas.
3. A distribuição t de Student tem valor médio zero (tal como
a distribuição Normal standard).
4. O desvio padrão da distribuição t de Student varia de
acordo com o tamanho da amostra e é maior do que 1 (o
que não acontece com a distribuição Normal standard,
onde σ = 1).
5. Quanto maior a dimensão da amostra, mais a distribuição t
de Student se aproximaAna
daM.distribuição
Abreu - 2006/07
Normal.
Distribuição Qui-quadrado Slide 50

A distribuição Qui-quadrado é a designação


de uma família de distribuições indexada
pelo parâmetro ν, que representa o número
de graus de liberdade (g.l.).
Reproduz-se em seguida parte da tabela
desta distribuição.

Ana M. Abreu - 2006/07


Distribuição Qui-quadrado Slide 51

α( dade)
gl (df) … .10 .05
… …
9 16.919
10 18.307

Os valores indicados escrevem-se na forma

ℵ2(0.05; 10) = 18.307

e lê-se: o percentil 0.05 da distribuição Qui-


quadrado com 10 graus de liberdade é 18.307.
Ana M. Abreu - 2006/07
Características da distribuição
Slide 52
Qui-Quadrado
1. A distribuição Qui-quadrado não é simétrica, ao
contrário do que sucede com as distribuições Normal
e t de Student.
À medida que o nº de graus de liberdade aumenta,,
a distribuição torna-se mais simétrica.

Distribuição Qui-quadrado Distribuição Qui-quadrado para


g.l.= 10 e g.l.= 20
Ana M. Abreu - 2006/07
Características da distribuição
Slide 53
Qui-Quadrado

2. Os valores da distribuição Qui-quadrado podem ser


positivos ou nulos, mas não podem ser negativos.

3. A distribuição Qui-quadrado é diferente consoante o nº


de graus de liberdade, os quais se escrevem g.l.= n – 1.
À medida que o nº de g.l. aumenta, a distribuição
aproxima-se da distribuição Normal.

Ana M. Abreu - 2006/07