Sei sulla pagina 1di 42

PONTIFCIA UNIVERSIDADE CATLICA DO RIO GRANDE DO SUL

FACULDADE DE ENGENHARIA
CURSO DE PS-GRADUAO LATO SENSU ESPECIALIZAO
Engenharia de Processos e de Sistemas de Produo

Estatstica Aplicada Engenharia


Prof. Hlio Radke Bittencourt

Curso de Especializao em
Engenharia de Processos e de Sistemas de Produo

Abril de 2014
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 2

Sumrio

1. Conceitos Bsicos 03
1.1 Tipos de Variveis
1.2 Estatstica Descritiva e Inferencial

2. Estatstica Descritiva 06
2.1 Tabelas de freqncia
2.2 Tabelas de freqncia
2.3 Separatrizes
2.4 Medidas de Variabilidade
2.5 Anlise Grfica

3. Um pouco de Probabilidade 19
3.1 Principais Conceitos
3.2 Variveis Aleatrias Discretas Distribuio Binomial
3.3 Variveis Aleatrias Contnuas Distribuio Normal

4. Amostragem e distribuies amostrais 29


4.1 Conceitos bsicos
4.2 Principais tcnicas de amostragem probabilstica
4.3 Distribuies Amostrais & Estimao por ponto e por intervalo
4.4 Distribuio amostral da mdia
4.5 Distribuio amostral da proporo

5. Inferncia Estatstica: Intervalos de Confiana 38


5.1 Intervalo de confiana para a mdia (terico)
5.2 Intervalo de confiana para a mdia (prtico)
5.3 Intervalo de confiana para a proporo
5.4 Dimensionamento de Amostras

Calendrio de aulas

Aula 1 25/04
Conceitos Bsicos, Estatstica Descritiva

Aula 2 26/04
Probabilidade, Amostragem e distribuies amostrais

Aula 3 10/05
Intervalos de Confiana, Clculo do n

As aulas com o Professor Lori Viali ocorrero em 09/05, 16/05 e 17/05.


Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 3

Cap. 1 CONCEITOS BSICOS

A Estatstica pode ser definida como o conjunto de ferramentas para coleta,


organizao, anlise e interpretao de dados experimentais. O objeto de estudo
em Estatstica um conjunto de dados que pode constituir uma populao ou uma
amostra.

Populao um conjunto finito ou infinito de elementos.

Amostra um subconjunto da populao. Geralmente buscamos amostras


representativas. Uma amostra representativa aquela que mantm as
caractersticas da populao.

Questes:

1) Qual o nmero aproximado de eleitores no Rio Grande do Sul? Qual o tamanho


amostral das pesquisas eleitorais realizadas pelos institutos?

2) Como se chama a investigao de toda a populao? Por que, por exemplo, o


IBGE no realiza _______________ anualmente?

1.1 Tipos de Variveis

J vimos que a Estatstica trabalha com conjunto de dados formado por elementos.
Ns no trabalharemos diretamente com os elementos que formam o conjunto de
dados, mas sim com suas caractersticas. Variveis so caractersticas dos
elementos que formam o conjunto de dados.

Vamos imaginar um carro e listar variveis associadas a ele:

As variveis podem ser classificadas em qualitativas ou quantitativas: as


variveis qualitativas expressam uma classificao em categorias e, por isso,
tambm so chamadas de categricas. As variveis quantitativas expressam
quantidades numricas e se dividem em discretas e contnuas. As variveis
discretas assumem apenas determinados valores num dado conjunto enumervel,
enquanto as variveis contnuas podem assumir, ao menos teoricamente, qualquer
valor num dado intervalo numrico.
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 4

Na prtica todas as variveis so discretas, devido limitao dos instrumentos de


mensurao.

As variveis qualitativas ainda podem ser classificadas em nominais ou ordinais.

O nvel nominal de mensurao caracterizado por nmeros que apenas


diferenciam ou rotulam as categorias.

O nvel ordinal de mensurao envolve nmeros que, alm de diferenciar,


hierarquizam as categorias.

Figura Resumo dos tipos de variveis e escalas de mensurao


Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 5

1.2 Estatstica Descritiva e Inferencial

A estatstica um conjunto de ferramentas utilizadas para a coleta, tabulao,


anlise e interpretao de um conjunto de dados experimentais. A Estatstica pode
ser dividida em duas grandes reas: Descritiva e Inferencial.

A estatstica descritiva aquela que costumamos encontrar com maior


freqncia em jornais, revistas, relatrios, etc. Essa parte da estatstica utiliza
nmeros para descrever fatos. Seu foco a representao grfica e o resumo e
organizao de um conjunto de dados, com a finalidade de simplificar informaes.
Nessa categoria se enquadram as mdias salariais, taxas de inflao, ndice de
desemprego, etc.

A estatstica inferencial consiste na obteno de resultados que possam ser


projetados para toda populao a partir de uma amostra da mesma. Ela
fundamenta-se na teoria da amostragem e no clculo de Probabilidades. Essa a
rea mais importante da Estatstica.

Figura - Esquema geral de um curso de Estatstica

Descritiva

Estatstica

Inferencial

Probabilidade Amostragem

Probabilidade um ramo da Matemtica que estuda fenmenos aleatrios.

Amostragem o nome dado ao conjunto de procedimentos e tcnicas para


extrao de elementos da populao para compor a amostra.
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 6

Cap. 2 ESTATSTICA DESCRITIVA

Apenas para lembrar: na estatstica descritiva nos preocupamos em apresentar a


informao de conjuntos de dados de forma resumida, mas, ao mesmo tempo, til
para o pesquisador.

2.1 Tabelas de freqncia

Tabelas de freqncia so encontradas em jornais informativos (Zero Hora, Correio


do Povo, etc.), relatrios tcnicos, monografias, dissertaes, teses e revistas
cientficas. As tabelas de freqncia simples apresentam de forma concisa o
nmero de ocorrncias (absoluta e relativa) dos valores de uma varivel

Uma tabela de freqncia genrica tem a seguinte configurao:

Tabela 1 Tabela de freqncias genrica


i xi fi fri Fi Fri
1 x1 f1 fr1 F1 Fr1
2 x2 f2 fr2 F2 Fr2
M M M M M M
k xk fk frk Fk Frk
n 100,0% - -

A notao utilizada a seguinte:

X uma varivel qualquer


x um particular valor da varivel X
i um ndice til para enunciar as expresses matemticas
k o nmero de linhas da tabela
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 7

Os componentes da tabela de freqncias so:

Freqncia absoluta (fi): nmero de ocorrncias do valor xi.

Freqncia relativa (fri): percentual de ocorrncias do valor xi

Freqncia absoluta acumulada (Fi): nmero de ocorrncias at o valor xi.

Freqncia relativa acumulada (Fri): percentual de ocorrncias at o valor xi

Como calcular as freqncias:

Tabela de freqncia cruzada so representaes tabulares da freqncia


de ocorrncia de duas variveis de maneira simultnea. So tambm
chamadas de tabelas de contingncia. Uma tabela cruzada tem l linhas e c
colunas.

Exemplo Tabela de contingncia genrica

Y
X y1 y2 yc
x1 f11 f21 ... f1c f1
x2 f12 f22 ... f2c f 2
M M O M M
xl fl1 fl2 ... flc f l

f 1 f 2 ... f c f
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 8

2.2 Medidas de Tendncia Central

So valores que trazem informao sobre a regio em torno da qual os dados esto
posicionados. As medidas de tendncia central mais utilizadas so: Mdia, Mediana
e Moda.

Para apresentar as medidas de tendncia central vamos utilizar o seguinte


exemplo.

Banco de dados do ENADE 2011 (Cursos de Engenharia de Produo)

2.2.1 Mdia Aritmtica (


, X)

A mdia aritmtica definida como a soma de todas observaes da varivel X,


dividida pelo nmero de elementos do conjunto de dados. Freqentemente a mdia
aritmtica o valor que melhor representa um conjunto de dados.

Quando os dados no esto organizados na forma de uma tabela de freqncias e,


portanto, esto na forma isolada, as expresses genricas para encontrar a mdia
so:

Populao Amostra

N n

x
i =1
i x
i =1
i
= X =
N n

Quando os dados esto organizados na forma de uma tabela de freqncias deve-


se ponderar os diferentes valores xi pelas respectivas freqncias fi. Procedendo
desta forma o clculo da mdia aritmtica torna-se mais simples e rpido.

Populao Amostra

k k

xi f i
i =1
x
i =1
i fi
= X =
N n

2.2.2 Mediana (Md)

A mediana o valor que divide o conjunto de dados ordenado em duas partes com
igual nmero de observaes. Para calcular a mediana iremos utilizar uma nova
notao. Seja x[1] , x[ 2 ] , K , x[ n ] um conjunto de dados ordenado (ordem no-
decrescente), onde o valor entre colchetes representa a posio no conjunto
ordenado.
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 9

As expresses genricas para encontrar a mediana so:

n mpar n par

2.2.3 Moda (Mo)

A moda definida como o valor mais freqente de um conjunto de dados.


possvel que o conjunto seja bimodal (duas modas) ou at mesmo multimodal
(trs os mais modas).

Mo = {xi } com maior f i

Exemplo Encontrar as MTCs para o CPC contnuo e seus 8 componentes


no EXCEL

= MDIA(??:??)
=MED(??:??)
=MODO(??:??)

Consideraes sobre as MTC

1. A mdia a MTC mais influenciada por valores extremos, entretanto a medida


mais rica, porque considera todos valores do conjunto de dados.

2. A mediana no afetada por valores extremos.

3. A moda a MTC mais pobre, porque considera apenas os valores mais


freqentes.

4. Existem outros tipos de mdia que no so to afetadas por valores extremos,


entretanto no toleram, por exemplo, o valor zero.

Mdia harmnica Mdia geomtrica

n
Xh = n
X G = n x1 x 2 K x n
1

i =1 xi

Pode-se estabelecer a seguinte relao entre as mdias:

Xh XG X
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 10

Exemplo Aplicando a Mdia Harmnica aos dados da planilha Vestibular


Aluno A Aluno B Aluno C
Matemtica 500 840 160
Fsica 501 420 540
Qumica 497 430 530
Geografia 498 470 550
Histria 502 450 555
Biologia 503 450 565
Literatura 499 490 550
Lngua Portuguesa 500 450 550

Mdia
Mediana
Mdia sem Matemtica

Mdia Harmnica
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 11

2.3 Separatrizes

So valores que separam o conjunto de dados ordenado em partes com igual


nmero de observaes.

A Mediana , portanto, uma separatriz porque divide o conjunto de dados em duas


partes iguais.

Min |------------------------|------------------------| Mx
Md

Os Quartis (Qi) dividem o conjunto de dados em 4 partes iguais.

Min |------------------------|------------------------| Mx

Os Percentis (Pi) dividem o conjunto de dados em 100 partes iguais.

Min |------------------------|------------------------| Mx

Exemplo Boletim de Desempenho do Provo do MEC

Exemplo Estabelecer uma rgua de percentis para o CPC contnuo

Mn P10 P20 P30 P40 P50 P60 P70 P80 P90 Mxi

=PERCENTIL(??:??)
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 12

2.4 Medidas de Variabilidade

So medidas que complementam as MTC trazendo informao sobre a disperso


existente no conjunto de dados. Para introduzi-las vamos recorrer a um exemplo
onde temos trs diferentes empresas e a varivel X investigada o salrio. Todas
empresas tm seis funcionrios.

Tabela Distribuio salarial em trs empresas


Empresa A Empresa B Empresa C
1000 1000 1000
1000 800 200
1000 1000 300
1000 1200 1000
1000 1300 2100
1000 700 1400
Mdia ( X )
Moda (Mo)
Mediana (Md)

Questes

1 O que aconteceu com as MTC na tabela acima?

2 As trs empresas so iguais em relao a distribuio salarial?

3 O que diferencia uma empresa da outra?

A partir de agora aprenderemos a calcular medidas capazes de quantificar


a variabilidade existente num conjunto de dados

2.4.1 Amplitude (R, do termo Range)

a diferena entre o maior e o menor valor de um conjunto de dados.

R = mx{xi } mn{xi }
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 13

2 , s 2)
2.4.2 Varincia (

A varincia uma medida da variao em torno da mdia. Por definio,


varincia a mdia dos quadrados dos desvios em torno da mdia.

Populao Amostra
N n

(x (x X)
2
)
2
i i
i =1 i =1
2 = s2 =
N n 1

A varincia, ao contrrio da Amplitude, considera todos elementos do conjunto de


dados no seu clculo. Quanto maior for a variao dos valores do conjunto de
dados, maior ser a varincia.

Quando os dados esto organizados na forma de uma tabela de freqncias,


deve-se ponderar os quadrados dos desvios pela freqncia. Esse procedimento
facilita o clculo.

Populao Amostra
k k

(x (x X ) fi
2
) fi
2
i i
i =1 i =1
2 = s2 =
N n 1

2.4.3 Desvio-padro (
, s)

O desvio-padro a raiz quadrada positiva da varincia. Essa medida corrige o


problema de unidade que surge na varincia. O desvio-padro tambm uma
medida da variao em torno da mdia.

Populao Amostra
2
= s = s2

O desvio-padro expressa a variao mdia do conjunto de dados em torno da


mdia, para mais ou para menos.

2.4.4 Coeficiente de Variao (CV)

O CV a razo entre o desvio-padro e a mdia de um conjunto de dados. Ele


expressa a variao relativa (%) presente no conjunto de dados em relao
mdia.

Populao Amostra
s
CV = 100% CV = 100%
X
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 14

Quanto maior o CV, mais heterogneos sero os dados.

Consideraes sobre as Medidas de Variabilidade (MV)

1. A Amplitude a MV mais pobre, porque considera apenas os dois valores


extremos do conjunto de dados.

2. A Varincia no interpretada na prtica devido ao problema da unidade, que


est ao quadrado.

3. O Desvio-padro a MV mais conhecida, sendo amplamente utilizada.

4. Dentre as MV estudadas, sugere-se que o CV seja utilizado para comparao da


variabilidade entre diferentes conjuntos de dados. Por no ter unidade, o CV pode
ser utilizado at mesmo para comparar a variabilidade entre variveis expressas
em diferentes unidades.

Exemplo Diferenciando as empresas

Encontrar as medidas de variabilidade para diferenciar as trs empresas.

=MAXIMO(??:??) MINIMO(??:??)
=VAR(??:??)
=DESVPAD(??:??)
=DESVPAD(??:??)/MEDIA(??:??)

Exemplo Encontrar a mdia e o desvio-padro do CPC contnuo por Dep.


Administrativa (Tipo)
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 15

2.5 Anlise Grfica

O tipo de grfico adequado para cada varivel depende do tipo de varivel. Segue
uma relao de exemplos de variveis e tipos de grficos adequados.

Varivel Qualitativa Nominal (com poucas categorias)

GRFICO DE SETORES

Figura Marca mais lembrada no quesito Empresa Area.

Gol
12%

Vasp Varig
13% 39%

TAM
36%

Fonte: Dados de lembrana fictcios. O grfico foi construdo de acordo com a


participao no mercado em 2002.

Varivel Qualitativa Nominal (com muitas categorias):

GRFICO DE BARRAS

Figura As 10 empresas gachas mais lembradas

Gerdau 8,7%

RBS 6,3%

Azalia 4,1%

Tramontina 3,8%

Marcopolo 3,3%

GM 3,3%

Coca-Cola 3,3%

Sup.Nacional 2,1%

Renner 1,8%

Grendene 1,8%

0,0% 5,0% 10,0%

Fonte: Top of Mind Revista Amanh 2002


Obs.: As outras empresas citadas somam 63,3%, entretanto individualmente no
ultrapassam 1,7%.
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 16

Varivel Qualitativa Ordinal:

GRFICO DE BARRAS

Figura Avaliao do atendimento em um restaurante

timo 45%

Muito Bom 25%


Avaliao

Bom 15%

Regular 8%

Ruim 5%

Pssimo 2%

0% 10% 20% 30% 40% 50%


%

Fonte: Dados fictcios.


Base: 100 observaes.

Varivel Quantitativa Discreta

GRFICO DE COLUNAS

Figura Distribuio da turma por idade


45%

40%

35%

30%
Relativa (%)
Freqncia

25%

20%

15%

10%

5%

0%
18 19 20 21 22 23 24 25 26 27 28 29 30
Idade (anos completos)

Fonte: Dados coletados na turma de Estatstica para ADM Empreendorismo e


Sucesso.
Base: 28 alunos
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 17

Varivel Quantitativa Contnua

HISTOGRAMA

Figura Distribuio de uma turma por altura

10

4
Freqncia

0
150,0 160,0 170,0 180,0 190,0 200,0

Altura (cm)

Fonte: Alunos de uma turma de Estatstica I. Grfico construdo no software SPSS.


Base: 20 observaes

Sries Temporais - GRFICO DE LINHAS

Figura - Evoluo das matrculas na Educao Superior no RS - 1988 a 2003

Fonte: MEC/INEP (extrado do Atlas Scio Econmico do RS


Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 18

Exemplo Construir no Excel

Um grfico de setores (var. qualitativa poucas categorias)


Um grfico de barras (var. qualitativa com muitas categorias)
Um grfico de barras (var. qualitativa ordinal)
Histograma (melhor fazer no Minitab ou SPSS)

OUTRO TIPO DE GRFICO 1 Box-plot

Exemplo - Fazer um Box-plot do CPC Contnuo por Den. Acadmica

OUTRO TIPO DE GRFICO 2 Grfico do Pareto


20.000.000
18.000.000 100,0%
Passageiros

16.000.000
80,0%
14.000.000
12.000.000
60,0%
10.000.000
8.000.000
40,0%
6.000.000
4.000.000 20,0%
2.000.000
0 0,0%
VIX
VIR
GIG

NAT
MCZ
SLZ
CFI

CUI
GOI
GRU

CGH

SDU

REC
CUR
FOR
FLN

MAN
BEL
SSA
POA

Outros

Fonte: Infraero, Jul2013 (exceto GRU e VIR, cujos dados so de 2012). Total de 66 aeroportos.

Exemplo - Fazer um Pareto para as matrculas nas Engenharias


Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 19

Cap. 3 Um pouco de Probabilidade

3.1 Principais conceitos

Probabilidade o ramo da matemtica que trata de fenmenos aleatrios. A


observao de um fenmeno aleatrio por parte do homem chamada de
experimento aleatrio.

Caractersticas de um experimento aleatrio:

1) No se conhece um particular valor do experimento antes dele ser executado,


porm podemos descrever todos os possveis resultados - as possibilidades;

2) Quando o experimento repetido algumas vezes, os resultados ocorrem de uma


forma aparentemente acidental. Mas quando o nmero de repeties aumenta, uma
regularidade aparecer. E esta regularidade que torna possvel construir um modelo
matemtico til para anlise do experimento.

Exemplos de fenmenos aleatrios:

1) Condies meteorolgicas
2) Produo de arroz anual numa cidade
3) Resultado de uma cirurgia
4) Lanamento de uma moeda
5) Resultados de loterias

Exemplos de experimentos aleatrios:

E1: Jogue um dado e observe o n. na face de cima.


E2: Jogue uma moeda 3 vezes e observe o nmero de caras obtido.
E3: Jogue uma moeda 3 vezes e observe a seqncia de caras e coroas obtida.
E4: Uma mulher est grvida de gmeos. O sexo dos bebs ser verificado.
E5: O nmero de alunos matriculados na turma de Est Apl Psicologia verificado
E6: A temperatura de um paciente verificada pela enfermeira.

Nos seis exemplos anteriores no somos capazes de precisar o resultado, entretanto


conseguimos listar os possveis resultados.

Espao amostral de um experimento aleatrio o conjunto de todos os resultados


possveis do experimento. denotado por S ou .
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 20

Exemplos de espaos amostrais relacionados aos experimentos anteriores.

S1 =

S2 =

S3 =

S4 =

S5 =

S6 =

Um evento um subconjunto de S. Em particular, S e (conjunto vazio) so eventos;


S dito o evento certo e o evento impossvel.

Exemplo de eventos no lanamento de um dado

S = {1,2,3,4,5,6}

A: ocorre um n. par A = {2,4,6}


B: ocorre a face 6 B = {6}
C: ocorre um n. maior que 6 C=
D: ocorre n 6 ou n par D = {2,4,6}
E: ocorre n par ou n mpar E = {1,2,3,4,5,6} = S

possvel realizar operaes com eventos que nada so do que operaes com
conjuntos j estudadas no Ensino Fundamental.

Operaes com eventos

Sejam A e B dois eventos associados a um espao amostral S.

1) Unio: AB A ocorre ou B ocorre ou ambos ocorrem

2) Interseo: AB A ocorre e B ocorre

3) Complementar: Ac ou A no ocorre A
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 21

Duas definies importantes:

1) Dois eventos A e B so excludentes ou mutuamente exclusivos se a ocorrncia


de um impedir a ocorrncia de outro. Em outras palavras, no podem ocorrer
simultaneamente.

2) Eventos ou resultados equiprovveis tm a mesma probabilidade de ocorrncia.

Exemplo Lanamento de um dado e uma moeda, ambos honestos

Escreva o espao amostral. Os resultados so todos equiprovveis? Qual a


probabilidade de um particular par (x,y) ser selecionado. Assinale os seguintes eventos:

3.1.1 Conceitos de probabilidade

Conceito Axiomtico

Seja A um evento de S. A probabilidade de ocorrncia de A, denotada por P(A), dever


satisfazer os seguintes axiomas (propriedades fundamentais):

Axioma 1: 0 P(A) 1
Axioma 2: P(S) = 1

Conceito clssico

Esse conceito s vlido se todos resultados de S forem equiprovveis. Para casos


assim a probabilidade de ocorrncia do evento A obtida por:

n( A)
P( A) =
n( S )

n(A) o nmero de resultados favorveis ao evento A


n(S) o nmero total de resultados em S

Exemplos Conceito clssico

1) Mega-sena, Lanamento de moedas e dados honestos.


Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 22

Conceito freqentista

Neste conceito a probabilidade vista como um limite. Para casos assim a


probabilidade de ocorrncia do evento A obtida por:

1) O experimento repetido n vezes.

2) Observa-se a freqncia relativa de ocorrncia de um certo resultado A:

n( A)
fr(A) = , onde n(A) o n de vezes em que ocorre o resultado A em n realizaes
n
do experimento.

3) Probabilidade como limite. A medida que n aumenta, a fr(A) converge para a real
probabilidade P(A).

n( A)
P( A) = lim n
n

Exemplos Conceito freqentista

1) Verificando se um dado honesto.

2) Encontrando a probabilidade de ocorrncia de um acidente areo.

3) Qual a probabilidade de uma criana nascer com Sndrome de Down?

3.1.2 Probabilidade Condicional

A probabilidade de ocorrncia de um evento pode ser influenciada pela ocorrncia de


um evento paralelo. Considere que A e B so eventos de um mesmo espao amostral S.
Chamaremos de P(A|B) a probabilidade de ocorrncia do evento A dado que o evento
B j ocorreu.

Graficamente:

Olhando para o desenho podemos estabelecer as seguintes relaes:

P(A|B) = P(B|A) =
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 23

Exemplo Escolhendo algum na sala de aula

Suponha que um aluno da turma ser sorteado. Aps saber o resultado o professor faz
algumas perguntas utilizando probabilidade condicional.

Exemplo Mquina X Conformidade

Resultado
Mquina Conforme No conforme Total
A 60 25 85
B 40 65 105
Total 100 90 190

Resolver as seguintes probabilidades:

3.1.3 Independncia

Dois eventos A e B so considerados independentes se a ocorrncia de um no


interfere na probabilidade de ocorrncia do outro:

P(A|B) = P(A) e P(B|A) = P(B)

Isolando a interseco na expresso de probabilidade condicional obtemos:

P(AB) = P(A) x P(B)

Esse conceito fundamental para aplicaes em Estatstica.

Exemplo A probabilidade de ter um carro roubado no perodo de 1 ano de 0,6%.


Escreva o espao amostral e calcule as probabilidades para todos possveis resultados
de uma famlia que tem dois carros.
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 24

3.2 Variveis aleatrias discretas Distribuio Binomial

O exerccio acima pode ser resolvido pela Distribuio Binomial. Sempre que um
experimento que assume apenas dois possveis resultados em cada repetio for
repetido n vezes e que a probabilidade de sucesso constante em cada repetio
podemos modelar o nmero de sucessos pela distribuio Binomial.

X = nmero de sucessos, variando de 1 at n


p = probabilidade de sucesso em cada repetio
1-p = probabilidade de fracasso em cada repetio
n = nmero de repeties

Expresso genrica da Binomial

n!
P ( X = x) = p x (1 p ) n x
x!(n x )!

O nmero esperado ou esperana de sucessos na distribuio Binomial facilmente


encontrado. Intuitivamente, responda as perguntas a seguir:

1) Se lanarmos uma moeda honesta 100 vezes, qual o nmero esperado de caras?

2) Se lanarmos um dado 600 vezes, qual o nmero esperado de faces 5.

3) Em uma frota que 1000 carros, qual o nmero esperado de carros roubados no
perodo de 1 ano?

E( X ) = n p

Exerccio Inspeo por amostragem

Suponha que lotes com uma quantidade muito grande de peas so produzidos e que a
proporo de peas defeituosas nesses lotes estimada em 2%. Numa amostra
aleatria de 30 itens para inspeo:
a) Qual modelo descreve X=nmero de peas defeituosas na amostra?
b) Esboce o modelo terico (tabela e grfico).
c) Faa uma simulao com um lote de N=5000 no Excel e construa a distribuio
emprica de X.

Exerccio Aceitao por amostragem

Construa uma Curva Caracterstica de Operao (CCO) para um plano de amostragem


para aceitao / rejeio de um lote. Siga as instrues do professor.
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 25

3.3 Variveis aleatrias contnuas

3.3.1 Conceitos

As variveis contnuas podem, ao menos teoricamente, assumir qualquer valor num


intervalo numrico. Sendo assim fica impossvel representarmos variveis contnuas da
mesma forma que as variveis discretas.

Importante

As variveis contnuas so representadas por curvas, chamadas de funo


densidade de probabilidade, e a rea sob essa funo representa a probabilidade de
ocorrncia. Nas variveis contnuas no existe a probabilidade de ocorrncia de um
valor exato, mas sim de intervalos.

A funo densidade de probabilidade, denotada por fx(x), a funo que indica o


comportamento probabilstico da varivel aleatria contnua X. A funo densidade de
probabilidade dever satisfazer as seguintes condies:

a) f(x) 0, para todo x R.

b) rea total sob a curva deve ser igual a 1.

A rea sob a curva fx(x) nos informa a probabilidade de ocorrncia de valores da


varivel X.

Supondo que o grfico acima represente a funo de probabilidade de uma varivel


aleatria X. Como sabermos a probabilidade de ocorrncia de valores entre a e b ?

Exemplo Gerador de Nmeros pseudo-aleatrios (Distribuio Uniforme)

Suponha que o gerador de nmeros pseudo-aleatrios do Excel siga uma distribuio


Uniforme no intervalo de [0 ; 1].
a) Esboce graficamente a funo densidade de probabilidade para esse caso.
b) Encontre a probabilidade de ocorrer um nmero maior que 0,8.
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 26

3.3.2 A Distribuio Normal ou Curva de Gauss

A distribuio Normal ou Gaussiana , sem dvida, o modelo probabilstico mais


conhecido. Vrias tcnicas estatsticas necessitam da suposio de que os dados se
distribuam normalmente para serem utilizadas. Na natureza uma grande quantidade de
variveis apresentam tal distribuio.

Uma v.a.c. X tem distribuio normal com parmetros e se sua funo densidade
de probabilidade dada por:

( x )2
1
f (x ) = e 2 2
, x ,
2
onde e so parmetros,
- < < + ; > 0

Notao

X N(,)

X tem distribuio Normal com mdia e desvio-padro .

Os parmetros da Normal so a mdia e o desvio-padro, que permitem infinitas curvas


normais com diferentes formatos (mas sempre simtricas). O grfico da fX
apresentado a seguir:
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 27

A distribuio Normal, independentemente dos valores dos parmetros, apresenta


sempre a seguinte relao:

Entendendo os parmetros da Normal:

A mdia informa o centro da distribuio. um parmetro de locao.

O desvio-padro informa o formato da curva.


f(x)

f(x)

f(x)

-10 -5 0 5 10 -10 0 10 -10 -5 0 5 10


Valores de X Valores de X Valores de X

Os clculos integrais envolvendo a distribuio Normal so bastante complicados.


Felizmente, veremos a seguir uma relao que facilita muito nossa vida.
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 28

Exemplo Aplicao prtica

A altura de mulheres adultas no RS segue uma distribuio Normal com mdia de


165cm e desvio-padro de 6cm.

a) Qual a probabilidade de uma mulher ter entre 159 e 171cm?

b) Qual a probabilidade de uma mulher ter entre 153 e 177cm?

c) Qual a probabilidade de uma mulher ter mais de 177cm?

d) Qual a probabilidade de uma mulher ter menos de 180cm?

Distribuio Normal-padro ou Normal reduzida

Seja X uma varivel aleatria normalmente distribuda com quaisquer parmetros mdia
e desvio-padro . Se realizarmos a seguinte transformao obteremos uma nova
varivel Z com mdia 0 e desvio-padro 1:

X
X N(,) Z= Z (0,1)

Qualquer varivel com distribuio Normal pode ser padronizada para a
Normal. A distribuio Normal padronizada (Z) tabelada.

O valor de Z indica quantos desvios acima ou abaixo ns estamos em relao mdia.

Exemplo Aprendendo a usar a tabela

1) Calcule:

a) P(Z < 1,24) =


b) P(Z < 1,67) =
c) P (Z > 2,12) =
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 29

Cap. 4 Amostragem & Distribuies Amostrais

4.1 Conceitos Bsicos

Amostragem o nome dado ao conjunto de procedimentos e tcnicas para


extrao de elementos da populao para compor a amostra. O objetivo da
amostragem obter uma amostra representativa da populao em estudo. Um
Censo a investigao da populao completa.

Por que trabalhar por amostragem?

________________________________________

________________________________________

________________________________________

________________________________________

A frao de amostragem f a razo entre o tamanho amostral (n) e o tamanho


populacional (N). No existem regras fixas para tamanho de amostra, ou seja, cada
caso merece um cuidado especial. Frases como 10% da populao ideal, quase
sempre no so verdadeiras.

n
f =
N

As tcnicas de amostragem se dividem em: probabilsticas e no-


probabilsticas. As tcnicas probabilsticas so aquelas onde todos os elementos
da populao tm uma probabilidade no nula de seleo; possvel associar
probabilidade de seleo a todos elementos que compem a populao. Nas
tcnicas no-probabilsticas no podemos garantir que todos elementos tm
probabilidade de serem selecionados para a amostra.

4.2 Principais tcnicas de amostragem probabilstica

Geralmente as tcnicas probabilsticas produzem melhores resultados do que as


no probabilsticas, tendo uma melhor receptividade pela comunidade cientfica.
Neste tipo de amostragem, a seleo dos elementos envolve a utilizao de algum
dispositivo aleatrio para seleo das unidades amostrais, pois, desta forma,
estamos garantindo que todos os elementos da populao tiveram sua chance de
serem selecionados.

Exemplo de dispositivos aleatrios:


Funo Aleatrio do Excel, Random, Urna, Dado, Moeda.
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 30

4.2.1 Amostragem Aleatria Simples (AAS)

Apesar de ser uma forma extremamente simples de seleo de elementos da


populao, a AAS considerada uma das melhores tcnicas de amostragem. Na
AAS cada elemento da populao tem igual probabilidade de seleo.

Etapas:

1) Enumerar a populao de 1 at N.
2) Sortear n nmeros no intervalo de 1 at N. (pode ser COM ou SEM reposio)
3) Compor a amostra com os elementos selecionados.

Probabilidade de seleo de um elemento na AAS:

Nmero de amostras possveis SEM reposio:

Nmero de amostras possveis COM reposio:

Exemplo Amostra n=2 da populao N=5

Verificar quantas amostras so possveis SEM reposio da populao de tamanho 5


verificando tambm as probabilidades de seleo de cada unidade.

A B C D E
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 31

4.3 Distribuies Amostrais & Estimao por ponto e por intervalo

Agora que j conhecemos seus dois pilares Probabilidade e Amostragem


iniciaremos a parte de Inferncia Estatstica. Inferir significa transcender
resultados amostrais para toda populao.

No item a seguir faremos a distino entre caractersticas populacionais e


amostrais.

4.3.1 Parmetros e Estimadores

Um parmetro um valor que descreve uma caracterstica da populao. Um


estimador uma funo de dados amostrais que gera estimativas para um
parmetro. A palavra estatstica pode ser utilizada como um sinnimo de
estimador.

Considere x1 , x2 , ... , xn uma amostra aleatria de n elementos de uma


populao. Denotaremos por um parmetro qualquer e por (x ) ou simplesmente
um estimador de . Os parmetros geralmente so denotados por letras gregas e
bastante comum utilizar o chapu para diferenciar os estimadores dos
parmetros.

4.3.2 Propriedades dos Estimadores

Considere x1 , x2 , ... , xn uma amostra de n elementos de uma populao com


mdia e desvio-padro , sendo os xi independentes e identicamente
distribudos. Um estimador (x ) ser considerado uma varivel aleatria pois, cada
uma das possveis amostras de tamanho n da populao provavelmente gerar
uma diferente estimativa.

Um estimador (x ) uma varivel aleatria porque depende da amostra (aleatria)


selecionada.

Um bom estimador do parmetro dever apresentar algumas propriedades


desejveis. Iremos discutir quatro propriedades dos estimadores:

1a) No tendenciosidade: um estimador no-tendencioso se a sua esperana


coincide com o valor do parmetro. Em outras palavras, uma estimador no-
tendencioso se as suas estimativas, em mdia, so corretas, orbitando em torno de
.

Exemplo:
E( X ) =
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 32

2a) Consistncia: um estimador consistente se a sua variabilidade diminui a


medida que o tamanho amostral aumenta. Esta uma propriedade altamente
desejvel quando aliada a no-tendenciosidade.

Se (x ) consistente, ento lim Var () = 0 .


n

Exemplo:

Var( X )=

Importante:
O desvio-padro de um estimador tambm chamado de Erro-padro.

DP( ) = Var( ) = Erro padro

3a) Eficincia: um estimador 1 mais eficiente que 2 se Var(1 ) < Var( 2 ) para
um mesmo tamanho amostral n.

4a) Suficincia: um estimador suficiente se utilizar o mximo de informao


disponvel na amostra para estimar o parmetro .

4.3.3 Mtodos de Estimao

Neste texto discutiremos dois diferentes mtodos de estimao de parmetros. Um


terceiro mtodo, chamado de mnimos quadrados, ser trabalhado no item 5.4.

1o) Mtodo da Mxima Verossimilhana (MxVer) ou Maximum Likelihood


(ML): o mtodo computacionalmente mais empregado para estimao de
parmetros, consistindo na maximizao da funo de verossimilhana l( ) ou de
seu logaritmo ln l( ).

A funo de verossimilhana retrata a probabilidade de uma particular amostra


x1,x2,...,xn ter sido selecionada em funo do(s) parmetro(s) que regem a funo
de probabilidade do fenmeno. Assim sendo, a estimativa de mxima
verossimilhana para ser aquela que tornar mxima a funo. De acordo com
Meyer (1969), as estimativas de MxVer podem ser tendenciosas, mas so
consistentes, assintoticamente eficientes e, a medida que n aumenta, os
estimadores de MxVer seguem distribuio aproximadamente normal.

n
l( ) = f ( x1 , ) f ( x2 , )K f ( xn , ) = f ( xi , )
i =1
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 33

Para entender melhor a funo de verossimilhana, tente lembrar da regra da


independncia:

P( A B ) = P( A ) P( B )
P( A B C ) = P( A ) P( B ) P( C )
n n
P( I Ai ) = P( Ai )
i =1 i =1

Exemplo URNA (Costa Neto, 1977):

Considere uma urna com S bolas Pretas e 10-S bolas Brancas e quatro bolas COM
reposio sero extradas da caixa. Estimar por MxVer o valor de S sabendo que,
numa extrao aleatria ocorreu uma bola Preta e trs Brancas.

Como n=10 bolas, logo sabemos que o valor de S ir variar entre 0 e 10 e, por ser
extrao COM reposio, podemos modelar este fenmeno pela distribuio
Binomial com parmetros n=4 e p=S/10.

Suponha que X=nmero de bolas pretas na amostra, assim a funo de


verossimilhana l(S ) ser baseada na binomial e ficar nica e exclusivamente
como funo de S, visto que X=1 a partir dos dados da amostra n=4.

1 4 1 3
S 10 S S 10 S S (10 S ) 3 S (10 S ) 3
l( S ) = P ( X = 1) = C 41 = 4 = 4 =
10 10 10 10 10 1000 2500

Mostraremos graficamente o processo de maximizao de l(S ) na forma de um


grfico prprio para esta funo discreta.

Figura Funo de verossimilhana para o exemplo da urna


0,4116
0,45 0,4096
L(S)

0,40
0,3456
0,35
0,2916
0,30 0,25
0,25
0,20 0,1536
0,15
0,10 0,0756
0,05 0,0256
0 0,0036 0
-
0 1 2 3 4 5 6 7 8 9 10
S
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 34

Exemplo PRMIOS OCULTOS

Uma promoo distribui picols gratuitos dentre aqueles que encontrarem o vale-
brinde no palito. Suponha que voc deseje estimar a taxa de premiao, ou seja,
qual a proporo p de picols vendidos que tm prmio. Suponha que, na terceira
tentativa voc encontre um prmio.

Perceba que, embora tenhamos outro problema que envolva variveis discretas,
neste caso no podemos enumerar todas possibilidades para p visto que no
sabemos o total de picols produzidos. De qualquer forma, obviamente, 0<p<1.

Figura Funo de verossimilhana para o exemplo do Prmio Oculto

0,16
L(p)

0,14
0,12
0,10
0,08
0,06
0,04
0,02
-
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Exemplo Estimador de MxVer para na Poisson

Encontar o estimador MxVer para sabendo que X ~ Poisson (). Neste caso
muito mais simples maximizar o logaritmo natural da funo de verossimilhana.

2o) Mtodo dos Momentos: Este mtodo foi proposto pelo ingls Pearson em
1894 e consiste em igualar os momentos amostrais aos momentos da distribuio
populacional.

Exemplo Distribuio Normal

Mdia amostral (1o momento amostral) = X

Varincia amostral (2o momento amostral) = 2

Na distribuio Normal:

E(X) = e Var(X) = 2

Portanto X pode ser usado para estimar e 2 para estimar 2. Sabemos,


n

(x X)
2
i
entretanto, que 2 = i =1 um estimador viciado para 2.
n

Exemplo Poisson
Sabendo que X ~ Poisson (), encontrar pelo mtodo dos momentos um estimador
para .
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 35

4.4 Distribuio amostral da mdia ( X )

J sabemos que o estimador X uma varivel aleatria, mas ainda no estudamos


o seu comportamento probabilstico. Vejamos um exemplo:

Exemplo Populao N=6 e Amostra n=3

A B C D E F
10 20 30 40 50 60
Parmetros; = 35 =17,078

Quadro Possveis estimativas para


i Amostra Xi i Amostra X i
1 ABC 11 BCD
2 ABD 12 BCE
3 ABE 13 BCF
4 ABF 14 BDE
5 ACD 15 BDF
6 ACE 16 BEF
7 ACF 17 CDE
8 ADE 18 CDF
9 ADF 19 CEF
10 AEF 20 DEF

(X )
20 20

X
i =1
i
2 i =1
i X
X= =
X
20 20

Graficamente:

10 20 30 40 50 60

O objetivo deste exemplo foi demonstrar o funcionamento do teorema do limite


central, formalizado a seguir.
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 36

Teorema do Limite Central

Para populaes infinitas:


X , a medida que ninfinito, tem distribuio Normal com Mdia= e Desvio-

padro =
n

Quando N finito:
X , a medida que nN, tem distribuio Normal com Mdia= e Desvio-padro
N n
=
n N 1

Exemplo Populao com mdia 0,5

Considere uma populao infinitamente grande com mdia = 0,5 . Vamos avaliar
as distribuies amostrais da mdia amostral X com n = 30 e 300.

2,0 3,5
3,0
1,5 2,5
2,0
1,0
1,5

0,5 1,0
0,5
- -
0 0,2 0,4 0,6 0,8 1 0 0,2 0,4 0,6 0,8 1
Mdias amostrais Mdias amostrais

n = 30 n = 300
Percebemos claramente que com o aumento do tamanho amostral a distribuio de
X fica cada vez mais concentrada em torno do parmetro . Isso quer dizer que,
quanto maior amostra, maior a possibilidade de acertarmos o valor do parmetro.
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 37

4.5 Distribuio amostral da proporo ( p )

O estimador p teoricamente pode ser descrito pela distribuio Binomial. Vamos


definir uma varivel binria X assumindo os valores 0 (caracterstica ausente) e 1
(caracterstica presente). Considere uma populao infinita com parmetro p. O
n

x i
estimador imediato de p a proporo amostral p = i =1 . Se assumirmos populao
n
infinita (equivalente a amostragem com reposio) a distribuio amostral de
n p ser descrita pela Binomial com parmetros (n ; p). No caso de populaes
finitas a distribuio de p ser Hipergeomtrica.

Exemplo Populao N=6 e Amostra n=3

A B C D E F
0 1 0 1 1 0

Quadro Possveis estimativas para p


i Amostra p i Amostra pi
i
1 ABC 11 BCD
2 ABD 12 BCE
3 ABE 13 BCF
4 ABF 14 BDE
5 ACD 15 BDF
6 ACE 16 BEF
7 ACF 17 CDE
8 ADE 18 CDF
9 ADF 19 CEF
10 AEF 20 DEF

20

X
i =1
i
p =
20

Para n > 30 a distribuio de p pode ser aproximada pela Normal, com mdia igual
p (1 p )
ao parmetro p e desvio-padro dado por .
n
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 38

Cap. 5 Inferncia Estatstica: Intervalos de Confiana

A estimao por ponto e por intervalo constitui um tipo de inferncia estatstica,


pois buscamos encontrar o verdadeiro valor do parmetro populacional a partir de
uma amostra.

5.1 Estimao por ponto

Visa estimar o valor do parmetro atravs de estimativas pontuais (nicas). A


vantagem ser de fcil e rpida interpretao, mas, em contrapartida, a
probabilidade de acerto na mosca praticamente nula.

Mas por que a probabilidade de acertar na mosca praticamente zero? Voc se


lembra que os estimadores podem ser encarados como variveis aleatrias
contnuas e que, nesse tipo de varivel, no possvel calcular a probabilidade de
ocorrncia para valores exatos, mas sim para intervalos.

5.2 Estimao por intervalo de confiana

Consiste em cercar o valor da estimativa pontual por uma regio cuja probabilidade
de conter o verdadeiro parmetro seja conhecida.

NOTAES que sero utilizadas a partir de agora

(alfa) = nvel de significncia 1 - = nvel de confiana


t = valor da distribuio t de Student com n-1 graus de liberdade e rea
n 1;
2
2
direita.


z = valor da distribuio normal padro com rea direita
2
2

1o) Intervalo de Confiana para (terico)

Conhecendo o teorema do limite central podemos construir intervalos de confiana


para a mdia populacional. Para isso basta cercarmos a estimativa pontual X por
um intervalo cuja probabilidade de conter o parmetro seja conhecida.

P( a < < b ) = 1 O intervalo [a;b] tem 1- de probabilidade de conter .

Mas quais os valores de a e b? O conhecimento do comportamento probabilstico de


X possibilita encontramos um intervalo de confiana para .
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 39


X
P a < < b = 1

n


de confiana = X z
I.C. para com 1-
2 n

Na frmula de IC acima percebemos a presena de um parmetro (). Se estamos


procurando um intervalo de confiana para porque NO conhecemos .
praticamente impossvel conhecermos e no conhecermos . Por isso esse
resultado acaba sendo INTIL na prtica.

2o) Intervalo de Confiana para (prtico)

Ao substituirmos o parmetro por seu estimador s , a distribuio amostral de X


deixa de ter uma distribuio Normal e passa a ter uma distribuio t de Student.
Desta forma os Intervalos de confiana podem ser utilizados em situaes prticas.

s
de confiana = X t
I.C. para com 1-

n 1,
2 n

Quando a populao finita, faz-se necessrio o fator de correo para populaes


finitas:

s N n
de confiana = X t
I.C. para com 1-

n 1,
2 n N 1

Exemplo Dimetro de Aros

Aros so produzidos numa indstria metalrgica. O dimetro nominal de 15cm.


Numa amostra aleatria de 31 aros, o dimetro mdio encontrado foi de 15,3cm
com um desvio-padro de 0,8cm.

Construa um IC 95% para o verdadeiro dimetro mdio dos aros nesta linha de
produo.
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 40

3o) Intervalo de Confiana para uma proporo populacional p

A estimativa pontual para uma proporo dada diretamente pela proporo


amostral.
J vimos que para n>30, a distribuio de p pode ser aproximada pela distribuio
p (1 p )
Normal (p; ). Vamos deduzir a expresso do intervalo:
n

) p ( 1 p )
I.C. para p com 1- de confiana = p z
2
n

N n
O fator de correo acrescentado em caso de populaes infinitas.
N 1

) p (1 p ) N n
I.C. para p com 1- de confiana = p z
2
n N 1

onde z 0,05 =1,645 (90%)


z 0,025 = 1,96 (95%)
z 0,005 = 2,576 (99%)

Exemplo Proporo de reclamaes no perodo de garantia

Uma empresa vendeu 1500 unidades de uma mquina com garantia de 2 anos.
Uma amostra de 150 clientes (leia-se 150 mquinas) revelou que 15 tinham
utilizado os servios de garantia. Construa um Intervalo de confiana 95% para a
verdadeira proporo de clientes que utilizou servios de garantia.
Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 41

5.3 Dimensionamento de Amostras

Dimensionar uma amostra verificar qual o n necessrio para atingir uma preciso
pr-definida, fixando-se um nvel de confiana e fazendo algumas suposies. Na
realidade, dimensionar a amostra controlar a margem de erro do estudo.

Margem de erro = semi-amplitude do Intervalo de Confiana

As expresses a seguir so de fcil aplicao, mas necessrio ter algum


conhecimento prvio sobre a varivel de interesse para ser possvel calcular n. Os
valores de t , X , s e p podem ser obtidos em amostras piloto ou em estudos
anteriores, ou ainda, em ltimo caso, por intuio.

Dedues das expresses de clculo do tamanho amostral:

Para mdias: Para propores:

2
t s z 2 p (1 p )
n 1;
n= 2 n= 2
erro erro 2

Esses tamanhos amostrais precisam ser ajustados em caso em populaes finitas:

N n
n finito =
N +n

Exerccios:

1) No exerccio do dimetro dos aros, qual deveria ser o n para reduzir a margem
de erro para 0,15cm, mantendo a confiana em 95%.

2) No exerccio da garantia, qual deveria ser o n para reduzir a margem de erro


para 2% mantendo a confiana em 95%.

3) Diferencie nvel de confiana de margem de erro.

4) A relao entre a margem de erro e o n linear?


Especializao em Engenharia de Processos e de Sistemas de Produo ESTATSTICA - Pg. 42

Exerccios

1) Segundo a FEE, o rendimento mdio real dos ocupados na RMPA foi


estimado em R$ 1395,00 em Abril/2011. Considerando um desvio-padro
correspondente a 50% da mdia, qual dever ser o tamanho amostral n
para estimar esse rendimento mdio com margem de erro de R$ 100,00.

2) Construir uma curva que mostre o tamanho amostral n como funo do


erro usando os dados do exerccio anterior.

3) Numa amostra de n=120 porto-alegrenses obteve-se um total de 30


pessoas que nasceram em outras cidades.
Construa um intervalo de confiana BINOMIAL e outro usando a frmula
baseada na aproximao pela NORMAL para a proporo de poto-
alegrenses que no nasceram em POA.

4) Extrair 500 amostras de tamanho n=30 da populao N=10.000 do


arquivo Excel. Construir intervalos para cada estimativa de x-barra e
contar quantos contm o parmetro.