Sei sulla pagina 1di 93

MINISTRIO DA EDUCAO

UNIVERSIDADE FEDERAL DO PIAU


CENTRO DE CINCIAS DA NATUREZA
DEPARTAMENTO DE QUMICA

ESTATSTICA APLICADA QUMICA

Prof. Dr. Alexandre Araujo de Souza

Teresina PI
2013

SUMRIO
ASSUNTO
1. Conceitos Fundamentais em Estatstica. Organizao de
dados quantitativos. Estatstica descritiva. Populao e
amostra. Distribuies de frequncias. Tabelas. Grficos.
Histogramas. Medidas de tendncia central e de disperso:
mdia, mediana, moda, varincia, desvio-padro. Freqncia
relativa e probabilidade.
2. Aplicao da Matemtica Estatstica. Varivel aleatria.
Distribuies de probabilidade. A distribuio normal.
Esperana. Varincia. Distribuio amostral das mdias.
Estatstica inferencial. Teste de hipteses. Hiptese nula.
Testes unilaterais e bilaterais. Erros do tipo I e do tipo II. Nvel
de significncia. Teste Z. Teste t. Teste F. Intervalos de
confiana.
3. Mtodos Grficos e Numricos. Diagramas de disperso.
Correlao linear. Coeficiente de correlao de Pearson, r.
Coeficiente de determinao, r2. Teste de hipteses sobre a
correlao. Regresso linear simples. Mtodo dos mnimos
quadrados. Anlise de resduos.
4. Fontes de Erro em Anlise Qumica. Algarismos
significativos. Erro e desvio de uma medida. Exatido e
preciso. Tipos de erros: determinados e indeterminados.
Preciso de uma medida. Limite de confiana da mdia.
Propagao de erros. Rejeio de resultados: teste Q.
Amostragem. Padronizao. Calibrao. Validao. Certificao
da qualidade.

CARGA
HORRIA

04 h

12 h

10 h

04 h

Captulo 1. Conceitos Fundamentais em Estatstica.

Introduo

Estatstica a cincia que faz uso efetivo dos dados numricos relativos a
grupos de indivduos ou experimentos. Nesse sentido, ela trata de todos os aspectos,
incluindo no s a coleta, organizao, anlise e interpretao dos dados, mas
tambm o planejamento da coleta de dados. Importante dizer que todos os mtodos
estatsticos baseiam-se na teoria das probabilidades. A Estatstica bastante til para
orientar a tomada de decises baseada na anlise de um nmero muito grande de
dados, tal como pesquisas de opinio pblica e de mercado. A palavra estatstica
tambm pode ser usada para significar o prprio conjunto de dados, ou as grandezas
a ele associadas, tais como a mdia e o desvio-padro. Assim, num conjunto de
dados, podemos dizer que a mdia uma estatstica.
A etimologia, ou origem da palavra Estatstica, mostra que ela deriva da
palavra Estado. De fato, a expresso em Latim Moderno, statisticum collegium
(conselho de Estado) e a palavra em Italiano, statista (homem de Estado, Poltico),
fizeram com que o filsofo alemo Gottfried Achenwall (1719-1772) introduzisse o
termo em Alemo, Statistik, em 1749, significando anlise dos dados sobre o Estado.
Assim, a Estatstica foi originalmente desenvolvida para resolver questes de Estado,
tais como taxas de nascimento e de mortalidade, impostos, heranas, fortunas, etc.
Apesar de sua origem peculiar, a Estatstica hoje utilizada nas mais diversas
reas. Ela est presente nas teorias mais fundamentais da Fsica Moderna, como a
Mecnica Quntica, e hoje se sabe que a natureza das partculas fundamentais
governada por leis estatsticas. Nas reas de Sade, a Estatstica conhecida como
Bioestatstica. O nome pode ser diferente, mas os mtodos so os mesmos, sendo
apenas as aplicaes especficas para as reas de Sade. A Qumica utiliza bastante
a Estatstica, em suas diversas reas. Entretanto, a rea que mais faz uso da
Estatstica a Qumica Analtica. Nesse sentido, a compreenso da teoria de erros
e da obteno de retas de regresso, pelo mtodo dos mnimos quadrados, esto
entre os pontos mais relevantes. Reconhecer os tipos de erros em anlises
qumicas, saber como a propagao dos erros e como eles afetam o resultado
de suma importncia para o qumico. As retas de regresso so bastante usadas nas
curvas de calibrao, empregadas em diversas tcnicas de anlises quantitativas.

Populao e Amostra

Populao o conjunto de todos os elementos, ou resultados, do grupo em


que estamos interessados em estudar alguma caracterstica. Um exemplo so todos
os brasileiros do sexo feminino. Elas constituem uma populao, caso queiramos
estudar alguma caracterstica delas, por exemplo, a estatura. Outro exemplo, se
formos fabricantes de postes de concreto para iluminao e tivermos de testar a
resistncia ruptura dos postes, para atender s normas tcnicas, ento toda a
produo ser a nossa populao. Repare que, coletar os dados de uma populao,
muitas vezes invivel, pois o custo muito alto, como no caso da pesquisa com
todas as brasileiras. Em outros casos, a coleta de dados da populao destruiria toda
a populao, como no caso dos postes de concreto para iluminao. O ensaio de
resistncia trao danifica os postes. No sensato realizar esse experimento na
populao, pois se trata de toda a sua produo.
Uma populao pode ser finita ou infinita. Nos casos acima, as populaes
so finitas. Se uma moeda jogada uma nica vez, a populao, P constituda pelo
conjunto de todos os resultados possveis, ou seja, P = {cara;coroa}. Se uma moeda
jogada duas vezes, a populao, P constituda pelo conjunto de todos os resultados
possveis, ou seja, P = {cara/cara; cara/coroa; coroa/cara; coroa/coroa}. Nesses dois
exemplos, as populaes so finitas. No primeiro caso, a populao tem 21 = 2 (dois)
elementos. No segundo caso, a populao tem 22 = 4 (quatro) elementos. Entretanto,
considere uma moeda sendo jogada vrias vezes, indefinidamente. A cada jogada, d
cara ou coroa. A populao, nesse caso infinita, pois consiste nas infinitas
possibilidades de resultados possveis. Se uma moeda for jogada n vezes, o tamanho
da populao ser dado por 2n.
Exerccio Resolvido.
Se uma moeda for jogada trs vezes (n=3), primeiro calcule o tamanho da populao e depois escreva o
conjunto de resultados P que representa a populao.
Resoluo:
Tamanho da populao = 23 = 8 (oito)
P = {cara/cara/cara; cara/cara/coroa; cara/coroa/cara; coroa/cara/cara; coroa/cara/coroa; coroa/coroa/cara;
cara/coroa/coroa; coroa/coroa/coroa}

Amostra um subconjunto de uma populao. uma frao de elementos,


coletada da populao, para fins de anlise. Os dados geralmente so coletados a
partir de amostras. Esse processo de coleta de dados denominado amostragem. A
amostra deve ser representativa da populao. Por exemplo, se resolvermos
pesquisar apenas brasileiras de uma cidade onde a mdia das mulheres mais alta
que a mdia nacional, ento chegaremos concluso errada de que a mulher
brasileira mais alta do que realmente . Esse um exemplo de uma amostra que
no representativa. Uma amostra representativa deve conter brasileiras de diversas
cidades, de regies bem distintas do Brasil, com estaturas mdias bastante variadas.
No caso da produo de postes de concreto para iluminao, apenas uma pequena
frao da produo (amostra) dever ser sacrificada para atender norma tcnica.
No caso de uma moeda que foi jogada apenas duas vezes (n=2), apesar do
tamanho da populao ser pequeno (22=4), a quantidade de amostras possveis bem
grande, pois cada subconjunto uma amostra. S para se ter uma idia, e lembrando
que o conjunto vazio {

}, bem como o conjunto todo, so sempre subconjuntos de

qualquer conjunto, podemos escrever aqui apenas algumas das amostras possveis
para essa pequena populao: P={cara/cara; cara/coroa; coroa/cara; coroa/coroa}.
Teremos amostras com zero, um, dois, trs e quatro elementos. O tamanho da
amostra o nmero de elementos da amostra. Este exemplo foi colocado para ilustrar
que h sempre uma enorme quantidade de amostras, para qualquer populao.

Amostras (subconjuntos) possveis para uma populao onde uma moeda foi
jogada duas vezes:
A01 = { }
A02 = {cara/cara}
A03 = {cara/coroa}
A04 = {coroa/cara}
A05 = {coroa/coroa}
A06 = {cara/cara; cara/coroa}
A07 = {cara/cara; coroa/cara}
A08 = {cara/cara; coroa/coroa}
A09 = {cara/cara; cara/coroa; coroa/cara}
A10 = {cara/cara; cara/coroa; coroa/coroa}

Afinal = {cara/cara; cara/coroa; coroa/cara; coroa/coroa}.

Organizao de Dados Quantitativos

Os dados quantitativos so representados por nmeros e so denominados


variveis aleatrias. Para se utilizar a Estatstica, os dados devem ser organizados
em tabelas e grficos. O exemplo a seguir trata da anlise de ons cloreto [Cl] da
gua tratada em um municpio brasileiro. Os valores das concentraes de cloreto na
gua, medidos em 25 coletas so apresentados abaixo, em mg/L.
Concentraes de ons cloreto [Cl] medidas em 25 coletas de gua tratada em um municpio
brasileiro. As unidades esto em mg/L.
254
253 253
252 252 252
251 251 251 251
250 250 250 250 250
249 249 249 249
248 248 248
247 247
246
Os dados acima esto desorganizados. Vamos coloc-los na forma de uma
tabela. A Tabela 1 apresenta os dados obtidos de forma organizada, colocando
para cada valor obtido, a frequncia absoluta, f com que ele observado. Por
exemplo, o valor 250 foi observado em 5 (cinco) coletas. Portanto, a frequncia
absoluta do valor 250 f = 5. A frequncia relativa, fr representa a frao que o valor
observado. Por exemplo, o valor 250 observado numa frao de fr = 0,20. Ou seja,
em 20% das observaes.
A frequncia relativa, fr calculada dividindo-se a frequncia absoluta , f
pelo tamanho da amostra, N.
 =




Tabela 1. Concentrao de ons cloreto [Cl] medidos na gua tratada de um municpio


brasileiro. As unidades de concentrao esto em mg/L. Tamanho da amostra,
N=25. f = frequncia absoluta. fr =frequncia relativa.
[Cl]
f
fr

246
1
0,04

247
2
0,08

248
3
0,12

249
4
0,16

250
5
0,20

251
4
0,16

252
3
0,12

253
2
0,08

254
1
0,04

A somatria de todas as frequncias absolutas numericamente igual ao


tamanho da amostra. Podemos ver isso no exemplo da Tabela 1, fazendo a conta:
1+2+3+4+5+4+3+2+1 = 25
Essa igualdade representada pela equao abaixo, onde foi utilizado o
smbolo de somatria, representado pela letra grega sigma maiscula, .
 = 
A somatria de todas as frequncias relativas numericamente igual
unidade. Podemos ver isso no exemplo da Tabela 1, fazendo a conta:
0,04 + 0,08 + 0,12 + 0,16 + 0,20 + 0,16 + 0,12 + 0,08 + 0,04 = 1
Essa igualdade representada pela equao abaixo, onde foi utilizado o
smbolo de somatria, representado pela letra grega sigma maiscula, .

  = 1
Os dados da Tabela 1 podem ser visualizados na forma grfica. Uma forma
bastante usual o histograma de frequncias. Nesse grfico, a grandeza medida, ou
varivel aleatria, colocada no eixo horizontal (abscissa) e a frequncia absoluta,
ou a relativa, no eixo vertical (ordenada). A Figura 1 mostra o histograma de
frequncias para os dados da Tabela 1.

0,20

fr

0,15

0,10

0,05

0,00
246

247

248

249

250

251

252

253

254

[Cl ]/mg/L

Figura 1. Histograma de frequncias para os dados da Tabela 1.

Observa-se, no histograma de frequncias da Figura 1, que a


distribuio dos valores da varivel aleatria simtrica em relao a um
valor central, igual a 250 mg/L. Esse comportamento compatvel com um
tipo de distribuio de probabilidade que ser visto mais adiante, denominada
distribuio normal.

Medidas de Tendncia Central

Um conjunto de dados pode ser representado por um nico nmero,


denominado mdia. Trata-se de uma medida de tendncia central cujo significado vai
ficar mais claro medida que os exemplos forem sendo dados.
Considere o seguinte conjunto de dados:
x1 = 40

x4 = 43

x2= 41

x5 = 44

x3 = 42

x6 = 45

A mdia aritmtica simples de um conjunto de dados, ou simplesmente


mdia definida pela soma entre todos os elementos do conjunto, com a subsequente
diviso pelo nmero de elementos do conjunto.
Se o conjunto de dados for uma populao, a mdia populacional
representada pela letra grega mi minscula, . Caso o conjunto de dados seja uma
.
amostra, a mdia amostral representada pela por um  com uma barra em cima, 

Quem vai determinar se o conjunto de dados uma populao ou uma amostra a


pessoa que est fazendo a estatstica dos dados.
Vamos considerar que os dados acima sejam uma amostra. Ento a mdia
amostral ser dada por:

1
 =  +  +  +  +  +  
6

1
 = 40 + 41 + 42 + 43 + 44 + 45
6

1
 = 255
6
 = 42,5

A frmula geral da mdia aritmtica simples dada pelas equaes abaixo,


onde o i que aparece denominado ndice e um nmero inteiro que varia, por
exemplo, de 1 a n, no caso de uma populao, ou seja: i = 1, 2, 3, ..., n...

Frmula para a mdia populacional. O tamanho da populao n.

=

1
 



Frmula para a mdia amostral. O tamanho da amostra N.

 =

1
 



No caso de dados, como os da Tabela 1, em que temos as frequncias, o


clculo da mdia pode ser feito de uma das seguintes formas:

Frmula para a mdia amostral, usando as frequncias absolutas, . O

tamanho da amostra N.

 =

1
  



Frmula para a mdia amostral, usando as frequncias relativas,  Neste

caso, no preciso dividir pelo tamanho da amostra.

 =   


Faamos os clculos com os dados da Tabela 1, das duas formas. Primeiro


usando as frequncias absolutas:

 =

1
1 246 + 2 247 + 3 248 + 4 249 + 5 250 + 4 251 + 3 252 + 2 253 + 1 254#
25
 =

1
6250#
25

 = 250

Agora, refaamos o clculo da mdia, usando as frequncias relativas:


 = 0,04 246 + 0,08 247 + 0,12 248 + 0,16 249 + 0,20 250 + 0,16 251 + 0,12 252
 = 250

+ 0,08 253 + 0,04 254#

Observem que os valores calculados para as mdias foram o mesmo, pelos

dois mtodos, ou seja, obteve-se uma mdia de  = 250 mg/L para a concentrao de
ons cloreto na gua tratada desse municpio brasileiro. Olhando para o histograma de

frequncias da Figura 1, vemos que esse valor coincide com o valor central da
distribuio de frequncias. Para uma distribuio simtrica como essa, a mdia
coincide com o valor central da distribuio. Isso ocorre na distribuio normal, a
qual ser vista mais adiante. Por esta razo, a mdia considerada uma medida de
tendncia central.
Outras medidas de tendncia central so a moda e a mediana. A moda
simplesmente o valor da varivel que possui a maior frequncia. No caso dos
dados da Tabela 1, a moda 250 mg/L, pois o valor que possui a maior frequncia.

A mediana o valor central, que divide o conjunto de dados em partes iguais.


Os valores dos dados devem ser previamente colocados em ordem crescente.
Sendo N o tamanho da amostra, a posio da mediana pode ser encontrada pela
equao abaixo.
$%&'% *+ ,-*'++ =

+1
2

Considere o seguinte conjunto, com um nmero mpar de dados (N=11):


40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50
A posio da mediana ser: (11+1)/2 = 6 lugar. O valor da mediana ser 45.

Considere, agora, o seguinte conjunto, com um nmero par de dados (N=10):


40, 41, 42, 43, 44, 45, 46, 47, 48, 49
A posio da mediana ser: (10+1)/2 = 5,5. Isso significa que a mediana est
entre o 5 e o 6 lugar. Neste caso, o valor da mediana a mdia entre os valores que
esto no 5 e no 6 lugar. Logo, o valor da mediana ser (44+45)/2 = 44,5.
A mediana bastante til quando temos um valor muito discrepante dos
demais. Por exemplo, as vendas de hambrguer numa lanchonete foram medidas num
perodo de 10 dias. Entretanto, em um determinado dia, no 4 dia, houve uma grande
festa na lanchonete e a venda foi muito mais alta. Vejamos os dados na Tabela 2.

Tabela 2. Nmero de hambrgueres vendidos, em uma determinada lanchonete, em


um perodo de 10 dias.
Dia
Vendas

1
48

2
47

3
52

4
320

5
50

6
45

7
46

8
53

Vamos calcular a mdia para os dados acima:

 =

1
48 + 47 + 52 + 320 + 50 + 45 + 46 + 53 + 44 + 49#
10
 =

1
754#
10

 = 75,4

9
44

10
49

Vamos calcular a mediana, agora. Mas, para isso, primeiro temos que colocar
os dados em ordem crescente, na Tabela 3.

Tabela 3. Nmero de hambrgueres vendidos, em uma determinada lanchonete, em


um perodo de 10 dias. Dados colocados em ordem crescente.
Dia
Vendas

9
44

6
45

7
46

2
47

1
48

10
49

7
50

3
52

8
53

4
320

A posio da mediana ser: (10+1)/2 = 5,5. Ento, a mediana est entre o 5 e


o 6 lugar. Neste caso, o valor da mediana a mdia entre os valores que esto no 5
e no 6 lugar, na Tabela 3. Logo, o valor da mediana ser (48+49)/2 = 48,5.
A mdia 75,4 e a mediana, 48,5. Qual dessas duas medidas reflete melhor as
vendas dirias da lanchonete? bvio que a mediana. E sabe por qu? Porque a
mediana no afetada por valores extremos. J o valor da mdia ficou bem alto,
justamente por causa do valor extremo, 320. Nem sempre a mdia a melhor medida.

Medidas de Disperso

A disperso de um conjunto de dados pode ser representado por um nico


nmero, denominado varincia cujo significado vai ficar mais claro medida que os
exemplos forem sendo dados. A varincia calculada de forma diferente, caso o
conjunto de dados seja uma populao, ou uma amostra. E lembre-se que a pessoa
que est fazendo a estatstica dos dados que vai determinar se o conjunto de dados
uma populao ou uma amostra.

Frmula para a varincia populacional, var(x)= 2. A varincia populacional


representada pelo quadrado da letra grega sigma minscula, . O tamanho da
populao n.

.+  = /  =

1
  



Frmula para a varincia amostral. A varincia amostral representada pelo

quadrado da letra romana s minscula. O tamanho da amostra N.

& =

1
   
 1


A varincia tem o significado de ser uma mdia dos quadrados dos


desvios entre cada valor e a mdia amostral, ou populacional. Se todos esses

desvios fossem zero,    = 0, a varincia seria zero. Verifique que, se o tamanho

da amostra for muito grande, no far diferena usar N1 ou N no denominador da


ltima equao para s2. A diferena s relevante para amostras pequenas.

Considere o seguinte conjunto de dados abaixo, cuja mdia 42,5.


x1 = 40

x4 = 43

x2= 41

x5 = 44

x3 = 42

x6 = 45

Se o conjunto de dados acima for uma populao de media =42,5 e tamanho


n=6, ento a varincia populacional calculada da seguinte forma:

/ =

1
 40 42,5 + 41 42,5 + 42 42,5 + 43 42,5 + 44 42,5 + 45 42,5 #
6
/ =

1
17,5#
6

/  = 2,91666
23 3, 43

Se o conjunto de dados acima for uma amostra de media  = 42,5 e tamanho

N=6, ento a varincia amostral calculada da seguinte forma:

& =

1
 40 42,5 + 41 42,5 + 42 42,5 + 43 42,5 + 44 42,5
6 1
+ 45 42,5 #

& =

1
17,5#
5

53 = 6, 7

Existe uma frmula prtica para calcular a varincia populacional, que a


seguinte.
.+  = 888
   
fcil obter o valor de   = 42,5 = 1806,25.

O valor de 888
  obtido a partir da mdia dos quadrados dos valores de x.
x12 = (40)2= 1600

x42 = (43)2= 1849

x22= (41)2= 1681

x52 = (44)2= 1936

x32 = (42)2= 1764

x62 = (45)2= 2025

1
888
  = 1600 + 1681 + 1764 + 1849 + 1936 + 2025
6
1
888
  = 10855
6

888
  = 1809,1666
888 1809,17


Assim, a varincia calculada pela diferena:

888  
.+  = 

.+  = 1809,17 1806,25


9:;  = 3, 43

A varincia tem a desvantagem de ter unidades da varivel ao quadrado. Por


isso, define-se uma medida de disperso muito utilizada denominada desvio-padro
como sendo a raiz quadrada da varincia. Assim, teremos as seguintes equaes.

Desvio-padro populacional:
/ = </  = <.+ 

Desvio-padro amostral:
& = <& 
Vamos agora comparar dois conjuntos de dados amostrais, com varincias

distintas. Primeiramente, vamos utilizar os dados da Tabela 1. Na Tabela 4,


reproduzimos esses dados e acrescentamos os quadrados das concentraes de
cloreto, para ficar mais fcil calcular a varincia. Vamos supor, somente por
simplicidade de clculo, que esses dados sejam referentes a uma populao.

Tabela 4. Concentrao de ons cloreto [Cl] medidos na gua tratada de um municpio


brasileiro. As unidades de concentrao esto em mg/L. Tamanho da amostra,
N=25. f = frequncia absoluta. fr =frequncia relativa.
[Cl]
[Cl]2
f
fr

246
60516
1
0,04

247
61009
2
0,08

248
61504
3
0,12

249
62001
4
0,16

250
62500
5
0,20

251
63001
4
0,16

252
63504
3
0,12

253
64009
2
0,08

254
64516
1
0,04

3 = 37=3 = >37==

888
 =

1
1 60516 + 2 61009 + 3 61504 + 4 62001 + 5 62500 + 4 63001 + 3 63504
25

888
 =

1
1562600#
25

+ 2 64009 + 1 64516#

888
3 = >37=?

2
.+  = 888
2 

.+  = 62504 62500


9:;  = ?

Desvio-padro populacional: 2 = ? = 3 mg/L


Os dados da Tabela 1 constituem uma distribuio simtrica, muito similar a

uma distribuio normal e possuem mdia 250 mg/L e desvio-padro 2 mg/L.

Vamos calcular, agora, a mdia e a varincia para o conjunto de dados da


Tabela 5, assumindo que se trata de uma populao. A Figura 2 apresenta o
histograma de frequncias para os dados da Tabela 5.

Tabela 5. Concentrao de ons cloreto [Cl] medidos na gua tratada de um municpio


brasileiro. As unidades de concentrao esto em mg/L. Tamanho da amostra,
N=25. f = frequncia absoluta. fr =frequncia relativa.
[Cl]
[Cl]2
f
fr

246
60516
1
0,04

247
61009
1
0,08

248
61504
2
0,12

249
62001
8
0,16

250
62500
8
0,20

251
63001
8
0,16

252
63504
2
0,12

253
64009
1
0,08

254
64516
1
0,04

0,25

0,20

fr

0,15

0,10

0,05

0,00
246

247

248

249

250

251

252

253

254

[Cl ] / mg/L

Figura 2. Histograma de frequncias para os dados da Tabela 5.

 =
 =

1
1 246 + 1 247 + 2 248 + 8 249 + 8 250 + 8 251 + 2 252 + 1 253 + 1 254#
25
1
8000#
32

= 37=


3 = 37=3 = >37==

888
 =

1
1 60516 + 1 61009 + 2 61504 + 8 62001 + 8 62500 + 8 63001 + 2 63504
32

888
 =

1
2000082#
32

+ 1 64009 + 1 64516#

888
3 = >37=3, 7>37

2
.+  = 888
2 

.+  = 62502,5625 62500


9:;  = 3, 7>37

Desvio-padro populacional: 2 = <3, 7>37 = B, >

Os dados da Tabela 5 constituem uma distribuio simtrica, muito similar


uma distribuio normal e possuem mdia 250 mg/L e desvio-padro 1,6 mg/L. Com
relao aos dados da Tabela 1, a mdia manteve-se a mesma. Entretanto, o desviopadro apresentou-se menor no segundo caso. Esse fato pode ser visualizado pela
comparao dos histogramas de frequncia das Figuras 1 e 2. No primeiro caso, os
dados esto mais dispersos, enquanto que, no segundo caso, os dados esto mais
concentrados em torno do valor central. Em outras palavras, a disperso dos dados
maior no primeiro caso e esse fato medido pelo valor maior do desvio-padro da
distribuio de frequncias.

0,25

0,20

0,20

0,15

fr

fr

0,15

0,10

0,10

0,05
0,05

0,00

0,00
246

247

248

249

250

251

252

253

254

246

247

248

249

250

251

252

253

254

[Cl ]/mg/L

[Cl ] / mg/L

Figura 1. Histograma de frequncias

Figura 2. Histograma de frequncias

para os dados da Tabela 1.

para os dados da Tabela 5.

= 250 mg/L ; = 2,0 mg/L

= 250 mg/L ; = 1,6 mg/L

Dados Agrupados

Muitas vezes, os dados aparecem na forma de dados agrupados, como


ocorre na Tabela 6.

Tabela 6. Peso de pessoas que trabalham em certa companhia. (N=40)


Peso / kg
64-66
67-69
70-72

Frequncia Absoluta
16
21
2

Para se calcular a mdia em um conjunto de dados como esse, devemos fazer


a suposio de que a distribuio dos pesos uniforme dentro de cada classe. O
histograma de frequncias da Figura 3 ilustra esse conceito.

frequncia absoluta

20

15

10

0
64

65

66

67

68

69

70

71

pesos / kg

Figura 3. Histograma de frequncias para os dados agrupados da Tabela 6.

Assim, a mdia da distribuio pode ser calculada atravs da equao abaixo,

onde C o ponto mdio de cada classe. Faamos o clculo para o exemplo da


Tabela 6.

 =

1
  



 =

1
16 65 + 21 68 + 2 71#
40


 =

1
2610#
40

= >7, 37


Vamos supor que tivssemos acesso aos dados mais completos e


pudssemos construir a tabela de dados agrupados mostrada na Tabela 7.

Tabela 7. Peso de pessoas que trabalham em certa companhia. (N=40)


Peso / kg
64
65
66
67
68
69
70
72

Frequncia Absoluta
3
5
8
11
7
3
2
1

Agora podemos calcular a mdia e comparar com aquela anteriormente feita,


com a suposio de que a distribuio dos pesos uniforme dentro de cada classe. O
histograma de frequncias da Figura 4 mostra a real distribuio dos pesos.

Frequncia Absoluta

10

0
64

65

66

67

68

69

70

71

72

Pesos / kg

Figura 4. Histograma de frequncias para os dados da Tabela 7.

 =

 =

1
  


 =

1
2747#
40

1
3 64 + 5 65 + 8 66 + 11 67 + 7 68 + 3 69 + 3 70 + 1 72#
40
= >E, >E


Comparando com os resultados da mdias calculadas com os dados

agrupados das Tabelas 6 e 7, verificamos que h um erro:  = 68,68 65,25 = 3,43.

O mesmo se dar ao se calcular a varincia. Esse erro se deveu ao fato de termos


poucos dados agrupados na Tabela 6 e de termos feito a suposio de que a
distribuio dos pesos uniforme dentro de cada classe. Entretanto, no h outra
suposio razovel que se possa fazer. Logo, muitas vezes, pela falta de dados,
temos de aceitar o fato de que haver um erro.

Probabilidade

Experimento Aleatrio

No experimento exemplificado anteriormente, a concentrao de ons cloreto


foi medida na gua tratada de um municpio brasileiro. O que se obteve como
resultado foi uma distribuio de valores. Por que no se obteve um valor nico? Por
vrias razes. Talvez a concentrao dos ons cloreto seja realmente diferente em
cada ponto de coleta, ou ento pode ter havido erros de vrios tipos durante as
determinaes quantitativas. Quando um experimento pode resultar em uma
distribuio de resultados possveis, ele denominado experimento aleatrio.
Esse o tipo de experimento que interessa para a Estatstica. Uma varivel medida
em um experimento aleatrio, como a concentrao dos ons cloreto, denominada
varivel aleatria. A jogada de uma moeda, M vezes, tambm um experimento
aleatrio, pois resulta em uma distribuio de resultados possveis, caras e coroas,
que so as variveis aleatrias.

Espao Amostral

O conjunto de todos os resultados possveis para a varivel aleatria


denominado espao amostral. Nesse sentido, o espao amostral tem o mesmo
sentido da populao definida anteriormente. No caso das concentraes de ons
cloreto, esse conjunto tem um tamanho infinito, pois h uma quantidade infinita de
valores possveis para os resultados. Entretanto, h espaos amostrais de tamanho
finito, como o caso do experimento aleatrio de uma moeda sendo jogada M vezes.
O tamanho do espao amostral, neste caso, ser dado por 2M. Para simplificar a
notao, representaremos o resultado cara pela letra K e coroa pela letra C.

Cara
Coroa

=
=

K
C

Desde j vamos deixar bem claro que a jogada de uma nica moeda M vezes
e uma nica jogada de M moedas so experimentos aleatrios completamente
equivalentes, com os mesmos espaos amostrais.
O espao amostral, para a jogada de uma moeda, possui 21 = 2 elementos
dado pelo conjunto, A1 abaixo. O espao amostral, para a jogada de duas moedas,
possui 22 = 4 elementos dado pelo conjunto, A2 abaixo. O espao amostral, para a
jogada de trs moedas, possui 23 = 8 elementos e dado pelo conjunto, A3 abaixo.

A1 = {K, C}
A2 = {KK, KC, CK, CC}
A3 = {KKK, KKC, KCK, KCC, CKK, CKC, CCK, CCC}

Evento

Evento todo subconjunto de um espao amostral. Nesse sentido, evento


tem o mesmo sentido da amostra definida anteriormente. Usando o exemplo acima, da
jogada de trs moedas, podemos escrever alguns eventos abaixo, em relao ao
espao amostral A3, com seus significados escritos ao lado.

E3,1 = {KKK, KKC, KCK, KCC}: Sair cara no lanamento da primeira moeda.
E3,2 = {KKC, KCK, CKK}: Sair exatamente uma coroa.
E3,3 = {KKK, KKC, KCK, KCC, CKK, CKC, CCK}: Sair no mximo duas coroas.
E3,4 = {KKK, KKC, KCK, CKK}: Sair pelo menos duas caras.
E3,5 = {KKK}: No sair nenhuma coroa.

Probabilidade de um Evento

Para chegar ao conceito de probabilidade, vamos usar os exemplos vistos


anteriormente. Considere o espao amostral para o lanamento de trs moedas, A3 e
o evento que seja sair pelo menos duas caras, E3,4.
A3 = {KKK, KKC, KCK, KCC, CKK, CKC, CCK, CCC}
E3,4 = {KKK, KKC, KCK, CKK}: Sair pelo menos duas caras.
A pergunta a seguinte: no lanamento de trs moedas, qual a
probabilidade de sair pelo menos duas caras?
A maneira formal de definir probabilidade considera o seguinte:

N E = nmero de elementos do evento.

N A = nmero de elementos do espao amostral.

Assim, a probabilidade, P(E) de ocorrncia do evento E, no espao

amostral A, dada pela seguinte razo:

J K =

 K
 L

Para o exemplo acima, o clculo da probabilidade fica assim:


J K =

 K 4 1
= = = 0,50
 L 8 2

O resultado foi P E=0,50 ou seja, h 50% de chance de sair pelo menos duas

caras no lanamento de trs moedas.

Exerccio Resolvido.
Uma moeda jogada 2 vezes. Calcule a probabilidade de sair cara na primeira jogada e coroa na segunda.
Resoluo:
Primeiro escrevem-se o espao amostral e o evento, com os respectivos tamanhos.
A2 ={KK, KC, CK, CC}; N(A) = 4;

E2,1 = {KC}; N(E) = 1

A seguir, calcula-se a probabilidade do evento, pela equao abaixo.


J K =

 K 1
= = 0,25
 L 4

Logo, h 25% de chance de sair cara na primeira jogada e coroa na segunda.

Frequncia Relativa e Probabilidade

Uma segunda forma de definir probabilidade atravs do conceito de


frequncia relativa. Neste caso, definimos as seguintes grandezas:

nE = nmero de vezes que o evento E observado.


N = nmeros de vezes que o experimento aleatrio repetido.
Assim, a frequncia relativa, f de ocorrncia do evento E, no experimento

aleatrio, dada pela seguinte razo:

=

N


No lanamento de trs moedas, a frequncia relativa de sair pelo menos duas


caras depende do nmero de repeties e do que foi observado. Se o experimento foi
repetido N=100 vezes e obtiveram-se pelo menos duas caras em nE = 48 vezes, ento
a frequncia relativa de sair pelo menos duas caras, neste caso foi f=0,48.

Acompanhe o clculo abaixo.


=

N
48
=
= 0,48
 100

Verifique que o valor obtido aproxima-se bastante do valor calculado para a


probabilidade (P=0,50). De fato, o valor da frequncia relativa tende para o valor da
probabilidade, quando o experimento aleatrio for repetido um nmero muito grande
de vezes. Por isso, vlida a seguinte definio de probabilidade, que utiliza o
conceito de limite, quando N tender a infinito ().
N
J = lim W X
TV 

Probabilidade da Unio de dois Eventos Mutuamente Excludentes

A unio de dois conjuntos A e B, simbolizada por A


B, o conjunto que
contm todos os elementos dos dois conjuntos. Por exemplo, considere os
conjuntos A e B a seguir:

A = {1,3,5,7,9}
B = {0,2,4,6,8}

Os conjuntos A e B acima no contm nenhum elemento em comum. So


assim chamados conjuntos disjuntos, ou mutuamente excludentes. Diz-se que a
interseo entre eles vazia, ou seja; AB = { }. A unio AB ser o conjunto dado
abaixo:
AB = {0,1,2,3,4,5,6,7,8,9}
Agora vamos tratar da probabilidade da unio de dois eventos mutuamente
excludentes. A probabilidade da unio de dois eventos A e B, mutuamente
excludentes, igual soma das probabilidades de cada evento individual.
A probabilidade da unio de dois eventos A e B interpretada como a
probabilidade de ocorrncia do evento A ou do evento B.

J L %Y Z = J L Z = J L + J Z (Eventos mutuamente excludentes)

Considere, agora, uma moeda sendo jogada duas vezes. J vimos que o
espao amostral dado pelo conjunto abaixo:
A2 = {KK, KC, CK, CC}
Vamos considerar dois eventos que sejam mutuamente excludentes. Por
exemplo:

E2,1 = {KK}: Sair duas caras.


E2,2={KC,CK}: Sair exatamente uma cara (ou uma coroa).

A unio desses dois eventos o seguinte conjunto:


E2,1E2,2 = {KK, KC, CK}
Pode-se ver que os eventos E2,1 e E2,2 so mutuamente excludentes, pois no
apresentam nenhum elemento em comum. Ento podemos calcular a probabilidade da
unio dos dois eventos pela equao acima. Primeiro, calculamos as probabilidades
dos eventos individuais.

J\K, ] =

\K, ] 1
= = 0,25
 L 
4

J\K, ] =

\K, ] 2
= = 0,50
 L 
4

A seguir, aplicamos a equao da soma, para calcular a probabilidade da unio


dos eventos.
J\K2,1 K2,2 ] = J\K2,1 ] + J K2,2 
J\K2,1 K2,2 ] = 0,25 + 0,50
J\K2,1 K2,2 ] = 0,75
Interpretamos a resposta assim: a probabilidade de sair duas caras ou
exatamente uma cara (ou uma coroa) de 75%. Tambm podemos dizer que a
probabilidade de ocorrncia do evento unio E2,1E2,2 de 75%. Essa conta s foi
vlida dessa forma porque os dois eventos eram mutuamente excludentes. Vamos
aprender, mais a frente, a calcular a probabilidade da unio de eventos que no so
mutuamente excludentes.

Probabilidade da Interseo de dois Eventos

A interseo de dois conjuntos A e B, simbolizada por A


B, o conjunto
que contm todos os elementos que pertencem simultaneamente aos dois
conjuntos. Por exemplo, considere os conjuntos A e B a seguir:

A = {1,2,5,6,9}
B = {0,2,4,6,8}

A interseo entre os conjuntos A e B acima o conjunto dado abaixo:


AB = {2,6}
Como se v, os conjuntos A e B acima possuem dois elementos em comum.
Portanto no so disjuntos, ou seja, no so mutuamente excludentes.
No h uma frmula geral para calcular a probabilidade da interseo entre
dois eventos A e B. Por isso, teremos de obter a interseo e contar seu nmero de
elementos. A partir da, a interseo passa a ser vista como um evento e a
probabilidade calculada com a frmula da probabilidade de um evento.
A probabilidade da interseo de dois eventos A e B interpretada como
a probabilidade de ocorrncia do evento A e do evento B.
Consideremos uma moeda sendo jogada trs vezes. J vimos que o espao
amostral dado pelo conjunto abaixo:
A3 = {KKK, KKC, KCK, KCC, CKK, CKC, CCK, CCC}

Vamos considerar os dois eventos seguintes;


E3,1 = {KKC, CCK}: Sair duas caras ou duas coroas, nas duas primeiras jogadas.
E3,2 = {KKC, KCK, CKK}: Sair exatamente duas caras.
A interseo desse dois eventos dada pelo conjunto abaixo:
E2,1E2,2 = {KKC}
Logo, a probabilidade da interseo desses dois eventos calculada pela
equao abaixo.

J\E2,1 E2,2 ] =

\E2,1 E2,2 ] 1
= = 0,125
8
 L 

Interpretamos a resposta assim: a probabilidade de sair duas coroas, nas duas


primeiras jogadas e sair exatamente duas caras igual a 12,5%. Tambm podemos
dizer que a probabilidade de ocorrncia do evento interseo E2,1E2,2 de 12,5%.

Probabilidade Geral da Unio de dois Eventos

Agora estamos em condies de formular a equao que estabelece a


probabilidade da unio de dois eventos A e B, sejam eles mutuamente excludentes, ou
no. A frmula bastante geral e dada abaixo.

J L %Y Z = J L Z = J L + J Z J L Z

No caso dos eventos mutuamente excludentes, o termo P AB=0 e a


equao torna-se igual quela que foi vista anteriormente. Assim, v-se que aquela
equao um caso particular desta ltima.
Por exemplo, considere, agora, uma moeda sendo jogada duas vezes. J
vimos que o espao amostral dado pelo conjunto abaixo:
A2 = {KK, KC, CK, CC}
Vamos considerar dois eventos que no sejam mutuamente excludentes, ou
seja, que tenham pelo menos um elemento em comum. Por exemplo:
E2,1 = {KK}: Sair duas caras.
E2,2 = {KK, KC,CK}: Sair pelo menos uma cara.
A interseo entre os eventos dada pelo conjunto abaixo:
E2,1E2,2 = {KK}
Vamos agora calcular a probabilidade da unio dos dois eventos, usando a
ltima equao.
J\K2,1 K2,2 ] = J\K2,1 ] + J\K2,2 ] J K2,1 K2,2 

J\K2,1 K2,2 ] =

\K2,1 ] \K2,2 ]  K2,1 K2,2 


+

 L 
 L 
 L 

J\K2,1 K2,2 ] =

1 3 1 3
+ = = 0,75
4 4 4 4

Interpretamos a resposta assim: a probabilidade de sair duas caras ou de sair


pelo menos uma cara de 75%. Note que, se no fosse a subtrao do termo de
probabilidade de interseo, a soma teria chegado a 100%, dando um resultado
errado.
Exerccio Resolvido.
Uma dado de seis faces jogado 2 vezes. Calcule (a) a probabilidade de sair 1 na primeira jogada e 2 na
segunda jogada; (b) a probabilidade de sair 1 na primeira jogada ou 2 na segunda jogada.

Resoluo:
Primeiro escrevem-se o espao amostral e os eventos, com os respectivos tamanhos.
A2 ={11, 12, 13, 14, 15, 16, 21, 22, 23, 24, 25,26, 31, 32, 33, 34, 35, 36, 41, 42, 43, 44, 45, 46, 51, 52, 53,
54, 55, 56, 61, 62, 63, 64, 65, 66};

N(A2) = 36

E2,1 = {11, 12, 13,14, 15, 16}: Sair 1 na primeira jogada.

N(E2,1) = 6

E2,2 = {12, 22, 32, 42, 52, 62}: Sair 2 na segunda jogada.

N(E2,1) = 6

Os eventos no so mutuamente excludentes. Eles tm um elemento em comum. A interseo entre os


eventos o conjunto: E2,1 E2,2 = {12}.

N(E2,1 E2,2) = 1

(a) A probabilidade de sair 1 na primeira jogada e 2 na segunda jogada a probabilidade da interseo


entre os dois eventos, ou seja, dado pelo clculo abaixo:
J\K, K, ] =

 K, K, 
1
=
= 0,0278
 L 
36

Jogando um dado duas vezes, h uma chance de 2,78% de sair 1 na primeira jogada e 2 na segunda
jogada.

(b) A probabilidade de sair 1 na primeira jogada ou 2 na segunda jogada a probabilidade da unio entre
os dois eventos, ou seja, dado pelo clculo abaixo:

J\K, K, ] = J\K, ] + J\K, ] J K, K, 

J\K, K, ] =

J\K, K, ] =

\K, ] \K, ]  K, K, 


+

 L 
 L 
 L 

6
6
1
+

= 0,167 + 0,167 0,0278 = 0,306


36 36 36

Jogando um dado duas vezes, h uma chance de 30,6% de sair 1 na primeira jogada ou 2 na segunda
jogada.

Amostragem com Reposio

Amostragem significa escolher alguns elementos da populao. Ela pode ser


feita com reposio, ou sem reposio. Na amostragem com reposio, uma vez
que o elemento escolhido uma vez, ele pode voltar a ser escolhido novamente.
Esse o caso das jogadas de moedas e dados. Uma vez que deu resultado cara, na
jogada de uma moeda, nada impede que d cara novamente na prxima jogada.
Quando se joga uma moeda M vezes, o nmero de resultados possveis dado
por 2M. Da mesma forma, quando se joga um dado M vezes, o nmero de resultados
possves dado por 6M. De um modo geral, quando escolhemos M objetos, com
reposio, de uma populao de A objetos, teremos AM maneiras distintas de
selecionar os objetos.
Vamos

analisar

um

exemplo

interessante,

usando

amostragem

com

reposio.Considere uma prova com 30 questes de mltipla escolha, com cinco


alternativas em cada questo. Qual a probabilidade de tirar a nota mxima na prova,
apenas na sorte?
Neste caso, podemos considerar que estamos escolhendo M=30 questes,
com reposio, de uma populao de A=5 alternativas. O nmero total de respostas
possveis dado por AM = 530 = 9,31 x 1020. Como h apenas uma maneira de se
responder a prova para tirar a nota mxima, essa probabilidade ser dada pela conta
abaixo. Verifica-se que o resultado P=1021 extremamente baixo para que algum
consiga acertar a prova toda, apenas na sorte.
J=

1
= 1,07 10b
9,31 10a

Amostragem sem Reposio

Veremos agora a amostragem sem reposio. Na amostragem sem


reposio, uma vez que o elemento escolhido uma vez, ele no pode voltar a
ser escolhido novamente.
Considere que h sete camisas em uma gaveta, para serem usadas durante a
semana, uma cada dia. Suponha que, a cada dia, uma camisa retirada da gaveta,
mas no devolvida, pois vai para o cesto de roupas para serem lavadas. No

domingo, h sete camisas. Na segunda-feira, haver seis. Na tera-feira, cinco. E


assim por diante. No sbado s haver uma camisa na gaveta. De quantas maneiras
diferentes podem-se escolher as camisas para os sete dias da semana?
No domingo, h 7 escolhas possveis de camisas. Na segunda-feira, h 6
escolhas possveis. Ento, haver 7x6=42 escolhas possveis para os dois primeiros
dias. Continuando o processo, podemos concluir que haver o seguinte nmero de
escolhas possveis de camisas para toda a semana;
7! = 7 x 6 x 5 x 4 x 3 x 2 x 1 = 5 040
Em outras palavras, h 5040 maneiras diferentes de se escolher as camisas
durante a semana, assumindo que a retirada das camisas sem reposio. Este
uma caso de permutao de 7 camisas.
Caso a escolha tivesse sido feita com reposio, esse nmero seria bem maior:
7

7 =823 543.
O valor 7! denominado fatorial de 7. O fatorial de um nmero muito
importante na teoria das probabilidades. Abaixo esto os valores dos fatoriais de zero
a dez, dando a idia do conceito. Os valores dos fatoriais crescem muito depressa e
nmeros grandes tm fatoriais gigantescos, por exemplo, 70! 10100.
Por definio, o fatorial de zero 1.

0! =1
1! = 1
2! =2x1 =2
3! = 3x2x1 = 6
4! = 4x3x2x1 = 24
5! = 5x4x3x2x1 = 120
6! = 6x5x4x3x2x1 = 720
7! = 7x6x5x4x3x2x1 = 5 040
8! = 8x7x6x5x4x3x2x1 = 40 320
9! = 9x8x7x6x5x4x3x2x1 = 362 880
10! = 10x9x8x7x6x5x4x3x2x1 = 3 628 800

Arranjos

Vamos considerar ainda a amostragem sem reposio. Entretanto, considere


agora que h dez camisas em uma gaveta, para serem usadas durante a semana,
uma cada dia. Note que, neste caso, nem todas as camisas sero usadas. De quantas
maneiras diferentes podem-se escolher as camisas para os sete dias da semana?
H 10 escolhas para o domingo, 9 para a segunda, 8 para a tera, e assim por
diante. No sbado haver 4 camisas na gaveta. Podemos concluir que haver o
seguinte nmero de escolhas possveis de camisas para toda a semana:
10 x 9 x 8 x 7 x 6 x 5 x 4=604 800
Em outras palavras, h 604 800 maneiras diferentes de se escolher as camisas
durante a semana, assumindo que a retirada das camisas sem reposio. Este
uma caso de arranjo de 10 camisas durante os 7 dias da semana.
Podemos escrever uma frmula conveniente para arranjos, em termos de
fatoriais. Vamos usar o ltimo exemplo para deduzir essa frmula. Note que a ltima
expresso pode ser reescrita na forma abaixo:
10 9 8 7 6 5 4 3 2 1 10!
10!
=
=
= 604 800
10 7!
321
3!

A expresso acima mostra que a frmula para o arranjo, de de j objetos,


f

escolhidos sem reposio, de uma populao de n objetos pode ser escrita na


forma abaixo.

Lh =
i

!
 j!

Combinaes

Vamos considerar ainda a amostragem sem reposio. Vamos considerar uma


exemplo bastante conhecido na loteria, a Mega-Sena. So 60 dezenas e voc tem de
acertar seis. A pergunta , de quantas formas distintas pode-se escolher as seis
dezenas?

Poderamos pensar em um arranjo. No incio tem-se 60 dezenas. Depois de


sorteada a primeira dezena, sobram 59. Depois de sorteada a segunda, sobram 58. E
assim por diante. Pode-se pensar no seguinte clculo de arranjo:
60 x 59 x 58 x57 x56 x55 = 36 045 979 200
Esse resultado seria calculado pela frmula do arranjo d>>= , dada abaixo.
La =

60!
60! 60 59 58 57 56 55 54!
=
=
= 36 045 979 200
60 6! 54!
54!

O nico problema com esse clculo o seguinte. Suponha que tenha sado as
dezenas: 01, 05, 23, 25, 37, 39. Esse clculo conta todas as permutaes possveis
dessas dezenas. Ento, temos de dividir o resultado pelo nmero de
permutaes, ou seja 6! = 720. Isto porque a ordem em que os resultados saem
no importa.


Assim, a frmula para a combinao W j X de n objetos, tomados j de cada vez

dada pela frmula abaixo.

!

WjX =

j! j!
Fazendo o clculo da combinao de 60 objetos, tomados 6 de cada vez,
chegamos ao nmero de formas distintas que se pode escolher as seis dezenas na
Mega-Sena.
W

60!
60!
60 59 58 57 56 55 54! 36 045 979 200
60
X=
=
=
=
= 50 063 860
6
6! 60 6! 6! 54!
720
6! 54!

Probabilidade Condicional
Dados dois eventos A e B, a probabilidade condicional P A|B a

probabilidade de ocorrncia do evento A, dado que o evento B tenha ocorrido.

Considere N AB o nmero de elementos e P AB a probabilidade de

ocorrncia da interseo entre os eventos A e B. Considere, tambm N B o nmero

de elementos e P B a probabilidade de ocorrncia do evento B. A expresso para o

clculo da probabilidade condicional P A|B dada abaixo.


J L|Z =

 L Z J L Z
=
 Z
J Z

Note que se a interseo AB for vazia, ento a probabilidade condicional ser

zero, ou seja, P A|B=0.

Um exemplo a jogada de um dado duas vezes. O espao amostral tem


N(A2)=36 elementos e dado pelo conjunto abaixo.
A2 ={11, 12, 13, 14, 15, 16, 21, 22, 23, 24, 25,26, 31, 32, 33, 34, 35, 36, 41, 42, 43, 44,
45, 46, 51, 52, 53, 54, 55, 56, 61, 62, 63, 64, 65, 66}
Considere os seguintes eventos:
E2,1 = {12, 21}: Obter soma 3 nas duas jogadas. N(E2,1)=2
E2,2 = {21, 22, 23, 24, 25, 26}: Obter 2 na primeira jogada. N(E2,2)=6
A interseo entre os dois eventos dada pelo conjunto abaixo:
E2,1E2,2 = {21}.

N(E2,1E2,2) = 1

A probabilidade condicional J\K, mK, ] dada pela equao abaixo.

J\K, mK,] =

 K, K,  1
= = 0,167
6
 K, 

Ento, a probabilidade condicional de obter soma 3 nas duas jogadas, dado


que se obteve 2 na primeira jogada de 16,7%.

Eventos Independentes

Dois eventos A e B so independentes se a equao abaixo for


verdadeira:

J L|Z = J L
Considere que aparea um 3 na primeira jogada de um dado. No que isso afeta
a probabilidade de aparecer qualquer outro nmero na prxima jogada? A resposta
que no afeta em nada. Nesse caso, os eventos so independentes.
Portanto, para eventos independentes pode-se escrever a expresso abaixo.

J L =

J L Z
J Z

Lembrando que P(AB)=P(A e B), essa ltima expresso pode ser rearranjada
na forma abaixo.
J L - Z = J L J Z

(eventos independentes)

Por exemplo, na jogada de dois dados, qual a probabilidade de aparecer 3 na


primeira jogada e 5 na segunda jogada?
A2 ={11, 12, 13, 14, 15, 16, 21, 22, 23, 24, 25,26, 31, 32, 33, 34, 35, 36, 41, 42, 43, 44,
45, 46, 51, 52, 53, 54, 55, 56, 61, 62, 63, 64, 65, 66}. N(A2) = 36
Considere os seguintes eventos independentes:
E2,1 = {31, 32, 33, 34, 35, 36}: Aparecer 3 na primeira jogada. N(E2,1)=6
E2,2 = {15, 25, 35, 45, 55, 65}: Aparecer 5 na segunda jogada. N(E2,2)=6
J\K, - K, ] = J\K, ] J\K, ] =

6 6
1 1
1

= =
= 0,0278
36 36 6 6 36

Ento, na jogada de dois dados, a probabilidade de aparecer 3 na primeira


jogada e 5 na segunda jogada de 2,78%.

Problemas

1. Quais so os significados da palavra Estatstica?


2. Defina e d exemplos, diferentes daqueles dados no texto, de: (a) populao; (b)
amostra; (c) populao de tamanho infinito; (d) populao de tamanho finito; (e)
amostra representativa; (f) amostra no representativa.
3. Considere os conjuntos de dados amostrais A e B, abaixo. Para cada um, calcule a
mdia, a mediana e a moda.
(a) A={28, 22 , 33, 30, 100, 28, 25, 30, 27, 28}
(b) B={213, 210, 215, 213, 220, 1018, 214, 213, 211, 213, 215}
4. Para as populaes de dados abaixo, calcule as respectivas varincias e desviospadro, usando as duas frmulas, a da definio e a frmula prtica.
(a) A={70, 72, 75, 78, 74, 73, 79, 71, 77, 76}
(b) B={1010, 1015, 1017, 1014, 1018, 1020, 1011}
5. Os visitantes do Parque Nacional de Yellowstone, nos Estados Unidos,
consideram uma erupo do giser Old Faithful uma atrao que no pode ser
perdida. A tabela de freqncias a seguir resume uma amostra de tempos (em
minutos) entre erupes, Construa um histograma para a tabela de frequncias
dada. Se um guia turstico deseja garantir que seus turistas presenciem uma
erupo, qual o tempo mnimo que devem permanecer no parque? Calcule a
mdia e o desvio-padro da distribuio de frequncias.
Tempo / minutos
40-49
50-59
60-69
70-79
80-89
90-99
100-109

Freqncia
8
44
23
6
107
11
1

6. Obtiveram-se, em uma universidade brasileira, os dados da tabela abaixo,


referentes ao nmero de carros de estudantes e de professores e servidores e
seus respectivos anos de uso. Construa um histograma de freqncias relativas
para cada um dos dois conjuntos de dados. Com base nos resultados, quais so
as diferenas perceptveis entre as duas amostras? Calcule as mdias e os
desvios-padro para cada distribuio de frequncias.
Ano do carro
0-2 anos
3-5
6-8
9-11
12-14
15-17
18-20
21-23

Estudantes
23 carros
33
63
68
19
10
1
0

Professores e Servidores
30 carros
47
36
30
8
0
0
1

7. A tabela de freqncias a seguir d as velocidades, de motoristas multados pela


polcia de uma cidade brasileira, onde o limite de velocidade estabelecido era de
40 km/h. Construa um histograma para essa tabela de freqncias. O que essa
distribuio sugere sobre o limite fixado comparado com o limite de velocidade
constatado? Calcule as mdias e os desvios-padro para cada distribuio de
frequncias.
Freqncia Absoluta
14
11
8
6
4
3
1
2
1

Velocidade / km/h
42-43
44-45
46-47
48-49
50-51
52-53
54-55
56-57
58-59

8. As companhias de seguro pesquisam continuamente as idades e as causas de


morte. Construa um histograma de frequncias relativas correspondente tabela de
freqncias abaixo. Os dados se baseiam em um estudo da revista Veja sobre
vtimas fatais de armas de fogo no Brasil, durante uma semana. O que o
histograma sugere quanto s idades dessas vtimas fatais? Calcule as mdias e os
desvios-padro para cada distribuio de frequncias.
Freqncia
22
10
6
2
4
5
1

Idade na Morte
16-25
26-35
36-45
46-55
56-65
66-75
76-85

9. Defina e d exemplos, diferentes daqueles dados no texto, de: (a) experimento


aleatrio; (b) varivel aleatria; (c) espao amostral; (d) evento; (e) unio de
eventos (f) interseo de eventos; (g) eventos mutuamente excludentes.
10. Discuta a diferena conceitual entre as duas definies de probabilidade de um
T N
h
evento apresentadas, ou seja: J K = T o e J = limTV W Tp X. Utilize um exemplo,
diferente daquele dado no texto, para ilustrar sua discusso.

11. Uma moeda jogada trs vezes. Calcule a probabilidade dos eventos abaixo. Dica:
escreva os conjuntos que representam o espao amostral e os eventos.
(a) Sair exatamente uma cara.
(b) Sair no mximo duas caras.
(c) Sair coroa no lanamento da primeira moeda.
(d) No sair nenhuma cara.
12. Uma moeda jogada trs vezes. Calcule as probabilidades que se pedem abaixo.
(a) Sair trs caras ou trs coroas.
(b) Sair trs caras e trs coroas.
(c) Sair duas caras ou duas coroas.
(d) Sair duas caras e duas coroas.
(e) Sair uma cara e uma coroa.
(f) Sair uma cara ou uma coroa.
13. Defina e d exemplos, diferentes daqueles dados no texto, de: (a) amostragem com
reposio; (b) amostragem sem posio; (c) fatorial de um nmero; (d) permutao;
(e) arranjo; (e) combinao.
14. De quantas formas distintas 9 pessoas podem ficar dispostas em fila indiana?
15. Quantos anagramas podemos formar com a palavra TEORIA?
16. Em uma prova com 10 questes de mltipla escolha, com 4 alternativas cada, qual
a probabilidade de um candidato responder a prova e acertar todas a questes
apenas no palpite?
17. Se voc tem 15 camisas em uma gaveta, para serem usadas durante a semana (7
dias), uma cada dia, sem reposio, de quantas maneiras diferentes pode-se
escolher as camisas para os sete dias da semana?
18. Em um campeonato de futebol, participam 20 times. Quantos resultados so
possveis para os 3 primeiros lugares?

Captulo 2. Aplicao da Matemtica Estatstica.

A Distribuio Binomial

Uma varivel aleatria discreta aquela que pode ser descrita por meio de
nmeros inteiros. Por exemplo, quando se joga uma moeda 20 vezes, podemos definir
uma varivel aleatria X discreta como sendo o nmero de vezes que sai o resultado
cara. Assim, os valores possveis de X podem ser: X = 0, 1, 2, 3, ..., 20.
A distribuio binomial uma distribuio de probabilidade para varivel
discreta. Ela caracterizada por dois parmetros, apenas (n,p). O parmetro n
o nmero de vezes que o experimento executado.
Por exemplo, no lanamento de uma moeda, a moeda pode ser lanada n = 1,
2, 3, 4, 5, ... vezes. O parmetro p a probabilidade de sucesso em cada vez que
o experimento executado. Por exemplo, no lanamento de uma moeda, p= pode
representar a probabilidade de sair cara (ou coroa). Por consequncia, 1p a
probabilidade de fracasso.
Uma distribuio de frequncia coloca a varivel aleatria no eixo horizontal
(abscissa) e a probabilidade de ocorrncia de cada valor da varivel no eixo vertical
(ordenada). Seja X uma varivel aleatria. A probabilidade P X=i de se obter X=i
sucessos, em uma distribuio binomial (n, p), dada pela equao abaixo.

J r = ' = W X $ 1 $hb
'
Na equao acima, foi utilizada a notao de combinao, dada abaixo.
!

W X=
'
'!  '!

Exemplo da Jogada de 20 moedas


Vamos calcular a distribuio binomial n, p = 20,  para uma jogada de 20

(vinte) moedas. A probabilidade de sucesso, em cada jogada, pode ser definida


arbitrariamente como a probabilidade de sair cara e seu valor p = .
Por exemplo, P X=1, a probabilidade de sair cara em apena 1 moeda e coroa

nas outras 19 moedas, pela distribuio binomial 20,  calculada da forma abaixo.
J r = 1 =

20!
0,5 1 0,5ab = 0,0000190735
1! 20 1!

A Tabela 8 e a Figura 5 mostram os resultados de todos os clculos.


Tabela 8. Distribuio binomial n, p = 20, . Seja X a varivel aleatria e P X=i, a
probabilidade de se obter X=i sucessos. O valor central X=10 est

destacado.
i
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

P X=i
=i
0,0000009537
0,0000190735
0,0001811980
0,0010871900
0,0046205500
0,0147858000
0,0369644000
0,0739288000
0,1201340000
0,1601790000
0,1761970000
0,1601790000
0,1201340000
0,0739288000
0,0369644000
0,0147858000
0,0046205500
0,0010871900
0,0001811980
0,0000190735
0,0000009537

0.18
0.16
0.14

P(X=i)

0.12
0.10
0.08
0.06
0.04
0.02
0.00
0

10

12

14

16

18

20

i
Figura 5. Distribuio binomial n, p = 20, . Seja X a varivel aleatria e P X=i, a
probabilidade de se obter X=i sucessos.

Como interpretamos a distribuio de probabilidades acima? Ao jogarmos 20


(vinte) moedas, a probabilidade de se obter 10 caras (X=10) mxima, ou seja,

P X=10 = 0,176197 o valor mximo. As probabilidades diminuem medida que X se

distancia de 10.

A esperana (valor mdio), E X e a varincia, Var X de uma varivel aleatria


com distribuio binomial so calculadas a partir dos valores dos parmetros n e p, de
acordo com as equaes abaixo.
K r =  $
t+ r =  $ 1 $

No exemplo dado acima, n, p = 20, . Portanto, a esperana e a varincia


de X possuem os seguintes valores.
K r = 20 0,5 = 10
t+ r = 20 0,5 1 0,5 = 5
Logo, de se esperar o valor central X=10 para a distribuio binomial acima,
j que este o valor da esperana de X.

Exemplo das 30 questes de mltipla escolha

Outro exemplo de utilizao da distribuio binomial foi o caso abordado


anteriormente de uma prova de mltipla escolha, com 30 questes e 5 alternativas em
cada questo. Vimos que h um total de 530 = 9,31 x 1020 respostas possveis.
Considerando X o nmero de questes que um candidato acertou na prova, os
valores possveis para essa varivel aleatria discreta sero: X = 0, 1, 2, 3, ..., 30.
Podemos considerar que essa varivel siga uma distribuio binominal (n,p) = (30,1/5).
Como h 5 alternativas, a probabilidade de sucesso, ou seja, de acertar uma questo
p=1/5. Assim, podemos calcular a probabilidade de acertar qualquer nmero de
questes, apenas na sorte, usando a frmula da distribuio binomial.
Vamos calcular a probabilidade de acertar a prova inteira na sorte, ou seja,
vamos calcular P(X=30), usando a distribuio binomial, com n=30 e p=1/5=0,2.
J r = 30 =

30!
0,2a 1 0,2aba = 1,07 10b
30! 30 30!

Esse o mesmo resultado encontrado anteriormente, da ordem de P=1021.


Vamos agora encontrar a probabilidade de acertar metade da prova na sorte, ou seja,
vamos calcular P(X=15), usando a mesma distribuio binomial.
J r = 15 =

30!
0,2  1 0,2ab  = 0,000179
15! 30 15!

A probabilidade encontrada muitas vezes maior que a anterior. De fato, para


algum acertar metade da prova, na sorte, a probabilidade de 0,0179%. O valor
continua sendo pequeno para que algum consiga acertar na sorte, mas j possvel
que algum consiga, pois esta probabilidade bem maior que as de muitas loterias!
Calculemos a esperana e a varincia de X para este caso.
K r = 30 0,2 = 6
t+ r = 30 0,2 1 0,2 = 4,8
Vamos calcular a probabilidade de acertar apenas 6 (seis) questes, na sorte,
ou seja, vamos calcular P(X=6), usando a mesma distribuio binomial.
J r = 6 =

30!
0,2 1 0,2ab = 0,179
6! 30 6!

Para se acertar 6 questes na sorte, a probabilidade mxima e igual a


17,9%. O desvio padro igual 4,8 = 2,2. Portanto, espera-se que a 18% dos
candidatos que faam a prova no puro palpite acertem 62 questes.

A Distribuio Normal

Uma varivel aleatria contnua aquela que pode ser descrita por meio de
nmeros reais. Por exemplo, a concentrao dos ons cloreto em amostras de gua.
A distribuio normal uma distribuio de probabilidade para varivel
contnua. Ela caracterizada por dois parmetros populacionais (, ). Ela uma
distribuio simtrica, em forma de sino, sendo que o valor central a mdia da
populao, e a medida da disperso o desvio-padro, da populao.
A distribuio normal dada pela curva gaussiana, nome dado em
homenagem ao matemtico alemo Johann Carl Friedrich Gauss (1777-1855). Seja x
uma varivel aleatria contnua. A curva gaussiana a funo densidade de
probabilidade, f x para a varivel aleatria x e dada pela equao abaixo.

  =

22v

wbxy
 23

A esperana E(x) e a varincia Var(x) da varivel aleatria contnua x, em uma


distribuio normal, so dadas pelas equaes abaixo, respectivamente.

E(x) =
Var(x) = 2

A Figura 6 apresenta duas curvas gaussianas, ambas com =0. Uma das
curvas possui =1,0 e a outra, =2,0. A curva com maior mais larga e menos alta.

Figura 6. Curva gaussiana para =0, =1,0 e =2,0.

A Distribuio Normal Reduzida

Qualquer conjunto de dados {x}, com media e desvio-padro , pode ser


transformado em outro conjunto de dados {Z}, com mdia =0 e desvio padro =1,
mediante o uso da equao de transformao abaixo.

z=


/

Aplicando a transformao acima para uma funo gaussiana, obtemos a


equao abaixo, denominada distribuio normal reduzida: (, ) = (0, 1).

 z =

2v

- b z

Note que a Figura 6 apresenta o grfico da distribuio normal reduzida.

Vejamos um exemplo. Consideremos as estaturas de uma populao de


mulheres. As estaturas so representadas pela varivel aleatria x. Vamos supor que
essa varivel siga uma distribuio normal e que a mdia e o desvio padro dessa
populao sejam, respectivamente: = 1,60 m; = 0,20 m. Neste caso, duas
mulheres da populao que tivessem estaturas x1 = 1,47 m e x2 = 1,68 m na
distribuio normal, passariam a ter as seguintes estaturas na distribuio normal
reduzida:

z =

1,47 1,60 ,
= 0,65
0,20 ,

z =

1,68 1,60 ,
= +0,40
0,20 ,

Os valores na distribuio normal reduzida podem ser positivos ou


negativos, indicando se so maiores ou menores que a mdia. Na distribuio normal
reduzida, o valor Z=0 significa que a varivel tem o valor mdio. Alm disso, a
distribuio normal reduzida adimensional, ou seja, os valores no tm unidade,
so nmeros puros.

Probabilidade de uma varivel aleatria contnua

Para discutir a probabilidade de uma varivel aleatria contnua assumir um


determinado valor, vamos usar a distribuio normal reduzida.
A funo gaussiana f Z d a densidade de probabilidade para a varivel
reduzida Z. O valor da probabilidade P da varivel reduzida Z assumir um valor entre
Z1 e Z2 dado pela integral definida abaixo.

~y

J z < z < z  = |  } *}
~

A Equao acima significa que a probabilidade P da varivel reduzida Z assumir

um valor entre Z1 e Z2 dada pela rea abaixo da curva de f Z, entre os valores Z1 e

Z2. Usando a expresso da distribuio gaussiana reduzida, a ltima equao assume


a forma dada abaixo. A equao abaixo integrada numericamente. Na prtica,os
valores so tabelados. Por exemplo, a Figura 7 mostra que a probabilidade de a
varivel reduzida Z assumir valores entre -2 < Z < 2 de 95,45%.

J z < z < z  =

1 ~y 1 ~y
| - 2 *}
2v ~

Figura 7. rea abaixo da curva gaussiana reduzida (=0, =1) na faixa 2 < Z < 2.

A rea total sob a curva 1, significando 100% (vide Figura 7). Em outras
palavras, a probabilidade de a varivel Z assumir valores na faixa < Z < + P=1.
Essa a denominada condio de normalizao, expressa pela equao abaixo.

bV

 } *} = 1

A partir da condio de normalizao, podemos calcular, por exemplo, a


probabilidade de a varivel Z assumir valores maiores que 2, ou seja, P(Z>2).
Observando a Figura 7, vemos que a probabilidade de Z estar na faixa -2>Z>2 dada
por: 1 0,9545 = 0,0455. Como a funo simtrica, a probabilidade de Z ser maior
que 2 metade desse valor, ou seja:

J z > 2 =

1 0,9545 0,04550
=
= 0,02275
2
2

Se quisermos saber a probabilidade de Z assumir valores menores que 2, ou


seja, P(Z>2) s fazer o seguinte clculo:

J z < 2 = 1 0,02275 = 0,97725


H uma srie de valores de probabilidade que podemos calcular para os
valores da varivel reduzida Z. Uma coisa importante notar. Que, como a
probabilidade uma rea sob a curva, a probabilidade de a varivel assumir um
determinado valor seria zero, pois a rea sob a curva seria zero.

J z = + = |  } *} = 0

Na prtica so utilizadas tabelas de probabilidades. No Apndice A1


mostrada a tabela para a probabilidade de Z assumir valores menores que a, P(Z<a).

Vamos aprender a usar as tabelas de probabilidades para distribuio normal


reduzida, com exemplos.
Suponha que a concentrao do gs poluente SO2 apresente uma distribuio
normal em uma cidade brasileira e que a mdia da concentrao seja = 0,14 ppm e
o desvio-padro = 0,01 ppm. Calcule o que se pede abaixo:

(a) A probabilidade de que a concentrao de SO2 seja maior do que a mdia.

Neste caso, queremos a probabilidade P(X>0,14 ppm). Vamos


transformar em varivel reduzida primeiro.
z=

  0,14 0,14
=
= 0,00
/
0,01

Agora, o problema determinar a probabilidade P(Z>0,00). Na tabela de


probabilidades, encontramos P(Z<0,00) = 0,5000. Como a rea total sob a
curva 1, ou seja, como a curva normalizada, ento a probabilidade que se
deseja calcular dada pelo clculo abaixo.
J r > 0,00 = 1 J r < 0,00 = 1 0,5000 = 0,5000
Conclumos que a probabilidade de que a concentrao do gs poluente
SO2 venha a assumir um valor acima da mdia, na cidade, de 50%, como
mostra a Figura 8.

Figura 8. Probabilidade de que a varivel Z assuma valores acima da mdia,


ou seja, P(Z>0)=0,5000.

(b) A probabilidade de a concentrao de SO2 ser maior que 0,15 ppm.


Neste caso, queremos a probabilidade P(X>0,15 ppm). Vamos
transformar em varivel reduzida primeiro.
z=

  0,15 0,14
=
= 1,00
/
0,01

Agora, o problema determinar a probabilidade P(Z>1,00). Na tabela de


probabilidades, encontramos P(Z<1,00) = 0,8413. Como a rea total sob a
curva 1, ou seja, como a curva normalizada, ento a probabilidade que se
deseja calcular dada pelo clculo abaixo.
J r > 0,00 = 1 J r < 0,00 = 1 0,8413 = 0,1587
Conclumos que a probabilidade de que a concentrao do gs poluente
SO2 venha a assumir um valor acima de 0,15 ppm, na cidade, de 15,87%,
como mostra a Figura 9.

Figura 9. Probabilidade de que a varivel Z assuma valores acima de 1,00. Ou


seja, P(Z>1,00)=0,1587.

(c) A probabilidade da concentrao de SO2 ser maior do que 0,17 ppm.


Neste caso, queremos a probabilidade P(X>0,17 ppm). Vamos
transformar em varivel reduzida primeiro.
z=

  0,17 0,14
=
= 3,00
/
0,01

Agora, o problema determinar a probabilidade P(Z>3,00). Na tabela de


probabilidades, encontramos P(Z<3,00) = 0,9987. Como a rea total sob a
curva 1, ou seja, como a curva normalizada, ento a probabilidade que se
deseja calcular dada pelo clculo abaixo.
J r > 3,00 = 1 J r < 3,00 = 1 0,9987 = 0,0013
Conclumos que a probabilidade de que a concentrao do gs poluente
SO2 venha a assumir um valor acima de 0,17 ppm, na cidade, de 0,13%, o
que representa um valor muito baixo.
(d) A probabilidade de que a concentrao de SO2 tenha um valor entre 0,141
ppm e 0,142 ppm.
Neste caso, queremos a probabilidade P(0,141 ppm < X > 0,142 ppm).
Vamos transformar em variveis reduzidas primeiro.
z =

z =

  0,141 0,14
=
= 0,100
/
0,01

  0,142 0,14
=
= 0,200
/
0,01

A probabilidade que se quer pode ser obtida da tabela de probabilidades,


atravs do seguinte clculo:
P(0,100 < Z< 0,200) = P(Z<0,200) P(Z<0,100) = 0,5793 0,5398 = 0,0395
Conclumos que a probabilidade de que a concentrao do gs poluente
SO2 venha a assumir valores entre 0,141 ppm e 0,142 ppm, na cidade, de
3,95%.

A Distribuio Amostral das Mdias

J vimos que, para uma dada populao, existe um grande nmero de

amostras possveis. Cada amostra tem um tamanho , uma mdia  e um desvio-

padro & .

Se estivermos amostrando uma populao que tenha uma distribuio de

probabilidades desconhecida, com mdia x e varincia 23 , caso o tamanho


amostral e seja grande o suficiente, a distribuio amostral das mdias ser
aproximadamente normal. A esperana, K   e a varincia, t+   da mdia

amostral so dadas, respectivamente, pelas equaes abaixo. Esse resultado


conhecido como Teorema do Limite Central.

K   = 
t+   =

/


O desvio-padro da mdia amostral, &   a raiz quadrada da varincia, ou

seja, dado pela equao abaixo.

&   = <t+   =

A Figura 10 ilustra a idia por trs do Teorema do Limite Central, usando o


experimento aleatrio da jogada de n dados. Quando se joga apenas 1 (um) dado, as
probabilidades so todas iguais para os seis nmeros, ou seja P=1/6. Quando se joga
mais de um dado, as probabilidades de se obter cada nmero vo ficando diferentes,
podendo ser calculadas pela distribuio binomial. medida que o nmero de jogadas
aumenta, a distribuio se aproxima da distribuio normal.

Figura 10. Ilustrao do Teorema do Limite Central. medida que o nmero


de jogadas de dados aumenta, a distribuio se aproxima da
distribuio normal.

Exerccio Resolvido.
Suponha que a concentrao do gs poluente SO2 apresente uma distribuio populacional desconhecida
em uma cidade brasileira. A mdia da concentrao = 0,140 ppm e o desvio-padro, = 0,010 ppm
so conhecidos na populao. Voc coletou uma amostra aleatria de tamanho n=100, na cidade e mediu
o teor de SO2. Qual a probabilidade de a mdia amostral ter um valor entre 0,141 ppm e 0,142 ppm, ou
seja, calcule a seguinte probabilidade: P(0,141 ppm <  < 0,142 ppm) = ?

Resoluo:

Pelo Teorema do Limite Central, temos que a mdia amostral segue uma distribuio aproximadamente
normal, com esperana, K   = 0,14 ppm e desvio-padro, &   =

a,a a
aa

ppm = 0,001 ppm.

Vamos agora usar a varivel reduzida Z, para calcular as probabilidades.

z=

z =

z =

 
/


0,141 0,14
= 1,00
0,001

0,142 0,14
= 2,00
0,001

A probabilidade que se quer pode ser obtida da tabela de probabilidades, atravs do seguinte clculo:

P(1,00 < Z< 2,00) = P(Z<2,00) P(Z<1,00) = 0,9772 0,8413 = 0,1359

Resposta: A probabilidade de a mdia amostral ter um valor entre 0,141 ppm e 0,142 ppm, na populao
considerada, ser de 13,59%.

Teste de Hipteses

Muitas vezes precisamos aceitar ou rejeitar o valor de algum parmetro. Para


tanto, devemos estabelecer critrios. Os critrios que iremos adotar so estatsticos e
obedecem a leis probabilsticas.
Uma afirmao sobre um parmetro estatstico, tal como a mdia, ou a
varincia, 2 de uma, ou mais de uma populao, denominada hiptese estatstica.
O procedimento de tomada de deciso sobre a hiptese denominado teste de
hiptese. A hiptese que se quer testar denominada hiptese nula e
normalmente denotada por Ho. Por exemplo, a hiptese nula pode ser a de que a
mdia populacional seja zero. Podemos express-la da seguinte forma: Ho: = 0. A
hiptese oposta hiptese nula denominada hiptese alternativa e denotada por
H1 ou por Ha. No exemplo usado, podemos express-la da seguinte forma: H1: 0.
importante ressaltar que as hipteses estatsticas so sempre afirmaes sobre a
populao, nunca sobre a amostra.

Rejeitar a hiptese nula Ho, quando de fato ela for verdadeira, definido como
erro do tipo I.
Vamos supor que hiptese nula seja Ho: = 0 e que chegssemos, atravs de

um teste de hiptese, concluso de que ela devesse ser rejeitada. Nesse caso,
haveria uma probabilidade de cometer o erro do tipo I. Essa probabilidade
denotada por (alfa). O valor dessa probabilidade denominado nvel de
significncia do teste e deve ser fixado pelo estatstico logo no incio do teste de
hiptese. Normalmente, o nvel de significncia estabelecido em 1% ou 5%, ou seja,
= 0,01 ou = 0,05.

= nvel de significncia do teste.

O teste de hiptese tem determinadas etapas a serem seguidas. A ordem em


que elas aparecem abaixo deve ser respeitada, caso contrrio o teste no funciona.

(1) Formular as hipteses, nula e alternativa. Por exemplo: Ho: = 0; H1: 0.


(2) Fixar o nvel de significncia do teste de hiptese. Por exemplo: = 0,05.

(3) Se a hiptese nula for verdadeira, ento existe uma varivel aleatria
denominada estatstica de teste, que deve ser calculada e essa estatstica de
teste segue uma distribuio de probabilidade conhecida.
Por exemplo: uma amostra de tamanho n=100 obteve mdia amostral  = 0,10. O desvio-

padro da populao conhecido, = 0,01. Neste caso, sabemos que, se a hiptese nula for
verdadeira,  ter distribuio normal com mdia = 0 e desvio-padro & =

a, a

aa

0,010. Portanto, a estatstica de teste escolhida, denominada teste Z, ser a distribuio normal

reduzida: z =

w b

(4) Estabelecer valores crticos para a estatstica de teste, em funo do nvel de


significncia fixado ( = 0,05). A Figura 11 mostra que acima de Z = 1,96 e
abaixo de Z = 1,96, a rea total igual a 0,05. Isto significa que a
probabilidade de a varivel Z assumir valores na faixa 1,96 > Z >1,96 de 5%.
Se a estatstica de teste calculada assumir um valor nessa faixa, ento Ho ser
rejeitada com um nvel de significncia de 5%. O valor crtico Zcrt. = 1,96.
Esse valor foi encontrado a partir das tabelas de probabilidades. Como se quer
P(Z>a) = 0,025 (/2), ento se tem que P(Z<a)=10,025=0,975. Procurando na
tabela de probabilidades, encontra-se o valor crtico Z = 1,96. Este um teste
bicaudal, ou bilateral.

Figura 11. Distribuio normal reduzida. Valores crticos Z = 1,96 e Z = 1,96.


Acima e abaixo desses valores, a rea total igual a 0,05. A regio
de rejeio de Ho denominada regio de significncia.

(5) Calcular a estatstica de teste.

z. =

 
0,10 0
/ = 0,01 = 100

100

(6) Deciso. Compara-se a estatstica de teste calculada com o valor crtico. No


caso, verifica-se que |Zcalc.|>Zcrit. Em outras palavras, o valor de Zcalc. cai na
regio de rejeio de Ho (vide Figura 11). Por isso, rejeita-se Ho com nvel de
significncia de 5% (=0,05). Isso significa que a probabilidade de estarmos
rejeitando Ho, dado que de fato ela verdadeira, ou seja, a probabilidade de
estamos cometendo um erro do tipo I de 5%.
(7) Concluso. No exemplo dado, pelos dados amostrais e pelo teste de hiptese
efetuado, no temos razes significativas (=0,05) para supor que a mdia
populacional seja zero.
costume chamar a estatstica de teste (e os dados) de significantes quando a
hiptese nula Ho for rejeitada. Inclusive, a regio de rejeio de Ho denominada
regio de significncia.

Valor p

O valor p o menor nvel de significncia que conduz rejeio da hiptese


nula Ho, com os dados fornecidos.
Por exemplo, vamos supor que em um teste de hiptese, usando a estatstica
de teste Z, calculou-se o seguinte valor, na etapa 5: Zcalc. = 2,56. Consultando a tabela
de probabilidades, para Z<2,56, encontra-se P(Z<2,56) = 0,9948. O valor p calculado
pela expresso abaixo e possui o valor p = 0,0104. Isso quer dizer que o menor nvel
em que esses dados so sinificantes seria = 0,0104.
p = 2 x [1 P(Z<2,56)] = 2 x [1 0,9948] = 2 x [0,0052] = 0,0104
A Figura 12 ilustra a idia do valor p. Ele simplesmente a soma das reas
sombreadas, direita e esquerda no grfico. Quanto maior o valor de Zcalc., menor
o valor p. no exemplo usado para explicar o teste de hiptese, encontrou-se Zcalc. =
100. Nesse caso, recorrendo-se tabela de probabilidades, conclui-se que o valor p
praticamente zero nesse caso (p=0).

Figura 12. Valor p para Zcalc. = 2,56. p = 2 x [0,0052] = 0,0104.


Regras de deciso, baseadas em um valor p

1. Se p, ento rejeite Ho.


2. Se p>, ento falhe em rejeitar Ho.

Erros do Tipo I e II

Tipo I
Vimos o erro do tipo I cuja probabilidade se expressa por (alfa).

Rejeitar a hiptese nula Ho, quando de fato ela for verdadeira, definido como
erro do tipo I.

Vimos que, em um teste de hiptese, essa probabilidade o nvel de


significncia do teste e deve ser pr-estabelecida pelo estatstico.

Tipo II
Veremos agora o erro do tipo II cuja probabilidade se expressa por (beta).

No rejeitar a hiptese nula Ho, quando de fato ela no for verdadeira,


definido como erro do tipo II.

Para se calcular necessrio ter uma hiptese alternativa bastante


especfica. Vamos usar um exemplo para calcular a probabilidade de erro do tipo II.

Exemplo:

Suponha que o desvio-padro da concentrao do gs poluente SO2 em uma


populao seja conhecido, = 0,040 ppm. Considere que tomamos uma amostra

de tamanho n =100 e que obtivemos uma mdia amostral  = 0,147 ppm.

(a) Testar a hiptese nula de que a mdia populacional seja  = 0,140 ppm. Fixar
nvel de significncia em 5%.

(b) Calcular o valor p.


(b) Calcular a probabilidade, de erro do tipo II, caso a mdia populacional de fato
fosse = 0,147 ppm.

Resoluo:

(a) Teste de hiptese:

(1) Hiptese nula e alternativa: Ho: = 0,140 ppm; H1: 0,140 ppm
(2) Nvel de significncia: = 0,05 ( = probabilidade do erro do tipo I)
(3) Estatstica de teste: z =

w b

(4) Valores crticos (para = 0,05): Zcrt. = 1,96

(5) Clculo da estatstica de teste. z. =

a, ba, a
,


= 1,75

(6) Deciso. |Zcalc.|<Zcrit. Como Zcalc. est na zona de aceitao, no se rejeita Ho.

(7) Concluso. No h razo significativa para rejeitar Ho. Portanto, no h razo


para no supor que a mdia populacional da concentrao de SO2 seja

 = 0,140 ppm.

(b) Clculo do valor p.

p = 2 x [1 P(Z<1,75)] = 2 x [1 0,9599] = 2 x [0,0401] = 0,0802


Como p>, ento falhe em rejeitar Ho.

(c) Clculo de :

Primeiro vamos formular a hiptese nula, Ho original e uma hiptese alternativa,


H1 bastante especfica.
:  = 0,140 ppm
:  = 0,147 ppm

Neste caso, um erro do tipo II ser cometido se a mdia amostral,  cair entre

os limites da regio crtica, quando na verdade  = 0,147 ppm.

Vamos agora nos basear na transformao para varivel reduzida, abaixo.

z=

 
/


Rearranjando a equao acima, encontramos em  os valores crticos

correspondentes aos valores reduzidos: Zcrt. = 1,96.

 = z
 = 1,96
 = +1,96

0,04

100
0,04

100

+

+ 0,147 = 0,13916
+ 0,147 = 0,15484

A Figura 13 ilustra o significado da probabilidade de cometer o erro do


tipo II, ou seja, o valor de . Trata-se da probabilidade condicional da varivel

aleatria  assumir valores na faixa 0,13916 <  < 0,15484, dado que
verdadeira, ou seja, dada pelas expresses abaixo.

< =, B7?E?|B : x = =, B? ppm)


= =, B64B> < 
=

0,0042v

a, 

a,  

w ba, y
 a,aay

= 0,950

= J 1,96 < z < 1,96 = J z < 1,96 J z < 1,96


= = 0,975 0,025
= = 0,950

Figura 13. Probabilidade de erro do tipo II, = 0,950.


= J 0,13916 <  < 0,15484| :  = 0,147 ppm)
Veja que a probabilidade de falhar em rejeitar Ho neste caso bastante alta,
=95%.

Potncia de um teste

A potncia de um teste pode ser definida como a probabilidade de rejeitar


corretamente uma hiptese nula falsa. A potncia de um teste dada por 1
.
No ltimo exemplo, a potncia do teste era 1
0,95 = 0,05, ou seja, apena 5%.

Alguns pontos importantes devem ser destacados.

1. O tamanho da regio crtica sempre pode ser reduzida pela seleo apropriada
do valor de (alfa).
2. Os erros do tipo I e do tipo II esto relacionados. Uma diminuio em (alfa)
implica em um aumento em (beta) e vice-versa, desde que o tamanho da
amostra no varie.
3. Um aumento no tamanho da amostra reduzir o valor de (beta), desde que o
valor de (alfa) seja mantido constante.
4. Quando Ho for falsa, o valor de (beta) aumenta medida que o valor
verdadeiro do parmetro (p.ex. a mdia, ) se aproxima do valor usado em Ho.
valor de (beta) diminui medida que aumenta a diferena entre o valor
verdadeiro do parmetro e o valor usado em Ho.

Teste t

Uma distribuio de probabilidade importante, relacionada distribuio normal


a distribuio t, tambm denominada distribuio t de Student. Ela tem esse
nome devido ao estatstico ingls William Sealy Gosset (1876-1937), que a criou
sob o pseudnimo de Student, em um artigo publicado em 1908.
A distribuio t simtrica, tem forma de sino e bem semelhante curva
normal padro, porm com caudas mais largas, ou seja, a distribuio t pode gerar
valores mais extremos que a curva normal. O nico parmetro que a define e que
caracteriza a sua forma o nmero de graus de liberdade, gl. Quanto maior for
esse parmetro, mais prxima da curva normal ela ser.
A utilidade da distribuio t para aqueles casos onde no se conhece a
varincia populacional, 2. Nestes casos, em um teste de hipteses, ao invs
de se usar a estatstica de teste Z, como temos usado at agora, passaremos a
usar a estatstica de teste t, calculada de acordo com a equao abaixo.

 
&


Na equao acima, & o desvio-padro amostral e  o tamanho da

amostra. A distribuio t, neste caso possui = e B graus de liberdade, ou

seja, o nmero de graus de liberdade depende do tamanho da amostra. As


probabilidades para uma distribuio t com graus de liberdade tambm podem
ser encontradas em uma tabela de probabilidades.

No Apndice A2 mostrada a tabela de probabilidades para a distribuio t de


Student unilateral. No Apndice A3 mostrada a tabela de probabilidades para a
distribuio t de Student bilateral.

Exemplo. Considere uma amostra de n = 27 jogadores de um time de futebol com

mdia amostral de massa corprea  = 90 kg e desvio-padro amostral & = 9,0 kg.

Testar a hiptese de que a amostra foi extrada de uma populao com distribuio
normal com mdia  = 100 kg. (Considere nvel de significncia de 5%)
Resoluo:
(1) Hiptese nula e alternativa: Ho:  = 90 kg; H1:  90 kg.
(2) Nvel de significncia: = 0,05
(3) Estatstica de teste:

w b

(4) Valores crticos ( =  1 = 27 1 = 26): a.a; =2,056 (bilateral)


(5) Clculo da estatstica de teste.

ab aa
,
y

= 5,7735

(6) Deciso. |tcalc.|>tcrit. Como tcalc. est na regio de rejeio, rejeita-se Ho com nvel
de significncia de 5%.
(7) Concluso. Pelos dados amostrais e pelo teste de hiptese, no h razo
significativa (=0,05) para supor que a mdia populacional tenha sido extrada

de uma populao com distribuio normal com mdia  = 100 kg.

Problemas

Teste Z para uma mdia. Nos problemas abaixo, utilize como critrio de
deciso no teste de hiptese tanto o valor crtico Zcrit. quanto o valor p.

1. O Departamento de Agricultura dos EUA reportou que o custo mdio


(populacional) para se criar um filho at a idade de 02 anos na zona rural de
$ 10 460, com desvio-padro (populacional) de $ 1 540. Uma amostra aleatria
de 900 crianas, com idades at 02 anos, na zona rural revelou um custo
mdio (amostral) de $ 10 345. H evidncia significativa para se apoiar o
relatrio do Departamento de Agricultura dos EUA, com =0,05?
2. Um fabricante de chuveiros para proteo contra incndios afirma que a
temperatura mdia (populacional) de ativao do sistema de 57,2 oC, com
desvio-padro (populacional) de 1,8 oC. Em uma amostra aleatria de 100
chuveiros, encontra-se uma temperatura mdia (amostral) de 56,1 oC. H
evidncia significativa para se apoiar a afirmao do fabricante, com =0,05?
3. Segundo o Instituto Gallup, o tempo mdio (populacional) que leva para os
fumantes pararem de fumar permanentemente de 15 anos, com desviopadro (populacional) de 4,3 anos. Uma amostra aleatria com 36 ex-fumantes
revelou um tempo mdio (amostral) de 14,8 anos. H evidncia significativa
para se apoiar a afirmao do Instituto Gallup, com =0,05?
4. Uma empresa fabrica um refrigerante e afirma que em uma lata de 350 mL de
refrigerante h uma massa mdia (populacional) 40 mg de cafena com desviopadro (populacional) de 7,5 mg. Uma amostra aleatria com 49 latas de
refrigerante apresentou massa mdia (amostral) de 39,2 mg. H evidncia
significativa para se apoiar a afirmao do fabricante, com =0,05?
5. Certo fabricante de cereal matinal afirma que em cada poro de 100 g do
cereal h uma massa mdia (populacional) de 230 mg de sdio com desviopadro (populacional) de 10,0 mg. Uma amostra aleatria de 64 pores de
cereal forneceu uma massa mdia (amostral) de 232 mg de sdio. H
evidncia significativa para se apoiar a afirmao do fabricante, com =0,05?

Teste t para a uma mdia.

6. Uma indstria afirma que a mdia (populacional) do pH na gua do rio mais


prximo de 6,8. Uma amostra aleatria de 19 pores de gua forneceu um
pH (amostral) de 6,7 e um desvio-padro (amostral) de 0,24. H evidncia
significativa para se apoiar a afirmao da indstria, com =0,05?
7. Uma universidade afirma que o nmero mdio (populacional) de horas-aula
semanais do corpo docente de 12 h. Um representante estudantil decide
estudar uma amostra aleatria de 09 professores e obtm os seguintes
resultados, em horas-aula semanais: 11, 08, 12, 13, 10, 12, 06, 12, 14. H
evidncia significativa para apoiar a afirmao da universidade, com =0,05?

Captulo 3. Mtodos Grficos e Numricos.


Correlao
H correlao entre duas variveis aleatrias quando existe uma relao
estatstica entre elas. A Tabela 9 mostra valores para dados amostrados das
variveis x e y. Temos aqui uma correlao positiva, pois y tende a aumentar
medida que x aumenta. A Figura 14 mostra o grfico desses valores e chamada de
diagrama de disperso. A regresso dos dados permite encontrar a funo
matemtica que melhor representa a relao entre as variveis. A curva em vermelho
na Figura 14 foi obtida por regresso dos dados.

Tabela 9. As variveis x e y esto correlacionadas positivamente.


x

0
1
2
3
4
5
6
7
8
9
10

0,0
0,8
4,8
7,2
19,2
20,0
43,2
39,2
76,8
64,8
120

120

100

80

60

40

20

0
0

10

x
Figura 14. Diagrama de disperso para os dados da Tabela 9. Em vermelho est a
curva de regresso dos dados.

Muitas vezes busca-se correlao entre pares de variveis aleatrias, tais


como peso vs. idade, renda vs. consumo, taxa de juros vs. emprstimos, etc.
Em Qumica Analtica, normalmente busca-se a correlao entre uma
propriedade fsica, como a absorbncia (absoro de luz em um dado comprimento
de onda) e a concentrao de um analito em soluo. A Figura 15 mostra uma
soluo em uma cubeta de comprimento l, contendo o analito de concentrao c e
absortividade molar . A luz incidente tem intensidade I0. Aps passar pela soluo, a
luz transmitida possui intensidade I1. Parte da luz incidente foi absorvida pelo analito.

Define-se transmitncia, T pela relao: =  . A absorbncia, A definida pela


equao abaixo.


L = % a
a

Figura 15. Cubeta de comprimento l, contendo uma soluo do analito, de


concentrao c e absortividade molar . A luz incidente tem intensidade
I0 e a luz transmitida, intensidade I1.

Se o sistema seguir a lei de Beer-Lambert, a absorbncia, A ser funo


linear da concentrao, c, conforme mostrado na equao abaixo, onde a
absortividade molar da substncia e l o caminho tico, ou seja, a distncia que a luz
atravessa pelo material. Neste caso, temos uma correlao linear entre A e c.
L =

A Tabela 10 mostra os dados de uma anlise qumica, onde foi medida a


absorbncia, A para cada concentrao c de um analito em soluo.
Tabela 10. A absorbncia e a concentrao, c tem correlao linear positiva.
c / mol L1

Absorbncia

0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.10

0.012
0.048
0.052
0.088
0.092
0.128
0.132
0.168
0.172
0.208

A Figura 16 mostra o diagrama de disperso dos dados. Aps a regresso dos


dados, constri-se uma curva de calibrao que permite obter a concentrao, c do
analito em uma amostra, a partir da leitura da respectiva absorbncia, A. A reta de
regresso mostrada na Figura 16 e corresponde seguinte equao de regresso:
L = 2,048 0,003
corresponde ao valor previsto para a absorbncia.
A notao L

0.20

Absorbncia

0.15

0.10

0.05

0.00

0.00

0.02

0.04

0.06

c / mol L

0.08

0.10

-1

Figura 16. Diagrama de disperso para os dados da Tabela 10. Em vermelho est a
curva de regresso dos dados, que corresponde curva de calibrao.

Coeficiente de Correlao Linear


O coeficiente de correlao linear, r mede a intensidade da relao linear entre
os valores das variveis x e y. Ele tambm chamado de coeficiente de correlao de
Pearson. Ele calculado pela equao abaixo, onde n o nmero de pontos.

=

   

<     <   

A Tabela 11 apresenta a intensidade da correlao para cada faixa de valores


de r. Em geral, em Qumica Analtica interessam apenas as correlaes fortes.

Tabela 11. Intensidade da correlao para cada faixa de valores de r.


Coeficiente de Correlao, r

Intensidade da Correlao

=1

Perfeita Positiva

0,8 <  < 1

0,5 <  < 0,8


0,1 <  < 0,5
0 <  < 0,1
=0

0,1 <  < 0

0,5 <  < 0,1


0,8 <  < 0,5
1 <  < 0,8
 = 1

Forte Positiva
Moderada Positiva
Fraca Positiva
nfima Positiva
Nula
nfima Negativa
Fraca Negativa
Moderada Negativa
Forte Negativa
Perfeita Negativa

Vamos agora calcular o valor de r para os dados da Tabela 10. Vamos chamar
a concentrao de x e a absorbncia de y. Vamos reescrever a Tabela 10, abaixo,
acrescentando as colunas xy, x2 e y2 e depois calcular as somatrias que aparecem na
equao para r: x, y, xy, x2, y2. No caso, o nmero de pontos n = 10.

xy

x2

y2

0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.10
x = 0,55

0.012
0.048
0.052
0.088
0.092
0.128
0.132
0.168
0.172
0.208
y = 1,1

0.00012
0.00096
0.00156
0.00352
0.00460
0.00768
0.00924
0.01344
0.01548
0.02080
xy = 0,0774

0.0001
0.0004
0.0009
0.0016
0.0025
0.0036
0.0049
0.0064
0.0081
0.0100
2
x = 0,0385

0.000144
0.002304
0.002704
0.007744
0.008464
0.016384
0.017424
0.028224
0.029584
0.043264
y2 = 0,15624

Usando a equao para r, calculamos o seguinte valor:

=

10 0,0774 0,55 1,1

<10 0,0385 0,55 <10 0,15624 1,1

= 0,9912

De acordo com a Tabela 11, trata-se de uma correlao forte positiva. Isto
bastante adequado para uma curva de calibrao.

Regresso Linear
O objetivo da regresso linear encontrar a equao da reta que melhor
descreve os dados. Para tanto, utiliza-se a equao da reta, dada abaixo, onde x e y
so as variveis, a o coeficiente angular e b o coeficiente linear da reta.
= + +

A regresso linear feita atravs do mtodo dos mnimos quadrados. Neste


mtodo, chamam-se yi os valores experimentais da varivel y e chamam-se (yi)calc, os
valores de y calculados pela regresso linear, ou seja:
  = + +
O objetivo do mtodo encontrar os valores dos coeficientes a e b, da equao

da reta, que minimizem  *' 2, a somatria dos quadrados das diferenas entre yi e
(yi)calc, dados pela equao abaixo.

*  =    #
Para tanto, derivam-se os *' 2 em relao aos coeficientes a e b, da equao

da reta e igualam-se a zero, resultando em um sistema de duas equaes e duas


incgnitas, a e b, conforme mostrado abaixo.

 *' 2
=0
+

 *' 2
=0

Substituindo as expresses para *' 2 em termos de a e b, temos:


' +'
+

' +'

2
2

=0
=0

Resolvendo as derivadas, chegamos s seguintes equaes:

 2\' +' ] '  = 0




 2\' +' ] 1 = 0


Dividindo as equaes acima por 1/2, obtemos as equaes abaixo:

 \' +' ] '  = 0




 \' +' ] = 0


As equaes acima podem ser reescritas na forma:

 \' ' ] +  '   '  = 0




 \' ] +     1 = 0


Como  1 = , ou seja, o nmero de pontos, podemos resolver o sistema de

duas equaes acima e chegar s equaes para as constantes a e b.

+=
=

   
    

     
    

Vamos agora calcular os valores de a e b para os dados da Tabela 10. Vamos


reescrev-la, novamente.

xy

x2

y2

0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.10
x = 0,55

0.012
0.048
0.052
0.088
0.092
0.128
0.132
0.168
0.172
0.208
y = 1,1

0.00012
0.00096
0.00156
0.00352
0.00460
0.00768
0.00924
0.01344
0.01548
0.02080
xy = 0,0774

0.0001
0.0004
0.0009
0.0016
0.0025
0.0036
0.0049
0.0064
0.0081
0.0100
x2 = 0,0385

0.000144
0.002304
0.002704
0.007744
0.008464
0.016384
0.017424
0.028224
0.029584
0.043264
y2 = 0,15624

Vamos usar as equaes para a e b.

+=
=

10 0,0774 0,55 1,1


= 2,048
10 0,0385 0,55

0,0385 1,1 0,55 0,0774


= 0,003
10 0,0385 0,55

Chegamos ento, a seguinte reta de regresso:

= 2,048  0,003

Captulo 4. Fontes de Erro em Anlise Qumica.

Preciso e Exatido

As medidas que so feitas em uma anlise qumica (massas, volumes,


absoro de luz, corrente eltrica, etc.), tm por objetivo final determinar a
concentrao, ou o teor de um analito em uma amostra.
Em anlise qumica, uma tcnica um princpio qumico, ou fsico, que pode
ser usado para analisar uma amostra. Geralmente utiliza-se uma das seguintes
tcnicas analticas:

Tcnicas clssicas: gravimetria (pesagens) e volumetria (titulaes).

Tcnicas espectroqumicas: espectroscopia de ultravioleta-visvel (UV-vis),


espectroscopia no infravermelho com transformada de Fourier (FTIR),
espectroscopia de absoro atmica (AAS), etc.

Tcnicas eletroqumicas: potenciometria, coulometria, voltametria, etc.


Um mtodo a aplicao de uma tcnica para a determinao de um analito

especfico em uma matriz especfica. Por exemplo, existem mtodos para determinar a
concentrao de chumbo (Pb) no solo, na gua, ou no sangue, por espectroscopia de
absoro atmica com forno de grafite. Assim como existe um mtodo para
determinao do teor de vitamina C, em suplementos vitamnicos, por volumetria de
oxirreduo.
A repetio de uma medida, pelo mesmo mtodo, indica a preciso
(reprodutibilidade) da medida. A diferena entre os valores medidos pelo mesmo
mtodo denominada desvio. Um tipo particularmente importante de desvio o
desvio-padro. Uma medida precisa aquela que possui um desvio-padro baixo.
A diferena entre a mdia dos valores medidos e um valor de referncia,
assumido como o valor verdadeiro, o erro da medida. Uma medida exata aquela
que possui um erro baixo. A concordncia entre resultados obtidos por mtodos
diferentes tambm indica a exatido (veracidade) da medida.

A Figura 17 ilustra os conceitos de preciso e exatido, considerando uma


srie de medidas efetuadas por um mesmo mtodo. As causas dos erros e dos
desvios sero discutidas na seo de Teoria de Erros.

Figura 17. A preciso a medida da disperso dos valores medidos por um mesmo
mtodo, geralmente dada pelo desvio-padro. A exatido a diferena entre
a mdia dos valores medidos e um valor de referncia, assumido como o
valor verdadeiro.

Incertezas Absoluta e Relativa

A incerteza absoluta expressa a margem de incerteza associada a uma


medida. Ela depende do instrumento, ou equipamento utilizado na medida.

Se a incerteza na leitura da massa em uma balana for de 0,01 g, chamamos


a grandeza 0,01 g de incerteza absoluta na leitura da massa. Um objeto de
massa 2,68 g medido nessa balana deve ser reportada da seguinte forma:
(2,680,01) g.

Se a incerteza na leitura do volume em uma bureta calibrada for de 0,02 mL,


chamamos a grandeza 0,02 mL de incerteza absoluta na leitura do volume.
Um volume de um lquido igual a 18,03 mL, medido nessa bureta, deve ser
reportado da seguinte forma: (18,030,02) mL.

A incerteza relativa compara o tamanho da incerteza absoluta, com o valor da


medida. Ela definida pela razo entre a incerteza absoluta e o valor da medida. Por
isso, adimensional, ou seja, no tem unidade. Quando multiplicada por 100, temos a
incerteza relativa percentual (%). Quando multiplicada por 1000, temos a incerteza
relativa em partes por mil (%o).

--}+ -+'.+

Para um objeto de massa (2,680,01) g, a incerteza relativa percentual de

a,a
,

--}+ L&%Y+
t+% *+ -*'*+

100% = 0,4%

Para um volume de um lquido igual a (18,030,02) mL, a incerteza relativa


percentual de

a,a

,a

100% = 0,1%

Algarismos Significativos

Algarismos significativos so o nmero mnimo de algarismos necessrios


para expressar o valor de um resultado experimental, sem perda de exatido. Esse
resultado experimental pode ser obtido de duas formas distintas:
(1) diretamente, como na medida da massa de uma substncia, pela
pesagem em uma balana, ou na medida do volume de uma soluo,
usando uma pipeta, ou uma bureta;
(2) indiretamente, como na determinao da concentrao de uma espcie
em soluo, atravs de clculos envolvendo as massas e volumes
medidos experimentalmente.

O nmero de algarismos significativos expressa a preciso de uma medida.


Por exemplo, existem balanas analticas cuja incerteza na medida da
massa de 0,00001 g a 0,0001 g (ou 0,01 mg a 0,1 mg) e a balana tcnica,
com incerteza de 0,01 g. Assim, um objeto pesado como 2,30385 g, em uma balana
analtica, possui seis algarismos significativos. O ltimo algarismo denominado
algarismo duvidoso, pois o seu valor no conhecido com certeza, j que a
incerteza

na

medida

est

na

quinta

casa

decimal.

Assim,

representa-se

apropriadamente a medida da massa do corpo como (2,30385 0,00001 g). Esse


mesmo objeto, pesado em uma balana tcnica deveria apresentar o valor 2,30 g, com
trs algarismos significativos. O algarismo duvidoso est agora na segunda casa
decimal. Essa medida mais apropriadamente representada como (2,30 0,01 g). A
medida feita com a balana analtica possui uma preciso maior que aquela efetuada
com a balana tcnica, pois os desvios entre medidas efetuadas na balana analtica
so, em princpio, menores.
Existem tambm as microbalanas cuja incerteza bem menor, ou seja
0,0000001 g (ou 0,1 g).
O algarismo zero, direita, significativo se fizer parte da medida. Por
exemplo, em uma massa de 3,81900 g, medida em uma balana com incerteza de
0,01 mg os dois ltimos algarismo (os zeros) so significativos.
O algarismo zero no significativo quando apenas expressar a ordem de
grandeza. Por exemplo, uma massa de 1,23 mg, medida em uma balana com
incerteza de 0,01 mg pode ser expressa como 0,00123 g. Neste caso, a medida
possui apenas trs algarismos significativos. Os zeros esquerda no so
significativos neste caso, pois expressam apenas converso 1 mg = 0,001 g. Neste
caso, til expressar a medida em notao cientfica, colocando apenas os
algarismos significativos e a potncia de dez. Neste caso, ficaria 1,23 103 g.
O mesmo acontece no caso de uma massa de 2,46 g, medida em uma balana
com incerteza de 0,01 g. Pode-se expressar essa massa como 2460 g. Entretanto, o
ltimo algarismo, o zero, no significativo, pois apenas expressa a relao de
converso 1 g = 1000 mg. Esta medida possui apenas trs algarismos significativos
que podem ser expressos de forma mais conveniente, usando a notao cientfica.
Neste caso, ficaria 2,46 103 mg.

Adio e Subtrao com Algarismos Significativos

Na adio e subtrao, envolvendo algarismos significativos, vale a seguinte


regra prtica:

A soma ou a diferena, de duas ou mais quantidades, dever ter tantas


casas decimais quantas existirem na parcela de menor nmero de casas
decimais.

Considere os seguintes exemplos:

(1) Uma massa foi determinada como 3,2 g em uma balana com incerteza de
0,1 g e outra massa foi determinada como 0,2032 g em uma balana com
incerteza de 0,0001 g. Calcule a soma das duas massas.
3,2
+0,2032
______
3,4032
O resultado deve ser expresso com uma casa decimal, ou seja, 3,4 g.

(2) A massa de um material foi determinada como 7,31 g em uma balana com
incerteza de 0,01 g. Cortou-se um pedao do material e a massa desse
pedao foi determinada como 1,2058 g em uma balana com incerteza de
0,0001 g. Calcule a massa do restante do material.
7,31
1,2058
______
6,1042
O resultado deve ser expresso com duas casas decimais, ou seja, 6,10 g.

Arredondamento

Quando for necessrio arredondar nmeros, aps operaes matemticas,


deve ser seguida a seguinte regra:
Se o dgito que segue o ltimo algarismo significativo do resultado for
maior ou igual a 5, ento se aumenta o ltimo algarismo significativo do
resultado em uma unidade. Caso contrrio, permanece inalterado o ltimo
algarismo significativo do resultado.
Considere os seguintes exemplos:

(1) Uma massa foi determinada como 3,2 g em uma balana com incerteza de
0,1 g e outra massa foi determinada como 0,4532 g em uma balana com
incerteza de 0,0001 g. Calcule a soma das duas massas.
3,2
+0,4532
______
3,6532
O resultado deve ser expresso com uma casa decimal e deve ser arredondado,
aumentando uma unidade na primeira casa decimal, ou seja, 3,7 g.
(2) A massa de um material foi determinada como 7,31 g em uma balana com
incerteza de 0,01 g. Cortou-se um pedao do material e a massa desse
pedao foi determinada como 1,1226 g em uma balana com incerteza de
0,0001 g. Calcule a massa do restante do material.
7,31
1,1226
______
6,1874
O resultado deve ser expresso com duas casas decimais, aumentando uma
unidade na segunda casa decimal, ou seja, 6,19 g.

Multiplicao e Diviso com Algarismos Significativos

Na multiplicao e diviso, envolvendo algarismos significativos, vale a


seguinte regra:

O produto ou o quociente, de duas ou mais quantidades, no poder ter


uma incerteza relativa menor que o fator que possui a menor incerteza
relativa.

Felizmente, em muitos casos vale a seguinte regra prtica:

O produto ou o quociente, de duas ou mais quantidades, dever ter


tantos algarismos significativos quantos existirem no fator de menor
nmero de algarismos significativos.

Considere o seguinte exemplo:

(1) Na titulao de 24,98 mL de uma soluo de HCl, foram gastos 25,11 mL de


soluo de NaOH 0,1041 mol/L. Determine a concentrao da soluo de HCl.
# =

tT +# 25,11 , 0,1041 ,%/


=
= 0,1046417  ,%/
t
24,98 ,

O resultado deve ser expresso com quatro algarismos significativos, ou seja,


[HCl] =0,1046 mol/L.
Na seo sobre propagao da incerteza, a partir do erro aleatrio,
aprenderemos que nem sempre a regra prtica vlida para multiplicaes e divises.
Para tanto, deveremos calcular a propagao das incertezas e utilizar a regra que diz
que o resultado no poder ter uma incerteza relativa menor que o fator que possui a
menor incerteza relativa.

Teoria de Erros

Existem dois tipos bsicos de erros que acompanham uma medida:

Erros sistemticos (ou determinados). So devidos a falhas nos


equipamentos, na pureza dos reagentes, nos mtodos, ou na realizao dos
experimentos. Se realizarmos o experimento repetidas vezes, o erro
sistemtico repete-se sempre da mesma forma, ou seja, reprodutvel. Por
isso, em princpio, os erros sistemticos podem ser descobertos,
calculados e corrigidos. Um medidor de pH pode ter sido padronizado
incorretamente, levando a leituras de pH sistematicamente menores que o
valor verdadeiro, em por exemplo, 0,05 unidades. Neste caso, uma soluo
cujo pH verdadeiro fosse 7,00 produziria uma leitura de 6,95 no medidor de pH.
Quando se faz uma anlise por volumetria, o uso de um indicador inadequado
leva a um erro sistemtico de mtodo. Os erros de mtodo so os mais
difceis de serem detectados.

Erros aleatrios (ou indeterminados). So devidos a variveis que no esto


sob controle durante o experimento. A probabilidade de o erro aleatrio ser
positivo ou negativo a mesma. Este tipo de erro sempre est presente e
no pode ser corrigido. Uma pessoa, lendo a mesma escala de um
instrumento diversas vezes, provavelmente obter leituras diferentes a cada
vez, devido s interpolaes subjetivas que so feitas entre as marcaes da
escala. Rudos eltricos aleatrios em equipamentos tambm levam a
flutuaes positivas e negativas nas medidas. Por sua natureza aleatria,
este tipo de erro pode ser tratado estatisticamente.

Propagao da Incerteza, a partir do Erro Aleatrio

Considere que todos os erros sistemticos foram detectados e corrigidos. Na


maioria dos experimentos necessrio realizar operaes aritmticas envolvendo
diversos nmeros, cada um deles associado a um erro aleatrio. As incertezas se
propagam durante as operaes aritmticas. Qual a incerteza do resultado de uma
operao aritmtica envolvendo nmeros associados a erros aleatrios?

Adio e Subtrao

Considere a operao aritmtica abaixo, envolvendo adio e subtrao de


nmeros e suas respectivas incertezas absolutas (e1, e2, e3). Qual o valor da
incerteza absoluta e4, do resultado?

1,76 (0,03) e1
+1,89 (0,02) e2
0,59 (0,02) e3
_______________
3,06 (e4)

O valor da incerteza absoluta e4, do resultado de somas e adies dado pela


equao abaixo:

-4 = -21 + -22 + -23


No caso da operao aritmtica acima, o valor da incerteza absoluta e4, do
resultado calculado pela equao acima, conforme mostrado abaixo.
- = < 0,03 + 0,02 + 0,02
- = <0,0009 + 0,0004 + 0,0004
- = <0,0017
- = 0,04

Normalmente, utiliza-se representar o primeiro algarismo no significativo como


subscrito (0,041) para evitar erros de arredondamento nos clculos subseqentes
que utilizem esse nmero.
A incerteza relativa percentual, %- do resultado dada pela equao abaixo.
%- =

0,04
100% = 1, %
3,06

Resultado: 3,06(0,04) incerteza absoluta; 3,06(1%) incerteza relativa percentual.

Multiplicao e Diviso

Considere a operao aritmtica abaixo, envolvendo multiplicao e diviso de


nmeros e suas respectivas incertezas absolutas (e1=0,03, e2=0,02, e3=0,02). Qual
o valor da incerteza absoluta, e4 e da incerteza relativa percentual, %- do resultado?
1,76 0,03 1,89 0,02
= 5,64 - 
0,59 0,02
O valor da incerteza relativa percentual %e4, do resultado de multiplicaes e
divises dado pela equao abaixo, envolvendo as incertezas relativas percentuais
dos fatores da operao.

%-4 = %-21 + %-22 + %-23

Primeiro temos que encontrar as incertezas relativas percentuais dos fatores da


operao.
%- =
%- =
%- =

0,03
100% = 1, %
1,76

0,02
100% = 1, %
1,89
0,02
100% = 3, %
0,59

Calcula-se, assim, o valor da incerteza relativa percentual %e4, do resultado da


operao acima, conforme mostrado abaixo.

%- = \1,7 ] + \1,1 ] + \3,4 ]


2

%- = <2,89 + 1,21 + 11,56


%- = <15,66
%- = 4,a %

A incerteza absoluta, e4 do resultado ento encontrado conforme mostrado


abaixo.

- =

%-
.+% *% -&Y+*%
100
- =

4,0

100

5,64

- = 0, 2

Resultado: 5,64(0,23) incerteza absoluta; 5,64(4,0%) incerteza relativa percentual. O


resultado possui apenas dois algarismos significativos.

Tratamento Estatstico dos Erros Aleatrios

Na ausncia de erros sistemticos, os erros aleatrios permanecem e no


podem ser detectados e corrigidos. Entretanto, os erros aleatrios seguem a lei de
distribuio normal, discutida no Capitulo 2.
Em uma srie de medidas experimentais, tem-se um conjunto de dados

amostrais  ,  ,  , . Com esses dados, pode-se calcular a mdia amostral,  e o


desvio-padro amostral, & utilizando as equaes abaixo, discutidas anteriormente,
onde N o nmero de dados amostrais, ou seja, o tamanho da amostra.

 =

1
 



1
   
&=
 1


O intervalo de confiana para a mdia populacional, pode ser estimado a

partir da mdia amostral,  , do tamanho da amostra, N e do desvio-padro da

populao, ou da amostra, s. Usam-se as equaes abaixo, em cada caso.

 =  }
 = 


&

Um intervalo de confiana diz que o valor da mdia populacional est


compreendido em um certo intervalo, com uma certa probabilidade. As probabilidades
so dadas pelos valores de z ou t e so encontradas nas tabelas dos Apndices.

Exemplo 1. Uma srie de  = 9 medidas de concentrao de um analito produziu

uma mdia amostral de  = 3,78 ,%/. Sabe-se que o desvio-padro populacional

/ = 0,03 ,%/. Determine o intervalo de confiana da mdia com uma probabilidade

de 95%.

Soluo: Usaremos a Tabela A1 do apndice. Temos de encontrar o valor de z cuja rea entre -z
e +z seja de 95%. Nesse caso, a rea fora desse intervalo dada pelo clculo 10,95 = 0,05.
Logo, a rea acima de z dada por 0,05/2 = 0,025. A Tabela A1 fornece as reas abaixo de z.
Portanto, temos de encontrar o valor de z cuja rea esquerda seja 10,025 = 0,975. Procurando
na Tabela A1, encontramos z = 1,96. Portanto a mdia populacional est no intervalo de
confiana abaixo, com probabilidade de 95%.
 = 3,78 1,96
 = 3,78 1,96

0,03
9

0,03
3

 = 3,78 1,96 0,01


 = 3,78 0,01

Exemplo 2. Uma srie de  = 9 medidas de concentrao de um analito produziu

uma mdia amostral de  = 3,78 ,%/. Sabe-se que o desvio-padro amostral

& = 0,03 ,%/. Determine o intervalo de confiana da mdia com uma probabilidade

de 95%.

Soluo: Usaremos a Tabela A3 do apndice. Temos de encontrar o valor de t cuja rea entre -t
e +t seja de 95%, com N1 = 91 = 8 graus de liberdade (gl). Procurando na Tabela A3, para
95% e gl=9, encontramos t = 2,306. Portanto a mdia populacional est no intervalo de
confiana abaixo, com probabilidade de 95%.
 = 3,78 2,306
 = 3,78 2,306

0,03
9

0,03
3

 = 3,78 2,306 0,01


 = 3,78 0,02a

Na ausncia de erro sistemtico o valor da mdia populacional, coincide com o valor


verdadeiro Xv. Na presena de erro sistemtico, o erro dado por K =  r .

PROBLEMAS

01.

Considere os seguintes pontos experimentais (x; y): (3,0; 3,87), (10,0; 12,99), (20,0;
25,93), (30,0; 38,89), (40; 51,96). Com esses n=5 pontos, faa o que se pede a
seguir: (a) faa uma tabela com os pontos experimentais e mostre como se calculam
os valores de x, y, xy, x2 e y2; (b) construa, em escala, o diagrama de
disperso; (c) calcule o coeficiente de correlao, r (d) classifique a correlao
quanto intensidade e ao sinal (positiva ou negativa); (e) determine a reta de
regresso = + + .

02.

Discuta os significados dos termos a seguir, dando exemplos diferentes daqueles


apresentados em sala de aula e na apostila da disciplina. Pesquise em livros de
Qumica Analtica. (a) Tcnica e mtodo; (b) Exatido e preciso; (c) Erro e desvio;
(d) Incerteza absoluta e incerteza relativa; (e) Erro sistemtico e erro aleatrio.

03.

Calcule os resultados das seguintes adies e subtraes, usando o nmero correto


de algarismos significativos, bem como as incertezas absolutas e relativas
percentuais dos resultados, usando a propagao das incertezas devida a erros
aleatrios. Faa os devidos arredondamentos quando necessrio.
(a) 3,785(0,002) + 1,08(0,03) 2,09023(0,00001)
(b) 23,03(0,05) + 19,0876(0,0001) 15,0 (0,3)

04.

Calcule os resultados das seguintes multiplicaes e divises, usando o nmero


correto de algarismos significativos, bem como as incertezas absolutas e relativas
percentuais dos resultados, usando a propagao das incertezas devida a erros
aleatrios. Faa os devidos arredondamentos quando necessrio.
(c) 3,785(0,002) 1,08(0,03) 2,09023(0,00001)
(d) 23,03(0,05) 19,0876(0,0001) 15,0 (0,3)

05.

Calcule o que se pede abaixo. Utilize as Tabelas A1 e A3 do Apndice da apostila da


disciplina.
(a) Uma srie de  = 4 medidas de concentrao de um analito produziu uma mdia
amostral de  = 1,08 ,%/. Sabe-se que o desvio-padro populacional
/ = 0,05 ,%/. Determine o intervalo de confiana da mdia com uma
probabilidade de 98,96%, usando o teste Z.
(b) Uma srie de  = 4 medidas de concentrao de um analito produziu uma mdia
amostral de  = 1,08 ,%/. Sabe-se que o desvio-padro amostral & =
0,05 ,%/. Determine o intervalo de confiana da mdia com uma
probabilidade de 98%, usando o teste t.

APNDICES

A1. Tabela de probabilidades para distribuio normal reduzida.

Probabilidades Esquerda
P(Z<a)
a
a |
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
----+------------------------------------------------------------------------------0.0 | 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 | 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 | 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 | 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 | 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 | 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 | 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 | 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 | 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 | 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 | 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 | 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 | 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 | 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 | 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 | 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 | 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 | 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 | 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 | 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 | 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 | 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 | 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 | 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 | 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 | 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 | 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 | 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 | 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 | 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 | 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990

gl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

A2. Tabela de probabilidades para a distribuio t de


Student unilateral com graus de liberdade.

Os valores tabelados correspondem aos pontos a tais que: :


p=0,600
p=0,750
p=0,900
p=0,950
p=0,975
p=0,990
p=0,995
0,325
1,000
3,078
6,314
12,706
31,821
63,657
0,289
0,816
1,886
2,920
4,303
6,965
9,925
0,277
0,765
1,638
2,353
3,182
4,541
5,841
0,271
0,741
1,533
2,132
2,776
3,747
4,604
0,267
0,727
1,476
2,015
2,571
3,365
4,032
0,265
0,718
1,440
1,943
2,447
3,143
3,707
0,263
0,711
1,415
1,895
2,365
2,998
3,499
0,262
0,706
1,397
1,860
2,306
2,896
3,355
0,261
0,703
1,383
1,833
2,262
2,821
3,250
0,260
0,700
1,372
1,812
2,228
2,764
3,169
0,260
0,697
1,363
1,796
2,201
2,718
3,106
0,259
0,695
1,356
1,782
2,179
2,681
3,055
0,259
0,694
1,350
1,771
2,160
2,650
3,012
0,258
0,692
1,345
1,761
2,145
2,624
2,977
0,258
0,691
1,341
1,753
2,131
2,602
2,947
0,258
0,690
1,337
1,746
2,120
2,583
2,921
0,257
0,689
1,333
1,740
2,110
2,567
2,898
0,257
0,688
1,330
1,734
2,101
2,552
2,878
0,257
0,688
1,328
1,729
2,093
2,539
2,861
0,257
0,687
1,325
1,725
2,086
2,528
2,845
0,257
0,686
1,323
1,721
2,080
2,518
2,831
0,256
0,686
1,321
1,717
2,074
2,508
2,819
0,256
0,685
1,319
1,714
2,069
2,500
2,807
0,256
0,685
1,318
1,711
2,064
2,492
2,797
0,256
0,684
1,316
1,708
2,060
2,485
2,787
0,256
0,684
1,315
1,706
2,056
2,479
2,779
0,256
0,684
1,314
1,703
2,052
2,473
2,771
0,256
0,683
1,313
1,701
2,048
2,467
2,763
0,256
0,683
1,311
1,699
2,045
2,462
2,756
0,256
0,683
1,310
1,697
2,042
2,457
2,750
0,255
0,681
1,303
1,684
2,021
2,423
2,704
0,254
0,679
1,296
1,671
2,000
2,390
2,660
0,254
0,677
1,289
1,658
1,980
2,358
2,617
0,253
0,674
1,282
1,645
1,960
2,326
2,576

p=0,9995
636,619
31,598
12,924
8,610
6,869
5,959
5,408
5,041
4,781
4,587
4,437
4,318
4,221
4,140
4,073
4,015
3,965
3,922
3,883
3,850
3,819
3,792
3,768
3,745
3,725
3,707
3,689
3,674
3,660
3,646
3,551
3,460
3,373
3,291

A3. Tabela de probabilidades para a distribuio t de Student bilateral com


graus de liberdade.

A 0.80 0.90 0.95 0.98 0.99 0.995 0.998 0.999


P 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001
3.078 6.314 12.706 31.820 63.657 127.321 318.309 636.619
1

gl

1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599

1.638 2.353 3.182 4.541 5.841 7.453

10.215 12.924

1.533 2.132 2.776 3.747 4.604 5.598

7.173

8.610

1.476 2.015 2.571 3.365 4.032 4.773

5.893

6.869

1.440 1.943 2.447 3.143 3.707 4.317

5.208

5.959

1.415 1.895 2.365 2.998 3.499 4.029

4.785

5.408

1.397 1.860 2.306 2.897 3.355 3.833

4.501

5.041

1.383 1.833 2.262 2.821 3.250 3.690

4.297

4.781

10

1.372 1.812 2.228 2.764 3.169 3.581

4.144

4.587

11

1.363 1.796 2.201 2.718 3.106 3.497

4.025

4.437

12

1.356 1.782 2.179 2.681 3.055 3.428

3.930

4.318

13

1.350 1.771 2.160 2.650 3.012 3.372

3.852

4.221

14

1.345 1.761 2.145 2.625 2.977 3.326

3.787

4.140

15

1.341 1.753 2.131 2.602 2.947 3.286

3.733

4.073

16

1.337 1.746 2.120 2.584 2.921 3.252

3.686

4.015

17

1.333 1.740 2.110 2.567 2.898 3.222

3.646

3.965

18

1.330 1.734 2.101 2.552 2.878 3.197

3.610

3.922

19

1.328 1.729 2.093 2.539 2.861 3.174

3.579

3.883

20

1.325 1.725 2.086 2.528 2.845 3.153

3.552

3.850

21

1.323 1.721 2.080 2.518 2.831 3.135

3.527

3.819

22

1.321 1.717 2.074 2.508 2.819 3.119

3.505

3.792

23

1.319 1.714 2.069 2.500 2.807 3.104

3.485

3.768

24

1.318 1.711 2.064 2.492 2.797 3.090

3.467

3.745

25

1.316 1.708 2.060 2.485 2.787 3.078

3.450

3.725

26

1.315 1.706 2.056 2.479 2.779 3.067

3.435

3.707

27

1.314 1.703 2.052 2.473 2.771 3.057

3.421

3.690

28

1.313 1.701 2.048 2.467 2.763 3.047

3.408

3.674

29

1.311 1.699 2.045 2.462 2.756 3.038

3.396

3.659

30

1.310 1.697 2.042 2.457 2.750 3.030

3.385

3.646

31

1.309 1.695 2.040 2.453 2.744 3.022

3.375

3.633

32

1.309 1.694 2.037 2.449 2.738 3.015

3.365

3.622

33

1.308 1.692 2.035 2.445 2.733 3.008

3.356

3.611

34

1.307 1.691 2.032 2.441 2.728 3.002

3.348

3.601

35

1.306 1.690 2.030 2.438 2.724 2.996

3.340

3.591

36

1.306 1.688 2.028 2.434 2.719 2.991

3.333

3.582

37

1.305 1.687 2.026 2.431 2.715 2.985

3.326

3.574

38

1.304 1.686 2.024 2.429 2.712 2.980

3.319

3.566

39

1.304 1.685 2.023 2.426 2.708 2.976

3.313

3.558

40

1.303 1.684 2.021 2.423 2.704 2.971

3.307

3.551

42

1.302 1.682 2.018 2.418 2.698 2.963

3.296

3.538

44

1.301 1.680 2.015 2.414 2.692 2.956

3.286

3.526

46

1.300 1.679 2.013 2.410 2.687 2.949

3.277

3.515

48

1.299 1.677 2.011 2.407 2.682 2.943

3.269

3.505

50

1.299 1.676 2.009 2.403 2.678 2.937

3.261

3.496

60

1.296 1.671 2.000 2.390 2.660 2.915

3.232

3.460

70

1.294 1.667 1.994 2.381 2.648 2.899

3.211

3.435

80

1.292 1.664 1.990 2.374 2.639 2.887

3.195

3.416

90

1.291 1.662 1.987 2.369 2.632 2.878

3.183

3.402

100

1.290 1.660 1.984 2.364 2.626 2.871

3.174

3.391

120

1.289 1.658 1.980 2.358 2.617 2.860

3.160

3.373

150

1.287 1.655 1.976 2.351 2.609 2.849

3.145

3.357

200

1.286 1.652 1.972 2.345 2.601 2.839

3.131

3.340

300

1.284 1.650 1.968 2.339 2.592 2.828

3.118

3.323

500

1.283 1.648 1.965 2.334 2.586 2.820

3.107

3.310

1.282 1.645 1.960 2.326 2.576 2.807

3.090

3.291

Potrebbero piacerti anche