Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Teresina PI
2013
SUMRIO
ASSUNTO
1. Conceitos Fundamentais em Estatstica. Organizao de
dados quantitativos. Estatstica descritiva. Populao e
amostra. Distribuies de frequncias. Tabelas. Grficos.
Histogramas. Medidas de tendncia central e de disperso:
mdia, mediana, moda, varincia, desvio-padro. Freqncia
relativa e probabilidade.
2. Aplicao da Matemtica Estatstica. Varivel aleatria.
Distribuies de probabilidade. A distribuio normal.
Esperana. Varincia. Distribuio amostral das mdias.
Estatstica inferencial. Teste de hipteses. Hiptese nula.
Testes unilaterais e bilaterais. Erros do tipo I e do tipo II. Nvel
de significncia. Teste Z. Teste t. Teste F. Intervalos de
confiana.
3. Mtodos Grficos e Numricos. Diagramas de disperso.
Correlao linear. Coeficiente de correlao de Pearson, r.
Coeficiente de determinao, r2. Teste de hipteses sobre a
correlao. Regresso linear simples. Mtodo dos mnimos
quadrados. Anlise de resduos.
4. Fontes de Erro em Anlise Qumica. Algarismos
significativos. Erro e desvio de uma medida. Exatido e
preciso. Tipos de erros: determinados e indeterminados.
Preciso de uma medida. Limite de confiana da mdia.
Propagao de erros. Rejeio de resultados: teste Q.
Amostragem. Padronizao. Calibrao. Validao. Certificao
da qualidade.
CARGA
HORRIA
04 h
12 h
10 h
04 h
Introduo
Estatstica a cincia que faz uso efetivo dos dados numricos relativos a
grupos de indivduos ou experimentos. Nesse sentido, ela trata de todos os aspectos,
incluindo no s a coleta, organizao, anlise e interpretao dos dados, mas
tambm o planejamento da coleta de dados. Importante dizer que todos os mtodos
estatsticos baseiam-se na teoria das probabilidades. A Estatstica bastante til para
orientar a tomada de decises baseada na anlise de um nmero muito grande de
dados, tal como pesquisas de opinio pblica e de mercado. A palavra estatstica
tambm pode ser usada para significar o prprio conjunto de dados, ou as grandezas
a ele associadas, tais como a mdia e o desvio-padro. Assim, num conjunto de
dados, podemos dizer que a mdia uma estatstica.
A etimologia, ou origem da palavra Estatstica, mostra que ela deriva da
palavra Estado. De fato, a expresso em Latim Moderno, statisticum collegium
(conselho de Estado) e a palavra em Italiano, statista (homem de Estado, Poltico),
fizeram com que o filsofo alemo Gottfried Achenwall (1719-1772) introduzisse o
termo em Alemo, Statistik, em 1749, significando anlise dos dados sobre o Estado.
Assim, a Estatstica foi originalmente desenvolvida para resolver questes de Estado,
tais como taxas de nascimento e de mortalidade, impostos, heranas, fortunas, etc.
Apesar de sua origem peculiar, a Estatstica hoje utilizada nas mais diversas
reas. Ela est presente nas teorias mais fundamentais da Fsica Moderna, como a
Mecnica Quntica, e hoje se sabe que a natureza das partculas fundamentais
governada por leis estatsticas. Nas reas de Sade, a Estatstica conhecida como
Bioestatstica. O nome pode ser diferente, mas os mtodos so os mesmos, sendo
apenas as aplicaes especficas para as reas de Sade. A Qumica utiliza bastante
a Estatstica, em suas diversas reas. Entretanto, a rea que mais faz uso da
Estatstica a Qumica Analtica. Nesse sentido, a compreenso da teoria de erros
e da obteno de retas de regresso, pelo mtodo dos mnimos quadrados, esto
entre os pontos mais relevantes. Reconhecer os tipos de erros em anlises
qumicas, saber como a propagao dos erros e como eles afetam o resultado
de suma importncia para o qumico. As retas de regresso so bastante usadas nas
curvas de calibrao, empregadas em diversas tcnicas de anlises quantitativas.
Populao e Amostra
qualquer conjunto, podemos escrever aqui apenas algumas das amostras possveis
para essa pequena populao: P={cara/cara; cara/coroa; coroa/cara; coroa/coroa}.
Teremos amostras com zero, um, dois, trs e quatro elementos. O tamanho da
amostra o nmero de elementos da amostra. Este exemplo foi colocado para ilustrar
que h sempre uma enorme quantidade de amostras, para qualquer populao.
Amostras (subconjuntos) possveis para uma populao onde uma moeda foi
jogada duas vezes:
A01 = { }
A02 = {cara/cara}
A03 = {cara/coroa}
A04 = {coroa/cara}
A05 = {coroa/coroa}
A06 = {cara/cara; cara/coroa}
A07 = {cara/cara; coroa/cara}
A08 = {cara/cara; coroa/coroa}
A09 = {cara/cara; cara/coroa; coroa/cara}
A10 = {cara/cara; cara/coroa; coroa/coroa}
246
1
0,04
247
2
0,08
248
3
0,12
249
4
0,16
250
5
0,20
251
4
0,16
252
3
0,12
253
2
0,08
254
1
0,04
= 1
Os dados da Tabela 1 podem ser visualizados na forma grfica. Uma forma
bastante usual o histograma de frequncias. Nesse grfico, a grandeza medida, ou
varivel aleatria, colocada no eixo horizontal (abscissa) e a frequncia absoluta,
ou a relativa, no eixo vertical (ordenada). A Figura 1 mostra o histograma de
frequncias para os dados da Tabela 1.
0,20
fr
0,15
0,10
0,05
0,00
246
247
248
249
250
251
252
253
254
[Cl ]/mg/L
x4 = 43
x2= 41
x5 = 44
x3 = 42
x6 = 45
1
=
+ + + + +
6
1
= 40 + 41 + 42 + 43 + 44 + 45
6
1
= 255
6
= 42,5
=
1
=
1
tamanho da amostra N.
=
1
=
=
1
1246 + 2247 + 3248 + 4249 + 5250 + 4251 + 3252 + 2253 + 1254#
25
=
1
6250#
25
= 250
dois mtodos, ou seja, obteve-se uma mdia de = 250 mg/L para a concentrao de
ons cloreto na gua tratada desse municpio brasileiro. Olhando para o histograma de
frequncias da Figura 1, vemos que esse valor coincide com o valor central da
distribuio de frequncias. Para uma distribuio simtrica como essa, a mdia
coincide com o valor central da distribuio. Isso ocorre na distribuio normal, a
qual ser vista mais adiante. Por esta razo, a mdia considerada uma medida de
tendncia central.
Outras medidas de tendncia central so a moda e a mediana. A moda
simplesmente o valor da varivel que possui a maior frequncia. No caso dos
dados da Tabela 1, a moda 250 mg/L, pois o valor que possui a maior frequncia.
+1
2
1
48
2
47
3
52
4
320
5
50
6
45
7
46
8
53
=
1
48 + 47 + 52 + 320 + 50 + 45 + 46 + 53 + 44 + 49#
10
=
1
754#
10
= 75,4
9
44
10
49
Vamos calcular a mediana, agora. Mas, para isso, primeiro temos que colocar
os dados em ordem crescente, na Tabela 3.
9
44
6
45
7
46
2
47
1
48
10
49
7
50
3
52
8
53
4
320
Medidas de Disperso
.+ = / =
1
& =
1
1
x4 = 43
x2= 41
x5 = 44
x3 = 42
x6 = 45
/ =
1
40 42,5 + 41 42,5 + 42 42,5 + 43 42,5 + 44 42,5 + 45 42,5 #
6
/ =
1
17,5#
6
/ = 2,91666
23 3, 43
& =
1
40 42,5 + 41 42,5 + 42 42,5 + 43 42,5 + 44 42,5
6 1
+ 45 42,5 #
& =
1
17,5#
5
53 = 6, 7
O valor de 888
obtido a partir da mdia dos quadrados dos valores de x.
x12 = (40)2= 1600
1
888
= 1600 + 1681 + 1764 + 1849 + 1936 + 2025
6
1
888
= 10855
6
888
= 1809,1666
888 1809,17
888
.+ =
Desvio-padro populacional:
/ = </ = <.+
Desvio-padro amostral:
& = <&
Vamos agora comparar dois conjuntos de dados amostrais, com varincias
246
60516
1
0,04
247
61009
2
0,08
248
61504
3
0,12
249
62001
4
0,16
250
62500
5
0,20
251
63001
4
0,16
252
63504
3
0,12
253
64009
2
0,08
254
64516
1
0,04
3 = 37=3 = >37==
888
=
1
160516 + 261009 + 361504 + 462001 + 562500 + 463001 + 363504
25
888
=
1
1562600#
25
+ 264009 + 164516#
888
3 = >37=?
2
.+ = 888
2
246
60516
1
0,04
247
61009
1
0,08
248
61504
2
0,12
249
62001
8
0,16
250
62500
8
0,20
251
63001
8
0,16
252
63504
2
0,12
253
64009
1
0,08
254
64516
1
0,04
0,25
0,20
fr
0,15
0,10
0,05
0,00
246
247
248
249
250
251
252
253
254
[Cl ] / mg/L
=
=
1
1246 + 1247 + 2248 + 8249 + 8250 + 8251 + 2252 + 1253 + 1254#
25
1
8000#
32
= 37=
3 = 37=3 = >37==
888
=
1
160516 + 161009 + 261504 + 862001 + 862500 + 863001 + 263504
32
888
=
1
2000082#
32
+ 164009 + 164516#
888
3 = >37=3, 7>37
2
.+ = 888
2
0,25
0,20
0,20
0,15
fr
fr
0,15
0,10
0,10
0,05
0,05
0,00
0,00
246
247
248
249
250
251
252
253
254
246
247
248
249
250
251
252
253
254
[Cl ]/mg/L
[Cl ] / mg/L
Dados Agrupados
Frequncia Absoluta
16
21
2
frequncia absoluta
20
15
10
0
64
65
66
67
68
69
70
71
pesos / kg
=
1
=
1
1665 + 2168 + 271#
40
=
1
2610#
40
= >7, 37
Frequncia Absoluta
3
5
8
11
7
3
2
1
Frequncia Absoluta
10
0
64
65
66
67
68
69
70
71
72
Pesos / kg
=
=
1
=
1
2747#
40
1
364 + 565 + 866 + 1167 + 768 + 3 69 + 370 + 172#
40
= >E, >E
Probabilidade
Experimento Aleatrio
Espao Amostral
Cara
Coroa
=
=
K
C
Desde j vamos deixar bem claro que a jogada de uma nica moeda M vezes
e uma nica jogada de M moedas so experimentos aleatrios completamente
equivalentes, com os mesmos espaos amostrais.
O espao amostral, para a jogada de uma moeda, possui 21 = 2 elementos
dado pelo conjunto, A1 abaixo. O espao amostral, para a jogada de duas moedas,
possui 22 = 4 elementos dado pelo conjunto, A2 abaixo. O espao amostral, para a
jogada de trs moedas, possui 23 = 8 elementos e dado pelo conjunto, A3 abaixo.
A1 = {K, C}
A2 = {KK, KC, CK, CC}
A3 = {KKK, KKC, KCK, KCC, CKK, CKC, CCK, CCC}
Evento
E3,1 = {KKK, KKC, KCK, KCC}: Sair cara no lanamento da primeira moeda.
E3,2 = {KKC, KCK, CKK}: Sair exatamente uma coroa.
E3,3 = {KKK, KKC, KCK, KCC, CKK, CKC, CCK}: Sair no mximo duas coroas.
E3,4 = {KKK, KKC, KCK, CKK}: Sair pelo menos duas caras.
E3,5 = {KKK}: No sair nenhuma coroa.
Probabilidade de um Evento
JK =
K
L
K 4 1
= = = 0,50
L 8 2
O resultado foi PE=0,50 ou seja, h 50% de chance de sair pelo menos duas
Exerccio Resolvido.
Uma moeda jogada 2 vezes. Calcule a probabilidade de sair cara na primeira jogada e coroa na segunda.
Resoluo:
Primeiro escrevem-se o espao amostral e o evento, com os respectivos tamanhos.
A2 ={KK, KC, CK, CC}; N(A) = 4;
K 1
= = 0,25
L 4
=
N
N
48
=
= 0,48
100
A = {1,3,5,7,9}
B = {0,2,4,6,8}
Considere, agora, uma moeda sendo jogada duas vezes. J vimos que o
espao amostral dado pelo conjunto abaixo:
A2 = {KK, KC, CK, CC}
Vamos considerar dois eventos que sejam mutuamente excludentes. Por
exemplo:
J\K, ] =
\K,
] 1
= = 0,25
L
4
J\K, ] =
\K, ] 2
= = 0,50
L
4
A = {1,2,5,6,9}
B = {0,2,4,6,8}
J\E2,1 E2,2 ] =
\E2,1 E2,2 ] 1
= = 0,125
8
L
JL %Y Z = JL Z = JL + JZ JL Z
J\K2,1 K2,2 ] =
L
L
L
J\K2,1 K2,2 ] =
1 3 1 3
+ = = 0,75
4 4 4 4
Resoluo:
Primeiro escrevem-se o espao amostral e os eventos, com os respectivos tamanhos.
A2 ={11, 12, 13, 14, 15, 16, 21, 22, 23, 24, 25,26, 31, 32, 33, 34, 35, 36, 41, 42, 43, 44, 45, 46, 51, 52, 53,
54, 55, 56, 61, 62, 63, 64, 65, 66};
N(A2) = 36
N(E2,1) = 6
E2,2 = {12, 22, 32, 42, 52, 62}: Sair 2 na segunda jogada.
N(E2,1) = 6
N(E2,1 E2,2) = 1
K,
K,
1
=
= 0,0278
L
36
Jogando um dado duas vezes, h uma chance de 2,78% de sair 1 na primeira jogada e 2 na segunda
jogada.
(b) A probabilidade de sair 1 na primeira jogada ou 2 na segunda jogada a probabilidade da unio entre
os dois eventos, ou seja, dado pelo clculo abaixo:
J\K, K, ] =
J\K, K, ] =
L
L
L
6
6
1
+
Jogando um dado duas vezes, h uma chance de 30,6% de sair 1 na primeira jogada ou 2 na segunda
jogada.
analisar
um
exemplo
interessante,
usando
amostragem
com
1
= 1,07 10b
9,31 10a
7 =823 543.
O valor 7! denominado fatorial de 7. O fatorial de um nmero muito
importante na teoria das probabilidades. Abaixo esto os valores dos fatoriais de zero
a dez, dando a idia do conceito. Os valores dos fatoriais crescem muito depressa e
nmeros grandes tm fatoriais gigantescos, por exemplo, 70! 10100.
Por definio, o fatorial de zero 1.
0! =1
1! = 1
2! =2x1 =2
3! = 3x2x1 = 6
4! = 4x3x2x1 = 24
5! = 5x4x3x2x1 = 120
6! = 6x5x4x3x2x1 = 720
7! = 7x6x5x4x3x2x1 = 5 040
8! = 8x7x6x5x4x3x2x1 = 40 320
9! = 9x8x7x6x5x4x3x2x1 = 362 880
10! = 10x9x8x7x6x5x4x3x2x1 = 3 628 800
Arranjos
Lh =
i
!
j!
Combinaes
60!
60! 60 59 58 57 56 55 54!
=
=
= 36 045 979 200
60 6! 54!
54!
O nico problema com esse clculo o seguinte. Suponha que tenha sado as
dezenas: 01, 05, 23, 25, 37, 39. Esse clculo conta todas as permutaes possveis
dessas dezenas. Ento, temos de dividir o resultado pelo nmero de
permutaes, ou seja 6! = 720. Isto porque a ordem em que os resultados saem
no importa.
Assim, a frmula para a combinao W j X de n objetos, tomados j de cada vez
!
WjX =
j! j!
Fazendo o clculo da combinao de 60 objetos, tomados 6 de cada vez,
chegamos ao nmero de formas distintas que se pode escolher as seis dezenas na
Mega-Sena.
W
60!
60!
60 59 58 57 56 55 54! 36 045 979 200
60
X=
=
=
=
= 50 063 860
6
6! 60 6! 6! 54!
720
6! 54!
Probabilidade Condicional
Dados dois eventos A e B, a probabilidade condicional PA|B a
L Z JL Z
=
Z
JZ
N(E2,1E2,2) = 1
J\K, mK,] =
K,
K, 1
= = 0,167
6
K,
Eventos Independentes
JL|Z = JL
Considere que aparea um 3 na primeira jogada de um dado. No que isso afeta
a probabilidade de aparecer qualquer outro nmero na prxima jogada? A resposta
que no afeta em nada. Nesse caso, os eventos so independentes.
Portanto, para eventos independentes pode-se escrever a expresso abaixo.
JL =
JL Z
JZ
Lembrando que P(AB)=P(A e B), essa ltima expresso pode ser rearranjada
na forma abaixo.
JL - Z = JL JZ
(eventos independentes)
6 6
1 1
1
= =
= 0,0278
36 36 6 6 36
Problemas
Freqncia
8
44
23
6
107
11
1
Estudantes
23 carros
33
63
68
19
10
1
0
Professores e Servidores
30 carros
47
36
30
8
0
0
1
Velocidade / km/h
42-43
44-45
46-47
48-49
50-51
52-53
54-55
56-57
58-59
Idade na Morte
16-25
26-35
36-45
46-55
56-65
66-75
76-85
11. Uma moeda jogada trs vezes. Calcule a probabilidade dos eventos abaixo. Dica:
escreva os conjuntos que representam o espao amostral e os eventos.
(a) Sair exatamente uma cara.
(b) Sair no mximo duas caras.
(c) Sair coroa no lanamento da primeira moeda.
(d) No sair nenhuma cara.
12. Uma moeda jogada trs vezes. Calcule as probabilidades que se pedem abaixo.
(a) Sair trs caras ou trs coroas.
(b) Sair trs caras e trs coroas.
(c) Sair duas caras ou duas coroas.
(d) Sair duas caras e duas coroas.
(e) Sair uma cara e uma coroa.
(f) Sair uma cara ou uma coroa.
13. Defina e d exemplos, diferentes daqueles dados no texto, de: (a) amostragem com
reposio; (b) amostragem sem posio; (c) fatorial de um nmero; (d) permutao;
(e) arranjo; (e) combinao.
14. De quantas formas distintas 9 pessoas podem ficar dispostas em fila indiana?
15. Quantos anagramas podemos formar com a palavra TEORIA?
16. Em uma prova com 10 questes de mltipla escolha, com 4 alternativas cada, qual
a probabilidade de um candidato responder a prova e acertar todas a questes
apenas no palpite?
17. Se voc tem 15 camisas em uma gaveta, para serem usadas durante a semana (7
dias), uma cada dia, sem reposio, de quantas maneiras diferentes pode-se
escolher as camisas para os sete dias da semana?
18. Em um campeonato de futebol, participam 20 times. Quantos resultados so
possveis para os 3 primeiros lugares?
A Distribuio Binomial
Uma varivel aleatria discreta aquela que pode ser descrita por meio de
nmeros inteiros. Por exemplo, quando se joga uma moeda 20 vezes, podemos definir
uma varivel aleatria X discreta como sendo o nmero de vezes que sai o resultado
cara. Assim, os valores possveis de X podem ser: X = 0, 1, 2, 3, ..., 20.
A distribuio binomial uma distribuio de probabilidade para varivel
discreta. Ela caracterizada por dois parmetros, apenas (n,p). O parmetro n
o nmero de vezes que o experimento executado.
Por exemplo, no lanamento de uma moeda, a moeda pode ser lanada n = 1,
2, 3, 4, 5, ... vezes. O parmetro p a probabilidade de sucesso em cada vez que
o experimento executado. Por exemplo, no lanamento de uma moeda, p= pode
representar a probabilidade de sair cara (ou coroa). Por consequncia, 1p a
probabilidade de fracasso.
Uma distribuio de frequncia coloca a varivel aleatria no eixo horizontal
(abscissa) e a probabilidade de ocorrncia de cada valor da varivel no eixo vertical
(ordenada). Seja X uma varivel aleatria. A probabilidade PX=i de se obter X=i
sucessos, em uma distribuio binomial (n, p), dada pela equao abaixo.
Jr = ' = W X $ 1 $hb
'
Na equao acima, foi utilizada a notao de combinao, dada abaixo.
!
W X=
'
'! '!
nas outras 19 moedas, pela distribuio binomial 20, calculada da forma abaixo.
Jr = 1 =
20!
0,5
1 0,5ab
= 0,0000190735
1! 20 1!
destacado.
i
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
PX=i
=i
0,0000009537
0,0000190735
0,0001811980
0,0010871900
0,0046205500
0,0147858000
0,0369644000
0,0739288000
0,1201340000
0,1601790000
0,1761970000
0,1601790000
0,1201340000
0,0739288000
0,0369644000
0,0147858000
0,0046205500
0,0010871900
0,0001811980
0,0000190735
0,0000009537
0.18
0.16
0.14
P(X=i)
0.12
0.10
0.08
0.06
0.04
0.02
0.00
0
10
12
14
16
18
20
i
Figura 5. Distribuio binomial n, p = 20, . Seja X a varivel aleatria e PX=i, a
probabilidade de se obter X=i sucessos.
distancia de 10.
30!
0,2a 1 0,2aba = 1,07 10b
30! 30 30!
30!
0,2
1 0,2ab
= 0,000179
15! 30 15!
30!
0,2 1 0,2ab = 0,179
6! 30 6!
A Distribuio Normal
Uma varivel aleatria contnua aquela que pode ser descrita por meio de
nmeros reais. Por exemplo, a concentrao dos ons cloreto em amostras de gua.
A distribuio normal uma distribuio de probabilidade para varivel
contnua. Ela caracterizada por dois parmetros populacionais (, ). Ela uma
distribuio simtrica, em forma de sino, sendo que o valor central a mdia da
populao, e a medida da disperso o desvio-padro, da populao.
A distribuio normal dada pela curva gaussiana, nome dado em
homenagem ao matemtico alemo Johann Carl Friedrich Gauss (1777-1855). Seja x
uma varivel aleatria contnua. A curva gaussiana a funo densidade de
probabilidade, fx para a varivel aleatria x e dada pela equao abaixo.
=
22v
wbxy
23
E(x) =
Var(x) = 2
A Figura 6 apresenta duas curvas gaussianas, ambas com =0. Uma das
curvas possui =1,0 e a outra, =2,0. A curva com maior mais larga e menos alta.
z=
/
z =
2v
- b z
z =
1,47 1,60 ,
= 0,65
0,20 ,
z =
1,68 1,60 ,
= +0,40
0,20 ,
~y
Jz
< z < z
= | } *}
~
um valor entre Z1 e Z2 dada pela rea abaixo da curva de fZ, entre os valores Z1 e
Jz < z < z =
1 ~y 1 ~y
| - 2 *}
2v ~
Figura 7. rea abaixo da curva gaussiana reduzida (=0, =1) na faixa 2 < Z < 2.
A rea total sob a curva 1, significando 100% (vide Figura 7). Em outras
palavras, a probabilidade de a varivel Z assumir valores na faixa < Z < + P=1.
Essa a denominada condio de normalizao, expressa pela equao abaixo.
bV
} *} = 1
Jz > 2 =
1 0,9545 0,04550
=
= 0,02275
2
2
Jz = + = | } *} = 0
0,14 0,14
=
= 0,00
/
0,01
0,15 0,14
=
= 1,00
/
0,01
0,17 0,14
=
= 3,00
/
0,01
z =
0,141 0,14
=
= 0,100
/
0,01
0,142 0,14
=
= 0,200
/
0,01
padro & .
K =
t+ =
/
& = <t+ =
Exerccio Resolvido.
Suponha que a concentrao do gs poluente SO2 apresente uma distribuio populacional desconhecida
em uma cidade brasileira. A mdia da concentrao = 0,140 ppm e o desvio-padro, = 0,010 ppm
so conhecidos na populao. Voc coletou uma amostra aleatria de tamanho n=100, na cidade e mediu
o teor de SO2. Qual a probabilidade de a mdia amostral ter um valor entre 0,141 ppm e 0,142 ppm, ou
seja, calcule a seguinte probabilidade: P(0,141 ppm < < 0,142 ppm) = ?
Resoluo:
Pelo Teorema do Limite Central, temos que a mdia amostral segue uma distribuio aproximadamente
normal, com esperana, K = 0,14 ppm e desvio-padro, & =
a,a
a
aa
z=
z =
z =
/
0,141 0,14
= 1,00
0,001
0,142 0,14
= 2,00
0,001
A probabilidade que se quer pode ser obtida da tabela de probabilidades, atravs do seguinte clculo:
Resposta: A probabilidade de a mdia amostral ter um valor entre 0,141 ppm e 0,142 ppm, na populao
considerada, ser de 13,59%.
Teste de Hipteses
Rejeitar a hiptese nula Ho, quando de fato ela for verdadeira, definido como
erro do tipo I.
Vamos supor que hiptese nula seja Ho: = 0 e que chegssemos, atravs de
um teste de hiptese, concluso de que ela devesse ser rejeitada. Nesse caso,
haveria uma probabilidade de cometer o erro do tipo I. Essa probabilidade
denotada por (alfa). O valor dessa probabilidade denominado nvel de
significncia do teste e deve ser fixado pelo estatstico logo no incio do teste de
hiptese. Normalmente, o nvel de significncia estabelecido em 1% ou 5%, ou seja,
= 0,01 ou = 0,05.
(3) Se a hiptese nula for verdadeira, ento existe uma varivel aleatria
denominada estatstica de teste, que deve ser calculada e essa estatstica de
teste segue uma distribuio de probabilidade conhecida.
Por exemplo: uma amostra de tamanho n=100 obteve mdia amostral = 0,10. O desvio-
padro da populao conhecido, = 0,01. Neste caso, sabemos que, se a hiptese nula for
verdadeira, ter distribuio normal com mdia = 0 e desvio-padro & =
a, a
aa
0,010. Portanto, a estatstica de teste escolhida, denominada teste Z, ser a distribuio normal
reduzida: z =
w b
z. =
0,10 0
/ = 0,01 = 100
100
Valor p
Erros do Tipo I e II
Tipo I
Vimos o erro do tipo I cuja probabilidade se expressa por (alfa).
Rejeitar a hiptese nula Ho, quando de fato ela for verdadeira, definido como
erro do tipo I.
Tipo II
Veremos agora o erro do tipo II cuja probabilidade se expressa por (beta).
Exemplo:
(a) Testar a hiptese nula de que a mdia populacional seja = 0,140 ppm. Fixar
nvel de significncia em 5%.
Resoluo:
(1) Hiptese nula e alternativa: Ho: = 0,140 ppm; H1: 0,140 ppm
(2) Nvel de significncia: = 0,05 ( = probabilidade do erro do tipo I)
(3) Estatstica de teste: z =
w b
a,
ba,
a
,
= 1,75
(6) Deciso. |Zcalc.|<Zcrit. Como Zcalc. est na zona de aceitao, no se rejeita Ho.
= 0,140 ppm.
(c) Clculo de :
Neste caso, um erro do tipo II ser cometido se a mdia amostral, cair entre
z=
/
= z
= 1,96
= +1,96
0,04
100
0,04
100
+
+ 0,147 = 0,13916
+ 0,147 = 0,15484
aleatria assumir valores na faixa 0,13916 < < 0,15484, dado que
verdadeira, ou seja, dada pelas expresses abaixo.
0,0042v
a,
a,
w ba,
y
a,aay
= 0,950
Potncia de um teste
1. O tamanho da regio crtica sempre pode ser reduzida pela seleo apropriada
do valor de (alfa).
2. Os erros do tipo I e do tipo II esto relacionados. Uma diminuio em (alfa)
implica em um aumento em (beta) e vice-versa, desde que o tamanho da
amostra no varie.
3. Um aumento no tamanho da amostra reduzir o valor de (beta), desde que o
valor de (alfa) seja mantido constante.
4. Quando Ho for falsa, o valor de (beta) aumenta medida que o valor
verdadeiro do parmetro (p.ex. a mdia, ) se aproxima do valor usado em Ho.
valor de (beta) diminui medida que aumenta a diferena entre o valor
verdadeiro do parmetro e o valor usado em Ho.
Teste t
&
Testar a hiptese de que a amostra foi extrada de uma populao com distribuio
normal com mdia = 100 kg. (Considere nvel de significncia de 5%)
Resoluo:
(1) Hiptese nula e alternativa: Ho: = 90 kg; H1: 90 kg.
(2) Nvel de significncia: = 0,05
(3) Estatstica de teste:
w b
ab
aa
,
y
= 5,7735
(6) Deciso. |tcalc.|>tcrit. Como tcalc. est na regio de rejeio, rejeita-se Ho com nvel
de significncia de 5%.
(7) Concluso. Pelos dados amostrais e pelo teste de hiptese, no h razo
significativa (=0,05) para supor que a mdia populacional tenha sido extrada
Problemas
Teste Z para uma mdia. Nos problemas abaixo, utilize como critrio de
deciso no teste de hiptese tanto o valor crtico Zcrit. quanto o valor p.
0
1
2
3
4
5
6
7
8
9
10
0,0
0,8
4,8
7,2
19,2
20,0
43,2
39,2
76,8
64,8
120
120
100
80
60
40
20
0
0
10
x
Figura 14. Diagrama de disperso para os dados da Tabela 9. Em vermelho est a
curva de regresso dos dados.
L = %
a
a
Absorbncia
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.10
0.012
0.048
0.052
0.088
0.092
0.128
0.132
0.168
0.172
0.208
0.20
Absorbncia
0.15
0.10
0.05
0.00
0.00
0.02
0.04
0.06
c / mol L
0.08
0.10
-1
Figura 16. Diagrama de disperso para os dados da Tabela 10. Em vermelho est a
curva de regresso dos dados, que corresponde curva de calibrao.
=
Intensidade da Correlao
=1
Perfeita Positiva
Forte Positiva
Moderada Positiva
Fraca Positiva
nfima Positiva
Nula
nfima Negativa
Fraca Negativa
Moderada Negativa
Forte Negativa
Perfeita Negativa
Vamos agora calcular o valor de r para os dados da Tabela 10. Vamos chamar
a concentrao de x e a absorbncia de y. Vamos reescrever a Tabela 10, abaixo,
acrescentando as colunas xy, x2 e y2 e depois calcular as somatrias que aparecem na
equao para r: x, y, xy, x2, y2. No caso, o nmero de pontos n = 10.
xy
x2
y2
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.10
x = 0,55
0.012
0.048
0.052
0.088
0.092
0.128
0.132
0.168
0.172
0.208
y = 1,1
0.00012
0.00096
0.00156
0.00352
0.00460
0.00768
0.00924
0.01344
0.01548
0.02080
xy = 0,0774
0.0001
0.0004
0.0009
0.0016
0.0025
0.0036
0.0049
0.0064
0.0081
0.0100
2
x = 0,0385
0.000144
0.002304
0.002704
0.007744
0.008464
0.016384
0.017424
0.028224
0.029584
0.043264
y2 = 0,15624
=
= 0,9912
De acordo com a Tabela 11, trata-se de uma correlao forte positiva. Isto
bastante adequado para uma curva de calibrao.
Regresso Linear
O objetivo da regresso linear encontrar a equao da reta que melhor
descreve os dados. Para tanto, utiliza-se a equao da reta, dada abaixo, onde x e y
so as variveis, a o coeficiente angular e b o coeficiente linear da reta.
= + +
da reta, que minimizem *' 2, a somatria dos quadrados das diferenas entre yi e
(yi)calc, dados pela equao abaixo.
* = #
Para tanto, derivam-se os *' 2 em relao aos coeficientes a e b, da equao
*' 2
=0
+
*' 2
=0
' +'
2
2
=0
=0
2\' +' ]1 = 0
\' +' ] = 0
\' ] + 1 = 0
+=
=
xy
x2
y2
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.10
x = 0,55
0.012
0.048
0.052
0.088
0.092
0.128
0.132
0.168
0.172
0.208
y = 1,1
0.00012
0.00096
0.00156
0.00352
0.00460
0.00768
0.00924
0.01344
0.01548
0.02080
xy = 0,0774
0.0001
0.0004
0.0009
0.0016
0.0025
0.0036
0.0049
0.0064
0.0081
0.0100
x2 = 0,0385
0.000144
0.002304
0.002704
0.007744
0.008464
0.016384
0.017424
0.028224
0.029584
0.043264
y2 = 0,15624
+=
=
= 2,048 0,003
Preciso e Exatido
especfico em uma matriz especfica. Por exemplo, existem mtodos para determinar a
concentrao de chumbo (Pb) no solo, na gua, ou no sangue, por espectroscopia de
absoro atmica com forno de grafite. Assim como existe um mtodo para
determinao do teor de vitamina C, em suplementos vitamnicos, por volumetria de
oxirreduo.
A repetio de uma medida, pelo mesmo mtodo, indica a preciso
(reprodutibilidade) da medida. A diferena entre os valores medidos pelo mesmo
mtodo denominada desvio. Um tipo particularmente importante de desvio o
desvio-padro. Uma medida precisa aquela que possui um desvio-padro baixo.
A diferena entre a mdia dos valores medidos e um valor de referncia,
assumido como o valor verdadeiro, o erro da medida. Uma medida exata aquela
que possui um erro baixo. A concordncia entre resultados obtidos por mtodos
diferentes tambm indica a exatido (veracidade) da medida.
Figura 17. A preciso a medida da disperso dos valores medidos por um mesmo
mtodo, geralmente dada pelo desvio-padro. A exatido a diferena entre
a mdia dos valores medidos e um valor de referncia, assumido como o
valor verdadeiro.
--}+ -+'.+
a,a
,
--}+ L&%Y+
t+% *+ -*'*+
100% = 0,4%
a,a
,a
100% = 0,1%
Algarismos Significativos
na
medida
est
na
quinta
casa
decimal.
Assim,
representa-se
(1) Uma massa foi determinada como 3,2 g em uma balana com incerteza de
0,1 g e outra massa foi determinada como 0,2032 g em uma balana com
incerteza de 0,0001 g. Calcule a soma das duas massas.
3,2
+0,2032
______
3,4032
O resultado deve ser expresso com uma casa decimal, ou seja, 3,4 g.
(2) A massa de um material foi determinada como 7,31 g em uma balana com
incerteza de 0,01 g. Cortou-se um pedao do material e a massa desse
pedao foi determinada como 1,2058 g em uma balana com incerteza de
0,0001 g. Calcule a massa do restante do material.
7,31
1,2058
______
6,1042
O resultado deve ser expresso com duas casas decimais, ou seja, 6,10 g.
Arredondamento
(1) Uma massa foi determinada como 3,2 g em uma balana com incerteza de
0,1 g e outra massa foi determinada como 0,4532 g em uma balana com
incerteza de 0,0001 g. Calcule a soma das duas massas.
3,2
+0,4532
______
3,6532
O resultado deve ser expresso com uma casa decimal e deve ser arredondado,
aumentando uma unidade na primeira casa decimal, ou seja, 3,7 g.
(2) A massa de um material foi determinada como 7,31 g em uma balana com
incerteza de 0,01 g. Cortou-se um pedao do material e a massa desse
pedao foi determinada como 1,1226 g em uma balana com incerteza de
0,0001 g. Calcule a massa do restante do material.
7,31
1,1226
______
6,1874
O resultado deve ser expresso com duas casas decimais, aumentando uma
unidade na segunda casa decimal, ou seja, 6,19 g.
Teoria de Erros
Adio e Subtrao
1,76 (0,03) e1
+1,89 (0,02) e2
0,59 (0,02) e3
_______________
3,06 (e4)
0,04
100% = 1, %
3,06
Multiplicao e Diviso
0,03
100% = 1, %
1,76
0,02
100% = 1,
%
1,89
0,02
100% = 3, %
0,59
- =
%-
.+% *% -&Y+*%
100
- =
4,0
100
5,64
- = 0, 2
=
1
1
&=
1
= }
=
&
de 95%.
Soluo: Usaremos a Tabela A1 do apndice. Temos de encontrar o valor de z cuja rea entre -z
e +z seja de 95%. Nesse caso, a rea fora desse intervalo dada pelo clculo 10,95 = 0,05.
Logo, a rea acima de z dada por 0,05/2 = 0,025. A Tabela A1 fornece as reas abaixo de z.
Portanto, temos de encontrar o valor de z cuja rea esquerda seja 10,025 = 0,975. Procurando
na Tabela A1, encontramos z = 1,96. Portanto a mdia populacional est no intervalo de
confiana abaixo, com probabilidade de 95%.
= 3,78 1,96
= 3,78 1,96
0,03
9
0,03
3
& = 0,03 ,%/. Determine o intervalo de confiana da mdia com uma probabilidade
de 95%.
Soluo: Usaremos a Tabela A3 do apndice. Temos de encontrar o valor de t cuja rea entre -t
e +t seja de 95%, com N1 = 91 = 8 graus de liberdade (gl). Procurando na Tabela A3, para
95% e gl=9, encontramos t = 2,306. Portanto a mdia populacional est no intervalo de
confiana abaixo, com probabilidade de 95%.
= 3,78 2,306
= 3,78 2,306
0,03
9
0,03
3
PROBLEMAS
01.
Considere os seguintes pontos experimentais (x; y): (3,0; 3,87), (10,0; 12,99), (20,0;
25,93), (30,0; 38,89), (40; 51,96). Com esses n=5 pontos, faa o que se pede a
seguir: (a) faa uma tabela com os pontos experimentais e mostre como se calculam
os valores de x, y, xy, x2 e y2; (b) construa, em escala, o diagrama de
disperso; (c) calcule o coeficiente de correlao, r (d) classifique a correlao
quanto intensidade e ao sinal (positiva ou negativa); (e) determine a reta de
regresso = + + .
02.
03.
04.
05.
APNDICES
Probabilidades Esquerda
P(Z<a)
a
a |
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
----+------------------------------------------------------------------------------0.0 | 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 | 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 | 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 | 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 | 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 | 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 | 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 | 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 | 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 | 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 | 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 | 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 | 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 | 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 | 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 | 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 | 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 | 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 | 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 | 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 | 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 | 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 | 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 | 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 | 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 | 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 | 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 | 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 | 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 | 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 | 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
gl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
p=0,9995
636,619
31,598
12,924
8,610
6,869
5,959
5,408
5,041
4,781
4,587
4,437
4,318
4,221
4,140
4,073
4,015
3,965
3,922
3,883
3,850
3,819
3,792
3,768
3,745
3,725
3,707
3,689
3,674
3,660
3,646
3,551
3,460
3,373
3,291
gl
10.215 12.924
7.173
8.610
5.893
6.869
5.208
5.959
4.785
5.408
4.501
5.041
4.297
4.781
10
4.144
4.587
11
4.025
4.437
12
3.930
4.318
13
3.852
4.221
14
3.787
4.140
15
3.733
4.073
16
3.686
4.015
17
3.646
3.965
18
3.610
3.922
19
3.579
3.883
20
3.552
3.850
21
3.527
3.819
22
3.505
3.792
23
3.485
3.768
24
3.467
3.745
25
3.450
3.725
26
3.435
3.707
27
3.421
3.690
28
3.408
3.674
29
3.396
3.659
30
3.385
3.646
31
3.375
3.633
32
3.365
3.622
33
3.356
3.611
34
3.348
3.601
35
3.340
3.591
36
3.333
3.582
37
3.326
3.574
38
3.319
3.566
39
3.313
3.558
40
3.307
3.551
42
3.296
3.538
44
3.286
3.526
46
3.277
3.515
48
3.269
3.505
50
3.261
3.496
60
3.232
3.460
70
3.211
3.435
80
3.195
3.416
90
3.183
3.402
100
3.174
3.391
120
3.160
3.373
150
3.145
3.357
200
3.131
3.340
300
3.118
3.323
500
3.107
3.310
3.090
3.291