Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
A FON S O
E S T A T STICA A P LICA D A
LOPES
e EX C ELN C I A E M G E S T O
Estatstica Aplicada
Anlise de Resultados
de Ensaios de Proficincia
na Avaliao de Laboratrios
CADERNO DE ATIVIDADES
ANVISA
INSTITUTO ADOLPHO LUTZ
11 a 15 de agosto de 2003
http://www.estatistica.eng.br
Rua Voluntrios da Ptria, 474/701 - Humait
endereo eletrnico: estatistica@estatistica.eng.br
22270-010 - Rio de Janeiro - RJ
telefone: (21) 2539-7966 / fax: (21)2286-9877 / celular:(21) 9-627-0648
p. 1
A. Ementa
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
C. Objetivo
Proporcionar ao pessoal do Instituto Adolpho Lutz o conhecimento dos conceitos estatsticos bsicos
necessrios ao entendimento e interpretao dos requisitos especficos da norma ABNT ISO/IEC 17025:
2001, tornando-se -se capaz de compreender e analisar os resultados para uma correta tomada de deciso.
D. Metodologia
Exposio dialogada dar suporte aos debates, estudos de caso, vivncias e exerccios.
E. Bibliografia recomendada
ABNT ISO/IEC Guia 43-1: 1999, Ensaios de proficincia por comparaes interlaboratoriais Parte 1: Desenvolvimento e operao de programas de ensaio de proficincia.
ABNT ISO/IEC Guia 43-2: 1999, Ensaios de proficincia por comparaes interlaboratoriais Parte 2: Seleo e uso de programas de ensaio de proficincia por organismos de
credenciamento de laboratrios.
ABNT ISO/IEC 17025: 2001, Requisitos gerais para competncia de laboratrios de ensaio e
calibrao.
LOPES, Paulo Afonso. Probabilidades e Estatstica conceitos, modelos, aplicaes em
Excel. Rio de Janeiro: Reichmann&Affonso Editores, 3 reimpresso, 2003.
p. 2
os anexos a esta Parte da ABNT ISO/IEC Guia 43 fornecem diretrizes estatsticas para o
tratamento de dados obtidos em programas de ensaios de proficincia. - Prefcio (p. 1).
valor disperso - parte de um grupo de valores que inconsistente com as outras partes
daquele grupo (tambm definido na ISO 5725-1). - item 3.16.
"Estes resultados podem ter uma profunda influncia em sumrios estatsticos, tais como a
mdia e o desvio padro. - Nota do item 3.17.
"Estas tcnicas admitem menor peso para os resultados extremos, ao invs de eliminar
estes resultados do grupo de dados. - Nota do item 3.18.
2.
3.
iniciar o aplicativo
clulas:
incluso:
identificao
clula ativa
nmeros
texto
Formular um plano para coleta dos dados: conhecida a natureza da avaliao, identificar os provveis
elementos a coletar, restringindo a pesquisa aos dados de interesse.
2.
3.
Coletar os dados.
4.
5.
p. 3
5. Estatstica Descritiva:
medidas de representatividade (tendncia central) e de disperso
1. Dados brutos e rol: Livro, p. 22
a)
EXCEL:
MEDIANA amostral
a)
VARINCIA amostral, s2
EXCEL: Livro, p. 37, "Colar funo/VAR"
i=1 X i2
n
s2 =
i=1 X i
n
n 1
DESVIO-PADRO amostral, s
EXCEL: Livro, p. 37, "Colar funo/DESVPAD"
para alguns autores de lngua inglesa, tambm conhecido como RSD (relative standard deviation), desviopadro relativo.
O CV razovel somente quando o desvio-padro estritamente proporcional mdia aritmtica; se o desviopadro constante em uma faixa extensa dos nveis da propriedade sendo observada, o CV , neste caso,
ilusrio; outra desvantagem que seu valor no muito til quando a mdia prxima do valor zero.
Paulo Afonso Lopes
p. 4
Exemplo
A Norma NIT-DICLA-026, reviso 01, aprovada em AGO/01 afirma:
7.6.Documentos e Registros do Laboratrio
7.6.1 O laboratrio deve manter registros atualizados contendo os ensaios de proficincia
em que participou, com as seguintes informaes, quando aplicveis:
.........................................
e) critrio de aceitao dos resultados ou avaliao de desempenho (ex.: percentual mnimo
exigido de acertos, Youden, z-score, etc.);
f) resultados obtidos (satisfatrio/questionvel/insatisfatrio);
b)
2.
3.
Toda deciso tem um risco, que a probabilidade associada a uma deciso errada.
p. 5
OBSERVAO IMPORTANTE: Quando se tem os dados originais, todos os clculos devem ser
feitos com eles. A construo de tabelas, nos dias de hoje, tem o objetivo de facilitar a apresentao
dos resultados, no sendo recomendada para clculos. Usar os valores da tabela era natural nos
milnios passados, quando no existiam os modernos recursos computacionais.
9. Introduo s probabilidades,
a segunda ferramenta para a Inferncia
1. O que probabilidade:
conceito axiomtico
a)
b)
5.
6.
p. 6
p. 7
ts
n
4.
Calcular a relao
5.
6.
Se a relao for menor que o valor tabelado, aceitar o ponto extremo; caso contrrio, elimin-lo da amostra.
7.
Eliminado o valor disperso, refazer a anlise com os valores restantes, at que todos os valores sejam
considerados no dispersos.
n
5
|d|/s
1,65
d
s
n
40
|d|/s
2,50
6
7
8
9
1,73
1,80
1,86
1,92
12
14
16
18
2,03
2,10
2,16
2,20
22
24
26
30
2,28
2,31
2,35
2,39
50
100
200
500
p. 8
2,58
2,80
3,02
3,29
Exemplo
Sejam os seguintes valores:
X1 = 858, 77
X2 = 819,29
X3 = 777,37
X4 = 724,51
X5 = 752,39
X6 = 736,69
X7 = 1050,51
X8 = 996,85
X9 = 1097,35
X10 = 824,16
X11 = 1086,09
X12 = 1077,09
X13 = 936,85
X14 = 831,41
X15 = 845,40
X16 = 812,86
X17 = 842,69
X18 = 986,83
X19 = 859,49
X20 = 1568,60
1)
2)
3)
para o maior valor, d20 = 1568,60 - 924,26 = 644,34; para o menor valor, d24 = 724,51 - 924,26 = -199,75
4)
para o maior valor, |d20|/s = |1568,60 - 924,26|/193,25 = 3,33; para o menor valor, |d4|/s = |724,51 924,26|/193,25 = 1,03.
5)
6)
como 1,03 < 2,24, X4 permanece e como 3,33 > 2,24, elimina-se X20 .
II - Teste de COCHRAN
Neste teste, comparam-se varincias, ou seja, verifica-se se a varincia dos resultados obtidos por
um grupo excessiva em relao dos demais grupos, sendo um teste unilateral, isto , s verifica o
maior valor.
Para um conjunto de n inspetores, cada um com desvio-padro amostral si ( i = 1,2,...,n) todos
calculados para o mesmo nmero n de observaes, o valor a calcular para o teste de Cochran
dado por:
Ccalculado =
s2max
n
s2
i
i =1
onde:
s2 = estimativa da varincia
2
s max = maior valor encontrado no conjunto como estimativa da varincia, no
n = nmero de inspetores
conjunto
p. 9
Para um conjunto de resultados Z(h), h = 1,2,....H, agrupados em ordem crescente, o Teste de Dixon
utiliza o seguinte critrio:
se o total de resultados estiver entre 3 e 7,
Dcalc =
Z(2) Z(1)
Z(H) Z(H 1)
e
Z(H 1) Z(1)
Z(H) Z(2)
Z(3) Z(1)
Z(H) Z(H 2)
e
Z(H 2) Z(1)
Z(H) Z(3)
p. 10
Exemplo
Observe, agora, uma definio de reprodutibilidade, segundo a Norma XYZ4 de uma empresa
avaliada:
6.7. Reprodutibilidade
NORMA 1 - A diferena entre dois resultados individuais e independentes, obtidos por dois
operadores, operando em laboratrios diferentes a partir de uma mesma amostra submetida ao
ensaio, no deve ultrapassar ..... em valor absoluto.
III - APLICAO DOS NDICES
A repetitividade e a reprodutibilidade so dois valores extremos, sendo a repetitividade a mnima
variabilidade entre resultados e a reprodutibilidade a mxima variabilidade entre resultados. A
repetitividade representada pelo smbolo r e a reprodutibilidade pelo smbolo R. Convm enfatizar
que tanto uma quanto outra tm unidades.
Suponha-se que os ndices calculados tenham sido R= 0,03 e r= 0,02.
Um laboratrio, efetuando duas repeties, obteve em um teste os valores 0,17 e 0,18. A diferena
0,01 aceitvel e as duas anlises so vlidas, porque essa diferena menor que r; caso se
obtivesse 0,17 e 0,20, a diferena 0,03 inaceitvel, e um dos valores deve ser rejeitado; no
havendo informaes mais especficas, a rejeio deve ser do valor mais afastado da mdia.
Considere-se agora que o laboratrio 1 obteve 0,18 e o laboratrio 5 obteve 0,20. A diferena 0,02
inferior a R = 0,03 e os dois valores so aceitveis. No caso de ser necessrio rejeitar um resultado,
este deve ser o mais disperso, como no caso da repetitividade.
Convm relembrar que R e r so ndices intimamente ligados preciso de resultados de medies.
importante, portanto, que esses ndices sejam expressos de modo correto para que no se perca
de vista o significado fsico que deve ser associado a esses nmeros.
O objetivo metrologicamente desejvel (porm difcil) reduzir os valores de R e r, necessitando
maior controle em todo o processo. Deve haver esforo para reduzir os erros em cada um dos
laboratrios, em cada repetio e tambm em cada amostra. Como o processo lento, deve-se
considerar os ndices R e r como ndices dinmicos, sujeitos a reavaliaes e revises. Nas fases
iniciais do processo, pode haver muita instabilidade, mas ao longo do tempo espera-se que diminua.
p. 11
preciso cuidado com um ndice com valor muito pequeno, o qual pode cair em descrdito por ser
muito difcil a sua reproduo. lgico, portanto, iniciar a utilizao desses ndices com valores
maiores (toleram-se variaes em faixa ampla de valores) que possam ir sendo reduzidos.
Exemplo
4.2. Elipse de Confiana
Os resultados obtidos pelos laboratrios participantes, relativos ao par de amostras A e B
permitiram a construo de diagramas de disperso elaborados em um sistema de eixos
cartesianos, onde a escala do eixo X cobre a faixa de resultados referentes amostra A e
Paulo Afonso Lopes
p. 12
p. 13
Exemplo
5.1. Resduo Peneira de Abertura 75/m (%)
De acordo com a NBR XYZ2 o resultado expresso em porcentagem de massa calculado at
os dcimos.
Tabela 5
LABORATRIO
AMOSTRA A
AMOSTRA B
F
1
1,1
1,2
O
2
1,2
1,4
O
3
1,2
1,4
O
4
1,7
1,6
O
5
1,5
1,8
O
6
1,2
1,3
O
7
1,0
1,0
O
8
1,4
1,6
O
9
1,3
1,4
O
10
0,6
0,7
O
11
1,2
1,1
O
16
1,4
1,6
O
13
2,0
2,0
O
14
1,8
2,1
O
15
1,5
1,6
O
12
2,3
2,7
*
20
0,6
1,2
*
Mdia Geral
1,34
1,45
Desvio Padro
0,3418
0,3701
Numero de Observaes da Elipse: 15
Numero de Observaes Total: 17
o - Laboratrios includos no calculo da elipse de 95% de confiana e se encontram dentro dela.
* - Laboratrios excludos da elipse de 95% de confiana.
Laboratrios 12 - Erro sistemtico significativo. Verificar metodologia, calibrao de equipamento,
condies ambientais.
Laboratrios 20 - Erro aleatrio. Verificar operador, erro de leitura, de clculo, de transcrio. O erro
ocorreu
na amostra A.
Paulo Afonso Lopes
Instituto Adolfo Lutz/IAL, 11 a 15 de agosto de 2003
p. 14
O modelo matemtico: y = + x+
denomina-se resduo ou erro aleatrio e tem os seguintes pressupostos:
? varivel aleatria com distribuio de deMoivre-Laplace-Gauss, mdia zero e
desvio-padro constante
? corresponde a observaes independentes e no correlacionadas
elementos bsicos:
? variveis: dependente (Y), ou explicada, e independente (X), ou explicativa,
esta podendo ser qualitativa ou quantitativa
? equao
? parmetros: so as grandezas das relaes (coeficientes)
? termo aleatrio ou de erro
mtodo dos mnimos quadrados
EXCEL: Livro, p. 134, "Colar Funo"/INCLINAO e INTERCEPO
p. 15
p. 16
p. 17
o coeficiente de correlao
t x AIN/ n
Avaliao
Z
c) para o Laboratrio 63, indique como foi decidida a eliminao dele pelos dois critrios de
avaliao
escore z
Mdia
Avaliao
LAB
aritmtica
robusta
clssica
robusta
X
Y
X
Y
X
Y
Entre Dentro
Z
Y
63
0,1610 0,3633 0,660
-3,562 0,273 -2,749 -2,891 4,033
*
*
Aps eliminarem-se dispersos na avaliao z, encontrou-se:
Para X:
nmero de resultados = 57
mediana = 0,1560
amplitude interquartlica normalizada (AIN) = 0,0067
Mdia = 0,1563
Desvio-padro = 0,0069
Coeficiente de correlao = 0,3093
t x DP/ n = 0,0018
Para Y:
nmero de resultados = 57
mediana = 0,4103
amplitude interquartlica normalizada (AIN) = 0,0114
Mdia = 0,4087
Desvio-padro = 0,0116
Coeficiente de correlao
t x DP/ n = 0,0030
BIBLIOGRAFIA
LOPES, Paulo Afonso, Probabilidades e Estatstica Reichmann&Affonso Editores, 1999.
p. 18
n
1%
0,993
0,968
0,928
0,883
0,838
0,794
0,754
0,718
0,684
0,653
0,624
0,599
0,575
0,553
0,532
0,514
0,496
0,480
0,465
0,450
0,437
0,425
0,413
0,402
0,391
0,382
0,372
0,363
= 2
5%
0,967
0,906
0,841
0,781
0,727
0,680
0,638
0,602
0,570
0,541
0,515
0,492
0,471
0,452
0,434
0,418
0,403
0,389
0,377
0,365
0,354
0,343
0,334
0,325
0,316
0,308
0,300
0,293
n
1%
0,995
0,942
0,864
0,788
0,722
0,664
0,615
0,573
0,536
0,504
0,475
0,450
0,427
0,407
0,388
0,372
0,356
0,343
0,330
0,318
0,307
0,297
0,287
0,278
0,270
0,262
0,255
0,248
0,241
= 3
5%
0,975
0,871
0,768
0,684
0,616
0,561
0,516
0,478
0,445
0,417
0,392
0,371
0,352
0,335
0,319
0,305
0,293
0,281
0,270
0,261
0,252
0,243
0,235
0,228
0,221
0,215
0,209
0,203
0,198
n
1%
0,979
0,883
0,781
0,696
0,626
0,568
0,521
0,481
0,447
0,418
0,392
0,369
0,349
0,332
0,316
0,301
0,288
0,276
0,265
0,255
0,246
0,238
0,230
0,222
0,215
0,209
0,202
0,196
0,191
= 4
5%
0,939
0,798
0,684
0,598
0,532
0,480
0,438
0,403
0,373
0,348
0,326
0,307
0,291
0,276
0,262
0,250
0,240
0,230
0,220
0,212
0,204
0,197
0,191
0,185
0,179
0,173
0,168
0,164
0,259
n
1%
0,959
0,834
0,721
0,633
0,564
0,508
0,463
0,425
0,393
0,366
0,343
0,322
0,304
0,268
0,274
0,261
0,249
0,238
0,229
0,220
0,212
0,204
0,197
0,190
0,184
0,179
0,173
0,168
0,164
= 4
5%
0,906
0,746
0,629
0,544
0,480
0,431
0,391
0,358
0,331
0,308
0,288
0,271
0,255
0,242
0,230
0,219
0,209
0,200
0,192
0,185
O,178
0,172
0,166
0,160
0,155
0,150
0,146
0,142
0,138
p = nmero de grupos
n = nmero de observaes em cada grupo
p. 19