Sei sulla pagina 1di 125

Estatística Aplicada

Prof. Guintar Luciano Baugis


Bacharelado em Química
Química Industrial
v2019

1
Conteúdo

1. Introdução ........................................................................................................................... 3
1.1. Quimiometria ................................................................................................................... 3
1.2. Noções de Amostragem ................................................................................................... 5

2. Estatística Descritiva .......................................................................................................... 7


2.1. Precisão e Exatidão .......................................................................................................... 7
2.2. Medidas de Posição e Dispersão ..................................................................................... 9
2.3. Distribuição de freqüência ............................................................................................. 14
2.4. Função de distribuições de probabilidade ..................................................................... 20

3. Estatística Indutiva ........................................................................................................... 27


3.1. Estimação por intervalo de confiança ............................................................................ 27
3.2. Tamanho das amostras................................................................................................... 37
3.3. Rejeição de valores dispersos ........................................................................................ 39
3.4. Testes de Hipótese ......................................................................................................... 48

4. Análise de Variância ......................................................................................................... 65

5. Regressão e Correlação Linear ......................................................................................... 74

6. Planejamento de Experimentos ........................................................................................ 80


6.1. Planejamento de Experimentos Fatorial ........................................................................ 81
6.2. Planejamento Fatorial Fracionário............................................................................... 107

Apêndices ........................................................................................................................... 115

2
Introdução 1
1.1. Estatística Aplicada

Estatística é um conjunto de métodos e processos quantitativos que serve para


estudar e medir os fenômenos coletivos. Esta ciência se preocupa com a organização,
descrição, análise e interpretação de dados experimentais. Ela é aplicada ao estudo de
variáveis aleatórias e, principalmente, quando tais variações têm grande efeito sobre o
fenômeno estudado.

A Estatística pode ser dividida em duas partes (Figura 1.1):

• Descritiva: que se preocupa com a organização e descrição dos dados


experimentais;

• Indutiva: que cuida da análise e interpretação, permitindo a realização de inferências


e projeção de populações.

Dados Análise

Descritiva Indutiva
Conhecimento e
informação

Figura 1.1. Divisões da Estatística e suas atribuições.

Quimiometria é uma disciplina voltada à aplicação de métodos estatísticos e


matemáticos no planejamento e otimização de procedimentos e na obtenção de informações
químicas nas análises de resultados relevantes. É reconhecida atualmente como um ramo da
química analítica. O emprego dos computadores em laboratório impulsionou o
desenvolvimento da quimiometria

3
Alguns campos de aplicação da quimiometria:

• Otimização de experimentos
• Curvas de calibração
• Modelagem de fenômenos
• Detecção e resolução
• Comparação de métodos
• Redes neurais
• Procura bibliográfica

O método estatístico aplicado na avaliação de um processo se divide em quatro


fases basicamente:

- Coleta de dados: pode ser efetuada de dois modos;


• Direto: todo o universo dos dados é utilizado para análise;
• Indireto: somente uma parte do universo é utilizada para análise – a amostra;

Em um determinado processo estatístico esta importante etapa deve atender os


seguintes requisitos:

• Definir claramente os objetivos;


• Definir a técnica a ser utilizada;
• Comprometer o coletor com o processo;
• Planejar a coleta;
• Definir os pontos mais adequados;
• Treinar o coletor;
• Utilizar instrumentos adequados.

- Apuração dos dados: após a coleta dos dados efetua-se a tabulação de acordo com
critérios pré-estabelecidos. Por exemplo: faixa de concentração, método utilizado, etc.

- A apresentação dos dados: os dados podem ser apresentados em tabelas (ou quadros) e
em gráficos.

- Análise e interpretação: baseados na análise dos dados deverão ser tomadas medidas para
resolução de problemas observados ou melhoria dos processos.

O emprego da quimiometria e de ferramentas estatísticas tem colaborado com o


químico nas suas diversas áreas de atuação, levando-lhe a melhor interpretação de dados
experimentais obtidos e a grande economia de tempo e materiais.

4
Dois conceitos fundamentais devem ser considerados em quimiometria:

• Nenhuma operação matemática melhora a medida do processo!


• O domínio e o conhecimento acerca do problema ainda são imprescindíveis.

Note o problema descrito na Figura 1.2.

Figura 1.2. (D. Harris, QAQ, ed. LTC).

1.2. Noções de Amostragem

População ou universo estatístico: é um conjunto da totalidade dos elementos


objeto da nossa análise. Pode ser finita ou infinita;

Amostra é uma parte significativa da população, selecionada com critérios


científicos, que nos permite tirar conclusões a respeito da população.

O esquema na Figura 1.3 associa o conceito de população e amostra com a


estatística descritiva e indutiva.

É preciso garantir que a amostra usada seja obtida por processos adequados para
seja representativa da população. Isso significa que, em maior ou menor grau, no processo
de amostragem a amostra deve possuir as mesmas características básicas da população.

5
Estatística
População existente Descritiva
População futura
Estatística
Amostra Indutiva
Amostra

Figura 1.3. Relações entre as divisões da estatística, amostra e população.

De acordo com o interesse ou propósito do trabalho a ser conduzido, a amostragem


de uma determinada população pode ser assim classificada:

- Amostragem casual simples - Todos os elementos da população têm igual probabilidade


de pertencer à amostra;

- Amostragem sistemática - Quando os elementos da população se apresentam ordenados e


a retirada da amostra é feita em espaço e tempo definidos;

- Amostragem por meio de conglomerados - Quando a população apresenta uma subdivisão


em pequenos grupos, chamados conglomerados, é possível se realizar uma amostragem
casual destes subconjuntos;

- Amostragem estratificada - Muitas vezes a população se divide em sub-populações ou


estratos, sendo razoável supor que, de estrato para estrato, a variável de interesse apresente
um comportamento substancialmente diverso. A amostragem estratificada consiste em
especificar os estratos e a porção da amostra retirada em cada um dele.

6
Estatística Descritiva 2
2.1. Precisão e Exatidão

Erros ou desvios são conseqüências naturais do processo de medida de uma


determinada grandeza. Os erros podem ter como origem as seguintes fontes:

- Erro de julgamento: oriundo de uma medida subjetiva.


- Erro de leitura: oriundo de leituras errôneas.
- Erro de instrumento: oriundo de defeitos ou da precisão limitada de instrumento.
- Erro de fontes externas: devido a fatores que influem diretamente na medida.
- Erro de representação: devido às medidas não poderem ser representadas numa escala
correta.

Os erros descritos acima nos levam a uma classificação genérica de dois tipos de
erros, a saber:

• Erro Sistemático: apresenta tendência e relaciona-se com a média. Ex: utilizar uma
balança não calibrada para pesagem. Para eliminá-lo necessitamos descobrir a fonte
e caso não seja possível devemos utilizar tabelas ou fórmulas para sua correção.

- É unidirecional
- Tem causa assinalável
- Está associada à exatidão

• Erro Aleatório: não apresenta tendência e relaciona-se com o desvio padrão. Ex:
leituras sucessivas em um equipamento com diferentes valores. Não são passíveis
de eliminação, porém podem ser tratados estatisticamente.

- É bidirecional
- Não tem causa assinalável
- Está associado à precisão

• Exatidão: É a concordância entre uma medida e valor verdadeiro ou mais provável


da grandeza. É também referida como acurácia.

• Precisão: É a concordância entre uma série de medidas da mesma grandeza.


Expressa a reprodutibilidade da medida.

Os conceitos relacionados à Exatidão e Precisão estão demonstrados na Figura 2.1.

7
Precisão – Erros Aleatórios
Exatidão – Erros Sistemáticos

Figura 2.1. Relações apresentadas por Exatidão e Precisão.

O grau de exatidão e precisão na tomada de uma determinada medida é determinado


por um conjunto de propriedades estatísticas que relacionam posição e dispersão a um valor
da população

2.2. Medidas de Posição e Dispersão

Medidas podem ser tomadas em função da amostra ou da população. A notação


destas medidas encontra-se na Tabela 2.1:

Tabela 2.1. Notações de principais estatísticas para população e amostra.


População Amostra
No de elementos N n
Média  x
Variância 2 S2
Desvio padrão  S

8
As medidas de posição servem para localizar a distribuição de freqüência sobre o
eixo da variável em questão. Três tipos importantes de medidas de posição: média, mediana
e moda.

• Média aritmética: sendo xi (i = 1,2,3, ..., n,), definimos com média aritmética ou
simplesmente média:
n n

 xi x i
= i =1
ou x= i =1
N n

• Média Ponderada: consiste na média dos valores ordenados por classes


considerando o peso de cada classe no conjunto.

n n

 xi. fi x i. fi
= i =1
x= i =1

N ou n

• Mediana ( ~x ): A mediana é o valor médio ou a média aritmética dos dois valores


centrais de um conjunto de números, ordenados em ordem de grandeza, isto é, em
um rol.

• Moda ( x̂ ): é o valor que ocorre com maior freqüência, isto é, é o valor mais
comum. A moda pode não existir e, mesmo que exista, pode não ser única. Uma
distribuição que tem apenas uma única moda é denominada unimodal.

Exemplo

Encontrar média, mediana e moda do seguinte conjunto:

11 12 14 15 15 16 16 18

11 + 12 + 14 + 15 + 15 + 16 + 16 + 18
x= = 14,6
8

15 + 15
mediana = x (4º : 5º ) = = 15
2

moda = 15 e 16 (universo bimodal)

9
As medidas de dispersão complementam as informações das medidas de posição,
indicando o grau de variação existente num conjunto de dados. As principais medidas de
dispersão são: amplitude, variância, desvio padrão e o coeficiente de variabilidade.

• Amplitude: É a diferença entre o maior e o menor valor da série de dados.

R = xmáx − xmín

• Variância: Por definição é a média dos quadrados dos valores em relação à média.
Podemos definí-la como:

n n

 (x − )
i
2
 (x − x)
i
2

2 = i =1
ou S2 = i =1
N n −1
2 2
 n   n 
  xi    xi 
xi −  i =1  xi −  i =1 
n n

 2

N
 2

n
 2 = i =1 ou S 2 = i =1
N n −1

As variações das outras fórmulas ocorrem das formas análogas às variações acima.
As propriedades matemáticas da variância:

- Multiplicando-se todos os valores de um conjunto por uma constante, a variância do


conjunto fica multiplicada pelo quadrado dessa constante;

- Somando-se ou subtraindo–se uma constante a todos os valores de um conjunto, a


variância não se altera.

• Desvio Padrão: É definido como sendo a raiz quadrada da variância. Sua vantagem
em relação à variância é que se encontra na mesma unidade dos dados amostrais.

S = S2

Às vezes, o desvio padrão e a variância correspondentes a amostra são definidos


com n, em lugar de n-1 nos denominadores das expressões. Isso representa uma estimativa
melhor do desvio padrão da população da qual a amostra faz parte. Para grandes valores de
N (certamente N>30) não há, praticamente, diferença entre as definições.

10
Exemplo

Conjunto de dados apresentados na determinação de Pb (mg/L) de 4 laboratórios:

48,4 50,2 50,8 51,0

x = 50,1 mg/L

xi − x ( xi − x ) 2
48,4 – 50,1 = -1,7 2,89
50,2 – 50,1 = 0,1 0,01
50,8 – 50,1 = 0,7 0,49
51,0 – 50,1 = 0,9 0,81
Σ 0 4,2

4,2
S2 = = 1,4 (mg/L)2
4 −1

S = 1,4 = 1,2 mg/L

• Coeficiente de variação: É definido como o quociente percentual entre o desvio


padrão e a média. Sua vantagem é caracterizar a dispersão dos dados em termos
relativos a seu valor médio.

S
CV =  100
x

Exemplo

Um químico, desejando avaliar um novo método para determinação de cobre, conduziu


uma investigação preliminar usando uma solução de concentração conhecida. Esta solução
de 60 mg/L de cobre foi analisada 6 vezes, tomando para cada determinação alíquotas de 10
mL. Encontrar a média, mediana, moda, amplitude, variância, desvio-padrão e o coeficiente
de variação dos resultados encontrados.

58,2 61,0 56,6 53,8 56,9 58,3

58,2 + 61,0 + 56,6 + 53,8 + 56,9 + 58,3


x= = 57,5 mg/L
6

md = x (56,9 : 58,2) = 57,6 mg/L

11
R = 61,0 − 53,8 = 7,2 mg/L

(58,2 − 57,5) 2 + (61,0 − 57,5) 2 + ... + (58,3 − 57,5) 2


S =
2
= 5,65 (mg/L)2
(6 − 1)
S = 5,65 = 2,38 mg/L

2,38
CV =  100 = 4,1%
57,5

conjunto amodal (sem moda)

Exemplo

Foram realizadas análises de cloretos em meio aquoso por 4 técnicos em uma mesma
amostra padrão de 10,0 mg/L, encontrando-se os seguintes resultados:

técnico A 9,0 9,0 9,2 9,1 9,3


técnico B 9,9 9,9 10,3 10,3 10,3
técnico C 8,0 9,0 9,5 8,5 9,8
técnico D 9,0 10,5 11,0 9,5 10,0

Em relação aos resultados encontrados, classifique-os quanto à precisão e exatidão, e diga


qual o tipo de erro (sistemático ou aleatório) há em cada um dos casos.

Para estimarmos a exatidão vamos considerar a estatística x , e para a precisão o


coeficiente de variação.

x S CV (%) classe erro


técnico A 9,1 0,13 1,4 inexato e preciso sistemático
técnico B 10,1 0,22 2,2 exato e preciso aleatório
técnico C 9,0 0,73 8,1 inexato e impreciso sistemático aleatório
técnico D 10,0 0,79 7,9 exato e impreciso aleatório

Exercício 2.1

Três amostras foram enviadas ao laboratório para análise. O técnico realizou 5


determinações em cada uma delas, e encontrou os seguintes resultados :

A: 6,1 6,3 6,2 6,5 5,9


B: 36,5 37,3 36,9 38,4 35,4
C: 241,5 244,7 237,5 252,9 242,9

12
a) Calcule a média, a amplitude, o desvio-padrão e o coeficiente de variação para cada
amostra;
b) Comente o uso do desvio-padrão, amplitude e coeficiente de variação como unidade de
precisão de um método analítico.

Resposta: b) O coeficiente de variação é a melhor propriedade para estimar a dispersão.

Problemas

2.1. Calcule a amplitude, a variância, o desvio-padrão e o coeficiente de variação em cada


amostra:

a) 12 6 7 3 15 10 18 5
b) 9 3 8 8 9 8 9 18
c) 75 75 76 77 76 75 76 77 75 76 75

2.2. Uma amostra artificial, padronizada, de soro de sangue humano contém 50,0 gramas de
albumina por litro. Cinco laboratórios (A-E), realizaram seis determinações da
concentração de albumina, com os seguintes resultados:

A 50,5 49,6 50,1 49,9 49,1 50,2


B 47,8 51,6 50,1 48,1 51,9 49,9
C 51,5 50,8 51,8 51,1 50,7 51,3
D 43,0 51,0 45,1 48,5 45,8 49,2
E 50,2 49,6 50,0 49,8 50,6 47,0

Comente sobre a precisão e exatidão de cada laboratório.

2.3. Uma solução padrão com 30 mg/L de Pb foi distribuída a 2 Técnicos no laboratório e
solicitado a eles que realizassem 4 ensaios, individualmente, usando o mesmo método e o
mesmo equipamento. Os resultados estão apresentados a seguir:

Técnico 1 33 34 34 33
Técnico 2 29 30 26 35

Através do cálculo das propriedades estatísticas, indique qual tipo de erro pode ser
atribuído a cada Técnico (sistemático ou aleatório) e classifique-os quanto à precisão e
exatidão.

13
2.4. Durante um programa de controle interlaboratorial, um laboratório recebeu uma
amostra de sangue para dosagem de cafeína cuja concentração real é de 5,50 µg/mL. Para
que o laboratório receba o certificado de aprovação nesse tipo de controle, é necessário que
o resultado não exceda o limite de tolerância de ± 0,25µg/mL. Após a análise de quatro
replicatas dessa amostra, foram obtidos os seguintes resultados:

Replicata Concentração de cafeína


(µg/mL)
1 4,12
2 4,13
3 4,12
4 4,12
Média 4,12
Desvio-padrão 0,005
CV (%) 0,121

Qual parâmetro a ser melhorado: a precisão ou a exatidão? Na ação corretiva, que tipo de
erro deve ser eliminado?

2.3. Distribuição de freqüência

É uma séria estatística específica, onde os dados encontram-se dispostos em classes


ou categorias juntamente com as freqüências correspondentes. Pode ser dividida em dois
tipos:

• Distribuição Simples: Assume valores inteiros (pontuais) normalmente oriundos de


contagem. Ex.: números de técnicos que participam de um plano de correlação
laboratorial (dados discretos).

• Distribuição acumulada: Assume valores contínuos, normalmente oriundos de


medidas. Ex.: resultados de análises de enxofre realizadas em amostras de gasolina.

Exemplo de uma distribuição contínua: temperaturas observadas em determinado processo:

22 46 9 40 57 22 22 13 50 42
35 2 15 41 34 52 32 75 69 44
26 42 60 56 30 3 17 79 45 37
0 12 62 50 45 41 59 11 66 39
43 33 70 50 47 20 36 40 67 29

14
A distribuição de freqüência será expressa na seguinte ordem:

Temperaturas nº observações

0 ⊢ 10 4
10 ⊢ 20 5
20 ⊢ 30 6
30 ⊢ 40 8
40 ⊢ 50 12
50 ⊢ 60 7
60 ⊢ 70 5
70 ⊢ 80 3

Para discutir os dados dispostos na tabela de distribuição devemos notar algumas


definições:

• Dados Brutos: São os dados não organizados.

• Rol: Arranjo de dados em ordem decrescente.

• Classe (i): Número de cada classe (inferior e superior). No exemplo é igual a 8.

• Limite de classe: São os extremos de cada classe (inferior e superior). No exemplo a


terceira classe tem limite inferior igual a 20 e limite superior igual a 30.

• Intervalo de classe ou amplitude: É a diferença entre o limite superior e o limite


inferior de cada classe. No exemplo é 10.

• Amplitude total: É a diferença entre a maior e a menor observação. No exemplo a


amplitude total é 79.

• Ponto médio de classe (xi): É a média aritmética entre o limite superior e inferior de
cada classe. No exemplo, xi da quinta classe é 45.

• Número de classes: Pode ser encontrado pela regra de Sturges:

K = 1 + 3,3 logN (N = número de elementos)

Também pode ser encontrado por outras fórmulas, como regra de Kelly e etc. No entanto, é
utilizado um número conveniente. No exemplo optamos por 8 classes.

15
• Freqüência absoluta simples (fi): Número de observações em cada classe.

• Freqüência relativa simples (fir): É o quociente entre a frequência absoluta simples


da classe (fi) e o número total de observações (N).

• Freqüência absoluta acumulada (Fi): Corresponde a soma das freqüências de


determinada classe com todas as anteriores.

• Freqüência relativa acumulada (Fir): Corresponde à soma das freqüências


relativas simples (fir) de determinada classe com todas as anteriores.

Exemplo

Os valores abaixo se referem a uma série de resultados analíticos de determinado produto,


já ordenados de forma crescente.

95 96 96 97 97 97 97 98 98 98 98 98
98 99 99 99 99 99 99 99 99 99 99 99
99 100 100 100 100 100 100 100 100 100 100 100
100 100 100 100 100 100 100 101 101 101 101 101
101 101 101 101 101 101 102 102 102 102 102 102
102 103 103 103 103 104 104 105

Em relação aos dados acima, organize uma tabela de distribuição de freqüência por
intervalos e responda as seguintes questões:

a) % de resultados iguais ou superiores a 99;


b) % de resultados entre 98 (inclusive) e 102 (exclusive);
c) Número de resultados menores que 103.

16
Temperatura (ºC) xi fi fir Fi Fir

95 ⊢ 96 95,5 1 0,015 1 0,015


96 ⊢ 97 96,5 2 0,029 3 0,044
97 ⊢ 98 97,5 4 0,059 7 0,103
98 ⊢ 99 98,5 6 0,088 13 0,191
99 ⊢ 100 99,5 12 0,176 25 0,368
100 ⊢ 101 100,5 18 0,265 43 0,632
101 ⊢ 102 101,5 11 0,162 54 0,794
102 ⊢ 103 102,5 7 0,103 61 0,897
103 ⊢ 104 103,5 4 0,059 65 0,956
104 ⊢ 105 104,5 2 0,029 67 0,985
105 ⊢ 106 105,5 1 0,015 68 1,000

a) % resultados ≥ 99 (freqüência acumulada relativa até quarta classe): 1-0,191 = 0,809


(80,9 %) .
b) % resultados ≥ 98, < 102 (soma das freqüências relativa entre quarta e sétima classe):
0,088 + 0,176 + 0,265 + 0,162 = 0,691 (69,1 %) .
c) resultados < 103 (freqüência acumulada até a oitava classe): 61

Exercício 2.2
Em um determinado processo foram observadas as seguintes medidas de temperatura, com
um termômetro:

Data ºC Data ºC Data ºC Data ºC Data ºC


1/11 22 1/12 35 31/12 26 30/1 0 1/3 43
4/11 46 4/12 2 3/1 42 2/2 12 4/3 33
7/11 9 7/12 15 6/1 60 5/2 62 7/3 70
10/11 40 10/12 41 9/1 56 8/2 50 10/3 50
13/11 57 13/12 34 12/1 30 11/2 45 13/3 47
16/11 22 16/12 52 15/1 3 14/2 41 16/3 20
19/11 22 19/12 32 18/1 17 17/2 59 19/3 36
22/11 13 22/12 75 21/1 79 20/2 11 22/3 40
25/11 50 25/12 69 24/1 45 23/2 66 25/3 67
28/11 42 28/12 44 27/1 37 26/2 39 28/3 29

Determine:
a) % de observações ≥ 70 ºC.
b) número de observações ≥ 70 ºC.
c) número de observações < 60 ºC e ≥ 20 ºC.
d) % de observações < 40 ºC.

17
Histogramas

São representações gráficas em forma de colunas justapostas, onde a base colocada


no eixo das abscissas corresponde aos intervalos das classes, e a altura é dada pela
freqüência absoluta das classes. O processo de obtenção do histograma é análogo ao
utilizado para obtenção da distribuição de freqüência. A Figura 2.2 apresenta as
classificações de histogramas que podem ser obtidas. A Figura 2.3 demonstra o histograma
construído a partir de dados do Exercício 2.2 de classificação assimétrica.
Tipo Geral Tipo Pente

16 18
14 16
12 14
10 12
10
8 8
6 6
4 4
2 2
0 0

Tipo Platô Tipo Assimétrico

14 18
12 16
10 14
12
8 10
6 8
4 6
4
2 2
0 0

Figura 2.2. Classificação de histogramas conforme formato da distribuição dos dados.

14

12

10

8
fi

0
0├ 10 10├ 20 20├ 30 30├ 40 40├ 50 50├ 60 60├ 70 70├ 80

Figura 2.3. Histograma dos dados do Exercício 2.2.

18
Exercício 2.3
Construa o histograma referente ao exemplo da página 15.

19
2.4. Função de distribuições de probabilidade

Vamos considerar o seguinte exemplo: determinado lote de produtos fabricados


com especificação A e B, respectivamente, foram classificados em uma escala própria de
cor, de 1 a 2, conforme a seguinte tabela:

Escala cor
Especificação 1 2 Total
A 503 120 623
B 250 5 255
Total 753 125 878

Em um processo de escolha aleatória, qual a probabilidade de sorteamos:

a) Produto com especificação A

b) Produto com cor 2

c) Produto com especificação B e cor 1

d) Produto com especificação A ou cor 1

Quando conhecemos a distribuição dos dados sob determinados critérios podemos


estabelecer facilmente a probabilidade de encontrarmos um resultado aleatório dentro de
um intervalo. Exemplos clássicos deste conceito são (Figura 2.4): a) a função de onda, que
determina a probabilidade de encontrarmos um elétron em determinado espaço orbital; e b)
a distribuição de Maxwell referente à velocidade das partículas do gás ideal em função da
temperatura (P.W. Atkins, Princípios de Química, Bookman, 2001).

20
Figura 2.4. Exemplos de distribuição de probabilidade aplicados à química.

A distribuição de probabilidade é determinada pela curva de densidade. No caso do


histograma do Exemplo da página 15, podemos delimitar a curva de densidade da
distribuição de probabilidade dos dados, conforme Figura 2.5.

20

18

16

14

12

10
fi

0
94 95 96 97 98 99 100 101 102 103 104 105 106
ºC

Figura 2.5. Curva de densidade de probabilidade conforme exemplo pg 15.

21
Quando não conhecemos a distribuição dos dados, podemos admitir sob critérios
rigorosos que a população pode seguir um padrão de distribuição determinado.

Distribuição Normal

Um dos mais importantes exemplos de uma distribuição continua de probabilidade é


a distribuição normal, ou a distribuição de Gauss, apresentada na Figura 2.6. A função de
distribuição normal é definida pela equação:

( x− )2
1 −
Y= e 2 2

 2

Figura 2.6. Representação gráfica da distribuição normal.

A distribuição normal é a distribuição mais comumente utilizada quando se estuda


variáveis. Podemos assim descrever as características de uma distribuição normal:

• Apresenta simetria ao redor da média;

• Tem um ponto de máximo para x =  ;

• É duplamente assintótica;

• Tem dois pontos de inflexão;

• A área sob é igual à unidade.

A probabilidade sob a curva de densidade da distribuição normal tem valores


definidos em termos de  conforme apresentado no Figura 2.7.

22
99,7 %

95,4 %

68,3 %

- 

- 2 2

- 3 3

Figura 2.7. Relação de probabilidade da distribuição normal em função de .

Como exemplo, vamos ilustrar a aplicação de cálculo pela probabilidade normal no


caso de uma análise química de cobre por método eletrogravimétrico, supondo que o
resultado esperado para o teor de cobre seja de 20 % e que a determinação analítica resultou
em média x = 20 e desvio padrão  = 0,5.

P (19 ≤ μ ≤ 21) =
P (18,5 ≤ μ ≤ 21,5) =
P (19 ≤ μ ≤ 21,5) =

Distribuição Normal Reduzida

Para facilitar o cálculo de áreas de probabilidades, converte-se a escala dos eixos de


x (variável aleatória) para escala de unidades de desvio padrão. Assim, temos que:

(x − )
z=

onde o valor z representa o quanto um determinado valor dista da média em termos de


desvio-padrão.

23
A tabela disposta no Apêndice deve ser empregada para determinar a probabilidade
de um resultado ocorrer em uma distribuição normal

Exemplo

Um certo material foi analisado em laboratório. A média das determinações foi de 3,40 e o
desvio padrão de 0,14. A especificação deste material fornecida pelo produtor é de
3,36  0,05. Qual a probabilidade de encontrar valores fora de especificação?

μ = 3,40
 = 0,14

Limites da especificação: x1 = 3,36 – 0,05 = 3,31


x2 = 3,36 + 0,05 = 3,41

(3,31 − 3,40)
z1 = = −0,642
0,14
(3,41 − 3,40)
z2 = = 0,071
0,14

P (x < 3,31) = P (z < -0,642) = 0,5 - 0,2389 = 0,261


P (x > 3,41) = P (z > 0,071) = 0,5 - 0,0279 = 0,472

P (3,31 < x < 3,41) = 0,733 ou 73,3 %

Exercício 2.4

A média obtida pelo laboratório para o teor de Fe no minério de ferro amostrado é de


12,5 % e o desvio padrão 1,2 %. A especificação do cliente é de 12,6  1,5 %.

a) Qual a probabilidade dos resultados obtidos encontrarem-se dentro desta especificação?


b) Qual a probabilidade de encontrar valores maiores que 11,1 %.

Problemas

2.5. Para X : N (20,4), ou seja, dada uma distribuição com μ = 20 e  2= 4, encontrar os


valores reduzidos correspondentes a:
x1 = 14 x2 = 16 x3 = 18 x4 = 20
x5 = 22 x6 = 24 x7 = 26

24
2.6. Seja X : N (100,25), calcule:
a) P (100  x  106)
b) P (89  x  107)
c) P (112  x  116)
d) P (x  108)
e) P (x  95)

2.7. Suponha que X é normalmente distribuída com média de 5 e um desvio padrão de 4.


Determinar o seguinte:
a) P(x  11)
b) P(x  0)
c) P(3  x  7)
d) P(-2  x  9)
e) P(2  x  8)

2.8. Os resultados das análises de óleo em água das amostras de um efluente final
apresentam valores de média 1,60 ppm e desvio-padrão 0,30 ppm. Supondo que os
resultados estejam normalmente distribuídos, encontre a probabilidade de uma amostra de
efluente final se apresentar:
a) Entre 1,50 e 1,80 ppm.
b) Mais de 1,75 ppm.
c) Menos de 1,48 ppm.
d) Qual deve ser valor mínimo para escolhermos os 10 % dos resultados que apresentaram
valores mais altos.

2.9. A resistência à compressão de amostras de cimento pode ser modelada por uma
distribuição normal com média de 6000 quilogramas por centímetro quadrado e um desvio
padrão de 100 quilogramas por centímetro quadrado.
a) qual é a probabilidade de que a força de uma amostra seja menor que 6250 kgf/cm2?
b) qual é a probabilidade de que a força de uma amostra esteja entre o 5800 e 5900
kgf/cm2?
c) que força é ultrapassada por 95 % das amostras?

2.10. A altura média feminina com idade entre 20-74 anos era de 64 polegadas em 2002,
um aumento de cerca de uma polegada desde 1960
(http://usgovinfo.about.com/od/healthcare). Suponha que a altura feminina é normalmente
distribuída com desvio padrão de 2 polegadas.
a) qual é a probabilidade de que uma mulher aleatoriamente selecionada nesta população
ter entre 58 polegadas e 70 polegadas?
b) qual altura inclui 90 % desta população?

25
2.11. A demanda pelo uso da água em Phoenix em 2003 atingiu uma alta de cerca de 442
milhões galões por dia em 27 de junho de 2003
(http://phoenix.gov/WATER/wtrfacts.html). O uso da água no verão é normalmente
distribuído com uma média de 310 milhões de galões por dia e um desvio padrão de 45
milhões de galões por dia. Reservatórios da cidade têm uma capacidade de armazenamento
combinado de quase 350 milhões de galões.
a) qual é a probabilidade de um dia requerer mais água do que é armazenado em
reservatórios da cidade?
b) que capacidade do reservatório seria necessária para que a probabilidade de que a reserva
de água seja ultrapassada seja apenas de 1 %?

2.12. Um artigo sob revisão para a Air Quality, Atmosphere & Health denominado
“Linking Particulate Matter (PM10) and Childhood Asthma in Central Phoenix” utilizou
dados de PM10 (partículas de <10-6 m de diâmetro) referentes à qualidade do ar medidos
por sensores. O valor de PM10 médio diário para um sensor localizado estrategicamente foi
de 50 mg/m3, com um desvio padrão de 25 mg/m3. Suponha que a média diária de PM10 é
normalmente distribuída.
a) qual é a probabilidade da média diária de PM10 ser superior a 100 mg/m3?
b) qual é a probabilidade da média diária de PM10 ser inferior a 25 mg/m3?
c) para qual valor médio diário de PM10 podemos estabelecer que, a partir dele, teremos
5 % dos resultados mais altos?

26
Estatística Indutiva 3
O objetivo da estatística indutiva é tirar conclusões sobre as populações com base
nos resultados observados nas amostras extraídas dessas populações. Os problemas de
estatística indutiva se concentram em dois grupos:

- Estimação de Parâmetros por Intervalos de Confiança


- Avaliação por Testes de Hipóteses

Estimação dos parâmetros da população

Através de uma amostra representativa da população, procura-se estimar os


parâmetros da população (média, mediana, moda, amplitude, desvio padrão, variância,
coeficiente de correlação, etc.). A estimação amostral pode ser por ponto ou por intervalo
de confiança.

A estimação pontual é a estimativa do parâmetro através de um único valor


resultante de observações sobre os valores da amostra. Em estatística, entende-se por
população o conjunto de elementos que tem em comum determinada característica. Todo
subconjunto de elementos retirado dessa população é uma amostra. As medidas obtidas
com base na população são chamadas parâmetros, indicados por letras gregas. Assim, por
exemplo, a média de uma população é indicada por μ, e o desvio padrão por .

As medidas obtidas com base em amostras são denominadas estatísticas, que são
obtidas a partir de amostras como estimativas dos parâmetros. Na estimação de parâmetros
por ponto, x serve para estimar μ, assim como S serve para estimar .

3.1. Estimação por intervalo de confiança

Estimar o parâmetro por intervalo consiste na determinação de valores obtidos de


observações da amostra no qual se espera que o mesmo contenha o valor do parâmetro. O
intervalo estabelecido com uma determinada probabilidade é conhecido como intervalo de
confiança. O nível ou grau de confiança, designado por 1-, é a probabilidade citada.
Assim,  será a probabilidade de erro na estimação por intervalo.

27
Admitiremos simetria na probabilidade que os intervalos de confiança contenham os
valores dos parâmetros estimados e, dessa forma, a probabilidade de que o parâmetro fique
fora do intervalo, à direita e à esquerda do mesmo, será igual a /2.

O intervalo de confiança pode ser determinado para uma série de condições. Vamos
considerar estas condições específicas como casos de estudo.

Caso 1. Intervalo de Confiança para μ com  conhecido.

O intervalo de confiança será expresso como x  e0 , sendo os limites do intervalo


de confiança simétrico x + e0 e x − e0 . O problema resume-se em determinar o e0 ,
fixando-se a probabilidade de erro na estimação, e fazendo uso do conceito da distribuição
normal padronizada.

Admitindo-se:

μ = média da população
x = média da amostra
x = valor da variável estudada
 = desvio padrão da população
n = tamanho da amostra
e0 = semi-amplitude do intervalo de confiança
x−
e z= x =   e0

Em se tratando do estudo de amostras, o desvio padrão em z passa a ser indicado por


 / n.

Substituindo as respectivas simbologias, temos que:

(   e0 ) − 
z=

n


e0 =  z
n

Portanto, a expressão do intervalo de confiança, x  e0 , resultará em:


xz
n

e a interpretação desse intervalo será indicada por:

28
   
P x − z x+z  = 1 − 
 n n

o valor de z é obtido na tabela da área sob a curva normal .

Exemplo

Consideremos uma amostra de 49 elementos extraída de uma população com distribuição


normal, com média amostral x = 25 e  = 1. Estabelecer um intervalo de 95 % de
probabilidade com confiança para a média dessa população.

Através da tabela da curva normal:

z = z2,5% = 1,96 (valor obtido para 1- = 1-0,05 = 0,95).

1
e0 = 1,96. = 0,28
49

o intervalo de confiança será dado por:

x  e0 = 25,00  0,28

com indicação dada por:

P (24,72 ≤ μ ≤ 25,28) = 0,95.

Exercício 3.1.
O teste da concentração de K no sangue não é totalmente preciso. Além disso, a
concentração pode variar significativamente de um dia para outro. Suponha que medidas
repetidas tomadas em dias diferentes do mesmo paciente variem normalmente, com
 = 0,2.
a) 1 amostra retirada de um determinado paciente apresentou resultado x = 3,4. Dê o
intervalo com 90 % de confiança para seu nível médio de K;
b) Suponha agora que 3 amostras fossem tomadas e fornecessem média x =3,4. Qual seria
agora o intervalo com 90 % de confiança para a média?

29
Exercício 3.2.
Uma fábrica produz pilhas com  = 1 h em termos de vida-útil. Em uma amostra de 36
pilhas, a média de vida-útil foi de 7,5 h. Supondo que a distribuição tenha comportamento
normal, estimar o intervalo que contém μ com 95 % de confiança.

Caso 2. Intervalo de Confiança para μ com  desconhecido.

Quando os parâmetros da população são desconhecidos, podemos, com base em


uma amostra, obter a média da amostra, o desvio padrão e o erro padrão da média. A
probabilidade neste caso deve ser considerada conforme a distribuição t de Student que é
adequada para amostras com menor número de elementos, em geral < 30.

A curva de densidade da distribuição t de Student se assemelha com a curva normal


à medida que n tende a valores maiores, conforme demonstrado na Figura 3.1.

z
Figura 3.1. Comparação entre a distribuição t e a normal em função do tamanho da
amostra.

A probabilidade sob a curva densidade da estatística t pode ser encontrada por meio
de dados tabelados (Apêndice).

30
Exemplo

Procurar o valor de t para uma amostra de 10 elementos com um nível de confiança de


95 %.

Exercício 3.4
Encontrar os valores de t na tabela bilateral para :
a) n = 20 95 % de confiança t=
b) n = 30 95 % de confiança t=
c) n = 10 99 % de confiança t=
d) n = 5 90 % de confiança t=

Exercício 3.5
Qual o número de amostras para:
a) 95 % de confiança t = 2,145 n=
b) 99 % de confiança t = 2,704 n=
c) 90 % de confiança t = 1,746 n=

Exercício 3.6
Qual o nível de confiança para :
a) t = 1,325 n = 21 confiança =
b) t = 2,878 gl = 18 confiança =

Usando a distribuição de t de Student podemos estabelecer um intervalo de


confiança para a média, calculando os limites x  tS x , onde S x = S n . Assim a expressão
para o intervalo de confiança para μ para com  desconhecido fica:

x  tn−1, / 2 S n

onde t é obtido por meio de tabela com n-1 graus de liberdade. A interpretação para o
intervalo de confiança é dada por:

 S S 
P x − tn −1, / 2 .    x + tn −1, / 2 .  = 1−
 n n

Exemplo

Uma amostra de 10 elementos com média x = 16 e desvio padrão S = 2 é extraída de uma


população de distribuição normal. Construir um intervalo de confiança de 90 % para a
média dessa população.

Da tabela de distribuição t temos:

31
tn-1= t9,90% = 1,833

2
eo = 1,833 × = 1,159
10

o intervalo de confiança será:

x  e0 = 16,00  1,159

com indicação:

P(14,841 ≤ μ ≤ 17,159) = 0,90

Exercício 3.7
Temos uma amostra de minério para análise de ferro. Obtivemos os seguintes resultados:

12,5 11,8 13,2 12,7 12,0 12,0

Construir um intervalo para a média, considerando 90 % de confiança.

Exercício 3.8
Construir o intervalo de confiança (95 %) para a concentração de enxofre em amostra de
carvão mineral. Os resultados obtidos em laboratório foram:

3,22 3,45 3,33 3,40 3,60

Problemas

3.1. A especificação de um produto garante o teor de cálcio igual a 1,5 %. Foram feitas 12
determinações de cálcio em um lote, sendo a média dos valores obtidos igual a 1,7 % e o
desvio padrão igual a 0,22 %. Verificar se o lote é aceito quando se aceita um risco de 5 %
de erro (95 % de confiança).

32
3.2. Quatro técnicos analisaram uma solução de amônia de concentração de 20,1%,
encontrando-se os seguintes resultados.

Técnico Determinações x S
A 20,2 19,9 20,1 20,4 20,2 20,4 20,2 0,190
B 19,9 20,2 19,5 20,4 20,6 19,4 20,0 0,486
C 20,6 20,5 20,7 20,6 20,8 21,0 20,7 0,179
D 20,1 19,9 20,2 19,9 21,1 20,0 20,2 0,456

Baseado nos dados acima, verifique com um nível de significância de 5 % se algum técnico
apresenta um erro sistemático.

Caso 3. Intervalo de confiança para a variância populacional.

A estimação do parâmetro variância pode ser realizada através de intervalos, de


forma análoga à determinação de μ. Para tal, devemos empregar a distribuição  2 (qui
quadrado).

A distribuição  2 estabelece a dependência da variância com o número de graus de


liberdade conforme apresentado na Figura 3.2:

Figura 3.2. Função de distribuição  2 de acordo com o número de graus de liberdade.

33
Seja:
n

 (x − x) i
2

S2 = i =1
n −1

 x − x  n −1 n −1 2
n 2

 =  i
2
  = 2 S
i =1    n −1 

(n − 1) S 2
2 =
2

O intervalo de confiança para a variância populacional é definido por:

 (n − 1) S 2 (n − 1) S 2 
P   2
 = 1-
  2 ,  2
 ,1−
 
 2 2 

Para o desvio padrão, o intervalo é definido por:

 (n − 1) S 2 (n − 1) S 2 
P   = 1-
  2 ,2  2 ,1− 2 
 

Onde os valores de  2 , e  2 ,1− podem ser encontrados em Tabela (Apêndice).


2 2

Exemplo

Uma amostra de 11 elementos extraída de uma população com distribuição normal


forneceu S2 = 7,08. Construir o intervalo com 90 % de confiança para 2 da população.

 2 ,2 =  210,5% =18,307

 2 ,1−2 =  210,95% =3,94

10  7,08
limites do intervalo: LI = = 3,87
18,307

10  7,08
LS = = 18,0
3,94

P(3,87  2  18,0) = 0,90


P(1,97    4,24) = 0,90

34
Exercício 3.9
A vazão de um determinado produto em um processo contínuo é medida por um
instrumento. São feitas as seguintes leituras em um intervalo definido de tempo.

3,20 3,18 3,22 3,57 3,61 3,72

com 90 % de confiança, estabeleça a variação máxima que poderá ser alcançada por este
sistema.

Caso 4. Intervalo de confiança para a proporção populacional

Uma variável é uma função que confere um número real a cada resultado no espaço
amostral de um experimento aleatório. As variáveis podem ser classificadas de duas
formas:

• Variáveis discretas – possuem uma faixa finita e contável. Exemplo: número de


lotes fabricados, número de analisadores em linha, número de certificados emitidos
no mês, etc..

• Variáveis contínuas – possuem um intervalo de números reais para a sua faixa.


Exemplo: temperatura, massa, tempo, concentração, etc..

O tratamento estatístico dado às variáveis discretas refere-se à proporção dos


eventos contáveis que ocorrem em uma determinada população. Baseados na distribuição
binomial, podemos estabelecer o intervalo de confiança para uma determinada proporção
populacional.

Seja:
n = número de elementos da amostra;
f = freqüência observada do evento;
p = proporção populacional (parâmetro);
p’= estimador do parâmetro (amostral);

f
p' =
n
Quando np ≥ 5 e n(1-p) ≥ 5
p ' (1 − p ' )
2 =
n


se e0 = z
n

35
p ' (1 − p ' )
para a proporção populacional: e0 = z
n

O intervalo de confiança para p pode ser definido por:

 p' (1 − p' ) p' (1 − p' ) 


P  p'− z  p  p'+ z  =1-

 n n 

Exemplo

Retirada uma amostra de 1000 peças da produção de uma máquina, verificou-se que 35
eram defeituosas. Qual o IC ao nível de 95 % para a produção de defeitos da máquina?

n = 1000

f = 35

35
p' = = 0,035
1000

z 95 % = 1,96

0,035(1 − 0,035)
e0 = 1,96 = 0,0114
1000

P(0,035-0,0114 ≤ p  0,035+0,0114) = 1-

P(0,0236 ≤ p ≤ 0,0464) = 0,95

Exercício 3.10
Em uma pesquisa com os 150 alunos do último ano de graduação de uma faculdade, 57
afirmaram que farão pós-graduação. Sendo a população de alunos formandos de 2000 em
todas as faculdades da região, calcule o número mínimo de alunos que com 95 % de certeza
farão pós-graduação.

36
3.2. Tamanho das amostras

A amplitude do intervalo de confiança é inversamente proporcional ao nível de


confiança, isto é, quanto maior o intervalo menor será a precisão na estimação. A
determinação do tamanho de amostras necessárias para casos de estimação da média fica:

• Com  conhecido na estimação da média populacional

2
 z 
n =  
 e0 

• Com  desconhecido na estimação da média populacional


2
t S
n =  ( n −1, / 2) 
 e0 

Nesta situação, dependemos de uma amostra piloto n’ para podermos considerar o


valor de t n −1, / 2 na expressão acima para o cálculo de n. Enquanto o valor de n obtido for
maior que o valor de n’ utilizada como amostra piloto, devemos escolher novo n’ e
conseqüentemente teremos a tabela t de Student o valor correspondente com n’-1 graus de
liberdade. Repetimos este procedimento até se obter n < n’.

• Para a proporção populacional


2
 z
n =   p' (1 − p' )
 e0 

Exemplo

O supervisor dos analistas do laboratório setorial deseja estimar o valor médio para a
determinação de selênio em amostras de ração animal, para checar se o método que ele está
utilizando atende ao erro de 0,2 mg/L, com 90 % de confiança. Baseado em dados do
laboratório central, a estimativa para o desvio padrão do teor esperado é de  = 0,50 mg/L.
Qual o número mínimo de determinações que ele precisa efetuar?

Para 90 % de confiança (1- ): z = 1,65.


2
 1,65  0,50 
n=  = 17
 0,2 

37
Exemplo

Para verificar se determinado material está fora de especificação, ou seja, maior que
0,05 mg/L de Pb, o supervisor encaminhou ao analista 7 amostras, obtendo os seguintes
resultados.

0,052 0,048 0,050 0,055 0,054 0,043 0,060

Ao nível de 10 % de significância, este número de amostras é suficiente para se afirmar que


a amostra está fora de especificação? Considerar que não há mais informações a respeito do
problema.

x = 0,05171

S = 0,005438

n’ = 7 > t 6;0,90 = 1 ,943

e0 = x −  = 0,05171 − 0,05 = 0,00171

2
 1,943  0,005438 
n=  = 38
 0,00171 

como n > n’ (38>7), devemos fazer novas determinações e procedermos aos cálculos para a
nova média x e a nova estimativa para desvio padrão, utilizando a estatística “t”
correspondente, ao nível de 5 %, e obtermos o novo número n; e assim por diante, até
chegarmos em n menor ou igual a n’ . O n final vai nos indicar o número mínimo de
amostras necessário para dizermos sobre a concordância a respeito da especificação.

Exemplo

Qual o tamanho da amostra suficiente para estimar a proporção de produtos com defeitos
fornecidos por uma máquina, com precisão de 0,02 e 90 % de confiança, sabendo que
seguramente esta proporção não é superior a 0,20.
2
 1,65 
n=   0,2(1 − 0,2) = 1089
 0,02 

38
3.3. Rejeição de valores dispersos

Antes de se efetuar a avaliação e interpretação de uma série de resultados, é


necessário verificar a existência de valores que eventualmente possam ser considerados
como dispersos, ou seja, valores que muito provavelmente não pertençam ao mesmo
conjunto de resultados (população).

Em geral, são feitas considerações dentro do critério de rejeição de valores :

• Se proporção de valores dispersos < 10 %, estes devem ser rejeitados e o restante


do conjunto pode ser tratado normalmente;

• Se 10% < proporção de valores dispersos < 15%, o responsável pela avaliação dos
resultados deve usar o bem senso acerca da preservação do conjunto de dados para
estudo;

• Se proporção de valores dispersos > 15 %, a amostra deve ser totalmente rejeitada.

Existem métodos de verificar se um ou mais valores podem ser considerados


dispersos. Vamos aqui nos concentrar no estudo dos procedimentos mais comumente
empregados e recomendados.

Teste de Cochran

Este teste é utilizado quando se deseja comparar variâncias, ou seja, verificar se a


variância dos resultados obtidos por um laboratório é excessiva em relação aos demais
laboratórios. É um teste unilateral, isto é, só verifica o maior valor.

Para um conjunto de p laboratórios, com desvios padrão Si (i=1,2,...,p), todos


computados com o mesmo número de repetições n, o teste de Cochran é dado por:

2
S máx
Cc = p

S
i =1
i
2

onde:
S2 = estimativa da variância
S2 máx = maior valor encontrado como estimativa da variância, no conjunto
p = número de laboratórios

Os valores críticos para o teste de Cochran são tabelados (Apênice).

Se Cc < Ct 5 % → Valor aceito


Se Ct 1 % < Cc < Ct 5 % → Valor suspeito
Se Cc > Ct 1 % → Valor disperso

39
Exemplo

Aplicar o Teste de Cochran no conjunto de dados abaixo para encontrar valores dispersos.

Laboratório n S S2
1 3 0,005 0,000025
2 3 0,010 0,000100
3 3 0,021 0,000441
4 3 0,010 0,000100
5 3 0,019 0,000361
6 3 0,006 0,000036
7 3 0,012 0,000144
8 3 0,025 0,000625

Calcular a soma das variâncias


 Si2 = 0,001832
Relacionar a maior variância encontrada, com a soma.

2
S máx 0,000625
Cc = p
= = 0,341
0,001832
S
i =1
i
2

Comparar o valor calculado Cc, com o valor tabelado (Ct 1 % e Ct 5 %)

Na tabela, para p = 8 e n = 3, temos:

Ct 5 % = 0,516
Ct 1 % = 0,615

Conclusão: Como Cc < Ct 5 %, então o valor da maior variância, Laboratório 8, é aceita.

Teste de Grubbs

O teste é primeiramente realizado verificando a existência de um valor disperso em


cada extremidade do conjunto. Se nesta primeira análise, um dos dois valores for
considerado disperso, ele é rejeitado, retirado do conjunto e novo teste, verificando a
existência de um valor disperso em cada extremidade do conjunto, é realizado e assim
sucessivamente. Caso contrário, se nesta primeira análise, ambos os valores forem aceitos
como não dispersos, o teste é então realizado verificando-se a existência de dois valores
dispersos em cada extremidade do conjunto. Se nesta segunda análise os dois resultados de
uma das extremidades forem considerados como dispersos, eles devem ser rejeitados,

40
retirados do conjunto e novo teste verificando a existência de dois valores dispersos em
cada extremidade do conjunto é realizado e assim sucessivamente.

Os valores críticos para o teste de Grubbs são tabelados (Apêndice).

Teste de Grubbs para 1 valor disperso: dado um conjunto de resultados gi, para i=1, 2, ...,
p, dispostos em ordem crescente, então para determinar se um determinado valor é um
disperso, usando o teste de Grubbs, devemos calcular as seguintes estatísticas:

para testar o maior valor, utilizar

(g p − g )
Gp =
S

para testar o menor valor, utilizar

( g − g1 )
G1 =
S

Os valores críticos para o teste de Grubbs são tabelados.

Se Gc < Gt 5 % → Valor aceito


Se Gt 1 % > Gc > Gt 5 % → Valor suspeito
Se Gc > Gt 1 % → Valor disperso

Teste de Grubbs para 2 valores dispersos: dado um conjunto de resultados gi, para
i=1,2,...,p, dispostos em ordem crescente, então para determinar se dois (maiores ou
menores) valores são considerados como dispersos, devemos calcular as seguintes
estatísticas:
Para testar se dois maiores valores podem ser considerados como dispersos, calcular a
relação entre as diferenças quadráticas (G):

S p2−1, p
G p −1, p =
S 02
onde:
p
S =  ( g i − g ) 2 - é a diferença quadrática no conjunto com todos os valores
2
0
i =1
p−2
S p2−1, p =  ( g i − g p −1, p ) 2 - é a diferença quadrática no conjunto sem os dois maiores valores
i =1
p −2
gi
g p −1, p =  - é a média do conjunto, sem os dois maiores valores
i =1 ( p − 2)

41
Alternativamente, para os dois menores valores

S12, 2
G1, 2 =
S 02
p
S 02 =  ( g i − g ) 2 - é a diferença quadrática no conjunto com todos os valores
i =1
p
S12, 2 =  ( g i − g1, 2 ) 2 - é a diferença quadrática no conjunto, sem os dois menores valores
i =3
p
gi
g1, 2 =  - é a média do conjunto, sem os dois menores valores
i =3 ( p − 2)

Se Gc > Gt 5 % → Valor aceito


Se Gt 1 % < Gc < Gt 5 % → Valor suspeito
Se Gc < Gt 1 % → Valor disperso

Exemplo

Verificar se há dados dispersos no conjunto abaixo:

Laboratório n x
1 3 0,708
2 3 0,680
3 3 0,667
4 3 0,660
5 3 0,690
6 3 0,733
7 3 0,703
8 3 0,677

Ordenando dados de forma crescente:

g(1) g(2) g(3) g(4) g(5) g(6) g(p-1) g(p)


0,660 0,667 0,677 0,680 0,690 0,703 0,708 0,733

Verificar dados tabelados para os níveis de significância dados.


Valores tabelados Gt 1% ou Gt 5%.
Para 8 laboratórios, testando um valor, temos: Gt 5% = 2,126 e Gt 1% = 2,274.

Selecionar o menor e o maior valor.


Verificar se 0,660 é disperso.
Verificar se 0,733 é disperso.

42
Calcular a média e o desvio padrão do conjunto de dados
g
g =  i = 0,68975
p

 (g i − g )2
S= i =1
= 0,024022
p −1

Calcular a estatística.
Para o menor valor:

(0,68975 − 0,660)
G1 = = 1,238
0,0240

Conclusão: como o valor calculado é menor do que os valores tabelados, tanto a 1 % como
a 5 %, ele não é considerado nem disperso, nem suspeito, respectivamente.

Para o maior valor:

(0,733 − 0,68975)
Gp = = 1,800
0,0240

Conclusão: como o valor calculado é menor do que os valores tabelados, tanto a 1 % como
a 5 %, ele não é considerado nem disperso, nem suspeito, respectivamente.

Obs. Tanto o menor valor como o maior valor foram aceitos, seguimos com o teste de
Grubbs, agora com dois valores em cada extremidade.

Para 8 laboratórios, testando um valor, temos: Gt 5% = 0,110 e Gt 1% = 0,056.

Selecionar os dois menores valores e os dois maiores valores.


Verificar se 0,660 e 0,667 são dispersos.
Verificar se 0,708 e 0,733 são dispersos.

Calcular a média do conjunto de dados, sem os dois menores valores a serem testados.

Portanto, sem os dois menores valores teremos:

p
gi
g1, 2 =  = 0,6985
i =3 ( p − 2)

Calcular a soma das diferenças quadráticas, dos dois conjuntos, ou seja, um conjunto com
todos os valores e o outro conjunto sem os dois valores a serem testados.

43
Conjunto com todos os valores

p
S 02 =  ( g i − g ) 2 = 0,00404
i =1

Laboratório gi (gi − g ) ( gi − g )2
4 0,66 -0,02975 0,0008851
3 0,667 -0,02275 0,0005176
8 0,677 -0,01275 0,0001626
2 0,68 -0,00975 0,0000951
5 0,69 0,00025 0,0000001
7 0,703 0,01325 0,0001756
1 0,708 0,01825 0,0003331
6 0,733 0,04325 0,0018706
 0,00404

conjunto sem os dois valores


p
S12, 2 =  ( g i − g1, 2 ) 2 = 0,002178
i =3

Laboratório gi ( g i − g1, 2 ) ( gi − g1, 2 ) 2


4 0,66
3 0,667
8 0,677 -0,0215 0,0004622
2 0,68 -0,0185 0,0003422
5 0,69 -0,0085 0,0000723
7 0,703 0,0045 0,0000202
1 0,708 0,0095 0,0000902
6 0,733 0,0345 0,0011903
 0,002178

Calcular o valor de Grubbs

S12, 2 0,00218
G1, 2 = 2 = = 0,539
S0 0,00404

Conclusão: como o valor calculado é maior do que os valores tabelados a 1 % e 5 %, os


dois valores testados não são nem dispersos, nem suspeitos.

Calcular a média do conjunto de dados, sem os dois valores maiores a serem testados.

Portanto, sem os dois maiores valores teremos:

44
p −2
gi
g p−1, p =  = 0,6795
i =1 ( p − 2)

Calcular a soma das diferenças quadráticas, dos dois conjuntos, ou seja, um conjunto com
todos os valores e o outro conjunto sem os dois valores a serem testados.

Conjunto com todos os valores:


p
S 02 =  ( g i − g ) 2 = 0,00404
i =1

Conjunto sem os dois valores:


p −2
S p2−1, p =  ( g i − g p−1, p ) 2 = 0,001206
i =1

Laboratório gi ( g i − g p −1, p ) ( gi − g p−1, p ) 2


4 0,66 -0,0195 0,0003802
3 0,667 -0,0125 0,0001562
8 0,677 -0,0025 0,0000062
2 0,68 0,0005 0,0000003
5 0,69 0,0105 0,0001102
7 0,703 0,0235 0,0005522
1 0,708
6 0,733
 0,001206

Calcular o valor de Grubbs

S p2−1, p 0,00121
G p−1, p = 2
= = 0,299
S 0 0,00404

Conclusão: Como o valor calculado é maior do que os valores tabelados a 1 % e 5 %, os


dois valores testados não são nem dispersos, nem suspeitos.

Exercício 3.11

Verificar se há valores dispersos para os dados dispostos abaixo

1,6 4,0 4,2 4,2 4,2 4,4 4,4 4,4 4,6 4,6 6,0 8,0

45
Problemas

3.3. Medições de pH em uma solução tampão forneceram os seguintes resultados:

5,12 5,20 5,15 5,17 5,16 5,19 5,15.

Calcule os limites de confiança 95 % e 99 % para o valor verdadeiro de pH.

3.4. O rendimento de um processo químico está sendo estudado. A partir de experiência


prévia, o rendimento é conhecido ser normalmente distribuído, com σ = 3. Os últimos cinco
dias de operação da planta resultaram os seguintes rendimentos, em %:
91,6 88,75 90,8 89,95 91,3.
Encontre um intervalo de confiança de 95 % para o rendimento médio verdadeiro.

3.5. Um artigo no Journal of Agricultural Science [“The Use of Residual Maximum


Likelihood to Model Grain Quality Characteristics of Wheat with Variety, Climatic and
Nitrogen Fertilizer Effects” (1997, Vol. 128, pp. 135-142)] investigou o teor médio de
proteína bruta de grãos de trigo (CP) e número de Hagbergfalling (HFN) no Reino Unido.
A análise utilizou uma variedade de aplicações de fertilizante de nitrogênio (kg N/ha),
temperatura (ºC) e precipitação de chuva mensal total (mm). Os dados mostrados abaixo
descrevem as temperaturas do trigo cultivado em Harper Adams Agricultural College entre
1982 e 1993. As temperaturas medidas em junho foram obtidas conforme a seguir:
15,2 14,2 14,0 12,2 14,4 12,5 14,3 14,2 13,5 11,8 15,2
Assumir que o desvio padrão é conhecido, σ = 0,5. Construa um intervalo de confiança com
99 % para a temperatura média.

3.6. A vida útil em horas de uma lâmpada de 75 watts é conhecida por ser normalmente
distribuída com σ = 25 horas. Uma amostra aleatória de 20 lâmpadas tem uma vida média
de 1014 horas. Construa um intervalo de confiança com 95 % para a vida útil média.

3.7. Uma determinada marca de margarina diet foi analisada para determinar o nível de
ácido graxo poli-insaturado (em percentagem). Uma amostra de seis pacotes resultou nos
seguintes dados:
16,8 17,2 17,4 16,9 16,5 17,1
Calcule o intervalo de confiança e conclua se a amostra atende com 95 % a especificação
de 17,0 %.

3.8. Um artigo na Nuclear Engineering International (fevereiro de 1988, p. 33) descreve


várias características das barras de combustível usadas em um reator de uma central elétrica
na Noruega. Medidas da porcentagem de enriquecimento de 12 bastões foram relatadas
conforme a seguir:
2,94 3,00 2,90 2,75 3,00 2,95
2,90 2,75 2,95 2,82 2,81 3,05

Encontre um intervalo de confiança de 99 % para a média de enriquecimento. Você está


seguro em afirmar de que a percentagem média de enriquecimento é 2,95 %? Por que?

46
3.9. O teor de açúcar na calda de pêssegos enlatados é normalmente distribuído. Uma
amostra aleatória de n = 10 latas produz um desvio padrão de amostra de S = 4,8 mg.
Calcule um intervalo de confiança com 95 % para σ.

3.10. A porcentagem de titânio em uma liga usada em peças aeroespaciais é medida em 51


peças selecionadas aleatoriamente. O desvio padrão da amostra é S = 0,37. Construa um
intervalo de confiança 95 % para σ.

3.11. Um artigo na Australian Journal of Agricultural Research [“Non-Starch


Polysaccharides and Broiler Performance on Diets Containing Soyabean Meal as the Sole
Protein Concentrate” (1993, Vol. 44, No. 8, pp. 1483–1499)] determinou que o nível de
composição de aminoácidos essenciais (lisina) de refeições de soja é dado conforme abaixo
(g/kg):
22,2 24,7 20,9 26,0 27,0
24,8 26,5 23,8 25,6 23,9
Calcule com 99 % de confiança o limite inferior para σ.

3.12. Em 2004, o reator esteve parado com problemas em 5 dias. Para 2003, qual o número
mínimo de dias esperado, com 90 % de confiança, em que haverá perda de produção diária
no mesmo equipamento?

3.13. Foram feitas 20 medidas do tempo real gasto para a precipitação de um sal, em
segundos, numa dada experiência:

13 15 12 14 17 15 16 15 14 16
17 14 16 15 15 13 14 15 16 15

Esses dados são suficientes para estimar o tempo médio gasto na precipitação com precisão
de meio segundo e 95 % de confiança? Em caso negativo, qual o tamanho da amostra
necessária?

3.14. Uma amostra de 10 peças forneceu os seguintes valores de certa dimensão (em mm):
80,1 80,0 80,1 79,8 80,0 80,3 79,7 80,0 80,2 80,4
Deseja-se estimar a dimensão média com erro máximo de 5/100 mm e 98 % de confiança,
bem como a proporção de peças com dimensão acima de 80 mm, com precisão de 90 % de
confiança. Dimensione a amostra total que se deverá tomar. (resolva com auxílio do Excel).

3.15. Deseja-se estimar a resistência média de certo tipo de peças com precisão de 2 kgf e
95 % de confiança. Desconhecendo-se a variabilidade da resistência, romperam-se 5 peças,
obtendo-se para elas os seguintes valores para as suas resistências (em kg): 50, 58, 52, 49,
55. Com base nos resultados obtidos, determinou-se que deveriam ser testadas mais 14
peças, a fim de se conseguir o resultado desejado. Qual a sua opinião a respeito da
conclusão?

47
3.16. Quantas amostras serão necessárias para estimar o desvio com α = 5% e α = 1%, de
um determinado técnico ao realizar uma análise, sabendo que é admitido um erro de = 1%
( = 0,179)

3.17. Verificar se existe algum valor discrepante nos resultados de análises de 4 técnicos
conforme dados abaixo :

técnico A 6 determinações s2 = 0,036


técnico B 6 determinações s2 = 0,236
técnico C 6 determinações s2 = 0,032
técnico D 6 determinações s2 = 0,015

3.18. Usando o teste de Grubbs, verificar se existe algum resultado discrepante nas
determinações a seguir:

i: 20,1 19,9 20,2 19,9 20,1 20,0


ii: 49,4 49,8 50,8 49,3 51,3 50,0 50,8 51,8

3.4. Testes de Hipótese

O objetivo dos testes de hipótese é comparar um valor suposto de um parâmetro de


população com um valor encontrado numa amostra aleatória. Ao contrário do que ocorria
nos problemas de estimação, vamos agora supor que exista uma hipótese, a qual será
considerada válida até prova em contrário, acerca de um dado parâmetro da população.
Essa hipótese será testada com base em resultados amostrais, sendo aceita ou rejeitada.

Representaremos por H0 a hipótese existente, a ser testada, a qual chamaremos de


hipótese nula. Consideraremos H1 a hipótese alternativa e estaremos decidindo sobre a
afirmação dada por H0 através de testes sobre a hipótese alternativa H1 .O teste irá levar à
aceitação ou rejeição da hipótese H0 , o que corresponde respectivamente à negação ou
afirmação de H1. Enfim, enunciaremos o resultado final sempre em termos da hipótese H0,
ou seja, aceitar ou rejeitar H0. Os erros que estão os sujeitos a cometer são:

• Rejeitar uma hipótese quando deveria ser aceita (erro tipo I)

• Aceitar uma hipótese quando deveria ser rejeitada (erro tipo II)

O nível de significância do teste é a máxima probabilidade com que estaríamos


incorrendo num risco de erro tipo I, geralmente denotada por . Assim, sendo H0
verdadeira, aceitaremos H0 com probabilidade (1-) e rejeitaremos H0 com probabilidade 
(erro tipo I), e sendo H0 falsa, aceitaremos H0 com probabilidade  e rejeitaremos H0 com
probabilidade (1- ) (erro tipo II).

48
Os testes de hipóteses podem ser unilaterais e bilaterais, conhecidos também como
monocaudais e bicaudais, respectivamente, ou seja, correspondendo ao nosso interesse em
verificar se os desvios do valor real ao parâmetro estão unicamente para mais ou
unicamente para menos, ou para mais e para menos, em relação ao valor testado.

Procedimento para o teste de hipótese

• Definir o problema em estudo:


- caracterizar os objetivos.
- definir os parâmetros populacionais envolvidos.

• Formular as hipóteses que traduzam os objetivos:


- H0 é sempre neutra.
- H1 é sempre a negativa de H0 .
- H0 e H1 são definidas pelos parâmetros populacionais envolvidos no problema.

• Definir o nível de significância ( ) do teste.

• Definir o tamanho da amostra (n).

• Obter dados amostrais (informações) através da amostra considerada.

• Determinar a região crítica (região de rejeição de H0)


- a região crítica é definida pela H1
- pela distribuição de probabilidade envolvida e nível de significância ( ) do
teste
- a região crítica é sempre limitada por um valor crítico.

• Tomar a decisão:
- Rejeitar H0 se o valor de encontra na região crítica.
- Não rejeitar H0 se o valor não se encontra na região crítica.

Os testes de Hipótese básicos envolvem 1 ou 2 populações e podem ser testes de


média ou variância.

49
Testes para 1 amostra

• Caso 1. Para μ com  conhecido:

Hipóteses Rejeita-se H0 se:


H 0 : μ = μ0
H 1 : μ < μ0 zc < -zt()

H 0 : μ = μ0 zc > zt()
H 1 : μ > μ0

H 0 : μ = μ0 |zc| > zt(/2)


H 1 : μ ≠ μ0

Exemplo

A distribuição dos valores obtidos para a determinação de P numa produção de fertilizante


fosfatado segue uma distribuição normal. No laboratório químico, o técnico analisou 4
amostras da produção do dia, e o resultado forneceu média de 5 % de P. Sabendo que o
desvio padrão do processo de fabricação é de 0,2 %, podemos dizer, ao nível de 5 % de
significância, que o valor médio de P produzido é menor que 5,2 % ?

H0: μ = 5,2 %
H1: μ < 5,2 %

O problema é testar se zc < - zt; se houver confirmação, rejeita-se a hipótese nula.

5 − 5,2
zc = = −2
0,2
4

zt = z0,05 = 1,645

Conclusão: Como zc < -zt, rejeita-se a hipótese nula H0. Portanto, podemos afirmar que ao
nível de 5% de significância, o valor médio de P, naquele dia, é menor que 5,2 %.

Exercício 3.11
A especificação de um certo material é estabelecida em 3,36  0,04 mg/L. Considerar
 = 0,04. O Técnico analisou uma amostra deste material e encontrou o valor médio para 3
repetições de 3,29. Pode-se aceitar o material como especificado com 5 % de significância?

50
Resposta: |zc| = 1,3; zt = 1,96. Aceita-se H0.

• Caso 2. Para μ com  desconhecido:

Hipóteses Rejeita-se H0 se:


H 0 : μ = μ0
H 1 : μ < μ0 tc < -tt(n-1,)

H 0 : μ = μ0 tc > t t(n-1,)
H 1 : μ > μ0

H 0 : μ = μ0 |tc| > t t(n-1,/2)


H 1 : μ ≠ μ0

Exemplo

A determinação de Ti em uma amostra de mineral forneceu os seguintes resultados:

3,22 3,45 3,33 3,40 3,60

Considerando que o valor acordado é de 3,50 , posso concluir com 1 % de significância que
o material apresenta teor de Ti adequado?

H0: μ = 3,5
H1: μ ≠ 3,5

x = 3,4
S = 0,14
tt = t4;0,005 = 4,604

x−
tc =
S
n

3,4 − 3,5
tc = = −1,6
0,14
5

Conclusão: Como tc < tt, aceita-se H0. O teor de Ti é igual ao especificado ao nível de 1 %
de significância.

51
Testes para 2 amostras

A teoria dos testes de hipóteses aplica-se a casos em que temos duas amostras, em
princípio, provenientes de populações diferentes. Comparam-se parâmetros equivalentes
das populações envolvidas, testando hipóteses referentes ao valor real da diferença entre as
duas médias populacionais.

• Caso 1. Dados emparelhados

A situação é caracterizada quando os dados de duas amostras estão relacionados


dois a dois segundo, algum critério pré-estabelecido. Como exemplo, podemos citar a
comparação de resultados analíticos obtidos com dois métodos analíticos diferentes na
determinação de um elemento.

Se os dados das duas amostras estão emparelhados, tem sentido calcularmos as


diferenças d correspondentes a cada par de valores, resumindo-se os dados a uma única
amostra de n diferenças.

Por outro lado, testar a hipótese de que a diferença entre as médias de duas
populações emparelhadas seja igual a um certo valor μd equivale a testar a hipótese de que a
média de todas as diferenças (referentes às populações) seja igual a μd. Ou seja, vamos
testar simplesmente a hipótese,

H0: μd = 0 (caso bilateral)


H1: μd ≠ 0

ou

H0: μd = 0 (caso unilateral)


H1: μd > 0

ou

H0: μd = 0 (caso unilateral)


H1: μd < 0

Através da comparação do t de Student experimental com o valor crítico obtido em


função do nível de significância () estabelecido para o teste com n-1 graus de liberdade.

A estatística t é calculada conforme equação:

d − d0
t=
Sd
n

52
d é a média da amostra das diferenças;
d 0 é o valor testado da média das diferenças nas populações, em geral, igual a 0;
Sd é o desvio padrão das diferenças;

A decisão de aceitar ou rejeitar a hipótese nula H0 segue o critério estabelecido, ao nível de


 % de significância e n-1 graus de liberdade:

Hipóteses Rejeita-se H0 se:


H0: μd = 0
H1: μd < 0 tc < -tt(n-1,)
H0: μd = 0
H1: μd > 0
tc > t t(n-1,)

H0: μd = 0
H1: μd ≠ 0
|tc| > t t(n-1,/2)
Exemplo

Deseja-se comparar se as médias obtidas para 5 amostras, utilizando 2 diferentes métodos


analíticos para determinação de Sn podem ser consideradas iguais, ao nível de 5 % de
significância?

Os resultados analíticos são:

Método A Método B A - B (d)


33,0 33,0 0
50,4 50,0 0,4
11,9 11,3 0,6
1,24 1,36 -0,12
1,69 1,75 -0,06
d = 0,164
Sd = 0,3176

o teste de hipótese pode ser resumido desta forma:

H0 : as médias são iguais (μd = 0)


H1 : as médias não são iguais (μd ≠ 0)

Para resolver este problema, devemos calcular a estatística t e compará-la com o valor
tabelado a 5 % de significância.

53
0,164
tc = = 1,155
0,3176
5

tt = tn-1;/2 = t 4; 0,025 = 2,776

Conclusão: Como tc < tt, aceita-se H0. Podemos afirmar que não existe diferença
significativa entre os dois métodos empregados.

• Caso 2. Dados não emparelhados

O caso de dados não emparelhados será subdividido em 3 situações:

• quando os desvios padrão das populações são conhecidos;

• quando os desvios padrão das populações são desconhecidos mas supostos iguais;

• quando os desvios padrão das populações são desconhecidos e não podem ser
supostos iguais.

Dados não emparelhados com desvios padrão das populações conhecidas:

Com 1 e 2 das populações conhecidas, utilizamo-nos de

x1 − x2
zc =
 12  22
+
n1 n2

A decisão do teste será conforme o critério indicado a seguir:

Hipóteses Rejeita-se H0 se:


H0: μ1 - μ2 = 0
H1: μ1 - μ2 < 0 zc < -zt()

H0: μ1 - μ2 = 0 zc > zt()


H1: μ1 - μ2 > 0

H0: μ1 - μ2 = 0 |zc| > zt(/2)


H1: μ1 - μ2 ≠ 0

54
Exemplo

O controle do teor de impurezas de Cd em soluções extratoras na fabricação de um produto


tem revelado que os resultados seguem uma distribuição normal com desvio padrão de
0,05 mg/L. Em dois turnos consecutivos de trabalho foram recolhidas amostras de 10 e 15
peças, respectivamente, com teores médios de 0,40 mg/L e 0,45 mg/L de Cd. Qual a
conclusão, ao nível de 5 % e 1 % de significância, de que o processo de fabricação ficou
fora de controle?

H0 : μ1 – μ2 = 0
H1 : μ1 – μ2 ≠ 0

1 = 2

0,40 − 0,45 − 0,05


zc = = = 2,448
2 2
0,05 0,05 0,000417
+
10 15

z0,025 = 1,960

z0,005 = 2,578

Conclusão: ao nível de 5 %, pode-se afirmar que o processo ficou fora de controle; porém,
ao nível de 1 % , aceita-se a hipótese nula.

Dados não emparelhados com desvios padrão das populações desconhecidos, mas
supostos iguais:

Para este caso, aplica-se a seguinte expressão:

x1 − x2
tc =
1 1
Sp +
n1 n2

onde o estimador combinado Sp (pooled stimator) é definido por:

(n1 − 1) S12 + (n2 − 1) S 22


Sp =
n1 + n2 − 2

A decisão do teste será conforme o critério indicado abaixo:

55
Hipóteses Rejeita-se H0 se:
H0: μ1 - μ2 = 0
H1: μ1 - μ2 < 0 tc < -tt(n1+n2-2,)

H0: μ1 - μ2 = 0 tc > tt(n1+n2-2,)


H1: μ1 - μ2 > 0

H0: μ1 - μ2 = 0 |tc| > tt(n1+n2-2, /2)


H1: μ1 - μ2 ≠ 0

Exemplo

Dois fornecedores de reagentes químicos para a determinação de P pelo método


colorimétrico foram testados por nosso laboratório. Foram analisadas 7 amostras de 2 lotes
diferentes. Ao nível de 5 % de significância, pode-se afirmar que os resultados obtidos com
os reagentes químicos do fornecedor A são mais baixos que os obtidos com reagentes do
fornecedor B? Não se conhecem os parâmetros desta distribuição.

Fornecedor A Fornecedor B
0,0149 0,0158
0,0160 0,0158
0,0156 0,0155
0,0170 0,0170
0,0150 0,0160
0,0250 0,0240
0,0147 0,0153
x = 0,016886 x = 0,017057
S = 0,003664 S = 0,003109

H0 : μ1 – μ2 = 0
H1 : μ1 – μ2 < 0

(7 − 1)0,003664 2 + (7 − 1)0,003109 2
Sp = = 0,0033979
7+7−2

0,016886 − 0,017057
tc = = −0,09415
1 1
0,0033979 +
7 7

56
tn1+n2-2; = t12;0,05 = 1,782

tc > - tt

Conclusão: Aceita-se a hipótese nula, ou seja, posso aceitar que os resultados obtidos com
os reagentes de ambos os fornecedores são iguais ao nível de 5 % de significância.

Dados não emparelhados com desvios padrão das populações desconhecidos e nem
supostos iguais:

Hipóteses Rejeita-se H0 se:


H0: μ1 - μ2 = 0
H1: μ1 - μ2 < 0 tc < -tt(ν,)

H0: μ1 - μ2 = 0 tc > tt(ν,)


H1: μ1 - μ2 > 0

H0: μ1 - μ2 = 0 |tc| > tt(ν,/2)


H1: μ1 - μ2 ≠ 0

Os valores críticos de t para ν graus de liberdade são obtidos da tabela, cujo cálculo é dado
por:

x1 − x2
tc =
S12 S 22
+
n1 n2

2
 S12 S 22 
 + 
=  n1 n 2  −2
2 2
 S12   S 22 
   
 1  +  n2 
n
n1 + 1 n2 + 1

Exemplo

Deseja-se verificar se o nível de Pb em efluente industrial de determinada unidade de


tratamento é diferente no inverno e no verão. Testar a nível de 10% de significância para:

a) Concentrações iguais em ambas estações;

57
b) Concentração maior no inverno;

Verão Inverno
13,01 12,99
13,00 13,06
12,95 12,98
12,97 13,14
13,01 13,14
12,93
12,94
12,96
12,97
12,94
x = 12,968 x = 13,062
S = 0,02974 S = 0,0776
n = 10 n=5
Questão a

H0 : μ1 – μ2 = 0
H1 : μ1 – μ2 ≠ 0

12,968 − 13,062
tc = = −2,613
0,02974 2 0,0776 2
+
10 5

2
 0,02974 2 0,0776 2 
 + 
=  10 5  − 2 = 4,9  5
2 2
 0,02974 2   0,0776 2 
   
 10  + 5 
10 + 1 5 +1

t 5;0,10 = 2,015

Conclusão: como |tc| > tt, rejeita-se H0 e não podemos afirmar que os níveis de Pb em
estações diferentes são iguais.

• Caso 3. Comparação de variâncias

Duas variâncias populacionais podem ser comparadas estatisticamente. Para tal, a


relação entre as duas variâncias deve ser comparada por meio da distribuição F. Assim

58
como a distribuição  2 , a distribuição F é assimétrica e depende do número de graus de
liberdade entre o numerador e o denominador conforme apresentado na Figura 3.2.

Figura 3.2. Função de distribuição F de acordo com o número de graus de liberdade das
populações .

O cálculo da estatística F é dado por:

S12
F 1, 2 =
S 22
sendo que S12  S 22

Os critérios para aceitação ou rejeição da hipótese nula seguem abaixo, utilizando as


tabelas de F-Snedecor, com n1-1 e n2-1 graus de liberdade. (Apêndice):

Hipóteses Rejeita-se H0 se:


H0: 1=2
H1: 1 <2 Fc < Fn1-1,n2-1(1-)

H0: 1 =2 Fc > Fn1-1,n2-1()


H1: 1 >2

H0: 1=2 Fc > Fn1-1,n2-1(/2)


H1: 1 ≠ 2

Exemplo

59
De duas populações de distribuições normais foram extraídas amostras de 5 e 10 elementos
que forneceram variâncias iguais a 3,5 e 8 respectivamente, Ao nível de 1 % de
significância podemos concluir que as populações têm diferentes graus de dispersão?

H0: 1 =2
H1: 1 ≠ 2

8
Fc = = 2,286
3,5

Ft = F 9;4;0,005 = 21,14

Conclusão: Como Fc < Ft, não rejeitamos a hipótese nula e podemos dizer que as
populações não têm diferentes graus de dispersão.

Exercício 3.12
Supomos que a distribuição populacional de resultados para uma solução de amônia tem
como média 20,0 % de NH3 e desvio padrão 0,171, para o laboratório. Queremos avaliar a
precisão de um analista recém admitido, nesta determinação, através dos dez resultados
para a solução padrão de 20,0 % de NH3 por ele obtido:

20,5 19,9 20,1 20,3 19,9 19,7 20,2 19,6 19,7 20,1

Pode-se admitir que a precisão obtida pelo analista é igual à precisão do laboratório ao
nível de 5 % de significância?

Problemas.

3.15. Dois catalisadores podem ser usados em um processo químico por batelada. Doze
bateladas foram preparadas usando o catalisador 1, resultando em um rendimento médio de
86 e um desvio padrão da amostra igual a 3. Quinze bateladas foram preparadas
empregando o catalisador 2 , resultando um rendimento médio de 89, com um desvio
padrão de 2. Considere que as medidas dos rendimentos sejam distribuídas
aproximadamente de forma normal, com o mesmo desvio padrão. Há evidência que
confirme a afirmação que o catalisador 2 produz um rendimento maior que o catalisador 1?
Use =0,01.

3.16. O diâmetro de bastões de aço, fabricados em 2 máquinas extrusoras diferentes está


sendo investigado. Duas amostras aleatórias de tamanho n1 = 15 e n2 = 17 são selecionadas
e as médias e as variâncias das amostras são x 1 = 8,73, S2 = 0,35, e x 2 = 8,68, S2 = 0,40,
respectivamente. Suponha que 1 = 2 e que os dados sejam retirados de uma população
normal. Há evidência que confirme a afirmação que as duas máquinas produzem bastões de
diferentes diâmetros? Use =0,05 para chegar a esta conclusão.

60
3.17. Os pontos de fusão de duas ligas usadas na formulação de solda foram investigados
através da fusão de 21 amostras de cada material. A média e o desvio padrão para a amostra
1 foram x 1 = 420 ºF e S1 = 4 ºF, enquanto que para a liga 2 foram x 2 = 426 ºF e S2 = 3 ºF.
Os dados amostrais confirmam a afirmação de que ambas as ligas tem o mesmo ponto de
fusão? Use  = 0,05 e considere que ambas as populações sejam normalmente distribuídas
e tem o mesmo .

3.18. Dois diferentes testes analíticos podem ser usados para determinar o nível de
impurezas em uma liga de aço. Oito espécimes são testados usando ambos os
procedimentos, sendo os resultados demonstrados na tabela a seguir. Há evidência
suficiente para concluir que ambos os testes fornecem o mesmo nível médio de impureza?
Use =0,01.

Espécime Teste 1 Teste 2


1 1,2 1,4
2 1,3 1,7
3 1,5 1,5
4 1,4 1,3
5 1,7 2,0
6 1,8 2,1
7 1,4 1,7
8 1,3 1,6

3.19. Um cientista de computação está investigando a utilidade de duas diferentes


linguagens de programação na melhoria das tarefas computacionais. Doze programadores
experientes, familiarizados com ambas as linguagens, codificaram uma função padrão nas
duas linguagens. O tempo em minutos foi registrado, sendo os dados mostrados a seguir:

Programador Linguagem 1 Linguagem 2


1 17 18
2 16 14
3 21 19
4 14 11
5 18 23
6 24 21
7 16 10
8 14 13
9 21 19
10 23 24
11 13 15
12 18 20

Ao nível de =0,05, há alguma indicação que uma linguagem de programação seja


preferível?

61
3.20. Está sendo investigada a temperatura em que ocorre uma deflexão, devida à carga, em
dois diferentes tubos de plástico. Duas amostras aleatórias foram testadas e as temperaturas
(em ºF) observadas em que ocorre a deflexão são reportadas a seguir:

Tipo 1 Tipo 2
206 193 192 177 176 198
188 207 210 197 185 188
205 185 194 206 200 189
187 189 178 201 197 203
194 213 205 180 192 192

Os dados confirmam a afirmação de que a temperatura em que ocorre a deflexão , devido à


carga, no tipo 2 excede àquela do tipo 1? Use =0,05.

3.21. Duas companhias químicas podem fornecer uma matéria-prima, cuja concentração de
um determinado elemento é importante. A concentração média para ambos os fornecedores
é a mesma, porém, suspeitamos que a variabilidade na concentração pode diferir entre as
duas companhias. O desvio padrão da concentração de uma amostra aleatória de n1 = 10
bateladas produzidas pela companhia é S1 = 4,7 g/L, enquanto para a companhia 2, uma
amostra aleatória de n2 = 16 bateladas resulta em S2 = 5,8 g/L. Há evidência suficiente para
concluir que a as variâncias das duas populações difiram? Use =0,05.

3.22. Considere os dados apresentados no Problema 3.18. Os dados da amostra confirmam


a afirmação que ambas as ligas tem a mesma variância de ponto de fusão? Use =0,05 para
tirar a conclusão.

3.23. Com o intuito de controlar a homogeneidade da produção de certas partes no tempo,


amostras semanais são retiradas da produção corrente. Uma primeira amostra de dez
elementos, forneceu x 1 = 284,55 e S1 = 0,320, ao passo que uma segunda amostra forneceu
os seguintes valores:

284,6 283,9 284,8 285,2 284,3 283,7 284,0

Ao nível de 5% de significância, podemos afirmar que a homogeneidade da produção tenha


variado no decorrer das duas semanas investigadas?

3.24. Um fabricante produz virabrequins para um motor de automóvel. O desgaste do eixo


de manivela após 100.000 milhas é importante porque é susceptível ao impacto nas
reclamações sobre a garantia do produto. Uma amostra aleatória de eixos n = 15 é testada
com x = 2,78. É sabido que σ = 0,9 e que o desgaste é normalmente distribuído. Através do
teste de hipótese, verifique se o desgaste é igual a 3,00 com α = 0,05.

3.25. Um teste de ponto de fusão de um material, com amostras n = 10, utilizado na


fabricação de um propulsor de foguete resultou em x = 154,2 ºF. Suponha que o ponto de

62
fusão é normalmente distribuído com σ = 1,5 ºF. Através do teste de hipótese, verifique se o
ponto de fusão é igual a 155 ºF com α = 0,05.

3.26. A vida em horas de uma bateria é conhecida por ser aproximadamente normalmente
distribuída com desvio padrão σ = 1,25 h. Uma amostra aleatória de 10 baterias tem uma
vida média de horas de 40,7 h. Há evidência para apoiar a alegação de que a vida útil da
bateria excede 40 horas? Use α = 0,05.

3.27. Um artigo no jornal ASCE Journal of Energy Engineering (1999, Vol. 125, pp. 59–
75) descreve um estudo sobre as propriedades de inércia térmica do concreto aerado
autoclavado, usado como material de construção. Cinco amostras do material foram
testadas em uma estrutura e a média de temperaturas interiores (°C) apresentaram os
seguintes resultados. Verifique se a inércia térmica é igual a 22,5 ºC. Use α = 0,05.

23,01 22,22 22,04 22,62 22,59

3.28. Um artigo de 1992 no jornal da Associação Médica Americana (“A Critical Appraisal
of 98.6 Degrees F, the Upper Limit of the Normal Body Temperature, and Other Legacies
of Carl Reinhold August Wunderlich”) reportou a temperatura do corpo, gênero e ritmo
cardíaco para várias condições. A temperatura do corpo de 25 mulheres foi verificada
conforme a seguir (ºF):

97,8 97,2 97,4 97,6 97,8 97,9 98,0 98,0 98,0 98,1 98,2
98,3 98,3 98,4 98,4 98,4 98,5 98,6 98,6 98,7 98,8 98,8
98,9 98,9 99,0
É possível afirmar que a temperatura corporal para esse estudo é menor que 98,6 ºF? Use
α = 0,05.

3.29. Determinou-se o teor de sódio de vinte caixas de 300 gramas de flocos de milho
orgânico, os dados (em mg) são os seguintes:

131,15 130,69 130,91 129,54 129,64 128,77 130,72


128,33 128,24 129,65 130,14 129,29 128,71
129,00 129,39 130,42 129,53 130,12 129,78
130,92

Você pode apoiar a afirmação de que o teor de sódio deste tipo de sucrilhos difere de 130
miligramas? Use α = 0,05.

3.30. Duas máquinas são usadas para encher garrafas de plástico com um volume líquido de
16,0 onças, o volume de preenchimento pode ser assumido normal com desvio padrão σ1 =
0,020 e σ2 = 0,025 onças. Um funcionário da engenharia suspeita que ambas as máquinas
tenham a mesma exatidão de preenchimento do volume. Uma amostra aleatória de 10
garrafas é retirada da saída de cada máquina. Você acha que o engenheiro está correto? Use
α = 0,05.

63
Máquina 1 Máquina 2
16,03 16,01 16,02 16,03
16,04 15,96 15,97 16,04
16,05 15,98 15,96 16,02
16,05 16,02 16,01 16,01
16,02 15,99 15,99 16,00

Você acha que o engenheiro está correto? Use α = 0,05.

3.31. Dois tipos de plástico são adequados para utilização por um fabricante de
componentes eletrônicos. A força de ruptura do plástico é importante. É sabido que σ1 = σ2
= 1,0 libra por polegada quadrada. A partir de uma amostra aleatória de tamanho n1 = 10 e
n2 = 12 obtemos x 1 = 160,5 e x 2 = 155,5. A empresa não adotará plástico 1 a menos que
sua média de resistência à ruptura seja superior ao plástico 2. Com base nas informações, a
empresa deveria usar o plástico 1? Use α = 0,05.

3.32. Duas formulações diferentes de um combustível de motor estão sendo testadas para
estudar a octanagem. A variância da octanagem para a formulação 1 é σ2 = 1,5 e para
formulação 2 é σ2 = 1,2. Duas amostras aleatórias de tamanho n1 = 15 e n2 = 20 foram
testadas e as octanagens foram x 1 = 89,6 e x 2 = 92,5. Usando α = 0,05, conclua se a
octanagem da formulação 2 é maior.

3.33. O diâmetro de hastes de aço fabricadas em duas diferentes máquinas de extrusão está
sendo investigado. Duas amostras aleatórias de tamanhos n1 = 15 e n2 = 17 são selecionadas
e as médias e variâncias de amostra são x 1 = 8,73 e S21 = 0,35 e x 2 = 8,68 e S22 = 0,40
respectivamente. Há evidência para apoiar a alegação de que as duas máquinas produzem
hastes com diâmetros médios diferentes? Considere σ1 = σ2 e α = 0,05.

64
Análise de Variância 4
Análise da variância é a técnica utilizada para isolar e estimar as variâncias que contribuem
para a variação total de um experimento, possibilitando identificar as fontes relevantes e
estabelecer meios para estimar seus efeitos.

Com único fator de classificação

Objetivo: comparar os efeitos de “a” tratamentos (ou níveis de um fator) alocados


aleatoriamente às unidades experimentais (experimento completamente aleatorizado).

Exemplos:

• Comparar os resultados analíticos obtidos por “a” técnicos;


• Comparar os resultados analíticos obtidos em “a” aparelhos.

Matriz de observações para n replicatas de um experimento:

tratamento observações total


1 Y 11 Y 12 Y 13 ... Y 1n Y 1.
2 Y 21 Y 22 Y 23 ... Y 2n Y 2.
3 Y 31 Y 32 Y 33 ... Y 3n Y 3.
. . .
. . .
a Y a1 Y a2 Y a3 ... Y an Y a.
total Y ..

Onde: Yij = qualquer valor das observações


 i.= total das observações do tratamento “i”
Y
n = número de replicatas de cada tratamento
N = n . a =número total de observações

Procedimento para o teste

Partição da variação total nas componentes:


• Efeito do fator
• Erro aleatório

65
Soma de quadrados (corrigida) total ou variação total:

SQT =  (Yij − Y
) 2
..
i j

Desenvolvendo este somatório teremos:

SQT =  (Yij − Y
) 2 =  (Y − Y
.. ij
. + Y
i
. − Y
i
) 2 =
..
i j i j

n (Yi. − Y
) +  (Y − Y
..
2
ij
 ) 2
i.
i i j

SOMA DOS QUADRADOS TOTAIS (SQT) =


SOMA DO QUADRADO DOS FATORES (SQF) + SOMA DO QUADRADO DOS ERROS (SQE)

SQF = variação entre os diversos tratamentos (between)


SQE = variação dentro dos tratamentos devido ao erro (within)

Quadrado médio e número de graus de liberdade (gl)

Para o fator: QMF = SQF/ (a – 1); gl = (a-1)


Para o erro: QME = SQE/ (N –a); gl = (N-a)

Valores esperados dos quadrados médios:

- E (QME) = 2 (QME estima variância)

 n 
-E (QMF) =  2 +    1
2

 a −1 i

a
Onde τi representa a diferença entre a média total e a média de cada grupo (  12 = 0 ).
i =1

Caso a razão QMF/ QME seja um valor elevado, indica que 1  0. Assim comparamos sob
as condições do modela a estatística:

QMF
Fo =
QME

A distribuição F possui (a – 1) graus de liberdade (gl) no numerador e (N-a) graus de


liberdade no denominador.

66
Caso Fo  F ,a −1, N − a , a hipótese da igualdade dos efeitos deve ser rejeitada para o nível de
significância .

Fonte de Graus de Soma dos Quadrados


Fo
variação liberdade quadrados médios
Fator a-1 SQF QMF QMF/QME
Erro N-a SQE QME
Total N-1 SQT

Fórmulas para cálculo:


Y..2
SQT =  (Yij − Y.. ) 2 =  Yij2 −
i j i j N
1 Y..2
SQF = n (Yi. − Y.. ) =  i. N
Y 2

i n i

SQE = SQT − SQF

Exemplo

Foram efetuadas 3 determinações do ponto de fulgor em óleo combustível pesado com


quatro termômetros diferentes . Testar a um nível de significância de 5 % se existe
diferença de termômetros.

Termômetro A: 174,0 173,0 173,5


Termômetro B: 173,0 173,0 172,0
Termômetro C: 171,5 171,0 173,0
Termômetro D: 173,5 171,0 172,5

Solução:

Antes de aplicar a Análise de Variância, vamos subtrair os dados de uma constante,


digamos 170, a todos os valores, pois isso simplifica o cálculos e não muda o resultado

67
Σ
Termômetro A: 4 3 3,5 10,5
Termômetro B: 3 3 2 8
Termômetro C: 1,5 1 3 5,5
Termômetro D: 3,5 1 2,5 7
Σ 31

 312 
SQT = Y −
Y..2
ij
2 2
(
= 4 + 3 + 3,5 + 3 + ... + 2,5 − 
2 2 2 2
)  = 10,9
i j N  12 

1 Y..2 10,5 2 8 2 5,5 2 7 2 312


SQF =  i. N = 3 + 3 + 3 + 3 − 12 = 4,4
n i
Y 2

SQE = SQT − SQF = 10,9 − 4,4 = 6,5

Fonte de Graus de Soma dos Quadrados


Fo
variação liberdade quadrados médios
Fator 3 4,4 1,47 1,8
Erro 8 6,5 0,81
Total 11 10,9

Ft 0,05 = 4,1

Conclusão: ao nível de 5 % de significância não existe diferenças entre os termômetros.

Com mais de um fator de classificação

É usada quando se deseja separar os experimentos em blocos a fim de remover da análise


um erro experimental.

Experimentos completos em blocos aleatorizados.

Em cada um de “b” blocos são aplicados, em ordem aleatória, todos os “a” tratamentos.

68
tratamento Bloco 1 Bloco 2 Bloco b total
1 Y 11 Y 12 Y 1b Y 1.
2 Y 21 Y 22 Y 2b Y 2.
3 Y 31 Y 23 Y 3b Y 3.
. . . . .
. . . . .
a Y a1 Y a2 Y ab Y a.
total Y .1 Y .2 Y .b Y ..

Número total de observações: N = ab


Neste caso o modelo é aditivo, isto é , não existe interação entre tratamentos e blocos.

Partição da soma dos quadrados

SQT =  (Yij − Y.. )2


i j

SQT = SQF + SQB + SQE

Graus de liberdade:
N – 1 = (a –1) + (b – 1 ) +( a – 1 ) (b – 1)

E (QME) =  2

b
E (QMF ) =  2 +
a −1
  12

a
E (QMB) =  2 +
b −1
 12
Estatística teste para aceitação da influência do fator

QMF
Fo = : F( a −1)(a −1)(b −1)
QME

Rejeitamos a igualdade entre os fatores ao nível de significância  se:

Fo  F , ( a −1),( a −1)(b −1)

Rejeitamos a igualdade para o efeito dos blocos se:

QMB
Fo =
QME

69
for grande, tem-se uma indicação que os blocos são relevantes na redução do erro.

Y2
C=
N

SQT = Yij2 − C
i j

1
SQF = 
b i
Yi.2 − C

1
SQB = 
a j
Y j2 − C

Fonte de Graus de Soma dos Quadrados


Fo
variação liberdade quadrados médios
a-1 SQF SQF/(a-1) QMF/QME
Fator
b-1 SQB SQB/(b-1) QMB/QME
Bloco
(a-1)(b-1) SQE SQE/(a-1)(b-1)
Erro
N-1 SQT
total

Exemplo

Os dados apresentados a seguir referem-se aos resultados obtidos por 5 técnicos em 3


laboratórios diferentes. Verifique se ao nível de 5 % de significância existe diferença entre
os técnicos e os laboratórios.

Laboratório 1 Laboratório 2 Laboratório 3


Técnico A 32 49 30
Técnico B 41 45 29
Técnico C 35 45 37
Técnico D 30 40 35
Técnico E 31 42 42

Reduzindo os resultados pela subtração de 37:

70
L1 L2 L3 Σ
TA -5 12 -7 0
TB 4 8 -8 4
TC -2 8 0 6
TD -7 3 -2 -6
TE -6 5 5 4
Σ -16 36 -12 8

 82 
SQT = Y −
Y..2
ij
2 2
( 2 2 2
)
= - 5 + 12 + - 7 + 4 + ... + 5 −   = 573,7
2

i j N  15 

1 Y..2 0 2 4 2 6 2 − 6 2 4 2 8 2
SQF =  i. N = 3 + 3 + 3 + 3 + 3 − 15 = 30,4
b i
Y 2

1 Y..2 − 16 2 36 2 − 12 2 8 2
SQB =  j. N = 5 + 5 + 5 − 15 = 334,9
a j
Y 2

SQE = SQT − SQF − SQB = 10,9 − 4,4 = 208,4

Graus de Soma dos Quadrados


Fonte de variação Fo Ft
liberdade quadrados médios
4 30,4 7,6 0,29 3,8
Entre Técnicos
2 334,9 167,5 6,43 4,4
Entre Laboratórios

Erro 8 208,4 26,1

Total 14 573,7

Conclusão: Ao nível de 5 %, verifica-se que há diferenças significativas apenas enre os


laboratórios.

71
Problemas

4.1. Um produto foi analisado por três métodos diferentes conforme tabela abaixo.
Verifique se existe diferença significativa entre os métodos ao nível de significância de 1 %
e 5 %.

Método I 75 62 71 58 73
Método II 81 85 68 92 90
Método III 73 79 60 75 81

4.2. Os resultados abaixo referem-se às análises efetuadas em 5 equipamentos diferentes.


Teste a hipótese de que não exista diferença entre os resultados ao nível de 1 % e 5 %.

A 68 72 75 42 53
B 72 52 63 55 48
C 60 82 65 77 75
D 48 61 57 64 50
E 64 65 70 68 53

4.3. Os resultados da tabela abaixo referem-se aos resultados de um plano de correlação


realizado por 8 laboratório diferentes. Verifique se ao nível de 5 % de significância existe
diferença entre os laboratórios.

LAB 1 LAB 2 LAB 3 LAB 4 LAB 5 LAB 6 LAB 7 LAB 8


11,5 11,0 12,0 11,5 12,1 11,0 10,9 11,5
11,3 11,3 12,1 11,3 11,3 10,9 10,8 11,4
11,4 11,4 11,5 11,0 11,5 10,5 11,0 11,5

72
4.4. Um laboratório dispõe de 5 técnicos e 4 aparelhos para executar determinada análise
(vide tabela abaixo) Deseja-se verificar se o resultado de uma análise varia para diferentes
operadores. Usando a tabela ANOVA, verifique se existe diferença nos resultados dos
técnicos entre os equipamentos. Use α = 0,05.

Laboratórios
técnicos I II III IV
A 44 38 47 36
B 46 40 40 43
C 44 36 44 38
D 43 38 46 33
E 38 42 49 39

4.5. A análise de dureza é feita pressionando-se uma haste sobre uma placa metálica.
Avaliar se há diferença entre hastes (A, B, C e D) e entre placas (I, II, III e IV), quando
testadas aleatoriamente. Use α = 0,05.

I II III IV
A 9,3 9,4 9,6 10,0
B 9,4 9,3 9,8 9,9
C 9,2 9,4 9,5 9,7
D 9,7 9,6 10,0 10,2

4.6. Quatro pneus de cada uma das marcas A, B e C foram testados quanto à durabilidade.
Os resultados obtidos em milhares de km são mostrados a seguir.

A 34 38 31 35
B 32 34 31 29
C 30 25 28 23

Ao nível de 1% de significância, há evidência que os pneus tenham diferentes


durabilidades médias?

73
Regressão e Correlação Linear 5
Muitas vezes, necessitamos estudar o relacionamento de duas variáveis, coletadas
como pares de valores, para resolver questões, como por exemplo:

• O rendimento de uma reação pode ser estimado em função da temperatura


no reator;
• A viscosidade da solução resultante depende da concentração do reagente;
• As emissões de poluentes de uma fábrica dependem do nível de produção
atingida no período.

Problemas como esses podem ser estudados através uma analise de correlação
simples, onde podemos determinar a intensidade da relação entre as variáveis. As variáveis
estudadas serão: X, denominada variável independente, e Y, denominada variável
dependente. Se o relacionamento entre X e Y for consistente, poderemos realizar uma
predição para o valor de Y, conhecido um valor de X, através de uma análise de regressão
simples dos dados.

Diagrama de Dispersão

É um gráfico no qual cada ponto representa um par observado de valores para as


variáveis estudadas (X ,Y), num sistema de eixos cartesianos. Através do diagrama de
dispersão poderemos estimar a existência de uma relação entre as variáveis estudadas. A
Figura 5.1 a seguir apresenta exemplos de diagramas de dispersão.

Coeficiente de Correlação Linear (R)

Mede o grau e o tipo do relacionamento entre as variáveis estudadas. Esta medida é


também chamada de coeficiente de correlação de Pearson.

74
(a) Relação linear direta (b) Relação linear inversa

(c) Relação curvilínea direta (c) Não há relação

Figura 5.1. Exemplos de diagramas de dispersão.

O valor de R, pode ser calculado por:

nXY − XY
R=
n(X 2 ) − (X ) 2 n(Y 2 ) − (Y ) 2

Onde n é o numero de pares de valores (X,Y) observados. Os valores do Coeficiente


de Correlação Linear encontram-se no intervalo: -1,0 ≤ R ≤ 1,0. A partir dos valores de R,
podemos verificar o tipo da correlação existente entre as variáveis estudadas, conforme
Figura 5.2.

-1 0 1

□Fraca
■ Forte

Figura 5.2. Intensidade da correlação conforme o valor de R.

A Equação de Regressão Linear Simples

É uma equação que possibilita predizer um valor para Y dado o valor de X. A


equação de regressão linear simples populacional é dada por: Y = α + βX + ε, onde ε é o

75
componente aleatório que representa a influência de outros fatores, bem como os erros de
medição da variável Y. Este componente surge devido à variabilidade dos valores de Y para
cada valor de X.

Para o componente aleatório, também comumente chamado de resíduo, são


admitidas as seguintes características:
• A variável aleatória ε têm distribuição normal.
• ε tem média igual a zero.
• ε tem variância igual a σ2 para todos os valores de X.

Os estimadores dos coeficientes angular (β) e linear (α) serão designados


respectivamente por b e a, e a estimativa do modelo linear será dada por:

Y = a + bX

Os valores de a e b serão determinados através do Método dos Mínimos Quadrados


(MMQ), aplicado na amostra selecionada, utilizando-se as seguintes equações:

 XY − nXY
b= a = Y + bX
 X 2 − n( X ) 2

É importante observar que:

- A reta de mínimos quadrados (MMQ) passa pelo ponto ( Y ; X ), isto é,



quando X = X , temos que Y = Y ;

- b mede a variação que ocorre em Y por unidade de variação de X.



- Quando não houver relação entre X e Y teremos Y = Y , pois b = 0

- Quando as relações entre X e Y forem proporcionais, a reta passa na origem e



a = 0, logo Y = b X .

Exemplo

Para 5 volumes de uma solução, foram medidos os tempos de aquecimento em um mesmo


bico de gás e as respectivas temperaturas finais:

Tempo (min) 20 22 19 23 17
Temperatura (ºC) 75 80 75 82 78

Determine o modelo de regressão pelo método dos mínimos quadrados e calcule o


coeficiente de correlação.

76
X Y XY X2 Y2
20 75 1500 400 5625
22 80 1760 484 6400
19 75 1425 361 5625
23 82 1886 529 6724
17 78 1326 289 6084
Σ 101 390 7897 2063 30458

X = 20,2
Y = 78

7897 − 5.20,2.78
b= = 0,833 a = 78 + 0,833.20,2 = 61,2
2063 − 5(20,2) 2


Y = 61,2 + 0,833 X

5.7897 − 101.390
R= = 0,645
5.2063 − (101) 2 5.30458 − (390) 2

R2 = 0,417

Problemas

5.1. Um artigo científico apresentou dados sobre a concentração do licor verde de Na 2S e


da produção de uma máquina de papel. Os dados lidos a partir de um gráfico são mostrados
a seguir:

nº Na2S (g/L) Produção (t/d)


1 40 825
2 42 830
3 49 890
4 46 895
5 44 890
6 48 910
7 46 915
8 43 960
9 53 990
10 52 1010
11 54 1012
12 57 1030
13 58 1050

77
a) Ajuste um modelo de regressão linear simples correlacionando a concentração do
licor verde de Na2S com a produção.
b) Encontre o valor de y, correspondente a x = 910, e o resíduo associado.
c) Encontre a concentração média do licor de Na 2S quando a taxa de produção for de
950 t/d.
d) Calcule R2.

5.2. Dados correspondentes ao desgaste abrasivo do aço doce (y), em 10-4 mm3 e a
viscosidade do óleo (x) em mm2/s são apresentados na tabela a seguir:

y 240 181 193 155 172 110 113 75 94


x 1,6 9,4 15,5 20,0 22,0 35,5 43,0 40,5 33,0

a) Ajuste um modelo de regressão linear simples empregando o método dos mínimos


quadrados.
b) Preveja o desgaste abrasivo quando a viscosidade for igual a 30 .
c) Obtenha o valor ajustado de y quando x = 22, e calcule o resíduo correspondente.
d) Calcule R2 e faça a interpretação dessa grandeza.

5.3. A ocorrência de cloreto de sódio nas correntes de superficiais de um rio na parte central
de Rhode Island foi estudada. Os dados a seguir se referem à concentração de cloreto (y,
em mg/L) e à área (x,em %) das encostas exploradas para análise:

y 4,4 6,6 9,7 10,6 10,8 10,9 11,8 12,1 14,3


x 0,19 0,15 0,57 0,70 0,67 0,63 0,47 0,70 0,60

y 14,7 15,0 17,3 19,2 23,1 27,4 27,7 31,8 39,5


x 0,78 0,81 0,78 0,69 1,30 1,05 1,06 1,74 1,62

a) Ajuste um modelo de regressão linear simples empregando o método dos mínimos


quadrados.
b) Estime a concentração média de cloreto para 1% de área das encostas exploradas.
c) Obtenha o valor ajustado correspondente x = 0,47 e o resíduo correspondente.
d) Calcule R2 e faça a interpretação dessa grandeza.

5.4. Utilizando os dados abaixo:


a) Construa o diagrama de dispersão
b) Ajuste uma reta de dados
c) Trace a reta no diagrama de dispersão.
d) Qual o valor de y para x = 16?

x 10 11 12 13 14 15
y 100 112 119 130 139 142

78
116. Sendo:

x 1993 1994 1995 1996 1997


y 17,5 19 23,3 28,7 35

a) Ajustar uma reta aos dados.


b) Estimar o valor de y para 1998

79
Planejamento de Experimentos 6
Muito do que sabemos nas ciências, especialmente em química, é desenvolvido
através de testes ou experiências. Freqüentemente, os cientistas trabalham em áreas
problemáticas, em que nenhuma teoria é ainda completamente aplicável. Assim, a
experiência e a observação dos dados resultantes constituem as únicas maneiras pelas quais
o problema pode ser equacionado. Mesmo que haja uma boa teoria científica básica em que
possamos confiar na explicação do fenômeno de interesse, é quase sempre necessário
conduzir testes ou experimentos para confirmar que a teoria é, na verdade, operativa na
situação ou no ambiente no qual ela está sendo aplicada. Julgamento estatístico e métodos
estatísticos desempenham um papel importante no planejamento, condução e análise de
dados a partir de experimentos.

A validade das conclusões retiradas acerca de experimentos realizados no intuito de


entender como processos ou sistemas funcionam depende, em grande extensão, de como os
experimentos são conduzidos. Conseqüentemente, o adequado planejamento do
experimento desenvolve papel relevante na solução do problema que inicialmente motivou
o trabalho. O Planejamento de Experimentos quando empregado no sentido de otimização
dos processos também tem como objetivo:

• Obter produtos melhores;

• Diminuir tempo de desenvolvimento do produto;

• Aumentar produtividade;

• Minimizar a sensibilidade do produto em relação às variações nas condições de


fabricação;

• Minimizar os custos em um trabalho exploratório.

Os métodos aplicados em planejamentos de experimentos que trataremos neste


conteúdo apresentam as seguintes funcionalidades:

• Organizam e reduzem o trabalho experimental otimizando os custos;

• Funcionam bem na presença do erro experimental;

80
• Empregam operações matemáticas simples;

• Necessitam apenas de conhecimento básico em estatística.

6.1. Planejamento de Experimentos Fatorial

Os processos estudados por meio dos métodos de planejamento necessitam ser


caracterizados (Figura 6.1). Como exemplo, considere que um químico deseje obter o
rendimento máximo de uma reação controlando duas variáveis: temperatura e tempo de
reação. O rendimento da reação é considerado a resposta do processo. Adicionalmente,
outras respostas poderiam ser estudadas no mesmo processo, tais como viscosidade, dureza
e elasticidade, por exemplo. As variáveis que em princípio influenciam a resposta –
temperatura e tempo – são os fatores. Em geral, descrevemos as respostas do processo na
forma de variáveis dependentes e os fatores como variáveis independentes. O objetivo do
químico em questão é descobrir que valores (ou níveis) dos fatores produzem a melhor
resposta possível.

Fatores Respostas
F1 R1
F2 Sistema R2
F3 R3
(Temperatura, tempo, (Rendimento, viscosidade
concentração, etc..) elasticidade, etc..)

Figura 6.1. Caracterização do processo em um planejamento de experimentos.

Planejamentos de Experimentos Fatoriais são os métodos mais adequados para


estudar os efeitos dos fatores e suas possíveis interações nas respostas de processo. Vamos
no decorrer dos exemplos apresentados ilustrar como as interações entre os fatores
ocorrem.

Um método de planejamento, alternativo ao fatorial e não recomendado, consiste


em praticar a mudança dos níveis testando um fator a cada vez. Neste método univariado, à
medida que se busca otimizar o processo através do fator escolhido, outros fatores
permanecem constantes. A principal falha no método univariado é que as possíveis
interações entre os fatores não podem ser identificadas, ou seja, os resultados sinérgicos ou
antagônicos nas mudanças de níveis dos fatores são ignorados.

81
Retornando ao problema anteriormente colocado, o rendimento da reação como
resposta foi observado quando se variou o tempo (Figura 6.2) à uma certa temperatura
estabelecida. Posteriormente, variou-se a temperatura mantendo o tempo de reação em
1,7 h, o melhor valor para se otimizar a reação conforme o experimento anterior (Figura
6.3).

75

70

Rendimento (%) 65

60

55

50

45

40
0 0,5 1 1,5 2 2,5 3
tem po (h)

Figura 6.2. Evolução do rendimento da reação em função do tempo (T=155 ºC).

80

75

70
Rendimento (%)

65

60

55

50

45

40
135 145 155 165 175 185
tem peratura (ºC)

Figura 6.3. Evolução do rendimento da reação em função da temperatura (t=1,7 h).

Através do método univariado concluímos que a melhor condição experimental para


reação está em manter a temperatura em 155 ºC e o tempo de reação em 1,7 h. Ao comparar
o resultado obtido em um gráfico de curva de nível do rendimento em função da
temperatura e do tempo (Figura 6.4), notamos que o ponto determinado experimentalmente
está distante do ponto de melhor rendimento. Geralmente, o método univariado falha na
presença de interações, como no caso aqui apresentado. A Figura 6.5 apresenta a superfície
de resposta do problema em que é possível notar que a mudança no rendimento alterando-
se o tempo é mais acentuada a uma temperatura de 185 ºC do que a 140 ºC.

82
210
Ponto de maior rendimento

200

190
Temperatura (ºC)

180 90 % Ponto determinado


experimentalmente
170 80 %

160
70 %
150

140 60 %

130
0,0 0,5 1,0 1,5 2,0 2,5

tempo (h)
Figura 6.4. Curvas de nível para o rendimento em função da temperatura e tempo.

Figura 6.5. Superfície de resposta para o rendimento em função da temperatura e tempo.

83
Há ocasiões em que vários fatores são interessantes em um trabalho
experimental, por exemplo, se necessitássemos avaliar simultaneamente o efeito de
temperatura, tempo, pH, concentração dos reagentes e presença de catalisador para o
rendimento da reação, em um determinado processo. Nestes casos é possível ocorrer
interações entre mais de dois fatores e assim um planejamento fatorial deve ser usado.
Todas as combinações possíveis dos níveis dos fatores são investigadas em cada tentativa
ou réplica do experimento no Planejamento Fatorial, assegurando que as possíveis
interações sejam identificadas. A análise e solução dos problemas por meio de
planejamento fatorial envolvem as etapas descritas na Figura 6.6. Conclui-se a análise a
partir da magnitude dos efeitos dos fatores e interações estudados.

Planejamento
Fatorial
Número de fatores Análise
Número de Níveis
Valores dos níveis

Ensaios Respostas
Procedimentos Propriedades
Número de ensaios Identificação de influência

Figura 6.6. Etapas em uma análise por meio de planejamento de experimentos

O efeito de um fator é definido com a variação na resposta produzida pela mudança


do nível do fator. Em um planejamento fatorial nk, n = níveis dos fatores e k = número de
fatores. Os planejamentos fatoriais em 2 níveis são úteis na etapa inicial de um trabalho em
que muitos fatores são estudados e, portanto, são mais comumente empregados.

Exemplificando, para estudar o efeito da temperatura no rendimento da reação em 2


níveis – 40 e 60 ºC – temos: k = 1 (temperatura) e n = 2. Adicionalmente, podemos optar
por realizar replicatas (r) em cada nível ensaiado para estimar a variância dos resultados.
No exemplo, vamos estudar cada nível em duplicata (ou 1 replicata) com r = 2. O número
de ensaios que devemos executar será r.nk = 4 ensaios.

A Figura 6.7 apresenta o resultado dos ensaios em cada temperatura. O resultado


médio para o nível em temperatura alta ( y + ) foi 90 % e para o nível em temperatura baixa
( y − ) foi 59 %.

84
95
y+
85

Rendimento (%)
75

65
y−
55

45
30 40 50 60 70
Temperatura (ºC)

Figura 6.7. Evolução do rendimento da reação em função da temperatura em 2 níveis.

O efeito no rendimento devido ao aumento da temperatura é calculado pela


expressão:
Efeito = y+ − y−

empregando os resultados do exemplo:

R = 90 − 59 = 31

Conclusão: o aumento da temperatura aos níveis estudados proporciona um aumento de


31 % no rendimento.

Planejamento Fatorial 22

Considere como objetivo avaliar os efeitos da temperatura e mudança do catalisador


no rendimento da reação em dois níveis com 1 replicata.

n = 2 (+ e -)
k = 2 (Catalisador e Temperatura)
r = 2 (1 replicata)

No planejamento fatorial temos: 2.22 = 8 ensaios. A notação do planejamento é dada


na Tabela 6.1 com os fatores e seus níveis. A Tabela 6.2 apresenta os resultados dos
experimentos.

85
Tabela 6.1. Fatores e níveis avaliados no planejamento 22.
Fatores (-) (+)
T - Temperatura (ºC) 40 60
C - Catalisador (tipo) A B

Tabela 6.2. Resultados dos experimentos obtidos no planejamento fatorial 2 2.


Experimento T C Rendimento (%) Média
1 - - 57 61 59
2 + - 92 88 90
3 - + 55 53 54
4 + + 66 70 68

A matriz com os coeficientes de contrastes para o cálculo do efeito fatorial está na


Tabela 6.3. Além do cálculo dos efeitos dos fatores principais, o efeito da interação quando
se altera catalisador simultaneamente à temperatura (TC) é estimado multiplicando os
sinais da coluna T com a coluna C. A média dos experimentos é calculada através da
coluna I com sinais +. Cada tratamento é denominado por convenção. Em t, temos apenas T
no nível alto (+), assim como em c temos C em nível alto. Em tc todos os fatores principais
estão em nível alto. Em (1) todos os fatores principais estão em nível baixo.

Tabela 6.3. Coeficiente de contrastes para cálculo dos efeitos no planejamento fatorial 22.
Efeito fatorial
Experimento I T C TC Rendimento (%) Média
(1) + - - + 57 61 59
t + + - - 92 88 90
c + - + - 55 53 54
tc + + + + 66 70 68

Cálculo dos efeitos:

T = yT + − yT −

t + tc c + (1)
T= −
2 2

86
90 + 68 59 + 54
T= − = 22,5
2 2

C = yC + − y C −

c + tc t + (1)
C= −
2 2

59 + 90 54 + 68
C= − = −13,5
2 2

(1) + tc t + c
TC = −
2 2

59 + 68 90 + 54
TC = − = −8,5
2 2

59 + 68 + 90 + 54
I= = 67,7
4

Conclusão: O aumento da temperatura provoca um aumento de 22,5 % no rendimento da


reação. A troca do catalisador A pelo catalisador B diminui o rendimento da reação em
13,5 %. Além disso, nota-se um efeito negativo para o rendimento quando se altera o
catalisador simultaneamente com a temperatura, visto que a interação TC foi de – 8,5 %.

A avaliação dos contrastes provocados pela mudança de nível dos fatores na matriz
de experimentos planejada pode ser verificada por meio das representações geométricas da
Figura 6.8.

A interação entre a temperatura e o catalisador está ilustrada na Figura 6.9. Nota-se


que o aumento da temperatura com o catalisador A provoca um aumento mais pronunciado
no rendimento que o aumento da temperatura com o catalisador B. Caso a interação entre a
temperatura e o catalisador não fosse relevante, esperaríamos linhas paralelas (linear A e B)
unindo os pontos em diferentes temperaturas.

87
+
90 68 90 68
t tc t tc

-13,5 % +
T 22,5 % -

(1) c (1) c
59 54 59 C 54
-

90 68
t tc
-8,5 %
- +
T

(1) c
59 C 54

Figura 6.8. Interpretação geométrica dos efeitos no planejamento 2 2.

100

90
Rendimento (%)

80

70

60

50

40
35 40 45 50 55 60 65
Tem peratura (ºC)

A B Linear (B) Linear (A)

Figura 6.9. Avaliação de interação dos fatores no planejamento 22.

88
Embora tivéssemos calculado os efeitos, a rigor não podemos ainda concluir que
estes são de fato significativos para o processo. Lembre-se que todo processo de medida
tem embutido um erro aleatório inerente à precisão do procedimento experimental
empregado. Assim, para estabelecer a relevância dos efeitos, precisamos nos certificar que
a magnitude do erro experimental não é maior que o próprio efeito calculado.

O erro experimental é determinado a partir do cálculo da variância dada pela


expressão:

S =
2  ( xi − x ) 2

Para estimar o erro experimental necessitamos calcular a variância agrupada pelos


2
experimentos ( S p ) conforme equação:

( 1 S12 +  2 S 22 +  3 S 32 + ... +  m S m2 )
=
2
Sp
( 1 +  2 +  3 + ... +  m )

Tomando o exemplo apresentado no Planejamento Fatorial 22:

Experimento Rendimentos (%) Média S2


(1) 57 61 59 8
t 92 88 90 8
c 55 53 54 2
tc 66 70 68 8

Calculando a variância agrupada:

8 1 + 8 1 + 2 1 + 8 1
Sp = = 6,5
2

1+1+1+1

O erro padrão experimental do processo é determinado pela raiz quadrada da


variância agrupada:

S p (efeito) = S p2 = 2,5

Cada efeito calculado é a diferença entre a média dos valores das respostas no nível
alto e no nível baixo.

Efeito = R+ − R−

89
Para calcular a variância de cada efeito, aplicamos o conceito relativo à propriedade
matemática da variância (pág. 9):

V ( Efeito) = V ( R+ − R− ) = V ( R+ ) + V ( R− )

Podemos estabelecer por aproximação que a variância dos níveis é a mesma.


Realizamos 4 ensaios em cada nível. Desta forma, temos:

S p2
V ( R+ ) = V ( R− ) =
4

O erro de cada efeito é assim calculado:

 S p2   S p2  S p2 6,5
V ( Efeito) =   +   = = = 3,25
 4   4  2 2
   

Erro = V ( Efeito) = 1,8

O erro calculado é menor que todos os efeitos e interações determinados. Assim,


podemos concluir que todos estes são significativos e devem ser considerados na
otimização do processo. O erro da média experimental é a metade do erro dos efeitos, pois
os experimentos são realizados em dois níveis. O resultado do planejamento fatorial
determinado está sumarizado a seguir:

(Estimativa ± erro padrão)


Média 67,75 ± 0,9

Fatores Principais T 22,5 ± 1,8


C - 13,5 ± 1,8

Interação TC - 8,5 ± 1,8

O resultado do planejamento fatorial leva a concluir que o maior rendimento é


alcançado elevando-se a temperatura e mantendo o catalisador A. Possivelmente, os valores
encontrados não serão ainda aqueles que proporcionam o melhor resultado em termos de
rendimento da reação, mas indicam certamente em que posição devemos definir novos
experimentos na superfície de análise para alcançá-lo. A otimização do processo a partir
dos experimentos pode envolver consecutivos passos que definimos como Operação
Evolucionária (EVOP – Evolutionary Operation). A Figura 6.10 apresenta a EVOP de um
processo baseada em um planejamento fatorial 22.

90
Figura 6.10. Operação Evolucionária com um planejamento fatorial 22.

Exercício 6.1. No processo de fabricação de gasolina através do craqueamento catalítico


de petróleo, duas variáveis estão sendo estudadas por um engenheiro químico para avaliar
efeitos no rendimento e teor de olefinas (instaurados) do produto. As variáveis temperatura
e tempo de contato com o catalisador no reator foram estudadas em um planejamento
fatorial tipo 22. Os resultados estão demonstrados nas tabelas a seguir.

Fatores
Níveis Temperatura (ºC) t (s)
+ 545 2,0
- 538 1,5

I T t Tt Rendimento (%) Olefinas (%)


(1) + - - + 61 64 18,0 18,3
T + + - - 76 76 19,5 19,9
t + - + - 66 65 32,0 32,5
Tt + + + + 80 82 35,0 34,8

Determinar o efeito de cada fator com suas possíveis interações nas respostas dos testes.

Resposta: T tem maior efeito para o rendimento e t para o aumento de olefinas. Como a
concentração de olefinas é indesejável no produto, recomenda-se empregar T alta e t
baixo.

91
Exercício 6.2. A temperatura e o pH foram estudados em um planejamento fatorial 22 para
avaliar o efeito no rendimento de uma reação. Os resultados estão apresentados no gráfico
abaixo. A partir deste, responda:
a) Em qual temperatura a modificação do pH passa a ser significativa ao processo?
Justifique a resposta.
b) Aponte uma condição experimental para aumentar o rendimento da reação em função
dos fatores estudados (pH e temperatura).

Resposta: a) Temperatura baixa. b) pH ácido e temperatura baixa

O Modelo Estatístico Fatorial

A estimativa dos efeitos dos fatores acerca do rendimento da reação pode servir para
a construção de um modelo de predição.

O modelo para um planejamento fatorial 22 é dado pela expressão:

y =  0 + 1 x1 +  2 x2 + 12 x1 x2

onde:  0 é a média dos valores populacionais; 1 ,  2 e 12 são os parâmetros


relacionados aos fatores e à interação. A partir dos valores experimentais é possível
encontrar ŷ - o valor estimado para y - conforme equação:

yˆ = b0 + b1 x1 + b2 x2 + b12 x1 x2

92
onde: b0 , b1 , b2 e b12 são os estimadores de  0 , 1 ,  2 e 12 , respectivamente, obtidos
experimentalmente pelos efeitos calculados.

No planejamento fatorial em 2 níveis, cada efeito corresponde à variação quando


passamos do nível baixo (-1) para o nível alto (+1) – Figura 6.11. No caso da temperatura,
temos o nível -1 correspondente a 40 ºC e o nível +1 a 60 ºC. Mudanças realizadas a partir
da média dos valores até o nível alto (+1 ou 60 ºC) correspondem a um aumento de metade
do efeito calculado. Isso ocorrerá também com o outro fator e a interação.

+1
90 68
t tc

-1 66,75 +1

(1) c
59 54
-1

Figura 6.11. Codificação de variáveis no planejamento fatorial 22.

Assim, podemos definir que o modelo estatístico para o planejamento 22 no


exemplo é dado por:
T C TC
yˆ = y + xT + xC + xT xC
2 2 2

que corresponde à equação:

yˆ = 67,75 + 11,25T − 6,75C − 4,25TC

Planejamento Fatorial 23

Vamos determinar os efeitos acrescentando outro fator ao problema. Agora


necessitamos estimar os resultados no rendimento da reação a partir de mudanças de
temperatura, catalisador e concentração dos reagentes no processo.

n = 2 (+ e -)
k = 3 (Catalisador, Temperatura e Concentração)
r = 2 (1 replicata)

No planejamento fatorial temos: 2.23 = 16 ensaios. Os níveis dos fatores no


planejamento são dados nas Tabelas 6.4 e 6.5.

93
Tabela 6.4. Resultados dos experimentos obtidos no planejamento fatorial 23.
Fatores (-) (+)
T - Temperatura (ºC) 40 60
C - Catalisador (tipo) A B
M - Concentração (mol.L-1) 1,0 1,5

Tabela 6.5. Fatores e níveis avaliados no planejamento 23.


Experimento T C M Rendimento (%) Média
1 - - - 56 52 54,0
2 + - - 85 88 86,5
3 - + - 49 47 48,0
4 + + - 64 62 63,0
5 - - + 65 61 63,0
6 + - + 92 95 93,5
7 - + + 57 60 58,5
8 + + + 70 74 72,0

A matriz com os coeficientes de contrastes para o cálculo do efeito fatorial está na


Tabela 6.6. A representação geométrica da matriz experimental está na Figura 6.12.

Tabela 6.6. Coeficientes de contrastes para cálculo dos efeitos no planejamento fatorial 23.
I T C M TC TM CM TCM Resposta
(1) + - - - + + + - 54,0
t + + - - - - + + 86,5
c + - + - - + - + 48,0
m + - - + + - - + 63,0
tc + + + - + - - - 63,0
tm + + - + - + - - 93,5
cm + - + + - - + - 58,5
tcm + + + + + + + + 72,0

94
Figura 6.12. Representação do planejamento fatorial 23.

À medida que a matriz aumenta com a inserção de novos fatores, torna-se mais
conveniente calcular os efeitos através de um método matricial. Considerando que podemos
associar a resposta a uma tabela de coeficientes de contrastes de sinais, teremos o seguinte
arranjo:

I T C M TC TM CM TCM R
+ − − − + + + − 54,0
+ + − − − − + +  86,5
  
+ − + − − + − + 48,0
   
+ − − + + − − + 63,0
X = y= 
+ + + − + − − − 63,0
   
+ + − + − + − − 93,5 
+ − + + − − + − 58,5
   
+ + + + + + + +  72,0

Para calcular os efeitos por meio deste algoritmo necessitamos incluir a unidade na
coluna específica com os sinais. Por exemplo, para calcular o efeito de T multiplicamos a
matriz transposta de T com y:

95
T
−  − 1
+   1 
   
−  − 1
   
− −1
XT =   =  
+   1 
   
+   1 
−  − 1
   
+   1 

1 t
T= XT y
4

54,0
86,5
 
48,0
 
63,0
T = − 1 1 − 1 − 1 1 1 − 1 1 
1
= 22,88
4 63,0
 
93,5 
58,5
 
72,0

Calculando todos os efeitos e interações pelo método:

 I   67,31 
 T   22,88 
   
 C  − 13,88
   
 M  =  8,88 
 TC   − 8,63 
   
 TM   − 0,88 
 CM   0,88 
   
TCM   0,13 

O erro dos efeitos é calculado de acordo com o método apresentado anteriormente


com o fatorial 22:

96
Tratamento Rendimentos (%) Média S2
(1) 56 52 54,0 8,0
t 85 88 86,5 4,5
c 49 47 48,0 2,0
m 64 62 63,0 2,0
tc 65 61 63,0 8,0
tm 92 95 93,5 4,5
cm 57 60 58,5 4,5
tcm 70 74 72,0 8,0
Σ= 41,5

41,5
S p2 = = 5,2
8
S p = 2,28
5,2
V ( Efeito) = = 1,3
4
Erro = 1,30 = 1,1

(Estimativa ± erro padrão)


Média 67,3 ± 0,55
Fatores Principais T 22,9 ± 1,1
C -13,9 ± 1,1
M 8,9 ± 1,1

Interações TC -8,6 ± 1,1


TM -0,9 ± 1,1
CM 0,9 ± 1,1
TCM 0,1 ± 1,1

Conclusão: os efeitos dos fatores principais (T, C e M) mostram-se significativos. O


aumento de temperatura aumenta o rendimento da reação em 23 %. A troca de catalisador
A por B diminui o rendimento em 14 %. O aumento da concentração aumenta o rendimento
em 9 %. Apenas o efeito de interação entre a temperatura e o catalisador é significativo. A
concentração não demonstra interação com os outros fatores. A representação geométrica
dos efeitos do planejamento fatorial 23 está na Figura 6.13.

97
Figura 6.8. Interpretação geométrica dos efeitos no planejamento 23.

O modelo estatístico para o planejamento fatorial 23 tem o seguinte formato:

yˆ = b0 + b1 x1 + b2 x2 + b3 x3 + b12 x1 x2 + b13 x1 x3 + b23 x2 x3 + b13 x1 x3 + b123 x1 x2 x3

Assim como determinado com o planejamento fatorial 22, o coeficiente b0


corresponde à média de todos os experimentos e os demais coeficientes da equação às
respectivas metades dos efeitos calculados que se demonstraram significativos:

yˆ = 67,3 + 11,14T − 6,95C + 4,44M − 4,31TC

Exercício 6.3. Em um estudo das propriedades eletroquímicas do azul de metileno foram


investigados 3 fatores: concentração, pH e o tipo de sílica. O método escolhido foi
voltametria cíclica. Com o objetivo de estudar as condições experimentais que produzem a
melhor reversibilidade de um processo redox, ou seja, que minimiza o valor da diferença de
voltagem (∆E), empregou-se um planejamento fatorial 23 e obteve-se os seguintes
resultados:

98
Fatores
Níveis Concentração Sílica
pH
(mol/L) modificada
- 0,1 4 STM
+ 0,5 7 STPM

Experimento C P S ∆E
1 - - - 106
2 + - - 98
3 - + - 139
4 + + - 141
5 - - + 137
6 + - + 123
7 - + + 119
8 + + + 103

Calcule os efeitos e indique a condição experimental para otimizar a resposta.

Resposta: O efeito mais significativo é a interação entre o pH e a sílica modificada. A fim


de otimizar o processo, devem-se planejar novos experimentos mantendo o pH maior e
empregando a sílica STPM.

Exercício 6.4. Foram estudados em um planejamento 23 os efeitos de 3 fatores (tempo,


temperatura de hidrólise e tipo de catalisador) no grau de substituição de uma resina
clorometilada com o objetivo de maximizar a resposta - quanto maior o grau, melhor.
Dados dos experimentos e efeitos calculados são apresentados a seguir.

Fatores
1 2 3
Níveis
Tempo de hidrólise Temperatura Catalisador
+ 48 h 160 oC AP
- 24 h 130 oC TFA

1 2 3 12 13 23 123
0,040 0,015 -0,004 -0,005 0,005 0,010 -0,015

99
Os ensaios foram realizados em duplicata. Assim, pôde-se determinar o erro experimental
para os efeitos em ±1,53 × 10-2. Responda:

a) Em termos de otimização da resposta, seria adequado manter o tempo de hidrólise alto?


b) Há interação entre os fatores estudados? Identificar em caso afirmativo.
c) Torna-se válido realizar o experimento em temperatura alta? Justifique.

Resposta: a) sim. b) não há interação. c) não é válido aumentar a temperatura.

Planejamento Fatorial 24

Vamos inserir outro fator ao planejamento. Necessitamos agora estimar os


resultados no rendimento da reação a partir de mudanças de 4 fatores: temperatura,
catalisador, concentração dos reagentes e pH. À medida que vamos inserindo fatores torna-
se mais oneroso o trabalho experimental e nem sempre é possível realizar o trabalho com
replicatas.

n = 2 (+ e -)
k = 4 (Catalisador, Temperatura, Concentração e pH)
r = 1 (ensaio único)

No planejamento fatorial temos: 1.24 = 16 ensaios. Os níveis dos fatores no


planejamento são dados nas Tabelas 6.7 e 6.8. A Figura 6.12

Tabela 6.7. Fatores e níveis avaliados no planejamento 24.


Fatores (-) (+)
T - Temperatura (ºC) 40 60
C - Catalisador (tipo) A B
M - Concentração (mol.L-1) 1,0 1,5
P - pH 4 7

100
Figura 6.12. Representação do planejamento fatorial 24.

Tabela 6.8. Resultados dos experimentos obtidos no planejamento fatorial 2 4.


Experimento T C M P Resultado
1 - - - - 54
2 + - - - 85
3 - + - - 49
4 + + - - 62
5 - - + - 64
6 + - + - 94
7 - + + - 56
8 + + + - 70
9 - - - + 52
10 + - - + 87
11 - + - + 49
12 + + - + 64
13 - - + + 64
14 + - + + 94
15 - + + + 58
16 + + + + 73

101
Tabela 6.9. Coeficientes de contrastes para cálculo dos efeitos no planejamento fatorial 2 4.
I T C M P TC TM TP CM CP MP TCM TCP TMP CMP TCMP Resposta

(1) + - - - - + + + + + + - - - - + 54
t + + - - - - - - + + + + + + - - 85
c + - + - - - + + - - + + + - + - 49
tc + + + - - + - - - - + - - + + + 62
m + - - + - + - + - + - + - + + - 64
tm + + - + - - + - - + - - + - + + 94
cm + - + + - - - + + - - - + + - + 56
tcm + + + + - + + - + - - + - - - - 70
p + - - - + + + - + - - - + + + - 52
tp + + - - + - - + + - - + - - + + 87
cp + - + - + - + - - + - + - + - + 79
tcp + + + - + + - + - + - - + - - - 64
mp + - - + + + - - - - + + + - - + 64
tmp + + - + + - + + - - + - - + - - 94
cmp + - + + + - - - + + + - - - + - 58
tcmp + + + + + + + + + + + + + + + + 73

102
Cálculo dos efeitos pelo método matricial está demonstrado a seguir:
 I   67,2 
 T   22,9 
   
 C  − 14,1
   
 M   8,9 
 P   0,9 
   
 TC   − 8,6 
 TM   − 0,6 
   
 TP   0,9 
 CM  =  − 0,6 
   
 CP   0,9 
   
 MP   0,4 
 TCM   0,9 
   
 TCP   − 0,1 
 TMP   − 0,6 
   
 CMP   0,4 
TCMP   0,4 
   

O experimento foi realizado em uma única vez, sem replicata, e assim não temos
como estimar o erro dos efeitos através do cálculo da variância agrupada. No entanto,
podemos dispor os resultados em um gráfico de probabilidade normal para realizar esta
análise. Neste procedimento devemos colocar os resultados dos efeitos em uma região
de probabilidade acumulada na distribuição normal.

Como exemplo, vamos considerar dispor em um gráfico normal seis pontos


experimentais. Cada ponto deve ocupar sob a distribuição normal de valor unitário uma
região de área equivalente aos demais. Assim, dividindo área em seis partes iguais e
dispondo os pontos nela vamos ter a representação da Figura 6.13a. Destarte, se
compararmos os valores dos efeitos dos seis pontos com a probabilidade acumulada na
distribuição normal de cada um ocorrer, vamos ter o resultado representado na figura
6.13b.
Ax1 = Ax2 =...= Ax6

a)
x1 x2 x3 x4 x5 x6

b)

Figura 6.13. a) Disposições de 6 dados em regiões equivalentes em área na distribuição


normal e b) comparação dos pontos na distribuição normal acumulada com os efeitos
calculados.

Exemplificando o procedimento a partir dos dados do planejamento fatorial 2 4:


para os 15 efeitos calculados, vamos definir 15 regiões no gráfico de probabilidade.
Cada região terá 1/15 da distribuição, ou seja, 6,67 % da área. O efeito calculado vai se
posicionar ao centro do segmento próximo ao eixo. Colocam-se os efeitos em ordem
crescente e nomeiam-se os pontos de 1 a 15. Para cada ponto devemos estabelecer a
probabilidade da área acumulada na distribuição normal de acordo com a estatística z a
partir do ponto médio. A Tabela 6.10 apresenta o resultado deste tratamento.

Para construir o gráfico plota-se em cada ponto o valor encontrado de


probabilidade normal acumulada na ordenada (y) e o valor do efeito calculado na
abscissa (x). No exemplo do fatorial 24 vamos obter o gráfico da Figura 6.14.

104
Tabela 6.10. Determinação da probabilidade normal acumulada para efeito do
planejamento fatorial 24.
Fator- Região probabilidade Ponto
Número Efeito z
interação acumulada médio
1 C -14,12 0 - 0,067 0,033 -1,83
2 TC -8,62 0,067 - 0,133 0,100 -1,28
3 TMP -0,625 0,133 - 0,200 0,167 -0,97
4 TM -0,625 0,200 - 0,267 0,233 -0,73
5 CM -0,625 0,267 - 0,333 0,300 -0,52
6 TCP -0,125 0,333 - 0,400 0,367 -0,34
7 TCMP 0,375 0,400 - 0,467 0,433 -0,17
8 MP 0,375 0,467 - 0,533 0,500 0,00
9 CMP 0,375 0,533 - 0,600 0,567 0,17
10 TP 0,875 0,600 - 0,667 0,633 0,34
11 TCM 0,875 0,667 - 0,733 0,700 0,52
12 P 0,875 0,733 - 0,800 0,767 0,73
13 CP 0,875 0,800 - 0,867 0,833 0,97
14 M 8,88 0,867 - 0,933 0,900 1,28
15 T 22,9 0,933 - 1,000 0,967 1,83

2,5
2,0
T
1,5
M
1,0
0,5
0,0
Z

-0,5
-1,0
TC
-1,5
C
-2,0
-2,5
-20 -10 0 10 20 30
Efeito

Figura 6.14. Gráfico de probabilidade normal dos efeitos no planejamento 24.

105
Nota-se que boa parte dos pontos correspondente aos efeitos está próxima a 0 e
sobre estes pontos pode-se traçar uma reta. Tais pontos não têm significado físico e são
irrelevantes ao processo. Outros pontos afastados da reta apresentam significância e
foram identificados no gráfico. Quanto mais afastados da reta podemos mais
significativos são os efeitos e por isso devem servir para a otimização do processo.

Conclusão: A mudança do pH não tem significado para o rendimento.

Exercício 6.5. Deseja-se otimizar a resolução de um ensaio por HPLC para um


determinado componente presente na amostra. Foram estudados em um planejamento
fatorial completo 24 os fatores apresentados abaixo:

- 1. volume de amostra injetada


- 2. pressão do gás na coluna
- 3. temperatura do forno
- 4. tipo de gás de arraste

Os efeitos calculados são apresentados na tabela a seguir

1 2 3 4 12 13 14 23
-5,3 -1,7 0,3 -0,2 0,4 2,5 0,3 0,3
24 34 123 124 134 234 1234
0,2 0,1 0 0 0 0 0

a) De acordo com os resultados, qual seria a forma mais efetiva para otimizar a
resolução por meio da alteração dos fatores?
b) Construir um gráfico de probabilidade normal a partir dos resultados.

Resposta: a) diminuir o volume da amostra.

Exercício 6.6. Para estudar a otimização de um método de analise de íons Ca 2+ por


espectrometria de absorção atômica com atomização eletrotérmica, foi utilizado um
planejamento fatorial completo. Para tal, foram selecionados 3 fatores em 2 níveis, que
estão apresentados na tabela abaixo. Responda a seguir:

Fatores
A B C
Níveis Temperatura de Temperatura de Modificador
pirólise atomização Químico
+ 1400 oC 2500 oC presente
- 1100 oC 2200 oC ausente

106
a) O gráfico normal dos efeitos calculados para esse conjunto de experimentos é
apresentado abaixo. Aponte o(s) fator(es) que são relevantes na otimização do
sistema.

b) Identifique se há alguma interação significativa entre os fatores estudados.

2,0

1,5 A
1,0
C
0,5
ABC
0,0 BC
z

-0,5 AC
AB
-1,0
-1,5 B
-2,0
-6 -4 -2 0 2 4 6
Efeito

6.2. Planejamento Fatorial Fracionário


Casos em que muitos fatores necessitam ser estudados simultaneamente não são
raros. No exemplo discutido até aqui, se fossemos estudar mais 3 fatores em dois níveis,
sem replicatas seria necessário realizar 27 = 128 ensaios! Provavelmente, um trabalho
experimental desta monta seria muito oneroso e difícil realizar.

No entanto, há maneiras de realizar apenas uma fração do planejamento fatorial


definindo por meio de tratamentos estatísticos os experimentos e mantendo assim a
qualidade do estudo. No planejamento fatorial fracionário os contrastes calculados são
muito próximos aos efeitos correspondentes ao planejamento fatorial completo quando
analisados.

Vamos avaliar os efeitos da temperatura, mudança do catalisador, concentração e


pH no rendimento da reação através do planejamento fatorial fracionário, tal como
abordamos no planejamento fatorial 24. Entretanto, vamos supor que ao invés de
realizar 16 ensaios tivéssemos a possibilidade de realizar apenas 8, ou seja, a metade ou
meia fração do planejamento 24. Vamos estabelecer agora um planejamento fatorial
fracionário tipo 24-1.

n = 2 (+ e -)
k = 4 (Catalisador, Temperatura, Concentração e pH)
r = 1 (ensaio único)

107
Os níveis dos fatores no planejamento são dados nas Tabelas 6.7. No
24
planejamento fracionário a meia fração do planejamento completo: = 2 4.2 −1 = 2 3 = 8
2
ensaios.

Para definir os experimentos a realizar a partir do fatorial completo


estabelecemos um gerador para a matriz de experimentos. Para a meia fração o gerador
será

I = TCMP

Os coeficientes de contrastes da coluna I são sempre positivos. Associamos a


estes os experimentos da coluna TCMP que possuem sinais positivos. A Tabela 6.11
apresenta a associação dos experimentos pelo gerador. A Figura 6.15 demonstra a
representação geométrica dos experimentos na matriz.

Figura 6.15 Representação do planejamento fatorial 24-1.

Ao montar a tabela dos coeficientes de contrastes de sinais notar-se-á pares


associados de colunas com a mesma identidade, conforme apresentado na Tabela 6.12.
Para calcular os contrastes da meia fração (l) definimos os experimentos da Tabela 6.11
e os pares associados, conforme disposição da Tabela 6.13.

108
Tabela 6.11. Experimentos no planejamento fatorial fracionário 24-1 definidos pelo
gerador I = TCMP (em destaque).
Experimento I T C M P TCMP
1 + - - - - +
2 + + - - - -
3 + - + - - -
4 + + + - - +
5 + - - + - -
6 + + - + - +
7 + - + + - +
8 + + + + - -
9 + - - - + -
10 + + - - + +
11 + - + - + +
12 + + + - + -
13 + - - + + +
14 + + - + + -
15 + - + + + -
16 + + + + + +

Tabela 6.12. Pares associados obtidos pelos coeficientes de contrastes da meia fração do
planejamento fatorial.
Relação entre colunas de sinais Contrastes da meia fração do
planejamento 24-1
T = CMP l T → T + CMP
C = TMP l C → C + TMP
M = TCP l M → M + CMP
P = TCM l P → P + TCM
TC = MP l TC = l MP → TC + MP
TM = CP l TM = l CP → TM + CP
TP = CM l TP = l CM → TP + CM
I = TCMP l I → I + ½(TCMP)

109
Tabela 6.13. Coeficientes para cálculo dos contrastes dos pares associados no
planejamento fatorial 24-1.
I T C M P TC TM TP
Resposta
TCMP CMP TMP TCP TCM MP CP CM
(1) + - - - - + + + 54
tc + + + - - + - - 62
tm + + - + - - + - 94
cm + - + + - - - + 56
tp + + - - + - - + 87
cp + - + - + - + - 79
mp + - - + + + - - 64
tcmp + + + + + + + + 73

Calculando os contrastes do planejamento fracionário vamos obter os resultados


colocados na Tabela 6.14. Os resultados do fatorial completo estão colocados também
na mesma tabela para comparação:

Tabela 6.14. Comparação entre os contrastes dos fatores obtidos pelos


planejamentos fatoriais completos e fracionários.
24-1 24
T 23,3 22,9
C -14,8 -14,1
M 8,8 8,9
P 1,8 0,9
TC -8,3 -8,6
TM 0,3 -0,6
TP 0,3 0,9
CM 0,3 -0,6
CP 0,3 0,9
MP -8,3 0,4
TCM 1,8 0,9
TCP 8,8 -0,1
TMP -14,8 -0,6
CMP 23,3 0,4
TCMP 67,4 0,4

Nota-se que, com exceção aos contrastes MP, TCP, TMP e TCMP, os resultados
encontrados são aproximados em termos absolutos. Adicionalmente, se considerarmos
que l P ≈ 0, os contrastes que contém P também são insignificantes. Assim podemos
resumir a conclusão aos resultados apresentados na Tabela 6.15.

110
Tabela 6.15. Comparação entre os contrastes significativos dos fatores obtidos pelos
planejamentos fatoriais completos e fracionários.
Contraste Completo 24 Fracionário (l) 24-1
T 23 23
C -14 -15
M 9 9
TC -9 -8

O planejamento fatorial fracionário pode resultar valores muito próximos ao


fatorial completo, contemplando os objetivos relacionados à otimização do trabalho
experimental. Entretanto, como vimos no exemplo empregado, o uso bom senso é
imprescindível. Portanto, devemos em um trabalho conclusivo executar fatoriais
completos. Os fatoriais fracionários são mais adequados para trabalhos exploratórios na
primeira etapa de desenvolvimento.

Problemas.

6.1. Os dados abaixo foram obtidos num estudo da influência de alguns fatores no tempo
da pega inicial do gesso, isto é, o tempo em que o gesso começa a endurecer, depois que
o pó é misturado com água. Os ensaios foram realizados em duplicata. Determine todos
os efeitos e interprete os resultados.

Fator 1: Granulometria: 100-150 mesh (-), 150-200 mesh (+)


Fator 2: Água residual: 6,6 % (-), 7,5 % (+)
Resposta: Tempo de pega inicial (min)

Ensaio Fator 1 Fator 2 Resposta


1 - - 12,33 13,00
2 + - 10,52 10,57
3 - + 10,33 9,75
4 + + 9,00 8,92

6.2. Na preparação de suportes para catalisadores é interessante controlar o tamanho dos


poros do suporte, para uso em aplicações específicas. Na preparação de alumina com
essa finalidade, o efeito da temperatura e da concentração dos reagentes no tamanho de
poro, para diferentes tamanhos de poros foram estudados. Para poros com diâmetros
entre 103 e 104 nm eles empregaram um planejamento fatorial 2 2 e obtiveram os
seguintes resultados

111
Ensaio T (ºC) C (mol/L) Volume, (cm3/g)
1 50 0,25 0,285 0,297
2 60 0,25 0,313 -
3 50 0,50 0,168 0,161
4 60 0,50 0,223 0,229

Apesar de o planejamento prever a realização de duplicatas em todos os ensaios,


um dos resultados está faltando. Mesmo assim, calcule os valores de todos os efeitos.

6.3. Dados obtidos por um pesquisador em uma série de experimentos de síntese de


polipirrol numa matriz de EPDM foram estudados. Três fatores foram considerados: o
tempo da reação (t), a concentração de oxidante (C), e o tamanho da partícula (P). A
resposta observada foi o rendimento da reação. Calcule o valor dos efeitos e verifique
qual variável tem maior influência nos rendimentos.

t C P Rendimento (%)
- - - 4,39 4,73
+ - - 6,21 5,75
- + - 14,51 13,45
+ + - 19,57 21,11
- - + 2,09 1,93
+ - + 3,15 3,39
- + + 11,77 12,69
+ + + 19,40 17,98

6.4 Os resultados abaixo foram obtidos numa investigação cujo objetivo era a
otimização do rendimento de uma reação orgânica. Que conclusões você pode tirar
desses resultados?

Fatores - +
1 (Temperatura) Ambiente Refluxo
2 (Base) K2CO3/NaOH K2CO3
3 (Solvente) CH2Cl2 CH3CN
4 (Catalisador) Nenhum TEBA

112
Ensaio 1 2 3 4 Rendimento(%)
1 - - - - 0
2 + - - + 70
3 - + - + 65
4 + + - - 0
5 - - + + 100
6 + - + - 85
7 - + + - 50
8 + + + + 95

6.5. A determinação de traços de Mo em plantas é realizada por meio da ação catalítica


da espécie Mo4+ sobre a oxidação do íon I- pelo peróxido de hidrogênio. A matriz de
planejamento dos dezesseis ensaios está demonstrada na tabela a seguir. Através da
análise dos experimentos, determine o efeito dos fatores no sinal analítico comparando
os resultados de um planejamento completo com a respectiva meia fração.

Ensaio A B C D Sinal
1 - - - - 52
2 + - - - 61
3 - + - - 124
4 + + - - 113
5 - - + - 85
6 + - + - 66
7 - + + - 185
8 + + + - 192
9 - - - + 98
10 + - - + 86
11 - + - + 201
12 + + - + 194
13 - - + + 122
14 + - + + 139
15 - + + + 289
16 + + + + 286

113
Fatores (-) (+)
A. [H2SO4] (mol/L) 0,16 0,32
B. [KI] (mol/L) 0,015 0,030
C. [H2O2] (mol/L) 0,0020 0,0040
D. Δt (s) 90 130

6.6. Estime os efeitos para o planejamento fatorial fracionário 2 5-1 conforme os dados
apresentados na tabela abaixo. Plote os efeitos em um gráfico de probabilidade normal.

A B C D E Observação
- - - - + 14,8
+ - - - - 14,5
- + - - - 18,1
+ + - - + 19,4
- - + - - 18,4
+ - + - + 15,7
- + + - + 27,3
+ + + - - 28,2
- - - + - 16,0
+ - - + + 15,1
- + - + + 18,9
+ + - + - 22,0
- - + + + 19,8
+ - + + - 18,9
- + + + - 29,9
+ + + + + 27,4

114
Apêndices

Tabela 1. Função de Distribuição Normal Reduzida.


Tabela 2. Função de Distribuição (t) de Student.
Tabela 3. Função de Distribuição 2.
Tabela 4. Valores críticos para o teste de Cochran.
Tabela 5. Valores críticos para o teste de Grubbs.
Tabela 6. Função Distribuição F .

115
Tabela 1. Função de Distribuição Normal Reduzida
Z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0 0,00000 0,00400 0,00800 0,01200 0,01600 0,01990 0,02390 0,02790 0,03190 0,03590
0,1 0,03980 0,04380 0,04780 0,05170 0,05570 0,05960 0,06360 0,06750 0,07140 0,07530
0,2 0,07930 0,08320 0,08710 0,09100 0,09480 0,09870 0,10260 0,10640 0,11030 0,11410
0,3 0,11790 0,12170 0,12550 0,12930 0,13310 0,13680 0,14060 0,14430 0,14800 0,15170
0,4 0,15540 0,15910 0,16280 0,16640 0,17000 0,17360 0,17720 0,18080 0,18440 0,18790
0,5 0,19150 0,19500 0,19850 0,20190 0,20540 0,20880 0,21230 0,21570 0,21900 0,22240
0,6 0,22570 0,22910 0,23240 0,23570 0,23890 0,24220 0,24540 0,24860 0,25170 0,25490
0,7 0,25800 0,26110 0,26420 0,26730 0,27040 0,27340 0,27640 0,27940 0,28230 0,28520
0,8 0,28810 0,29100 0,29390 0,29670 0,29950 0,30230 0,30510 0,30780 0,31060 0,31330
0,9 0,31590 0,31860 0,32120 0,32380 0,32640 0,32890 0,33150 0,33400 0,33650 0,33890
1 0,34130 0,34380 0,34610 0,34850 0,35080 0,35310 0,35540 0,35770 0,35990 0,36210
1,1 0,36430 0,36650 0,36860 0,37080 0,37290 0,37490 0,37700 0,37900 0,38100 0,38300
1,2 0,38490 0,38690 0,38880 0,39070 0,39250 0,39440 0,39620 0,39800 0,39970 0,40150
1,3 0,40320 0,40490 0,40660 0,40820 0,40990 0,41150 0,41310 0,41470 0,41620 0,41770
1,4 0,41920 0,42070 0,42220 0,42360 0,42510 0,42650 0,42790 0,42920 0,43060 0,43190
1,5 0,43320 0,43450 0,43570 0,43700 0,43820 0,43940 0,44060 0,44180 0,44290 0,44410
1,6 0,44520 0,44630 0,44740 0,44840 0,44950 0,45050 0,45150 0,45250 0,45350 0,45450
1,7 0,45540 0,45640 0,45730 0,45820 0,45910 0,45990 0,46080 0,46160 0,46250 0,46330
1,8 0,46410 0,46490 0,46560 0,46640 0,46710 0,46780 0,46860 0,46930 0,46990 0,47060
1,9 0,47130 0,47190 0,47260 0,47320 0,47380 0,47440 0,47500 0,47560 0,47610 0,47670
2 0,47720 0,47780 0,47830 0,47880 0,47930 0,47980 0,48030 0,48080 0,48120 0,48170
2,1 0,48210 0,48260 0,48300 0,48340 0,48380 0,48420 0,48460 0,48500 0,48540 0,48570
2,2 0,48610 0,48640 0,48680 0,48710 0,48750 0,48780 0,48810 0,48840 0,48870 0,48900
2,3 0,48930 0,48960 0,48980 0,49010 0,49040 0,49060 0,49090 0,49110 0,49130 0,49160
2,4 0,49180 0,49200 0,49220 0,49250 0,49270 0,49290 0,49310 0,49320 0,49340 0,49360
2,5 0,49380 0,49400 0,49410 0,49430 0,49450 0,49460 0,49480 0,49490 0,49510 0,49520
2,6 0,49530 0,49550 0,49560 0,49570 0,49590 0,49600 0,49610 0,49620 0,49630 0,49640
2,7 0,49650 0,49660 0,49670 0,49680 0,49690 0,49700 0,49710 0,49720 0,49730 0,49740
2,8 0,49740 0,49750 0,49760 0,49770 0,49770 0,49780 0,49790 0,49790 0,49800 0,49810
2,9 0,49810 0,49820 0,49820 0,49830 0,49840 0,49840 0,49850 0,49850 0,49860 0,49860
3 0,49865 0,49869 0,49874 0,49878 0,49882 0,49886 0,49889 0,49893 0,49897 0,49900
3,1 0,49903 0,49906 0,49910 0,49913 0,49916 0,49918 0,49921 0,49924 0,49926 0,49929
3,2 0,49931 0,49934 0,49936 0,49938 0,49940 0,49942 0,49944 0,49946 0,49948 0,49950
3,3 0,49952 0,49953 0,49955 0,49957 0,49958 0,49960 0,49961 0,49962 0,49964 0,49965
3,4 0,49966 0,49968 0,49969 0,49970 0,49971 0,49972 0,49973 0,49974 0,49975 0,49976
3,5 0,49977 0,49978 0,49978 0,49979 0,49980 0,49981 0,49982 0,49982 0,49983 0,49984
3,6 0,49984 0,49985 0,49985 0,49986 0,49986 0,49987 0,49987 0,49988 0,49988 0,49989
3,7 0,49989 0,49990 0,49990 0,49990 0,49991 0,49991 0,49992 0,49992 0,49992 0,49993
3,8 0,49993 0,49993 0,49993 0,49994 0,49994 0,49994 0,49994 0,49995 0,49995 0,49995
3,9 0,49995 0,49995 0,49996 0,49996 0,49996 0,49996 0,49996 0,49996 0,49997 0,49997
4 0,49997 0,49997 0,49997 0,49997 0,49997 0,49997 0,49998 0,49998 0,49998 0,49998

116
Tabela 2. Função de Distribuição (t) de Student
Área de Probabilidade (p)
 0,2 0,4 0,6 0,8 0,90 0,95 0,98 0,99 0,998 0,999
1 0,325 0,727 1,376 3,078 6,314 12,706 31,821 63,656 318,289 636,578
2 0,289 0,617 1,061 1,886 2,920 4,303 6,965 9,925 22,328 31,600
3 0,277 0,584 0,978 1,638 2,353 3,182 4,541 5,841 10,214 12,924
4 0,271 0,569 0,941 1,533 2,132 2,776 3,747 4,604 7,173 8,610
5 0,267 0,559 0,920 1,476 2,015 2,571 3,365 4,032 5,894 6,869
6 0,265 0,553 0,906 1,440 1,943 2,447 3,143 3,707 5,208 5,959
7 0,263 0,549 0,896 1,415 1,895 2,365 2,998 3,499 4,785 5,408
8 0,262 0,546 0,889 1,397 1,860 2,306 2,896 3,355 4,501 5,041
9 0,261 0,543 0,883 1,383 1,833 2,262 2,821 3,250 4,297 4,781
10 0,260 0,542 0,879 1,372 1,812 2,228 2,764 3,169 4,144 4,587
11 0,260 0,540 0,876 1,363 1,796 2,201 2,718 3,106 4,025 4,437
12 0,259 0,539 0,873 1,356 1,782 2,179 2,681 3,055 3,930 4,318
13 0,259 0,538 0,870 1,350 1,771 2,160 2,650 3,012 3,852 4,221
14 0,258 0,537 0,868 1,345 1,761 2,145 2,624 2,977 3,787 4,140
15 0,258 0,536 0,866 1,341 1,753 2,131 2,602 2,947 3,733 4,073
16 0,258 0,535 0,865 1,337 1,746 2,120 2,583 2,921 3,686 4,015
17 0,257 0,534 0,863 1,333 1,740 2,110 2,567 2,898 3,646 3,965
18 0,257 0,534 0,862 1,330 1,734 2,101 2,552 2,878 3,610 3,922
19 0,257 0,533 0,861 1,328 1,729 2,093 2,539 2,861 3,579 3,883
20 0,257 0,533 0,860 1,325 1,725 2,086 2,528 2,845 3,552 3,850
21 0,257 0,532 0,859 1,323 1,721 2,080 2,518 2,831 3,527 3,819
22 0,256 0,532 0,858 1,321 1,717 2,074 2,508 2,819 3,505 3,792
23 0,256 0,532 0,858 1,319 1,714 2,069 2,500 2,807 3,485 3,768
24 0,256 0,531 0,857 1,318 1,711 2,064 2,492 2,797 3,467 3,745
25 0,256 0,531 0,856 1,316 1,708 2,060 2,485 2,787 3,450 3,725
26 0,256 0,531 0,856 1,315 1,706 2,056 2,479 2,779 3,435 3,707
27 0,256 0,531 0,855 1,314 1,703 2,052 2,473 2,771 3,421 3,689
28 0,256 0,530 0,855 1,313 1,701 2,048 2,467 2,763 3,408 3,674
29 0,256 0,530 0,854 1,311 1,699 2,045 2,462 2,756 3,396 3,660
30 0,256 0,530 0,854 1,310 1,697 2,042 2,457 2,750 3,385 3,646
40 0,255 0,529 0,851 1,303 1,684 2,021 2,423 2,704 3,307 3,551
50 0,255 0,528 0,849 1,299 1,676 2,009 2,403 2,678 3,261 3,496
60 0,254 0,527 0,848 1,296 1,671 2,000 2,390 2,660 3,232 3,460
70 0,254 0,527 0,847 1,294 1,667 1,994 2,381 2,648 3,211 3,435
80 0,254 0,526 0,846 1,292 1,664 1,990 2,374 2,639 3,195 3,416
90 0,254 0,526 0,846 1,291 1,662 1,987 2,368 2,632 3,183 3,402
100 0,254 0,526 0,845 1,290 1,660 1,984 2,364 2,626 3,174 3,390
120 0,254 0,526 0,845 1,289 1,658 1,980 2,358 2,617 3,160 3,373
150 0,254 0,526 0,844 1,287 1,655 1,976 2,351 2,609 3,145 3,357
 0,253 0,524 0,842 1,282 1,645 1,960 2,327 2,576 3,091 3,291

117
Tabela 3. Função de Distribuição 2.

Área de Probabilidade
 0,995 0,99 0,975 0,95 0,8 0,5 0,2 0,05 0,025 0,01 0,005
1 0,001 0,004 0,064 0,455 1,642 3,841 5,024 6,635 7,879
2 0,01 0,02 0,051 0,103 0,446 1,386 3,219 5,991 7,378 9,210 10,597
3 0,072 0,115 0,216 0,352 1,005 2,366 4,642 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,649 3,357 5,989 9,488 11,143 13,277 14,860
5 0,412 0,554 0,831 1,145 2,343 4,351 7,289 11,070 12,832 15,086 16,750
6 0,676 0,872 1,237 1,635 3,070 5,348 8,558 12,592 14,449 16,812 18,548
7 0,989 1,239 1,690 2,167 3,822 6,346 9,803 14,067 16,013 18,475 20,278
8 1,344 1,647 2,180 2,733 4,594 7,344 11,030 15,507 17,535 20,090 21,955
9 1,735 2,088 2,700 3,325 5,380 8,343 12,242 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 6,179 9,342 13,442 18,307 20,483 23,209 25,188
11 2,603 3,053 3,816 4,575 6,989 10,341 14,631 19,675 21,920 24,725 26,757
12 3,074 3,571 4,404 5,226 7,807 11,340 15,812 21,026 23,337 26,217 28,300
13 3,565 4,107 5,009 5,892 8,634 12,340 16,985 22,362 24,736 27,688 29,819
14 4,075 4,660 5,629 6,571 9,467 13,339 18,151 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 10,307 14,339 19,311 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 11,152 15,338 20,465 26,296 28,845 32,000 34,267
17 5,697 6,408 7,564 8,672 12,002 16,338 21,615 27,587 30,191 33,409 35,718
18 6,265 7,015 8,231 9,390 12,857 17,338 22,760 28,869 31,526 34,805 37,156
19 6,844 7,633 8,907 10,117 13,716 18,338 23,900 30,144 32,852 36,191 38,582
20 7,434 8,260 9,591 10,851 14,578 19,337 25,038 31,410 34,170 37,566 39,997
21 8,034 8,897 10,283 11,591 15,445 20,337 26,171 32,671 35,479 38,932 41,401
22 8,643 9,542 10,982 12,338 16,314 21,337 27,301 33,924 36,781 40,289 42,796
23 9,260 10,196 11,689 13,091 17,187 22,337 28,429 35,172 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 18,062 23,337 29,553 36,415 39,364 42,980 45,558
25 10,520 11,524 13,120 14,611 18,940 24,337 30,675 37,652 40,646 44,314 46,928
26 11,160 12,198 13,844 15,379 19,820 25,336 31,795 38,885 41,923 45,642 48,290
27 11,808 12,878 14,573 16,151 20,703 26,336 32,912 40,113 43,195 46,963 49,645
28 12,461 13,565 15,308 16,928 21,588 27,336 34,027 41,337 44,461 48,278 50,994
29 13,121 14,256 16,047 17,708 22,475 28,336 35,139 42,557 45,722 49,588 52,335
30 13,787 14,953 16,791 18,493 23,364 29,336 36,250 43,773 46,979 50,892 53,672

118
Tabela 4. Valores críticos para o teste de Cochran

n=2 n=3 n=4 n=5


p 1% 5% 1% 5% 1% 5% 1% 5%
2 - - 0,995 0,975 0,979 0,939 0,959 0,906
3 0,993 0,967 0,942 0,871 0,883 0,798 0,834 0,746
4 0,968 0,906 0,864 0,768 0,781 0,684 0,721 0,629
5 0,928 0,841 0,768 0,684 0,696 0,598 0,633 0,544
6 0,683 0,781 0,722 0,616 0,626 0,532 0,584 0,000
7 0,838 0,727 0,684 0,561 0,568 0,048 0,508 0,431
8 0,794 0,068 0,615 0,516 0,521 0,438 0,463 0,391
9 0,754 0,638 0,573 0,478 0,481 0,403 0,425 0,358
10 0,718 0,602 0,538 0,445 0,447 0,373 0,393 0,331
11 0,684 0,570 0,504 0,417 0,418 0,348 0,386 0,308
12 0,653 0,541 0,475 0,392 0,392 0,326 0,343 0,288
13 0,624 0,515 0,450 0,371 0,389 0,307 0,322 0,271
14 0,599 0,492 0,427 0,352 0,349 0,291 0,304 0,255
15 0,575 0,471 0,407 0,335 0,332 0,276 0,288 0,242
16 0,553 0,452 0,388 0,319 0,316 0,262 0,274 0,230
17 0,532 0,434 0,372 0,305 0,301 0,250 0,261 0,219
18 0,514 0,418 0,356 0,293 0,288 0,240 0,249 0,209
19 0,496 0,403 0,343 0,281 0,276 0,230 0,238 0,200
20 0,480 0,389 0,330 0,270 0,265 0,220 0,229 0,192
21 0,465 0,377 0,318 0,261 0,255 0,212 0,220 0,185
22 0,045 0,385 0,307 0,252 0,246 0,204 0,212 0,178
23 0,437 0,354 0,297 0,243 0,238 0,197 0,204 0,172
24 0,425 0,343 0,287 0,235 0,230 0,191 0,197 0,166
25 0,413 0,334 0,278 0,228 0,222 0,185 0,190 0,160
26 0,402 0,325 0,270 0,221 0,215 0,179 0,184 0,155
27 0,391 0,316 0,262 0,215 0,209 0,173 0,179 0,150
28 0,382 0,308 0,255 0,209 0,202 0,168 0,173 0,146
29 0,372 0,300 0,248 0,203 0,196 0,164 0,168 0,142
30 0,363 0,293 0,241 0,198 0,191 0,259 0,164 0,138

119
Tabela 5. Valores críticos para o teste de Grubbs
Um valor Dois valores
p 1% 5% 1% 5%
- - - - -
3 1,155 1,155 - -
4 1,496 1,481 - 0,000
5 1,764 1,715 0,002 0,009
6 1,973 1,887 0,012 0,035
7 2,139 2,020 0,031 0,071
8 2,274 2,126 0,056 0,110
9 2,387 2,215 0,085 0,149
10 2,482 2,020 0,115 0,186
11 2,564 2,355 0,145 0,221
12 2,636 2,412 0,174 0,254
13 2,699 2,462 0,202 0,284
14 2,755 2,507 0,228 0,311
15 2,806 2,549 0,253 0,337
16 2,852 2,585 0,277 0,360
17 2,894 2,620 0,299 0,382
18 2,932 2,651 0,320 0,403
19 2,968 2,681 0,340 0,421
20 3,001 2,709 0,359 0,439
21 3,031 2,733 0,376 0,456
22 3,060 2,758 0,393 0,471
23 3,087 2,781 0,401 0,486
24 3,112 2,802 0,423 0,499
25 3,135 2,822 0,438 0,512
26 3,157 2,841 0,451 0,525
27 3,178 2,859 0,464 0,536
28 3,199 2,876 0,476 0,547
29 3,218 2,893 0,488 0,557
30 3,236 2,908 0,499 0,567
31 3,253 2,924 0,509 0,577
32 3,270 2,938 0,519 0,586
33 3,286 2,952 0,529 0,594
34 3,301 2,965 0,538 0,602
35 3,316 2,979 0,547 0,610
36 3,330 2,991 0,555 0,618
37 3,343 3,003 0,564 0,625
38 3,356 3,014 0,571 0,632
39 3,369 3,025 0,579 0,638
40 3,381 3,036 0,586 0,645

120
Tabela 6.1. Função Distribuição F (=0,10).

 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 
1 39,86 49,50 53,59 55,83 57,24 58,20 58,91 59,44 59,86 60,19 60,71 61,22 61,74 62,00 62,26 62,53 62,79 63,06 63,33
2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,38 9,39 9,41 9,42 9,44 9,45 9,46 9,47 9,47 9,48 9,49
3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 5,25 5,24 5,23 5,22 5,20 5,18 5,18 5,17 5,16 5,15 5,14 5,13
4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 3,95 3,94 3,92 3,90 3,87 3,84 3,83 3,82 3,80 3,79 3,78 3,76
5 4,06 3,78 3,62 3,52 3,45 3,40 3,37 3,34 3,32 3,30 3,27 3,24 3,21 3,19 3,17 3,16 3,14 3,12 3,10
6 3,78 3,46 3,29 3,18 3,11 3,05 3,01 2,98 2,96 2,94 2,90 2,87 2,84 2,82 2,80 2,78 2,76 2,74 2,72
7 3,59 3,26 3,07 2,96 2,88 2,83 2,78 2,75 2,72 2,70 2,67 2,63 2,59 2,58 2,56 2,54 2,51 2,49 2,47
8 3,46 3,11 2,92 2,81 2,73 2,67 2,62 2,59 2,56 2,54 2,50 2,46 2,42 2,40 2,38 2,36 2,34 2,32 2,29
9 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,44 2,42 2,38 2,34 2,30 2,28 2,25 2,23 2,21 2,18 2,16
10 3,29 2,92 2,73 2,61 2,52 2,46 2,41 2,38 2,35 2,32 2,28 2,24 2,20 2,18 2,16 2,13 2,11 2,08 2,06
12 3,18 2,81 2,61 2,48 2,39 2,33 2,28 2,24 2,21 2,19 2,15 2,10 2,06 2,04 2,01 1,99 1,96 1,93 1,90
15 3,07 2,70 2,49 2,36 2,27 2,21 2,16 2,12 2,09 2,06 2,02 1,97 1,92 1,90 1,87 1,85 1,82 1,79 1,76
20 2,97 2,59 2,38 2,25 2,16 2,09 2,04 2,00 1,96 1,94 1,89 1,84 1,79 1,77 1,74 1,71 1,68 1,64 1,61
24 2,93 2,54 2,33 2,19 2,10 2,04 1,98 1,94 1,91 1,88 1,83 1,78 1,73 1,70 1,67 1,64 1,61 1,57 1,53
30 2,88 2,49 2,28 2,14 2,05 1,98 1,93 1,88 1,85 1,82 1,77 1,72 1,67 1,64 1,61 1,57 1,54 1,50 1,46
40 2,84 2,44 2,23 2,09 2,00 1,93 1,87 1,83 1,79 1,76 1,71 1,66 1,61 1,57 1,54 1,51 1,47 1,42 1,38
60 2,79 2,39 2,18 2,04 1,95 1,87 1,82 1,77 1,74 1,71 1,66 1,60 1,54 1,51 1,48 1,44 1,40 1,35 1,29
120 2,75 2,35 2,13 1,99 1,90 1,82 1,77 1,72 1,68 1,65 1,60 1,55 1,48 1,45 1,41 1,37 1,32 1,26 1,19

 2,71 2,30 2,08 1,94 1,85 1,77 1,72 1,67 1,63 1,60 1,55 1,49 1,42 1,38 1,34 1,30 1,24 1,17 1,00
Tabela 6.2. Função Distribuição F (=0,05).

 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 248,0 249,1 250,1 251,1 252,2 253,3 254,3
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,36
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39
120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25

 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00

122
Tabela 6.3. Função Distribuição F (=0,025).

 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 
1 647,8 799,5 864,2 899,6 921,8 937,1 948,2 956,6 963,3 968,6 976,7 984,9 993,1 997,3 1001 1006 1010 1014 1018
2 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,43 39,45 39,46 39,46 39,47 39,48 39,49 39,50
3 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 14,17 14,12 14,08 14,04 13,99 13,95 13,90
4 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,75 8,66 8,56 8,51 8,46 8,41 8,36 8,31 8,26
5 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,52 6,43 6,33 6,28 6,23 6,18 6,12 6,07 6,02
6 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,37 5,27 5,17 5,12 5,07 5,01 4,96 4,90 4,85
7 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,67 4,57 4,47 4,41 4,36 4,31 4,25 4,20 4,14
8 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,20 4,10 4,00 3,95 3,89 3,84 3,78 3,73 3,67
9 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,87 3,77 3,67 3,61 3,56 3,51 3,45 3,39 3,33
10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72 3,62 3,52 3,42 3,37 3,31 3,26 3,20 3,14 3,08
12 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,28 3,18 3,07 3,02 2,96 2,91 2,85 2,79 2,72
15 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 2,96 2,86 2,76 2,70 2,64 2,59 2,52 2,46 2,40
20 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,68 2,57 2,46 2,41 2,35 2,29 2,22 2,16 2,09
24 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64 2,54 2,44 2,33 2,27 2,21 2,15 2,08 2,01 1,94
30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,41 2,31 2,20 2,14 2,07 2,01 1,94 1,87 1,79
40 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,29 2,18 2,07 2,01 1,94 1,88 1,80 1,72 1,64
60 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 2,17 2,06 1,94 1,88 1,82 1,74 1,67 1,58 1,48
120 5,15 3,80 3,23 2,89 2,67 2,52 2,39 2,30 2,22 2,16 2,05 1,94 1,82 1,76 1,69 1,61 1,53 1,43 1,31

 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05 1,94 1,83 1,71 1,64 1,57 1,48 1,39 1,27 1,00

123
Tabela 6.4. Função Distribuição F (=0,01).

 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 
1 4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6107 6157 6209 6234 6260 6286 6313 6340 6366
2 98,50 99,00 99,16 99,25 99,30 99,33 99,36 99,38 99,39 99,40 99,42 99,43 99,45 99,46 99,47 99,48 99,48 99,49 99,50
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,34 27,23 27,05 26,87 26,69 26,60 26,50 26,41 26,32 26,22 26,13
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,37 14,20 14,02 13,93 13,84 13,75 13,65 13,56 13,46
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,89 9,72 9,55 9,47 9,38 9,29 9,20 9,11 9,02
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,72 7,56 7,40 7,31 7,23 7,14 7,06 6,97 6,88
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,74 5,65
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,67 5,52 5,36 5,28 5,20 5,12 5,03 4,95 4,86
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,11 4,96 4,81 4,73 4,65 4,57 4,48 4,40 4,31
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,71 4,56 4,41 4,33 4,25 4,17 4,08 4,00 3,91
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,16 4,01 3,86 3,78 3,70 3,62 3,54 3,45 3,36
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,67 3,52 3,37 3,29 3,21 3,13 3,05 2,96 2,87
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,23 3,09 2,94 2,86 2,78 2,69 2,61 2,52 2,42
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,03 2,89 2,74 2,66 2,58 2,49 2,40 2,31 2,21
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,84 2,70 2,55 2,47 2,39 2,30 2,21 2,11 2,01
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,66 2,52 2,37 2,29 2,20 2,11 2,02 1,92 1,80
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,50 2,35 2,20 2,12 2,03 1,94 1,84 1,73 1,60
120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,34 2,19 2,03 1,95 1,86 1,76 1,66 1,53 1,38

 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,18 2,04 1,88 1,79 1,70 1,59 1,47 1,32 1,00

124
Tabela 6.5. Função Distribuição F (=0,005).

 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 
1 16212 19997 21614 22501 23056 23440 23715 23924 24091 24222 24427 24632 24837 24937 25041 25146 25254 25358 25466
2 198,5 199,0 199,2 199,2 199,3 199,3 199,4 199,4 199,4 199,4 199,4 199,4 199,4 199,4 199,5 199,5 199,5 199,5 199,5
3 55,55 49,80 47,47 46,20 45,39 44,84 44,43 44,13 43,88 43,68 43,39 43,08 42,78 42,62 42,47 42,31 42,15 41,99 41,83
4 31,33 26,28 24,26 23,15 22,46 21,98 21,62 21,35 21,14 20,97 20,70 20,44 20,17 20,03 19,89 19,75 19,61 19,47 19,32
5 22,78 18,31 16,53 15,56 14,94 14,51 14,20 13,96 13,77 13,62 13,38 13,15 12,90 12,78 12,66 12,53 12,40 12,27 12,14
6 18,63 14,54 12,92 12,03 11,46 11,07 10,79 10,57 10,39 10,25 10,03 9,81 9,59 9,47 9,36 9,24 9,12 9,00 8,88
7 16,24 12,40 10,88 10,05 9,52 9,16 8,89 8,68 8,51 8,38 8,18 7,97 7,75 7,64 7,53 7,42 7,31 7,19 7,08
8 14,69 11,04 9,60 8,81 8,30 7,95 7,69 7,50 7,34 7,21 7,01 6,81 6,61 6,50 6,40 6,29 6,18 6,06 5,95
9 13,61 10,11 8,72 7,96 7,47 7,13 6,88 6,69 6,54 6,42 6,23 6,03 5,83 5,73 5,62 5,52 5,41 5,30 5,19
10 12,83 9,43 8,08 7,34 6,87 6,54 6,30 6,12 5,97 5,85 5,66 5,47 5,27 5,17 5,07 4,97 4,86 4,75 4,64
12 11,75 8,51 7,23 6,52 6,07 5,76 5,52 5,35 5,20 5,09 4,91 4,72 4,53 4,43 4,33 4,23 4,12 4,01 3,90
15 10,80 7,70 6,48 5,80 5,37 5,07 4,85 4,67 4,54 4,42 4,25 4,07 3,88 3,79 3,69 3,59 3,48 3,37 3,26
20 9,94 6,99 5,82 5,17 4,76 4,47 4,26 4,09 3,96 3,85 3,68 3,50 3,32 3,22 3,12 3,02 2,92 2,81 2,69
24 9,55 6,66 5,52 4,89 4,49 4,20 3,99 3,83 3,69 3,59 3,42 3,25 3,06 2,97 2,87 2,77 2,66 2,55 2,43
30 9,18 6,35 5,24 4,62 4,23 3,95 3,74 3,58 3,45 3,34 3,18 3,01 2,82 2,73 2,63 2,52 2,42 2,30 2,18
40 8,83 6,07 4,98 4,37 3,99 3,71 3,51 3,35 3,22 3,12 2,95 2,78 2,60 2,50 2,40 2,30 2,18 2,06 1,93
60 8,49 5,79 4,73 4,14 3,76 3,49 3,29 3,13 3,01 2,90 2,74 2,57 2,39 2,29 2,19 2,08 1,96 1,83 1,69
120 8,18 5,54 4,50 3,92 3,55 3,28 3,09 2,93 2,81 2,71 2,54 2,37 2,19 2,09 1,98 1,87 1,75 1,61 1,43

 7,88 5,30 4,28 3,72 3,35 3,09 2,90 2,74 2,62 2,52 2,36 2,19 2,00 1,90 1,79 1,67 1,53 1,36 1,00

125

Potrebbero piacerti anche