Sei sulla pagina 1di 93

Mini Curso # 4:

Estatística para Bioquímica e


Biotecnologia
Ministrado por:
Dr. Marcelo Caldeira Viegas
marcelo.viegas@unopar.br
Estatística para Bioquímica e Biotecnologia

CONSIDERAÇÕES INICIAIS

A competitividade e o alto custo tornam,


a cada momento, mais difícil pensar em
desenvolvimento de produtos e processos
sem agregar uma metodologia científica de
trabalho.
Estatística para Bioquímica e Biotecnologia

ALIMENTOS QUíMICA

PETROQUíMICA
Algumas
áreas de
aplicações
FARMACÉUTICA

...... BIOTECNOLOGIA
ENGENHARIA
Estatística para Bioquímica e Biotecnologia

Limitações da Estatística:
1o) Toda a informação está contida nos dados. A conclusão, no
máximo, terá a qualidade dos dados que a geraram. Se os
dados forem iniciados ou coletados inadequadamente,
qualquer conclusão que deles advenham está
comprometida.

“A estatística não serve para corrigir erros grosseiros ou técnica


defeituosa”
2o) A Estatística apenas auxilia o pesquisador, mas não dispensa
o espírito científico crítico e cético, nem o conhecimento
profundo do processo em estudo.
Estatística para Bioquímica e Biotecnologia

Teste de Hipóteses
Estatística para Bioquímica e Biotecnologia

Teste de Hipóteses

Regra de decisão estatística que permite,


com base em informações contidas nos
dados amostrais, concluir sobre
parâmetros da população (Estatística
Inferencial).
Estatística para Bioquímica e Biotecnologia

Hipótese Estatística

É uma suposição sobre algum parâmetro


da população, que será posta à prova
através do teste de hipóteses.
Consideram-se, sempre, duas hipóteses:
H0 e H1, denominadas, respectivamente,
hipótese nula e hipótese alternativa.
Estatística para Bioquímica e Biotecnologia

Hipótese Nula (H0)

H0 é a hipótese que está sendo colocada à


prova (exemplo: o pH médio da população
alvo é igual a 5,0).
Hipótese Alternativa (H1)

H1 é a hipótese que será aceita, se for


rejeitada no teste.
Exemplos:

H1: O pH médio da população alvo é diferente de 5,0  Teste bilateral


H1: μ5,0

H1 : O pH médio da população alvo é menor que 5,0  Teste unilateral à


esquerda
H1: μ<5,0

H1 : O pH médio da população alvo é maior que 5,0  Teste unilateral à


direita
H1: μ>5,0
Estatística para Bioquímica e Biotecnologia

Teste de Hipóteses
Escolha do Tipo de Distribuição Amostral

Distribuição Normal ou t-Student ?

- Distribuição Normal (Teste Z)


Se n>30
Se n<30 e o desvio padrão populacional () for conhecido

- Distribuição t-Student (Teste t)


Se n<30 e o desvio padrão populacional () for desconhecido
Estatística para Bioquímica e Biotecnologia

Teste de Hipóteses - Valores


Críticos(Tabelados):
 Distribuição Normal (Teste Z)
Se o nível de confiança for de 90%, Zcrit=±1,65
Se o nível de confiança for de 95%, Zcrit=±1,96
Se o nível de confiança for de 99%, Zcrit=±2,57

 Distribuição t-Student (Teste t)


O valor de tcrit depende do tamanho da amostra (n).
Anexo 1
Estatística para Bioquímica e Biotecnologia

Testes de Hipóteses

Mecanismo dos erros

Como o teste de hipóteses é baseado em amostras


aleatórias, há sempre algum risco de erro.

É importante lembrar que uma outra amostra


retirada poderia fornecer valores diferentes daquela
utilizada na realização do teste.
Estatística para Bioquímica e Biotecnologia

Erro do tipo I ou de primeira espécie: rejeitar H0, quando


H0 é verdadeira.

A probabilidade de cometermos um erro do tipo I,


também conhecida como nível de significância do teste, é
denotada por α e escolhida a priori pelo pesquisador.
Em geral, o nível de significância α = 0,05 (5%) é muito
bem aceito pela comunidade científica.

α = P (erro tipo I) = P (rejeitar H0, quando H0 é


verdadeira).
Estatística para Bioquímica e Biotecnologia

Teste de Hipóteses
O nível de confiança, 1 - α, varia de acordo com o
interesse e a exigência do pesquisador, devendo ser
fixado a priori.

Um valor bem aceito universalmente é 1 - α = 0,95


ou, em termos de porcentagens, (1 - α)% = 95% e
será aqui adotado.
Estatística para Bioquímica e Biotecnologia

Erro do tipo II ou de segunda espécie: não rejeitar H0,


quando H0 é falsa.

A probabilidade de cometermos um erro do tipo II é


denotada por β.

β = P (erro tipo II) = P (não rejeitar H0, quando H0 é


falsa).
Estatística para Bioquímica e Biotecnologia

Mecanismo dos erros num teste estatístico


Resultado do Teste Estatístico
Realidade na
População
Aceita H0 Rejeita-se H0

Resultado correto:
H0 é verdadeira Erro do Tipo I
não há erro

Resultado correto:
H0 é falsa Erro do Tipo II
não há erro
Testes de hipóteses
Regra dos 4 passos
a. Enunciar claramente as hipóteses H0: μ = μ0 e H1: μ  μ0;

b. Fixar o nível de significância α e determinar as regiões críticas


do teste: de aceitação (RA) e de rejeição (RR) de H0, definidas
pelo valor tabelado de t(n-1; α/2). Em geral α = 0,05 (5%);

x  0
c. Calcular o valor da estatística do teste tCalc 
s
n
d. Decisão Estatística: Comparar o valor calculado (item c) com o
valor que delimita as regiões críticas (item b). Dependendo do
resultado a hipótese nula (H0) será aceita ou rejeitada.
Regiões Críticas
São as regiões de aceitação de H0, que denotaremos RA H0, e de
rejeição de H0, que denotaremos RR H0.

Teste bilateral: Se -t(n-1; α/2) < tCalc < t(n-1; α/2) , aceita H0, ou
equivalentemente, através do p-valor, rejeita-se H0 se p-valor  α.

Figura 01: Esboço de um teste bilateral, para a média de uma população


normal, H1: μ μ0
Regiões Críticas
Teste Unilateral a Direita: Aceita H0, quando tCalc <
tTab ou, equivalentemente, quando p – valor > α =
0,05 (95% de confiança).

2 R A Ho : 1 - alfa = 0,95 p - valor > 0,05

R R Ho : alfa = 0,05

0
-6 -4 -2 0
0 2 tCalc tTab 6

Figura 02: Esboço de um teste unilateral para a média de uma população


normal, H1 : μ > μ0. p-valor > .
Regiões Críticas
Teste Unilateral a Direita: Rejeita-se H0,
quando tCalc  tTab ou, equivalentemente, quando
p – valor  α = 0,05 (95% de confiança).

2 R A Ho : 1 - alfa = 0,95 R R Ho : alfa = 0,05

p - valor < 0,05

0
-6 -4 -2 0
0 2 tTab 4 tCalc 6

Figura 03: Esboço de um teste unilateral a direita para a média de uma


população normal, H1 : μ > μ0. P-valor< 
Planejamento Experimental
Design of Experiments (DOE)
e
Otimização de Processos
Livro Texto:
“Planejamento de Experimentos e Otimização de Processos”
autores: M. Isabel Rodrigues e Antonio Francisco Iemma,
Campinas, 2ª. edição, 2009
Estatística para Bioquímica e Biotecnologia

NOÇÕES SOBRE EXPERIMENTOS FATORIAIS

Os Planejamentos Experimentais Fatoriais se


baseiam na Estatística, mas a atividade estatística
mais importante não é a análise dos dados , e sim o
planejamento dos experimentos em que esses
dados devem ser obtidos.
Estatística para Bioquímica e Biotecnologia

Para se atingir os objetivos desejados utilizando-se esta


ferramenta estatística e necessário uma interação entre:

PROCESSO ESTATÍSTICA

BOM SENSO
Estatística para Bioquímica e Biotecnologia

“Em diversas situações, é imediato estabelecer


conclusões a partir de um experimento bem planejado,
empregando apenas técnicas de análise bastante
elementares. Por outro lado, mesmo a análise
estatística mais sofisticada não pode salvar um
experimento que tenha sido mal planejado”.

(Box, Hunter & Hunter)


Estatística para Bioquímica e Biotecnologia

Porque aprender Planejamento de Experimentos?


Desenvolvimento de um novo produto e/ou processo

Melhorar o produto que já está no mercado

Conhecer o efeito das variáveis do processo

Melhorar metodologias analíticas

Otimização do processo

Redução de custos
Estatística para Bioquímica e Biotecnologia

“O sucesso de um planejamento de experimentos


dependerá em grande parte da forma com que este é
estruturado e como será realizado. Entender
claramente quais são os objetivos de realizar um
experimento é necessário antes de qualquer ação
para executá-lo.”
Montgomery (2009)
Estatística para Bioquímica e Biotecnologia

Vantagens do Planejamento Experimental:

 Reduz o número de experimentos, com melhor qualidade de


informação nos resultados;

 É possível detectar o erro experimental e avaliá-lo;

 A análise multivariável permite verificar e quantificar efeitos


sinérgicos e antagônicos entre as variáveis estudadas;

 É possível otimizar mais de uma resposta ao mesmo tempo;


Estatística para Bioquímica e Biotecnologia

Roteiro para elaboração de um planejamento de experimentos:

a) Análise do processo;
b) Escolha dos fatores (variáveis independentes) e dos níveis que
serão avaliados;
c) Seleção das variáveis resposta;
d) Escolha do planejamento experimental mais adequado;
e) Realização dos ensaios conforme indicado pelo delineamento
experimental (item d);
f) Análise dos dados (Modelo Obtido , ANOVA, Superfície de
Respostas e Curvas de Contorno);
g) Conclusões e Recomendações;
Estatística para Bioquímica e Biotecnologia

Variáveis Independentes:
Fatores a serem estudados ou avaliados num processo (que
podem ser controladas)
Ex.: Formulação, temperatura, pH, agitação, aeração, tempo
de residência, vazão de alimentação, pressão, etc...

Variáveis Dependentes:
Respostas desejadas (determinadas experimentalmente)
Ex.: Rendimento, produtividade, índice de expansão,
atributos sensoriais, fator de pureza, atividade
enzimática, etc...
Estatística para Bioquímica e Biotecnologia

R1,2,...j = f (F1, F2, ..... Fk)

Estabelecer uma função matemática que correlacione as


variáveis estudadas em função da(s) resposta(s)
determinada(s).
Estatística para Bioquímica e Biotecnologia

Tabela 01: Nº. de ensaios experimentais de alguns delineamentos


fatoriais completos
Fatores
Níveis K=2 K=3 K=6 K
2 22=4 23=8 26=64 2k
3 32=9 33=27 36=729 3k
..... ..... ..... ..... .....
N N2 N3 N6 NK

Como pode ser visto pela Tabela 01, o nº. de ensaios cresce
exponencialmente, praticamente inviabilizando a utilização de
delineamentos completos para 6 ou mais fatores com dois níveis e para 4
ou mais fatores com 3 níveis.
Estatística para Bioquímica e Biotecnologia

Comparação entre o planejamento


fatorial versus estudo de um fator
por vez.

Estudo de caso em bioprocessos


Estatística para Bioquímica e Biotecnologia

Estudo de Caso:

AVALIAÇÃO DO EFEITO DO pH e
TEMPERATURA NA ATIVIDADE DE
UMA ENZIMA
Augusto, A C.S.; Costa, F.A.A. e Rodrigues, M.I.
Laboratório de Engenharia de Bioprocessos
FEA – UNICAMP, 2002
Estatística para Bioquímica e Biotecnologia

a) Estudo de uma variável por vez (10 ensaios):


Ensaios a 40oC a Ensaios a pH 4,0 e diferentes
diferentes valores de pH valores de temperatura

Atividade Temperatura Atividade


pH
(U/mL) (oC) (U/mL)
3,0 251 30 158

4,0 274 40 292

5,0 236 50 393

6,0 149 60 456

7,0 53 70 215
300

250

Atividade enzimática em
Atividade (U/mL)

200

função
150

100

50
2,5 3,5 4,5 5,5 6,5 7,5

pH
500

(a) pH (temperatura de 40o C)


400

Atividade (U/mL) 300

200

100
25 35 45 55 65 75
o
Temperatura ( C)

(b) da temperatura (pH igual a 4,0)


Estatística para Bioquímica e Biotecnologia

b) Estudo Fatorial (25 ensaios):


T=30oC T=40oC T=50oC T=60oC T=70oC

pH Ativ. pH Ativ. pH Ativ. pH Ativ. pH Ativ.


(U/mL) (U/mL) (U/mL) (U/mL) (U/mL)

3 162 3 277 3 295 3 61 3 34

4 158 4 287 4 384 4 504 4 409

5 122 5 267 5 346 5 425 5 361

6 68 6 159 6 218 6 253 6 30

7 25 7 51 7 53 7 26 7 3
Estatística para Bioquímica e Biotecnologia

Comportamento da atividade enzimática em diferentes pH e


temperaturas (o C)
600

500
Atividade (U/mL)

400

300

200
30
40
100
50
60
0
2,5 3,5 4,5 5,5 6,5 7,5 70

pH
Estatística para Bioquímica e Biotecnologia

Delineamento Experimental

Fatorial 2K (dois níveis)


Estatística para Bioquímica e Biotecnologia

Experimentos com Delineamento Fatorial 2K

 Os delineamentos com esquema fatorial 2K, ocorrem


quando temos K fatores, todos com dois níveis (-1 e +1).
 Delineamentos deste tipo são muito utilizados em
laboratórios e locais onde as fontes externas de variação
são, geralmente muito bem controladas.
 Eles apresentam uma vantagem incontestável: fornecem o
maior número possível de graus de liberdade para o
resíduo (erro).
Estatística para Bioquímica e Biotecnologia

a.1) Delineamento Fatorial 2K com repetições (replicatas genuínas) :


Suponha um experimento para estudar a atividade enzimática em função do pH
(fator A) e da temperatura (fator B), ambos avaliados em dois níveis que
denominaremos apenas de baixo (-1) e alto (+1), realizados em triplicata (três
repetições), conforme descrito na Tabela 02.

Tabela 02: Atividades Enzimáticas (U/mL), segundo o pH e a temperatura


Fatores Repetições Ativ.
Ensaios pH (A) Temp. (B) Tratamentos 1 2 3 Totais Enzim.
(Média)

1 3 (-1) 30 (-1) 1 218 212 170 600 200


2 7 (+1) 30 (-1) a 67 73 76 216 72
3 3 (-1) 70 (+1) b 402 399 411 1212 404
4 7 (+1) 70 (+1) ab 222 258 270 750 250
Estatística para Bioquímica e Biotecnologia

Uma descrição esquemática dos resultados desse experimento pode ser


visualizado na Figura 04.

Figura 04: Representação Esquemática dos Resultados Obtidos


Estatística para Bioquímica e Biotecnologia

a.1.1) Delineamento Fatorial 2K com repetições (Cálculo dos Efeitos


Principais dos Fatores e da Interação sobre as Respostas) - 

O efeito principal de um fator ”A” pode ser entendido como a variação


causada na resposta, quando percorremos todos os níveis de ”A”,
independente dos demais fatores.
No exemplo em questão podemos estimar o efeito principal do pH como a
diferença entre as atividades enzimáticas médias no nível alto e o nível
baixo do pH. Considerando a Figura 04, podemos obter:
 a  ab (1)  b A passagem do pH do
pH  A  y pH   y pH  
Figura
 nível (-1) para (+1), levou
2 2 uma diminuição de
 141,00 U/mL na média da
pH  A  y pH   y pH   161,00  302,00  141,00 
Figura
atividade enzimática.
Estatística para Bioquímica e Biotecnologia

a.1.1) Delineamento Fatorial 2K com repetições (Cálculo dos Efeitos


Principais dos Fatores e da Interação sobre as Respostas) - 

De modo análogo, para o efeito principal da temperatura (fator B):

b  ab (1)  a
 Bˆ  yT   yT  
Temp. Figura  A passagem da Temp.
2 2
do nível (-1) para (+1),
levou uma acréscimo de
 Bˆ  yT   yT   327,00  136,00  191,00 
Temp. Figura 190,00 U/mL na média
da atividade enzimática.
Estatística para Bioquímica e Biotecnologia

a.1.1) Delineamento Fatorial 2K com repetições (Cálculo dos Efeitos


Principais dos Fatores e da Interação sobre as Respostas) - 

Neste modelo simples, temos apenas uma interação de primeira ordem,


isto é, uma interação entre os níveis de dois fatores. A estimativa do efeito
da interação pode ser obtida através da Figura 04 como a diferença entre
as médias determinadas pelas diagonais principal e secundária.

ab  1 a  b 1  a  b  ab
pH x Temp. Figura
 AB   
2 2 2 Efeito de Interação
entre os fatores pH e
200  72  404  250 Temperatura.
 ABˆ 
pH x Temp. Figura  13 
2
Estatística para Bioquímica e Biotecnologia

a.1.2) Ajuste do Modelo

O modelo linear em relação aos parâmetros estudados é


dado pela equação:

yijr  0  1 x1 j   2 x2 j  12 x1 j .x2 j

Onde: x1 e x2 são as variáveis independentes.


Estatística para Bioquímica e Biotecnologia

a.1.2) Ajuste do Modelo


Os parâmetros 0, 1, 2 e 12 do modelo de regressão, que serão
estimados através do método dos mínimos quadrados.
Para fins práticos, a estimativas de 0 é a média geral das respostas:

0  y 
161  302  327  136
 231,50
4
As estimativas dos demais parâmetros são iguais às metades das
estimativas dos efeitos correspondentes:

 A  141,00
1    70,50
2 2
 Assim, o modelo ajustado é:
 B 191 
2    95,50 yijr  231,50  70,50 pH  95,5Temp  6,50 pH *Temp.
2 2

 AB  13
12    6,50
2 2
Estatística para Bioquímica e Biotecnologia

a.1.3) Análise de Variância (Contrastes e Soma dos Quadrados)


As somas dos quadrados podem ser obtidas elevando-se ao quadrado a
estimativa do contraste e, dividindo-se o resultado pelo produto entre a
soma de quadrados dos coeficientes do contraste e o número de
repetições (Tabela 03).

Tabela 03: Atividades Enzimáticas (U/mL), Contrastes Totais


(Considerando Repetições)
Contrastes Totais Valor dos Soma dos
Contrastes Quadrados do
Coeficiente
 216+750-600-1212 -846 4
A  a  ab  (1)  b
 1212+750-600-216 1146 4
B  b  ab  (1)  a

AB  ab  (1)  a  b 750+600-216-1212 -78 4
Estatística para Bioquímica e Biotecnologia

a.1.4) Análise de Variância (ANOVA)


Assim, com base na Tabela 03, calcula-se diretamente:

SQ(A)  SQ(pH) 
A
 2


 846
2
 59643,00
4r 4*3

SQ(B)  SQ(Temp) 
B
2


1146
2
 109443,00
4r 4*3

SQ(AB)  SQ(pH x Temp.) 


AB
2
 

 78
2
 507 ,00
4r 4*3

A Soma Quadrática (SQ) Total Corrigida e a SQ Resíduo são calculadas


conforme segue:

SQTc   yijr2  ny 2  815436,00  12 * (231,50) 2  172329,00


ijr

SQ Re s  SQTc  SQ A  SQB   SQ AB   2736,00


Estatística para Bioquímica e Biotecnologia

a.1.4) Delineamento Fatorial 2K com repetições (Análise de Variância -


ANOVA) Anexo 2
A Tabela 04 apresenta a análise de variância (ANOVA) calculados anteriormente.

Tabela 04: ANOVA - Atividades Enzimáticas (U/mL) Ftab(1,8 ; 95%)= 5,32


Fonte de Soma dos Graus de Média dos Fcal Hipóteses
Variação Quadrados Liberdade Quadrados
(SQ) (MQ)
pH (A) 59643,00 1 59643,00 174,39 H0: 1=0
(rejeitada)
Temp. (B) 109443,00 1 109443,00 320,01 H0: 2=0
(rejeitada)
pH x Temp. 507,00 1 507,00 1,48 H0: 12=0
(AB) (aceita)
Resíduo 2736,00 (n-p) 8 342,00 R2=98,41%
Total n: nº. total de ensaios; p: nº. de
172329,00 (n-1) 11 -
parâmetros do modelo

 Variação E xplicada p elo Modelo   59643  109443  507 


R 2%  100*   100   98,41%
 Variação T otal   172329 
Estatística para Bioquímica e Biotecnologia

a.1.4) Análise de Variância (Interpretação)


Observa-se pela Tabela 04 que o efeito de interação pH x
temperatura não foi significativo (Ftab < Fcal) e que os efeitos
principais de pH e da temperatura foram altamente
significativos. Em outras palavras, se aceita a hipótese H0:
12=0 (aceita).

Se, e apenas se, o efeito de interação não for significativo


poderemos interpretar isoladamente cada efeito principal.
Estatística para Bioquímica e Biotecnologia

a.1.5) Delineamento Fatorial 2K com repetições (Estimativas das


Variâncias e Erro Padrão – Efeitos)
A estimativa das variâncias para as variáveis codificadas é dada pela
equação abaixo:

ˆ  
Var ( A)  Var y pH   y pH  
QM Re s 342
  114,00
r 3
Assim, uma estimativa do erro padrão da estimativa do fator A (pH), é
dado por:


ep Aˆ  114,00  10,68
Estatística para Bioquímica e Biotecnologia

a.1.5) Delineamento Fatorial 2K com repetições (Estimativas das


Variâncias e Erro Padrão – Efeitos)

De modo análogo podem ser obtidas as estimativas dos erros padrões


das estimativas de B (temperatura) e de AB (interação), conforme valores
apresentados na Tabela 05.

Para a constante (média), temos:


QM Re s 342,00
Var ( y )    28,50
n 12
ep  y   28,50  5,34
Estatística para Bioquímica e Biotecnologia

a.1.6) Delineamento Fatorial 2K com repetições (t calculado e


Intervalo de Confiança – Efeitos)
Os valores de tcalc são obtidos pela equação abaixo:


tcalc 
ep  

Então, para a média, o pH, a temperatura e a interação temos,


respectivamente:

y 231,50 A - 141,00
t calc    43,36; t calc     -13,21
epy  5,34  
ep A 10,68

 
B 191,00 AB - 13,00
    17,89 ; t calc     -1,22
t calc

ep B 10,68  
ep AB 10,68
Estatística para Bioquímica e Biotecnologia

a.1.6) Delineamento Fatorial 2K com repetições (t calculado e


Intervalo de Confiança – Efeitos)

Para a estimativa do intervalo de confiança, aplica-se a equação abaixo:


ttab(8 g.l. ; 95%)= 2,31 Anexo 1

IC θ 95%


 θ  t8;95% ep θ

IC  y 95%  231,50  2 ,31.5,34   231,50  12 ,33


IC  pH 95%  141,00  2 ,31.10 ,68  141,00  24 ,67
IC Temp.95%  191,00  2 ,31.10 ,68  191,00  24 ,67
IC  pHxTemp.95%  13,00  2 ,31.10 ,68  13,00  24 ,67
Estatística para Bioquímica e Biotecnologia

a.1.6) t calculado e Intervalo de Confiança – Estimativa dos Efeitos


A Tabela 05 apresenta o erro padrão, tcalc e os limites de confiança dos
efeitos de cada fator calculados anteriormente.

Tabela 05: Erro padrão e limites de confiança dos Efeitos


Fatores Efeitos Erro tcalc Limite Limite
Padrão Inferior Superior
(95%) (95%)
Média 231,50 5,34 43,36 219,19 243,81
pH -141,00 10,68 -13,21 -165,62 -116,38
Temperatura 191,00 10,68 17,89 166,38 215,62

pH x Temp. -13,00 10,68 -1,22 -37,62 11,62


ttab(8 g.l. ; 95%)= 2,31
Estatística para Bioquímica e Biotecnologia

a.1.7) Delineamento Fatorial 2K com repetições - Diagrama de Pareto

Pelos dados da tabela 05 pode-se notar que o único valor de tcalc que
pertence à região de aceitação de H0 é aquele relativo à interação. Tais
resultados podem ser descritos no Diagrama de Pareto.
Os valores absolutos de tcalc, também denominados efeitos
padronizados, fornecem as alturas das barras que por sua vez são
dispostas de modo decrescente.

O valor de ttab (2,31) completa o diagrama fornecendo o valor a partir do


qual os efeitos são significativos, como pode ser visto na Figura 04.
Estatística para Bioquímica e Biotecnologia

a.1.7) Delineamento Fatorial 2K com repetições - Diagrama de Pareto


Pareto Chart of Standardized Effects; Variable: Atividade Enzimática (U/mL)
2**(2-0) design; MS Pure Error=342,
DV: Atividade Enzimática (U/mL)

(2)Temp. (ºC) 17,88879

(1)pH -13,2059

1by2 -1,21756

p=,05

Standardized Effect Estimate (Absolute Value)

Figura 04: Diagrama de Pareto


Estatística para Bioquímica e Biotecnologia

a.1.8) Delineamento Fatorial 2K com repetições (Valores preditos pelo


modelo)
Observed vs. Predicted Values
2**(2-0) design; MS Pure Error=342,
DV: Atividade Enzimática (U/mL)
450

400

350

300
Predicted Values

250

200

150

100

50

0
0 50 100 150 200 250 300 350 400 450

Observed Values

Figura 05: Valores Preditos versus Observados


Estatística para Bioquímica e Biotecnologia

a.1.9) Delineamento Fatorial 2K com repetições -


Superfície de Respostas e Curvas de Contorno

A descrição gráfica do modelo ajustado anteriormente é


conhecida como superfície de repostas (Figura 06), bem
como a projeção de seus cortes sobre o plano dos fatores
gerando as curvas de contorno (Figura 07), é muito útil na
interpretação dos resultados e na otimização do processo em
questão.
Experimentos Fatoriais
a.1.9) Delineamento Fatorial 2K com repetições - Superfície de
Respostas e Curvas de Contorno
Fitted Surface; Variable: Atividade Enzimática (U/mL)
2**(2-0) design; MS Pure Error=342,
DV: Atividade Enzimática (U/mL)

500
Atividade Enzimátic

4 00

300

200

100
a (U/mL)

75
70 7
65 7 ,5
60 6,5 ,0
Te 55 6
5 ,0
mp 50 5,0 ,5
. (º 45 4
C) 40 4 ,5
35 3,5 ,0 pH
3 0 2 3,0 > 400
2 5 ,5
< 340
< 240
< 140
< 40
z=128;375-27;125*x+5;5875*y-;1625*x*y+0;

Figura 06: Superfície de Resposta


Experimentos Fatoriais
a.1.9) Delineamento Fatorial 2K com repetições - Superfície de
Respostas e Curvas de Contorno
Fitted Surface; Variable: Atividade Enzimática (U/mL)
2**(2-0) design; MS Pure Error=342,
DV: Atividade Enzimática (U/mL)
75
70
65
60
Temp. (ºC)

55
50
45
40 > 400
< 390
35 < 340
< 290
30 < 240
25 < 190
2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 < 140
< 90
pH < 40
z=128;375-27;125*x+5;5875*y-;1625*x*y+0;

Figura 07: Curvas de Contorno


Estatística para Bioquímica e Biotecnologia

a.1.9) Delineamento Fatorial 2K com repetições - Superfície de


Respostas e Curvas de Contorno

Pelas Figuras 06 e 07 observa-se que nos intervalos estudados, as


maiores atividades enzimáticas ocorreram para níveis baixos de pH e
altos níveis de temperatura.
 Condições Otimizadas:
 pH: 2,5 ~4,5
 Temp.: 50 ~ 75ºC
Estatística para Bioquímica e Biotecnologia

a.2) Delineamento Fatorial 2K sem repetições:


Para apresentar os conceitos que serão expostos neste item, estaremos
supondo que no exemplo anterior o pesquisador tenha feito o experimento
apenas uma única vez, ou registrado apenas as médias das observações.
Neste contexto temos apenas quatro respostas conforme apresentado na
Tabela 06.
Tabela 06: Atividades Enzimáticas (U/mL), segundo o pH e a temperatura
Fatores
Ativ. Enzimática
Ensaios pH (A) Temp. (B) Tratamentos
Média (Totais)

1 3 (-1) 30 (-1) 1 200


2 7 (+1) 30 (-1) a 72
3 3 (-1) 70 (+1) b 404
4 7 (+1) 70 (+1) ab 250
Estatística para Bioquímica e Biotecnologia

a.2.1) Delineamento Fatorial 2K sem repetições (Efeitos e Coeficientes):

É fácil verificar, utilizando os conceitos empregados no item a.1, que as


estimativas dos efeitos e os coeficientes do modelo são idênticas àquelas já
obtidas considerando as repetições (triplicata), como pode ser visto na Tabela 07.

Tabela 07: Atividades Enzimáticas (U/mL), Efeitos e Coeficientes (Sem


Repetições)
Fatores Efeitos Coeficientes do Modelo

Média (Constante) 231,50 231,50


pH -141,00 -70,50
Temperatura 191,00 95,50
pH x Temp. -13,00 -6,50
Estatística para Bioquímica e Biotecnologia

a.2.2) Delineamento Fatorial 2K sem repetições (Contrastes e Soma


dos Quadrados):

O valor dos contrastes e a soma dos quadrados são apresentados na


Tabela 08.

Tabela 08: Atividades Enzimáticas (U/mL), Contrastes Totais (sem


repetições)
Contrastes Totais Valor dos Soma dos
Contrastes Quadrados do
Coeficiente
 72+250-200-404 -282 4
A  a  ab  (1)  b
 404+250-200-72 382 4
B  b  ab  (1)  a

AB  ab  (1)  a  b 250+200-72-404 -26 4
Estatística para Bioquímica e Biotecnologia

a.2.3) Delineamento Fatorial 2K sem repetições (ANOVA):


Assim, com base na Tabela 08, calcula-se diretamente:

SQ(A)  SQ(pH) 
A
 2


 282
2
 19881
4r 4*1

SQ(B)  SQ(Temp) 
B  382


2 2
 36481
4r 4*1

SQ(AB)  SQ(pH x Temp.) 


2
AB

 
 26
2
 169
4r 4*1
A Soma Quadrática (SQ) Total Corrigida e a SQ Resíduo são calculadas
conforme segue:
SQTc   yijr2  ny 2  270900  4 * (231,50) 2  56531
ijr

SQ Re s  SQTc  SQ A  SQB   SQ AB   zero


Estatística para Bioquímica e Biotecnologia

a.2.3) Delineamento Fatorial 2K sem repetições (ANOVA):


A Tabela 09 apresenta a análise de variância (ANOVA), sem considerar as
repetições.

Tabela 09: Tabela ANOVA - Atividades Enzimáticas (U/mL) sem repetições


Fonte de Soma dos Graus de Média dos Fcal Hipóteses
Variação Quadrados Liberdade Quadrados
(SQ) (MQ)
pH (A) 19881,00 1 19881,00 - -
Temp. (B) 36481,00 1 36481,00 - -
Ph x Temp. 169,00 1 169,00 - -
(AB)
Resíduo 0 (n-p) 0 0 R2=100,00%
Total 56531,00 (n-1) 3 - n: nº. total de ensaios; p: nº.
de parâmetros do modelo
 Variação E xplicada p elo Modelo   19881  36481  169 
R 2%  100*   100   100,00%
 Variação T otal   56531 
Estatística para Bioquímica e Biotecnologia

a.2.3) Delineamento Fatorial 2K sem repetições (ANOVA):


A partir dos dados da Tabela 09 podemos observar que não temos graus
de liberdades para o resíduo, indicando é impossível efetuar qualquer
inferência sobre as repostas, evidenciando que apenas a estatística
descritiva é permitido em tal situação. Em outras palavras, se não há
resíduo então não há erro padrão e, portanto, não é possível construir
estimativas por intervalos, testes de hipótese (t e F) ou obter previsões.

Assim sendo, mesmo que possamos apresentar o modelo com os


coeficientes da Tabela 07 e construir as superfícies de respostas e as
curvas de contorno, mas não há qualquer valor científico nisso, além da
descrição da amostra.
Estatística para Bioquímica e Biotecnologia

a.2.4) Delineamento Fatorial 2K sem repetições (Diagrama de Pareto)


Pareto Chart of Effects; Variable: Atividade Enzimática (U/mL)
2**(2-0) design
DV: Atividade Enzimática (U/mL)

(2)Temp. (ºC) 191,

(1)pH -141,

1by2 -13,

-20 0 20 40 60 80 100 120 140 160 180 200 220

Effect Estimate (Absolute Value)

Figura 08: Diagrama de Pareto


Estatística para Bioquímica e Biotecnologia

a.3) Delineamento Fatorial 2K com adição de ponto central:

Para tornar possível o uso, ao menos aproximada, da inferência


estatística, é usual serem feitos alguns ensaios no ponto central do
espaço experimental. Com tal procedimento estaremos viabilizando o
cálculo dos resíduos, e consequentemente do erro padrão e das
estimativas por intervalo, viabilizando assim os testes de hipóteses (t e F).

Suponhamos que no exemplo anterior sejam feitos três ensaios no ponto


central, conforme indicado na Tabela 10.
Estatística para Bioquímica e Biotecnologia

a.3) Delineamento Fatorial 2K com adição de ponto central:

Tabela 10: DOE - Adição de Ensaios no Ponto Central


Fatores Atividade
Ensaios pH (A) Temp. (B) Tratamentos Enzimática
(U/mL)

1 3 (-1) 30 (-1) 1 200


2 7 (+1) 30 (-1) a 72
3 3 (-1) 70 (+1) b 404
4 7 (+1) 70 (+1) ab 250
5 (C) 5 (0) 50 (0) - 150
6 (C) 5 (0) 50 (0) - 140
7 (C) 5 (0) 50 (0) - 160
Média 196,57
Estatística para Bioquímica e Biotecnologia

a.3.1) Delineamento Fatorial 2K com adição de ponto central (Ajuste


do Modelo):

Observa-se que agora, torna-se possível estimar algum resíduo, embora


de modo rudimentar, pois temos apenas 3 repetições adicionais.

Para estimar os resíduos são mantidos os coeficientes de regressão


obtido anteriormente no item a.1.2, exceto a constante, que é calculada
com a nova média geral das atividades enzimáticas (resposta).
O modelo é dado pela equação abaixo:

Atividade  196,57  70,50 pH  95,5Temp  6,5 pH *Temp.


Estatística para Bioquímica e Biotecnologia

a.3.2) Delineamento Fatorial 2K com adição de ponto central


(ANOVA):

A Soma Quadrática (SQ) Total Corrigida e a SQ Resíduo são calculadas


conforme visto anteriormente:

SQTc   yijr2  ny 2  338596  7* 196 ,57   68117 ,71


2

ijr

SQ Re s  SQTc  SQ A  SQB   SQ AB 


SQ Re s  68117 ,71  19881,00  36481,00  169 ,00  11586 ,71
Estatística para Bioquímica e Biotecnologia

a.3.2) Delineamento Fatorial 2K com adição de ponto central (ANOVA


- SS Residual):
Anexo 2
Tabela 11: ANOVA - Atividades Enzimáticas (U/mL) Ponto Central Ftab(1,3 ; 95%)= 10,13
Fonte de Soma dos Graus de Média dos Fcal Hipóteses
Variação Quadrados Liberdade Quadrados
(SQ) (MQ)
pH (A) 19881,00 1 19881,00 5,14 H0: 1=0
(aceita)
Temp. (B) 36481,00 1 36481,00 9,45 H0: 2=0
(aceita)
pH x Temp. 169,00 1 169,00 0,04 H0: 12=0
(AB) (aceita)
Resíduo 11586,71 (n-p) 3 3862,24 R2=82,99%
Total n: nº. total de ensaios; p: nº. de
68117,71 (n-1) 6 -
parâmetros do modelo

 Variação E xplicada p elo Modelo   19881  36481  169 


R 2%  100*   100   82,99%
 Variação T otal   68117,71 
Estatística para Bioquímica e Biotecnologia

a.3.3) Delineamento Fatorial 2K com adição de ponto central (Erros):

Os erros padrões, para a constante e para os demais efeitos são


calculados de modo análogo aos já obtidos anteriormente.
Para a constante, temos:

QM Re s 3862,24
ep ( y )    23,49
n 7

Para os demais efeitos, temos:

QM Re s 3862,24
ep ( A)  ep ( B)  ep ( AB )    62,15
r 1
Estatística para Bioquímica e Biotecnologia

a.3.3) Delineamento Fatorial 2K com adição de ponto central (Erros):

A Tabela 12 apresenta o erro padrão, tcalc e os limites de confiança dos


efeitos de cada fator calculados anteriormente.
Tabela 12: Erro padrão dos Efeitos (delineamento com ponto central)
Fatores Efeitos Erro Padrão tcalc

Média 196,57 23,49 8,37*


pH -141,00 62,15 -2,27
Temperatura 191,00 62,15 3,07
pH x Temp. -13,00 62,15 -0,21
ttab(3 g.l. ; 95%)= 3,18 Anexo 1
* Significativo ao nível de 95%
Estatística para Bioquímica e Biotecnologia

a.3.4) Delineamento Fatorial 2K com adição de ponto central (Gráfico


de Pareto):
Pareto Chart of Standardized Effects; Variable: Atividade Enzimática (U/mL)
2**(2-0) design; MS Residual=3862,238
DV: Atividade Enzimática (U/mL)

(2)Temp. (ºC) 3,073363

(1)pH -2,26882

1by2 -,209182

p=,05

Standardized Effect Estimate (Absolute Value)

Figura 09: Gráfico de Pareto (SS Residual)


Estatística para Bioquímica e Biotecnologia

a.3.2) Delineamento Fatorial 2K com adição de ponto central (ANOVA


– Erro Puro):

Tabela 13: ANOVA - Atividades Enzimáticas (U/mL) - Ponto Central


Fonte de Soma dos Graus de Média dos Fcal
Variação Quadrados Liberdade Quadrados
(SQ) (MQ)
pH (A) 19881,00 1 19881,00 198,81
Temp. (B) 36481,00 1 36481,00 364,81
pH x Temp. (AB) 169,00 1 169,00 1,69
Falta de Ajuste 11386,71 (m-p) 1 11386,71 113,87
Erro Puro 200,00 (n-m) 2 100,00
R2=82,99%
Total 68117,71 (n-1) 6
nº. total de ensaios (n=7); nº. de parâmetros do modelo (p=4); nº de níveis distintos (m=5)
F0,95; 1; 2 = 18,51 Anexo 2
Estatística para Bioquímica e Biotecnologia

a.3.4) Delineamento Fatorial 2K com adição de ponto central (Gráfico


de Pareto): Pareto Chart of Standardized Effects; Variable: Atividade Enzimática (U/mL)
2**(2-0) design; MS Pure Error=100,
DV: Atividade Enzimática (U/mL)

(2)Temp. (ºC) 19,1

(1)pH -14,1

1by2 -1,3

p=,05

Standardized Effect Estimate (Absolute Value)

Figura 10: Gráfico de Pareto (Erro Puro)


Estatística para Bioquímica e Biotecnologia

DELINEAMENTO
COMPOSTO CENTRAL
ROTACIONAL

Central Composite Design


Estatística para Bioquímica e Biotecnologia

Planejamento Composto Central (Central Composite Design):


Um Delineamento Composto Central que tem pontos axiais definidos é
denominado de Delineamento Composto Central Rotacional (DCCR).

O Planejamento composto central (Central Composite Design) deve ser


utilizado quando se quiser verificar a curvatura de um plano; ou seja;
quando se quiser verificar a existência de termos quadráticos no modelo
de regressão.
De modo geral este tipo de planejamento consiste de uma parte referente
ao planejamento fatorial com 2K ensaios fatorias + 2K ensaios em pontos
axiais ou estrelas (ns) + um número arbitrário de repetições no ponto
central (nc).Onde: K – nº. de fatores
Estatística para Bioquímica e Biotecnologia

Planejamento Composto Central (Central Composite Design)

A rotabilidade () depende do nº. de pontos na porção fatorial do


planejamento, e é dado pela equação abaixo:

  2 
1
K 4

Tabela 14: Valor de  em função do nº. de fatores


Nº. da Fatores (k) Porção Fatorial 
2 22 22/4 = 1,414
3 23 23/4 = 1,682
4 24 24/4 = 2,00
5 25 25/4 = 2,378
Estatística para Bioquímica e Biotecnologia

Planejamento Composto Central (Central Composite Design):

A Figura 10 apresenta os pontos do planejamento composto central para


o caso de 2 fatores (variáveis independentes).

Figura 11: Pontos experimentais para o planejamento composto central


Estatística para Bioquímica e Biotecnologia

Planejamento Composto Central Rotacional


ESTUDO DE CASO 1 (Atividade Enzimática)
Ensaios pH Temperatura (ºC) Atividade
Enzimática (U/mL)
1 -1,00 (3,6) -1,00 (36) 272
2 -1,00 (3,6) 1,00 (64) 457
3 1,00 (6,4) -1,00 (36) 83
4 1,00 (6,4) 1,00 (64) 16
5 -1,41 (3,0) 0,00 (50) 360
6 1,41 (7,0) 0,00 (50) 83
7 0,00 (5,0) -1,41 (30) 132
8 0,00 (5,0) 1,41 (70) 328
9 (C) 0,00 (5,0) 0,00 (50) 396
10 (C) 0,00 (5,0) 0,00 (50) 412
11 (C) 0,00 (5,0) 0,00 (50) 393
12 (C) 0,00 (5,0) 0,00 (50) 371
Estatística para Bioquímica e Biotecnologia

Planejamento Composto Central Rotacional:


Ajuste do Modelo

O modelo quadrático que correlaciona os


parâmetros estudados é dado pela equação:

Atividade  393  127,72 pH  90,44 pH 2  49,40T  86,19T 2  63 pH * T


Estatística para Bioquímica e Biotecnologia

Planejamento Composto Central Rotacional:


ANOVA Anexo 2

Tabela 15: Tabela ANOVA - Atividades Enzimáticas (U/mL) DCCR


Fonte de Soma dos Graus de Média dos Fcal
Variação Quadrados Liberdade Quadrados
(SQ) (MQ)
Regressão 249153,5 (p-1) 5 49830,70 25,29
Resíduo 11820,8 (n-p) 6 1970,13
Falta de Ajuste 10966,8 (m-p) 3 36655,60 129,06
Erro Puro 854 (n-m) 3 284,67
R2=95,47%
Total 260974,3 (n-1) 11
nº. total de ensaios (n=12); nº. de parâmetros do modelo (p=6); nº de níveis distintos (m=9)

F0,95; 5; 6 = 4,4 e F0,95; 3; 3 = 9,28


Estatística para Bioquímica e Biotecnologia

Planejamento Composto Central (Central Composite Design)


Pareto Chart of Standardized Effects; Variable: Atividade Enzimática (U/mL)
2 factors, 1 Blocks, 12 Runs; MS Residual=1970,132
DV: Atividade Enzimática (U/mL)

(1)pH(L) -8,13854

pH(Q) -5,15455

Temperatura (ºC)(Q) -4,91232

(2)Temperatura (ºC)(L) 3,147812

1Lby2L -2,83872

p=,05

Standardized Effect Estimate (Absolute Value)

Figura 12: Gráfico de Pareto (Central Composite Design)


Estatística para Bioquímica e Biotecnologia

Planejamento Composto Central (Central Composite Design)


Observed vs. Predicted Values
2 factors, 1 Blocks, 12 Runs; MS Residual=1970,132
DV: Atividade Enzimática (U/mL)
500

450

400

350
Predicted Values

300

250

200

150

100

50

-50
-50 0 50 100 150 200 250 300 350 400 450 500 550

Observed Values

Figura 13: Valores Preditos versus Observados


Estatística para Bioquímica e Biotecnologia

Planejamento Composto Central (Central Composite Design)


Fitted Surface; Variable: Atividade Enzimática (U/mL)
2 factors, 1 Blocks, 12 Runs; MS Residual=1970,132
DV: Atividade Enzimática (U/mL)

600
400
Atividade Enzimáti

200
0
0
-2 0
/mL)

0
-4 0
0
-6 0
ca

75 0
(U

7 5 7
7 ,5
Te 6 6 0 6 ,5 , 0
mp 55 6
era 5 ,0
50 5 5 ,5
tur 4 0 4,5 ,0
a( 4 5 4
ºC 3, ,0 pH > 400
) 3 30 3
2 ,0
5
2 5 ,5 < 300
< 100
< -100
< -300
< -500

Figura 14: Superfície de Resposta (Central Composite Design)


Estatística para Bioquímica e Biotecnologia

Planejamento Composto Central (Central Composite Design)


Fitted Surface; Variable: Atividade Enzimática (U/mL)
2 factors, 1 Blocks, 12 Runs; MS Residual=1970,132
DV: Atividade Enzimática (U/mL)
75

70

65

60
Temperatura (ºC)

55

50

45

40

35
> 400
30 < 300
< 100
25
< -100
2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5
< -300
pH < -500

Figura 15: Curvas de Contorno (Central Composite Design)


REFERÊNCIAS:

BARROS NETO, B.; SCARMINIO, I. S.; BRUNS, R.


E. Planejamento e Otimização de Experimentos.
Campinas: Editora da UNICAMP, 1995.
MONTGOMERY, D. C. Introdução ao Controle
Estatístico da Qualidade, 4º edição, Rio de
Janeiro: Editora LTC, 2009.
Rodrigues , M. Isabel e Iemma, A. Francisco.
Planejamento de Experimentos e Otimização de
Processos, Campinas: Editora Casa do Pão, 2ª.
edição, 2009.
ANEXO 1 (Tabela t Student)

Slide 11
Slide 54
Slide 78
ANEXO 2 (Tabela F de Fisher - 95% confiança)

Slide 49
Slide 74
Slide 78
Slide 86

Potrebbero piacerti anche