Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Como a Estatística
1
Pode Ajudar
... Porque ter a mente boa não é o bastante; o principal é aplicá-la bem. As maiores
almas são capazes tanto das maiores virtudes quanto dos maiores vícios, e aqueles que
marcham lentamente podem avançar muito mais, se seguirem o caminho certo, do
que os que correm porém dele se afastam.
Descartes, Discurso sobre o método, parte I.
Este é um livro sobre o bom senso. Mais especificamente, sobre o bom senso na
realização de experimentos e na análise de seus resultados. No início do Discurso
sobre o método, um pouco antes da citação acima, Descartes diz que, de todas as
coisas no mundo, a mais bem distribuída é o bom senso, porque “todos se acham
tão abundantemente providos [de bom senso] que mesmo aqueles mais difíceis de
se contentar em outros assuntos comumente não desejam mais bom senso do que já
têm” (Descartes, 1637). Se você acredita nisso (Descartes obviamente não acredita-
va), este livro não é para você.
Digamos, porém, que você esteja de acordo com Descartes − afinal, você con-
tinuou lendo − e ache que nem tudo que parece óbvio é tão óbvio assim. Nesse
caso, se você estiver envolvido com experimentação, seja na vida acadêmica, seja na
indústria, seja num laboratório de pesquisa ou desenvolvimento, este livro poderá
lhe ser bastante útil. Com ele você poderá aprender a realizar seus experimentos e
tirar suas conclusões de forma mais econômica e eficaz.
Nos capítulos seguintes apresentaremos algumas técnicas relativamente
simples e fáceis de empregar. Como o ovo de Colombo, essas técnicas poderão
até parecer óbvias depois que você refletir um pouco sobre elas, mas isso não
lhes tira o mérito nem a eficácia. Para deixar mais claro o que queremos dizer,
16
Como Fazer Experimentos
vamos considerar um exemplo prático, muito fácil de encontrar na vida real, prin-
cipalmente na indústria, onde a relação custo/benefício é sempre uma questão
importante.
Digamos que um químico deseje obter o rendimento máximo em uma certa
reação, e que essa reação seja controlada por apenas duas variáveis: a temperatura
e a concentração de um determinado reagente. Na nomenclatura que adotaremos
neste livro, a propriedade de interesse, que neste caso é o rendimento, é chamada
de resposta. As variáveis que em princípio influenciam a resposta (isto é, a tempe-
ratura e a concentração) são os fatores, e a função que descreve essa influência é
chamada de superfície de resposta. O objetivo do pesquisador é descobrir quais
os valores − os níveis − dos dois fatores que produzem a maior resposta possível.
Como você faria para resolver esse problema?
Eis uma sugestão. Para manter as coisas sob controle, fixamos um dos fatores
num certo nível e variamos o outro até descobrir qual o nível desse outro fator que
produz o maior rendimento. Variando só um dos fatores estaremos nos assegurando
de que qualquer mudança na resposta terá sido causada pela modificação do nível
desse fator. Depois, mantendo esse fator no nível ótimo encontrado, variamos o nível
do primeiro fator (o que tinha sido fixado), até descobrir o valor dele que também
produz um rendimento máximo. Pronto. O experimento acabou, e descobrimos os
valores ótimos que estávamos procurando, certo?
Errado! Esse pode ser o senso comum, mas certamente não é bom senso.
Quase todas as pessoas a quem perguntamos concordaram que o procedimento
que acabamos de descrever era “o mais lógico”, e no entanto existe uma maneira
muito mais eficaz de fazer o experimento. Aliás, com esse “senso comum” o rendi-
mento máximo só seria descoberto em circunstâncias muito especiais. Ao contrá-
rio do que se poderia esperar, é muito melhor fazer variar todos os fatores ao mesmo
tempo. A razão para isso é que as variáveis podem se influenciar mutuamente, e o
valor ideal para uma delas pode depender do valor da outra. Esse comportamento,
que chamamos de interação entre os fatores, é um fenômeno que ocorre com
muita frequência. Raras são as situações em que dois fatores atuam de forma real-
mente independente.
Este é apenas um exemplo de como o senso comum pode ser enganoso. Vol-
taremos a ele nos capítulos seguintes, para um tratamento detalhado. Neste capí-
tulo vamos apenas introduzir algumas noções básicas de modelagem e apresentar
sumariamente as técnicas que discutiremos ao longo do livro, tentando mostrar a
utilidade de cada uma delas na vida real.
17
Capítulo 1 Como a Estatística Pode Ajudar
Para resumir o conteúdo deste livro numa única frase, podemos dizer que o seu
objetivo é ensinar as técnicas mais empregadas para desenvolver modelos empíricos.
1
Aliás, o termo data mining está se tornando cada vez mais comum para descrever investigações exploratórias em
grandes bancos de dados, normalmente de interesse comercial.
20
Como Fazer Experimentos
dos experimentos em que esses dados devem ser obtidos. Quando isso não é feito da
forma apropriada, o resultado muitas vezes é uma montanha de números estéreis, da
qual estatístico algum conseguiria arrancar quaisquer conclusões.
A essência de um bom planejamento consiste em projetar um experimento de
forma que ele seja capaz de fornecer exatamente o tipo de informação que procu-
ramos. Para isso precisamos saber, em primeiro lugar, o que é mesmo que estamos
procurando. Mais uma vez, parece óbvio, mas não é bem assim. Podemos mesmo di-
zer que um bom experimentador é, antes de tudo, uma pessoa que sabe o que quer.
Dependendo do que ele queira, algumas técnicas serão mais vantajosas, enquanto
outras serão simplesmente inócuas. Se você quer tornar-se um bom planejador, por-
tanto, comece perguntando a si mesmo:
Yogi Berra, o astro do beisebol americano, também era conhecido por suas
tiradas espirituosas, e às vezes paradoxais. Uma delas se aplica perfeitamente neste
contexto: Se você não sabe para onde está indo, vai terminar batendo em outro lugar.
Imaginemos um eixo que descreva o progresso de uma investigação experi-
mental, desde uma situação de praticamente nenhuma informação até a constru-
ção de um (hipotético) modelo mecanístico global. Caminhar ao longo desse eixo
corresponderia a ir descendo as linhas da Tabela 1.1, que mostra um sumário do
conteúdo do livro. Na primeira linha, numa situação de pouca informação, sequer
sabemos quais são as variáveis mais importantes para o sistema que estamos es-
tudando. Nosso conhecimento talvez se limite a uma pequena experiência prática
ou a alguma informação bibliográfica. Nessas condições, a primeira coisa a fazer é
realizar uma triagem e descartar as variáveis não significativas, para não perder mais