Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
INSTITUTO DE MATEMÁTICA
Cadernos de Matemática e Estatística
Série B: Trabalho de Apoio Didático
ELEMENTOS DE BIOESTATÍSTICA: UM
CURSO INTRODUTÓRIO
Série B, nº 46
Porto Alegre, setembro de 1999
APRESENTAÇ‹O
1 Introdução ................................................................................................................... 1
1.1 0 Papel da Estatística na Área Biológica ................................................................... 1
1.2 Definições Básicas .................................................................................................... 6
3 Probabilidade .............................................................................................................. 33
3.1 Conceitos Básicos ..................................................................................................... 33
3.2 Risco Relativo e Razão de Chances ......................................................................... 40
3.3 Distribuições de Probabilidade .................................................................................. 48
3.3.1 Distribuição Binomial .............................................................................................. 49
3.3.2 Distribuição Normal ................................................................................................ 57
1 Introdução
1.1 O Papel da Estatística na Área Biológica
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
2
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
3
causadas por ação dinâmica do próprio atleta (sem contato físico com outros atletas), enquanto que lesões
exógenas são aquelas causadas pelo contato físico com outros atletas. Os tipos de lesão são contratura (espasmo
muscular), contusão, entorse, deformidade da coluna vertebral, distensão, fratura, lesão tendínea e luxação.
Durante a pré-temporada de 1997, os atletas apresentaram 11 lesões (seis lesões tendíneas,
quatro contraturas e uma entorse), sendo que 90,9% das lesões foram provocadas por mecanismos autógenos.
O valor médio da característica Vo2 máximo na pré-temporada foi 53,47 ml/Kg/min, sendo que
aproximadamente metade dos atletas (17) apresentou valores de Vo2 máximo acima desta média. Os 18 atletas
restantes apresentaram valores de Vo2 máximo abaixo da média. Os procedimentos utilizados para medir o Vo2
máximo são descritos na referência citada.
É conveniente, também, apresentar um estudo observacional amplamente analisado na
literatura, que será discutido no decorrer do curso. Trata-se de uma investigação onde se procurou avaliar a
relação entre a presença da bactéria Streptococcus pyogenes e o aumento das amígdalas em crianças. A Tabela
1.1 apresenta os dados referentes à classificação de 1398 crianças entre 0 a 15 anos de acordo com o tamanho
relativo de suas amígdalas e com a característica “portadora” ou “não portadora” de Streptococcus pyogenes. A
informação foi inicialmente apresentada por Holmes & Williams (1954) e analisada por Armitage (1955),
Armitage (1974), McCullagh (1980) e Vigo (1994).
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
4
A Tabela 1.2 apresenta um resumo dos resultados produzidos pela aplicação de diferentes
técnicas de análise estatística aos dados deste exemplo. Uma detalhada discussão sobre o emprego dessas
técnicas de análise e dos correspondentes resultados gerados pode ser encontrada em Vigo (1994). Neste
momento, é conveniente enfatizar o modelo de odds proporcionais proposto por McCullagh (1980), que faz
parte de uma classe de modelos de regressão para analisar a dependência entre uma variável categórica ordenada
e um conjunto de covariáveis. Uma de suas vantagens sobre as demais técnicas é que permite estimar tanto a
direção quanto a magnitude do efeito da presença de Streptococcus pyogenes sobre o tamanho das amígdalas.
Assim, os resultados sugerem que crianças portadoras da bactéria Streptococcus pyogenes têm
aproximadamente 1,8 vezes mais chances de apresentar amígdalas aumentadas ou grandemente aumentadas do
que crianças não portadoras da bactéria.
Tabela 1.2 – Resumo dos resultados das técnicas de análise estatística aplicadas aos dados do
estudo observacional sobre o tamanho relativo de amígdalas.
Método de análise Conclusões
Há evidências de que as proporções das
χ 2 DE PEARSON
categorias de tamanho de amígdalas são
veja Vigo (1994, p. 12) diferentes para portadores e não portadores de
Streptococcus pyogenes.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
5
Estes casos são exemplos de estudos observacionais, caracterizados pelo fato de que não
houve interferência do pesquisador, ao contrário dos estudos experimentais. Existem vários tipos de estudos
experimentais utilizados na área biológica e médica, e definições básicas e exemplos reais de alguns
experimentos podem ser encontrados em Soares & Siqueira (1999, p.14-29). Uma descrição detalhada dos
aspectos teóricos da metodologia de planejamento de experimentos pode ser encontrada, por exemplo, Agresti
(1990) e Montgomery (1991).
Como ilustração de um estudo experimental aplicado à pesquisa médica, é interessante
mencionar o primeiro relato de um ensaio clínico planejado para comprovar a eficácia do AZT (zidovudina) no
prolongamento da vida de aidéticos. Os dados foram publicados por Fischl et al. (1987) e posteriormente
discutidos por Soares & Siqueira (1999, p.176-183).
O experimento considerou essencialmente o acompanhamento de 282 pacientes aidéticos
durante 24 semanas de tratamento, os quais foram aleatoriamente divididos em dois grupos: o grupo de
pacientes tratados com AZT (composto por 145 aidéticos) e o grupo controle, composto por 137 aidéticos que
receberam o placebo. A variável resposta (desfecho) é a situação do paciente (sobrevivente ou não sobrevivente)
após as 24 semanas de tratamento. Os resultados são reproduzidos na Tabela 1.3.
baseado na estatística χ 2 (lê-se qui-quadrado) de Pearson, o qual será discutido na Seção 8.3. O valor calculado
2
da estatística de teste foi χ calc = 15,017 , cuja probabilidade “exata” de significância associada (p_value, em
inglês) é p < 0,0001 . Este resultado evidencia que a verdadeira proporção de pacientes aidéticos que
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
6
sobrevivem após 24 semanas é maior quando são tratados com AZT em relação aos não tratados (isto é, que
recebem o placebo).
A definição formal de testes de hipóteses e dos aspectos teóricos necessários para suas
aplicações serão abordados na Seção 6.2. Testes de hipóteses particulares também serão abordados nos capítulos
7 e 8. Na Seção 8.2, por exemplo, o teste de homogeneidade de populações será discutido e, na sua
exemplificação, o problema acima será detalhadamente considerado.
Outro exemplo de estudo experimental é o ensaio clínico planejado para avaliar a eficácia do
tratamento da candidíase oral crônica mediante a droga denominada clotrimazole. Utilizando um sistema de
aleatorização foram definidos dois grupos de 10 indivíduos: o grupo controle ao qual foi administrado um
placebo e o grupo de pacientes tratados, que recebeu a droga. Os dados mostrados na Tabela 1.4 ilustram essa
questão; eles foram publicados por Kirkpatrick & Alling (1978) e posteriormente analisados por Moses et al.
(1984) – a ordem de classificação é explicada nessas referências.
Moses et al. (1984) ilustram a aplicação de diferentes métodos estatísticos para analisar os
resultados gerados neste experimento, cabendo destacar o teste de Mann-Whitney (também conhecido como
teste de Wilcoxon) para amostras independentes, concluindo que o tratamento mediante a droga clotrimazole é
superior ao placebo; ou seja, a droga clotrimazole é eficaz para o tratamento da candidíase oral crônica.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
7
cuja informação pode diferir de um indivíduo para outro, é denominada variável. Existem vários tipos de
variáveis, as quais são definidas basicamente de acordo com o sistema de medida associado.
Um sistema de medida é um procedimento operacional que utiliza uma regra para atribuir
números ou outros rótulos a indivíduos. A regra usualmente especifica as categorias de um atributo variável ou
algum aspecto quantitativo de uma observação variável, definindo, assim, uma escala de medida. Escalas de
medidas comumente são classificadas como sendo nominais, ordinais, de intervalo e de razão, podendo medir
variáveis discretas ou contínuas - veja Cureton (1978, p.764) e Vigo (1994, p.7-8).
Variáveis cuja escala de medida consiste de um conjunto de categorias disjuntas são
denominadas variáveis categóricas ou qualitativas. Elas surgem nas mais diversas áreas do conhecimento, tais
como ciências sociais, epidemiologia, ecologia, educação, medicina, etc. Por exemplo, o estado de evolução de
uma doença pode ser medido como “doença progressiva”, “remissão parcial” ou “remissão completa”. Existem
muitos tipos de variáveis categóricas, de acordo com a escala de medida utilizada. Assim, variáveis categóricas
para as quais não existe uma ordem natural dos níveis ou categorias são ditas nominais. Em uma escala nominal,
os números meramente identificam os indivíduos ou as categorias de um atributo através do qual os indivíduos
podem ser classificados. Os números atribuídos aos jogadores de futebol constituem um bom exemplo de escala
nominal. Sem perda de informação, letras, palavras ou símbolos arbitrários poderiam ser empregados nesse
caso. Exemplos de variáveis nominais são estado civil (solteiro, casado, divorciado, viúvo, desquitado) e
religião (católica, protestante, judaica, outra). Para variáveis nominais, a ordem em que aparecem as categorias
deveria ser irrelevante na análise estatística, no sentido de que diferentes permutações na ordem das mesmas
devem conduzir aos mesmos resultados, veja Cureton (1978).
Em muitas variáveis categóricas, contudo, existe uma ordem natural dos seus níveis, mas as
distâncias absolutas entre eles são desconhecidas ou nem mesmo estão definidas. Essas variáveis são chamadas
de categóricas ordenadas. A principal característica de um conjunto de categorias ordenadas é que elas
expressam, em ordem crescente ou decrescente, a extensão ou o grau de intensidade de um fenômeno
observável. O exemplo anterior, relativo ao estado de evolução de uma doença, constitui uma aplicação na área
médica. Outros exemplos são gravidade de uma fratura (leve, média, grave), classe social (baixa, média, alta) e
atitude política (liberal, moderado, conservador). Variáveis contínuas medidas através de postos ou escores
(denominados ranks em inglês) também são tratadas como categóricas ordenadas.
Variáveis cuja escala medida é a escala de intervalo ou a escala de razão são chamadas de
variáveis quantitativas. A escala de razão é caracterizada pelo fato de que existe um tamanho de intervalo
constante e o ponto zero é verdadeiro (absoluto). O tamanho de intervalo constante significa que, por exemplo
na medição da altura de determinado indivíduo, a diferença de altura entre 36 cm e 37 cm é a mesma do que
entre 39 cm e 40 cm. Exemplos de escala de razão são as medidas de altura, número de itens, peso, volume,
capacidade, taxas, tempo, etc. A escala de intervalo, por sua vez, é caracterizada pelo fato de que embora esteja
satisfeita a propriedade de tamanho de intervalo constante, o ponto zero não é absoluto. Um exemplo clássico é
quando a temperatura é medida em graus Celsius ou em graus Fahrenheit, em cujas escalas o ponto zero é
arbitrário.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
8
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
9
A aplicação dos métodos estatísticos tem como finalidade básica a análise e a interpretação
de dados gerados em estudos observacionais ou experimentais. Como mencionado anteriormente, a Estatística é
vital para transformar uma massa crítica de dados em informação relevante sobre o fenômeno em estudo.
Procedimentos simples de organização e síntese dos dados usualmente geram uma quantidade de informação
bem maior do que com os dados brutos, pois permitem interpretá-los de forma mais rápida e simples. A área da
Estatística que trata da organização e do resumo de dados é chamada de Estatística Descritiva ou, mais
recentemente, de Análise Exploratória de Dados.
A Análise Exploratória de Dados é um conjunto de métodos que permite identificar a
presença de valores aberrantes (outliers, em inglês), construir valores que traduzam o elemento típico e
quantificar a variabilidade dos dados. Quanto à organização e descrição dos dados, a Análise Exploratória de
Dados consiste basicamente na representação dos dados em tabelas e gráficos, bem como na construção de
medidas de síntese numérica. Em geral, é aplicada antes de técnicas de análise mais sofisticadas e pode
contribuir enormemente para a geração de hipóteses sobre o objeto em estudo.
Para ilustrar os procedimentos de análise exploratória de dados, é conveniente considerar o
exemplo abaixo, que trata do estudo sobre doenças cardiovasculares em Honolulu, Havaí.
Exemplo 2.1: Em 1969 foi conduzido um estudo para investigar o comportamento de algumas características
possivelmente associadas às doenças cardiovasculares, em homens da cidade de Honolulu, Havaí. Para tanto,
foram observados 7683 casos de homens com problemas cardíacos. Este estudo é descrito por Kuzma (1998) e
por Soares & Siqueira (1999, p.37), sendo que nesta última referência foram disponibilizadas (através do site
www.est.ufmg.br/~estmed) as informações relativas a uma amostra de 100 destes pacientes. As características
estudadas e os correspondentes códigos utilizados são:
1 = Nenhuma
2 = Primeiro Grau Incompleto
3 = Primeiro Grau Completo
4 = Segundo Grau Completo
5 = Curso Técnico
6 = Curso Superior
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
10
0 = Não Fumante
1 = Fumante
Atividade Física → variável qualitativa observada através das seguintes categorias ordenadas:
1 = Sedentário
2 = Moderada
3 = Alta
Nível de Glicose no Sangue (em miligramas percentuais) → variável quantitativa contínua.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
11
Tabela 2.1 – Codificação das respostas associadas às variáveis do estudo sobre doenças
cardiovasculares em Honolulu, para a amostra de 100 pacientes.
Paciente Nível de Peso Altura Idade Hábito Atividade Nível de Nível de Pressão
nº Instrução (em kg) (em cm) (em anos) de Física Glicose Colesterol Sérico Sistólica
Fumar (em mg%) (em mg%) (em mmHg)
1 2 70 165 61 1 1 107 199 102
2 1 60 162 52 0 2 145 267 138
3 1 62 150 52 1 1 237 272 190
4 2 66 165 51 1 1 91 166 122
5 2 70 162 51 0 1 185 239 128
6 4 59 165 53 0 2 106 189 112
7 1 47 160 61 0 1 177 238 128
8 3 66 170 48 1 1 120 223 116
9 5 56 155 54 0 2 116 279 134
10 2 62 167 48 0 1 105 190 104
11 4 68 165 49 1 2 109 240 116
12 1 65 166 48 0 1 186 209 152
13 1 56 157 55 0 2 257 210 134
14 2 80 161 49 0 1 218 171 132
15 3 66 160 50 0 2 164 255 130
16 4 91 170 52 0 2 158 232 118
17 3 71 170 48 1 1 117 147 136
18 5 66 152 59 0 2 130 268 108
19 1 73 159 59 0 2 132 231 108
20 4 59 161 52 0 1 138 199 128
21 1 64 162 52 1 1 131 255 118
22 3 55 161 52 1 1 88 199 134
23 2 78 175 50 1 1 161 228 178
24 2 59 160 54 0 1 145 240 134
25 3 51 167 48 1 2 128 184 162
26 3 83 171 55 0 1 231 192 162
27 2 66 157 49 1 2 78 211 120
28 4 61 165 51 0 1 113 201 98
29 2 65 160 53 0 1 134 203 144
30 3 75 172 49 0 1 104 243 118
31 4 61 164 49 0 2 122 181 118
32 1 73 157 53 1 2 442 382 138
33 2 66 157 52 0 1 237 186 134
34 1 73 155 48 0 2 148 198 108
35 2 61 160 53 0 1 231 165 96
36 3 68 162 50 0 2 161 219 142
37 2 52 157 50 0 2 119 196 122
38 5 73 162 50 0 1 185 239 146
39 1 52 165 61 1 2 118 259 126
40 1 56 162 53 1 1 98 162 176
41 3 67 170 48 1 2 218 178 104
42 1 61 160 47 0 1 147 246 112
43 3 52 166 62 1 2 176 176 140
44 2 61 172 56 1 2 106 157 102
45 3 62 164 55 1 2 109 179 142
46 2 56 155 57 1 2 138 231 146
47 1 55 157 50 0 2 84 183 92
48 3 66 165 48 1 2 137 213 112
49 1 59 159 51 0 2 139 230 152
50 3 53 152 53 1 2 97 134 116
51 5 71 173 52 0 2 169 181 118
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
12
Tabela 2.1 – Codificação das respostas associadas às variáveis do estudo sobre doenças
cardiovasculares em Honolulu, para a amostra de 100 pacientes.
Paciente Nível de Peso Altura Idade Hábito Atividade Nível de Nível de Pressão
nº Instrução (em kg) (em cm) (em anos) de Física Glicose Colesterol Sérico Sistólica
Fumar (em mg%) (em mg%) (em mmHg)
52 2 57 152 49 0 1 160 234 128
53 2 73 165 50 1 1 123 161 116
54 3 75 170 49 0 2 130 289 134
55 3 80 171 50 1 2 198 186 108
56 4 49 157 53 0 1 215 298 134
57 4 65 162 52 0 1 177 211 124
58 2 82 170 56 0 2 100 189 124
59 3 55 155 52 0 2 91 164 114
60 3 61 165 58 0 1 141 219 154
61 2 50 155 54 1 2 139 287 114
62 5 58 160 56 0 1 176 179 114
63 1 55 166 50 1 2 218 216 98
64 5 59 161 47 0 2 146 224 128
65 2 68 165 53 1 1 128 212 130
66 2 60 170 53 1 2 127 230 122
67 1 77 160 47 1 1 76 231 112
68 5 60 155 52 0 1 126 185 106
69 3 70 164 54 0 1 184 180 128
70 2 70 165 46 0 1 58 205 128
71 3 77 160 58 1 1 95 219 116
72 5 86 160 53 0 2 144 286 154
73 2 67 152 49 1 2 124 261 126
74 3 77 165 53 1 1 167 221 140
75 3 75 169 57 0 2 150 194 122
76 2 70 165 52 0 2 156 248 154
77 2 70 165 49 1 1 193 216 140
78 1 71 157 53 0 1 194 195 120
79 1 55 162 49 0 2 73 217 140
80 2 59 165 53 1 2 98 186 114
81 3 64 159 50 0 2 127 218 122
82 1 66 160 54 0 1 153 173 94
83 4 59 165 60 0 2 161 221 122
84 3 68 165 57 0 1 194 206 172
85 5 58 160 52 0 1 87 215 100
86 1 57 154 65 1 1 188 176 150
87 2 60 160 65 0 2 149 240 154
88 2 53 162 62 0 1 215 234 170
89 2 61 159 62 1 2 163 190 140
90 1 66 154 62 0 1 111 204 144
91 1 61 152 67 0 2 198 256 156
92 2 52 152 66 0 2 265 296 132
93 1 59 155 62 0 2 143 223 140
94 1 63 155 62 1 1 136 225 150
95 2 61 165 63 0 2 298 217 130
96 2 68 155 67 0 2 173 251 118
97 1 58 170 62 0 1 148 187 162
98 3 68 160 55 0 1 110 290 128
99 5 60 159 50 0 2 188 238 130
100 2 61 160 54 1 1 208 218 208
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
13
Na forma como os dados estão apresentados na Tabela 2.1, contudo, não é possível extrair
praticamente nenhuma informação sobre o comportamento das variáveis em estudo. Em outras palavras, para
entender melhor o comportamento dessas variáveis é necessário organizar e apresentar os dados brutos em uma
forma mais apropriada, como será visto na próxima seção.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
14
pressão sistólica observados na amostra e estão em ordem crescente. Assim, na primeira linha da tabela, o valor
x = 92 representa o menor nível de pressão sistólica observado na amostra, que é igual a 92 mmHg. Por sua
vez, o maior valor observado foi x = 208 mmHg .
A segunda coluna da Tabela 2.2 contém o número de vezes que cada valor de pressão
sistólica ( x ) foi observado na amostra. Esta medida é chamada de freqüência absoluta e usualmente
amostra que apresentaram um valor da característica em estudo igual ao valor x da i-ésima linha da tabela.
Para os dados da Tabela 2.2, f1 = 1 significa que apenas um paciente da amostra apresentou
pressão sistólica igual a 92 mmHg (que é o valor da primeira linha da tabela). Analogamente, na 18ª linha, o
valor da pressão sistólica é x = 128 mmHg , ao qual está associada a freqüência absoluta f18 = 8 , ou seja, 8
freqüência relativa correspondente ao valor da i-ésima linha da tabela, usualmente representada por f ri e
fi
definida por f ri = . Assim, a freqüência relativa f ri representa a proporção de indivíduos da amostra que
n
apresentam um valor da variável em estudo igual ao valor de x da linha i.
1 8
Por exemplo, na Tabela 2.2, f r1 = = 0,01 e f r18 = = 0,08 . Uma maneira usual de
100 100
interpretar a freqüência relativa é transformá-la em percentual, mediante a sua multiplicação por 100. Dessa
forma, f r1 × 100 = 0 ,01 × 100 = 1% , significa que 1% dos indivíduos da amostra apresentaram pressão
sistólica igual a 92 mmHg. Analogamente, 8% dos pacientes da amostra (isto é, f r18 × 100 = 8% ) apresentaram
pressão sistólica igual a 128 mmHg. Como as freqüências relativas são calculadas em relação ao tamanho da
L
amostra n , então o total desta coluna será obrigatoriamente igual a 1, , ou seja, ∑1 f
i=
ri = 1 (exceto, em alguns
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
15
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
16
Outra medida que geralmente pode ser útil para interpretar os dados gerados na amostra é a
freqüência absoluta acumulada, denotada por F . A freqüência absoluta acumulada da linha i é definida pela
i
soma das freqüências absolutas até a i-ésima linha, ou seja, Fi = ∑f
j =1
j . Consequentemente, Fi representa o
número de indivíduos da amostra que apresentam valores da variável em estudo menores ou iguais ao valor x
correspondente a i-ésima linha da tabela. Por exemplo, na Tabela 2.2, a freqüência absoluta acumulada da linha
18 é F18 = 54 . Isto significa que 54 pacientes da amostra apresentaram pressão sistólica menor ou igual a 128
onde n é o tamanho da amostra. Naturalmente que este resultado é apenas uma referência, devendo-se fazer os
ajustes apropriados levando-se em conta as características práticas do problema. Em outras palavras, pode-se
aumentar ou diminuir o valor k em função da conveniência e clareza de apresentação. O número de intervalos
de classe também pode ser determinado através das expressões k = n ou k = 1 + log 2 n , descritas por Soares
& Siqueira (1999, p.42).
É importante salientar que os intervalos de classe devem ser disjuntos, ou seja, não pode
ocorrer sobreposição de classes, pois cada observação deve ser colocada em somente um intervalo de classe. É
preferível, também, que os intervalos de classe sejam todos do mesmo tamanho (amplitude). O tamanho dos
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
17
A
intervalos de classe pode ser determinado, ao menos aproximadamente, por a = , onde a é a amplitude dos
k
intervalos de classe e A é a amplitude de variação amostral, definida pela diferença entre o maior e o menor
valor observados na amostra.
Para ilustrar a construção de uma tabela de agrupamento por intervalos de classe, considere
as observações da variável pressão sistólica do Exemplo 2.1, apresentadas na Tabela 2.2. Como o tamanho da
amostra é n = 100 , a aplicação da fórmula de Sturges produz
ou seja, o número de classes deveria ser aproximadamente igual a 8. Para determinar a amplitude das classes,
primeiro é necessário identificar o menor e o maior valor da amostra, isto é, a menor e a maior pressão sistólica
observada, que são respectivamente x( 1 ) = 92 mmHg e x( n ) = 208 mmHg . Assim, a amplitude amostral é
A 116
a= = = 14 ,5 ≅ 15 mmHg .
k 8
Resumindo, a tabela de distribuição de freqüências agrupadas por intervalos de classe para a
variável pressão sistólica deveria considerar 8 classes, todas com amplitude de 15 mmHg. Naturalmente que o
número de classes e a amplitude das classes poderiam ser modificados se na prática esta configuração implicasse
substancial perda de informação ou se o número de classes ainda fosse demasiadamente grande. Entretanto, a
solução obtida parece ser bastante razoável, produzindo o agrupamento disposto na Tabela 2.3.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
18
40
35
30
Freqüência Relativa
25
20
15
10
0
97,5 112,5 127,5 142,5 157,5 172,5 187,5 202,5
Naturalmente, o mesmo procedimento de organização dos dados pode ser utilizado para as
demais variáveis do Exemplo 2.1, permitindo apresentá-las de uma maneira mais adequada e diminuindo
substancialmente o esforço necessário para interpretá-las. A título de ilustração, considere a variável qualitativa
nível de instrução, cujas informações geradas na amostra são apresentadas através da distribuição empírica de
freqüências mostrada na Tabela 2.4.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
19
Como se trata de uma variável qualitativa, a representação gráfica dos dados da Tabela 2.4
pode ser realizada mediante o gráfico de barras disposto na Figura 2.2.
40
35
30
Freqüência Relativa
25
20
15
10
0
Nenhuma 1º Grau Comp. Curso Técnico
1º Grau Inc. 2º Grau Comp.
Nível de Instrução
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
20
∑x
i =1
i
x= ,
n
e representa o “centro de gravidade” ou o “ponto de equilíbrio” da distribuição.
n
O termo ∑x
i =1
i representa a soma dos elementos do conjunto de dados ( x1 + x2 + ... + xn ) ,
ou seja, a soma dos valores da variável em estudo para cada indivíduo da amostra. Para facilitar a ilustração do
cálculo das medidas de tendência central, é conveniente utilizar os dados da variável pressão sangüínea sistólica
definida no Exemplo 2.1, onde a soma dos valores da pressão sistólica para cada um dos 100 indivíduos da
100
amostra é igual a ∑x
i =1
i = ( x1 + x 2 + L + x100 ) = (102 + 138 + L + 208) = 13010 mmHg – veja os valores
∑x
i =1
i
13010
x= = = 130,10 mmHg .
n 100
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
21
∑f
i =1
i × xi
x= ,
n
onde L é o número de linhas da tabela, ou seja, o número de valores xi distintos que apareceram na amostra,
pressão sistólica é
∑f
i =1
i × xi
1 × 92 + 1 × 94 + 1 × 96 + 2 × 98 + L + 1 × 208 13010
x= = = = 130 ,10 mmHg .
n 100 100
Se os dados estão agrupados por intervalos de classe, o cálculo da média aritmética segue os
mesmos princípios do caso em que os dados estão em uma tabela de agrupamento simples. Entretanto, como as
informações disponíveis são os intervalos de classe (e não os valores exatos da variável), deve-se utilizar o
ponto médio de cada classe como o valor de xi , para todo i = 1,2 ,..., L , onde L = k é o número de classes. Os
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
22
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
23
Utilizando os resultados da Tabela 2.6, quando a pressão sistólica está agrupada por
intervalos de classe, a média aritmética amostral é dada por
∑f
i =1
i × xi
10 × 97 ,5 + 24 × 112,5 + L + 1 × 202,5 12990
x= = = = 129 ,90 mmHg .
n 100 100
Deve-se observar que o agrupamento dos dados em intervalos de classe praticamente não
provocou perda de informação, pois o valor de x = 129 ,90 mmHg está muito próximo da média
∑p ×x
i =1
i i
xp = n
,
∑p
i =1
i
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
24
onde pi representa o peso associado à observação xi . Um exemplo trivial surge no caso da nota final de uma
disciplina, onde a importância das provas é representada, por exemplo, pelos pesos 2, 3 e 5, respectivamente
para a primeira ( x1 ) , segunda ( x 2 ) e terceira ( x3 ) prova. Assim, a média ponderada seria determinada por
2 × x1 + 3 × x 2 + 5 × x3
m pond = .
2+3+5
por
x g = n x1 × x 2 × L × x n ,
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
25
Para ilustrar, considere os dados da variável pressão sistólica do Exemplo 2.1, dispostos na
Tabela 2.2. A primeira etapa está satisfeita, pois como os dados estão em uma tabela de distribuição de
freqüências, já estão ordenados. Na segunda etapa, como o tamanho da amostra (n = 100 ) é par, o valor da
n n+2
mediana é a média entre os valores que estão, respectivamente, nas posições = 50 e = 51 do conjunto
2 2
ordenado de observações. Outra alternativa para determinar a posição da mediana, independentemente do
n +1
tamanho n da amostra ser par ou ímpar, é utilizar a expressão . No exemplo, a posição da mediana é
2
n +1
= 50,5 e significa que a mediana é determinada através da média aritmética dos valores que estão nas 50ª
2
e 51ª posições do conjunto ordenado observações. Assim, a mediana amostral é
128 + 128
md = = 128 mm Hg ,
2
devendo ser interpretada da seguinte forma: metade dos indivíduos da amostra (50%) apresentou pressão
sistólica menor ou igual a 128 mmHg, enquanto que os outros 50% dos pacientes apresentaram pressão sistólica
maior ou igual a 128 mmHg.
Se os dados estão agrupados por intervalo de classe, entretanto, o procedimento para
determinar a mediana é diferente daquele descrito acima, devendo-se calcular a mediana através da expressão
n − Fant
md = Linf + a × 2 ,
f
onde
Linf = limite inferior do intervalo de classe que contém a mediana;
Os dados da pressão sistólica agrupados por intervalos de classe dispostos na Tabela 2.3 são
úteis para ilustrar o procedimento de cálculo da mediana nesta situação. Como foi visto anteriormente, a
mediana está entre o 50º e 51º elementos do conjunto ordenado de observações. Isto significa que o valor da
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
26
mediana está dentro do intervalo de classe 120 | 135 mmHg. Então, para o cálculo da mediana deve-se
identificar as seguintes informações:
n = 100, Linf = 120, a = 135-120 = 15, Fant = 34 e f = 33.
É importante salientar que todas as observações são diretamente utilizadas para calcular a
média, não ocorrendo o mesmo com a mediana. Dessa forma, valores extremos (muito grandes ou muito
pequenos quando comparados aos demais valores da amostra) causam grandes perturbações na média, o que em
geral não ocorre com a mediana. Por esta razão, diz-se que a mediana é uma medida robusta, como pode ser
ilustrado através do exemplo hipotético descrito abaixo.
Exemplo 2.2 (dados hipotéticos): Um sonífero foi administrado em dois grupos de 5 pacientes
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
27
∑=
i 1
xi
30,35
x= = = 6,07 min utos ,
n 5
∑=
yi
49,65
y= i 1
= = 9,93 min utos .
n 5
Cabe observar que a discrepância entre essas médias é devida ao valor aparentemente atípico
em um paciente do grupo B (25,90 minutos), que está afetando substancialmente a média do grupo. Ao contrário
da média, a mediana amostral é igual nos dois grupos (6,05 minutos), indicando que o tempo até o início do
efeito do sonífero é similar em ambos os grupos. Em situações com esta, a mediana pode ser uma medida mais
adequada para representar o elemento típico da amostra, pois não é afetada por valores extremos.
Exemplo 2.3 (dados hipotéticos): A gravidade de uma fratura (da bacia, por exemplo) não pode ser
quantificada, mas é usual adotar uma variável ordinal definida pelas categorias “1-fratura leve”, “2-fratura
moderada” e “3-fratura severa”. Um grupo de 7 pacientes com fratura na bacia foi classificado de acordo com
este critério, tendo sido observados os seguintes níveis ou graus de severidade da fratura:
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
28
ser considerado moderado. Isso significa que 50% dos pacientes apresentaram fratura de severidade leve ou
moderada, enquanto que os outros 50% dos pacientes tiveram fratura moderada ou severa.
Por outro lado, a utilização de escores para representar a severidade da fratura deve ser
acompanha por uma profunda e criteriosa discussão, haja vista que a escolha subjetiva de diferentes sistemas de
escores poderia conduzir a conclusões diferentes ou até mesmo conflitantes. Por exemplo, ao invés de usar os
escores 1, 2 e 3 para as categorias leve, moderada e severa da variável severidade da fratura, poderiam ser
usados os escores 1, 5 e 7, respectivamente. Assim, a validade das conclusões depende essencialmente da
adequação do sistema de escores adotado.
Um exemplo real onde a média não está definida é o caso da variável nível de instrução
apresentada no Exemplo 2.1, cuja distribuição empírica de freqüências foi disposta na Tabela 2.4. A posição da
n +1
mediana, neste caso, é = 50,5 , de tal forma que o valor da mediana é md = 1º Grau Incompleto; ou seja
2
50% dos pacientes da amostra não tem instrução ou tem, no máximo, o primeiro grau incompleto.
Outra medida de tendência central comumente usada é a moda, que nada mais é do que o
valor mais freqüente do conjunto de observações. A moda está definida para qualquer tipo de variável, ou seja,
qualquer que seja a escala de medida utilizada. No entanto, ela é mais usada no caso de variáveis nominais, para
as quais a média e a mediana não estão definidas.
Como primeira ilustração, considere os dados do Exemplo 2.3, onde o valor modal é fratura
severa. Para os dados da variável pressão sistólica do Exemplo 2.1, a moda amostral é mo = 128 mmHg , que é
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
29
Freqüentemente não é suficiente usar apenas uma medida de posição para interpretar
adequadamente um conjunto de dados. Assim, juntamente com uma medida de tendência central é desejável
dispor de uma medida de dispersão dos dados, através da qual é possível quantificar a variabilidade em relação
ao centro da distribuição. As medidas de variabilidade comumente usadas são amplitude de variação e o desvio
padrão, definido como a raiz quadrada da variância.
A amplitude de variação, ou simplesmente amplitude, é a medida de dispersão mais simples,
definida como a diferença entre os valores extremos da distribuição e, quanto maior a amplitude, maior é a
variabilidade dos dados. No caso amostral, é a diferença entre o valor máximo e o valor mínimo observados na
amostra, isto é, A = X ( n ) − X ( 1 ) , onde X ( n ) e X ( 1 ) são as estatística que representam o máximo o mínimo
da amostra, respectivamente.
Para as observações da variável pressão sistólica do Exemplo 2.1, a amplitude amostral foi
calculada na Seção 2.1, quando foram determinados o número de intervalos de classe e o tamanho de cada
classe. Repetindo o procedimento, o mínimo e o máximo da amostra foram, respectivamente, x( 1 ) = 92 mmHg
e x( n ) = 208 mmHg , de tal forma que a amplitude amostral é A = x( n ) − x( 1 ) = 208 − 92 = 116 mmHg .
2
n
n n ∑
xi
2
∑=
i 1
( xi − x ) 2
∑=
i 1
2
xi − i =1
n
S = = .
n −1 n −1
Os dados do Exemplo 2.2, dispostos na Tabela 2.7 podem ser usados para ilustrar o cálculo
da variância amostral nesta situação. Assim, aplicando o último termo da fórmula acima, a variância do tempo
até o início do efeito do sonífero no Grupo A é
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
30
( 30,35 ) 2
184,66 −
s A2 = 5 = 0,11 (min utos ) 2 ,
5 −1
( 49 ,65 ) 2
811,91 −
s 2B = 5 = 79,72 (min utos ) 2 .
5 −1
2
L
L L
∑
f i × x i
∑f i × ( xi − x )
2
∑ f i × xi2 − i =1
n
=
2 i =1 i =1
S = .
n −1 n −1
Assim, por exemplo, para os dados da pressão sistólica do Exemplo 2.1, agrupados como na
Tabela 2.5, a variância amostral é
2
L
L
∑ f i × x i
∑ f i × xi2 − 1
i =
−
(13.010)2
n 1.737.124
s = i =1
2 = 100
n −1 99
Ainda para a pressão sistólica do Exemplo 2.1, a Tabela 2.6 apresenta o agrupamento por
intervalos de classe e, portanto, os valores xi são os pontos médios das classes. A variância amostral é
2
L
L
∑ f i × xi
∑ f i × xi2 −
i =1
1.732.725 −
(12.990)
2
n
s = 100 (mmHg )2 .
2 i =1
= = 457 ,83
n −1 99
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
31
Como conseqüência direta da sua definição, a variância sempre assume valores maiores ou
iguais a zero e, em linhas gerais, pode-se dizer que quanto maior a variância, maior é a variabilidade dos dados
em torno da média. A interpretação da variância fica prejudicada pelo fato de que sua unidade é o quadrado da
unidade da variável, como pode ser constatado nos exemplos acima. Dessa forma, para retornar a unidade de
medida original, define-se a medida de variabilidade chamada de desvio padrão como a raiz quadrada da
e, para o Grupo B,
Neste exemplo, tanto com a variância quanto com o desvio padrão claramente percebe-se
que a variabilidade em torno da média é muito superior no Grupo B, como conseqüência da observação
discrepante 25,90 minutos.
Para variável pressão sistólica do Exemplo 2.1, o desvio padrão é igual a
e, após o agrupamento dos dados da pressão sistólica em intervalos de classe, o desvio padrão é igual a
Percebe-se, assim, que o agrupamento em intervalos de classe adotado para a variável pressão sistólica
praticamente não alterou o valor do desvio padrão, sugerindo que a estratégia de agrupamento está adequada.
De forma análoga à variância, o desvio padrão também assume apenas valores maiores ou
iguais a zero e, de maneira geral, valores grandes indicam a presença de grande variabilidade. Contudo, devido à
ordem de grandeza intrínseca às variáveis, em muitas situações é difícil ou subjetivo definir o que é um valor
grande para o desvio padrão, sendo mais apropriado utilizar uma medida de variabilidade que independe da
unidade de medida da variável, chamada de coeficiente de variação, discutido na próxima seção.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
32
O coeficiente de variação assume valores no intervalo [0 ,+∞ ] e quanto menor o seu valor
mais homogêneo é o conjunto de dados. O coeficiente de variação é zero quando o desvio padrão é igual a zero,
ou seja, quando todos os valores observados na amostra são iguais (ausência completa de variabilidade). Como
uma regra geral, características que apresentam valor do coeficiente de variação menor do que 0,25 (ou 25%)
são relativamente homogêneas, mas isso depende muito da área de aplicação. Em variáveis vitais, por exemplo,
geralmente espera-se um coeficiente de variação muito menor do que 25% para que o conjunto de dados possa
ser considerado homogêneo.
No Exemplo 2.2, a intensidade da variabilidade em torno da média da variável tempo até o
início do efeito do sonífero pode ser avaliada através do coeficiente de variação. No Grupo A,
0 ,33
CV A = = 0 ,0544 ou 5,44 % ,
6 ,07
enquanto que no Grupo B,
8,93
CV B = = 0 ,8993 ou 89 ,93 % .
9 ,93
Assim, as observações do Grupo A podem ser consideradas homogêneos, ou seja, a variabilidade em torno da
média é pequena, mas o mesmo não ocorre no Grupo B.
A pressão sistólica do Exemplo 2.1, por sua vez apresenta um coeficiente de variação igual a
21,21
CV = = 0 ,1630 ou 16 ,30 % ,
130 ,10
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
33
3 Probabilidade
A grande maioria das variáveis da área biológica está sujeitas à variabilidade, devido ao fato
de que ela é inerente aos seres vivos. Assim, é conveniente dispor de uma medida que exprima essa incerteza,
através de uma escala numérica que varie do impossível ao certo. Esta medida é a probabilidade e o seu
conceito é fundamental para o estudo de situações onde os resultados não são previsíveis, veja Soares, Farias e
Cesar (1991).
Antes de definir probabilidade, é importante apresentar os conceitos de experimento
aleatório, de espaço amostral e de evento aleatório. Segundo Soares, Farias e Cesar (1991), um experimento
aleatório é o processo de coleta de dados, relativos a um fenômeno aleatório. O espaço amostral, por sua vez, é o
conjunto de todos os resultados possíveis de um experimento aleatório, enquanto que um evento aleatório é
qualquer subconjunto do espaço amostral. Esses conceitos podem ser melhor compreendidos através de
exemplos.
Exemplo 3.1: Considere o experimento aleatório que consiste no lançamento de uma moeda honesta, onde o
resultado observado é a face superior. Mantidas as mesmas condições, para cada repetição do experimento não é
possível prever o resultado, mas pode-se afirmar que o resultado será cara (C) ou coroa (K). Assim, o espaço
amostral associado ao experimento é o conjunto Ω = {C , K } , pois esses são os dois resultados possíveis em
cada lançamento da moeda honesta. Aqui, a “ocorrência do resultado cara” pode ser considerada um evento.
Exemplo 3.2: Considere o experimento aleatório que consiste no lançamento de um dado, observando-se o
resultado da face superior. O espaço amostral é o conjunto Ω = {1,2,3,4,5,6} , que corresponde aos possíveis
resultados do experimento. Exemplos de eventos são: { 1 },{ 2 },{ 3 },{ 4 },{ 5 },{ 6 },{ 1 ou 2 } ou { 1 ou 3 }. A
Exemplo 3.3: Uma ilustração da área da médica é a observação da pressão sistólica descrita no Exemplo 2.1.
O espaço amostral associado a este experimento é o intervalo (0 ,+∞ ) , ou seja, conjunto Ω = (0 ,+∞ ) . Assim,
admita que a variável X representa a pressão sistólica de um homem com problemas cardíacos da população
que foi investigada em Honolulu. Neste contexto, inúmeros eventos podem interessar ao pesquisador, tais como:
a) um paciente apresenta pressão sistólica maior do que 150 mmHg, ou seja, [ X > 150 mmHg ] ;
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
34
b) um paciente apresenta pressão sistólica inferior a 200 mmHg, ou seja, [ X < 200 mmHg ] ; ou,
c) um paciente tem pressão sistólica entre 110mmHg e 160 mmHg, ou seja,
[110 mmHg < X < 160 mmHg ] .
Exemplo 3.4: O número de pessoas acidentadas que chegam em um pronto socorro de um determinado
hospital durante uma madrugada pode ser considerado uma variável aleatória, cujo espaço amostral é
Ω = {0 ,1,2 ,3,L} .
Exemplo 3.5: Outra ilustração da área médica é o peso ao nascer, que pode estar associado a diversos fatores
genéticos ou ao comportamento da mãe, tais como a histórico clínico, alimentação, hábito de fumar, esforço
físico, renda, grau de instrução, etc. Nesta situação, o espaço amostral consiste no intervalo de peso (0,+∞) ,
medido em gramas, quilogramas ou outra unidade de peso. Assim, se Y é a variável que representa o peso ao
nascer, então o espaço amostral associado à variável aleatória Y é Ω = (0,+∞ ) . É claro que uma criança não
apresentaria um peso muito próximo ao valor 0 kg, nem tampouco um valor elevado (por exemplo, 10 kg).
Diversos eventos podem ser definidos neste contexto, mas se o pesquisador está interessado
em identificar os fatores que possivelmente favorecem o nascimento de uma criança com baixo peso, o primeiro
passo seria definir o evento “a criança apresenta baixo peso ao nascer”. Um critério usual é classificar como
baixo peso ao nascer as crianças que apresentam peso de nascimento inferior a 2,5 kg. Consequentemente, o
evento [Y < 2,5 kg ] representa o nascimento de uma criança com baixo peso, enquanto que o evento
[Y ≥ 2,5 kg ] representa uma criança que não apresenta baixo peso ao nascer. A próxima etapa seria estimar a
probabilidade de que uma criança apresente baixo peso ao nascer, em função da sua exposição aos fatores de
risco (fatores genéticos, habito de fumar da mãe, renda, hábitos alimentares da mãe, etc). A probabilidade deste
tipo de evento é denominada de probabilidade condicional e será definida a seguir.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
35
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
36
Para ilustrar, considere o Exemplo 3.2 relativo a um lançamento de um dado, onde o evento
A=[o resultado do experimento é par] e B=[o resultado do experimento é menor do que 5]. Assim, o evento
[A ∩ B] significa que o resultado é par e é menor do que 5. Mas o evento A ocorre se e somente se o
resultado é {2} ou {4} ou {6}, enquanto que B ocorre se e somente se o resultado é {1} ou {2} ou {3} ou {4}.
Portanto, como o evento [ A ∩ B ] deve satisfazer as duas condições, ele está associado a ocorrência do resultado
P[ A ∩ B ] = P[{2}ou{4}] = 1 + 1 = 1 .
6 6 3
Como ilustração de eventos mutuamente exclusivos, considere ainda o Exemplo 3.2 relativo
a um lançamento de um dado, onde A=[o resultado do experimento é par] e B=[o resultado do experimento é
ímpar]. Assim, a ocorrência do evento A impede a ocorrência de B, pois o primeiro está associado aos
resultados {2}, {4} ou {6}, enquanto que o segundo está associado à ocorrência dos resultados {1}, {3} ou {5}.
Em outras palavras, os eventos A e B não podem ocorrer simultaneamente, para o que se escreve A ∩ B = ∅ ,
cuja probabilidade é
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
37
Um exemplo trivial na área médica é o sexo de uma criança, cujos resultados possíveis são
masculino (M) e feminino (F), ou seja, o espaço amostral é Ω = {M , F } . Assim, a probabilidade de uma
exclusivos, pois a ocorrência de um dos eventos impede a ocorrência do outro. Em outras palavras, se uma
criança é do sexo masculino, então a mesma criança não pode ser do sexo feminino, e vice-versa. Nesta
situação, a ocorrência simultânea dos dois eventos, isto é, uma criança ser simultaneamente do sexo masculino e
do sexo feminino, definida por [M ∩ F ] é um evento impossível e, consequentemente,
P[M ∩ F ] = P[∅ ] = 0 .
A união de dois eventos A e B equivale à ocorrência de A, ou de B ou de ambos, ou seja,
contém os elementos do espaço amostral que estão em pelo menos um dos dois conjuntos. A união de dois
eventos A e B pode ser ilustrada pelo diagrama de Venn na Figura 3.3, como segue:
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
38
corresponde a não ocorrência do evento A, é denotado por A ou A C e representado pelo diagrama de Venn
mostrado na Figura 3.4.
Com base nestas definições de tipos de eventos, se A e B são dois eventos pertencentes a um
mesmo espaço amostral Ω , então valem as seguintes regras básicas:
[ ]
a) 0 ≤ P A ≤ 1 ⇒ uma probabilidade sempre é um número entre 0 e 1;
[ ]
b) P Ω = 1 ⇒ o espaço amostra é um evento certo; e,
[
c) se A e B são eventos mutuamente exclusivos, então P A ∪ B = P A + P B . ] [ ] [ ]
Como conseqüência destas regras, também se pode mostrar que para dois eventos A e B, valem as
seguintes relações:
[ ] [ ]
d) se os eventos A e B não são mutuamente exclusivos, então P A ∪ B = P A + P B − P A ∩ B ; e, [ ] [ ]
[ ]
e) como P Ω = 1 , então P A [ ] = 1 − P[A] .
C
P[ A ∩ B ] = P[ A] × P[B ] .
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
39
Exemplo 3.6: Como ilustração, considere um experimento que consiste em lançar um dado honesto duas
vezes e de forma independente, observando-se o resultado da face superior. Os 36 resultados possíveis desse
experimento são apresentados abaixo, onde cada par {i , j} representa a ocorrência da face i no primeiro
lançamento e da face j no segundo lançamento, para todo i = 1,2,..,6 e j = 1,2 ,..,6 . Assim, o espaço amostral
associado ao experimento é
{1,1} {1,2} {1,3} {1,4} {1,5} {1,6}
{2,1} {2,2} {2,3} {2,4} {2,5} {2,6}
{3,1} {3,2} {3,3} {3,4} {3,5} {3,6}
Ω= .
{4,1} {4,2} {4,3} {4,4} {4,5} {4,6}
{5,1} {5,2} {5,3} {5,4} {5,5} {5,6}
{6,1} {6,2} {6,3} {6,4} {6,5} {6,6}
P[ A] = P[{ 1,1 }ou{ 1,2 }ou{ 1,3 }ou{ 1,4 }ou{ 1,5 }ou{ 1,6 }] = 6 =1
36 6
e
P[B ] = P[{ 1,2 }ou{ 2 ,2 }ou{ 3,2 }ou{ 4 ,2 }ou{ 5,2 }ou{ 6,2 }] = 6 =1 ,
36 6
de tal forma que tanto a ocorrência quanto a não ocorrência do evento A não muda a probabilidade do evento B
ser observado, e vice-versa. Assim, intuitivamente fica caracterizado que os eventos A e B são independentes.
Ainda, os eventos A e B ocorrem simultaneamente somente quando o resultado é o par
{1,2}, cuja chance ou probabilidade é 1
36 . Assim, a probabilidade da ocorrência simultânea dos eventos A e B é
P[ A ∩ B ]
P[ A | B ] = .
P[B ]
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
40
A probabilidade condicional entre dois eventos A e B também pode ser usada para definir a
independência entre eles. De fato, o evento A é independente de B se e somente se a probabilidade do evento A
ocorrer não é afetada pela ocorrência ou não do evento B, de tal forma que P[ A | B ] = P[ A] . Analogamente,
simultaneamente se e somente se ocorre o ponto {1,2}, com probabilidade 136 . Desta forma, a probabilidade
de ocorrer face 2 no segundo lançamento, sabendo-se que no primeiro lançamento o resultado é igual a 1, é
1
P[ A ∩ B ] P[{ 1,2 }]
P[B | A] = = = 36 = 1 = P[B ] .
P[ A] 1 1 6
6 6
Segue, portanto, que os eventos A e B são independentes, como já havia sido mostrado.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
41
sendo conhecida como “o risco de desenvolver a doença para os indivíduos expostos ao fator A”.
De maneira similar, “o risco de desenvolver a doença para os indivíduos não expostos ao
fator A” é a probabilidade condicional
que assume valores no intervalo (0 ,+∞ ) . Conseqüentemente, para determinar o risco relativo é necessário
P1 P2
conhecer (estimar) as probabilidades condicionais de desenvolver a doença e .
P1 + P3 P2 + P4
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
42
Assim, o risco de desenvolver a doença entre os indivíduos expostos ao fator A pode ser
estimado por
^
P1 a
=
P1 + P3 a + b
a
^
RR = a + b .
c
c+d
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
43
Para exemplificar uma aplicação da medida do risco relativo, considere o estudo sobre o
efeito preventivo da aspirina na mortalidade de doenças cardiovasculares, discutido por Soares & Siqueira
(1999, p.2-3, p.246-247) e descrito a seguir.
Exemplo 3.7: Um ensaio clínico duplo-cego foi planejado e criteriosamente conduzido para avaliar o
potencial do uso da aspirina na redução do risco de doenças cardiovasculares. O experimento considerou 22.071
médicos americanos com idade entre 40 e 84 anos, os quais foram aleatoriamente divididos em dois grupos,
denominados de grupo de pacientes tratados e grupo controle. Os 11.037 médicos do grupo de pacientes
tratados tomaram 325 mg de aspirina a cada dois dias, enquanto que aqueles do grupo controle, composto por
11.043 médicos, tomaram um comprimido semelhante ao da aspirina, mas sem o princípio ativo (ou seja, um
placebo).
Após 5 anos de acompanhamento, o experimento foi encerrado. Entre as características
observadas no experimento, foram confirmados 139 casos de infarto no grupo de pacientes tratados com
aspirina e 239 casos no grupo que recebeu o placebo. Estes resultados parciais são sintetizados na Tabela 3.3.
a 139
P[Infarto | Aspirina ] = = = 0,013 ,
a + b 11.037
c 239
P[Infarto | Placebo] = = = 0,022 .
c + d 11.034
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
44
Como esperado, o risco de infarto é menor para indivíduos tratados com aspirina, sugerindo
que o uso freqüente de aspirina possivelmente é um fator de proteção do risco de infarto. O risco relativo é
estimado por
^ P[Infarto | Aspirina ] 0,013
RR = = = 0,59
P[Infarto | Placebo] 0,022
e significa que o risco de infarto em um indivíduo tratado com aspirina é 59% do risco de infarto para um
1
indivíduo não tratado. Outra forma de interpretar o resultado é fazer ^
= 1,69 , que significa que um
RR
indivíduo que não tomou aspirina regularmente tem aproximadamente 1,7 vezes mais chances de ter infarto, em
relação a quem tomou.
Em muitos estudos epidemiológicos, entretanto, são utilizados estudos retrospectivos ou de
caso-controle. Ao contrário de um estudo de coorte, em um estudo caso-controle os indivíduos com e sem a
doença são investigados para trás no tempo (followed backwards in time, em inglês) para averiguar se o fator de
risco estava presente ou não.
Em estudos caso-controle o risco relativo não pode ser estimado, pois não é possível estimar
o risco da doença entre os indivíduos expostos e não expostos ao fator de risco. De fato, o que é possível estimar
a
é o risco do fator estar presente entre os indivíduos com a doença, dado por a +c
e, similarmente, o risco do fator
b
estar presente entre os indivíduos sem a doença, dado por b+d
.
pequena em relação a P4 , de tal forma que a razão dos riscos pode ser aproximada por
P1 P1
P1 + P3 P PP
≅ 3 = 1 4 .
P2 P2 P2 P3
P2 + P4 P4
Esta medida é chamada de razão de chances ou razão de odds (odds ratio, em inglês) e pode
ser usada como uma estimativa aproximada do risco relativo para o caso de doenças raras. A razão de
chances está definida para qualquer tipo de estudo epidemiológico, motivo pelo qual tem sido grandemente
utilizada. A chance (odds, em inglês) de desenvolver a doença entre os indivíduos expostos ao fator de risco é
P1 P
definida por , enquanto que entre os não expostos é 2 . Consequentemente, a razão de chances é
P3 P4
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
45
P1
P PP
ψ= 3 = 1 4.
P2 P2 P3
P4
cabendo salientar os seguintes aspectos: a) ψ = 1 significa que a característica em estudo não é um fator de
risco para a doença; b) ψ > 1 indica a possibilidade de que a característica em estudo seja um fator de risco para
a doença; e, c) ψ < 1 sugere a possibilidade de que a característica em estudo seja um fator de proteção da
doença.
No contexto amostral onde estão sendo consideradas duas características dicotômicas, os
resultados podem ser apresentados como na Tabela 3.2, de tal forma que a razão de chances pode ser estimada
por
a
a+b
b
ad
ψˆ = a + b = .
c bc
c+d
d
c+d
forma que um intervalo com aproximadamente (1 − α ) × 100% de confiança para ln ψ é dado por
^ ^
ln ψˆ − zα × Var (ln ψˆ ); ln ψˆ + zα × Var (ln ψˆ ) ,
2 2
onde z α é o valor da distribuição de probabilidade normal padrão tal que P − z α < Z < + z α = 1 − α .
2 2 2
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
46
O intervalo de confiança para a verdadeira razão de chances ψ pode ser obtido mediante a
aplicação da função exponencial nos extremos do intervalo obtido para ln ψ . Em outras palavras, um intervalo
exp ln ψˆ − z × Var (ln ψˆ ) ; exp ln ψˆ + z × Var (ln ψˆ ) .
^ ^
α α
2 2
confiança para ln ψ contém o valor 0, então não há evidências estatísticas de que o fator de risco em
consideração e a doença estejam associados.
É conveniente ressaltar que nesta seção foram considerados apenas aspectos básicos sobre a
aplicação do risco relativo e da razão de chances em estudos epidemiológicos. O leitor interessado em
aprofundar os estudos pode consultar, por exemplo, Breslow & Day (1980, 1987), Everitt (1992) ou Hosmer &
Lemeshow (1989). A seguir será ilustrado um estudo epidemiológico onde pode ser utilizada a razão de chances
para avaliar se o peso ao nascer é um fator de risco para a ocorrência de hemorragia peri-intraventricular.
Exemplo 3.8: O presente problema foi tratado por Tavares (1995) em sua Dissertação de Mestrado em
Pediatria da Faculdade de Medicina da UFMG e descrito também por Soares & Siqueira (1999, p.127-128,
p.259). Uma das causas mais freqüentes de agressão ao sistema nervoso central no período neonatal e a segunda
causa mais freqüente de morte em prematuros é a hemorragia peri-intraventricular (HPIV). Tavares (1995)
estudou a ocorrência desta doença em 120 recém-nascidos com peso menor do que 2000 g, no Hospital de
Clínicas da UFMG, no período de 18/01/94 a 17/05/95. Um dos possíveis fatores de risco para a ocorrência de
HPIV é o baixo peso ao nascer, sendo usual utilizar 1500 g como limite. Os dados relativos as 120 crianças
estudadas são sintetizados na Tabela 3.4.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
47
Uma estimativa aproximada do risco de ocorrer HPIV para crianças com peso ao nascer
menor do que 1500 g, em relação às crianças com peso ao nascer entre 1500 g e 2000 g, pode ser obtida através
da razão de chances dada por
ad 24 × 49 1176
ψˆ = = = = 2,45 .
bc 32 × 15 480
Isto significa que crianças com peso ao nascer menor do que 1500 g têm aproximadamente 2,5 vezes mais
chance de ocorrência de HPIV do que crianças com peso ao nascer entre 1500 g e 2000 g. No entanto, é
preferível estimar o risco através de um intervalo de confiança. A variância estimada de ln ψ̂ é
^ 1 1 1 1 1 1 1 1
Var (ln ψˆ ) = + + + = + + + = 0 ,16 .
a b c d 24 32 15 49
^ ^
ln ψˆ − 1,96 × Var (ln ψˆ ); ln ψˆ + 1,96 × Var (ln ψˆ ) .
^
ln ψˆ − 1,96 × Var (ln ψˆ ) = ln 2,45 − 1,96 × 0,16 = 0,8961 − 0,7840 = 0,1121
e
^
ln ψˆ + 1,96 × Var (ln ψˆ ) = ln 2 ,45 − 1,96 × 0,16 = 0 ,8961 + 0,7840 = 1,6801.
Portanto, com 95% de confiança, o intervalo (0 ,1121; 1,6801) contém o verdadeiro valor de
ln ψ . Observe que o intervalo não contém o valor 0, sugerindo que de fato existe uma associação entre o peso
ao nascer e a ocorrência de HPIV. No entanto, é mais informativo interpretar a estimativa do risco ao invés da
estimativa do logaritmo do risco. Para tanto, basta transformar o intervalo de confiança para ln ψ em um
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
48
intervalo de confiança para ψ , tomando-se a exponencial dos limites inferior e superior do intervalo de
confiança determinado acima. Assim, os novos limites são
^
exp ln ψˆ − 1,96 × Var (ln ψˆ ) = e 0 ,1121 = 1,12
e
^
exp ln ψˆ + 1,96 × Var (ln ψˆ ) = e1,6801 = 5,37 ,
de tal forma que, com 95% de confiança, o intervalo (1,12; 5,37 ) contém o verdadeiro valor do risco ψ .
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
49
Exemplo 3.9: Admita que 25% dos indivíduos de uma determinada população têm sangue do tipo B. Uma
amostra aleatória de quatro indivíduos desta população é selecionada, os quais são submetidos a um teste para
determinar o tipo de sangue.
O resultado deste “experimento aleatório” poderia ser representado pela variável aleatória X
definida como o “número de indivíduos da amostra com sangue do tipo B”. Equivalentemente, X = nº de
sucessos em 4 ensaios independentes, onde se diz que ocorre sucesso quando um indivíduo tem sangue do tipo
B, e os 4 ensaios independentes são os quatro indivíduos aleatoriamente selecionados da população
especificada.
Nesta situação, os valores que a variável aleatória X pode assumir são descritos no espaço
amostral Ω = {0, 1, 2, 3, 4} . O que se deseja determinar, portanto, são exatamente as probabilidades associadas
às ocorrências de cada valor admissível para X, se possível mediante um modelo probabilístico conhecido. Por
exemplo, sob estas condições, qual é a probabilidade de que dos 4 indivíduos extraídos ao acaso da população,
exatamente em 2 (dois) tenham sangue do tipo B?
Para responder esta questão, considere a amostra aleatória de 4 indivíduos, rotulados como
X 1 , X 2 , X 3 , X 4 . Para cada um dos indivíduos da amostra, o sangue é do tipo B ou não, ou seja, para
i = 1,2 ,3,4 ,
e a probabilidade do i-ésimo indivíduo ter sangue do tipo B é P[ X i = 1] = 0 ,25 , ∀ i = 1,2 ,3,4 . Assim, a
possíveis resultados desse experimento aleatório podem ser visualizados no esquema abaixo:
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
50
X1 X2 X3 X4 X1 X2 X3 X4 X1 X2 X3 X4 X1 X2 X3 X4 X1 X2 X3 X4
0 0 0 0 1 0 0 0 1 1 0 0 1 1 1 0 1 1 1 1
0 1 0 0 1 0 1 0 1 1 0 1
0 0 1 0 1 0 0 1 1 0 1 1
0 0 0 1 0 1 1 0 0 1 1 1
0 1 0 1
0 0 1 1
X =0 X =1 X =2 X =3 X =4
Assim, a probabilidade de X = 0 é
P[ X = 0] = P[( X 1 = 0) ∩ ( X 2 = 0) ∩ ( X 3 = 0) ∩ ( X 4 = 0)]
= 0 ,75 × 0 ,75 × 0 ,75 × 0 ,75 = (0 ,75) 4 = 0 ,3164.
variáveis X 1 , X 2 , X 3 , X 4 são independentes e identicamente distribuídas (por serem uma amostra aleatória).
(( X 1 = 1) ∩ ( X 2 = 0) ∩ ( X 3 = 0) ∩ ( X 4 = 0) ) ∪
(( X = 0) ∩ ( X 2 = 1) ∩ ( X 3 = 0) ∩ ( X 4 = 0) ) ∪
P[ X = 1] = P = 4 × (0 ,25)1 × (0 ,75)3 = 0 ,4219 .
1
(( X 1 = 0) ∩ ( X 2 = 0) ∩ ( X 3 = 1) ∩ ( X 4 = 0) ) ∪
(( X 1 = 0) ∩ ( X 2 = 0) ∩ ( X 3 = 0) ∩ ( X 4 = 1) )
Ainda, a probabilidade de que dois dos quatro indivíduos da amostra apresentem sangue do
tipo B é
(( X 1 = 1) ∩ ( X 2 = 1) ∩ ( X 3 = 0) ∩ ( X 4 = 0) ) ∪
(( X = 1) ∩ ( X 2 = 0) ∩ ( X 3 = 1) ∩ ( X 4 = 0) ) ∪
1
(( X 1 = 1) ∩ ( X 2 = 0) ∩ ( X 3 = 0) ∩ ( X 4 = 1) ) ∪
P[ X = 2 ] = P = 6 × (0 ,25) × (0 ,75) = 0 ,2109
2 2
(( X 1 = 0) ∩ ( X 2 = 1) ∩ ( X 3 = 1) ∩ ( X 4 = 0) ) ∪
(( X = 0) ∩ ( X 2 = 1) ∩ ( X 3 = 0) ∩ ( X 4 = 1) ) ∪
1
(( X 1 = 0) ∩ ( X 2 = 0) ∩ ( X 3 = 1) ∩ ( X 4 = 1) )
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
51
e, por sua vez, a probabilidade de que exatamente três dos quatro indivíduos tenham sangue do tipo B é igual a
(( X 1 = 1) ∩ ( X 2 = 1) ∩ ( X 3 = 1) ∩ ( X 4 = 0) ) ∪
(( X = 1) ∩ ( X 2 = 1) ∩ ( X 3 = 0) ∩ ( X 4 = 1) ) ∪
P[ X = 3] = P = 4 × (0,25) × (0,75) = 0,0469 .
1 3 1
(( X 1 = 1) ∩ ( X 2 = 0) ∩ ( X 3 = 1) ∩ ( X 4 = 1) ) ∪
(( X 1 = 0) ∩ ( X 2 = 1) ∩ ( X 3 = 1) ∩ ( X 4 = 1) )
Por fim, resta determinar a probabilidade de que os quatro indivíduos da amostra tenham
sangue do tipo B, que é dada por
P[ X = 4] = P[( X 1 = 1) ∩ ( X 2 = 1) ∩ ( X 3 = 1) ∩ ( X 4 = 1)]
= 0,25 × 0,25 × 0,25 × 0,25 = (0,25) = 0 ,0039.
4
x 0 1 2 3 4 Total
P[ X = x ] 0,3164 0,4219 0,2109 0,0469 0,0039 1
Observe que
P[Ω] = P[ X = 0] + P[ X = 1] + P[ X = 2] + P[ X = 3] + P[ X = 4]
= 0,3164 + 0,4219 + 0,2109 + 0,0469 + 0,0039 = 1.
4 4!
= = 1,
0 0! ( 4 − 0 )!
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
52
onde a expressão x! (lê-se x fatorial) representa a função fatorial do número inteiro x , definida como
x! = x × ( x − 1) × ( x − 2) × L × 2 × 1 . Convém lembrar ainda que, por definição, 0! = 1 e 1! = 1 .
Por outro lado, a ocorrência do evento [ X = 1] está associada a quatro resultados possíveis
(veja no quadro acima). O número de diferentes combinações também poderia ser determinado por
4 4! 4 × 3!
= = = 4.
1 1! ( 4 − 1 )! 1! 3!
Da mesma forma, existem
4 4! 4 × 3 × 2!
= = =6
2 2! ( 4 − 2 )! 2! 2!
4 4! 4 × 3!
= = =4
3 3! ( 4 − 3 )! 3! 1!
diferentes maneira de ocorrer o evento [X = 3] e, finalmente, apenas uma maneira de ocorrer o evento
[X = 4] .
4 4!
= ,
x x! ( 4 − x )!
4!
P[ X = x ] = (0,25) x (0,75)4− x ; ∀ x = 0,1,2,3,4.
x! ( 4 − x )!
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
53
Para ilustrar, a probabilidade de que entre os quatro indivíduos da amostra, exatamente dois
tenham sangue do tipo B é igual a
4!
P[ X = 2 ] = (0,25)2 (0,75)4−2 = 6 × (0,25)2 × (0,75)2 = 0,2109 ,
2! ( 4 − 2 )!
como determinado anteriormente.
Através do exemplo acima, foi ilustrada a construção do modelo binomial de
probabilidades, que pode ser formalmente definido da seguinte maneira: considere um experimento que é
repetido n vezes, sob condições idênticas, e tem as seguintes características:
a) cada repetição do experimento pode assumir um dos dois resultados possíveis, os quais são
mutuamente exclusivos e tecnicamente designados por sucesso (S) ou fracasso (F);
b) a probabilidade de sucesso, P[Sucesso] = p é a mesma em cada repetição e permanece constante em
Sob as condições especificadas, a variável aleatória que representa o número de sucessos nas n
n
repetições do experimento, definida por X = ∑
i
X i , possui distribuição de probabilidades binomial com
=1
n
P[ X = x ] = p x (1 − p )n − x
x
n!
= p x (1 − p )n − x ; ∀ x = 0 ,1,2 ,L , n.
x! ( n − x )!
tem esperança (média) igual a µ = np e variância igual σ 2 = np( 1 − p ) , sendo usualmente denotada por
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
54
50
40
30
P[X=x] 20
10
0
0 1 2 3 4
número esperado (médio) de sucessos, dado por µ = np = 10 × 0 ,5 = 5 sucessos. Isto significa que, nesta
situação, em 10 ensaios independentes seriam esperados 5 sucessos.
,4
,3
P[X=x]
,2
,1
0,0
0 1 2 3 4 5 6 7 8 9 10
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
55
A Figura 3.7 e a Figura 3.8, por sua vez, ilustram o comportamento da distribuição binomial
de probabilidade com n = 10 e probabilidade de sucesso p = 0,7 e p = 0,9 , respectivamente. É vital observar
que a assimetria negativa torna-se mais acentuada na medida que o valor da probabilidade de sucesso p se
,4 ,4
,3 ,3
P[X=x]
P[X=x]
,2 ,2
,1 ,1
0,0 0,0
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Figura 3.7 – Forma da distribuição binomial Figura 3.8 – Forma da distribuição binomial com
com n = 10 e p = 0,7 . n = 10 e p = 0,9 .
direção ao valor p = 0 .
resultado importante, conhecido como aproximação da distribuição binomial pela distribuição normal, derivado
do Teorema Central do Limite para variáveis independentes e identicamente distribuídas, o qual será
apresentado, discutido e ilustrado no Capítulo 5.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
56
,4
,4
,3
,3
P[X=x]
P[X=x]
,2
,2
,1
,1
0,0
0,0
0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10
Figura 3.9 – Forma da distribuição binomial com Figura 3.10 – Forma da distribuição binomial com
n = 10 e p = 0,4 . n = 10 e p = 0,15 .
,3 ,3
,2 ,2
P[X=x]
P[X=x]
,1 ,1
0,0 0,0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Figura 3.11 – Forma da distribuição binomial com Figura 3.12 – Forma da distribuição binomial com
n = 25 e p = 0,3 . n = 25 e p = 0,2 .
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
57
1
1 − ( x −µ )2
f(x)= e 2σ2 ; x ∈ ℜ e σ > 0; µ ∈ ℜ ,
σ 2π
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
58
É importante mencionar que, por tratar-se de uma distribuição de probabilidades, a área total
sob a curva definida pela densidade f ( x ) é igual a 1, correspondendo a 100% da distribuição de
probabilidades. A distribuição normal possui diversas características importantes, cabendo destacar:
a) a curva tem forma de sino e é simétrica em relação ao eixo vertical que passa por x = µ ;
b) a curva tem inflexões nos pontos x = µ − σ e x = µ + σ ; ou seja, é côncava para baixo no
Uma propriedade importante da distribuição normal é a seguinte: a área sob a curva definida
pela densidade f ( x ) , delimitada pelos intervalos µ ± σ , µ ± 2σ e µ ± 3σ corresponde, respectivamente, a
aproximadamente 68,3%, 95,4% e 99,7% da distribuição, como pode ser observado na Figura 3.15.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
59
Considere a variável aleatória X com distribuição normal com média µ e desvio padrão σ , a
( )
qual usualmente é denotada por X ~ N µ, σ 2 . A propriedade da distribuição normal, ilustrada no gráfico
( )
X ~ N µ,σ 2 , então a probabilidade de X pertencer ao intervalo (a ,b ) é dada por
1 2
b b 1 − ( x −µ )
P[a < X ≤ b] = ∫a f ( x )dx = ∫a σ e 2σ2 dx .
2π
Uma alternativa para determinar probabilidades desse tipo é recorrer a uma mudança de
x−µ
variável, transformando a variável aleatória X na variável aleatória padronizada Z, definida por Z = .
σ
Esta nova variável é chamada de variável normal padronizada ou reduzida, e possui média igual a 0 (zero) e
variância igual a 1 (um), sendo denotada por Z ~ N (0 ,1) .
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
60
a−µ b−µ
equivalente a determinar a probabilidade de Z pertencer ao intervalo , , a qual pode ser obtida na
σ σ
tabela da distribuição normal padrão.
É importante mencionar que existem diversos tipos de tabelas que fornecem áreas sob a
curva da distribuição normal padrão. Para evitar maiores complicações, será adotada a tabela em anexo, a qual
informa a área à esquerda de z , ou seja, P[Z ≤ z ] . A Figura 3.16 ilustra a área ou probabilidade informada na
tabela da normal padrão e uma relação importante na prática é dada por
Exemplo 3.10: Admita que a pressão sistólica em indivíduos saudáveis de uma determinada população segue
uma distribuição normal com média µ = 130 mmHg e desvio padrão σ = 9 mmHg . Algumas relações são
imediatas: por exemplo, como a distribuição da pressão sistólica dos indivíduos desta população é simétrica em
relação à média, então 50% dos indivíduos da população apresentam pressão sistólica menor do que
µ = 130 mmHg e, naturalmente, metade das pessoas tem pressão sistólica maior do que µ = 130 mmHg .
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
61
Considere uma pessoa selecionada ao acaso desta população e, por simplicidade, represente
(
por X o valor da sua pressão sistólica. Assim, utilizando a notação usual, X ~ N 130 mmHg ; 81 (mmHg)2 , )
que é interpretada da seguinte forma: a variável aleatória X representa a pressão sistólica de um indivíduo
extraído ao acaso da população em estudo e tem distribuição normal com média igual a µ = 130 mmHg e
desvio padrão σ = 9 mmHg . Considere, agora, os eventos abaixo, os quais são úteis para ilustrar o cálculo de
probabilidades mediante os valores tabelados da distribuição normal padrão, representada pela variável aleatória
Z , ou seja, Z ~ N (0 ,1) .
a) A probabilidade de que um indivíduo escolhido ao acaso desta população apresente pressão sistólica menor
do que 120 mmHg é ilustrada e determinada por
b) A probabilidade de que um indivíduo escolhido ao acaso desta população apresente pressão sistólica maior
do que 140 mmHg é ilustrada e determinada por
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
62
c) A probabilidade de que um indivíduo escolhido ao acaso desta população apresente pressão sistólica maior do
que 116 mmHg e menor do que 147 mmHg é ilustrada e determinada por
116 − µ X − µ 147 − µ
P[116 < X < 147] = P < <
σ σ σ
d) A probabilidade de que um indivíduo escolhido ao acaso desta população apresente pressão sistólica maior
do que 133 mmHg e menor do que 146 mmHg é ilustrada e determinada por
133 − µ X − µ 146 − µ
P[133 < X < 146] = P < <
σ σ σ
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
63
respectivamente (veja a Seção 6.1). Assim, dispondo da uma amostra aleatória X 1 , X 2 ,L , X n , pode-se
( ) ( ) (
determinar os intervalos X − S , X + S , X − 2 × S , X + 2 × S e X − 3 × S , X + 3 × S e contar o número )
de observações contidas em cada intervalo. Se a característica em estudo segue uma distribuição normal de
probabilidades, então esses intervalos deveriam conter aproximadamente 68,3%, 95,4% e 99,7% das
observações, respectivamente. Observe que este resultado segue naturalmente da propriedade da distribuição
normal de probabilidade.
Outros métodos estatísticos podem ser aplicados para avaliar se uma determinada
característica tem distribuição normal de probabilidade, tais como testes de aderência ou procedimentos
200
180
Valor Esperado pela Normal
160
140
120
100
80
60
60 80 100 120 140 160 180 200 220
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
64
No Exemplo 2.1 também foram apresentados os dados relativos à variável nível de colesterol
sérico (veja a Tabela 2.1). A Figura 3.18 apresenta o Q-Q plot para o nível de colesterol sérico, através do qual
pode-se constatar que o modelo normal aparentemente é plausível para esta variável, embora haja uma
observação que parece ser atípica.
400
300
200
100
100 200 300 400
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
65
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
66
Este tipo de amostra é caracterizado essencialmente pelo fato de que cada indivíduo da
população tem a mesma probabilidade de ser selecionado (ou seja, de pertencer à amostra). Se a população é
constituída de N elementos (pessoas, animais, plantas, residências, lâmpadas, etc.), e deseja-se extrair uma
amostra de tamanho n , a quantidade f = n
N é chamada de fração de amostragem. Ainda, se amostra é feita
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
67
N N!
sem reposição, como ocorre usualmente, então existem = possíveis amostras, as quais têm a
n n! ( N − n )!
mesma probabilidade de serem extraídas.
Assim, se a população é composta por N elementos, uma maneira prática de extrair uma
AAS é, primeiro, identificar cada indivíduo da população, por exemplo, numerando-os de 1 até N . Em seguida,
mediante um mecanismo aleatório qualquer (por exemplo, uma tabela de números aleatórios ou através de uma
rotina computacional que gere números aleatórios), sorteia-se n números dessa seqüência, os quais
correspondem aos indivíduos que compõem a amostra.
Com relativa freqüência, a população possui uma estrutura de estratos (ou grupos) bem
definidos, de tal forma que a(s) variável(eis) de interesse possivelmente apresenta(m) um comportamento
substancialmente diferente de um estrato para outro, porém com um comportamento homogêneo dentro de cada
estrato. Nesta situação, se for utilizada uma amostra aleatória simples (ou seja, se não for considerada a
existência dos estratos), os estratos podem não estar adequadamente representados na amostra. Assim, a amostra
poderia ser influenciada pelo comportamento específico que a variável apresenta nos estratos mais favorecidos
pelo sorteio. A adoção de uma amostra aleatória estratificada é uma maneira de evitar a possível ocorrência
deste problema, sendo um dos tipos mais utilizados.
Comumente utiliza-se uma amostra aleatória estratificada proporcional, que consiste
essencialmente em adotar um tamanho de amostra de cada estrato proporcional ao número de elementos
existentes no estrato correspondente. Assim, considere
na amostragem aleatória estratificada proporcional, o número de elementos a serem sorteados em cada estrato é
n1 = N1 f , n2 = N 2 f , L , n L = N L f . É importante observar que a extração dos ni = N i f indivíduos de
cada estrato deve ser realizada seguindo os mesmos princípios da amostra aleatória simples.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
68
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
69
∑x
i =1
i
Como foi definido na Seção 2.2.1, a média amostral da variável aleatória X é X = .
n
Contudo, como existem diversas maneiras de selecionar uma amostra aleatória de tamanho n , a média amostral
X também é uma variável aleatória, de tal forma que é vital conhecer sua distribuição de probabilidade.
Exemplo 5.1 (didático): Sabe-se que, até o presente momento, foram registrados apenas quatro casos de
uma determinada doença rara, para os quais foi observado o consumo renal de oxigênio, medido em
cm 3 / min . Nesta situação, a população-alvo tem tamanho N = 4 e é constituída pelos quatro pacientes nos
quais foi diagnosticada a doença. A variável de interesse neste estudo é, em particular, X ≡ consumo renal de
oxigênio, cujos valores observados são mostrados no esquema abaixo:
X: Consumo
Renal de Oxigênio
PACIENTE
(em cm 3
/ min )
1 14,0
2 14,1
3 14,2
4 14,3
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
70
N 4
∑1
i=
xi ∑1 x
i=
i
14,0 + 14,1 + 14,2 + 14,3
µ= = = = 14,15 cm 3 / min .
N 4 4
Por sua vez, o desvio padrão populacional é, por definição, determinado por
∑ (x
i =1
i − µ)
2
σ=
N
σ=
(14,0 − 14,15)2 + (14,1 − 14,15)2 + (14,2 − 14,15)2 + (14,3 − 14,15)2 .
4
σ = 0 ,05 4 = 0 ,1118 cm 3 / min
Admita, para fins pedagógicos, que deseja-se retirar uma amostra aleatória de tamanho
n = 2 desta população. Inicialmente o pesquisador deseja estudar o comportamento da variável X na amostra
e, se possível, utilizar a amostra para fazer inferências sobre a população-alvo (neste caso, a população de
indivíduos com a doença rara especificada).
Observe, entretanto, que se a amostragem é com reposição, então nesta situação existem
N n = 4 2 = 16 maneiras distintas de selecionar uma amostra aleatória de tamanho n = 2 . O Quadro 5.1 ilustra
as diferentes amostras possíveis e o respectivo valor médio observado para a média amostral X .
É importante observar que, na prática, apenas uma amostra é selecionada, mas ela pode ser
obtida de diferentes maneiras, ou seja, mediante diferentes combinações dos indivíduos que compõem a
população. Por exemplo, como pode ser observado no Quadro 5.1, o valor x = 14 ,15 cm 3 / min pode ser
gerado pelas amostras de número 4, 7, 10 ou 13. De forma similar, o mesmo raciocínio pode ser aplicado aos
demais valores admissíveis de X . Este exemplo ilustra o fato de que, antes de coletar a amostra, a média
amostral X também é uma variável aleatória, cuja distribuição de probabilidade deseja-se determinar, pois
pode ser útil para fazer inferências sobre a população.
No Quadro 5.1 são apresentadas todas as amostras possíveis de tamanho n = 2 e os
respectivos valores da média amostral. Estas informações podem ser organizadas de maneira mais apropriada,
mediante a distribuição de freqüências da variável X apresentada na Tabela 5.1, e melhor visualizadas
mediante o gráfico de barras apresentado na Figura 5.1.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
71
30
Freqüência Relativa
20
10
0
14,00 14,05 14,10 14,15 14,20 14,25 14,30
Média Amostral
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
72
Como já foi mencionado, antes da amostra ser selecionada a média amostral X é uma
variável aleatória (pois diferentes valores x podem ser gerados), de tal forma que deseja-se encontrar a sua
distribuição de probabilidade, denominada distribuição da média amostral. Além da forma da distribuição,
deseja-se determinar, em particular, a média e o desvio padrão da variável aleatória X . Assim, para ilustrar,
considere as informações do Exemplo 5.1, onde a média da variável X é
σX =
(14,00 − 14,15)2 + (14,05 − 14,15)2 + (14,10 − 14,15)2 + L + (14,30 − 14,15)2
16
0,10
σX = = 0,0063 = 0,0791 cm 3 / min .
16
Para os resultados do exemplo, observe que o valor da média da variável aleatória X é igual
a µ X = 14 ,15 cm 3 / min , que coincide com o valor da média populacional da variável original X (ou seja,
σ X = 0,0791 cm 3 / min , é igual ao valor do desvio padrão populacional da variável original X , dividido pela
σ 0 ,1118
raiz quadrada do tamanho da amostra, ou seja, σ X = = = 0 ,0791 cm 3 / min .
n 2
O resultado ilustrado através do exemplo pode ser generalizado: se uma amostra aleatória de
tamanho n é extraída de uma população com média igual a µ e desvio padrão igual a σ , então o valor
esperado da variável aleatória X é igual a µ e desvio padrão de X (também denominado de erro padrão da
média) é igual a σ
n
. Em outras palavras, a distribuição da variável aleatória X tem média igual a µ (isto é,
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
73
identicamente distribuídas, com média comum µ e variância comum σ 2 , onde 0 < σ 2 < ∞ . Seja,
S n = X 1 + X 2 + L + X n . Então,
S n − E [S n ] S n − nµ
= D
→ N (0 ,1), quando n → ∞ .
Var S n σ n
quais são independentes (pois a amostra é aleatoriamente extraída da população) e identicamente distribuídas
(pois são observações sobre a mesma característica, realizadas em indivíduos extraídos da mesma população).
Assim, um resultado imediato do Teorema Central do Limite é que, para um tamanho de amostra
suficientemente grande (usualmente n ≥ 30 ), a distribuição de probabilidade da variável aleatória X
aproxima-se de uma distribuição normal com média µ e desvio padrão σ
n
, onde µ e σ são,
respectivamente, a média e o desvio padrão populacional da variável original X . No jargão probabilístico, diz-
se que X converge em distribuição para uma distribuição normal com média µ e desvio padrão σ
n
, sendo
denotado por
σ2
D
X → N µ , , quando n → ∞ .
n
É importante salientar que este resultado é válido apenas para amostras grandes, ou seja, para
n → ∞ . Contudo, um resultado amplamente conhecido do cálculo de probabilidade é que a soma de variáveis
aleatórias com distribuição normal e independentes, também segue uma distribuição de probabilidade normal.
Consequentemente, no caso em que X 1 , X 2 ,L X n é uma amostra aleatória de uma variável X com
( )
distribuição normal com média µ e desvio padrão σ , isto é, X ~ N µ , σ 2 , então a variável aleatória X
tamanho da amostra n .
A distribuição da média amostral é extremamente importante e útil para o cálculo de
probabilidades e, particularmente, para estender os resultados da amostra para a população-alvo (fazer
inferências), mediante o uso intervalos de confiança ou testes de hipóteses sobre médias populacionais, temas
que serão abordados na seqüência do curso.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
74
existir inúmeras maneiras de selecionar uma amostra de tamanho 10 desta população, ou seja, o valor observado
x pode variar de uma amostra para outra, pois as pessoas selecionadas poderiam ser diferentes. Como a
variável original (pressão sistólica de um indivíduo) tem distribuição normal, isto é, X ~ N (130, 81) , então X
também tem distribuição normal, independentemente do tamanho da amostra. Especificamente, a distribuição da
média X está centrada em 130 mmHg , pois µ X = µ = 130 mmHg . Porém, o desvio padrão de X é menor
σ 9
do que o desvio padrão da variável original, isto é, σ X = = = 2,85 mmHg .
n 10
Nesta situação, a probabilidade da média amostra X ser maior do que 140 mmHg é dada por
= 1 − P[Z ≤ +3,51] = 1 − 1 = 0.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
75
Nos últimos anos os métodos estatísticos têm sido largamente utilizados em estudos
científicos e tecnológicos das mais diversas áreas do conhecimento. Essa é uma tendência crescente e
irreversível, de maneira que a Estatística possui um papel vital na tomada de decisões e na produção de
conhecimentos ou de novas tecnologias, podendo ser considerada a “tecnologia da ciência”, veja Pereira (1997).
Fica evidente, portanto, que a Estatística é parte fundamental do método científico, cabendo
destacar a enorme importância dos procedimentos de estimação de parâmetros e testes de hipóteses. Mediante
o rigoroso atendimento das condições especificadas, estes procedimentos de inferência estatística permitem
estender para a população-alvo os resultados obtidos da amostra.
Neste capítulo serão brevemente abordados alguns aspectos sobre inferência estatística, que
embora sejam os mais simples e tradicionais, podem ser extremamente úteis para avaliar a veracidade de
hipóteses científicas ou estimar parâmetros populacionais em muitas situações práticas. Em especial, serão
apresentados procedimentos para estimação da média e da proporção populacional, por ponto e por intervalo,
para o caso de uma amostra aleatória extraída de populações com distribuição normal ou para tamanho de
amostra grande. Ainda no contexto de normalidade, também serão desenvolvidos testes de hipóteses para média
e para proporção populacional no caso de uma amostra, teste para comparação de médias e proporções
populacionais no caso de duas amostras independentes e teste para comparação de médias populacionais
mediante duas amostras pareadas.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
76
como subconjuntos ou funções apenas dessas observações também são. Assim, o mínimo X ( 1 ) e o máximo
X ( n ) da amostra; a mediana, a moda e a média amostral também são estatísticas e, portanto, candidatos a
estimadores de algum parâmetro. Como qualquer estatística (função da amostra) pode ser vista como um
estimador pontual, é natural que sejam utilizados estimadores que possuam propriedades ótimas, ou seja, que
representem adequadamente o valor populacional de interesse.
Diferentes métodos para construir estimadores, bem como as propriedades matemáticas
desejáveis em um estimador são extensamente discutidas na literatura estatística. Apesar de não ser objetivo do
curso, é conveniente mencionar brevemente os conceitos básicos das principais propriedades – o leitor
interessado pode consultar, por exemplo, Rohatgi (1976, p.333), Mood, Graybill e Boes (1974, p.271) ou Larson
(1982, p.359).
Para falar das propriedades desejáveis nos estimadores, admita que T é um estimador do
parâmetro populacional θ , definido pela função da amostra T = T ( X ) = f ( X 1 , X 2 ,L , X n ) . Qualquer que
seja o tamanho da amostra, um bom estimador deve fornecer, em média, estimativas exatas para o parâmetro θ ,
ou seja, deve coincidir com o verdadeiro valor de θ . Esta é precisamente uma das principais propriedades, que
especifica que T deve ser um estimador imparcial do parâmetro θ . O estimador T é imparcial para θ se a
esperança matemática de T (isto é, o seu valor médio, considerando repetidas amostras) é igual ao parâmetro
θ . Um estimador imparcial também é chamado de estimador não tendencioso, não viciado ou não viesado. No
entanto, é preciso alguma cautela, pois estimadores não tendenciosos podem não existir ou então produzir
resultados absurdos.
Como podem existir diversos estimadores não tendenciosos para o parâmetro θ , é desejável
que, além de imparcial, o estimador T seja consistente. A propriedade de consistência está associada à precisão
do estimador, quando o tamanho da amostra aumenta. Assim, na medida que o tamanho da amostra aumenta,
maior é a certeza de que T assume um valor na vizinhança de θ , ou seja, maior é a confiança que T inspira
como estimador de θ . Em outras palavras, se T é estimador consistente para θ , então para amostras
suficientemente grandes o erro de estimação pode ser tornado mínimo, de tal forma que a estimativa vai ser
“melhor’. Na prática, se T é um estimador imparcial e consistente para θ , então a sua variância tende para
zero quando o tamanho da amostra é suficientemente grande, ou seja, quando o tamanho da amostra aumenta
n→∞
para o infinito ( n → ∞ ), a variância do estimador T converge para zero ( σ T2 = Var T → 0 ).
Assim, se T é um estimador imparcial para θ , desejamos que sua variância seja tão
pequena quanto possível, pois, dessa forma, o valor de T tende a ficar próximo de θ . Por isso, usualmente
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
77
deseja-se escolher como estimador do parâmetro θ , o estimador T que pertence à classe de estimadores não
tendenciosos e que tenha variância mínima. O estimador T que satisfaz estas condições é chamado de
estimador não tendencioso e de variância mínima.
Outra propriedade importante em um estimador é a normalidade assintótica, que especifica
que a distribuição de probabilidade do estimador é aproximadamente normal. Assim, se T é um estimador
assintoticamente normal, então ele pode ser utilizado para construir intervalos de confiança e testes de hipóteses
para o parâmetro θ , baseados na distribuição normal de probabilidade. Existem ainda outras propriedades
desejáveis para estimadores, tais como suficiência, completeza (completeness, em inglês) e invariância, mas não
cabe descrevê-las no momento.
Neste curso o objetivo básico é ilustrar procedimentos de estimação para a média, para o
desvio padrão e para uma proporção, no contexto da distribuição normal e/ou para amostras grandes. Assim, é
conveniente utilizar o exemplo descrito a seguir.
Exemplo 6.1: O peso ao nascer é uma característica interessante, pois pode revelar a existência de problemas
de saúde pública. A Secretaria de Saúde de uma pequena cidade deseja estimar o peso médio de nascimento das
crianças da comunidade. Para tanto, planejou e selecionou uma amostra aleatória de 50 crianças nascidas no
único hospital da cidade, registrando o peso de nascimento de cada criança. Os resultados são mostrados no
Quadro 6.1.
Quadro 6.1 – Peso de nascimento na
amostra de 50 crianças, em gramas.
2678 3945 3127 2958 3063
3514 3199 2499 2413 3159
3188 3485 3701 3266 3328
2909 3008 4228 3794 2566
3142 3326 2681 2435 2607
2668 3360 3377 3295 3111
2342 2585 2740 3401 3114
2606 2922 2885 3030 3410
3113 3354 3494 2701 3088
3244 2814 2725 3447 3026
Nota: Dados fictícios.
5000
Valor Esperado pela Normal
4000
3000
2000
2000 3000 4000 5000
A Figura 6.1 ilustra o Q-Q plot para os dados do peso de nascimento gerados na amostra,
sugerindo que a distribuição normal parece ser adequada para descrever o comportamento desta característica,
na população. No entanto, a distribuição normal de probabilidades é caracterizada também pelos parâmetros µ
e σ , que são a média e o desvio padrão populacionais. Em outras palavras, constatou-se empiricamente que o
modelo normal parece ser apropriado para representar o peso ao nascer da comunidade, mas a média e o desvio
padrão do peso ao nascer são desconhecidos. Assim, é necessário estimar µ e σ desta população.
Existem diversos métodos de estimação de parâmetros, cabendo destacar o método da
máxima verossimilhança, cujo desenvolvimento foi inicialmente apresentado por Ronald A. Fisher em 1925, no
trabalho intitulado “Theory of Statistical Estimation”. O princípio da Máxima Verossimilhança consiste
essencialmente em admitir que a amostra é representativa da população e “escolher” como estimador o valor do
parâmetro que maximiza a probabilidade daquela particular amostra ser observada. Aspectos teóricos do método
da máxima verossimilhança e procedimentos para determinar os estimadores podem ser encontrados na
literatura estatística, veja Rohatgi (1976, p.375), Mood, Graybill e Boes (1974, p.276) ou Larson (1982, p.360).
O estimador pontual para a média populacional µ , derivado pelo método da máxima
verossimilhança, é dado por
n
∑Xi =1
i
µ
ˆ =X = ,
n
e, para a variância populacional σ 2 , é
n
∑ (X − X)
2
i
i =1
ˆ 2 = Ŝ 2 =
σ .
n
Cabe observar que a média amostral X é um estimador não tendencioso para µ , mas a
variância amostral Ŝ 2 não é um estimador imparcial de σ 2 . Por este motivo, usualmente utiliza-se a variância
amostral definida como
n
∑ (X − X)
2
i
i =1
S2 = ,
n −1
para σ 2 gerou a estimativa s 2 = 165510,25 g 2 , ou seja, o desvio padrão amostral é s = 406 ,83 g .
Em muitas situações o pesquisador está estudando uma característica dicotômica, ou seja,
que assume apenas dois resultados possíveis, usualmente denotados por sucesso e fracasso. Na Seção 3.3.1 foi
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
79
apresentada a distribuição binomial, que pode ser usada para descrever o comportamento de uma variável
aleatória definida pelo número de sucessos em uma amostra aleatória de tamanho n .
Recordando, se X 1 , X 2 ,L , X n é uma amostra aleatória de uma característica dicotômica,
isto é,
0, se o i-ésimo ensaio é fracasso
Xi =
1, se o i-ésimo ensaio é sucesso ,
sucessos nos n ensaios independentes segue uma distribuição de probabilidade binomial com parâmetros n e
p , ou seja, X ~ B(n , p ) .
Na prática, contudo, a probabilidade de sucesso p pode ser desconhecida, de tal forma que
pode ser necessário estimá-la. O estimador de máxima verossimilhança para a probabilidade de sucesso p é
definido pela proporção de sucessos na amostra, ou seja,
n
x
∑x
i =1
i
p̂ = = ,
n n
enquanto que o estimador de máxima verossimilhança para a variância populacional é dado por np̂ (1 − p̂ ) .
Apesar de sua simplicidade, os estimadores pontuais produzem apenas um valor sobre o
parâmetro populacional correspondente, não levando em conta a variabilidade do estimador. Na prática,
entretanto, é mais aconselhável construir um intervalo (usualmente simétrico) em torno da estimativa pontual,
de tal forma que este intervalo contenha o verdadeiro valor do parâmetro, para uma probabilidade conhecida.
Este procedimento é chamado estimação por intervalo e os intervalos produzidos são denominados intervalos
de confiança. Na próxima seção serão brevemente apresentados os intervalos de confiança para média de uma
variável aleatória com distribuição normal e, no contexto de grandes amostras, para uma proporção
populacional.
Um intervalo de confiança por ser visto como uma família de conjuntos que, com uma
probabilidade alta, contém o verdadeiro valor do parâmetro populacional θ . Assim, se a estatística
T = T ( X ) = f ( X 1 , X 2 ,L , X n ) é um estimador do parâmetro θ , então deseja-se determinar os limites T1 ( X )
e T2 ( X ) , tal que P[T1 ( X ) < θ < T2 ( X )] = 1 − α . Logicamente, o limite inferior T1 ( X ) e o limite superior
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
80
intervalo de confiança de nível (1 − α ) × 100% para o parâmetro θ . Os valores que freqüentemente são mais
utilizados para α são 0,01 ou 0,05, os quais respectivamente produzem os intervalos com 99% ou 95% de
confiança para θ .
É importante observar que a determinação do intervalo de confiança depende essencialmente
da distribuição de probabilidades do estimador T = T ( X ) = f ( X 1 , X 2 ,L , X n ) e, portanto, nem sempre
podem ser construídos. No contexto do curso serão abordados casos que em que a distribuição de probabilidade
de T = T ( X ) é normal ou, então, problemas nos quais o tamanho de amostra é suficientemente grande e
T ( X ) possui a propriedade de normalidade assintótica, de tal forma que é possível obter intervalos de
confiança aproximados para os parâmetros em investigação. Os métodos para construção de intervalos de
confiança estão fora do objetivo do curso; ao leitor interessado no aprofundamento destes aspectos teóricos
recomenda-se consultar, por exemplo, Rohatgi (1976, p.467), Mood, Graybill e Boes (1974, p.372) ou Larson
(1982, p.382). A seguir serão apresentados os intervalos de confiança para algumas situações básicas.
distribuição normal com média desconhecida µ , porém com variância conhecida σ 2 . O estimador pontual para
a média populacional µ , apresentado na Seção 6.1, é a média amostral X . Como a variável original X tem
distribuição normal, então a média amostral tem distribuição normal de probabilidade, com média µ X = µ e
σ2 σ2
variância σ 2X = , ou seja, X ~ N µ , . Convém lembrar que este resultado foi discutido no Capítulo 5.
n n
Consequentemente, mediante a padronização da variável aleatória X , obtém-se a variável
normal padrão definida como
X −µ
~ N (0,1) .
σ
n
Assim, sabe-se que
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
81
X −µ
P − z α ≤ ≤ + zα = 1 − α ,
2 σ 2
n
deseja-se um intervalo com (1 − α ) × 100% de confiança para µ , deve-se isolar o parâmetro µ na expressão
acima, isto é,
X −µ
− zα ≤ ≤ + zα .
2 σ 2
n
Assim,
σ σ
− zα × ≤ X − µ ≤ + zα × ,
2 n 2 n
σ σ
X − zα × ≤ µ ≤ X + zα × .
2 n 2 n
σ σ
Este intervalo também pode ser escrito como X − z α × ; X + zα × e
2 n 2 n
significa que com uma probabilidade igual a (1 − α ) este intervalo contém o verdadeiro valor da média
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
82
uma característica X extraída de população com distribuição normal com média desconhecida µ e variância
σ2 σ2
variância σ 2X = , seja, X ~ N µ , .
n n
∑ (X i − X )
2
i =1
S= ,
n −1
probabilidade t de Student com n − 1 graus de liberdade, onde n é o tamanho da amostra. Assim, sabe-se que
X −µ
P − t( n −1 ), α ≤ ≤ + t( n −1 ), α = 1 − α ,
2 S 2
n
onde t( n −1 ), α é o valor de distribuição probabilidade t de Student com n − 1 graus de liberdade que delimita
2
a área α
2 à sua direita e 0 < α < 1 . De forma similar ao caso anterior, deve-se isolar µ na expressão
X −µ
− t( n −1 ), α ≤ ≤ + t( n −1 ), α ,
2 S 2
n
de tal forma que
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
83
S S
− t( n −1 ), α × ≤ X − µ ≤ + t( n −1 ), α × ,
2 n 2 n
e, finalmente,
S S
X − t( n −1 ), α × ≤ µ ≤ X + t( n −1 ), α × .
2 n 2 n
S S
X − t( n −1 ), α × ; X + t( n −1 ), α × .
2 n 2 n
x = 3081,42 g e s = 406 ,83 g . Como o tamanho da amostra é grande (n = 50 ) , então pode ser apropriado
aproximar a distribuição de probabilidade t de Student pela distribuição normal padrão. Assim, um intervalo
com 95% de confiança para o peso médio ao nascer da população é dado por
S S
X − 1,96 × ; X + 1,96 × , ou seja,
n n
(2968,65; 3194,19)
Portanto, com 95% de confiança o intervalo (2968,65; 3194,19) contém o verdadeiro peso
médio de nascimento na população de crianças da cidade da qual a amostra foi retirada.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
84
amostra é grande, pois a distribuição de probabilidade do estimador p̂ está sendo aproximada pela distribuição
normal de probabilidades.
Na Seção 6.1 foi verificado que se X 1 , X 2 ,L , X n é uma amostra aleatória de uma
x
∑=1 x
i
i
p̂ = =
n n
Cabe salientar que o estimador p̂ pode ser visto como uma espécie de média amostral, isto
é, como o número médio de sucessos na amostra. Portanto, segue naturalmente do resultado denominado
“distribuição da média amostral” estudado no Capítulo 5, que p̂ tem uma distribuição de probabilidade
p (1 − p ) ^ p̂ (1 − p̂ )
centrada em p e com erro padrão EPp̂ = , o qual pode ser estimado por EPp̂ = . Em
n n
p (1 − p )
outras palavras, o estimador p̂ tem média igual a p e desvio padrão igual a Des p̂ = EPp̂ = .
n
Quanto à forma da distribuição, segue do Teorema Central do Limite que, para um tamanho de amostra
suficientemente grande, p̂ tem uma distribuição de probabilidade aproximadamente normal.
p̂(1 − p̂ ) p̂(1 − p̂ )
p̂ − zα × ; p̂ + zα × ,
n n
2 2
onde z α é o valor da distribuição normal padrão que delimita a área α
2 à sua direita e 0 < α < 1 .
2
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
85
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
86
apresentar algumas definições essenciais, as quais são necessárias na tomada de decisão sobre a veracidade das
hipóteses.
Exemplo 6.2: Sabe-se que em homens saudáveis de uma determinada população o nível de colesterol sérico
segue uma distribuição de probabilidade normal com média µ = 220 mg / dl e desvio padrão
7
Quadro 6.2 – Níveis de colesterol sérico
na amostra de 25 homens com DCC. 6
231,5 276,9
1
244,9 278,1
248,4 279,0 0
160 180 200 220 240 260 280 300 320 340
Nota: Dados fictícios.
Nível de Colsterol Sérico (mg/dl)
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
87
400
350
250
200
150
100
100 150 200 250 300 350 400
em homens com DCC (da população especificada). A hipótese de pesquisa, portanto, pode ser escrita como: na
população em estudo, os homens com DCC apresentam, em média, nível de colesterol sérico maior do que
homens saudáveis. Assim, através das respectivas médias populacionais, pode-se escrever esta hipótese como
µ DCC > µ = 220 mg / dl .
Cabe observar que a comparação dessas duas populações, mediante as suas médias, não
significa que todos os homens com nível de colesterol sérico “elevado” são portadores de DCC. De forma
análoga, um homem com DCC poderia, eventualmente, apresentar nível de colesterol sérico comparável ao dos
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
88
homens saudáveis. Em outras palavras, a comparação de duas populações através das suas médias considera o
comportamento típico ou global de cada população (que usualmente pode ser representado pela média).
A questão, agora, é como avaliar a veracidade da hipótese de pesquisa. Um procedimento
inicial é escrever o problema através de duas hipóteses estatísticas:
alternativa e, usualmente, representa a hipótese de pesquisa sob investigação. Usando uma notação estatística
mais simples, as hipóteses acima podem ser escritas, de forma equivalente, como:
H 0 : µ DCC ≤ µ = 220 mg / dl
alternativa (H 1 ) é verdadeira. Na prática, com base na média observada na amostra, o pesquisador vai decidir
sobre a veracidade de uma das hipóteses, ou seja, ele deverá optar por H 0 ou por H 1 . Contudo, neste processo
de decisão estatística existe uma “chance” de tomar uma decisão errada, justamente porque a realidade é
desconhecida. No exemplo em questão, o verdadeiro valor da média populacional µ DCC é desconhecido, de tal
forma que se o pesquisador soubesse qual é o valor da média populacional µ DCC , ele não precisaria testar
hipóteses sobre ele. Consequentemente, o pesquisador não conhece qual hipótese é verdadeira, precisando
buscar na amostra evidências que permitam uma tomada de decisão a favor de H 0 (isto é, ele escolhe H 0
como sendo verdadeira e, neste caso H 1 é falsa) ou, então, a favor de H 1 (isto é, ele escolhe H 1 como
verdadeira e, portanto H 0 é falsa). Contudo, existem duas possibilidades de tomar uma decisão errada, como
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
89
Os dois tipos de erro de decisão são indesejáveis, mas usualmente considera-se o Erro Tipo I
como mais grave. Para controlar este erro, trabalha-se com uma probabilidade pré-especificada e pequena,
geralmente valores menores do que 0,05 (ou 5%). A probabilidade do Erro Tipo I é chamada de nível de
significância do teste e é representada por α . Assim, a probabilidade do Erro Tipo I representa a probabilidade
de rejeitar a hipótese nula (H 0 ) quando ela é verdadeira, de tal forma que, usualmente, trabalha-se com
desejável, portanto, controlar esse erro de decisão mediante a atribuição de uma probabilidade pequena para o
Erro Tipo I, isto é, um valor α pequeno. Na maioria das situações práticas utiliza-se α = 0 ,05 ou α = 0,01 .
Como geralmente o erro mais grave de decisão está associado ao Erro Tipo I, na prática o
pesquisador não precisa se preocupar com o outro tipo de erro de decisão, chamado de Erro Tipo II, pois os
testes de hipóteses comumentemente utilizados são tais que para o nível de significância α fixado, a
probabilidade de Erro Tipo II é mínima. Estes testes são chamados de testes de hipóteses mais poderosos ou
uniformemente mais poderosos, sendo preferíveis em relação aos demais testes com mesmo nível de
significância α .
O Erro Tipo II representa o erro associado à decisão de aceitar hipótese nula (H 0 ) quando
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
90
Assim, outro aspecto a ser considerado é o fato de que o pesquisador pode planejar um
estudo observacional ou experimental de tal forma que o teste de hipóteses a ser realizado atinja o poder pré-
especificado e, consequentemente, ele estaria “controlando” também a probabilidade de um eventual Erro Tipo
II.
Nas próximas seções serão descritos alguns testes de hipóteses para médias, para o caso em
que a característica em estudo possui distribuição de probabilidade normal ou quando o tamanho da amostra é
suficientemente grande.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
91
As informações geradas pela amostra é que irão evidenciar se em homens com DCC o nível
médio de colesterol sérico é realmente maior do que para homens saudáveis, mediante a utilização de um teste
de hipóteses. Mas, a média amostral X carrega toda informação que a amostra X 1 , X 2 ,L , X n contém sobre a
média populacional desconhecida µ DCC ( embora seja um conceito explorado em um curso formal de
n
Inferência Estatística, diz-se que ∑X
i =1
i é uma estatística suficiente para o parâmetro populacional µ ).
Assim, no exemplo em discussão, para o pesquisador decidir entre uma das hipóteses
H 0 : µ DCC ≤ µ = 220 mg / dl ou H 1: µ DCC > µ = 220 mg / dl , parece razoável e intuitivo adotar a seguinte
estratégia: se o valor da média amostral X for significativamente maior do que µ = 220 mg / dl , então ele
decidirá a favor de H 1: µ DCC > µ = 220 mg / dl e, neste caso, poderia concluir que homens com DCC
apresentam nível sérico de colesterol em média maior do que em homens saudáveis, para o nível de
significância α . Por outro lado, se o valor de X for menor ou igual a µ = 220 mg / dl , então decidirá a favor
de H 0 : µ DCC ≤ µ = 220 mg / dl , sugerindo que o nível médio de colesterol sérico em homens com DCC não
significativamente maior do que µ = 220 mg / dl ? A resposta para esta questão pode ser obtida através da
distribuição da média amostral discutida no Capítulo 5 e mediante a escolha do valor α fixado para a
probabilidade de Erro Tipo I. Assim, se o valor da média amostral X for maior do que o valor crítico C , então
deve-se rejeitar a hipótese especificada sob H 0 , em favor de H 1 . O valor crítico x = C é determinado a partir
do valor α que foi fixado para a probabilidade do Erro Tipo I, ou seja, o valor de C é determinado a partir da
probabilidade de rejeitar H 0 quando H 0 é verdadeira, que pode ser escrita como
1 − α , e a região de rejeição de H 0 ou simplesmente região crítica, cuja área é igual ao valor fixado para α .
Portanto, para o nível de significância α fixado, se o valor x pertence à região crítica, então deve-se rejeitar a
hipótese nula ( H 0 ); caso contrário não se rejeita H 0 .
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
92
A Figura 6.4 ilustra a região crítica associada ao Exemplo 6.2, para o nível de significância
α = 0,05 . Como foi mencionado anteriormente, parece razoável admitir que o nível de colesterol sérico em
homens com DCC possui distribuição de probabilidade aproximadamente normal média µ DCC (desconhecida)
σX = σ
n
= 40 25
= 8 mg / dl . Observe que este resultado segue naturalmente da distribuição da média
amostral; não é necessário usar o Teorema Central do Limite, pois, neste caso, a variável X tem distribuição
normal. Assim, o valor crítico C é tal que,
X − µ DCC C − µ DCC
P[X > C H 0 é verdadeira ] = P > µ DCC = 220 mg / dl = 0 ,05
σ n σ
n
C − 220
= P Z > = 0,05 .
8
Assim,
C − 220
8
= +1,64 ⇒ C = 1,64 × 8 + 220 ⇒ C = 233,12 mg / dl .
exemplo, o valor da média amostral é x = 253 mg / dl e, como é maior do que o valor crítico, deve-se rejeitar
a hipótese nula. Este resultado sugere que homens portadores de doença cardíaca coronariana (DCC)
apresentam o nível médio de colesterol sérico superior aos homens saudáveis, para o nível de significância
α = 0,05 .
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
93
É importante observar que o pesquisador não pode garantir que o nível médio de colesterol
sérico é maior em homens com DCC, haja vista que existe uma probabilidade (5%) de ocorrer um erro de
decisão do tipo I (Erro Tipo I) e, portanto, deve-se sempre mencionar o nível de significância utilizado para
testar as hipóteses. Alternativamente, pode-se determinar a probabilidade exata de significância, também
denominada nível descritivo amostral ou valor-p (p-value, em inglês) associada ao teste. No exemplo, o nível
descritivo amostral do teste é igual a área sob a distribuição de probabilidade de X – no caso,
X ~ N (220; 40 2 ) – que está a direita do valor x = 253 mg / dl , conforme ilustração da Figura 6.5. Ou seja,
o nível descritivo amostral é a probabilidade
somente se o valor da estatística de teste estiver na região de rejeição de H 0 . Contudo, se p é maior do que α ,
então o valor da estatística de teste pertence à região de aceitação de H 0 e, neste caso, H 0 não deve ser
rejeitada.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
94
H 0 : µ DCC ≤ µ = 220 mg / dl
x − µ 253 − 220
z calc = = = 4 ,13
σ 40
n 25
No exemplo, como z calc = 4 ,13 > z tab = 1,64 , então deve-se rejeitar a hipótese nula
7ª) Conclusão:
Há evidências de que o nível médio de colesterol sérico em homens com DCC (da população
especificada) é superior aos homens saudáveis, para o nível de significância de 5%.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
95
É extremamente importante observar que no Exemplo 6.2 as hipóteses que foram testadas
são do tipo H 0 : µ ≤ µ 0 contra H 1 : µ > µ 0 , onde µ 0 é um valor de referência especificado (no caso
µ 0 = 220 ). Existem situações, contudo, nas quais o pesquisador deseja testar hipóteses do tipo H 0 : µ ≥ µ 0
serão diferentes. Os dois primeiros testes são denominados de testes unilaterais, enquanto que o último é
chamado de teste bilateral. O Quadro 6.4 apresenta um resumo das regiões de rejeição de H 0 , para os
H 0 : µ ≥ µ 0 contra H 1 : µ < µ 0 x − µ0
z calc = < − zα
σ n
H 0 : µ ≤ µ 0 contra H 1 : µ > µ 0 x − µ0
z calc = > zα
σ n
x − µ0
z calc = < − zα
σ n 2
H 0 : µ = µ 0 contra H 1 : µ ≠ µ 0 ou
x − µ0
z calc = > zα
σ n 2
X − µ0
T= , que deve ser comparada com o valor tabelado da distribuição de referência t de Student com
S n
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
96
n − 1 graus de liberdade, para o nível α fixado. Contudo, quando o tamanho da amostra é grande (n ≥ 30 ) , a
X −µ
substituição de σ por S não afeta substancialmente a distribuição da estatística Z calc = , podendo ser
σ
n
utilizada, portanto, a distribuição normal padrão como distribuição de referência. Em outras palavras, quando o
Como ilustração, considere o Exemplo 6.2, relativo ao nível de colesterol sérico em homens
portadores de doença cardíaca coronariana, porém com desvio padrão populacional desconhecido. Assim, o
desvio padrão σ deve ser estimado pelo desvio padrão amostral s = 40 ,5 mg / dl . Para executar o teste de
hipóteses, podem ser seguidas as etapas ilustradas anteriormente:
H 0 : µ DCC ≤ µ = 220 mg / dl
x − µ 253 − 220
t calc = = = 4 ,07
s 40 ,5
n 25
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
97
No exemplo, como t calc = 4,07 > t tab = +1,711 , então deve-se rejeitar a hipótese nula
7ª) Conclusão:
Há evidências de que o nível médio de colesterol sérico em homens com DCC (da população
especificada) é maior do que em homens saudáveis, para o nível de significância de 5%.
relativamente grande e, assim, o teste Z e o teste t têm praticamente o mesmo comportamento. Quando o
tamanho da amostra é pequeno, contudo, não é recomendável utilizar a distribuição normal padrão como
distribuição de referência para o teste t, pois os resultados podem ser catastróficos. Ao contrário, deve-se
utilizar a distribuição t de Student como distribuição de referência da estatística de teste. A Figura 6.6 ilustra o
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
98
Exemplo 6.3: O órgão governamental responsável pela fiscalização e controle da qualidade dos medicamentos
comercializados em um país deseja avaliar a qualidade do analgésico “A”, fabricado por um grande laboratório,
particularmente com respeito à quantidade de ácido acetilsalicílico (AAS) por comprimido. Como rotina de
fiscalização, seleciona amostras (aleatórias) de comprimidos de cada lote e observa a quantidade de AAS em
cada comprimido. Naturalmente que, como em qualquer processo produtivo, a quantidade de AAS apresenta
variabilidade de um comprimido para outro (bem como de um lote para outro). Se a quantidade de AAS for
muito alta ou muito baixa, o(s) lote(s) não poderá(ão) ser comercializado(s). Assim, com base nas
especificações exigidas para o produto e nas características do próprio fenômeno, sabe que é razoável admitir
que a quantidade de AAS nos comprimidos é uma variável aleatória com distribuição normal com média
µ = 0,5 g . Para o lote nº 777, foi observada uma amostra aleatória de 23 comprimidos, produzindo x = 0,47 g
e desvio padrão s = 0 ,02 g . Ao nível de significância α = 0 ,05 , qual deveria ser a decisão do órgão
governamental? Em outras palavras, o lote nº 777 deveria ser comercializado?
Para resolver este problema é conveniente seguir as etapas apresentadas nos exemplos
anteriores:
H 0 : µ = 0,5 g
H 1 : µ ≠ 0 ,5 g
x − µ0 0 ,47 − 0 ,5
tcalc = = = −7 ,19
s 0 ,02
n 23
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
99
Se t calc > t tab ou t calc < −t tab ⇒ Rejeita-se H 0 para o nível α fixado
No exemplo, como t calc = −7 ,19 < − t tab = −2 ,074 , então deve-se rejeitar H 0 : µ = 0 ,5 g
7ª) Conclusão:
A rejeição da hipótese nula H 0 : µ = 0 ,5 g , para o nível de significância de 5%, sugere que a quantidade
de AAS dos comprimidos do lote nº 777 não está dentro das especificações exigidas (em média, possuem
quantidade de AAS menor do que o exigido). Consequentemente, o órgão governamental não deveria permitir a
comercialização do lote nº 777.
associadas ao teste t para outras hipóteses estatísticas. O Quadro 6.5 apresenta um resumo das regiões de
rejeição de H 0 associadas aos diferentes tipos de hipóteses para o teste t para comparação de uma média
H 0 : µ ≥ µ 0 contra H 1 : µ < µ 0 x − µ0
t calc = < − t n −1,α
s n
H 0 : µ ≤ µ 0 contra H 1 : µ > µ 0 x − µ0
t calc = > t n−1,α
s n
x − µ0
t calc = < − t n −1,α
s n 2
H 0 : µ = µ 0 contra H 1 : µ ≠ µ 0 ou
x − µ0
t calc = > t n-1,α
s n 2
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
100
Exemplo 6.4: Um experimento foi realizado para avaliar se as drogas “B” e “G” são equivalentes quanto ao
tempo de coagulação sangüínea em humanos. O experimento consistiu em selecionar aleatoriamente treze
indivíduos da população, dos quais, também ao acaso, seis foram alocados ao Grupo B (isto é, tratados com a
droga B). Os outros sete indivíduos foram alocados ao Grupo G (isto é, tratados com a droga G). Uma amostra
de sangue é retirada de cada pessoa, sendo observado o respectivo tempo até a coagulação (em minutos). Este
exemplo é discutido por Zar (1996, p.123) e os dados são apresentados no Quadro 6.6.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
101
Este é um típico problema que envolve duas amostras independentes, as quais devem ser
usadas para fazer inferências sobre as populações. No caso, trata-se de duas populações hipotéticas: a população
de “todos” os indivíduos que seriam tratados pela droga B ou pela droga G. Assim, existem duas variáveis
aleatórias envolvidas:
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
102
H 0 : o tempo médio até a coagulação sangüínea na população de indivíduos tratados com a Droga B é
igual ao da população de indivíduos tratados com a Droga G
H 1 : o tempo médio até a coagulação sangüínea na população de indivíduos tratados com a Droga B é
diferente da população de indivíduos tratados com a Droga G,
ou seja, H 0 : µ1 = µ 2 contra H 1 : µ1 ≠ µ 2 .
x1 − x 2
t calc = ~ t( n1 + n2 −2 )
1 1
s 02 +
n1 n2
Na amostras, foram observados: Grupo 1 (Droga B): n1 = 6; x1 = 8,75 min; s12 = 0 ,3390 min 2
Como as variâncias das duas populações são iguais, então s 02 é uma estimativa conjunta da
variância populacional σ 2 (desconhecida), considerando as observações das duas amostras. Em outras palavras,
s 02 pode ser vista como uma média ponderada das variâncias amostrais, onde os pesos associados são
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
103
Como o teste de hipóteses é bilateral e a estatística de teste deve ser comparada com a
tabelados são t( 11 );0 ,025 = 2 ,201 e - t( 11 );0 ,025 = −2 ,201 , os quais delimitam a região de rejeição de
Se − t( 11 );0 ,025 = −2,201 < t calc < t( 11 );0 ,025 = +2 ,201, então não se rejeita H 0 : µ1 = µ 2 para
α = 0,05; caso contrário rejeita-se H 0 : µ1 = µ 2 .
Portanto, como o valor calculado da estatística de teste t calc = −2 ,4693 < −t( 11 );0 ,025 = −2 ,201 , então
deve-se rejeitar H 0 : µ1 = µ 2 para o nível de significância de 5%, em favor de H 1 : µ1 ≠ µ 2 .
6ª) Conclusão:
A rejeição da hipótese nula H 0 : µ1 = µ 2 , para o nível de significância de 5%, evidencia que as drogas
B e G não são “equivalentes” quanto ao tempo médio até a coagulação sangüínea, sugerindo o tempo médio de
coagulação sangüínea é menor quando os indivíduos são tratados com a droga B.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
104
teste t para amostras independentes, considerando os demais tipos de hipóteses estatísticas, conforme disposto
no Quadro 6.7.
H 0 : µ1 = µ 2 contra H 1 : µ1 ≠ µ 2 ou
x1 − x2
tcalc = < −t( n α
1 + n2 − 2 ); 2
1 1
s02 +
n
1 n2
H 0 : µ1 ≥ µ 2 contra H 1 : µ1 < µ 2 x1 − x2
tcalc = < −t( n1 + n2 − 2 );α
1 1
s02 +
n1 n2
H 0 : µ1 ≤ µ 2 contra H 1 : µ1 > µ 2 x1 − x2
tcalc = > t( n1 + n2 − 2 );α
1 1
s02 +
n1 n2
O teste de hipótese discutido na Seção 6.2.3 pode ser útil para comparar duas médias
populacionais no caso em que as amostras são independentes. Em outras palavras, quando os experimentos são
delineados de tal forma que as unidades amostrais são aleatoriamente alocadas aos tratamentos de uma maneira
que garanta que as duas amostras sejam independentes. A independência entre as duas amostras, neste caso,
significa que cada unidade amostral de uma amostra não está associada (ou correlacionada) com qualquer outra
observação da outra amostra.
Para facilitar a compreensão do conceito de independência entre duas amostras, é
conveniente considerar o Exemplo 6.4 discutido na Seção 6.2.3, relativo à comparação do tempo até a
coagulação sangüínea em indivíduos submetidos à droga B ou à droga G. O referido experimento foi organizado
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
105
Admita que um pesquisador está investigando o efeito do consumo de álcool (para uma
quantidade ou nível especificado) sobre o tempo de reação necessário para pisar no pedal do freio de um
automóvel. O objetivo básico é avaliar se o tempo médio de reação ( µ 2 ) na população de indivíduos que
consomem o nível especificado de álcool é maior do que na população de pessoas que não consomem álcool
( µ1 ) . O estudo poderia ser organizado e executado como descrito abaixo:
Estudo 1: Seleciona-se ao acaso um grupo de n indivíduos (que não consumiram álcool), submetendo-os ao
teste para determinar o respectivo tempo de reação necessário para pisar no pedal de freio do automóvel. Em
seguida, um segundo grupo com m indivíduos é aleatoriamente selecionado e cada indivíduo consome a
quantidade especificada de álcool, realizando o teste para registrar o correspondente tempo de reação necessário
para pisar no pedal de freio do automóvel. Desta forma, seriam delineadas duas amostras ou grupos
independentes de indivíduos: na primeira amostra (Grupo 1) são registrados os tempos de reação das n pessoas
que não consumiram álcool e, na segunda (Grupo 2), são registrados os tempos de reação das m pessoas que
consumiram álcool. Assumindo normalidade e igualdade de variâncias, as médias das duas populações
poderiam ser comparadas mediante a utilização do teste t para amostras independentes descrito na Seção 6.2.3,
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
106
das amostras, e não pelo fato de que o consumo de álcool não aumenta o tempo de reação.
Outra limitação do procedimento experimental descrito no Estudo 1 é a suposição de
igualdade de variâncias das duas populações, haja vista que após o consumo da quantidade de álcool
especificada o comportamento pode ser diferente de indivíduo para indivíduo. Veja Larson (1982, p.453).
Fica evidente, portanto, a necessidade de “controlar” a influência do tempo de reação
intrínseco a cada pessoa, de tal forma que o mesmo não interfira na comparação das médias. Para tanto, poderia
ser utilizado o seguinte procedimento experimental:
Estudo 2: Seleciona-se ao acaso um grupo de n indivíduos (que não consumiram álcool), submetendo-os ao
teste para determinar o respectivo tempo de reação necessário para pisar no pedal de freio do automóvel. Ao
invés de selecionar uma segunda amostra, estes indivíduos consomem a quantidade de álcool especificada e
novamente realizam o teste, registrando-se os correspondentes tempos de reação. Este procedimento produz n
pares de observações ( X 1 ,Y1 ),( X 2 ,Y2 ),L ,( X n ,Yn ) , que correspondem as duas medidas do tempo de reação
Dessa forma, parece ser razoável admitir que os pares ( X i ,Yi ) são variáveis aleatórias
correlacionadas, pois são medidas do tempo de reação do mesmo indivíduo. Em outras palavras, se o indivíduo i
naturalmente tem um rápido tempo de reação, então se espera que tanto antes quanto após o consumo de álcool
o tempo de reação seja rápido.
Admita que é razoável assumir que os pares ( X 1 ,Y1 ),( X 2 ,Y2 ),L ,( X n ,Yn ) formam uma
amostra aleatória, extraída de uma população com distribuição de probabilidade normal bivariada com
parâmetros µ1 , µ 2 , σ12 , σ 22 , ρ . Assim, a variável aleatória X tem média igual a µ1 e variância σ12 , enquanto
que a variável aleatória Y tem média igual a µ 2 e variância σ 22 e a correlação entre as variáveis X e Y é
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
107
igual a ρ . Sob estas condições, um resultado conhecido do cálculo de probabilidades garante que a variável
com variância igual a σ 2D = σ12 + σ 22 − 2ρσ1σ 2 . É importante notar que µ D = 0 é equivalente a dizer que
influência do tempo de reação intrínseco a cada indivíduo sobre a comparação das médias populacionais. Em
outras palavras, a definição da nova variável aleatória Di = X i − Yi ; ∀ i = 1,2 ,L , n , implica em uma amostra
aleatória D1 , D2 ,L , Dn , extraída de uma população que possui distribuição de probabilidade normal com
média µ D = µ1 − µ 2 e variância σ 2D . Portanto, a comparação das médias das duas populações pode ser
realizada através da utilização do teste t para uma única média, discutido na Seção 6.2.2. Contudo, neste
d
contexto a estatística de teste é t calc = , cuja distribuição de referência é a distribuição t de Student
sd
n
Em seguida, deve-se determinar o valor calculado da estatística de teste, comparando-o com o correspondente
valor tabelado da distribuição t de Student com n − 1 graus de liberdade, para o nível de significância α
fixado.
Antes de apresentar alguns exemplos convém fazer algumas observações importantes. Uma
das principais vantagens de utilizar estudos observacionais ou experimentais com amostras pareadas é que
usualmente permitem aumentar o poder das comparações. Isso ocorre devido ao fato de que o pareamento
permite controlar a influência de um ou mais fatores externos que podem influenciar nas comparações. Existem
três formas básicas de pareamento: autopareamento, pareamento natural e pareamento artificial, descritos
abaixo.
O autopareamento refere-se ao caso em que cada indivíduo é controle de si mesmo, como no
exemplo do tempo de reação para pisar no pedal de freio do automóvel. Outra situação típica de autopareamento
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
108
ocorre quando o mesmo indivíduo recebe duas drogas, administradas em duas ocasiões de tempo distintas.
Também se pode ter autopareamento quando se deseja comparar dois órgãos no mesmo indivíduo, tais como
olhos, pernas, narinas, etc., onde um dos órgãos foi submetido a um determinado tratamento e o outro órgão
funciona como “controle”.
O pareamento natural é construído mediante a formação de pares homogêneos, tais como a
utilização de gêmeos ou pares de animais oriundos de uma mesma ninhada.
Por sua vez, o pareamento artificial consiste em formar pares de indivíduos com
características semelhantes, tais como idade, sexo, raça, classe social, histórico clínico, etc. É importante
considerar as características que possivelmente influenciam a variável sob investigação. Convém salientar,
ainda, que é importante utilizar um procedimento aleatório para determinar qual elemento do par vai receber
cada tratamento, a fim de evitar a ocorrência de eventuais vícios.
Outra observação importante é que, na prática, não é necessário assumir que
( X 1 ,Y1 ),( X 2 ,Y2 ),L ,( X n ,Yn ) é uma amostra aleatória de uma população com distribuição de probabilidade
normal bivariada; basta que as diferenças D1 , D2 ,L , Dn formem uma amostra aleatória extraída de uma
distribuição de referência t de Student pode ser substituída pela distribuição normal padrão. Para ilustrar este
tipo de teste de hipóteses, considere o exemplo relativo ao tempo de reação necessário para pisar no pedal de
freio descrito anteriormente e complementado abaixo:
Exemplo 6.5: Admita que um pesquisador está investigando o efeito do consumo de álcool (para uma
quantidade ou nível especificado) sobre o tempo de reação necessário para pisar no pedal do freio de um
automóvel. O objetivo básico é avaliar se o tempo médio de reação ( µ 2 ) na população de indivíduos que
consomem o nível especificado de álcool é maior do que na população de pessoas que não consomem álcool
( µ1 ) . Para tanto, foram selecionados 10 voluntários e submetidos ao teste para medir o tempo de reação
necessário para pisar no pedal de freio do automóvel. Em seguida, cada um dos 10 indivíduos consumiu a
quantidade de álcool especificada e novamente realizou o teste, registrando-se o correspondente tempo de
reação. Os dados gerados são apresentados no Quadro 6.8, onde
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
109
Para executar o teste é conveniente seguir as etapas descritas nas seções anteriores, ou seja:
aleatória de uma população com distribuição de probabilidade normal bivariada. Basta admitir que as diferenças
Di = X i − Yi ; ∀ i = 1,2,L , n , ou seja, que D1 , D2 ,L , Dn formem uma amostra aleatória extraída de uma
H 0 : µ1 ≥ µ 2 ou , equivalentemente, H 0 : µ D ≥ 0
d − 201,3
t calc = = = −13,33 .
sd 47 ,77
n 10
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
110
Se t calc < −t( 9 );0 ,05 = −1,833 ⇒ Rejeita-se H 0 para o nível α fixado
Se t calc ≥ −t( 9 );0 ,05 = −1,833 ⇒ Não se rejeita H 0 para o nível α fixado.
Como t calc = −13,33 < t (9);0,05 = −1,833 , então deve-se rejeitar H 0 : µ1 ≥ µ 2 , para o nível de
significância de 5%.
7ª) Conclusão:
Há evidências de que na população com consumo da quantidade de álcool especificada, o
tempo médio de reação para pisar no pedal do freio do automóvel é maior do que na população de indivíduos
que não consomem álcool, para o nível de significância de 5%.
teste t para amostras pareadas, considerando os demais tipos de hipóteses estatísticas, conforme disposto no
Quadro 6.9.
d
t calc = > t ( n −1 );α
H 0 : µ1 = µ 2 contra H 1 : µ1 ≠ µ 2 sd 2
n
ou ou
H 0 : µ D = 0 contra H 1 : µ D ≠ 0 d
t calc = < −t ( n −1 );α
sd 2
n
H 0 : µ1 ≥ µ 2 contra H 1 : µ1 < µ 2
ou d
t calc = < −t ( n −1 );α
sd
H 0 : µ D ≥ 0 contra H 1 : µ D < 0 n
H 0 : µ1 ≤ µ 2 contra H 1 : µ1 > µ 2
ou d
t calc = > +t ( n −1 );α
sd
H 0 : µ D ≤ 0 contra H 1 : µ D > 0 n
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
111
Na Seção 6.2.1 foi apresentado um procedimento para comparar a média de uma população
com um valor de referência, quando a variável em estudo segue uma distribuição normal com desvio padrão
populacional conhecido. A execução do teste de hipóteses consiste basicamente em comparar o valor observado
da média amostral X com o valor crítico definido pelo valor da distribuição de referência para o nível de
significância especificado.
De maneira similar, se a característica em estudo é dicotômica, isto é, se assume apenas dois
x
valores genericamente rotulados como “sucesso” ou “fracasso”, então a proporção amostral p = p̂ = pode
n
ser vista como uma espécie de média amostral (ou seja, como o número médio de sucessos na amostra), onde x
é o número de sucessos na amostra aleatória de tamanho n . De fato, este resultado já foi comentado na Seção
6.1.2.3, quando foi derivada a expressão para o intervalo de confiança para uma proporção populacional p .
Assim, procedimento de teste de hipóteses para esta situação é baseado na proporção amostral p e é similar ao
procedimento descrito na Seção 6.2.1. A utilização do Exemplo 6.6 facilita sua compreensão.
Exemplo 6.6 (didático): Um determinado hospital adquiriu um lote com uma grande quantidade de
seringas de um determinado fabricante, o qual garante que no máximo 10% das seringas que ele produz
apresentam algum defeito de fabricação. Entretanto, desconfiando da qualidade dessas seringas, o enfermeiro
responsável pela avaliação da qualidade do material hospitalar deseja avaliar se as seringas produzidas por esta
empresa de fato atendem esta especificação; em caso contrário, o lote de seringas deverá ser substituído. Para
tanto, o enfermeiro selecionou uma amostra de 80 seringas do referido lote, submetendo-as a vários testes para
verificar a presença ou não de defeitos de fabricação. Sabendo que dentre as 80 seringas examinadas 14
apresentaram algum problema, este lote deveria ser devolvido?
Deve-se ter em mente que trata-se de um teste de hipóteses e, consequentemente, a reposta
depende do nível de significância α . A solução pode ser melhor compreendida seguindo as etapas já
apresentadas nos testes de hipóteses anteriores:
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
112
P[ X i = 0] = 1 − p, ∀ i = 1,2 ,L ,80 .
80
A variável aleatória definida pelo número de sucessos na amostra é X = ∑
i =1
X i ~ B(80 , p ) , onde p é
pelo Teorema Central do Limite, a distribuição binomial pode ser aproximada pela distribuição normal; mais
precisamente, para um tamanho de amostra suficientemente grande, a distribuição de probabilidade da
p(1 − p )
proporção amostral p é aproximadamente normal com média np e variância .
n
Consequentemente, sob a hipótese nula H 0 : p ≤ p 0 = 0 ,10 e para n suficientemente
grande, p segue uma distribuição aproximadamente normal com média np 0 = 80 × 0 ,1 = 8 e com variância
p 0 (1 − p 0 ) 0 ,10 × 0 ,9
= = 0 ,0011 . Assim, sob a hipótese nula, a estatística de teste é dada por
n n
p − p0 p − p0
z calc = = ,
EPp p0 (1 − p0 )
n
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
113
devendo ser comparada com uma distribuição normal padrão. É importante salientar que a distribuição de
referência normal padrão é adequada apenas quando tamanho da amostra é grande. Uma maneira prática para
avaliar se o tamanho da amostra é suficientemente grande, ou seja, se a distribuição normal padrão é adequada,
é verificar se as condições np 0 ≥ 5 e np 0 (1 − p 0 ) ≥ 5 estão satisfeitas. No exemplo em discussão, observe que
e, portanto, a distribuição normal padrão pode ser utilizada como distribuição de referência da estatística de
teste. Na amostra foram observadas 14 seringas defeituosas, de tal forma que a proporção amostral de seringas
defeituosas é
x 14
p= = = 0,18 .
n 80
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
114
No exemplo, como z calc = 2 ,39 > z tab = +1,64 , então deve-se rejeitar a hipótese nula
7ª) Conclusão:
Para o nível de significância 5%, há evidências de que a verdadeira proporção de seringas defeituosas
no lote é maior do que 0,10 (10%), contrariando a afirmação do fabricante. Consequentemente, por este critério
o lote deveria ser substituído.
Para finalizar, é conveniente apresentar as regiões de rejeição associadas aos outros tipos de
hipóteses estatísticas, para o teste de hipóteses utilizado para comparar uma proporção populacional com um
valor de referência p 0 , conforme disposto no Quadro 6.10.
H 0 : p ≥ p0 contra H 1 : p < p0 p − p0
z calc = < − zα
p0 (1 − p0 )
n
H 0 : p ≤ p0 contra H 1 : p > p 0 p − p0
z calc = > + zα
p0 (1 − p0 )
n
p − p0
z calc = < − zα
p 0 (1 − p 0 ) 2
H 0 : p = p0 contra H 1 : p ≠ p0 n
ou
p − p0
z calc = > zα
p 0 (1 − p 0 ) 2
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
115
De fato, o procedimento é similar ao teste t descrito na Seção 6.2.3, porém é baseado na distribuição normal
padrão. É importante mencionar que trata-se de uma aproximação pela distribuição normal, motivo pelo qual
deve ser utilizado apenas quando as amostras são suficientemente grandes. Para definir e ilustrar o procedimento
de comparação das proporções populacionais, mediante duas amostras independentes, é conveniente utilizar o
exemplo descrito abaixo.
Exemplo 6.7: Um novo tratamento foi proposto para pacientes com determinada doença e um pesquisador
deseja avaliar se ele realmente é melhor do que um tratamento padrão. Para tanto, selecionou uma amostra
aleatória de 130 pacientes com a doença, aleatoriamente dividindo-os em dois grupos: um grupo constituído por
70 indivíduos, os quais foram submetidos ao tratamento padrão, enquanto que os outros 60 indivíduos foram
submetidos ao novo tratamento. Ao final do tratamento, verificou-se o número de indivíduos que estavam
recuperados da doença, constatando que dos 70 indivíduos que receberam o tratamento padrão, 50 estavam
recuperados. No grupo de pacientes submetidos ao novo tratamento, 51 estavam curados da doença. É possível
afirmar que o novo tratamento é mais eficaz do que o tratamento padrão?
Logicamente que esta pergunta deve ser respondida no contexto de um teste de hipóteses,
utilizando como critério de comparação a proporção de indivíduos recuperados da doença, para cada grupo.
Observe que os grupos claramente constituem duas amostras independentes, onde a resposta é dicotômica. Em
outras palavras, em cada um dos pacientes submetidos ao tratamento padrão a resposta ao final do tratamento é
“recuperado da doença” ou “não recuperado da doença”, que pode ser representada pela variável rotulada como
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
116
onde X 1 , X 2 ,L , X 70 representa a amostra aleatória de indivíduos submetidos ao tratamento padrão, tal que
P[ X i = 1] = p1 e P[ X i = 0] = 1 − p1 , ∀ i = 1,2,L ,70 .
onde Y1 ,Y2 ,L ,Y60 representa a amostra aleatória de indivíduos submetidos ao novo tratamento, tal que
H 1 : p1 < p 2 ou p1 − p 2 < 0.
O teste de hipóteses é baseado nas proporções amostrais p1 e p 2 , pois para tamanhos de amostra
p1 − p 2
z calc = ,
1 1
p 0 (1 − p0 ) +
n1 n2
n1 p1 + n2 p 2
onde p 0 = é uma estimativa da proporção de sucessos populacional sob a hipótese nula. Quando
n1 + n2
as amostras são suficientemente grandes, esta estatística de teste pode ser comparada com a distribuição normal
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
117
padrão. Na prática, um procedimento que é útil para avaliar se os tamanhos de amostras são suficientemente
grandes é verificar se estão satisfeitas as condições n1 p1 ≥ 5 , n1 p1 (1 − p1 ) ≥ 5 , n2 p 2 ≥ 5 e
n 2 p 2 (1 − p 2 ) ≥ 5 .
Um resultado do cálculo de probabilidades garante que uma variável aleatória com
distribuição normal padrão, quando elevada ao quadrado, segue uma distribuição de probabilidade qui-quadrado
com 1 grau de liberdade. Assim, a estatística
( p1 − p 2 )2
Z2 =
1 1
p 0 (1 − p 0 ) +
n1 n2
possui uma distribuição assintótica de qui-quadrado com 1 grau de liberdade. Este resultado implica que o teste
de hipóteses (bilateral) para comparar duas proporções populacionais com amostras independentes é equivalente
ao teste de homogeneidade de marginais mencionado na Seção 1.1 e que será apresentado na Seção 8.3. O leitor
interessado em discutir os aspectos teóricos do teste pode consultar, por exemplo, Costa Neto (1977, p.118) ou
Rohatgi (1976, p.446).
O problema apresentado no Exemplo 6.7 pode ser resolvido através das etapas descritas nas
seções anteriores, com segue:
x 50
x = 50 ⇒ p1 = = = 0,71 .
n1 70
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
118
y 51
y = 51 ⇒ p 2 = = = 0 ,85 .
n2 60
H 0 : a proporção de indivíduos que se recuperam da doença pelo tratamento padrão é maior ou igual
do que a proporção de indivíduos que se recuperam da doença através do novo tratamento.
H 1 : a proporção de indivíduos que se recuperam da doença pelo novo tratamento é menor do que a
proporção de indivíduos que se recuperam da doença através do novo tratamento.
ou seja,
H 0 : p1 ≥ p 2 ou p1 − p 2 ≥ 0
H 1 : p1 < p 2 ou p1 − p 2 < 0.
n2 p 2 = 60 × 0,92 = 55,2 > 5 e n2 p 2 (1 − p 2 ) = 60 × 0 ,85 × 0 ,15 = 7 ,7 > 5 estão satisfeitas, de tal forma que o
teste Z pode ser utilizado para comparar as duas proporções populacionais. Sob a hipótese nula, a estimativa
conjunta da proporção de pacientes recuperados é
n1 p1 + n2 p 2 70 × 0 ,71 + 60 × 0 ,92
p0 = = = 0 ,81 .
n1 + n2 70 + 60
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
119
Como z calc = −2 ,03 < z tab = −1,64 , então deve-se rejeitar a hipótese nula rejeita-se
6ª) Conclusão:
proporção de indivíduos que se recuperam da doença é maior quando submetidos ao novo tratamento, ou seja, o
novo tratamento parece ser melhor do que o tratamento padrão.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
120
p1 − p 2
z calc = > + zα
1 1 2
p 0 (1 − p 0 ) +
n1 n 2
H 0 : p1 = p 2 contra H 1 : p1 ≠ p 2 ou
p1 − p 2
z calc = < −zα
1 1 2
p 0 (1 − p 0 ) +
n1 n 2
p1 − p 2
z calc = < − zα
H 0 : p1 ≥ p 2 contra H 1 : p1 < p 2 1 1
p 0 (1 − p 0 ) +
n1 n 2
p1 − p 2
z calc = > + zα
H 0 : p1 ≤ p 2 contra H 1 : p1 > p 2 1 1
p 0 (1 − p 0 ) +
n1 n2
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
121
Uma das situações que surge com grande freqüência no contexto biológico é a necessidade
de avaliar a existência de uma possível relação entre duas características quantitativas e, se for o caso,
determinar o grau dessa “relação”. Em outras palavras, deseja-se estudar o comportamento simultâneo entre
duas variáveis, com a finalidade de identificar se elas possuem algum tipo de relação ou, em determinadas
situações específicas, algum tipo de dependência.
A forma mais simples de relação entre duas variáveis quantitativas é a presença de uma
estrutura linear que descreve o comportamento simultâneo das variáveis. Sob condições controladas, é possível
estudar relações de causa e efeito entre as duas variáveis, caso em que se fala em estrutura de dependência
linear.
Neste capítulo serão brevemente discutidos dois métodos estatísticos para avaliar a
existência ou não de relação linear entre duas variáveis quantitativas. O primeiro, denominado de correlação
linear, é útil para medir o grau da relação linear entre as variáveis aleatórias. O segundo método é chamado de
regressão linear simples e pode ser utilizado para avaliar (e quantificar) a existência de uma estrutura de
dependência linear entre as variáveis; sob condições controladas, também é possível avaliar relações do tipo
causa e efeito.
O objetivo básico deste método estatístico é medir o grau em que duas variáveis aleatórias
quantitativas estão relacionadas segundo uma estrutura linear e, a partir deste valor, avaliar se esta relação linear
de fato existe na população. Para ilustrar o desenvolvimento e aplicação do método é conveniente considerar o
exemplo descrito por Daniel (1974, p.254).
Exemplo 7.1: Uma amostra de 25 pacientes foi selecionada ao acaso de uma população de indivíduos
hipertensos e, para cada indivíduo, foi observada a pressão sangüínea sistólica através de dois métodos,
denominados Método I e Método II. O objetivo é avaliar o grau de correlação linear entre os dois métodos
utilizados para medir a pressão sistólica. Os dados são mostrados na Tabela 7.1, onde também são apresentados
os cálculos básicos necessários para avaliar a existência de correlação linear. Note que a variável X representa as
medidas da pressão sistólica mediante o Método I, enquanto que Y representa as medidas da pressão sistólica
mediante o Método II.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
122
220
Y: Pressão Sistólica (Método II)
200
180
160
140
120
120 140 160 180 200 220 240
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
123
O objetivo básico é avaliar se estes métodos são coerentes para medir a pressão sistólica dos
indivíduos. Observe que para cada indivíduo existe um par de valores ( xi , y i ) que corresponde às medidas da
pressão sistólica realizadas pelo Método I e pelo Método II . Consequentemente, se o Método I e o Método II
são “coerentes” ou “equivalentes” para medir a pressão sistólica, então o valor xi deveria ser aproximadamente
Um procedimento extremamente útil para visualizar o tipo de relação existente entre duas
variáveis quantitativas é o diagrama de dispersão. A Figura 7.1 mostra o diagrama de dispersão entre as medidas
da pressão sistólica realizadas pelo Método I e pelo Método II na amostra de 25 indivíduos hipertensos. Como
existe variabilidade nas respostas, a relação entre as variáveis pode ser avaliada através do coeficiente de
correlação linear de Pearson, que no caso amostral é definido por
n n
n ∑
xi
∑y i
∑ xi y i − i =1
i =1
i =1 n
r= .
2 2
n n
n ∑
xi
n
∑ y
i
× y i2 − 1
∑i =1
2
xi −
i =1
n
∑
i =1
i=
n
X X
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
124
A inspeção visual da Figura 7.1 claramente revela a existência de uma correlação linear
positiva entre as medidas da pressão sistólica realizadas pelo Método I e pelo Método II. Para determinar o valor
da correlação linear é conveniente usar os resultados parciais apresentados na Tabela 7.1, de tal forma que
n n
n ∑
xi
∑
yi
∑ xi y i − i =1
i =1
i =1 n
r=
2 2
n n
n ∑
xi
n
∑ y i
∑ xi2 − ×
∑ y i2 −
i =1 i =1
i =1 n i =1 n
4.440 × 4.172
757.276 −
r= 25
808.408 −
(4.440)2 × 710.952 −
(4.172)2
25 25
Assim, constata-se que existe uma forte correlação linear entre as observações amostrais da
pressão sistólica realizadas através dos métodos em questão. Entretanto, este resultado permite apenas concluir
sobre a relação entre as variáveis na amostra; se o objetivo é avaliar a existência de correlação linear na
população, então é necessário realizar um teste de hipóteses sobre a correlação populacional, usualmente
denotada por ρ .
Neste momento é conveniente fazer algumas considerações teóricas sobre as exigências
necessárias para a avaliação da correlação linear. De fato, para calcular a coeficiente de correlação amostral não
é necessário fazer nenhuma suposição sobre a forma das distribuições de probabilidades das variáveis aleatórias
X e Y. Contudo, para testar hipóteses e construir intervalos de confiança para o coeficiente de correlação
populacional ρ , os pares ( X 1 ,Y1 ), ( X 2 ,Y2 ),L , ( X n ,Yn ) devem formar uma amostra aleatória extraída de uma
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
125
Embora seja possível testar vários tipos de hipóteses sobre a correlação populacional ρ ,
neste curso será abordado apenas o caso em que deseja-se verificar se a correlação é diferente de zero na
população. Em outras palavras, a partir do coeficiente de correlação amostral, deseja-se avaliar se existe
correlação linear na população, para o nível de significância α especificado. Os demais casos estão
extensamente descritos na literatura estatística, cabendo destacar Zar (1996, p.371), Daniel (1974, p.257) e
Costa Neto (1977, p.186).
Voltando ao Exemplo 7.1, deseja-se avaliar se na população de indivíduos hipertensos existe
correlação linear entre as leituras da pressão sistólica realizadas através do Método I e do Método II. As
hipóteses estatísticas podem ser formuladas como H 0 : ρ = 0 e H 1 : ρ ≠ 0 . Assim, a rejeição da hipótese nula
H 0 : ρ = 0 significa que a amostra produziu evidências de que existe correlação linear na população, enquanto
que a não rejeição da hipótese nula evidencia que as variáveis em estudo não são linearmente correlacionadas na
população. O teste de hipóteses é baseado na estatística
r n−2
t calc = = r× ,
1− r2 1− r2
n−2
que sob a hipótese nula segue uma distribuição de probabilidade t de Student com (n − 2) graus de liberdade.
Para facilitar a execução do teste de hipóteses pode-se seguir as etapas descritas nas seções anteriores:
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
126
4ª) Determinar os valores de t tabelado: − t 23;0 ,025 = −2,069 e t 23;0 ,025 = +2 ,069
0 ,9546 0 ,9546
n = 25 e r = 0 ,9546 ⇒ t calc = = = 15,37 .
1 − (0 ,9546 )2 0 ,0621
25 − 2
6ª) Decisão estatística:
Como t calc = 15,37 > t (23);0,025 = +2 ,069 , então deve-se rejeitar, H0 : ρ = 0 para o nível de
significância de 5%.
7ª) Conclusão:
Há evidências de que existe uma correlação positiva entre as medidas da pressão sistólica
realizadas pelo Método I e pelo Método II, na população de pacientes hipertensos, para o nível de significância
0,05. Como a correlação amostra é positiva ( r = +0 ,9546 ), então na medida que crescem os valores da pressão
arterial observados pelo Método I, também aumentam os valores observados pelo Método II, e vice-versa.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
127
definido por r 2 e usualmente é multiplicado por 100 para ser interpretado. Para os dados do Exemplo 7.1, o
coeficiente de determinação amostral é
r 2 = (0 ,9546 ) = 0 ,9113
2
⇒ r 2 × 100 = 0,9113 × 100 = 91,13%
e significa que aproximadamente 91% da variabilidade das medidas da pressão sistólica realizadas pelo Método
I podem ser explicadas pela variabilidade das observações realizadas pelo Método II, e vice-versa.
A origem da análise de regressão linear é devida ao cientista inglês Francis Galton (1822-
1911) e está intimamente relacionada com a análise de correlação linear. Pioneiro no estudo da correlação e
regressão linear, Galton desenvolveu esses procedimentos enquanto realizava estudos sobre herança genética.
Em particular no estudo da estatura humana, Galton descreveu a tendência da altura dos filhos (tanto filhos de
pais altos quanto filhos de pais baixos) “regredir” para a média da população em geral. De fato, a palavra
inicialmente utilizada por Galton para representar este fenômeno foi “reversion” e, depois, “regression”. Veja
Daniel (1974, p.224), Zar (1996, p.317, p.372).
A análise de regressão linear é uma técnica de análise estatística de dados extremamente útil
para investigar a dependência funcional de uma variável aleatória quantitativa em relação à outra característica
quantitativa. Se for razoável assumir uma estrutura linear para descrever o comportamento da variável
dependente em função da outra variável, então, sob certas condições, também é possível estimar o valor
esperado da variável dependente para um valor conhecido da variável explicativa.
No modelo de regressão linear simples existem duas variáveis sob investigação, usualmente
denominadas de variável dependente (Y) e de variável explicativa, independente, preditor ou regressor (X). Na
maioria dos problemas de pesquisa, contudo, a variável explicativa X é controlada pelo pesquisador, de tal
forma que não é caracterizada como uma variável aleatória. Em outras palavras, os valores da variável
explicativa são deliberadamente selecionados a priori pelo pesquisador, observando-se os correspondentes
valores da variável dependente e aleatória Y. É importante salientar que a escolha dos valores da variável
explicativa depende criticamente dos objetivos do estudo e, portanto, é uma etapa vital do delineamento do
experimento a ser conduzido.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
128
Exemplo 7.2: A Tabela 7.2 apresenta um conhecido conjunto de dados descrito na literatura de análise de
regressão, relatando a utilização uma amostra aleatória de 21 crianças para avaliar a relação funcional entre o
grau de desenvolvimento de crianças e a idade em que pronunciam a primeira palavra. O grau de
desenvolvimento da criança, medido através do escore Gessel de desenvolvimento, é a variável resposta ou
dependente Y, enquanto que a idade (em meses) ao pronunciar a primeira palavra é a variável explicativa X.
Sobre a relação funcional, naturalmente espera-se que na medida que aumenta a idade ao pronunciar a primeira
palavra, diminui o valor do escore Gessel de desenvolvimento. O objetivo, então, é avaliar se o modelo linear é
plausível para descrever esta estrutura funcional.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
129
130
120
110
Escore de Gessel (Y)
100
90
80
70
60
50
0 5 10 15 20 25 30 35 40 45 50
A inspeção visual da Figura 7.5 sugere a existência de uma relação aproximadamente linear
entre a variável dependente e a variável explicativa, revelando a tendência já esperada de que o escore Gessel de
desenvolvimento decresce com o aumento da idade ao pronunciar a primeira palavra. No entanto, os dados
amostrais indicam apenas a possibilidade desta dependência linear existir na população. Em outras palavras, os
dados amostrais sugerem a possibilidade de que a verdadeira estrutura de dependência entre a variável
dependente Y e a variável explicativa X é linear, podendo ser representada pelo modelo
Yi = α + β X i + ε i ; ∀ i = 1,2 ,L , N ,
onde N é o tamanho da população. Esta é a equação da reta e representa a relação teórica entre as variáveis e
só pode ser conhecida se toda a população é estudada. O parâmetro α é chamado de intercepto e representa o
ponto onde a reta encontra-se com o eixo dos y , ou seja o valor de y quando x = 0 . Por sua vez, o parâmetro
β é denominado coeficiente de regressão ou coeficiente angular e representa a inclinação da reta. Observe que
sob este modelo linear, para cada valor xi corresponde um valor teórico y*i = α + β xi . Assim, a diferença
entre o valor observado y i e o valor teórico y*i é a variável aleatória ε i = y i − y*i , que representa a parte da
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
130
variabilidade da variável dependente Y que não pode ser explicada pela variável explicativa X através do modelo
linear.
Observe que a resposta Y é uma variável aleatória, pois é uma função da variável aleatória
ε i . Portanto, para cada valor xi a variável resposta Y pode assumir diversos valores, tal que existe uma
distribuição de probabilidade para estes valores. Tecnicamente falando, o modelo de regressão linear é uma reta
que considera o valor médio da variável dependente e aleatória Y, dado os valores não aleatórios da variável
explicativa x . Em outras palavras, a modelagem é relativa à esperança condicional E [Y | xi ] = α + β xi , onde
os valores da variável explicativa são considerados não aleatórios. As suposições básicas do modelo de
regressão são as seguintes:
a) o erro aleatório ε i é uma variável aleatória com média zero e variância σ 2 (desconhecida), isto é,
(
∀ i; ε i ~ 0,σ 2 ) ou E [ε i ] = 0 e Var ε i = σ 2 ;
(
b) para todo i ≠ j , ε i e ε j são não correlacionadas; ou seja, ∀ i ≠ j corr ε i , ε j = 0 . )
As exigências dispostas nos itens (a) e (b) implicam que os erros aleatórios, também
chamados de resíduos do modelo, são não correlacionados, têm variância constante σ 2 e sua distribuição de
probabilidade está centrada no valor zero.
Outra suposição, não estritamente necessária, é que a forma da distribuição de probabilidade
( )
dos erros aleatórios ε i seja normal, isto é, ε i ~ N 0 , σ 2 . Assim, para todo i ≠ j os erros aleatórios ε i e ε j
são independentes. Para um tamanho de amostra suficientemente grande, como resultado imediato do Teorema
Central do Limite apresentado no Capítulo 5, há uma tendência para que os resíduos sejam normalmente
distribuídos, tal que a suposição de normalidade pode ser averiguada mediante os resíduos do modelo.
Na prática, entretanto, trabalha-se com uma amostra aleatória que consiste em n pares de
observações ( x1 , y1 ),( x 2 , y 2 ),L ,( x n , y n ) , através dos quais deseja-se estimar os parâmetros α e β . O modelo
sendo que para cada valor xi corresponde o resíduo ou desvio ε i = y i − (α + βxi ) , que são as discrepâncias
entre o valor observado y i e o valor teórico especificado pelo modelo linear. No entanto, esses valores teóricos
valores que minimizam a soma dos quadrados dos desvios ε i = y i − (α + βxi ) , sendo chamado de método de
mínimos quadrados. A estimação dos parâmetros do modelo encontra-se amplamente descrita na literatura, não
cabendo demonstrar neste momento; o leitor interessado pode consultar, por exemplo, Draper & Smith (1981,
p.13-18) ou Costa Neto (1977, p.193).
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
131
n n
n ∑
xi
y i∑
n
∑ xi y i − i =1 i =1 ∑ (x i − x )( yi − y )
i =1 n i =1
b= 2
= n
∑ (x
n
− x )2
n ∑
xi
i =1
i
∑ xi2 − i =1
i =1 n
n n
∑
i =1
yi ∑x
i =1
i
e o estimador de mínimos quadrados paro o intercepto α é a = y − bx , onde y = e x= .
n n
Uma vez estimados os parâmetros α e β , obtém-se a equação de regressão estimada ou
ajustada, dada por
ŷ i = a + bxi .
Se a equação de regressão ajustada apresenta uma boa aderência aos dados observados, então
ela pode ser utilizada para representar a verdadeira relação funcional entre as variáveis; alguns critérios de
avaliação do ajuste serão descritos a seguir. Observe que mediante a substituição dos valores xi na equação de
regressão ajustada, podem ser obtidos os respectivos valores estimados ŷ i . Assim, na prática são considerados
Neste momento é conveniente retomar os dados do Exemplo 7.2 para ilustrar o procedimento
de obtenção das estimativas dos parâmetros. A Tabela 7.3 apresenta os resultados dos cálculos intermediários,
bem como os valores estimados pelo modelo e os correspondentes desvios e quadrados dos desvios em relação
aos valores observados. A estimativa do coeficiente de regressão é dada por
n n
n ∑
xi
y i
∑
∑ xi y i − i =1 i =1 26.864 −
302 × 1967
i =1 n 21 1.423,33
b= = = = −1,1270 ,
n
2
(302 ) 2
1.262,95
n ∑
xi
5606 −
21
∑ xi2 − i =1
i =1 n
n n
∑i =1
yi
1967
∑x
i =1
i
302
As médias amostrais são y = = = 93,67 e x = = = 14,38 .
n 21 n 21
Assim, o intercepto é estimado por
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
132
Portanto, a equação de regressão estimada ou ajusta é ŷ = 109 ,88 − 1,1270 x . Observe que o
coeficiente de regressão é negativo, expressando a direção da relação já esperada, ou seja, que o grau de
desenvolvimento da criança decresce com o aumento da idade ao falar a primeira palavra.
É importante salientar que para poder utilizar o modelo de regressão para representar a
verdadeira relação funcional entre as variáveis na população, não é suficiente determinar a equação de regressão
ajustada. Em outras palavras, antes de estender os resultados para a população, é imprescindível avaliar a
qualidade ou precisão da reta ajustada, sob pena de cometer erros grosseiros nas conclusões. Em resumo, deseja-
se avaliar se o modelo ajustado é válido para a população, o que pode ser feito através de um teste de hipóteses
sobre a significância do coeficiente de regressão, chamado de teste de significância da regressão.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
133
Também é importante realizar a análise dos resíduos do modelo para avaliar a adequação da
suposição de normalidade e homogeneidade de variâncias, bem como verificar a eventual existência de pontos
de influência ou pontos de alavanca que poderiam causar perturbações no ajuste do modelo e,
consequentemente, nas generalizações ou predições realizadas. No entanto, estes tópicos estão fora dos
objetivos do curso, sendo abordados apenas alguns aspectos básicos. Ao leitor interessado recomenda-se
consultar a literatura de análise de regressão, cabendo destacar Draper & Smith (1981).
Se o modelo ajustado é plausível, então os resíduos devem exibir tendências que confirmem
as suposições do modelo; ou seja, devem sugerir que o modelo está correto. A normalidade dos resíduos é
necessária para poder realizar o teste de significância da regressão. Assim, para avaliar a adequação da
normalidade dos resíduos, pode-se realizar os procedimentos gráficos já descritos (Q-Q plot, histograma,
diagrama de pontos, etc.); outra alternativa é utilizar um teste de aderência. Na análise de regressão é mais
comum a utilização de gráficos para o exame dos resíduos.
Convém lembrar que a suposição sobre os resíduos é que eles devem seguir uma distribuição
( )
normal com média zero e variância igual a σ 2 , isto é, ε i ~ N 0 , σ 2 . Assim, os resíduos padronizados seguem
εi
uma distribuição normal padrão, ou seja, ~ N (0,1) . Se o modelo ajustado está correto, então o desvio padrão
σ
σ pode ser estimado pela raiz quadrada do quadrado médio dos desvios, definida por
n n
∑ ( yi − ŷ )2
i =1
∑
i =1
ei2
s= = = .
n−2 n−2
ei
A variável definida como ri = é chamada de resíduo padronizado e tem distribuição
s
normal padrão, podendo ser usada para avaliar as violações da normalidade. A Figura 7.6 mostra o Q-Q plot
para os resíduos padronizados gerados pelo modelo de regressão ajustado aos dados do Exemplo 7.2, revelando
que a suposição de normalidade parece razoavelmente plausível. Note, porém, que existe um ponto discrepante,
o qual corresponde a observação número 19, devendo ser cuidadosamente inspecionada.
Como a suposição de normalidade parece estar satisfeita, pode-se então construir intervalos
de confiança e testar hipóteses sobre os parâmetros populacionais α e β . Em particular, deseja-se realizar o
teste de significância da regressão já mencionado, com a finalidade verificar se a tendência linear captada pelo
modelo ajustado não é devida ao acaso. Em outras palavras, deseja-se testar se o verdadeiro coeficiente de
regressão (a inclinação da reta) na população é diferente de zero. Observe que se a verdadeira inclinação da reta
é igual a zero (isto é, se β = 0 ), então a variável Y não depende linearmente da variável X; de fato, neste caso a
média de Y é igual para todos os valores de X.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
134
2,0
1,5
,5
0,0
-,5
-1,0
-1,5
-2,0
-2 -1 0 1 2 3
b −β
e o teste é baseado na estatística de teste T = ^
que tem uma distribuição t de Student com n − 2 graus de
EPb
^
liberdade, onde EPb é o erro padrão do coeficiente de regressão estimado na amostra, definido por
∑=1 ( y i − ŷ )2 n
^ s
i
n−2
∑=1 ( y
i
i − ŷ )2
EPb = = 2
= ,
n 2
n n
2
n ∑
xi
n
xi
∑ xi
n 2 i =1
∑
∑=1 xi2 − i =1 ∑=1 xi2 − i =1 ∑
(n − 2) xi −
n i n i =1 n
i
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
135
n n n
^
∑
i =1
y i2 −a ∑y
i =1
i −b ∑x y
i =1
i i
EPb = .
n
2
xi
n 2 i =1
∑
(n − 2) xi − ∑ n
i =1
O teste de hipóteses pode ser executado através das etapas descritas anteriormente, ou seja:
4ª) Determinar os valores de t tabelado: − t19;0 ,025 = −2,093 e t19;0 ,025 = +2 ,093
b
5ª) Calcular o valor da estatística de teste: t calc = ^
~ t (n − 2 )
EPb
^ ∑ (y
i =1
i − ŷ )2
2308,59 2308,59
EPb = = = = 0,3102 ,
n
2
19 × 5606 −
(302) 2
23996,10
xi
n 2 i =1
∑
21
∑
(n − 2) xi −
n
i =1
b − 1,1270
de tal forma que t calc = ^
= = −3,63 .
0 ,3102
EPb
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
136
Como t calc = −3,63 < −t (19);0,025 = −2 ,093 , então deve-se rejeitar, H 0 : β = 0 para o nível de
significância de 5%.
7ª) Conclusão:
Há evidências de que na população em estudo existe uma estrutura de dependência linear
entre o escore Gessel de desenvolvimento das crianças e a idade (em meses) ao pronunciar a primeira palavra,
para o nível de significância 5%. Esta dependência linear pode ser representada pela equação de regressão
estimada ŷ = 109 ,88 − 1,1270 x que é interpretada da seguinte forma: para cada acréscimo de um mês na idade
que a criança pronuncia a primeira palavra, o escore Gessel de desenvolvimento diminui 1,1270 unidades.
Uma vez que o modelo foi validado, ele pode ser usado para fazer predições, ou seja, para
estimar o valor médio da variável dependente Y para um determinado valor da variável explicativa X. No
exemplo em discussão, o pesquisador poderia estar interessado em estimar o valor médio do escore Gessel de
desenvolvimento para uma determinada idade em que a criança pronuncia a primeira palavra. Por exemplo, para
uma criança que pronuncia a primeira palavra aos 20 meses de idade, o escore médio de desenvolvimento é
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
137
Entretanto, é preciso ter extrema cautela ao fazer predições, não sendo recomendado estimar
a média de Y para valores de X fora da região de valores observados na amostra. Ao invés de estimativas
pontuais, é preferível obter estimativas por intervalo, já que os intervalos de confiança para a média de Y levam
em conta o aumento da variabilidade na medida que os valores dos preditores se afastam da média x .
Para finalizar, é importante salientar alguns aspectos: existem diversos procedimentos para
análise de resíduos e diagnóstico de regressão, mediante os quais é possível detectar perturbações no modelo
ajustado e identificar as ações corretivas. A maioria destas técnicas é baseada em procedimentos gráficos ou
necessitam cálculos exaustivos, de tal forma que são factíveis apenas mediante a utilização de procedimentos
computacionais. Também não foram considerados outros aspectos da análise de regressão linear, tais como
intervalos de confiança para os parâmetros α e β , intervalos de confiança para a média de Y para um dado
valor x ou intervalos de precisão para uma nova observação. Outros aspectos que também não foram
explorados são multicolinearidade, estimação do erro puro na presença de repetições genuínas, transformações
nas variáveis, regressão inversa e a generalização do modelo para a Regressão Linear Múltipla, mediante a
incorporação de outras variáveis no modelo. Diante do interesse ou da necessidade de detalhar a metodologia da
análise de regressão, recomenda-se consultar a extensa literatura da área – veja, por exemplo, Draper & Smith
(1981), Johnson & Wichern (1988, p.273-339), Zar (1996, p.317-447), Soares, Farias e Cesar (1991, p.263-
279).
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
138
Na Seção 1.2 foram apresentadas as definições básicas dos tipos de variáveis que
freqüentemente surgem em investigações científicas, destacando que estão diretamente relacionadas à escala de
medida utilizada para observá-las. Recordando, as variáveis medidas em escala nominal ou ordinal são
classificadas como variáveis qualitativas, enquanto que variáveis medidas através da escala de intervalo ou da
escala de razão são chamadas de variáveis quantitativas.
No Capítulo 6 foram apresentados alguns procedimentos básicos para avaliar a existência de
diferenças entre dois tratamentos (drogas, dietas, métodos cirúrgicos, procedimentos laboratoriais, etc.) quando
a resposta é contínua, mediante a comparação das médias populacionais. Ainda, para avaliar a relação entre
variáveis quantitativas, no Capítulo 7 foram apresentadas as técnicas estatísticas chamadas de correlação e
regressão linear.
Entretanto, em muitas situações práticas as características nas quais o pesquisador está
interessado não podem ser adequadamente medidas na forma quantitativa, tal que as variáveis são observadas
através de um conjunto disjunto de categorias, dando origem às denominadas variáveis categóricas ou
qualitativas. O conjunto de informações sobre um fenômeno aleatório observado através de variáveis
categóricas é chamado de dados categóricos ou dados qualitativos. Usualmente são organizados em tabelas de
contingência, as quais consistem essencialmente nas freqüências de indivíduos observadas em cada uma das
categorias mutuamente exclusivas e exaustivas das variáveis ou do cruzamento de duas ou mais variáveis.
Alguns estudos reais que envolvem a observação de variáveis categóricas foram brevemente
comentados na Seção 1.1, destacando os exemplos relativos aos dados dispostos na Tabela 1.1 e na Tabela 1.3,
os quais serão retomados nas próximas seções.
Neste capítulo serão apresentados alguns métodos estatísticos básicos para a análise de dados
categóricos, destacando o teste de aderência, o teste de independência e o teste de homogeneidade de
populações. Convém ressaltar que os métodos de análise abordados não levam em conta a ordem das categorias
das variáveis envolvidas, ou seja, tratam as variáveis como nominais. Ao leitor que deseja aprofundar o estudo
sobre métodos de análise estatística de dados qualitativos sugere-se consultar a literatura estatística clássica, tais
como Agresti (1990), Agresti (1984), Everitt (1992) ou Hosmer & Lemeshow (1989).
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
139
Neste tipo de teste de hipóteses, a partir dos dados observados na amostra deseja-se avaliar
se a distribuição de probabilidade da variável sob investigação está de acordo com a distribuição especificada
sob a hipótese nula. Em outras palavras, deseja-se verificar se os dados observados na amostra apresentam uma
boa aderência ao modelo probabilístico especificado. Em caso afirmativo, pode-se utilizar o modelo postulado
para descrever a distribuição de probabilidade na população, mas em caso contrário, o modelo probabilístico
postulado é inadequado.
Existem diversas maneiras de realizar testes de aderência, dentre os quais destacam-se o teste
Nesta seção será abordado apenas o teste de aderência baseado na estatística χ 2 de Pearson,
o qual foi introduzido por Karl Pearson em 1900 e é considerado um dos primeiros métodos de inferência
estatística. Os demais procedimentos estão amplamente descritos na literatura, cabendo destacar Agresti (1990,
p.42), Daniel (1974, p.302), Zar (1996, p.457), Mood, Graybill e Boes (1974, p.442) e Costa Neto (1977,
p.130).
Para desenvolver os aspectos metodológicos do teste de aderência é conveniente utilizar o
exemplo hipotético abaixo, onde deseja-se avaliar se a ocorrência de acidente de trabalho entre os membros da
equipe de enfermagem de determinado hospital é igualmente provável em todos os dias da semana.
Exemplo 8.1: Devido às características intrínsecas da atividade, acidentes de trabalho envolvendo enfermeiros
e assistentes de enfermagem de um hospital constituem um enorme risco para a saúde dos membros da equipe
de enfermagem. Assim, na implementação de um programa de redução de acidentes no Hospital HC foi
estabelecido, como procedimento inicial, a identificação do dia da semana em que os acidentes acontecem. O
objetivo é avaliar se a ocorrência de acidentes de trabalho é igualmente provável em todos os dias da semana;
caso contrário, a identificação das causas e ações preventivas deveriam ser adotas para evitar acidentes,
especialmente nos dias em que ocorrem com maior freqüência. As informações relativas aos acidentes ocorridos
nos últimos 12 meses no Hospital HC foram obtidas junto aos registros do hospital. Em particular, considere os
dados da Tabela 8.1 que contém a distribuição de freqüências de acidentes com seringas que ocorreram nos
diferentes dias da semana. Para o nível de significância de 5%, é possível afirmar que a probabilidade de ocorrer
acidentes com seringas é igual para todos os dias da semana?
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
140
Terça-feira 2
Quarta-feira 5
Quinta-feira 5
Sexta-feira 4
Sábado 9
Domingo 12
Total 40
Nota: Dados fictícios.
Neste problema, a hipótese nula especifica que o número de acidentes é igual em todos os
dias da semana, o que resultaria que a chance do acidente com seringa acontecer em uma segunda feira, por
exemplo, é igual à chance de ocorrer em qualquer outro dia da semana. Em outras palavras, se de fato a
probabilidade de acontecer um acidente com seringa é igual para todos os dias da semana, então o número de
acidentes deveria ser aproximadamente equivalente para todos os dias. Os dados observados é que vão
evidenciar se a hipótese nula é verdadeira ou não, mediante a comparação do número de acidentes observados
em cada dia da semana com o correspondente número de acidentes esperados se a hipótese nula é verdadeira.
É importante observar que não está sendo modelada a probabilidade de um acidente
acontecer, mas sim a probabilidade do dia da semana em que o acidente ocorre. Assim, a variável aleatória sob
consideração é o “dia da semana em que o acidente ocorre”, observada através das sete categorias mutuamente
exclusivas e exaustivas, correspondentes ao dia da semana, isto é, Segunda, Terça, Quarta, Quinta, Sexta,
Sábado, Domingo. Portanto, o espaço amostral é
Por simplicidade, considere a variável aleatória X: dia da semana em que o acidente ocorre,
tal que a hipótese nula que os dias da semana são equiprováveis pode ser escrita como
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
141
Por outro lado, a hipótese alternativa especifica que a probabilidade do dia da semana em
que o acidente ocorre é diferente de 1 , para pelo menos um dia da semana. Alternativamente, as hipóteses
7
podem ser escritas através das freqüências de acidentes em cada dia da semana, ou seja,
onde o índice i indica os diferentes dias da semana. Isto significa que se a hipótese nula é verdadeira, então
deveriam ser esperados 5,71 (aproximadamente seis) acidentes em cada dia da semana.
Note que existem discrepâncias entre as freqüências observadas Oi e as freqüências
esperadas E i , tal que quanto maiores as diferenças entre elas, então maiores as evidências de que a hipótese
nula é falsa. Reciprocamente, se as freqüências observadas estão próximas das respectivas freqüências
esperadas, então os dados amostrais evidenciam a veracidade da hipótese nula. Assim, a estatística de teste é
baseada nas diferenças entre as freqüências observadas e esperadas sob a hipótese nula, sendo definida por
C
(Oi − Ei )2
2
χ calc = ∑
i=1 Ei
.
Esta estatística é chamada de estatística χ 2 de Pearson e, sob a hipóse nula, segue uma
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
142
resposta, então a estatística de teste deve ser comparada com a distribuição qui-quadrado com C − 1 = 6
C
(Oi − Ei )2
graus de liberdade, isto é, 2
χ calc = ∑
=1
i Ei
~ χ 62 . Assim, para α = 0,05 o valor tabelado é
χ 62;0 ,05 = 12 ,592 , onde χ (2r );α representa o valor da distribuição de probabilidade qui-quadrado com r
graus de que delimita a área α a sua direita.
Total 40 40 0 13,2
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
143
A tabela acima apresenta os cálculos intermediários e o valor observado para a estatística de teste, tal que
7
(Oi − Ei )2
2
χ calc = ∑
i =1 Ei
= 1,29 + 2,41 + L + 6,91 = 13,2 .
2
Se χ calc > χ (2C −1);α ⇒ rejeita-se H 0 para o nível α fixado, em favor de H 1
2
Se χ calc ≤ χ (2C −1);α ⇒ não se rejeita H 0 para o nível α fixado
2
No exemplo, χ calc = 13,2 > χ 62;0 ,05 = 12 ,592 , então deve-se rejeitar a hipótese nula para o nível de
significância 5%.
7ª) Conclusão:
Para finalizar, convém mencionar que o teste de aderência pode ser útil em um grande
número de situações práticas, podendo ser utilizado, por exemplo, para avaliar se a distribuição normal de
probabilidade é plausível para representar a verdadeira distribuição de probabilidade de uma característica
contínua. Um exemplo para tipo de aplicação é detalhadamente apresentado por Daniel (1974, p.302). As
condições necessárias para usar a distribuição qui-quadrado como distribuição de referência da estatística χ 2 de
Pearson serão apresentadas na Seção 8.4.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
144
através do teste χ 2 de independência ou de associação que será abordado nesta seção. Porém, quando há o
interesse de considerar simultaneamente mais variáveis, recomenda-se a utilização de métodos estatísticos mais
elaborados, tais como modelos log-lineares, regressão logística ou análise de correspondências. Devido às
limitações de tempo, não será possível explorar estas técnicas de análise; ao leitor interessado sugere-se
consultar, por exemplo, Everitt (1992, p.73), Hosmer & Lemeshow (1989), Escofier & Pagès (1992), Lebart,
Morineau e Piron (1995).
Na Seção 1.1 foi apresentado o estudo observacional que trata da classificação de 1398
crianças segundo o tamanho relativo de amígdala e se eram ou não portadoras da bactéria Streptococcus
pyogenes, cujos dados estão dispostos na Tabela 1.1. Este exemplo será retomado para apresentar o
Exemplo 8.2: Este estudo observacional foi conduzido para avaliar a relação entre a presença da bactéria
Streptococcus pyogenes e o aumento das amígdalas em crianças. Por conveniência, a Tabela 8.2 reproduz os
dados referentes à classificação de 1398 crianças entre 0 a 15 anos de acordo com o tamanho relativo de suas
amígdalas e com a característica “portadora” ou “não portadora” de Streptococcus pyogenes. A informação foi
inicialmente apresentada por Holmes & Williams (1954) e os dados têm sido amplamente analisados na
literatura, tais como por Armitage (1955), Armitage (1974), McCullagh (1980) e Vigo (1994).
O objetivo básico é identificar se o aumento das amígdalas em crianças está ou não
associado à presença da bactéria Streptococcus pyogenes. Em particular, deseja-se avaliar se crianças portadoras
da bactéria possuem maior risco de apresentar amígdalas aumentadas. Contudo, face às limitações naturais do
curso, será apresentada apenas a análise através do teste χ 2 de independência; o leitor interessado em
aprofundar a discussão da análise do problema é convidado a consultar as referências citadas, nas quais são
relatados os resultados mediante a utilização de métodos estatísticos mais sofisticados.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
145
enquanto que o total linha contém a distribuição marginal da variável Y e o total coluna contém a distribuição
marginal da variável X. Assim, pela notação apresentada a distribuição de probabilidade da variável X é dada
por
pi . = P[ X = i ]; ∀ i = 1,2,L , L
p. j = P[Y = j ]; ∀ j = 1,2,L ,C .
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
146
M M M M M
L p L1 p L2 ... p LC pL .
L C (Oij − Eij )2
2
χ calc = ∑∑
i =1 j =1 Eij
,
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
147
onde Oij e Eij representam, respectivamente, a freqüência observada e a freqüência esperada da célula de
contingência associada à categoria i da variável linha (X) e à categoria j da variável coluna (Y).
A Tabela 8.4 ilustra a situação genérica onde os n indivíduos da amostra são classificados
segundo as variáveis X e Y. Assim, esta tabela informa o número de indivíduos observados em cada célula de
contingência resultante do cruzamento das duas variáveis, bem como o número de indivíduos em cada categoria
das variáveis, isoladamente.
M M M M M
L OL1 OL 2 ... OLC nL .
L C L C
n= ∑=
i 1
ni . = ∑=
j 1
n. j = ∑∑
=
i 1 j 1=
Oij .
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
148
É vital perceber que o teste de independência depende das diferenças entre as freqüências
observadas e esperadas Oij − Eij , tal que duas variáveis são independentes se estas diferenças são pequenas.
liberdade. Assim, a hipótese nula é rejeitada para valores grandes da estatística χ 2 de Pearson, que deve ser
comparada com o valor tabelado da distribuição qui-quadrado com (L − 1) × (C − 1) graus de liberdade, para o
nível de significância α fixado.
Os detalhes da execução e da interpretação do teste de hipóteses podem ser melhor
compreendidos utilizando os dados do Exemplo 8.2, seguindo as etapas descritas anteriormente.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
149
α = 0,05 o valor tabelado é χ 22;0 ,05 = 5,99 , onde χ (2r );α representa o valor da distribuição de
probabilidade qui-quadrado com r graus de que delimita a área α a sua direita.
ni . × n . j
As freqüências esperadas são determinadas por Eij = , tal que
n
A tabela acima apresenta os cálculos intermediários e o valor observado para a estatística de teste, tal que
2 3 (Oij − Eij )2
2
χ calc = ∑∑
=1 j=1
i Eij
= 2,16 + 0,06 + L + 0 ,29 = 7 ,89 .
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
150
2
No exemplo, χ calc = 7 ,89 > χ 22;0 ,05 = 5,99 , então deve-se rejeitar a hipótese nula para o nível de
significância 5%.
7ª) Conclusão:
Há evidências de que o tamanho relativo das amígdalas em crianças está associado com a
bactéria Streptococcus pyogenes, para o nível de significância 5%. A comparação das freqüências observadas
com as freqüências esperadas sob a hipótese nula sugere que o tamanho relativo das amígdalas é maior para
crianças portadoras da bactéria em relação às não portadoras.
Na situação em que ambas as variáveis possuem duas categorias de resposta, a classificação dos
indivíduos produz uma tabela de contingência 2 × 2 , como ilustra a Tabela 8.5. Para simplificar a notação, as
freqüências observadas podem ser representadas por a ,b , c e d , de tal forma que a estatística χ 2 de Pearson
pode ser calculada por
2 n (ad − bc )2
χ calc = ,
(a + b )(c + d )(a + c )(b + d )
n ( ad − bc − 0 ,5n )
2 2 2 (O − Eij − 12 )
2
∑∑
2 ij
χ calc = = ,
(a + b )(c + d )(a + c )(b + d ) i =1 j =1 Eij
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
151
onde o termo ad − bc representa o valor absoluto da diferença (ad − bc ) , ou seja, o sinal é sempre positivo.
Exemplo 8.3: Os indivíduos de uma amostra de 5375 casos de morte por tuberculose foram classificados de
acordo com o sexo e com o tipo de tuberculose, mediante as categorias tuberculose do sistema respiratório ou
outro tipo de tuberculose. Os dados são apresentados por Everitt (1992, p.3) e reproduzidos na Tabela 8.6. O
objetivo básico é avaliar se o tipo de tuberculose que causou a morte está associado com o sexo dos indivíduos.
H 1: Existe associação entre o tipo de tuberculose que causou a morte do indivíduo e o sexo
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
152
Assim, a estatística de teste deve ser comparada com a distribuição qui-quadrado com
L C (Oij − Eij )2
(L − 1) × (C − 1) = 1 × 1 = 1 grau de liberdade, isto é, 2
χ calc = ∑ ∑
i =1 j =1 Eij
~ χ (21 ) . Para
α = 0,05 o valor tabelado é χ12;0 ,05 = 3,84 , onde χ (2r );α representa o valor da distribuição de
probabilidade qui-quadrado com r graus de que delimita a área α a sua direita.
2
No exemplo, χ calc = 100 ,39 > χ12;0 ,05 = 3,84 , então deve-se rejeitar a hipótese nula para o nível de
significância 5%.
7ª) Conclusão:
Há evidências de que o sexo e o tipo de tuberculose que causou a morte do indivíduo estão
associados, para o nível de significância 5%. A comparação das freqüências observadas com as freqüências
esperadas sob a hipótese nula sugere que a proporção de mortes por tuberculose do sistema respiratório é maior
em homens do que em mulheres.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
153
2 p 21 p 22 ... p 2C 1
M M M M M
L p L1 p L2 ... p LC 1
-
A hipótese nula especifica que as L populações (os tratamentos) são homogêneas, sendo
escrita como
H 0 : p1 j = p 2 j = L = p L j ; ∀ j = 1,2 ,L ,C ,
enquanto que a hipótese alternativa especifica que existe pelo menos uma diferença nas probabilidades acima.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
154
L C (Oij − Eij )2
2
χ calc = ∑ ∑
i =1 j =1 Eij
.
As freqüências esperadas sob a hipótese nula são estimadas de maneira análoga ao teste de
independência, ou seja,
ni . × n . j
Eij = .
n
É importante mencionar que, para amostras grandes, a comparação de dois tratamentos com
respostas dicotômicas conduz ao teste Z (bilateral) para comparação duas proporções populacionais com
amostras independentes descrito na Seção 6.2.6. Para ilustrar a aplicação do teste de homogeneidade de
populações, é conveniente retomar o exemplo brevemente descrito na Seção 1.1, relativo ensaio clínico
planejado para comprovar a eficácia do AZT (zidunovina) no prolongamento da vida de aidéticos.
Exemplo 8.4: Os dados reproduzidos na Tabela 8.8 referem-se aos resultados do ensaio clínico planejado
para comprovar a eficácia do AZT (zidovudina) no prolongamento da vida de aidéticos, os quais foram
publicado por Fischl et al. (1987) e posteriormente discutidos por Soares & Siqueira (1999, p.176-183).
O experimento considerou essencialmente o acompanhamento de 282 pacientes aidéticos
durante 24 semanas de tratamento, os quais foram aleatoriamente divididos em dois grupos: o grupo de
pacientes tratados com AZT (composto por 145 aidéticos) e o grupo controle, composto por 137 aidéticos que
receberam o placebo. A variável resposta (desfecho) é a situação do paciente (sobrevivente ou não sobrevivente)
após as 24 semanas de tratamento.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
155
121
o placebo é p PLACEBO = = 0,883 . Aparentemente a proporção de sobreviventes é maior no grupo de
137
pacientes tratados com AZT, mas para estender este resultado para a população é vital avaliar se as diferenças
observadas não são devidas ao acaso, mediante a utilização do teste de homogeneidade.
Assim, a estatística de teste deve ser comparada com a distribuição qui-quadrado com
L C (Oij − Eij )2
(L − 1) × (C − 1) = 1 × 1 = 1 grau de liberdade, isto é, 2
χ calc = ∑ ∑
i =1 j =1 Eij
~ χ (21 ) . Para
α = 0,05 o valor tabelado é χ12;0 ,05 = 3,84 , onde χ (2r );α representa o valor da distribuição de
probabilidade qui-quadrado com r graus de que delimita a área α a sua direita.
ni . × n . j
As freqüências esperadas sob a hipótese nula são tais que Eij = , ou seja,
n
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
156
2
No exemplo, χ calc = 13,14 > χ12;0 ,05 = 3,84 , então deve-se rejeitar a hipótese nula para o nível de
significância 5%.
7ª) Conclusão:
Há evidências de que a proporção de pacientes com AIDS tratados com AZT que sobreviveram
após 24 semanas de tratamento é diferente da proporção de sobreviventes quando tratados com o placebo, para o
nível de significância 5%, sugerindo que sob as condições do experimento o tratamento com AZT prolonga a
vida de pacientes aidéticos.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
157
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
158
9 Referências Bibliográficas
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório
159
JAMES, B.R. (1981). Probabilidade: Um Curso em Nível Intermediário. Rio de janeiro, IMPA-Projeto
Euclides.
JOHNSON, R.A. & WICHERN, D.W. (1988). Applied multivariate statistical analysis. Second
Edition. Englewood Cliffs, Prentice-Hall.
KIRKPATRICK, C.H. & ALLING, D.W. (1978). Treatment of chronic oral candidiasis with clotrimazole
troches: a controlled clinical trial. The New England Journal of Medicine. 299: 1201-1203.
KISH, L. (1965). Survey Sampling. New York: John Wiley.
KUZMA, J.W. (1998). Basic Statistic for Health Sciences. Third Edition, Palo Alto, Mayfield Publishing
Company.
LARSON, H.J. (1982). Introduction to Probability Theory and Statistical Inference. Third Edition, New
York, Wiley.
LEBART, L.; MORINEAU, A. e PIRON, M. (1995). Statistique Exploratoire Multidimensionelle. Paris,
Dunod.
MARDIA, K.V., KENT, J.T. e BIBBY, J.M. (1979). Multivariate Analysis. New York,, Academic
Press.
McCULLAGH, P. (1980). Regression models for ordinal data. J. R. Statist. Soc. B. 42(2): 109-142.
MOOD, A.M.; GRAYBILL, F.A. e BOES, D.C. (1974). Introduction to the Theory of Statistics. Third Edition,
Singapore, McGraw-Hill International Editions.
MONTGOMERY, D.C. (1991). Design and Analysis of Experiments. Third Edition, New York, Wiley.
MOSES, L.E. et al. (1984). Analyzing data from ordered categories. The New England Journal of Medicine.
111: 442-448.
PEREIRA, B. de B. (1997). Estatística: A Tecnologia da Ciência. Boletim da Associação Brasileira de
Estatística, Ano XIII, Nº 37.
ROHATGI, V.K. (1976). An Introduction to Probability Theory and Mathematical Statistics. New York,
Wiley.
SNEDECOR, D.W. & COCHRAN, W.G. (1967). Statistical Methods. 6th Edition. Ames: University Press.
TAVARES, E.C. (1995). Estudo ultra-sonográfico e clínico neurológico das hemorragias peri-
intraventricu-lares em recém-nascidos com peso de nascimento menor do que 2000 g. Belo Horizonte,
Faculdade de Medicina da UFMG (Dissertação de Mestrado).
SOARES, J.F.; FARIAS, A. A. e CESAR, C.C. (1991). Introdução à Estatística. Rio de Janeiro, Livros
Técnicos e Científicos Editora S.A.
SOARES, J.F. & SIQUEIRA, A.L. (1999). Introdução à Estatística Médica. Belo Horizonte, Departamento
de Estatística – UFMG.
VIEIRA, S. (1981). Introdução à Bioestatística. Segunda Edição, Rio de Janeiro, Editora Campus.
VIGO, A. (1994). Análise de Experimentos Industriais com Respostas Categóricas Ordenadas: Método de
Taguchi e Modelo de McCullagh. Dissertação de Mestrado, UNICAMP, Campinas, São Paulo.
ZAR, J.H. (1996). Biostatistical Analysis. Upper Saddle River, Prentice Hall.
Prof. Álvaro Vigo – UFRGS – Departamento de Estatística – Elementos de Bioestatística: Um Curso Introdutório