Sei sulla pagina 1di 142

Estatstica Aplicada Estatstica Aplicada Administrao Administrao

Prof. Marcelo Tavares

Copyright 2007. Todos os direitos desta edio reservados ao Sistema Universidade Aberta do Brasil. Nenhuma parte deste material poder ser reproduzida, transmitida e gravada, por qualquer meio eletrnico, por fotocpia e outros, sem a prvia autorizao, por escrito, do autor.

PRESIDENTE DA REPBLICA Luiz Incio Lula da Silva MINISTRO DA EDUCAO Fernando Haddad SECRETRIO DE EDUCAO A DISTNCIA Carlos Eduardo Bielschowsky DIRETOR DO DEPARTAMENTO DE POLTICAS EM EDUCAO A DISTNCIA DPEAD Hlio Chaves Filho SISTEMA UNIVERSIDADE ABERTA DO BRASIL Celso Costa COMISSO EDITORIAL DO PROJETO PILOTO UAB/MEC Marina Isabel Mateus de Almeida (UFPR) Teresa Cristina Janes Carneiro (UFES) Antonio Roberto Coelho Serra (UEMA) Jonilto Costa Sousa (UnB) Vicente Chiaramonte Pires (UEM) Ozrio Kunio Matsuda (UEM) Anderson de Barros Dantas (UFAL)

ORGANIZAO DO CONTEDO Prof. Marcelo Tavares PROJETO GRFICO Annye Cristiny Tessaro Mariana Lorenzetti DIAGRAMAO Annye Cristiny Tessaro Victor Emmanuel Carlson REVISO DE PORTUGUS Renato Tapado Patrcia Regina da Costa

Sumrio
Introduo.....................................................................................07

UNIDADE 1 Estatstica descritiva


Estatstica descritiva....................................................................................11

UNIDADE 2 Introduo a probabilidades


Introduo a probabilidades........................................................................41

UNIDADE 3 Amostragem
Amostragem............................................................................73

UNIDADE 4 Testes de Hipteses


Testes de Hipteses..............................................................................103 Referncias.....................................................................................133 Anexos.....................................................................................135

Introduo
O cidado comum pensa que a estatstica se resume apenas a apresentar tabelas de nmeros em colunas esportivas e/ou econmicas de jornais e revistas, ilustradas com grficos, pilhas de moedas, etc., ou quando muito associam a estatstica previso de resultados eleitorais. A estatstica no se limita somente a compilar tabelas de dados e os ilustrar graficamente. Sir Ronald Fisher (1890-1962), em seus trabalhos, iniciou a estatstica como mtodo cientfico. Desta forma, o trabalho do estatstico passou a ser o de ajudar a planejar a obteno de dados, interpretar e analisar os dados obtidos e apresentar os resultados de maneira a facilitar a tomada de decises razoveis. Didaticamente, podemos dividir a estatstica em duas partes: a estatstica descritiva e a inferncia estatstica. A estatstica descritiva preocupa-se com a forma pela qual podemos apresentar um conjunto de dados em tabelas e grficos, e tambm resumir as informaes contidas nestes dados mediante a utilizao de medidas estatsticas. J a inferncia estatstica baseia-se na teoria das probabilidades para estabelecer concluses sobre todo um grupo (chamado populao), quando se observou apenas uma parte (amostra) representativa desta populao. Uma grande quantidade de informaes importantes que auxiliam na tomada de decises est no site do Instituto Brasileiro de Geografia e Estatstica (IBGE). Todo o clculo das estatsticas pode ser feito por meio de calculadoras cientficas e tambm softwares estatsticos. As planilhas eletrnicas permitem o clculo de diversas estatsticas e confeco de grficos de forma mais rpida e eficiente. necessrio ter em mente que a estatstica uma ferramenta para o gestor ou executivo, nas respostas dos porqus de seus problemas que podem ser explicados por uma anlise de dados. Para ela ser bem usada, necessrio conhecer os seus fundamentos e princpios, e acima de tudo que o gestor ou executivo desenvolva um esprito

Para saber mais v ao site www.ibge.gov.br

Uma sugesto de referncia NEUFELD, John L. Estatstica Aplicada Administrao usando Excel. v.1. So Paulo: Prantice Hall, 2003

crtico e jamais deixe de pensar. Pois fcil mentir usando a estatstica, o difcil falar a verdade sem usar a estatstica. Atualmente, as empresas tm procurado profissionais como executivos que tenham um nvel de conhecimento de estatstica alto, pois este conhecimento tem feito uma diferena grande nos processos decisrios em empresas. Este livro ser dividido em quatro Unidades: Unidade 1 Estatstica Descritiva (Descrio de amostras por meio de distribuies de freqncias, e medidas de posio e disperso); Unidade 2 Probabilidades (Conceitos bsicos de probabilidades, variveis aleatrias uni e bidimensionais) e Distribuies de Probabilidades (discretas e contnuas); Unidade 3 Amostragem (probabilstica e no probabilstica), Distribuies Amostrais (Distribuies t de Student, qui-quadrado e F) e Intervalos de Confiana (mdia, proporo); e Unidade 4 Processos Decisrios (Testes de Hipteses).

1
Estatstica Estatstica descritiva descritiva

UNIDADE

Curso de Graduao em Administrao a Distncia

Objetivo
Esta Unidade tem por objetivo fazer com que voc tenha condies de descrever e apresentar os resultados de um conjunto de observaes de forma clara, objetiva e passando o mximo de informaes possveis. Para tal objetivo, sero abordadas as distribuies de freqncias, anlises grficas, medidas de posio e disperso.

10

Mdulo 4

Estatstica descritiva

Qualquer conjunto de dados, tais como o tempo de uma ligao telefnica, a velocidade de processamento de um computador, a proporo de participao no mercado das empresas de um determinado setor, suscetibilidade de empresas a uma determinada mudana no mercado, opinio dos alunos quanto didtica de um professor, etc., contm informao sobre algum grupo de indivduos. As possveis diferenas entre indivduos determinam a variao que est sempre presente na anlise de dados. Uma caracterstica que pode assumir diferentes valores de indivduo para indivduo denominada varivel, pois de outra forma seria denominada constante. A classificao das variveis em qualitativas e quantitativas foi apresentada na disciplina de Metodologia de Pesquisa. Caso no se lembre, reveja o material de Metodologia de Pesquisa. Desta forma, apenas para relembrar, como voc faria a classificao das seguintes variveis? a) Nmero de pginas desta unidade; b) peso dos funcionrios do setor de marketing de uma empresa; c) tipos de empresas em relao a adoo de determinada tcnica; e d) tamanho de empresas (pequena, mdia e grande). Respostas: a) quantitativa discreta; b) quantitativa contnua; c) qualitativa nominal; d) qualitativa ordinal.

Os dados qualitativas so divididos em nominais e ordinais; enquanto os dados quantitativas so divididos em discretas e contnuas.

11

Curso de Graduao em Administrao a Distncia

GLOSSRIO *Dados Brutos: dados na forma em que foram coletados, sem nenhum tratamento.Fonte: Lacombe (2004)

Quando voc coleta os dados para uma pesquisa, estas observaes so chamadas de dados brutos. Um exemplo de dados brutos corresponde ao tempo em minutos que consumidores de uma determinada operadora de telefonia celular utilizariam em um ms (dados simulados pelo autor a partir de um caso real). Os dados foram obtidos em uma pesquisa de mercado e apresentados na forma em que foram coletados (Tabela 1), por este motivo so denominados dados brutos*. Geralmente, este tipo de dado traz pouca ou nenhuma informao ao leitor, sendo necessrio organizar os dados, com o intuito de aumentar sua capacidade de informao.
C
1 2 3 4 5 6 7 8

T
104 108 138 101 163 141 90 154

C
9 10 11 12 13 14 15 16

T
122 142 106 201 169 120 210 98

C
17 18 19 20 21 22 23 24

T
129 138 122 161 167 189 132 127

C
25 26 27 28 29 30 31 32

T
144 151 146 82 137 132 172 87

C
33 34 35 36 37 38 39 40

T
183 138 115 179 142 111 140 136

GLOSSRIO *Rol a mais simples organizao numrica. a ordenao dos dados em ordem crescente ou decrescente. *Amplitude Total corresponde diferena entre o maior e o menor valor observado em um conjunto de dados. Notaremos por A.
12

Tabela 1: Tempo (T) em minutos de uso de telefone celular por consumidores (C) de uma determinada operadora

Como voc pode observar na Tabela 1, a simples organizao dos dados em um rol* aumenta muito a capacidade de informao destes. Na Tabela 2, voc pode verificar que o menor tempo observado foi 82 minutos, e o maior, 210 minutos, o que nos fornece uma amplitude total* de variao da ordem de 128 minutos. Outra informao que podemos obter nos dados por meio da Tabela 2 (organizada em rol crescente) que alguns tempos, como 122 min, 132 min, 138 min e 142 min, foram os mais freqentes, ou seja, os mais citados na pesquisa.

Mdulo 4

82 87 90 98 101 104 106 108

111 115 120 122 122 127 129 132

132 136 137 138 138 138 140 141

142 142 144 146 151 154 161 163

167 169 172 179 183 189 201 210

Tabela 2: Tempo em minutos de uso de telefone celular por consumidores de uma determinada operadora (dados em rol crescente).

Ento surge uma pergunta: Como voc pode organizar os dados de uma forma mais eficiente, na qual se possa apresentar uma quantidade maior de informaes?

Uma maneira de organizar um conjunto de dados para voc melhor represent-lo por meio de uma tabela de distribuio de freqncias (tabela onde so apresentadas as freqncias de cada uma das classes). Distribuindo-se os dados observados em classes* e contando-se o nmero de observaes contidas em cada classe, obtm-se a freqncia de classe. Veja que a disposio tabular dos dados agrupados em classes, juntamente com as freqncias correspondentes, se denomina distribuio de freqncias.

GLOSSRIO *Classes: Intervalos nos quais os valores da varivel analisada so agrupados.

Por exemplo, para o caso do tempo em minutos do uso de celulares, pode-se desejar incluir em uma nica classe todos os indivduos que possuam tempo entre 128 e 138 minutos assim, a classe ir variar de 128 a 138 minutos.

13

Curso de Graduao em Administrao a Distncia

Para identificar uma classe, deve-se conhecer os valores dos limites inferior e superior da classe, que delimitam o intervalo de classe. Neste ponto, surge uma dvida.

Indivduos que apresentem tempo exatamente iguais a 128 ou a 138 minutos pertencem ou no a esta classe? (128 a 138)

Deste modo, surge a necessidade de definir a natureza do intervalo de classe, se aberto ou fechado. Portanto, podemos ter exemplo de notao dos diferentes tipos de intervalos: Intervalos abertos* Este tipo de intervalo o mais utilizado. GLOSSRIO *Intervalos abertos os limites da classe (inferior e superior) no pertencem a ela. *Intervalos fechados os limites de classe (superior e inferior) pertencem classe em questo. *Intervalos mistos um dos limites pertence classe, e o outro, no. , para n 100; , para n > 100 128 min 138 min; Intervalos fechados* 128 min || 138 min. Pode-se ter ainda intervalos mistos*, como por exemplo: 128 min | 138 min.

Vamos, ento, a partir dos dados do exemplo relativo ao tempo de utilizao dos celulares, construir uma distribuio de freqncia e ao longo deste exerccio identificar conceitos presentes em uma distribuio de freqncias.

Ento, vamos exercitar. Para elaborar uma distribuio de freqncias necessrio que primeiramente, se determine o nmero de classes (k) em que os dados sero agrupados. Por questes de ordem prtica e esttica, sugerese utilizar de 5 a 20 classes. O nmero de classes (k) a ser utilizado, pode ser calculado em funo do nmero de observaes (n). Na pesquisa, como temos n = 40 consumidores, teremos, ento, o nmero de classes definido por = = 6,32, e como o nmero de classes inteiro, usaremos 6 classes. O arredondamento utilizado neste material o padro de algarismos significativos (como foi aprendido no Ensino Mdio). O nmero de classes pode tambm ser definido de uma forma arbitrria sem o uso desta regra.

14

Mdulo 4

Aps voc determinar o nmero de classes (k) em que os dados sero agrupados, deve-se, ento, determinar a amplitude do intervalo de classe (c). Para calcularmos a amplitude do intervalo de classe, vamos primeiramente calcular a amplitude total dos dados (A), que corresponde diferena entre o maior valor observado e o menor valor observado. No nosso caso, teremos A = 210 82 =128 mm. Com base neste valor da amplitude total (A) calculado, vamos obter a amplitude do intervalo de classe (c), como mostrado a seguir:

onde: c = amplitude de classe; A = amplitude total; e k = nmero de classes.

Deve ficar claro para voc, que existem outros procedimentos para determinao da amplitude do intervalo de classe que podem ser encontrados na literatura. Conhecida a amplitude de classes, voc deve determinar os intervalos de classe. O limite inferior e o superior das classes devem ser escolhidos de modo que o menor valor observado esteja localizado no ponto mdio (PM) da primeira classe. Partindo deste raciocnio, ento, o limite inferior da primeira classe ser: Limite inf. 1 = menor valor . = 69,2 min

PM =

onde:

LI: Limite inferior; e LS: Limite superior

No nosso caso, temos: Limite inf. 1 = 82

Definindo, ento, o limite inferior da primeira classe, para obtermos as classes da nossa distribuio, basta que somemos a amplitude do intervalo de classe a cada limite inferior. Assim, teremos: 69,2 | 94,8 primeira classe 94,8 | 120,4 segunda classe 20,4 | 146,0 terceira classe 146,0 | 171,6 quarta classe 171,6 | 197,2 quinta classe 197,2 | 222,8 sexta classe
15

Curso de Graduao em Administrao a Distncia

Ento, voc pode obter uma tabela como a apresentada a seguir.

A freqncia absoluta (fa) corresponde ao numero de observaes que temos em uma determinada classe ou em um determinado atributo de uma varivel qualitativa e a freqncia relativa (fr) corresponde proporo do nmero de observaes em uma determinada classe em relao ao total de observaes que temos. Esta freqncia pode ser expressa em termos porcentuais. Para isto, basta multiplicar a freqncia relativa obtida por 100.

Classes (mm)
69,2 | 94,8 94,8 | 120,4 120,4 | 146,0 146,0 | 171,6 171,6 | 197,2 197,2 | 222,8 Total

Freqncia
? ? ? ? ? ?

Tabela 3: Distribuio de freqncias do tempo em minutos de uso de telefone celular por consumidores de uma determinada operadora

Na tabela, aparece uma nova denominao chamada freqncia. Podem ter freqncias chamadas de freqncia absoluta (fa), freqncia relativa (fr) e freqncia acumulada (discutida posteriormente). O clculo da freqncia relativa obtido por meio da seguinte expresso: , com fai = freqncia absoluta da classe i. Apresentando os dados na forma de distribuio de freqncia, voc consegue sintetizar as informaes contidas neles, alm de facili16

Mdulo 4

tar sua visualizao. Na Tabela apresentada a seguir, temos as freqncias (fa e fr) relacionadas ao tempo de utilizao do aparelho celular.
Classes (mm)
69,2 | 94,8 94,8 | 120,4 120,4 | 146,0 146,0 | 171,6 171,6 | 197,2 197,2 | 222,8 Total

fa (consumidores) fr (proporo de consumidores)


3 8 16 7 4 2 40 0,075 0,200 0,400 0,175 0,100 0,050 1,000

Tabela 4: Distribuio de freqncias do tempo em minutos de uso de telefone celular por consumidores de uma determinada operadora

Como ficaria, ento, a interpretao da distribuio de freqncias? Pode-se verificar claramente na Tabela 4 que os tempos de utilizao do celular das 40 pessoas avaliadas em questo esto concentrados nas classes segunda, terceira e quarta, decrescendo em direo s classes do incio e do fim da tabela. A apresentao dos dados em forma de distribuio de freqncia facilita ainda o clculo manual de vrias medidas estatsticas de interesse e sua apresentao grfica. Alm das freqncias absolutas e relativas, muitas vezes podese estar interessado na quantidade de observaes que existe acima ou abaixo de um determinado ponto na distribuio. Desta forma, podemos trabalhar com a freqncia acumulada*. A ttulo de ilustrao, voc pode visualizar nas Tabelas 4 e 5, respectivamente, as freqncias acumuladas para cima e para baixo dos tempos de utilizao das 40 pessoas avaliadas na pesquisa. A freqncia acumulada apresentada na Tabela 4 pode ser obtida da seguinte forma: abaixo do limite superior da primeira classe, temos trs pessoas que esto presentes nesta classe, como pode ser visto na Tabela 3 da distribuio de freqncias absoluta. Quando consideramos a segunda classe, a freqncia acumulada corresponde ao nmero de

GLOSSRIO *Freqncia Acumulada Freqncia Acumulada corresponde soma da freqncia daquela classe s freqncias de todas as classes abaixo dela.

17

Curso de Graduao em Administrao a Distncia

pessoas que temos abaixo do limite superior desta classe, ou seja, as oito pessoas da segunda classe mais as trs pessoas da primeira classe, totalizando 11 pessoas abaixo de 120,4 minutos. Para as outras classes, o raciocnio semelhante.
Tempo (mim)
69,2 | 94,8 94,8 | 120,4 120,4 | 146,0 146,0 | 171,6 171,6 | 197,2 197,2 | 222,8 Total

Freq. acumulada
0 3 11 27 34 38 40

Freq. acumulada (relativa)


0,000 0,075 0,275 0,675 0,850 0,950 1,000

Tabela 5: Distribuio de freqncia acumulada do tempo em minutos de uso de telefone celular por consumidores de uma determinada operadora

Um bom exemplo de aplicao das distribuies de freqncias acumuladas corresponde identificao de uma determinada freqncia abaixo ou acima de um determinado valor que no corresponde ao limite superior ou inferior de uma classe qualquer. Podemos, ento, querer verificar qual a porcentagem de pessoas que utilizam o celular por um tempo inferior a 146 minutos, e para isto, basta consultar diretamente a Tabela 4 e verificar a freqncia acumulada abaixo deste valor (6,75%), pois o valor 146 minutos corresponde a um dos limites de classe apresentados nesta tabela.

E se voc quiser saber a proporo de pessoas que utilizam o celular por menos de 150 minutos?

Para podermos obter esta freqncia, necessrio que venhamos a pressupor que os tempos de utilizao estejam uniformemente

18

Mdulo 4

distribudos dentro das classes. O clculo baseado nos dados da Tabela 4 e so apresentados a seguir.

Freq. acumulada relativa abaixo da classe imediatamente inferior a 150 (abaixo de 146) = 0,675; e Freq. acumulada relativa abaixo da classe imediatamente superior a 150 (abaixo de 171,6) = 0,850;

Proporo de consumidores com tempo de uso abaixo de 146,0 min = 0,675 Proporo de consumidores com tempo de uso abaixo de 171,6 min = 0,850 Freq. entre 146,0 e 171,6 min = 0,175 de 146,0 a 171,6 min so 25,6 min de 146,0 a 150,0 min so 4,0 min assim, (diferena) no tempo variao (diferena) na proporo 25,6 min -------------------------------------------- 0,175 4,0 min ------------------------------------------------- x Portanto, fazendo o clculo da regra de trs apresentada anteriormente, teremos o valor de x.

Portanto, como abaixo de 140,0 min existe uma proporo de 0,675 e entre 140,0 e 150 min existe uma proporo de 0,0273, conclui-se, ento, que abaixo de 150 min existe uma proporo de 0,7023 (0,675 + 0,0273). Em termos porcentuais, isto corresponde a 70,23% dos consumidores.

19

Curso de Graduao em Administrao a Distncia

importante ressaltar que este resultado aproximado, devido perda de informao pelo fato de a tabela ser intervalar, ou seja, as classes esto em intervalos. Quando voc trabalha com variveis qualitativas, os atributos so as variaes nominativas da varivel. A construo da tabela consiste em contar as ocorrncias de cada atributo. O resultado da contagem define a freqncia absoluta do atributo. Para podermos entender isto, tomemos como exemplo uma pesquisa na qual se procurou avaliar o nmero de pessoas de diferentes sexos em uma determinada empresa. Estes resultados so apresentados na Tabela 6.
Sexo
Masculino Feminino Total

fa
20 30 50

fr
0,40 0,60 1,00

Tabela 6: Distribuio de freqncias do nmero de funcionrios em relao ao seu sexo em 2006

Tomando, por exemplo, o caso de uma varivel aleatria discreta (conceito visto em Metodologia de Pesquisa), realizou-se no SAC (Servio de Atendimento ao Consumidor) de uma empresa um estudo referente ao nmero de reclamaes (N.R.) atendidas diariamente, durante um certo ms, obtendo os seguintes resultados:
N.R. Dia
0 2 1 5 3 2 7 8 9 10 11 12

N.R. Dia
1 2 2 3 0 3 13 14 15 16 17 18

N.R. Dia
0 0 1 2 3 5 19 20 21 22 23 24

N.R. Dia
1 0 0 2 0 4 25 26 27 28 29 30

N.R.
0 3 4 0 2 1

20

Mdulo 4

Dispondo estes dados em um rol (crescente), tem-se: 000000000111112222222333334455 Podemos, ento, apresentar a seguir estes dados em uma distribuio de freqncias. Neste caso, no necessrio definir intervalos de classes, porque a variao dos valores pequena.

Numero de reclamaes por dia


0 1 2 3 4 5 Total

Nmero de dias (fa)


9 5 7 5 2 2 30

Freq. Relativa
0.3 0.17 0.23 0.17 0.07 0.07 1

Tabela 7: Nmero de reclamaes atendidas diariamente, durante certo ms

Verificamos que os valores da varivel discreta correspondem a cada uma das classes. Surge, ento, uma pergunta:

As tabelas de distribuio de freqncias so a nica forma que voc tem de apresentar um conjunto de dados?

Para responder a esta pergunta, vamos falar um pouco sobre algumas formas de representao grfica de tabelas de freqncia. Logicamente, dependendo do tipo de varivel, temos um grfico mais adequado. Os diferentes tipos de grfico, (histogramas, polgonos de freqncia, ogivas, grficos de setores, pictogramas e outros) permitem uma melhor visualizao de resultados. Estes grficos podem ser obtidos utilizando planilhas eletrnicas, como por exemplo, o Excel.
21

Curso de Graduao em Administrao a Distncia

GLOSSRIO *histograma Histogramas: so constitudos por um conjunto de retngulos, com as bases assentadas sobre um eixo horizontal, tendo o centro da mesma no ponto mdio da classe que representa, e cuja altura proporcional freqncia da classe. *Polgono de freqncias um grfico de anlise no qual as freqncias das classes so localizadas sobre perpendiculares levantadas nos pontos mdios das classes.

Os histogramas* so grficos utilizados para representar tabelas intervalares.

Figura 1: Histograma representativo da distribuio de freqncias do tempo em minutos de uso de telefone celular por consumidores de uma determinada operadora

J o polgono de freqncia*, voc pode obter pela simples unio dos pontos mdios dos topos dos retngulos de um histograma. Completa-se o polgono unindo as extremidades da linha que ligam os pontos representativos das freqncias de classe aos pontos mdios das classes, imediatamente, anterior e posterior s classes extremas, que tm freqncia nula.

Figura 2: Polgono de Freqncias do tempo em minutos de uso de telefone celular por consumidores de uma determinada operadora

22

Mdulo 4

Quando temos uma tabela de varivel qualitativa, um tipo de grfico adequado para apresentar os resultados corresponde ao grfico de setores, tambm popularmente conhecido como grfico tipo pizza. Sua construo simples: sabe-se que o ngulo de 360 equivale a 100% da rea da circunferncia; assim, para obter-se o ngulo do setor cuja rea representa uma determinada freqncia, basta resolver uma regra de trs simples, como a apresentada a seguir: 360 ---------------- 100% x ------------------- Freq. Relativa (Porcentual)

Figura 3: Grfico do sexo de pessoas que trabalham em uma determinada empresa

Os grficos chamados de ogivas correspondem a um polgono de freqncias acumuladas, nas quais estas freqncias so localizadas sobre perpendiculares levantadas nos limites inferiores ou superiores das classes, dependendo se a ogiva representar as freqncias acumuladas.

23

Curso de Graduao em Administrao a Distncia

Figura 4: Ogiva "abaixo de" do tempo em minutos que consumidores de uma determinada operadora de telefonia celular utilizariam em um ms se houvesse uma reduo na tarifa de 20%

Aps o estudo da construo de distribuies de freqncias e grficos que as representam, voc deve ser capaz de organizar um conjunto de dados, por meio de uma distribuio de freqncias (absoluta, relativa, e acumuladas) e represent-lo graficamente.

Saiba mais...
Visite o site de como usar a planilha Cal, do pacote OpenOffice, nas estatsticas descritivas, em: http://www2.ufpa.br/ dicas/open/oo-ind.htm Vamos, ento, fazer um exerccio para fixar os conhecimentos adquiridos. (As respostas esto no final do livro.)

24

Mdulo 4

Exerccio 1: tem-se a seguir o tempo em minutos de reunies em um setor de uma empresa.


45 50 42 41 52 51 44 41 50 46 50 46 60 54 52 58 57 58 60 51

a) Construa a distribuio de freqncias absoluta, relativa e acumulada; e b) Determine o nmero de reunies em que o tempo foi menor do que 50, a partir da distribuio de freqncias.

Medidas de posio
As medidas de posio ou de tendncia central constituem uma forma mais sinttica de apresentar os resultados contidos nos dados observados, pois representam um valor central, em torno do qual os dados se concentram. As medidas de tendncia central mais empregadas so a mdia, a mediana e a moda. A mdia aritmtica* a mais usada das trs medidas de posio mencionadas, por ser a mais comum e compreensvel delas, bem como pela relativa simplicidade do seu clculo, alm de prestar-se bem ao tratamento algbrico. Considerando o caso do nmero de reclamaes em um SAC (ver em distribuies de freqncia), se voc somar todos os valores do nmero de reclamaes e dividir pelo nmero de dias, voc ter ento a mdia aritmtica ( ) do nmero de reclamaes. Ento, o valor obtido ser: = 1,73 reclamaes por dia. GLOSSRIO *A mdia aritmtica, ou simplesmente mdia de um conjunto de n observaes, x1, x2,...,xn definida como:

O somatrio ( ) corresponde soma de todos os valores obtidos.

25

Curso de Graduao em Administrao a Distncia

Voc pode interpretar este resultado da mdia como sendo o nmero de reclamaes mdio por dia, que de 1,73, podendo ocorrer dias em que o nmero de reclamaes pode ser maior ou menor que o valor mdio encontrado.

GLOSSRIO *Hiptese Tabular Bsica todas as observaes contidas numa classe so consideradas iguais ao ponto mdio da classe.

Portanto, de uma forma mais geral, podemos interpretar a mdia como sendo um valor tpico do conjunto de dados. Pode ser um valor que no pertence ao conjunto de dados. Se os dados estiverem agrupados na forma de uma distribuio de freqncia em classes, lana-se mo da Hiptese Tabular Bsica* para o clculo da mdia. Ento, voc vai calcular a mdia por meio da seguinte expresso:

sendo xi: ponto mdio da classe i; fai: freqncia absoluta da classe i; fri : freqncia relativa da classe i. Considerando o caso do tempo de uso em minutos do celular (ver no item distribuies de freqncias), a mdia ser dada por:

O valor de 82 apresentado na expresso corresponde ao ponto mdio da primeira classe, o qual foi obtido pela soma dos limites superior e inferior, dividido por dois, ou seja, a mdia aritmtica. Os pontos mdios das outras classes so obtidos de forma similar.

26

Mdulo 4

Existem outros tipos de mdia que podem ser utilizados, como por exemplo, mdia ponderada (utilizada quando existe algum fator de ponderao), mdia geomtrica (quando os dados apresentam uma distribuio que no simtrica) e outras. s vezes, associam-se s observaes x1,x 2,...,xn determinadas ponderaes ou pesos w1,w2,...,wn, que dependem da importncia atribuda a cada uma das observaes; neste caso, a mdia ponderada dada por:

Como exemplo, voc pode considerar um processo de avaliao de um funcionrio em trs etapas. Um funcionrio apresentou as seguintes notas durante a avaliao: 1 etapa = 90; 2 etapa = 70; 3 etapa = 85, e os pesos de cada etapa so 1, 1 e 3, respectivamente. Qual o score mdio final do funcionrio?

Outro tipo de mdia corresponde geomtrica (Mg). Ela calculada pela raiz n-sima do produto de um conjunto de n observaes, x1,x2,...,xn, associadas s freqncias absolutas f1,f2,..., fn, e, respectivamente, dada por:

Este tipo de mdia, voc vai trabalhar na disciplina de Matemtica Financeira. Em algumas situaes, voc ver que necessria a informao do nmero de observaes que mais ocorre em um conjunto de dados.

27

Curso de Graduao em Administrao a Distncia

No caso do nmero de reclamaes no SAC, verifica-se que o que mais ocorre zero, ou seja, em vrios dias no ocorre nenhuma reclamao. Assim, podemos, ento, definir a moda (Mo) como sendo o valor em um conjunto de dados que ocorre com maior freqncia. Um conjunto de dados pode ser unimodal (uma moda) ou amodal (no possuir moda, pois no existe nenhum valor que ocorre com maior freqncia) ou multimodal (possui mais de uma moda). Quando os dados no esto em intervalos de classes, basta olhar o valor que ocorre com maior freqncia. Para dados agrupados em intervalos de classes, voc pode calcular a moda por meio do mtodo de Czuber, que se baseia na influncia das classes adjacente na moda, deslocando-se no sentido da classe de maior freqncia. A expresso que voc utilizar :

onde: Li: limite inferior da classe modal; d1: diferena entre a freqncia da classe modal e a imediatamente anterior; d2: diferena entre a freqncia da classe modal e a imediatamente posterior; e c: amplitude da classe modal. No caso do tempo de uso de aparelhos celulares (ver a tabela no item distribuio de freqncias), teremos que a classe modal a terceira, pois apresenta maior freqncia. Utilizando a expresso mostrada anteriormente, teremos:

Uma caracterstica importante da moda que ela no afetada pelos valores extremos da distribuio, desde que estes valores no constituam a classe modal.

28

Mdulo 4

Desta forma, a moda deve ser utilizada quando desejamos obter uma medida rpida e aproximada de posio ou quando a medida deva ser o valor mais freqente da distribuio. Outra medida de posio que voc pode utilizar a mediana (Md).

Em um conjunto de valores dispostos segundo uma ordem (crescente ou decrescente), o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo nmero de elementos, ou seja, 50% dos dados so superiores mediana, e 50% so inferiores.

O smbolo da mediana dado por Md ou . A posio da mediana dada por meio da expresso: E (elemento central) = (n+1) / 2. Considerando um conjunto de dados com nmero mpar de elementos como (1, 2, 5, 9, 10, 12, 13), a posio da mediana ser dada por (7 + 1)/2 = 4 posio. Portanto, a partir dos dados ordenados, o nmero que se encontra na 4 posio o 9, e assim a mediana ser igual a 9. (Temos trs valores abaixo e trs valores acima ou 50% acima da mediana, e 50% abaixo) Caso o nmero de elementos do conjunto de dados for par, como por exemplo, (1, 2, 6, 8, 9, 12, 11, 13), encontra-se a posio da mediana (( 8 + 1)/2 = 4,5 posio). Como a posio 4,5 est entre a 4 e a 5 posio, calcula-se a mdia entre os valores que ocupam estas posies. O valor encontrado de 8,5 corresponde mediana. Quando os dados esto agrupados na mediana devemos encontrar a classe mediana. Se os dados esto agrupados em intervalos de classe, como no caso do tempo de utilizao do telefone, utilizaremos a seguinte expresso:

29

Curso de Graduao em Administrao a Distncia

onde: li: limite inferior da classe mediana; n: nmero total de elementos; fantac: freqncia acumulada anterior classe mediana; fmed: freqncia absoluta da classe mediana e a amplitude da classe mediana. Portanto, resolvendo o caso do tempo de utilizao dos celulares, teremos que a posio da mediana ser dada por E = 40/2 = 20 elemento, o qual est na terceira classe (120,4 | 146), que corresponde classe mediana.

Em um conjunto de dados, a mediana, a moda e a mdia no necessariamente devem apresentar o mesmo valor. Uma informao importante de que a mediana no influenciada pelos valores extremos. Comparando os resultados encontrados para uma amostra em relao s medidas de posio estudadas e verificando a inter-relao entre elas, voc pode concluir que seus valores podem nos dar um indicativo da natureza da distribuio dos dados, em funo das regras definidas a seguir:

Outras medidas de posio denominadas separatrizes sero definidas a seguir. A principal caracterstica das medidas separatrizes consiste na separao da srie em partes iguais que apresentam o mesmo nmero de valores. As principais so os quartis, decis e percentis. Os quartis so valores de um conjunto de dados ordenados, que os dividem em quatro partes iguais. necessrio, portanto, trs quartis

30

Mdulo 4

(Q1, Q2 e Q3) para dividir um conjunto de dados ordenados em quatro partes iguais. Q1 : deixa 25% dos elementos abaixo dele. Q2 : deixa 50% dos elementos abaixo dele e coincide com a mediana. Q3 : deixa 75% dos elementos abaixo dele. A figura abaixo mostra bem o quartis:

Se considerarmos o exemplo do nmero de reclamaes por dia em um SAC, teremos de forma semelhante a figura anterior:

Para valores no tabelados, pode ser dito que o primeiro quartil pode ser obtido como a mediana da primeira metade dos dados, e para o terceiro quartil, como a mediana da segunda metade. Para dados tabelados, a frmula da mediana pode ser adaptada para os demais quartis.

Medidas de disperso
Como foi visto anteriormente, podemos sintetizar um conjunto de observaes em alguns valores representativos como mdia, mediana, moda e quartis. Em vrias situaes, torna-se necessrio visualizar como os dados esto dispersos. Tomando como exemplo vrias empresas que apresentem salrios mdios iguais, podemos concluir, ento, que a contribuio social (% do salrio) ser a mesma? Somente
31

Curso de Graduao em Administrao a Distncia

O termo amplitude total foi visto anteriormente na construo de uma distribuio de freqncia em classes. Relembrando, a diferena entre o maior e o menor valor observados.

com base no salrio mdio, sim, mas estaramos chegando a uma concluso errada. A variao em termos de faixas salariais pode ser diferente, apesar de apresentarem a mesma mdia. Pensando no que foi dito anteriormente, considere o valor (em reais) ganho por dia de trs grupos de empregados (A: 70, 70, 70, 70, 70; B: 50, 60, 70, 80, 90; C: 5, 15, 50, 120, 160). Podemos verificar que, apesar de apresentarem a mesma mdia (70), os trs grupos apresentam comportamento diferenciado, pois o grupo A o mais homogneo, e o grupo C o que apresenta maior variao de ganho por dia. Portanto, devemos sempre inserir junto a uma medida de posio uma medida que avalie esta distribuio, ou seja, a variabilidade de um conjunto de dados. Portanto, quanto maior a variabilidade, maior ser a disperso das observaes. Uma primeira medida de disperso que vamos comentar a amplitude total. No caso dos ganhos dirios, podemos obter os seguintes resultados: AA = 70 70 = 0 A B = 90 50 = 40 AC = 160 5 = 155

Verificamos, ento, que o grupo C o que apresenta maior variabilidade, e que o grupo A corresponde ao de menor variabilidade. Deste modo, o grupo C corresponde quele que teve maior variabilidade em torno da mdia. No caso de dados agrupados, a amplitude total calculada por meio da diferena entre o ponto mdio da ltima classe e o ponto mdio da primeira classe. A amplitude total tem a desvantagem de s levar em conta os dois valores extremos, por isso apenas uma indicao aproximada da disperso. Outra desvantagem que a amplitude total apresenta muita variao de uma amostra para outra, mesmo que ambas sejam extradas da mesma populao. Portanto, voc deve trabalhar com uma medida que leve em considerao todas as observaes. Desta forma, podemos querer verificar o quanto um conjunto de observaes est mais prximo ou mais distante de uma medida, que no caso ser a mdia. Ento, voc pode

32

Mdulo 4

calcular o desvio de cada valor em relao mdia ( ), e se fizermos o somatrio destes desvios, o resultado ser igual a zero. Se voc elevar este desvio ao quadrado e somar, teremos o que chamamos de soma de quadrado dos desvios. Dividindo este somatrio pelo total de observaes, teremos uma idia da disperso das observaes em relao mdia. Esta medida que acabamos de visualizar de forma intuitiva corresponde varincia. Portanto, voc pode concluir que a varincia sempre assumir valores positivos.

Quando o nosso interesse o de tirar inferncias vlidas para toda a populao a partir de uma amostra (poro representativa da populao), deve-se trocar na frmula da varincia N por n 1, onde: N corresponde ao tamanho da populao; e n corresponde ao tamanho da amostra utilizada.

As expresses para clculo das varincias populacional e amostral so apresentadas a seguir.

Quando temos os dados agrupados em intervalos de classes, o xi corresponde ao ponto mdio da classe, e fi freqncia da classe. Como a varincia calculada a partir dos quadrados dos desvios, ela um nmero que apresenta a unidade elevada ao quadrado em relao varivel que no est elevada ao quadrado; isto se torna um inconveniente em termos de interpretao do resultado. Por isso, definiu-se uma nova medida, o desvio-padro, que a raiz quadrada da varincia, com mais utilidade e interpretao prticas, representada por

33

Curso de Graduao em Administrao a Distncia

s ou . A varincia uma medida que tem pouca utilidade na Estatstica Descritiva, mas ser extremamente importante na Inferncia Estatstica e em combinaes de amostras. Tambm importante frisar que, na grande maioria das situaes, trabalhamos com amostras, ento devemos utilizar o desvio-padro amostral. No caso dos ganhos dirios, calculando a varincia de cada um dos grupos que correspondem a uma amostra, encontramos os seguintes resultados: sA = 0 reais; sB = 15,81 reais; sC=67,54 reais. O desvio-padro, quando analisado isoladamente, no d margem a muitas concluses. Por exemplo, para uma distribuio cuja mdia 300, um desvio-padro de 2 unidades pequeno, mas para uma distribuio cuja mdia 20, ele j no to pequeno. Importante! Condies para se usar o desvio-padro ou varincia para comparar a variabilidade entre grupos: mesmo nmero de observaes; mesma unidade; e mesma mdia. Alm disso, se quisermos comparar duas ou mais amostras de valores expressas em unidades diferentes, no poder ser possvel fazer a comparao por meio do desvio-padro, pois ele expresso na mesma unidade dos dados. Tambm necessrio que os conjuntos de observaes tenham o mesmo tamanho. Podemos, ento, considerar a situao na qual se avaliou o custo indireto de fabricao (CIF) de um produto em reais e o tempo gasto em uma mquina para fabricao deste produto em segundos.
x
CIF Tempo 175 reais 68 segundos

S
5 reais 2 segundos

34

Mdulo 4

A princpio, voc poderia concluir que o CIF apresenta maior variabilidade. Entretanto, as condies citadas anteriormente deveriam ser satisfeitas para que se pudesse utilizar o desvio-padro para comparar a variabilidade. Como as condies no so satisfeitas, devemos tentar expressar a disperso dos dados em torno da mdia, em termos porcentuais. Ento, utilizaremos uma medida estatstica chamada de coeficiente de variao (CV). O coeficiente ser dado por meio da expresso: , onde s e foram definidos anteriormente Para a situao do CIF e tempo, teremos:

Portanto, nesse grupo de indivduos, o tempo de horas, mquina apresenta maior disperso do que o custo indireto de fabricao (CIF), mudando, assim, a concluso anterior. Ao final desta parte de medidas de posio e disperso, voc deve ser capaz de calcular as medidas de posio e disperso, e interpret-las. Caso no consiga, voc deve voltar ao texto e fixar melhor os conceitos. Seguem abaixo exerccios para fixao dos conhecimentos adquiridos nos assuntos de medida de posio e de disperso. Voc deve resolver todos eles. Exerccio 2: a tabela abaixo apresenta uma distribuio de freqncias das reas de 400 lotes: A partir da tabela acima, calcule:

35

Curso de Graduao em Administrao a Distncia

reas (m2)
300 | 400 400 | 500 500 | 600 600 | 700 700 | 800 800 | 900 900 | 1000 1000 | 1100 1100 | 1200

N de lotes
14 46 58 76 68 62 48 22 6

a) mdia, mediana e moda; b) desvio padro e coeficiente de variao; c) o ponto mdio da stima classe; d) a amplitude do intervalo da segunda classe; e) a freqncia relativa da sexta classe; f) a freqncia acumulada da quinta classe; g) o n de lotes cuja rea no atinge 700 m2; h) o n de lotes cuja rea atinge e ultrapassa 800 m2; e i) a classe do 72 lote. Exerccio 3: os dez funcionrios de uma pequena empresa receberam os seguintes salrios, em reais: 230, 210, 100, 140, 160, 120, 390, 450, 100 e 200 Calcule as medidas de posio e disperso em relao aos salrios

36

Mdulo 4

Exerccio 4: uma loja vende cinco produtos bsicos A, B, C, D e E. O lucro por unidade comercializada destes produtos vale, respectivamente $ 200,00; $ 300,00; $ 500,00; $ 1.000,00; $ 5.000,00. A loja vendeu em determinado ms 20; 30; 20; 10; 5 unidades, respectivamente. Qual foi o lucro mdio por unidade comercializada por esta loja? Exerccio 5: uma empresa tem duas filiais praticamente idnticas quanto s suas caractersticas funcionais. Um levantamento sobre os salrios dos empregados dessas filiais resultou nos seguintes valores: Filial A: xA = 400 e SA = 20 Filial B: xB = 500 e SB = 25 Podemos afirmar que as duas filiais apresentam a mesma disperso?

Saiba mais...
Sobre clculo de mdias e funes em planilhas, visite o site: http://www.juliobattisti.com.br/tutoriais/celsonunes/ openoffice007.asp Mais exerccios referentes ao assunto esto no site: http://www.famat.ufu.br/prof/marcelo/exercicios.htm

37

2
Introduo Introduo a a probabilidades probabilidades

UNIDADE

Curso de Graduao em Administrao a Distncia

40

Mdulo 4

Introduo a probabilidades

Quando estamos falando de probabilidade, queremos identificar a chance de ocorrncia de um determinado resultado de interesse, em situaes nas quais no possvel calcular com exatido o valor real do evento. Desta forma, trabalhamos com chances ou probabilidades. Uma situao, para exemplificarmos este fato, est associada seguinte pergunta: meu vendedor poder cumprir sua meta de venda na semana que vem? O espao amostral* simbolizado por S ou nesta situao ser atinge a meta e no atinge a meta. Para calcular a probabilidade de cumprir a meta, voc pode usar a intuio (subjetivo) ou usar a freqncia relativa das ltimas dez semanas em que o vendedor esteve trabalhando (objetivo). Portanto, para calcularmos uma probabilidade, necessrio que tenhamos um experimento aleatrio*, que apresenta as seguintes caractersticas: a) cada experimento pode ser repetido indefinidamente sob as mesmas condies (n); b) no se conhece a priori o resultado do experimento, mas podem-se descrever todos os possveis resultados; e c) quando o experimento for repetido um grande nmero de vezes, surgir uma regularidade do resultado, isto , haver uma estabilidade da frao (freqncia relativa) da ocorrncia de um par-

GLOSSRIO *Espao amostral conjunto de possibilidades, ou seja, os possveis resultados associados a um experimento aleatrio. *Experimento aleatrio qualquer processo que venha a gerar um resultado incerto ou casual.

ticular resultado, onde r corresponde ao nmero de vezes que um determinado resultado aconteceu. Nos experimentos ou situaes mencionadas, voc pode notar que a incerteza sempre est presente, o que quer dizer que, se estes experimentos forem repetidos em idnticas condies, no se pode determinar qual o resultado ocorrer. A incerteza est associada chance de ocorrncia que atribumos ao resultado de interesse. Consideremos, como exemplo, os funcionrios que trabalham no setor de marketing de uma determinada empresa. Sabe-se que nes-

41

Curso de Graduao em Administrao a Distncia

te setor trabalham seis funcionrios. Um experimento ao acaso seria a escolha aleatria de um dos funcionrios. Podemos considerar como evento de interesse o sexo do funcionrio escolhido. Voc, ento, vai aplicar os conceitos vistos acima e novos conceitos associados a probabilidades. GLOSSRIO *Evento qualquer subconjunto de um espao amostral. Conjunto de possibilidades (Espao amostral): S = {Carlos, Jackeline, Giulyana, Girlene, Cludio, Larissa}. Conjunto de possibilidades favorveis (Funcionrios do sexo masculino que correspondem a um evento*): {Carlos, Cludio}. Qual a probabilidade de escolher um funcionrio ao acaso e ele ser do sexo masculino? (Sugesto: verificar o nmero de funcionrios do sexo masculino).

Dados trs eventos, A (funcionrio ser do sexo feminino) e B (seu nome comea com a letra G) e C (seu nome comea com a letra C) dos funcionrios do setor de marketing apresentado anteriormente: A B o evento em que A e B ocorrem simultaneamente: {Giulyana, Girlene}. A C o evento em que A ocorre ou C ocorre (ou ambos): {Carlos, Jackeline, Giulyana, Girlene, Cludio, Larissa}. A o evento em que A no ocorre (complementar de A): {Carlos, Claudio}. Dois eventos so considerados mutuamente exclusivos, se a ocorrncia de um exclui a ocorrncia do outro. Voc pode, ento, definir a probabilidade como uma funo que atribui um nmero real aos eventos de (se A um evento de , P(A) a probabilidade de A), que satisfaz: 1. P() = 0, P() = 1

42

Mdulo 4

2. 0 P(A) 1 3. Regra da soma: dados dois eventos mutuamente exclusivos A e C de , P(AC) = P(A) + P(C) O smbolo corresponde ocorrncia de um evento impossvel, ou seja, que no pode ocorrer no espao amostral considerado.

OBS: Caso os eventos no sejam mutuamente exclusivos, na regra da soma, devemos considerar que a interseco ser contada duas vezes. Ento, devemos retirar na regra da soma a interseco. P(AB) = P(A) + P(B) P(AB) Considerando os eventos A, B e C definidos anteriormente, calcule as probabilidades mencionadas na pgina anterior para fixao dos conceitos. Para inserirmos outros conceitos de probabilidade, voc deve considerar os dados a seguir referentes ao acesso e cadastro em dois sites, por pessoas em uma determinada regio. O site 1 segue o padro normal, enquanto o site 2 corresponde a uma nova proposta de apresentao de informaes.
Acessa e cadastra no site
Site 1 Site 2 Total 39.577 46.304 85.881

Acessa e no cadastra no site


8.672 7.297 15.969

Total
48.249 53.601 101.850

Um acesso a um dos sites escolhido ao acaso. Podemos considerar, ento, que o nosso espao amostral () corresponder ao conjunto de 101.850 acessos. H os seguintes eventos de interesse: S1 = nmero de acessos feitos no site 1.
43

Curso de Graduao em Administrao a Distncia

S2 = nmero de acessos feitos no site 2. AC = o site acessado, e o cadastro feito pelo internauta. S1 AC = o internauta acessa o site 1 e faz o cadastro no site. S1 AC = o internauta acessa o site 1 ou faz o cadastro no site. Voc pode obter, ento, algumas probabilidades como:

S2 = S1 P(S2) = P( S1) = 1 P( S1) = 1 0,473 = 0,527 P(S1 AC) = P(S1) + P(AC) P(S1 AC) = 0,473 + 0,843 0,388 = 0,928 Se voc relembrar a interpretao da probabilidade, considerando A um evento de um espao amostral associado a um experimento aleatrio, voc pode ter duas formas de atribuir probabilidades aos eventos de um espao amostral: P{A} uma intuio (subjetiva) que se deposita na ocorrncia de A. Interpretao freqntista (objetiva).

Quando n cresce: fn(A) se aproxima da P(A), por isso foram realizadas n repeties independentes do experimento. No exemplo anterior, se voc souber que um acesso sorteado do site 1, qual a probabilidade de que ocorra a efetuao do cadastro?

44

Mdulo 4

Temos uma informao parcial: o acesso do site 1.

Vamos designar a probabilidade de AC, quando se sabe que o acesso ocorreu no site 1, que chamaremos de P(AC /S1) e denominla probabilidade (condicional) de AC dado S1 (lembre-se que o smbolo / no corresponde a uma diviso). natural atribuirmos:

Note que:

Portanto, voc pode generalizar para dois eventos A e B quaisquer de um experimento aleatrio. Desta forma, podemos dizer que a probabilidade condicional de A dado B (nota-se por P (A / B)) definida como:

Podemos, ento, definir a regra do produto, ou seja, a partir da probabilidade condicionada definida anteriormente, obteremos a chamada regra do produto para a probabilidade da interseo de dois eventos A e B de um espao amostral: Passe a probabilidade de ocorrncia de B na probabilidade condicionada e multiplique pela probabilidade de ocorrncia de A sabendo que B j aconteceu.

45

Curso de Graduao em Administrao a Distncia

P (A ) = P (A / ) . P (B) Se dois eventos A e B so independentes, ento P{A / B} = P{A} ou P{B / A} = P(B). Deste modo, se A e B forem independentes, voc pode verificar que:

Veja esta outra situao, utilizando os conceitos de probabilidade condicionada e independncia de eventos. Considere a tabela a seguir, representativa da distribuio da renda anual de produtores rurais e duas cooperativas em uma determinada regio.
Cooperativas Faixa de renda anual (em R$1.000)
15 a 20 (R1) 20 a 25 (R2) 25 a 30 (R3) 30 a 35 (R4) Total

A
70 15 10 20 115

B
40 15 20 10 85

Total
110 30 30 30 200

Observando-se os dados acima, se verifica que a probabilidade de um cooperado aleatoriamente escolhido ser: a) da cooperativa A: P(A) = 115/200 = 0,575 b) da cooperativa B: P(B) = 85/200 = 0,425 c) de ter renda entre R$ 15.000,00 e R$ 20.000,00: P(R1) = 110/200 = 0,550 d) da cooperativa B e ter renda entre R$ 15.000,00 e R$ 20.000,00: P(B R1) = 40/200 = 0,20 e) ter renda entre R$ 15.000,00 e R$ 20.000,00 dado que da cooperativa B: P(R1/B) = 40/85 = 0,4706 ou

46

Mdulo 4

Como P(R1) P(R1/B), conclui-se que os eventos cooperativa e renda so dependentes. Um exemplo de aplicao dos conceitos de independncia de eventos pode ser visualizado por meio do lanamento de uma moeda no viciada (no existe preferncia para cara ou coroa) trs vezes. Considere os seguintes eventos: A = no primeiro lanamento da moeda, sai cara, e B = no segundo lanamento da moeda, sai cara. Obs: considere C = cara e R = coroa Verifique se verdadeira a hiptese de que os eventos A e B so independentes. O espao amostral e os eventos so apresentados a seguir: = {CCC, CCR, CRC, CRR, RCC, RCR, RRC, RRR} (A) = {CCC, CCR, CRC, CRR} (B) = {CCC, CCR, RCC, RCR}

Para que sejam considerados independentes, a relao de independncia deve ser vlida para todas as interseces presentes na Tabela 11.

Os resultados que esto em negrito ocorrem no espao amostral (8) somente duas vezes. P(A B) = 2/8 = 1/4 P (A) = 4/8 = 1/2 P (B) = 4/8 = 1/2 Portanto, P(A B) = P (A) . P(B) => 1/4 = 1/2 . 1/2 ou

P (A / B) = P (A) => 1/2 = 1/2

47

Curso de Graduao em Administrao a Distncia

Ento, provamos que os eventos so independentes. Vamos resolver alguns exerccios relacionados aos conceitos de probabilidade vistos anteriormente. (Os resultados esto no final do livro.)

Exerccio 1: as probabilidades de trs vendedores, A, B e C, que trabalham independentemente, efetivarem uma venda quando abordam um cliente so 2/3, 4/5 e 7/10, respectivamente. Se cada um abordar um cliente, qual a probabilidade de que pelo menos um efetive a venda? Exerccio 2: A e B so dois mestres que j esto suficientemente treinados em partidas de xadrez e jogam 120 partidas, das quais A ganha 60, B ganha 40, e 20 terminam empatadas. A e B concordam em jogar trs partidas. Determinar a probabilidade de: a) A ganhar todas as trs partidas; b) duas partidas terminarem empatadas; e c) A e B ganharem alternadamente. Exerccio 3: num perodo de um ms, cem funcionrios de uma empresa que trabalha com resduos nucleares, sofrendo de determinada doena, foram tratados. Informaes sobre o mtodo de tratamento aplicado a cada funcionrio e o resultado final obtido esto na tabela abaixo:
Tratamento A
Cura total Resultado Cura parcial Morte 24 24 12

B
16 16 8

a) Sorteando-se aleatoriamente um desses funcionrios, determine a probabilidade de que o funcionrio escolhido:

48

Mdulo 4

a1) tenha sido submetido ao tratamento A; a2) tenha sido totalmente curado; a3) tenha sido submetido ao tratamento A e tenha sido parcialmente curado; e a4) tenha sido submetido ao tratamento A ou tenha sido parcialmente curado. Exerccio 4: para selecionar seus funcionrios, uma empresa oferece aos candidatos um curso de treinamento durante uma semana. Ao final, eles so submetidos a uma prova, e 25% so classificados como bons (B), 50%, como mdios (M), e os demais 25%, como fracos (F). Como medida de economia, o departamento de seleo pretende substituir o treinamento por um teste contendo perguntas de conhecimentos gerais e especficos. Mas, para isso, gostaria de conhecer qual a probabilidade de um indivduo aprovado no teste ser considerado fraco caso fizesse o teste. De acordo com os resultados, receberam os conceitos: aprovado (A) ou reprovado (R). Sabendo que P(A B) = 0,20; P(A M) = 0,25 e P(A F) = 0,05; encontrar P(A/F).

Variveis aleatrias
Voc pode definir uma varivel aleatria como sendo uma funo que associa valores reais aos eventos de um espao amostral, e que pode ser discreta ou contnua. Um exemplo de uma varivel aleatria discreta (v.a) consiste em verificar o nmero de aes que tiveram queda em um determinado dia, em uma carteira composta por cinco aes diferentes. A funo ser dada por: X= nmero de aes que tiveram queda em um determinado dia. Define uma varivel aleatria discreta, que pode assumir os valores 0, 1, 2, 3, 4, 5.

49

Curso de Graduao em Administrao a Distncia

Vamos considerar agora uma situao na qual se verificou o tempo gasto por um vendedor para convencer um cliente a adquirir um determinado produto. A funo ser: Y= tempo gasto por um vendedor para convencer um cliente a adquirir um determinado produto. Define uma varivel aleatria contnua, que pode assumir infinitos valores. Se uma varivel aleatria X pode assumir os valores x1, x2,..., xn com probabilidades respectivamente iguais a p1, p2,..., pn, e tem-se definida uma distribuio de probabilidade. ,

importante ressaltar que a varivel aleatria tem notao de letra maiscula, e seus possveis valores, minsculos, como apresentado no pargrafo anterior.

Se a varivel X em questo for discreta, sua distribuio caracterizada por uma funo de probabilidade (P(X=x)), que associa probabilidades no nulas aos possveis valores da varivel aleatria. Para o exemplo do nmero aes da carteira, as probabilidades obtidas so mostradas na funo de probabilidade que corresponde tabela abaixo.
X P(X=x) 0 1/10 1 1/10 2 2/10 3 3/10 4 4/10 5 5/10 =1,00

Se a varivel X for contnua, somente haver interesse na probabilidade de que a varivel assuma valores dentro de determinados intervalos, sendo sua distribuio de probabilidades caracterizada por uma funo densidade de probabilidade (f.d.p.), f(x), a qual dever possuir as seguintes propriedades: f(x) 0;

50

Mdulo 4

A rea compreendida entre os pontos a e b, da funo f(x) e o eixo das abscissas, corresponde probabilidade da varivel X assumir valores entre a e b.

Para o caso do tempo gasto para convencer um cliente a adquirir um produto, podemos, por exemplo, ter a funo abaixo, que corresponde a uma distribuio normal que ser vista posteriormente:

, que a distribuio normal. A funo repartio ou distribuio acumulada, representada por F(x), corresponde probabilidade de a varivel aleatria ser menor ou igual a um determinado valor de x. Se a varivel for discreta, a distribuio acumulada ser dada por F(x) = P(X x), ou seja, voc deve somar todas as probabilidades que se tem abaixo de um determinado valor, inclusive este. J no caso de uma varivel contnua, o F(x) ser dado pela rea que vai de at o ponto x a ser considerado. Portanto, teremos: Integral de at o ponto x (visto no mdulo de Matemtica).

Agora, voc vai ver um exemplo de utilizao destes conceitos. Seja a seguinte varivel aleatria contnua, definida pela funo densidade de probabilidade (f.d.p):

51

Curso de Graduao em Administrao a Distncia

graficamente, tem-se:

a) Obtenha o valor de k. Como f(x) uma fdp:

O resultado encontrado corresponde inclinao da reta, ou seja, o quanto que a funo aumenta, quando a varivel x acrescida de uma unidade.

b) calcular F(1). F(1) = P(X 1) = Para o estudo de variveis aleatrias, at este ponto, considerouse que o resultado do experimento em questo seria registrado como um nico valor x. Todavia, existem casos em que h interesse por dois resultados simultneos, como por exemplo, observar o peso e altura

52

Mdulo 4

de uma pessoa, o sexo e desempenho no trabalho, etc. Para tanto, fazse necessria a seguinte definio:

Sejam E um experimento aleatrio, e S o espao amostral associado a E. Sejam X e Y duas variveis aleatrias. Ento, (X,Y) define uma varivel aleatria bidimensional, que pode ser discreta, contnua ou mista.

O principal objetivo da anlise de variveis aleatrias bidimensionais avaliar simultaneamente dois resultados de uma situao associando as probabilidades individuais e conjuntas. Vamos, ento, definir probabilidades ou distribuies conjuntas e marginais. A distribuio conjunta a distribuio simultnea das duas variveis, ou seja, a interseco das variveis e as distribuies marginais so as distribuies isoladas de cada varivel. Estas distribuies so assim chamadas por ocuparem, em uma tabela, a parte central e as margens das tabelas, respectivamente. Voc pode visualizar este fato na tabela apresentada na pgina seguinte. Se (X,Y) uma varivel aleatria bidimensional discreta, sua funo de probabilidade, representada por P(X = xi ;Y = yi) que associa um valor p(xi, yi) a cada valor do par (X,Y), deve satisfazer as seguintes condies: P(xi, yi) = 0

Veja a seguinte situao: uma pesquisa foi realizada para verificar a existncia de relao entre a utilizao de um produto (baixa, mdia ou alta) e o grau de instruo das pessoas (Fundamental, Mdio e Superior). Como os resultados associam duas variveis, ento temos uma distribuio de probabilidade de variveis aleatrias bidimensionais. No resultado encontrado (mostrado a seguir), temos um quadro chamada de contingncia.
53

Curso de Graduao em Administrao a Distncia

Utilizao
Alta Mdia Baixa Total

Instruo Fundamental
100 350 150 600

Mdio
120 100 80 300

Superior
65 20 15 100

Total
285 470 245 1000

Vamos, ento, calcular o quadro das probabilidades (dividindo cada valor por 1.000 que o tamanho da amostra utilizada.
Instruo Fundamental
0.100 0.350 0.150 0.600

Utilizao
Alta Mdia Baixa Total Distribuio Conjunta do Grau de Instruo e Utilizao.

Mdio
0.120 0.100 0.080 0.300

Superior
0.065 0.020 0.015 0.100

Total
0.285 0.470 0.245 1.000 Distribuio Marginal da Utilizao.

Distribuio Marginal do Grau de Instruo.

Resolva agora estes dois exerccios e, caso tenha dvida, releia o texto relativo a variveis aleatrias (os resultados esto no final do livro). Exerccio 5: uma empresa tem quatro caminhes de aluguel. Sabendo-se que o aluguel feito por dia e que a distribuio diria do nmero de caminhes alugado a seguinte, determine:
N de caminhes alugados / dia Probabilidade de alugar 0 0,1 1 0,2 2 0,3 3 0,3 4 0,1

a) Qual a probabilidade de alugar num dia mais de dois caminhes? b) Qual a probabilidade de alugar no mnimo um caminho?

54

Mdulo 4

c) Qual a probabilidade de alugar no mximo dois caminhes? d) Determine a funo de distribuio acumulada. e) Qual o valor de F(3)? O que significa este resultado? Exerccio 6: a proporo de lcool em um certo composto pode ser considerada uma varivel aleatria com a seguinte funo de densidade:

Calcule a probabilidade da proporo de lcool neste composto entre 0,20 e 0,25.

Distribuies de variveis aleatrias discretas


Distribuio Uniforme Discreta
Enquadram-se aqui as distribuies em que os possveis valores da varivel aleatria tenham todos a mesma probabilidade de ocorrncia. Logo, se existem n valores possveis, cada um ter probabilidade igual a 1/n. Ex. Seja o lanamento de um dado e a varivel aleatria X = face superior do dado, tem-se que:
X P(X=x) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 =1

ou P(X=x) = 1/6 Desta forma, voc pode verificar que esta varivel segue uma distribuio uniforme discreta, pois a varivel discreta, e todos os possveis resultados da varivel aleatria tm a mesma probabilidade (1/6).

55

Curso de Graduao em Administrao a Distncia

Distribuio de Bernoulli
Imagine uma situao na qual s podem ocorrer dois possveis resultados, sucesso e fracasso. Veja alguns exemplos: uma venda efetuada ou no em uma ligao de call center; um cliente pode ser adimplente ou inadimplente; uma pea produzida por uma cia. pode ser perfeita ou defeituosa; e um consumidor que entra numa loja pode comprar ou no comprar um produto. Associando-se uma varivel aleatria X aos possveis resultados do experimento, de forma que: X= 1 se o resultado for sucesso, X= 0 se o resultado for fracasso. Ento, a varivel aleatria X, assim definida, tem distribuio Bernoulli, com p sendo a probabilidade de ocorrer sucesso , e q = (1-p) a probabilidade de ocorrer fracasso. A funo de probabilidade da Distribuio de Bernoulli dada por:

Est relacionado com o objetivo do trabalho a ser realizado.

A mdia e a varincia sero obtidas por: Mdia = p Varincia = pq Contextualizando a distribuio de Bernoulli, temos a seguinte situao: a experincia tem mostrado que, durante as vendas de Natal, um cliente que entra em uma determinada loja tem 60% de chance de comprar um produto qualquer. Temos, portanto, uma probabilidade de sucesso (o cliente adquirir um produto qualquer) de 0,6 e uma
56

Mdulo 4

probabilidade de no adquirir um produto de 0,4 (vem da diferena q = 1-0,6).

Distribuio binomial
Para que uma situao possa se enquadrar em uma distribuio binomial, deve atender s seguintes condies: so realizadas n repeties (tentativas) independentes; cada tentativa uma prova de Bernoulli (s podem ocorrer dois possveis resultados); e a probabilidade p de sucesso em cada prova constante. Se uma situao atende a todas as condies acima, ento a varivel aleatria X = nmero de sucessos obtidos nas n tentativas ter uma distribuio binomial, com n tentativas e p (probabilidade de sucesso). Simbolicamente, temos: X ~ B(n,p) com a interpretao dada a seguir: Pense, como exemplo de forma didtica no lanamento de uma moeda 50 vezes, e veja se esta situao se enquadra nas condies da distribuio binomial.

A varivel aleatria x tem distribuio binomial com n ensaios e uma probabilidade p de sucesso. (em cada ensaio).

A funo de probabilidade utilizada para clculo de probabilidades, quando a situao se enquadra na distribuio binomial, ser dada por meio da seguinte expresso:

, onde n! corresponde ao fatorial de n. p = probabilidade de sucesso em cada ensaio q = 1-p = probabilidade de fracasso em cada ensaio

57

Curso de Graduao em Administrao a Distncia

Para exemplificar a utilizao da distribuio binomial, voc deve considerar que pessoas entram em uma loja no perodo prximo ao Dia das Mes. Sabe-se que a probabilidade de uma pessoa do sexo masculino comprar um presente de 1/3. Se entrarem quatro pessoas do sexo masculino nesta loja, qual a probabilidade de que duas venham a comprar presentes? Se as quatro pessoas entram na loja e duas delas compram, podemos colocar as possibilidades da seguinte forma (C compra e noC no compra). O espao amostral associado ao experimento : C, C, no-C, no-C ou C, no-C, no-C, C ou C, no-C, C, no-C ou no-C, no-C, C, C ou no-C, C, no-C, C ou no-C, C, C, no-C Logo, calculando as probabilidades usando as regras do e (multiplicao, pois so independentes) e do ou (soma), a probabilidade de dois clientes do sexo masculino comprarem presentes :

Como na binomial so n ensaios de Bernoulli e a distribuio tem mdia p, a mdia da binomial ser np. Raciocnio semelhante feito para a varincia.

Agora, voc deve calcular utilizando a funo de probabilidade apresentada anteriormente e verificar que o resultado ser o mesmo. Os valores da mdia e da varincia da distribuio binomial so: Mdia = np Varincia = npq Um outro exemplo de utilizao da distribuio binomial o seguinte. Em um determinado processo de fabricao, 10% das peas

58

Mdulo 4

produzidas so consideradas defeituosas. As peas so acondicionadas em caixas com cinco unidades cada uma. Considere que cada pea tem a mesma probabilidade de ser defeituosa (como se houvesse repetio no experimento de retirar uma pea). a) Qual a probabilidade de haver exatamente trs peas defeituosas numa caixa? P = 0,1 n = 5 b) Qual a probabilidade de haver duas ou mais peas defeituosas em uma caixa? c) Qual a probabilidade de uma caixa no apresentar nenhuma pea defeituosa? d) Supondo que a empresa pague uma multa de R$ 10,00 por caixa que apresente peas defeituosas, qual o valor esperado desta multa em um lote de 1.000 caixas? P(uma caixa ter pea defeituosa) = 1- P(X=0) = 0,4095 Temos, ento, uma nova varivel aleatria (nmero de caixas com peas defeituosas), a qual chamaremos de Y em um lote de 1.000 caixas, que segue uma distribuio binomial com n=1.000 e p=0,4095. E(Y) = np = 1000.0,4095 = 409,5 caixas. Multa Esperada = 409,5 . R$ 10,00 = R$ 4.095,00

Distribuio de Poisson
Voc pode empregar a distribuio de Poisson em situaes nas quais no est interessado no nmero de sucessos obtidos em n tentativas, como ocorre no caso da distribuio binomial, entretanto este nmero de sucessos deve estar dentro de um intervalo contnuo, ou seja, o nmero de sucessos ocorridos durante um intervalo contnuo, que pode ser um intervalo de tempo, espao, etc. Imagine que voc queira estudar o nmero de suicdios ocorridos em uma cidade durante um ano ou o nmero de acidentes automobilsticos ocorridos numa rodovia em um ms, ou o nmero de defeitos encontrados em

59

Curso de Graduao em Administrao a Distncia

um rolo de arame ovalado de 500 m. Estas situaes so exemplos que se enquadram na distribuio de Poisson. Note que, nos exemplos acima, no h como voc determinar a probabilidade de ocorrncia de um sucesso, mas sim a freqncia mdia de sua ocorrncia, como por exemplo, dois suicdios por ano, que denominaremos . Em uma situao com estas caractersticas, a varivel aleatria X = nmero de sucessos em um intervalo contnuo ter uma distribuio Poisson, com (freqncia mdia de sucesso). Simbolicamente, podemos utilizar a notao X ~ P().

A varivel aleatria x tem uma distribuio de Poisson com uma freqncia mdia de sucesso .

A funo de probabilidade da distribuio de Poisson ser dada por meio da seguinte expresso:

Onde e =2,7182 (base dos logaritmos neperianos) e corresponde freqncia mdia de sucesso no intervalo contnuo em que se deseja calcular a probabilidade. Vamos considerar que o Corpo de Bombeiros de uma determinada cidade recebe, em mdia, trs chamadas por dia. Queremos saber, ento, qual a probabilidade de do Corpo de Bombeiros receber: a) quatro chamadas num dia: Como o intervalo em que se deseja calcular a probabilidade um dia, ento, o ser igual a 3. X~P(3)

b) nenhuma chamada em um dia:

60

Mdulo 4

c) 20 chamadas em uma semana: = 21 chamadas por semana Como o intervalo desejado uma semana, ou seja, sete dias, ento, em uma semana a freqncia mdia de chamadas ser de sete dias vezes 3 chamadas/dia.

Uma caracterstica da distribuio de Poisson que as estatsticas da distribuio (mdia e varincia) apresentam o mesmo valor, ou seja, so iguais a . Ento, teremos: Mdia = Varincia = Vamos fazer alguns exerccios relativos distribuio binomial e de Poisson. Exerccio 7: no Brasil, a proporo de microempresas que fecham em at um ano de 10%. Em uma amostra aleatria de 20 microempresas, qual a probabilidade de cinco terem fechado em at um ano de criao? R: P(X = 5) = = 0,03192

Exerccio 8: entre 2.000 famlias de baixa renda, com quatro crianas e considerando que a chance de nascer uma criana do sexo masculino igual do sexo feminino, em quantas famlias se esperaria que tivessem: n=4ep= a) dois meninos? R: P(x=2) . 2.000 = 0,3750 . 2.000 = 750 famlias. b) Um ou dois meninos? R: [P(1) + P(2)] . 2.000 = (0,25 + 0,375) . 2.000 = 1.250 famlias. c) Nenhum menino? R: P(0) . 2.000 = 0,0625 . 2.000 = 125 famlias.

61

Curso de Graduao em Administrao a Distncia

Exerccio 9: a probabilidade de compra de um aparelho de celular igual a 30%. Observando oito compradores, qual a probabilidade de quatro deles comprarem este aparelho? R: P(X = 4) = = 0,13614

Exerccio 10: chegam caminhes a um depsito razo de 2,8 caminhes/hora, segundo uma distribuio de Poisson. Determine a probabilidade de chegarem dois ou mais caminhes: a) num perodo de 30 minutos; b) num perodo de 1 hora; e c) num perodo de 2 horas. R: 1- [P(0) + P(1)] a) = 1,4 b) = 2,8 c) = 5,6 R= 0,40817 R=0,76892 R=0,97559

Distribuies de Probabilidade Contnuas


Dentre as vrias distribuies de probabilidade contnuas, ser abordada aqui apenas a distribuio normal, pois apresenta grande aplicao em pesquisas cientficas e tecnolgicas. Grande parte das variveis contnuas de interesse prtico segue esta distribuio, aliada ao Teorema do Limite Central (TLC), que a base das estimativas e dos testes de hipteses, realizados sobre a mdia de uma populao qualquer, e garante que a distribuio amostral das mdias segue uma distribuio normal, independentemente da distribuio da varivel em estudo, como ser visto mais adiante.

62

Mdulo 4

A funo densidade de probabilidade da distribuio normal dada por:

onde e so a mdia e desvio-padro, respectivamente, da distribuio de probabilidade e corresponde a 3,1415 e exp a uma funo exponencial. O grfico da distribuio normal, utilizando a funo mostrada anteriormente, e os conceitos vistos no mdulo de Matemtica, so dados por:

Voc encontrar a seguir as principais propriedades da distribuio normal. 1) simtrica em relao ao ponto x = (50% abaixo e 50% acima da mdia). 2) Tem forma campanular (sino). 3) As trs medidas de posio, mdia, mediana e moda se confundem no ponto de mximo da curva (x = ). 4) Fica perfeitamente definida conhecendo-se a mdia e o desvio-padro, pois outros termos da funo so constantes. 5) Tem dois pontos de inflexo em x = .

63

Curso de Graduao em Administrao a Distncia

6) assinttica em relao ao eixo das abscissas

7) A rea compreendida entre a curva e eixo x igual a 1 .

Condio para ser uma funo densidade de probabilidade.

Portanto, a rea sob a curva entre os pontos a e b, em que a < b, representa a probabilidade da varivel X assumir um valor entre a e b.

Conceitos vistos em Matemtica e em variveis aleatrias.

Deste modo, a probabilidade de um ponto qualquer nula:

A notao utilizada para a distribuio normal ser a apresentada a seguir: A varivel X tem distribuio normal com mdia m e desvio s. X~N(,)

Verifica-se que a probabilidade em um ponto zero, pois de um ponto a ele mesmo no existe rea, e como nas distribuies contnuas a rea entre a funo e o eixo das abscissas corresponde probabilidade.

Como voc pode notar, o clculo de probabilidades via distribuio normal envolve a soluo de integrais que no so nada triviais. Em virtude da grande aplicao da distribuio normal, procurouse tabelar os valores de probabilidade, que seriam obtidos por meio da

64

Mdulo 4

integrao da funo densidade de probabilidade normal num determinado intervalo. A dificuldade para processar esse tabelamento se prendeu na infinidade de valores que (mdia) e (desvio padro) poderiam assumir. Nestas condies, teria que se dispor de uma tabela para cada uma das infinitas combinaes de e , ou seja, em cada situao que se quisesse calcular uma probabilidade. Para resolver este problema, podemos obter uma nova forma para a distribuio normal, que no seja influenciada por e . O problema foi solucionado mediante o emprego de uma nova varivel, definida por , que transforma todas as distribuies normais em uma

distribuio normal reduzida, ou padronizada, de mdia zero e desvio-padro um, z ~ N(0,1). Assim, utilizamos apenas uma tabela para o clculo de probabilidades, para qualquer que seja a curva correspondente a uma distribuio normal. Portanto, para um valor de x = numa distribuio normal qualquer, corresponde o valor: , na distribuio normal reduzida. Para x = + , tem-se , e assim por diante. Ento, podemos definir a distribuio normal reduzida ou padronizada como sendo uma distribuio da varivel Z que apresenta distribuio normal com mdia zero e varincia um (Z ~ N (0;1)). A Figura da distribuio normal padronizada apresentada a seguir:

65

Curso de Graduao em Administrao a Distncia

Figura 5: rea sob a curva normal padronizada compreendida entre os valores 0 e Z Fonte: elaborado pelos autores

Veja que na tabela da distribuio normal, os valores apresentados na primeira coluna correspondem parte inteira e decimal do valor de Z, enquanto os valores da primeira linha correspondem parte centesimal. J os valores encontrados no meio da tabela correspondem s probabilidades dos respectivos valores compreendidos entre zero e Z.
66

Mdulo 4

Para que voc possa entender a utilizao da distribuio normal, vamos considerar a situao em que se estudou a durabilidade de um certo tipo de pneu. Verificou-se que esta durabilidade seguia uma distribuio normal com durao mdia 60.000 km e desvio-padro 10.000 km. Procurou-se, ento, responder os seguintes questionamentos: a) Qual a probabilidade de um pneu aleatoriamente escolhido durar mais de 75.000 km? X~ N(60000;100002) e procura-se calcular a P(X > 75000) = ? Olhando este valor na tabela de z, encontraremos no meio da tabela o valor de 0,4332, que corresponde probabilidade de z estar entre zero e 1,5. Retirou-se a probabilidade encontrada de 0,5, pois este valor corresponde probabilidade de zero at o infinito. Como sugesto, faa o desenho da curva com os valores de x e depois transforme para os valores de z. P(50000 < X < 70000) = P( -1,00 < z < 1,00) = 0,3413 + 0,3413 = 0,6826 c) Qual a probabilidade de um pneu aleatoriamente escolhido durar entre 63.000 e 70.000 km? P(63.000 < X < 70.000) = ?

P(X > 75000) = P(z > 1,50) = 0,5 - P(0 < z < 1,50) = 0,4332 = = 0,5 -0,4332 = 0,0668 b) Qual a probabilidade de um pneu aleatoriamente escolhido durar entre 50.000 e 70.000 km? P(50000 < X < 70000) = ?

67

Curso de Graduao em Administrao a Distncia

P(63000 < X < 70000) = P( 0,30 < z < 1,00) = 0,3413 + 0,1179 = 0,2234 d) Qual a probabilidade de um pneu aleatoriamente escolhido durar exatamente 70.000 km? P (X = 70000) = 0 e) O fabricante deseja fixar prazo de garantia, em quilmetros, de tal modo que, se a durao do pneu for inferior garantia, o pneu seja trocado. De quantos quilmetros deve ser este prazo, para que somente 1% dos pneus sejam trocados? x // P(X < x ) = 0,01 ==> z // P(Z < z) = 0,01 z = -2,33

Resolva a seguir os exerccios relativos distribuio normal e confira os resultados no final do livro. Exerccio 11: as rendas mensais dos graduados em um curso de especializao em uma grande empresa so normalmente distribudas com uma mdia de R$ 2.000 e um desvio-padro de R$ 200. Qual o valor de Z para uma renda X de R$ 2.200? R$ 1.700?

68

Mdulo 4

Exerccio 12: o uso dirio de gua por pessoa em uma determinada cidade normalmente distribudo com mdia igual a 20 litros e desvio-padro igual a 5 litros. a) Que percentagem da populao usa entre 20 e 24 litros por dia? b) Que percentagem usa entre 16 e 20 litros? c) Qual a probabilidade de que uma pessoa selecionada ao acaso use mais do que 28 litros? Exerccio 13: um consultor verificou que as mdias obtidas em uma avaliao aps um treinamento tem distribuio normal com uma mdia igual a 72 e desvio-padro 5. Ele decide atribuir conceitos para o seu treinamento tal que os melhores 15 % recebem conceito A. Qual a mdia mnima que o funcionrio submetido ao treinamento precisa receber para obter um conceito A?

Saiba mais...
Mais exerccios referentes ao assunto esto no site: http://www.famat.ufu.br/prof/marcelo/exercicios.htm

69

3
Amostragem Amostragem

UNIDADE

Curso de Graduao em Administrao a Distncia

72

Mdulo 4

Amostragem

A amostragem (processo de retirada de amostras de uma populao) uma das etapas fundamentais na tomada de decises nos diversos nveis gerenciais, pois uma amostragem mal executada, com certeza, resultar em estatsticas pouco confiveis e em uma tomada de deciso possivelmente imprecisa. Esta Unidade tem como objetivo apresentar a voc alguns conceitos e definies essenciais para conduzir convenientemente uma operao de amostragem, visando principalmente coleta de dados socioeconmicos. No so contemplados todos os aspectos referentes da amostragem, como por exemplo, o aspecto terico das vrias tcnicas disponveis. Voc ver os aspectos mais importantes da amostragem e de maior aplicabilidade dentro das vrias reas da Administrao. Primeiramente, torna-se necessrio definirmos populao e amostra. Se considerarmos todos os atuais clientes de uma empresa da rea de telefonia, podemos considerar estas pessoas como sendo a populao* que caracteriza os clientes da empresa de telefonia, pois a populao apresenta caractersticas em comum, sendo, neste caso, o fato de utilizarem esta empresa de telefonia. Se quisermos utilizar uma parte desta populao, que apresente as mesmas caractersticas daquela teremos uma amostra, ou seja, uma poro ou frao da populao que preserva todas as caractersticas importantes dos elementos que a integram. Se considerarmos esta populao de clientes, voc pode determinar o tempo mdio em que o cliente fica utilizando no dia o aparelho de telefone fixo (mdia populacional (), que corresponde geralmente a um valor desconhecido, chamado de parmetro*. Como voc no vai medir toda a populao, podemos obter uma amostra que represente esta populao, e estudando a amostra, voc ter condies de calcular a mdia amostral (x), que corresponde ao estimador*, e o resultado obtido (valor numrico) corresponder estimativa.

GLOSSRIO *Populao o conjunto de elementos que apresentam uma ou mais caractersticas em comum. *Parmetro um valor desconhecido associado a uma caracterstica da populao. *Estimador uma funo (frmula) que permite estimar o valor de um parmetro (estimativa), baseando-se nas observaes de uma amostra.

73

Curso de Graduao em Administrao a Distncia

A amostragem o estudo das relaes existentes entre a amostra, a populao de onde ela foi extrada e a forma como ocorre esta extrao. til na avaliao de grandezas desconhecidas da populao, freqentemente denominadas parmetros, com base no conhecimento de grandezas correspondentes das amostras, geralmente chamadas estimativas ou estatsticas (Teoria da Estimao). Tambm auxilia na verificao de diferenas observadas entre duas ou mais amostras (tratamentos), para voc saber se estas diferenas so devidas a uma variao casual ou se so verdadeiramente relacionadas aos efeitos de tratamentos (Teoria da Deciso). Portanto, a amostragem tem por objetivo principal determinar meios e mtodos para estudar as populaes atravs de amostras. Observe que, quando obtemos informaes a partir das amostras e tentamos atingir as populaes, estamos realizando uma inferncia. Em resumo, podemos dizer que amostra um subconjunto da populao, necessariamente finito, pois todos os seus elementos sero examinados para efeito da realizao do estudo estatstico desejado. Se considerarmos, nesta populao de clientes, o tempo de utilizao diria do telefone fixo, teremos uma varivel aleatria, cuja mdia populacional corresponde ao parmetro mdia do tempo de utilizao diria do telefone fixo de todos os clientes atuais da empresa telefnica. Em geral, a populao muito grande, e a mdia populacional estimada por meio de uma amostra retirada desta populao, pelo clculo da mdia amostral x, que corresponde ao estimador, e o resultado obtido (valor numrico) corresponder estimativa. O problema de estimao de parmetros um dos importantes tpicos da estatstica inferencial e ser estudado posteriormente. A utilizao da amostragem ocorre, geralmente, quando queremos avaliar populaes muito grandes ou infinitas. As principais vantagens da utilizao do estudo por amostras representativas (aquelas que mantm as caractersticas da populao de onde a amostra foi retirada) em relao ao censo (avaliao de toda a populao) so:

74

Mdulo 4

ocorre uma reduo no custo, pois sendo os dados obtidos apenas de uma frao da populao, as despesas so menores do que as oriundas de um censo. Tratando-se de grandes populaes, podem-se obter resultados suficientemente precisos, para serem teis, de amostras que representam apenas uma pequena frao da populao; na prtica ou no dia-a-dia das organizaes, necessrio que os resultados sejam obtidos com a maior rapidez possvel. Portanto, com a amostragem, voc pode apurar os dados e sintetiz-los mais rapidamente do que em uma contagem completa. Este um fator primordial, quando se necessita urgentemente das informaes. Se o resultado de uma pesquisa for conhecido muito tempo depois, bem possvel que a situao que voc pretendia resolver, seja, nesse momento, completamente diferente da que existia no momento da coleta dos dados; outra vantagem corresponde a uma maior amplitude e flexibilidade. Em certos tipos de investigao, como pesquisas de mercado, tem-se que utilizar pessoal bem treinado e equipamento altamente especializado, cuja disponibilidade limitada para a obteno de dados. O censo completo torna-se impraticvel, e resta a escolha em obter as informaes por meio de uma amostra. Portanto, com um nmero reduzido de entrevistadores, por exemplo, o treinamento a ser aplicado neles de qualidade muito maior do que em um grupo maior de entrevistadores; e a ltima vantagem a ser citada aqui a maior exatido dos resultados. Em virtude de se poder empregar pessoal de melhor qualidade e intensivamente treinado, e por se tornar exeqvel a superviso mais cuidadosa do campo de trabalho e do processamento de dados, favorecendo a uma reduo no volume de trabalho, portanto, uma amostragem pode, na realidade, proporcionar resultados mais exatos do que o censo. Desta forma, podemos dizer que as amostras a serem trabalhadas devem apresentar uma caracterstica importante, que corresponde representatividade* . Para que as concluses da teoria de amostragem sejam vlidas, as amostras devem ser escolhidas de modo

GLOSSRIO *Representatividade corresponde possibilidade de manter as mesmas caractersticas presentes na populao.

75

Curso de Graduao em Administrao a Distncia

a serem representativas da populao. Isso significa que a amostra deve possuir as mesmas caractersticas bsicas da populao, no que diz respeito (s) varivel(eis) que desejamos estudar. Desta forma, o plano de amostragem deve ser formulado para garantir esta representatividade.

Com um plano amostral apropriado, voc considera que seja possvel garantir a representatividade da amostra devido a um erro amostral? Reflita em uma situao.

Uma vez tendo decidido realizar a pesquisa selecionando uma amostra da populao, preciso elaborar o plano de amostragem. O plano de amostragem consiste em definir as unidades amostrais*, maneira pela qual a amostra ser retirada (o tipo de amostragem), e o prprio tamanho da amostra. Estas unidades amostrais podem corresponder aos prprios elementos da populao, quando h acesso direto a eles, ou qualquer outra unidade que possibilite chegar at eles. Voc pode considerar como populao os domiclios de uma cidade e que se deseje avaliar o perfil socioeconmico. A unidade amostral ser cada um dos domiclios, que corresponder aos elementos da populao. Caso a unidade amostral for definida como os quarteires, a unidade amostral no corresponder aos elementos populacionais. Podemos ter dois tipos de amostragem, as probabilsticas e as no probabilsticas, as quais sero definidas a seguir. Amostragem probabilstica: quando todos os elementos da populao tiveram uma probabilidade conhecida e diferente de zero de pertencer amostra (ex: 50 funcionrios em uma atividade de treinamento, e voc deve selecionar dez funcionrios). A realizao deste tipo de amostragem s possvel se a populao for finita e totalmente acessvel. Amostragem no probabilstica: quando no se conhece a probabilidade de um elemento da populao pertencer amos76

GLOSSRIO *Unidades amostrais correspondem s unidades selecionadas na amostragem para calcular as estatsticas.

Mdulo 4

tra. Por exemplo, quando somos obrigados a colher a amostra na parte da populao a que temos acesso. Voc pode notar que a utilizao de uma amostra probabilstica melhor para garantir a representatividade da amostra, pois o acaso ser o nico responsvel por eventuais discrepncias entre populao e amostra. Estas discrepncias so levadas em considerao nas inferncias estatsticas. Os principais esquemas amostrais so apresentados a seguir.

Amostragem aleatria (casual) simples


Voc deve utilizar a amostragem aleatria simples somente quando a populao for homognea em relao varivel que se deseja estudar. Geralmente, atribumos uma numerao a cada indivduo da populao, e atravs de um sorteio aleatrio os elementos que vo compor a amostra so selecionados. Todos os elementos da populao tm a mesma probabilidade de pertencer amostra. Imagine que voc queira amostrar um nmero de pessoas que esto fazendo um determinado concurso com n inscritos. Como a populao finita, devemos enumerar cada um dos n candidatos e sortear n deles.

Pode ser feito por meio da gerao de um nmero aleatrio.

77

Curso de Graduao em Administrao a Distncia

Amostragem sistemtica
Em algumas situaes, conveniente retirar da populao os elementos que vo compor a amostra de forma cclica (em perodos), por exemplo, quando os elementos da populao se apresentam ordenados. Porm, de fundamental importncia que a varivel de interesse no apresente ciclos de variao coincidente com os ciclos de retirada, pois este fato tornar a amostragem no aleatria. Esta tcnica de amostragem se chama amostragem sistemtica. Para podermos entender melhor, vamos imaginar que voc queira retirar uma amostra de currculos apresentados para um processo seletivo, e a varivel de interesse corresponde idade dos candidatos. Pode ocorrer que pessoas de uma determinada faixa etria deixem para entregar o currculo no ltimo dia. Ento, se pegssemos os currculos de forma aleatria, poderamos estar subestimando ou superestimando a idade mdia. Nesta situao foram recebidos 500 currculos ordenados por ordem alfabtica. Deseja-se amostrar 50 currculos para estimar a idade mdia dos candidatos. Ser utilizada a tcnica de amostragem sistemtica, supondo que as idades estejam aleatoriamente distribudas na populao, ou seja, sem qualquer ciclo de repetio. Primeiramente, deve-se enumerar a populao de 1 a 500 e calcular uma constante (K) que servir como fator de ciclo para retirada dos currculos amostrados. Ento, podemos dividir os 500 currculos pelo tamanho da amostra (50) que se deseja trabalhar. Teremos uma constante igual a 10, e os elementos sero amostrados a cada dez elementos. Generalizando, ento, teremos que a constante (K) ser dado por K= N/n, onde N o tamanho da populao, e n, o tamanho da amostra. Aps a definio do valor de K, sorteia-se o ponto inicial da amostragem, ou seja, um dos elementos do primeiro intervalo constitudo pelos elementos populacionais numerados de 1 at 10. Escolhese o seguinte, que ser o elemento de ordem (i + K); e assim por diante, sempre somando-se K ordem do elemento anterior, at completar a escolha dos n elementos que vo compor a amostra. Um esquema apresentado a seguir.

78

Mdulo 4

Para fixar os conceitos de amostragem sistemtica, faa um esquema de amostragem para saber a opinio dos usurios de um banco em relao ao tempo de atendimento.

O banco possui uma listagem de 33.400 clientes em uma determinada cidade. A pesquisa ser feita por telefone, utilizando uma estrutura de call center. Deseja-se trabalhar com uma amostra de 300 clientes. Como seria organizada a amostragem sistemtica?

Amostragem Estratificada
Quando a varivel de interesse apresenta uma heterogeneidade na populao e esta heterogeneidade permite a identificao de grupos homogneos, voc pode dividir a populao em grupos (estratos) e fazer uma amostragem dentro de cada estrato, garantindo, assim, a representatividade de cada estrato na amostra. Podemos verificar que pesquisas eleitorais apresentam uma grande heterogeneidade em relao inteno de votos, quando consideramos, por exemplo, a faixa salarial ou o nvel de escolaridade. Ento, se fizssemos uma amostragem aleatria simples, poderamos incluir na amostra uma maior quantidade de elementos de um grupo, e, proporcionalmente, este grupo pequeno em relao populao. Desta forma, no teramos uma amostra representativa da populao a ser estudada. Ento, podemos dividir a populao em grupos (estratos) que so homogneos para a caracterstica que estamos avaliando, ou seja, neste caso, a inteno de votos.

79

Curso de Graduao em Administrao a Distncia

Como estamos dividindo a populao em estratos (grupos) que so homogneos dentro de si, podemos, ento, caracterizar a amostragem estratificada. Para efetuarmos a amostragem estratificada de forma proporcional, precisamos primeiramente definir a proporo do estrato em relao populao.

Proporo do estrato h ser igual ao nmero de elementos presentes neste estrato (Nh) dividido pelo tamanho da populao (N) (Nh/N). Aps voc obter esta proporo do estrato em relao populao, deve-se multiplicar o tamanho total da amostra (n) pela proporo de cada estrato na populao (Nh/N). Assim, teremos um tamanho de amostra em cada estrato, proporcional ao tamanho do estrato em relao populao.

A Figura 11 mostra como feita a escolha dos elementos de cada estrato (A, B, C, D) que voc pode fazer usando amostragem aleatria simples devido ao fato de os estratos serem homogneos individualmente, considerando a varivel de interesse.

80

Mdulo 4

Para que voc possa fixar os conceitos de amostragem estratificada, resolva a seguinte situao. Exerccio 1: uma franquia de fast food com foco em sanduches, apresenta lojas em todo o mundo. Para fazer uma pesquisa de satisfao dos clientes, dividiu-se a populao de lojas em trs estratos (pases desenvolvidos, pases em desenvolvimento e pases do grupo asitico). Pretende-se trabalhar com uma amostra de tamanho n = 200. Com as informaes a seguir, faa o esquema de uma amostragem estratificada.
Estratos
Pases desenvolvidos Pases em desenvolvimento Pases do grupo asitico

Tamanho do estrato (no de lojas)


N1 = 700 N2 = 420 N3 = 270

Amostragem por conglomerados


Apesar de a amostragem estratificada apresentar resultados satisfatrios, a sua implementao dificultada pela falta de informaes sobre a populao para fazer a estratificao. Para poder contornar este problema, voc pode trabalhar com o esquema de amostragem chamado amostragem por conglomerados. Os conglomerados so definidos em funo da experincia do gestor ou pesquisador. Geralmente, podemos definir os conglomerados por fatores geogrficos, como por exemplo, bairros e quarteires. A utilizao da amostragem por conglomerados possibilita uma reduo significativa do custo do processo de amostragem. Portanto, um conglomerado um subgrupo da populao, que individualmente reproduz a populao, ou seja, individualmente os elementos que o compem so muito heterogneos entre si. Este tipo de amostragem muito til quando a populao grande, por exemplo, no caso de uma pesquisa em nvel nacional. Para efetuarmos a amostragem por conglomerados, primeiramente definimos o conglomerado e assim dividimos a populao nos con81

Curso de Graduao em Administrao a Distncia

glomerados. Sorteamos os conglomerados por meio de um processo aleatrio e avaliamos todos os indivduos presentes no conglomerado, que chamado de amostragem por conglomerados em um estgio. Caso faamos um sorteio de elementos dentro de cada conglomerado, teremos uma amostragem por conglomerados em dois estgios. Segue abaixo o esquema de uma amostragem por conglomerados em um nico estgio. Cada quadrado corresponde a uma residncia.

A Pesquisa Nacional por Amostra de Domiclios (PNAD) do IBGE feita por conglomerados em trs estgios.

Saiba mais...
Sobre a Pesquisa Nacional por Amostra de Domiclios (PNAD), consulte o site www.ibge.com.br.

82

Mdulo 4

O clculo do tamanho amostral ser visto em conjunto com a parte de intervalos de confiana.

Amostragem No Probabilstica
Quando trabalhamos com a amostragem no probabilstica, no conhecemos a priori a probabilidade que um elemento da populao tem de pertencer amostra. Neste caso, no possvel calcular o erro decorrente da generalizao dos resultados das anlises estatsticas da amostra para a populao de onde a amostra foi retirada. Utilizamos, geralmente, a amostragem no probabilstica por simplicidade ou por impossibilidade de se obter uma amostra probabilstica, como seria desejvel. Os principais tipos de amostragem no probabilstica que temos so amostragem sem norma ou a esmo, intencional e por cotas.

Amostragem a esmo
Imagine uma caixa com 1.000 parafusos. A enumerao destes parafusos ficaria muito difcil, e a amostragem aleatria simples se torna invivel. Ento, em situaes deste tipo, supondo que a populao de parafusos seja homognea, escolhemos a esmo a quantidade relativa ao tamanho da amostra. Quanto mais homognea for a populao, mais podemos supor a equivalncia com uma AAS. Desta forma, os parafusos sero escolhidos para compor a amostra de um determinado tamanho sem nenhuma norma ou a esmo. Da vem o nome deste tipo de amostragem.

Amostragem intencional
A amostragem intencional corresponde quela em que o amostrador deliberadamente escolhe certos elementos para pertencer amostra, por julgar tais elementos bem representativos da populao. Um exemplo deste tipo de amostragem corresponde situao em que se deseja saber a aceitao em relao a uma nova marca de whisky a ser inserida no mercado de uma cidade. Somente entraro para compor a amostra pessoas que faam uso da bebida e que tenham
83

Curso de Graduao em Administrao a Distncia

condies financeiras de comprar esta nova marca (classe social de maior poder aquisitivo).

Amostragem por cotas


Neste tipo de amostragem, a populao dividida em grupos, e seleciona-se uma cota proporcional ao tamanho de cada grupo. Entretanto, dentro de cada grupo no feito sorteio, e sim os elementos so procurados at que a cota de cada grupo seja cumprida. Em pesquisas eleitorais, a diviso de uma populao em grupos (considerando, por exemplo, o sexo, o nvel de escolaridade, a faixa etria e a renda) pode servir de base para a definio dos grupos, partindo da suposio de que estas variveis definem grupos com comportamentos diferenciados no processo eleitoral. Para se ter uma idia do tamanho destes grupos, pode-se recorrer a pesquisas feitas anteriormente pelo IBGE (Instituto Brasileiro de Geografia e Estatstica).

Distribuies amostrais
Com as distribuies amostrais, voc pode inferir propriedades de um agregado maior (a populao) a partir de um conjunto menor (a amostra), ou seja, inferir sobre parmetros populacionais, dispondo apenas de estatsticas amostrais. Portanto, torna-se necessrio um estudo detalhado das distribuies amostrais, que so base para intervalos de confiana e testes de hipteses. Portanto, para que voc tenha condies de fazer afirmaes sobre um determinado parmetro populacional (ex: ), baseadas na estimativa x, obtido a partir dos dados amostrais, necessrio conhecer a relao existente entre x e , isto , o comportamento de x, quando se extraem todas as amostras possveis da populao, ou seja, sua distribuio amostral. Para obtermos a distribuio amostral de um estimador, necessrio conhecer o processo pelo qual as amostras foram retiradas, isto , se amostras foram retiradas com reposio ou sem reposio.

84

Mdulo 4

Portanto, a partir do comportamento da estatstica amostral, podese aplicar um teorema muito conhecido na estatstica como Teorema do Limite Central. Este teorema prope que, se retirarmos todas as possveis amostras de tamanho n de uma populao independente de sua distribuio, e verificarmos como as estatsticas amostrais obtidas se distribuem, teremos uma distribuio aproximadamente normal, com (mdia das mdias amostrais igual mdia populacional) e varincia das mdias (varincia das mdias mostrais

igual varincia da populao dividida pelo tamanho da amostra) , se a amostragem for realizada com reposio, ou , se a amostragem for realizada sem reposio em uma populao finita ( > 0,05), independentemente da distribui-

o da varivel em questo. Portanto, considerando a distribuio amostral de mdias, quando se conhece a varincia ou a amostra grande (n > 30), utilizamos a estatstica z da distribuio normal vista anteriormente, independente da distribuio da populao. Ento, por meio do teorema do limite central, a estatstica ser dada por: .

Para saber mais


Considere uma populao formada pelos nmeros {1 , 2, 3}. Sabemos que esta populao apresenta = 2 e varincia 2 = 2/3. Retire todas as amostras possveis com n=2, fazendo com e sem reposio e calcule a mdia das mdias amostrais (2 ) e a varincia das mdias amostrais ( ). Compare com os resultados da populao e veja se o teorema verdadeiro. Pesquise este problema em sites

da internet ou outros livros de Estatstica. Porm, ocorre que, na prtica, muitas 2 das vezes no se conhece e trabalha-se com amostras pequenas, ou seja, menores ou iguais a 30. Assim, voc conhece apenas sua estimativa s (desvio-padro amostral). Substituindo por seu estimador s, na expresso da varivel padronizada, obtm-se a varivel:

( expresso semelhante a Z)

85

Curso de Graduao em Administrao a Distncia

Corresponde ao divisor do clculo da varincia amostral, ou seja, n - 1. Nmero de variveis na amostra que variam livremente, na definio da Estatstica.

a qual segue uma distribuio t de Student com (n-1) graus de liberdade. A distribuio t apresenta as seguintes caractersticas: simtrica em relao mdia, que zero; tem forma campanular (semelhante normal); quando n tende para infinito, a distribuio t tende para a distribuio normal, na prtica, a aproximao considerada boa quando n >30; e possui n-1 graus de liberdade. Vamos aprender a utilizar a Tabela da distribuio de t de Student. Na Tabela t de Student, na primeira linha temos o valor de , que corresponde probabilidade (rea) acima de um determinado valor da tabela. Na figura a seguir, temos o conceito de (rea mais escura).

Observe que na Tabela de t (a seguir), temos na primeira coluna os graus de liberdade (GL) e no centro da tabela, teremos os valores da estatstica t de Student. Na primeira linha temos os valores de .

86

Mdulo 4

Tabela 8: Limites unilaterais da distribuio t de Student ao nvel de probabilidade Fonte: www.dpi.inpe.br/~camilo/estatistica/06estimao.ppt

Para exemplificar o uso da tabela, consideremos que desejamos encontrar a probabilidade de ser maior do que um valor de t igual a 2,764, trabalhando com uma amostra de tamanho n = 11. Portanto, teremos 10 graus de liberdade e nesta linha procuramos o valor que desejamos encontrar, 2,764. Subindo na Tabela em direo ao encontraremos um valor de 0,01 na primeira linha, ou seja, esta a probabilidade de ser maior do que 2,764, com 10 graus de liberdade.

87

Curso de Graduao em Administrao a Distncia

Retirando-se uma amostra de n elementos de uma populao normal com mdia e varincia 2, ento, pode-se demonstrar que a distribuio amostral da varincia amostral segue uma distribuio de 2 (qui-quadrado) com n-1 graus de liberdade. A varivel da estatstica de qui-quadrado ser dada por: tem distribuio 2 com n-1 graus de liberdade. Esta distribuio sempre positiva, o que pode ser comprovado pela prpria definio da varivel. Esta distribuio assimtrica, como pode ser visto no grfico da distribuio mostrado a seguir.

No esquema a seguir, temos como feita a utilizao da distribuio de qui-quadrado com g graus de liberdade.

Fonte: www.dpi.inpe.br/~camilo/estatistica/06estimao.ppt

88

Mdulo 4

A distribuio de F de Snedecor corresponde distribuio da razo de duas varincias. Temos, ento, duas populaes que apresentam varincias populacionais e delas so retiradas amostras, nas quais so calculadas varincias amostrais. A relao entre essas varincias que nos d a distribuio de F. A estatstica da distribuio apresentada a seguir:

segue uma distribuio F com g1 = n1 -1 e g2 = n2 -1 graus de liberdade para o numerador e denominador respectivamente. A utilizao da Tabela apresentada a seguir:

Fonte: www.dpi.inpe.br/~camilo/estatistica/06estimao.ppt

Nota-se que, no caso da tabela de F, o valor de que corresponde rea extrema direita da curva, apresentado no ttulo da tabela, pois para cada valor de temos uma tabela diferente. Uma aplicao prtica da distribuio de F est na verificao da homogeneidade das varincias provenientes de duas populaes normais e independentes. A seguir, so apresentados exerccios, que possibilitam o treino de utilizao das tabelas de t, 2 e F. Como sugesto, sempre faa o desenho da curva para melhor entender como utilizar a tabela.
89

Curso de Graduao em Administrao a Distncia

Exerccio 2: obter os seguintes valores da distribuio t de Student: a) P (-2,160 < t < a) = 0,95 com 13 g.l; b) P (a < t < 1,708) = 0,90 com 25 g.l; c) P (t > a) = 0,05 com 20 g.l. Exerccio 3: obter os seguintes valores da distribuio de 2: a) P (2 > a) = 0,025 com 21 g.l; b) P (2 < a) = 0,025 com 21 g.l; c) P( 2 > a) = 0,95 com 15 g. l. Exerccio 4: obter os seguintes valores da distribuio F de Snedecor: a) P(F > a) = 0,10 com g1 = 5 e g 2 = 25 g.l; b) P(F < a) = 0,90 com n1 = 6 e n2 = 26 g.l; c) P(F > a) = 0,05 com g1 = 13 e g2 = 29 g.l.

Estimao
Um dos principais objetivos da estatstica inferencial consiste em estimar os valores de parmetros populacionais desconhecidos (estimao de parmetros) utilizando dados amostrais. Ento, qualquer caracterstica de uma populao pode ser estimada a partir de uma amostra aleatria, desde que esta amostra represente bem a populao. Os parmetros populacionais mais comuns a serem estimados so a mdia, o desvio-padro e a proporo. A estatstica inferencial apresenta uma relevncia alta, j que na maioria das decises que um gestor ou pesquisador deve tomar, esto associadas utilizao de dados amostrais. Consiste em tirar concluses de uma populao a partir de amostra representativa dela, tendo uma grande importncia em muitas reas do conhecimento.

90

Mdulo 4

A partir de uma amostra de 800 clientes (escolhidos aleatoriamente entre todos os clientes que abasteceram na primeira quinzena de um determinado ms) de um posto de gasolina que possuem carros populares, verificou-se que o consumo mdio de gasolina foi de R$ 200,00 por quinzena.

Reflita sobre a afirmao abaixo: Ento, podemos inferir que o consumo mdio da populao de clientes da primeira quinzena do ms em estudo, proprietrios de carros populares que abastecem neste posto de gasolina de R$ 200,00.

Esta uma estimativa que chamamos de pontual, ou seja, inferimos sobre a populao, considerando apenas o valor da estimativa. Essas estimativas por ponto no nos do uma idia sobre confiana e as margens de erro que deveriam ser aplicadas ao resultado. Tudo que ns sabemos, por exemplo, que o consumo mdio de gasolina foi estimado como R$ 200,00 por quinzena, independente do tamanho da amostra e da variabilidade inerente dos dados. Se fosse usado um tamanho grande de amostra e houvesse pouca variabilidade, teramos grandes razes para acreditar no resultado. Mas no sabemos nada, se tivermos apenas uma estimativa por ponto. No entanto, podemos estimar ou fazer inferncias sobre os valores da populao usando uma segunda abordagem, chamada estimativas por intervalos ou intervalos de confiana, que do o intervalo dentro do qual se espera que esteja o valor da populao, com uma dada probabilidade ou um nvel de confiana. Neste caso, poderamos inferir, por exemplo, que o consumo de carros populares que abastecem no posto de gasolina est no intervalo de R$ 180,00 a R$ 220,00, e ainda afirmamos isto com, por exemplo, uma certeza de 95%.

91

Curso de Graduao em Administrao a Distncia

Em resumo, podemos dizer que a estimativa pontual fornece uma estimativa nica de um parmetro e que a estimativa intervalar nos d um intervalo de valores possveis, no qual se admite que esteja o parmetro populacional com uma probabilidade conhecida.

Como a estimativa por intervalos nos fornece uma informao mais precisa em relao ao parmetro, esta a melhor forma de estimar o parmetro populacional. Ento, para voc estimar parmetros populacionais por meio de dados amostrais, necessrio o conhecimento da distribuio amostral da estatstica que est sendo usada como estimador (visto anteriormente). Considere que, em uma loja em um shopping, voc coletou uma amostra de clientes do ms anterior e verificou que eles apresentavam uma idade mdia de 24,2 anos. Surge, ento, uma pergunta: este valor encontrado est prximo da mdia da populao de clientes do ms anterior? A distribuio da mdia amostral, segundo o teorema central do limite apresenta uma distribuio aproximadamente normal (considerando um tamanho amostral suficientemente grande). Pelo que foi visto na Unidade 2 (distribuio normal), se considerarmos uma probabilidade de 99%, teremos que 99% mdias amostrais estaro dentro do intervalo correspondente ao limite inferir de 2,57 desvios-padro abaixo da mdia da varivel, mdia amostral e ao limite superior de 2,57 desvios-padro acima da mdia. Em funo da dificuldade de encontrarmos um valor exato, ento trabalhamos com intervalos de confiana. Podemos concluir que existe uma chance de 1% de que a mdia no esteja dentro deste afastamento da mdia de 2,57 desviospadro, e convertendo este afastamento na unidade dos dados, teremos o chamado intervalo de confiana.

Ento, um intervalo de confiana d um intervalo de valores, centrado na estatstica amostral, no qual julgamos, com um risco conhecido de erro, estar o parmetro da populao.

92

Mdulo 4

Este 1% do exemplo anterior pode ser chamado de nvel de significncia ou , que nos d a medida da incerteza desta inferncia. O geralmente assume valores entre 1 e 10%.

Ento, a partir de informaes de amostras, devemos calcular os limites de um intervalo, valores crticos, que em (1-)% dos casos inclua o valor do parmetro a estimar e em % dos casos no inclua o valor do parmetro, como pode ser visto na Figura.

O nvel de confiana 1 - a probabilidade de o intervalo de confiana conter o parmetro estimado. Em termos de varivel normal padro Z, isto representa a rea central sob a curva normal entre os pontos -Z e Z.

93

Curso de Graduao em Administrao a Distncia

Voc pode observar que a rea total sob a curva normal unitria. Se a rea central 1 -, o ponto -z representa o valor de Z, que deixa sua esquerda a rea /2, e o ponto z representa o valor de Z, que deixa sua direita a rea /2. Vamos ento aprender como construir alguns intervalos de confiana.

Intervalo de confiana para a mdia populacional quando o desvio-padro populacional conhecido.

Vamos imaginar a seguinte situao: o Departamento de Recursos Humanos de uma grande empresa informa que o tempo de execuo de tarefas que envolvem participao manual varia de tarefa para tarefa, mas que o desvio-padro permanece aproximadamente constante, em 3 minutos. Uma nova tarefa est sendo implantada na empresa. Uma amostra aleatria do tempo de execuo de 50 destas novas tarefas forneceu o valor mdio de 15 minutos. Determine um intervalo de confiana de 95% para o tempo mdio de execuo desta nova tarefa. Primeiramente, voc precisa identificar que o desvio-padro populacional conhecido, e tambm a amostra considerada grande (n > 30). Ento, a construo do intervalo de confiana ser feita utilizando a mdia amostral, que aproximadamente normal. Utilizaremos para a obteno dos limites de confiana a curva normal padro Z. Como os limites so dados por meio da estatstica calculada a partir dos dados amostrais e da margem de erro (fornecida pela estatstica da distribuio multiplicada pelo desvio-padro da distribuio amostral), teremos, nesta situao, os limites calculados por meio da seguinte expresso:

94

Mdulo 4

Logo, o intervalo de confiana tem centro na mdia amostral: calculando na nossa situao, teremos: 1 = 0,95 = 0,05 /2 = 0,025 olhando na tabela de Z, voc encontrar Z /2 = 1,96

Interpretao do resultado: em cada grupo de 100 amostras retiradas de 50 clientes, espera-se que em 95 delas a mdia esteja dentro do intervalo de 14,168 a 15,831.

Fator de correo para populao finita


Quando voc estiver trabalhando com um tamanho de amostra que no seja to pequeno em relao ao tamanho da populao, e se a amostragem realizada for sem reposio, necessrio que se faa uma correo na estimativa do erro-padro da distribuio amostral. O fator de correo para populao finita, amostragem sem reposio, dado por: amostra. onde N: tamanho da populao e n: tamanho da

95

Curso de Graduao em Administrao a Distncia

Uma regra prtica para uso da correo dada por meio da relao entre o tamanho da amostra e o tamanho da populao. Ento, se , devemos fazer a correo para populao finita, e tere.

mos o desvio-padro igual a

Esta correo, quando necessria, deve ser utilizada para qualquer distribuio amostral. Resolva agora o exerccio proposto a seguir. Exerccio 5: considere, por exemplo, que as despesas mensais com alimentao das 1.000 cabeas de gado de uma fazenda so normalmente distribudas com desvio-padro de US$ 3,00. Uma amostra de cem bois revelou uma despesa mdia mensal de US$ 27,00. Determine o intervalo de confiana de 90% para a despesa mdia com alimentao dos bois desta fazenda. Desenvolvendo a expresso do erro mostrada anteriormente, teremos o tamanho de amostra para estimao da mdia populacional, quando o desvio-padro populacional conhecido, como mostrado a seguir:

Se voc verificar que a amostragem foi feita sem reposio em uma populao finita, conforme dito anteriormente, devemos utilizar o fator de correo. Imagine a seguinte situao: que tamanho de amostra ser necessrio para produzir um intervalo de 95% de confiana para a verdadeira mdia populacional, com erro de 1,0, se o desvio-padro da populao 10,0?

96

Mdulo 4

Intervalo de confiana para a mdia populacional, quando o desvio-padro populacional no conhecido e a amostra pequena (n < 30)

Nesta situao, no temos uma boa estimativa do desvio-padro populacional, devido ao tamanho reduzido da amostra utilizado (n < 30). A nica diferena em relao ao intervalo de confiana, quando o desvio-padro conhecido ou a amostra grande (apresentado anteriormente), que, no lugar da distribuio normal (Z) vamos trabalhar com a distribuio t de Student. Portanto, a expresso para o intervalo de confiana apresentada a seguir:

Todas as demais consideraes apresentadas anteriormente permanecem, bem como a interpretao do intervalo de confiana. Considere que, para uma dada semana, foi tomada uma amostra aleatria de 28 empregados horistas selecionados de um grande nmero de funcionrios de uma fbrica, a qual apresentou um salrio mdio de R$ 180,00 com um desvio-padro de R$ 14,00. Estimar o salrio mdio para todos os empregados horistas da fbrica, de tal maneira que se tenha uma confiana de 95% de que o intervalo estimado inclua a mdia da populao. Calculando na nossa situao, teremos: 1- = 0,95 = 0,05 /2 = 0,025 Olhando na tabela de t, voc encontrar t/2 = 2,052 ( com 27 graus de liberdade)

97

Curso de Graduao em Administrao a Distncia

Intervalo de confiana para a estimao da proporo populacional


Voc deve considerar que, geralmente, a proporo de sucessos em uma populao (p), na maioria das vezes desconhecida. Ento, o que fazemos? Calculamos uma estimativa da proporo de sucessos na populao a partir de uma amostra retirada desta, a qual denominamos . A distribuio amostral de uma proporo apresenta uma m.

dia p e desvio-padro

Para construirmos o intervalo de confiana para p desconhecida, determinamos na amostra e consideramos .

Portanto, considerando um nvel de significncia , teremos:

a) intervalo de confiana para p:

b) margem de erro da estimativa:

;e

c) tamanho da amostra:

Todas as demais consideraes apresentadas anteriormente permanecem, bem como a interpretao do intervalo de confiana.

Um despachante que cuida da documentao de automveis est interessado em estimar a proporo de clientes que trocaram de carro no ltimo ano para oferecer seus servios. Para isto, amostrou 80 clientes do seu cadastro e consultou-os por telefone, verificando que 30 deles teriam trocado de carro no ltimo ano. Determine o tamanho da amostra necessrio para estimar com 95% de confiana esta proporo com erro mximo de 4%.
98

Mdulo 4

Veja esta outra situao agora: considere que uma empresa de pesquisa de mercado faz contato com uma amostra de cem homens em uma grande comunidade e verifica que uma proporo de 0,40 na amostra prefere lminas de barbear fabricadas por seu cliente, em vez de qualquer outra marca. Determine o intervalo de confiana de 95% para a proporo de todos os homens na comunidade que preferem essa marca. 1- = 0,95 = 0,05 /2 = 0,025 Olhando na tabela de Z, voc encontrar Z /2 = 1,96

Saiba mais...
Mais exerccios referentes ao assunto esto no site: http:// www.famat.ufu.br/prof/marcelo/exercicios.htm

99

4
Testes Testes de de Hipteses Hipteses

UNIDADE

Curso de Graduao em Administrao a Distncia

102

Mdulo 4

Testes de Hipteses

Na teoria de deciso estatstica, os testes de hipteses assumem uma importncia fundamental, j que estes permitem nos dizer, por exemplo, se duas populaes so de fato iguais ou diferentes, utilizando para isso amostras destas populaes. Desta forma, a tomada de deciso de um gestor, deve estar baseada na anlise de dados a partir de um teste de hiptese.

Ento, voc pode definir as hipteses a serem testadas, retirar as amostras das populaes a serem estudadas, calcular as estatsticas delas e, por fim, determinar o grau de aceitao de hipteses baseadas na teoria de deciso, ou seja, se uma determinada hiptese ser validada ou no.

Para voc decidir se uma hiptese verdadeira ou falsa, ou seja, se ela deve ser aceita ou rejeitada, considerando uma determinada amostra, precisamos seguir uma srie de passos. Os passos so mostrados a seguir. 1) Definir a hiptese de igualdade (H0) e a hiptese alternativa (H1) para tentar rejeitar H0 (possveis erros associados tomada de deciso). 2) Definir o nvel de significncia (). 3) Definir a distribuio amostral a ser utilizada. 4) Definir os limites da regio de rejeio e aceitao. 5) Calcular a estatstica da distribuio escolhida a partir dos valores amostrais obtidos e tomar a deciso. Voc deve tomar a deciso baseada na seguinte regra: se o valor da estatstica da distribuio calculado estiver na regio de rejeio,

103

Curso de Graduao em Administrao a Distncia

rejeitar, ento, a hiptese nula, seno a deciso ser que a hiptese nula no poder ser rejeitada ao nvel de significncia determinada. Diversos conceitos sero apresentados ao longo do detalhamento dos passos a serem seguidos na formulao de um teste de hiptese. Detalhamento dos passos na formulao de um teste de hiptese: 1) Formular as hipteses (Ho e H1). Primeiramente, vamos estabelecer as hipteses nula e alternativa. Para exemplificar, voc deve considerar um teste de hiptese para uma mdia. Ento, a hiptese de igualdade chamada de hiptese de nulidade ou Ho. Suponha que voc queira testar a hiptese de que o tempo mdio de ligaes igual a 50 segundos. Ento, esta hiptese ser simbolizada da maneira apresentada a seguir: Ho: = 50 (hiptese de nulidade) Esta hiptese, na maioria dos casos, ser de igualdade. Se voc rejeitar esta hiptese, vai aceitar, neste caso, outra hiptese, que chamamos de hiptese alternativa. Este tipo de hiptese simbolizada por H1 ou Ha. As hipteses alternativas mais comuns so as apresentadas a seguir a partir do nosso exemplo: H1: > 50 (teste unilateral ou unicaudal direita) O tempo mdio de ligao superior a 50 segundos H1: < 50 (teste unilateral ou unicaudal esquerda) O tempo mdio de ligao inferior a 50 segundos H1: 50 (teste bilateral ou bicaudal) O tempo mdio de ligao pode ser superior ou inferior a 50 segundos.

Surge uma dvida. Qual hiptese alternativa voc utilizar? A resposta bem simples.

104

Mdulo 4

A hiptese alternativa ser definida por voc, em funo do tipo de deciso que deseje tomar. Veja o seguinte exemplo: voc inspeciona uma amostra de uma grande remessa, encontrando-se 8% defeituosa. O fornecedor garante que no haver mais de 6% de peas defeituosas em cada remessa. O que devemos responder, com auxlio dos testes de significncia, se a afirmao do fornecedor verdadeira. As hipteses que voc vai formular so: H0: p=0,06; H1: p>0,06. importante ressaltar que o sinal de igual para a hiptese Ho corresponde a um sinal de menor ou igual (neste exemplo), pois o teste unilateral direita (p1 > 0,06). Portanto, sempre que o teste for unilateral, deve ser feita esta considerao. 2) Definir o nvel de significncia. O nvel de significncia de um teste dado pela probabilidade de se cometer erro do tipo I (ocorre quando voc rejeita a hiptese Ho e esta hiptese verdadeira). Com o valor desta probabilidade fixada, voc pode determinar o chamado valor crtico, que separa a chamada regio de rejeio da hiptese Ho da regio de aceitao da hiptese Ho. Na Figura abaixo, as reas escuras correspondem significncia do teste, ou seja, probabilidade de se cometer o chamado erro tipo I (rejeitar Ho quando ela verdadeira). Esta probabilidade chamada de , e geralmente os valores mais utilizados so 0,01 e 0,05. O complementar do nvel de significncia chamado de nvel de confiana e dado por 1 - . A hiptese alternativa s pode ser maior, pois o fornecedor garante que no haver mais de 6%.

105

Curso de Graduao em Administrao a Distncia

3) Definir a distribuio amostral a ser utilizada. A estatstica a ser utilizada no teste, voc definira em funo da distribuio amostral a qual os dados seguem. Se voc fizer um teste de hiptese para uma mdia ou diferena entre mdias, utilize a distribuio de Z ou t de Student. Outro exemplo se voc quiser comparar a varincia de duas populaes, ento dever trabalhar com a distribuio F, ou seja, da razo de duas varincias. Note que o conhecimento das distribuies amostrais vistas na Unidade 3 muito importante. 4) Definir os limites da regio de rejeio. Os limites entre as regies de rejeio e aceitao da hiptese Ho, voc definir em funo do tipo de hiptese H1, do valor de (nvel de significncia) e da distribuio amostral utilizada. Considerando um teste bilateral, voc ter a regio de aceitao (no-rejeio) com uma probabilidade de 1- e uma regio de rejeio com probabilidade ( /2 + /2).

106

Mdulo 4

Atravs da amostra obtida, voc deve calcular a estimativa que servir para aceitar ou rejeitar a hiptese nula. 5) Tomar a deciso. Para tomar a deciso, voc deve calcular a estimativa do teste estatstico que ser utilizado para rejeitar ou no a hiptese Ho. A estrutura deste clculo para a mdia de forma generalista dada por:

Podemos exemplificar pela distribuio de Z, que ser:

Se o valor da estatstica estiver na regio crtica (de rejeio), rejeitar Ho; caso contrrio, aceitar H0. O esquema abaixo mostra bem a situao de deciso.

107

Curso de Graduao em Administrao a Distncia

Teste de hiptese para mdia populacional


Quando voc retira uma amostra de uma populao e calcula a mdia desta amostra, possvel verificar se a afirmao sobre a mdia populacional verdadeira. Para tanto, basta verificar se a estatstica do teste estar na regio de aceitao ou de rejeio da hiptese Ho. Aqui voc tem trs situaes distintas: 1) se o desvio-padro da populao conhecido ou a amostra considerada grande (n >30), a distribuio amostral a ser utilizada ser da Normal ou Z e a estatstica-teste que voc utilizar ser: .

Onde x: mdia amostral; : mdia populacional; : desviopadro populacional e n: tamanho da amostra. 2) agora, se voc no conhecer o desvio-padro populacional e a amostra for pequena ( ), ento, a distribuio amostral a ser utilizada ser a t de Student, e a estatsticateste ser: . Onde x: mdia amostral; : mdia

populacional; s : desvio-padro amostral e n: tamanho da amostra.

Uma observao importante: quando trabalhamos com amostras grandes, ou seja, n > 30, a distribuio de Z e t de Student apresentam comportamentos prximos e valores da estatstica prximos tambm.

Veja uma situao utilizando o teste de hiptese para uma mdia usando Z. Registros dos ltimos anos de funcionrios de uma determinada empresa atestam que sua mdia num teste de QI foi 115, com um desvio-padro de 20. Para saber se uma nova equipe de funcionrios tpica desta empresa, retirou-se uma amostra aleatria de 50 funcion-

108

Mdulo 4

rios desta nova equipe, encontrando-se mdia de 118. Com uma significncia de 5%, teste a hiptese de que esta nova equipe apresente a mesma caracterstica dos funcionrios da empresa, com relao ao QI.

Agora voc deve resolver o seguinte exerccio: Exerccio 1: um fabricante afirma que seus pneus radiais suportam em mdia uma quilometragem com mais de 40.000 km. Para testar essa afirmao, um comprador selecionou uma amostra de 49 pneus. Os testes nessa amostra forneceram uma mdia de 43.000 km. Sabese que a quilometragem de todos os pneus tem desvio-padro de 6.500 km. Se o comprador testar essa afirmao ao nvel de significncia de 5%, qual ser sua concluso? Veja agora uma situao aplicando o teste t de Student. O tempo mdio gasto para profissionais da rea de Cincias Contbeis realizarem um determinado procedimento tem sido de 50 minutos. Um novo procedimento est sendo implementado. Neste novo procedimento, retirou-se uma amostra de 12 pessoas, com um tempo mdio de 42 minutos e um desvio-padro de 11,9 minutos. Teste a hiptese de que a mdia populacional no novo procedimento menor do que 50.

Resposta no final do livro.

109

Curso de Graduao em Administrao a Distncia

Teste de hiptese para a razo de duas varincias.


Este teste de hiptese utilizado para saber se duas varincias populacionais so estatisticamente iguais ou se uma maior do que a outra. Ento, utilizando a distribuio F, poderemos formular o teste de hiptese da razo entre duas varincias e chegar concluso baseados apenas nas estimativas calculadas a partir das amostras. As hipteses Ho e H1 sero:

Como estamos utilizando um teste unilateral direita (questes didticas), ento, no clculo da estatstica de F, teremos a maior varincia dividida pela menor varincia.

A maior varincia amostral encontrada ser chamada de S12 (proveniente de uma amostra de tamanho n1), e a menor varincia amostral ser chamada S22 (proveniente de amostra de tamanho n2). Vamos supor que tivssemos duas amostras provenientes de duas populaes. Desejamos saber se as varincias das populaes so estatisticamente iguais ou uma maior do que a outra. Considere uma significncia de 2,5%. Os resultados amostrais so apresentados a seguir: S12 = 0,5184 com n1 = 14 S22 = 0,2025 com n2 = 21 A estatstica ser dada por: Ento, a varivel de teste do teste F ser:

110

Mdulo 4

Como em H o , estou considerando que as varincias populacionais so iguais, ento, na expresso acima as duas varincias populacionais vo se cancelar. No nosso exemplo, teremos:

O valor tabelado (crtico) da distribuio de F ser obtido na tabela da distribuio com uma significncia de 2,5%. Considerando como graus de liberdade iguais a 13 (n1 1) para o numerador (v1) e 20 (n2 1) para o denominador (v2), chegaremos ao seguinte resultado: valor tabelado igual a 2,637. O valor calculado da estatstica foi menor do que o tabelado, ento, ele caiu na regio de aceitao de Ho. Assim, aceitamos Ho e consideramos que a varincia da populao 1 estatisticamente igual varincia da populao 2, ou seja, no ocorre uma diferena entre elas. Este teste servir de base na escolha do prximo teste (diferena entre mdias para amostras independentes), ou seja, escolher o tipo de teste a ser utilizado.

Teste de hiptese para a diferena entre mdias populacionais


Quando queremos comparar a mdia de duas populaes, retiramos amostras das duas, e estas amostras podem apresentar tamanhos diferentes. Vamos considerar as situaes de amostras independentes (as populaes no apresentam nenhuma relao entre si) e amostras dependentes (uma populao sofre uma interveno e avalia-se antes e depois da interveno para saber se esta resultou em algum efeito). 1 situao: amostras independentes e grandes (n>30). 2 situao: amostras independentes e pequenas, mas que apresentam varincias populacionais estatisticamente iguais. 3 situao: amostras independentes e pequenas, mas que apresentam varincias populacionais estatisticamente desiguais. 4 situao: amostras dependentes.
111

Curso de Graduao em Administrao a Distncia

Agora voc vai estudar cada uma destas situaes. Lembre-se que as consideraes anteriores em relao aos passos para formulao dos testes de hipteses permanecem as mesmas. A grande diferena que voc vai ver ocorre s na determinao das hipteses a serem testadas. A hiptese Ho ser: Ho : 1 1 = d 0 Onde: 1: mdia da populao 1 e 2: mdia da populao 2. J do corresponde a uma diferena qualquer que voc deseje testar. Geralmente, quando queremos saber se as mdias das duas populaes so estatisticamente iguais, utilizamos o valor de do igual a zero. As hipteses alternativas seguem a mesma linha de raciocnio. Abaixo temos um quadro que nos auxiliar a visualizar estas consideraes.
Ho
1 2 = d0

H1
1 2 < d0 1 2 > d0 1 2 d0

importante ressaltar que, se as hipteses alternativas forem unilaterais, o sinal da hiptese Ho ser menor ou igual, maior ou igual, dependendo da hiptese alternativa, apesar de utilizarmos a notao de igual (conforme comentado anteriormente). Todas as outras consideraes em relao aos testes de hiptese permanecem as mesmas. Vamos, ento, procurar entender cada situao para os testes de hipteses para diferena entre mdias. 1 situao: amostras independentes e grandes (n>30). Como estamos trabalhando aqui com amostras grandes, ou quando se conhecem os desvios-padro populacionais, devemos trabalhar com a distribuio amostral de Z (raciocnio semelhante ao utilizado

112

Mdulo 4

no teste de hiptese para uma mdia). Portanto, a estatstica do teste ser dada por:

Onde: x1: mdia da amostra 1; x2: mdia da amostra 2 1: mdia da populao 1; 2: mdia da populao 2; 12: varincia da populao 1; 22: varincia da populao 2; n1: tamanho da amostra 1 e n2 tamanho da amostra 2.

OBS: se trabalharmos com amostras grandes poderemos substituir as varincias populacionais pelas varincias amostrais.

Vamos, ento, ver como podemos aplicar o teste de hiptese para a diferena entre mdias nesta situao. Foram retiradas amostras de aparelhos usados de duas marcas, e os resultados so apresentados na tabela a seguir. Verifique se as duas marcas tm uma mesma durabilidade ou se so diferentes, com uma significncia de 0,05.
Marcas
Mdia Desvio-padro tamanho amostra

A
1.160 90 100

B
1.140 80 100

113

Curso de Graduao em Administrao a Distncia

2 situao: amostras independentes e pequenas, mas que apresentam varincias populacionais estatisticamente iguais. Como as amostras com que estamos trabalhando so pequenas, e as varincias populacionais, desconhecidas, ento, voc deve trabalhar com a distribuio t de Student. Aqui consideraremos que as varincias populacionais so estatisticamente iguais, pois esta situao influenciar nos clculos e, conseqentemente, no processo decisrio. Para saber se as varincias podem ser consideradas iguais, deve-se fazer um teste da razo de duas varincias (teste F) mostrado anteriormente. A estatstica do teste ser dada por:

Aqui aparece um termo novo (Sp). Ele corresponde ao desviopadro ponderado pelos graus de liberdade, ou seja, calculamos um novo desvio-padro, no qual o fator de ponderao corresponde ao grau de liberdade de cada amostra. Veja a seguir:

Para voc encontrar o valor tabelado que limita as regies de aceitao e rejeio na tabela t de Student (revise na Unidade 3), o nmero de graus de liberdade (v) ser dado por:

Vamos agora resolver um exemplo. Um treinamento na rea contbil de um grupo empresarial ministrado a 12 profissionais pelo mtodo convencional. Um segundo grupo de dez profissionais recebeu o mesmo treinamento por um mtodo programado. Os resultados de notas dos dois mtodos so apresentados na tabela a seguir. Determine se h diferena entre os dois mtodos considerando uma significncia de 0,01.

114

Mdulo 4

Mtodo
Mdia Desvio-padro

Convencional
85 4

Programado
81 5

OBS: no teste F, no foram encontradas diferenas entre as varincias populacionais.

Agora voc deve resolver o seguinte exerccio: Exerccio 2: duas tcnicas de venda so aplicadas em dois grupos de vendedores. A tcnica A foi aplicada em um grupo de 12 vendedores, resultando em um nmero de vendas efetivadas em mdia de 76 e uma varincia de 50. J a tcnica B foi aplicada em um grupo de 15 vendedores, resultando em um nmero de vendas efetivadas em mdia de 68 e uma varincia de 75. Considerando as varincias estatisticamente iguais, e com uma significncia de 0,05, verifique se as mdias so estatisticamente iguais. 3 situao: amostras independentes e pequenas, mas que apresentam varincias populacionais estatisticamente desiguais. A diferena desta situao para a anterior que voc considera que as populaes apresentam varincias estatisticamente desiguais. Tambm utilizare-

115

Curso de Graduao em Administrao a Distncia

mos a estatstica do teste a partir da distribuio t de Student. A estatstica-teste ser dada por:

Outra diferena esta no clculo do nmero de graus de liberdade, pois nesta situao utilizaremos uma aproximao que dada pela expresso a seguir:

Se este valor calculado apresentar valores decimais, deve ser feito o arredondamento para um nmero inteiro. Vamos a um exemplo. Para estudar o efeito da certificao ambiental no valor de empresas, consideraram-se amostras de empresas da mesma rea, com e sem certificao ambiental. Obtiveram-se os seguintes resultados. Aps ter sido testado, verificou-se que as populaes apresentam varincias desiguais. Teste a hiptese de que os dois padres de empresas apresentam mdias de valor diferentes.
Mtodo
Mdia Desvio-padro N

Com certificao ambiental


24,0 1,7 8

Semcertificao ambiental
13,3 2,7 21

116

Mdulo 4

Resolva agora este exerccio: Exerccio 3: um empresrio deseja saber se h futuros profissionais mais promissores em escolas de regies pobres e de regies ricas. Uma amostra de 16 estudantes de uma zona pobre resultou em um teste especfico, uma mdia de 107 pontos e um desvio-padro de 10 pontos. J 14 estudantes de regio rica apresentaram uma mdia de 112 pontos e um desvio-padro de 8 pontos. Voc deve verificar se a mdia dos pontos dos dois grupos diferente ou igual, para que o empresrio possa saber se ele pode investir em qualquer uma das reas ou uma das reas mais promissora (primeiro, verifique se as varincias so estatisticamente iguais ou diferentes). 4 situao: amostras dependentes. Relembrando, amostras dependentes ocorrem quando se faz uma interveno e se deseja saber se os resultados antes da interveno so iguais aos resultados depois da interveno. Um ponto importante nesta situao que so calculadas primeiramente as diferenas de antes e depois. Esta diferena chamada de di. Ento, voc pode ver que: di = valor antes - valor depois Com base nestas diferenas (di) voc vai calcular a mdia (D) e o desvio- padro destas diferenas (SD)

e Veja que estas frmulas so iguais s de clculo da mdia e desvio-padro apresentados na Unidade 1. Neste caso, no lugar da varivel x, so utilizados os valores de di (diferenas). Com estes valores, a estatstica teste ser dada por:

117

Curso de Graduao em Administrao a Distncia

O valor de n corresponde ao nmero de diferenas calculadas, e o grau de liberdade para ser olhado na tabela t de Student ser dado por n - 1. Em um estudo, procurou-se investigar a no-eficcia de uma propaganda na percepo de clientes. O Quadro a seguir d os resultados de pessoas selecionadas anteriormente. No nvel de 5% de significncia, teste a afirmao de que as percepes sensoriais so inferiores aps a propaganda, ou seja, a propaganda no eficaz. (Os valores se referem a antes e depois da propaganda; medidas em uma escala de zero a doze.)
Pessoa Antes Depois A 6,6 6,8 B 6,5 2,4 C 9,0 7,4 D 10,3 8,5 E 11,3 8,1 F 8,1 6,1 G 6,3 3,4 H 11,6 2,0

Teste de hiptese para diferena entre propores


Em diversas situaes, o que nos interessa saber se a proporo de sucessos (evento de interesse) em duas populaes apresenta a mesma proporo ou no. Neste caso, os dados seguem uma distribuio de Bernoulli (vista na Unidade 2) com mdia p e varincia pq. Portanto, a expresso da estatstica-teste (no caso utilizaremos a distribuio de Z) ser dada por:

118

Mdulo 4

Nesta expresso, voc tem: correspondem proporo de sucesso nas amostras 1 e 2, respectivamente. p1 e p2 correspondem proporo de sucesso nas populaes 1 e 2, respectivamente. Voc deve se lembrar que a proporo de fracasso (q) dada por um, menos a proporo de sucesso. Vejamos, ento, como aplicar o teste da diferena de propores. Uma questo de teste considerada boa, se permitir discriminar entre estudantes preparados e estudantes no preparados. A primeira questo de um teste foi respondida corretamente por 62, dentre 80 alunos preparados, e por 23, dentre 50 alunos no preparados. Com um nvel de 5% de significncia, teste a afirmao de que esta questo foi respondida corretamente por uma proporo maior de estudantes preparados.

Teste do qui-quadrado de independncia


O teste do qui-quadrado de independncia est associado a duas variveis qualitativas, ou seja, uma anlise bidimensional (visto na Unidade 2). Voc se lembra que as tabelas de contingncia permitem verificar a relao de dependncia entre as duas variveis analisadas.

119

Curso de Graduao em Administrao a Distncia

Neste caso, procura-se calcular a freqncia de ocorrncia das caractersticas dos eventos a serem estudados. Por exemplo, podemos estudar a relao entre o sexo de pessoas (masculino e feminino) e o grau de aceitao do governo (ruim, mdio e bom). Ento, voc vai obter, por exemplo, o nmero de pessoas (freqncia) que so do sexo feminino e que acham o governo bom. Todos os cruzamentos das duas variveis so calculados. Vamos apresentar a voc, como exemplo, os possveis resultados da situao apresentada anteriormente (dados simulados).
Funo Ruim
157 206 363

Sexo
Masculino Feminino Total

Mdio
27 0 27

Bom
74 10 84

Total
258 216 474

Podemos, ento, querer determinar o grau de associao entre essas duas variveis, ou seja, se o grau de aceitao do governo depende do sexo ou existe uma relao de dependncia. As hipteses a serem testadas so: Ho: varivel linha independe da varivel coluna H1: varivel linha est associada com a varivel coluna A estatstica de qui-quadrado ser dada por meio da seguinte expresso:

Onde o valor k corresponde ao nmero de classes (freqncias encontradas). Voc pode verificar que fo corresponde freqncia observada, ou seja, o valor encontrado na tabela de contingncia. J fe corresponde freqncia esperada caso as variveis no tenham nenhuma relao de dependncia, ou seja, as duas variveis

120

Mdulo 4

sejam independentes. Em funo desta definio, a freqncia esperada (fe) ser obtida por:

Neste caso, os graus de liberdade (v), para que possamos olhar a tabela de qui-quadrado, so dados por: v = (h-1) (k-1) nas tabelas com h linhas e k colunas Ento, para cada clula da tabela de contingncias, voc vai calcular a diferena entre fe e. fo . Esta diferena elevada ao quadrado para evitar que as diferenas positivas e negativas se anulem. A diviso pela freqncia esperada feita para obter diferenas em termos relativos. Para entendermos melhor o teste de qui-quadrado do tipo independncia, vamos trabalhar com a seguinte situao: para testar se determinada droga era capaz de inibir a absoro de lcool pelo organismo humano, realizou-se um experimento com a participao de 60 voluntrios (homens saudveis, idade entre 25 e 28 anos). Metade dos voluntrios tomou a droga, e a outra metade no tomou. Todos os voluntrios tomaram duas doses de usque. Uma hora mais tarde, selecionou-se uma amostra do sangue de cada sujeito, observando-se os resultados a seguir. Usando 5% de significncia, pode-se concluir que o resultado do teste est associado ingesto da droga?
Teste Droga
Tomaram No tomaram

Presena de lcool
8 16

Ausncia de lcool
32 40

Ho: Presena ou ausncia de lcool independe de tomar droga H1: Presena ou ausncia de lcool est associado a tomar droga

121

Curso de Graduao em Administrao a Distncia

Teste Droga

Presena de lcool
8 (10) 16 (14) 24

Ausncia de lcool
32 (30) 40 (42) 72 40 56 96

56 . 24 = 14 96

Tomaram No tomaram

Valores entre parnteses (fe)

v = (2-1) . (2-1) = 1 gl
= 0,05 Qui-quadrado tabelado = 3,8415

Como o valor calculado (0,914) foi menor do que o tabelado, ento o calculado caiu na regio de aceitao de Ho. Portanto, no temos indcios para rejeitar a hiptese Ho, ou seja, o uso da droga no levou a uma inibio da absoro de lcool.

Anlise de varincia
A anlise de varincia um teste de hiptese utilizado para a comparao de mais de duas populaes. Imagine que voc queira comparar o grau de endividamento de empresas de trs setores (indstria, comrcio e prestao de servios). Para a comparao, necessrio que voc tenha repeties, pois elas que mediro a variao do acaso. Ento, voc deve selecionar uma amostra de dez empresas de cada setor (repeties). Para realizar uma anlise de varincia, dividimos a variao total de um conjunto de tratamentos a serem comparados com as suas

122

Mdulo 4

respectivas repeties. No nosso exemplo, os setores da indstria correspondem aos tratamentos. Voc tem, ento, dois componentes: variao ENTRE e variao DENTRO. A variao ENTRE corresponde variao encontrada entre as mdias dos tratamentos, em relao a uma mdia geral. Esta variao mede a diferena que ocorre entre os tratamentos. J a variao DENTRO do tratamento, como o prprio nome diz, a variao que ocorre entre as repeties de cada tratamento. Voc pode ver que as avaliaes das repeties dentro de cada tratamento correspondem variao do acaso. Ento, voc tem o quadro a seguir, que sintetiza tudo o que discutimos.

Vamos, ento, aprender a calcular a variao ENTRE, DENTRO E TOTAL. Aqui sero apresentadas expresses simplificadas para o clculo das variaes. Estas variaes correspondem a clculos de somas de quadrados, semelhantes s aprendidas na Unidade 1 para clculo da varincia. A variao ENTRE tratamento aquela atribuda estritamente variabilidade das mdias dos tratamentos em relao mdia geral. A variao DENTRO de tratamentos aquela devida variao de cada observao em relao mdia do tratamento. a variao devida a todas as fontes que causam variaes nos experimentos (acaso), excetuando os tratamentos. A variao total a variao de cada observao em relao mdia geral. Ento, temos a seguir as expresses para clculo das somas de quadrados:

123

Curso de Graduao em Administrao a Distncia

Onde: y: mdia geral de todos os tratamentos; r: nmero de repeties e t: nmero de tratamentos.

Como voc sabe, a variao TOTAL igual variao ENTRE mais variao DENTRO. Portanto, o clculo da variao DENTRO (efeitos do acaso) ou a soma de quadrados DENTRO obtida por meio da seguinte diferena:

SQDENTRO = SQTOTAL SQENTRE

O valor da soma de quadrado DENTRO obtido por diferena, devido maior dificuldade de sua obteno, principalmente em esquemas de anlise de varincia mais complexos. Esse tipo de anlise de varincia chamado de anlise com um fator ou de um critrio. o mais simples de todos os esquemas de anlise de varincia, sendo recomendado quando todas as condies experimentais so homogneas (no h uma variao em uma determinada direo). prprio para situaes (experimentos) nas quais se possa garantir homogeneidade. Este processo foi desenvolvido por Fisher com o objetivo de repartir a varincia de uma varivel aleatria em partes ortogonais (independentes) correspondentes a tratamentos (fator) e erro experimental (variaes do acaso). Voc pode vislumbrar agora que os objetivos da anlise de varincia so obter estimativas precisas das mdias dos tratamentos,

124

Mdulo 4

diferenas entre mdias e testar hipteses sobre igualdade de mdias de tratamentos. As hipteses na anlise de varincia so: Ho: t1= t2 = ... = tt (no existe diferena entre as mdias dos tratamentos) H1: no mnimo, um dos tratamentos difere dos demais. Na anlise de varincia, so obtidas os quadrados mdios (QM), que so estimativas no tendenciosas das varincias envolvidas na anlise. Da vem o nome anlise de varincia. Estes quadrados mdios so obtidos pela diviso da soma de quadrado pelo respectivo grau de liberdade. Ento, voc tem:

A forma pela qual voc obtm os graus de liberdade apresentada a seguir:


Fonte de Variao
Tratamento (Entre) Resduo (Dentro) Total

G. L. (grau de liberdade)
t 1 = nmero de tratamentos menos um t (r 1) = nmero de tratamento vezes numero de repeties menos um tr 1 = nmero de tratamento vezes numero de repeties menos um

Ento, voc precisa testar se a varincia do fator (ENTRE) difere da varincia do acaso (DENTRO). A distribuio amostral que voc estudou na Unidade 3, que compara duas varincias, a distribuio F ou da razo de duas varincias. Portanto, voc pode utilizar o teste de F para verificar a validade da hiptese Ho descrita anteriormente. O teste apresentado a seguir:

Comparamos o valor calculado na anlise de varincia com o valor de tabela F (v1, v2), em que v1 e v2 so, respectivamente, os

125

Curso de Graduao em Administrao a Distncia

graus de liberdade de tratamentos e de resduos. Se Fcalc > Ftab, temos que o experimento foi significativo, ou seja, indica que existe uma probabilidade superior a 1 de que pelo menos um dos tratamentos difere dos demais. O quadro da anlise de varincia pode ser resumido da seguinte forma:
Fonte de Variao
Tratamento Resduo Total

G. L.
t-1 t(r-1) tr-1

S. Q.
SQTrat

Q. M.
QMTrat

Fcalc
F calculado

F (v1,v2)
F tabela

SQResduo QMResduo SQTotal

G. L. = graus de liberdade

Vamos, ento, fazer um exemplo para entender melhor esta anlise: com o objetivo de comparar um determinado ndice inflacionrio em trs regies metropolitanas em um perodo de cinco meses, voc obteve os resultados apresentados a seguir. Verifique, por meio de uma anlise de varincia, se as mdias so estatisticamente iguais ou no.
Regies Metropolitanas Meses
1 2 3 4 5 Total

R1
1,60 2,00 2,20 1,70 1,80 5,30

R2
1,20 1,10 1,20 1,30 1,00 5,80

R3
2,00 1,80 1,40 1,60 1,90 8,70

As hipteses desta anlise de varincia so: Ho: R1= R2 = R3 (no existe diferena entre as mdias das regies) H1: pelo menos uma das regies difere das demais em mdia.

126

Mdulo 4

As repeties, ou seja, os meses so independentes, pois so considerados apenas repeties.

OBS: o teste F para anlise de varincia ser sempre um teste unilateral direita, em funo do tipo de hiptese alternativa.

Clculos das somas de quadrados:

FV
Entre Dentro Total

GL
2 12 14

SQ
1,401 0,516 1,9173

QM
0,701 0,043

Fcal
1.,2943

Significncia
0,0006

Tabela 8: Anlise de varincia

Concluso: existe diferena significativa entre as regies, pois o F tabelado (tabela de 5% e v1=2 gl e v2 = 12 gl) foi menor do que o calculado (16,29), fazendo assim com que o F calculado tenha cado na regio de rejeio da hiptese Ho.

127

Curso de Graduao em Administrao a Distncia

Saiba mais...
Mais exerccios referentes ao assunto esto no site: http://www.famat.ufu.br/prof/marcelo/exercicios.htm

Respostas dos exerccios propostos


Unidade 1
Exerccio 1: a)
Classes
38,5 | 43,5 43,5 | 48,5 48,5 | 53,5 53,5 | 58,5 58,5 | 63,5 Total

Freqncias absolutas
3 4 7 4 2 20

Classes
abaixo de 43,5 abaixo de 48,5 abaixo de 53,5 abaixo de 58,5 abaixo de 63,5

Freqncia acumulada para baixo


3 7 14 18 20

Classes
acima de 38,5 acima de 43,5 acima de 48,5 acima de 53,5 acima de 58,5

Freqncia acumulada para cima


20 17 13 6 2

128

Mdulo 4

b)

variao entre nmero das classes

variao de freqncias

5 ------------------------------------------------ 7 1,5 --------------------------------------------- x

; como abaixo de 48,5 temos 7, e entre 48,5 e 53,5 temos 5, ento, abaixo de 50, teremos: 7 +2,1 = 9,1. Exerccio 2: j) Mdia = 715,5 reais; Mediana = 708,82; Moda = 669,23 k) Desvio-padro = 13,79 e coeficiente de variao = 1,92% l) R: 950 m) R: 100 n) R: 0,155 o) R: 262 p) R: 194 q) R: 138 r) 3 classe Exerccio 3: x = 210; s = 10,96; CV = 5,22%; Md = 180; Mo = 100 Exerccio 4: Mdia = 682,35 Exerccio 5: Sim. Apresentam o mesmo CV.

Unidade 2
Exerccio 1: R: 1 (1/3 * 1/5 * 3/10) = 0,98 Exerccio 2: a) R: 0,125; b) R: 0,0694; c) R: 0,1388

129

Curso de Graduao em Administrao a Distncia

Exerccio 3: a1) R: 60/100; a2) R: 40/100; a3) R: 24/100; a4) R: 76/100 Exerccio 4: R: 0,05/0,25 = 0,2 Exerccio 5: a) R: 0,4; b) R:0,9; c) R:0,6; d) R: 1 0 2
0,1 0,3 0,6

3 0,9

4 1

e) R: 0,9. Probabilidade de alugar no mximo trs caminhes. Exerccio 6: R: 0,0089 Exerccio 7: R: P (X = 5) = Exerccio 8: Distribuio binomial com n = 4 e p = a) R: P(x=2) . 2.000 = 0,3750 . 2.000 = 750 famlias b) R: [P(1) + P(2)] . 2.000 = (0,25 + 0,375) . 2.000 = 1.250 famlias c) R: P(0) . 2.000 = 0,0625 . 2.000 = 125 famlias Exerccio 9: R: P(X = 4) = Exerccio 10: R: 1 [P(0) + P(1)], onde a distribuio de probabilidade uma Poisson com parmetro lambda. a) = 1,4 R = 0,40817 b) = 2,8 R = 0,76892 c) = 5,6 R = 0,97559 = 0,13614 = 0,03192

130

Mdulo 4

Exerccio 11: Para X = 2200 Para X = 1700 Exerccio 12: a) X = 20 Z = 0 X = 24 P(20 < X < 24) = P(0 < Z < 0,8) = 0,2881 (28,81 %). b) X = 16 X = 20 Z = 0 P(16 < X < 20) = P (-0,8 < Z < 0) = P(0 < Z < 0,8) = 0,2881 = 28,81 c) X = 28 Z = (28 - 20 )/ 5 = 1,6 P( X > 28) = P (Z > 1,6) = 0,5 0,4452 = 0,0548 Exerccio 13: seja X a mnima mdia. O Z correspondente 1,04 (aproximadamente)

Unidade 3
Exerccio 1: n1 = 101; n2 = 60; n3 = 39 Exerccio 2: a) a = 2,160; b) a = 1,708; c) a = 1,725 Exerccio 3: a) a = 34,4789; b) a = 10,2829; c) a = 7,2609 Exerccio 4: a) a = 2,092; b) a = 2,092; c) a = 2,075

131

Curso de Graduao em Administrao a Distncia

Unidade 4
Exerccio 1: (Sugesto: siga os passos para realizar um teste de hiptese.)

Como o valor calculado foi maior que o tabelado (1,64), ele caiu na regio de rejeio de Ho. Exerccio 2:

Como o valor calculado foi maior que o tabelado (2,060), ele caiu na regio de rejeio de Ho. Exerccio 3:

v=29,7425 =30 (graus de liberdade obtido pela aproximao)

t0,025 = 2,042 ( com 30 gl )


Concluso: como o valor calculado caiu na regio de aceitao, ento as mdias so estatisticamente iguais, o que indica que as duas regies apresentam o mesmo potencial.

132

Mdulo 4

REFERNCIAS
ARANGO, H. G. Bioestatstica Terica e Computacional . Rio de Janeiro: Guanabara Koogan, 2001 BARBETTA, P. A. Estatstica Aplicada s Cincias Sociais . 4 ed. Florianpolis: Ed. da UFSC, 2002. BEIGUELMAN, B. Curso Prtico de Bioestatstica . Ribeiro Preto: Revista Brasileira de Gentica, 1996. BRAULE, Ricardo. Estatstica Aplicada com Excel : para cursos de Administrao e Economia. Rio de Janeiro: Campus, 2001. BUSSAB, W. O.; MORETTIN, P. Estatstica Bsica. So Paulo: Atual, 2002. COSTA NETO, P. L. de O. Estatstica. So Paulo: Edgard Blcher, 2002. DOWNING, D.; CLARK, J. Estatstica Aplicada . So Paulo: Saraiva, 2000. FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de Estatstica. Rio de Janeiro: LTC, 1982. FREUD, J. E.; SIMON, G. A. Estatstica aplicada. Bookman, 2000, 403 p. LEVINE, D. M.; BERENSON, M. L.; STEPHAN, D. Estatstica: teoria e aplicaes (usando o Microsoft Excel em portugus). LTC, 2000, 812 p. MORETTIN, L. G. Estatstica Bsica: Probabilidade. V. 1. So Paulo: Makron Books, 1999. ________. Estatstica Bsica : Inferncia. V. 2. So Paulo: Makron Books, 1999. SOARES, J. F.; FARIAS, A. A.; CESAR, C. C. Introduo Estatstica. Rio de Janeiro: LTC, 1991. SPIEGEL, M. Probabilidade e Estatstica. Mc Graw Hill. 1993.

133

Curso de Graduao em Administrao a Distncia

STEVENSON, William J. Estatstica Aplicada Administrao. So Paulo: Harper, 1981. TRIOLA, M. F. Introduo Estatstica. Rio de Janeiro: LTC, 1999. WONNACOTT, T. H., WONNACOTT, R. J. Estatstica Aplicada Economia e Administrao. Rio de Janeiro: LTC,1981.

134

Mdulo 4

Anexos

Tabela 1: rea sob a curva normal padronizada compreendida entre os valores 0 e Z

135

Curso de Graduao em Administrao a Distncia

Tabela 2: Limites unilaterais da distribuio t de Student ao nvel de probabilidade

136

Mdulo 4

137

Tabela 3: Limites unilaterais da distribuio de 2 ao nvel

de probabilidade

Curso de Graduao em Administrao a Distncia

Tabela 4: Limites unilaterais da distribuio F de Fisher-Snedecor ao nvel de 10% de probabilidade

138

Mdulo 4

139

Tabela 5: Limites unilaterais da distribuio F de Fisher-Snedecor ao nvel de 5% de probabilidade

Curso de Graduao em Administrao a Distncia

140

Mdulo 4

141

Tabela 6: Limites unilaterais da distribuio F de Fisher-Snedecor ao nvel de 2,5% de probabilidade

Curso de Graduao em Administrao a Distncia

142

Tabela 7: Limites unilaterais da distribuio F de Fisher-Snedecor ao nvel de 1,0% de probabilidade

Potrebbero piacerti anche