Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
INTRODUO 1. DEFINIES 2. COLETA DE DADOS 3. POPULAO E AMOSTRA 3.1 AMOSTRAS RELACIONADAS 3.2 AMOSTRAS NO RELACIONADAS 4. AMOSTRAGEM 4.1 NO PROBABILSTICAS 4.1.1 Acidental ou convenincia 4.1.2 Intencional 4.1.3 Quotas ou proporcional 4.1.4 Desproporcional 4.2 PROBABILSTICA 4.2.1 Aleatria Simples 4.2.2 Aleatria Estratificada 4.2.3 Conglomerado 4.3 DIMENSIONAMENTO DA AMOSTRA 5. TIPOS DE DADOS 6. TIPOS DE VARIVEIS ESCALARES 7. DISTRIBUIES DE FREQNCIAS 7.1 REGRAS PARA A ELABORAO DE UMA DISTRIBUIO DE FREQNCIAS 8. MEDIDAS DE TENDNCIA CENTRAL
Mdia aritmtica 9. VARIABILIDADE 10. TESTE DE HIPTESE 11. ESTATSTICA NO PARAMTRICA 11.1 TESTE DE QUI QUADRADO 11.1.1 Teste de Qui Quadrado para uma amostra 11.1.1.1 Condies para a execuo do teste 11.1.1.2 Procedimento para a execuo do teste 11.1.2 Teste do Qui Quadrado para independncia (duas amostras) 11.1.2.1 Condies para a execuo do teste 11.1.2.2 Procedimento para a execuo do teste 11.1.3 Coeficiente de contingncia (CC) 12. TESTE T PARA DUAS AMOSTRAS NO RELACIONADAS 12.1 Condies para aplicao 12.2 Procedimentos de execuo 13. ANLISE DE VARINCIA 14. REGRESSO SIMPLES (RLS) 15. REGRESSO LINEAR MLTIPLA (RLM) 16. EXERCCIOS 17. BIBLIOGRAFIA
Introduo
O mundo dos negcios, em qualquer que seja a rea, de Recursos Humanos a Marketing, no pode mais embasar as tomadas de decises e assumir risco simplesmente no feeling e no bom-senso dos executivos e gerentes organizacionais. A complexidade da sociedade e dos mercados apresentada atualmente exige que estes agentes se utilizem de recursos precisos e poderosos de forma a minimizar os potenciais riscos da atividade econmica. Neste contexto pode-se destacar a crescente utilizao da informtica, do mtodo e dos recursos de estatstica nas organizaes que almejam destacar-se como agentes econmicos de ponta. O barateamento exponencial destes recursos nos ltimos anos tem feito que muitas empresas invistam neste hardware (computadores, pacotes estatsticos, Internet, bases de dados) mas uma menor ateno tem sido dada ao humanware ou seja aos indivduos que efetivamente extrairo deste arsenal tecnolgico a informao e o conhecimento que possibilitaro conduzir estas organizaes liderana em seus segmentos. Sem este aprimoramento do humanware de muita pouca valia ser o investimento feito no aparato tecnolgico. Este curso tem a inteno de aportar conhecimentos bsicos de ferramentas e mtodos relacionados pesquisa e anlise estatstica de dados visando o aprimoramento da utilizao de poderosos recursos com a viso gerencial de como, e porque explorar a informao e de como enxergar em um oceano de dados aqueles que efetivamente so capazes de promover um diferencial competitivo organizao. Estatstica bsica para pesquisa de mercado no pretende cobrir todas as possibilidades da anlise estatstica de dados mas sim de prover uma consistente base sobre a qual novas habilidades podem ser facilmente construdas e desenvolvidas. Bem-vindo ao mundo da anlise estatstica de dados!!!! Marcus Vinicius da Cunha Jnior, Estudante de Doutorado - University of Florida
1. Definies
Estatstica uma cincia exata que visa fornecer subsdios ao analista para coletar, organizar, resumir, analisar e apresentar dados. Trata de parmetros extrados da populao, tais como mdia ou desvio padro. Enfim, quando se fala de estatstica, fala-se de uma cincia presente em todos os eventos mensurveis do cotidiano. Muitas vezes ela est to presente nas atividades rotineiras que no se d conta de que a mesma encontra-se ali. Por exemplo, em um jogo de futebol, tomando-se a goleira e seu espao vizinho, tem-se uma distribuio normal. Sim, afinal ao longo do jogo, os chutes a gol, tendem rea delimitada e defendida pelo goleiro. Ao final do jogo se houvesse uma quantificao dos chutes a gol, ter-se-ia a normalidade dos chutes (provavelmente entre 68% a 99% dos chutes para a linha de fundo concentrar-se-iam neste espao). Este apenas um dos inmeros exemplos que fazem com a estatstica seja mais familiar do que se imagina.
2. Coleta de dados
Toda e qualquer ao estatstica deve estar centrada em objetivos claros. O primeiro passo para um procedimento estatstico o trabalho que envolve os dados de um estudo.
Estando estes objetivos definidos, buscam-se os dados que os satisfaam, sejam eles primrios ou secundrios. Dados primrios so aqueles que foram prospectados sem que no tenha havido um estudo preliminar acerca da amostra em especfico, ou seja, so dados originais. Dados secundrios so aqueles que esto a nossa disposio oriunda de outros estudos. So fontes de dados secundrios; Internet, bancos de dados, cadastros, jornais, revistas, filmes, entre muitas outras fontes. Basicamente podemos dividir os dados em histricos ou planejados.
3. Populaao e amostra
Qualquer estudo cientfico enfrenta o dilema de estudo da populao ou da amostra. Obviamente tera-se uma preciso muito superior se fosse analisado o grupo inteiro, a populao, do que uma pequena parcela representativa, denominada amostra. Observa-se que impraticvel na grande maioria dos casos, estudar-se a populao em virtude de distncias, custo, tempo, logstica, entre outros motivos. A alternativa praticada nestes casos o trabalho com uma amostra confivel. Se a amostra confivel e proporciona inferir sobre a populao, chamamos de inferncia estatstica. Para que a inferncia seja vlida, necessria uma boa amostragem, livre de erros, tais como falta de determinao correta da populao, falta de aleatoriedade e erro no dimensionamento da amostra.
4. Amostragem
No Probabilstica
1. 2. 3. Acidental ou convenincia Intencional Quotas ou proporcional
Tipos de amostragens
4.1 No probabilstica
Este tipo de amostra, determinada por ordem do pesquisador, ou seja no h uma aleatoriedade para a escolha de um elemento da populao. A escolha de um mtodo no probabilstico, via de regra, sempre encontrar desvantagem frente ao mtodo probabilstico. No entanto, em alguns casos, se faz necessrio a opo por este mtodo. Observa-se que no envio de questionrios via correio o mtodo no probabilstico (mesmo que a opo seja por amostragem Probabilstica). O respondente pode no querer responder o questionrio ou mesmo no ser localizado. Fonseca (1996), alerta que no h formas de se generalizar os resultados obtidos na amostra para o todo da populao quando se opta por este mtodo de amostragem.
4.1.2 Intencional
O entrevistador dirige-se a um grupo em especfico para saber sua opinio. Por exemplo, quando de um estudo sobre automveis, o pesquisador procura apenas oficinas.
4.1.4 Desproporcional
Muito utilizada quando a escolha da amostra for desproporcional populao. Atribui-se pesos para os dados, e assim obtm-se resultados ponderados representativos para o estudo. Por exemplo, em um mercado de telefones celulares, considerando uma fatia de mercado meramente ilustrativa, obteve-se os resultados conforme descritos a seguir:
Objetivando obter os pesos a serem atribudos a cada marca de telefone celular, para uma anlise conjunta de todas as marcas no exemplo acima, obteve-se os seguintes coeficientes: Nmero de elementos a serem entrevistados 120 40 30 10 200
4.2 Probabilstica
Para que se possa realizar inferncias sobre a populao, necessrio que se trabalhe com amostragem probabilstica. o mtodo que garante segurana quando investiga-se alguma hiptese. Normalmente os indivduos investigados possuem a mesma probabilidade de ser selecionado na amostra.
4.2 Aleatria Simples o mais utilizado processo de amostragem. Prtico e eficaz, confere preciso ao processo de amostragem. Normalmente utiliza-se uma tabela de nmeros aleatrios e nomeia-se os indivduos, sorteando-se um por um at
completar a amostra calculada. Utiliza-se comumente o sorteio aleatrio disponvel em planilhas eletrnicas como o Excel. Uma variao deste tipo de amostragem a sistemtica. Em um grande nmero de exemplos, o pesquisador depara-se com a populao ordenada. Neste sentido, tem-se os indivduos dispostos em seqncia o que dificulta a aplicao exata desta tcnica. Quando se trabalha com sorteio de quadras de casas por exemplo, h uma regra crescente para os nmeros das casas. Em casos como este, divide-se a populao pela amostra e obtm-se um coeficiente (). A primeira casa ser a de nmero x, a segunda ser a de nmero x + ; a terceira ser a de nmero x + 3. . Supondo que este coeficiente seja 6. O primeiro elemento ser 3. O segundo ser 3 + 6. O terceiro ser 3 + 2.6. O quarto ser 3 + 3.6, e assim sucessivamente. 4.2 Aleatria Estratificada Quando se deseja guardar uma proporcionalidade na populao heterognea. Estratifica-se cada subpopulao por intermdio de critrios como classe social, renda, idade, sexo, entre outros. 4.2.3 Conglomerado Em corriqueiras situaes, torna-se difcil coletar caractersticas da populao. Nesta modalidade de amostragem, sorteia-se um conjunto e procura-se estudar todo o conjunto. exemplo de amostragem por conglomerado, famlias, organizaes e quarteires.
Varivel intervalar e populao infinita Varivel intervalar e populao finita Varivel nominal ou ordinal e populao infinita Varivel nominal ou ordinal e populao finita
Obs.: A proporo (p) ser a estimativa da verdadeira proporo de um dos nveis escolhidos para a varivel adotada. Por exemplo, 60% dos telefones da amostra Nokia, ento p ser 0,60. A proporo (q) ser sempre 1 - p. Neste exemplo q, ser 0,4. O erro representado por d. Para casos em que no se tenha como identificar as propores confere-se 0,5 para p e q.
5. Tipos de dados
Basicamente os dados de uma pesquisa quantitativa, dividem-se em contnuos e discretos. O primeiro definido como qualquer valor entre dois limites quaisquer, tal como um dimetro. Portanto trata-se de um valor que ser quebrado. So dados contnuos, questes que envolvem idade, renda, gastos, vendas, faturamento, entre muitas outras. Quando fala-se em valores discretos, aborda-se um valor exato, tal como quantidade de peas defeituosas. Comumente utiliza-se este tipo de variveis para tratar de numero de filhos, satisfao e escalas nominais no geral. O tipologia dos dados determina a varivel, ela ser portanto contnua ou discreta. Isto quer dizer que ao definir-se uma varivel com contnua ou discreta, futuramente j definiu-se que tipo de tratamento se dar a ela. Por exemplo, a varivel dependente em uma anlise envolvendo Anova, no poder ser discreta.
criar uma organizao nas escalas. exemplo clssico de escala nominal, questes de sexo e as de dicotomia (sim; no) e diferencial semntico (puro _ _ _ impuro). Intervalar, So questes que visam comparar intervalos e medir o quanto uma preferncia encontra-se distante de outra. Atualmente so objeto de infindveis discusses entre estatsticos e acadmicos de marketing quando da aplicao de testes estatsticos, afinal so consideradas discretas mas podem passar por um processo de aproximao e tornarem-se contnuas. Um processo semelhante, descrito por Cunha (1997), quando o autor aborda a tcnica de Anlise de Correspondncia (AC) e comenta que as variveis de melhor emprego para tal tcnica so as qualitativas ou as que passaram por processo de categorizao. Exemplo de escalas intervalares: 1;2;3;4;5, muito insatisfeito; insatisfeito; indiferente; satisfeito; muito satisfeito. Razo, so as variveis contnuas. Peso, idade, renda, so exemplos de questes de razo. Abaixo sero descritos modelos estatsticos possveis para os tipos de escalas abordadas.
Tipo de escala
Ordinal
Nominal
Intervalar
Razo
Estatstica possvel Todas de tendncia central Moda e Qui quadrado Mdias, desvio padro e mdio, amplitudes, varincia, teste z e t, correlao e regresso. Todos do anterior
7. Distribuio de frequncias
Quando da anlise de dados, comum procurar conferir certa ordem aos nmeros tornando-os visualmente mais amigveis. O procedimento mais comum o de diviso por classes ou categorias, verificando-se o nmero de indivduos pertencentes a cada classe. O exemplo a seguir apresenta um conjunto de tempos para determinada operao. 5,1 6,3 6,7 7,3 7,8 8,5 9,4 10,4 5,3 6,3 6,8 7,4 7,9 8,5 9,4 10,6 5,3 6,3 6,8 7,5 7,9 8,6 9,5 10,8 5,6 6,4 6,9 7,5 8 8,7 9,5 10,9 5,8 6,4 6,9 7,6 8 8,8 9,6 11,2 5,9 6,4 7 7,6 8,1 8,8 9,8 11,5 6 6,5 7,1 7,6 8,2 8,9 9,9 11,8 6,1 6,5 7,1 7,7 8,3 9 10 12,3 6,2 6,6 7,2 7,7 8,3 9,1 10,2 12,7 6,2 6,7 7,2 7,8 8,4 9,2 10,2 14,9
Valor mnimo: 5,1 Valor mximo: 14,9 2. Definir o limite inferior da primeira classe (Li) que deve ser igual ou ligeiramente inferior ao menor valor das observaes: LI: 5,1 3. Definir o limite superior da ltima classe (Ls) que deve ser igual ou ligeiramente superior ao maior valor das observaes: LS:15 4. Definir o nmero de classes (K), que ser calculado usando K = . Obrigatoriamente deve estar compreendido entre 5 a 20. Neste caso, K igual a 8,94, aproximadamente, 8. 5. Conhecido o nmero de classes define-se a amplitude de cada classe:
6. Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe (inferior e superior), onde limite Inferior ser 5,1 e o limite superior ser 15 + 1,23. 7. Intervalo de Classe 05,10 a 06,33 06,34 a 07,57 07,58 a 08,81 08,82 a 10,05 10,06 a 11,29 11,30 a 12,53 12,54 a 13,77 13,78 a 15,01 Freqncia Absoluta Freqncia Acumulad Freqncia Relativa a 13 13 16,25% 21 34 26,25% 22 56 27,50% 15 71 18,75% 4 75 5,00% 3 78 3,75% 1 79 1,25% 1 80 1,25% 80 100%
Medidas
Frmula
Exemplo
X (i)
0,038 12,3 12,7 13,0 13,1 13,3 13,3 13,5 13,8 14,1 14,5 14,9 15,8 17,2 01 02 03 04 05 06 07 08 09 10 11 12 13
2) Valores imediatamente acima e abaixo de 0,25 (13,0 e 13,1), associados com p(inf) = 0,192 e p (sup) = 0,269
0,115 0,192 0,269 0,346 0,423 0,500 0,577 0,654 0,731 0,808 0,885 0,962
Valores imediatamente acima e abaixo de 0,75: x(inf) = 14,5 e x (sup) = 14,9, associados com p(inf) = 0,731 e p(sup) = 0,808:
9. Variabilidade
Amplitude total: Definida como a diferena entre o maior e o menor valor das observaes
Por exemplo, a amplitude entre 8 12 14 16 18, 10. Desvio Padro (DP): O DP a raiz quadrada da varincia. uma medida de variabilidade que leva em considerao toda a informao contida na amostra. Um exemplo como o a seguir ilustra bem a aplicao da medida do desvio padro. A mdia da idade da amostra foi de 15,00 anos, com desvio-padro de 1,05 anos, o que indica a maioria dos respondentes entre 14 e 16 anos.
...
Hiptese estatstica uma suposio de um parmetro populacional. Por exemplo: 1. A renda mdia da populao de Forquilhinha R$ 350,00.Ento H: = 350,00. 2. A proporo de alunos reprovados 35%, ou seja: H:p = 0,35 A contrapartida para uma hiptese alternativa (H1) a hiptese nula (H0). A primeira sempre expressa por uma desigualdade e a segunda sempre por uma igualdade.
Utiliza-se o teste de hiptese para casos como comparao de mdias, de pares de observao, de varincias, e de parmetros, entre outros.
Conclui-se ento que os parmetros populacionais e as estimativas so desconsiderados nos testes a seguir. Segundo Fonseca (1996), os testes no paramtricos so muito interessantes para os dados qualitativos quando se trabalha com amostras pequenas, (inferiores a 30).
Os principais representantes desta estatstica so os testes de Qui Quadrado, de Wilcoxon, de MannWhitney, da Mediana, e de Kruskall-Wallis.
Sendo o Qui Quadrado calculado, maior do que o tabelado, rejeita-se H0 em prol de H1. Exemplo: Um vendedor trabalhou comercializando um produto em sete bairros residenciais de uma mesma cidade em um mesmo perodo do ano. Seu gerente decidiu verificar se o desempenho do vendedor oscilava em virtude do bairro trabalhado, ou seja, se as diferenas eram significativas nos bairros trabalhados. A partir deste estudo o gerente poderia ento elaborar uma estratgia comercial para cada bairro ou manter uma para todos.
1 9 16
2 11 16
3 25 16
4 20 16
5 15 16
Total 80 80
H0: no h diferenas significativas entre os bairros H1: as diferenas observadas para os bairros 3 e 4 so significativamente diferentes para melhor em relao aos demais bairros. = 0,05 g.l = 5 1 = 4, onde Qui quadrado tabelado igual a 9,49. 2 = (9-16)2 + (11 16) 2 + (25-16) 2 + (20 16) 2 + (15 16) 2/16 2 = 72 + 52 +92 + 42 + 12= 172/16 = 10,75 Conclui-se que o Qui quadrado calculado (10,75) maior do que o tabelado (9,49), rejeita-se H0 em prol de H1.
Portanto h diferena significativa, ao nvel de 0,05, para os bairros 3 e 4. Face ao clculo o gerente deve elaborar uma estratgia comercial para cada bairro.
Sendo o Qui Quadrado calculado, maior do que o tabelado, rejeita-se H0 em prol de H1. H dependncia ou as variveis no esto associadas. Exemplo: Um pesquisador deseja identificar se h dependncia no consumo de seus chocolates e as cidades de sua regio. Cidades do Vale do Taquari Sabor do chocolate Chocolate com caju Chocolate com amendoim Chocolate com flocos Chocolate com passas Lajeado 60 45 55 70 230 Santa Cruz 30 35 25 35 125 Estrela 20 20 47 25 112 Taquari 40 10 13 20 83 150 110 140 150 550
H0: A preferncia pelos sabores independe da cidade H1: A preferncia pelos sabores depende da cidade. = 0,05 = (4 1) (3 1) = 6, onde Qui quadrado tabelado igual a 12,6.
Calculo dos valores esperados (E). Sabor do chocolate Chocolate com caju Chocolate com amendoim Chocolate com flocos Chocolate com passas Lajeado
0,11+0,49+3,61+13,39+0,02+4+0,25+2,62+0,21+1,45+12+3,11+0,85+0,32+0,99+0,29 = 43,72 Conclui-se que o Qui quadrado calculado (43,72) maior do que o tabelado (12,6), rejeita-se H0 em prol de H1.
Supondo que dois estabelecimentos discutem qual possui clientes mais satisfeitos. Para mensurara o grau de satisfao junto aos clientes, resolve-se realizar uma pesquisa de satisfao aplicando um questionrio com questes intervalares de 5 pontos.
O cliente A obteve mdia geral 2,85 e o cliente B obteve mdia geral 3,45. Supostamente, conclui-se que o cliente B possui clientes mais satisfeitos que A.
O teste t visa justamente comprovar se tal diferena significativa e explicar se as diferenas entre as mdias ocorrem devido ao erro amostral ou no. Quando trabalha-se com amostras pequenas, existe uma tendncia para que as mdias das amostras seja realmente diferentes, mesmo que originem-se da mesma populao. Neste caso o teste t, objetiva justamente verificar se o grau de diferena entre os dois conjuntos pode ser devido a fatores outros que no o erro de amostragem.
onde SQ a soma dos quadrados e x1 e x2 so as mdias de cada grupo. A frmula acima pode divergir em alguns livros de estatsticas que abordem amostras desiguais, no entanto, a mesma contempla amostras de tamanhos iguais ou no. Comparar o t tabelado com t calculado e rejeitar a hiptese nula em prol da alternativa, em caso de encontrar-se t calculado maior que o tabelado.
Exemplo:
A 1 3 2 4 3 3 2 2 4 1 3 3 3 4 3 2 4 4 4 2 T = 57 n = 20 X = 2,85 SQ = 18,55 B 2 3 4 3 5 4 3 5 3 3 4 2 2 1 5 3 4 4 5 2 T = 69 n = 20 X = 3,45 SQ = 24,95
Sendo t tabelado igual a 2,02 com 38 graus de liberdade e t calculado igual a 1,77, rejeita-se a hiptese nula em prol da hiptese verdadeira. Conclui-se, portanto que os dois grupos de clientes esto satisfeitos e que provavelmente as diferenas entre as mdias sejam devido ao erro de amostragem.
Existem dois tipos de problemas a serem resolvidos atravs da Anova: a nveis fixos ou a nveis aleatrios. A aleatoriedade determinada a questo do problema.
Na grande maioria dos casos trata-se de nveis fixos, afinal o segundo tipo de problema (aleatrio) somente surgir quando ocorrer um estudo envolvendo uma escolha aleatria de fatores (em 10 lotes de produo, escolhe-se apenas 5, entre 15 mquinas de um total de 20, por exemplo).
Tabela de Anlise de Varincia ou tabela ANOVA.
Fonte de Variao SQ GDL MQ Teste F Entre Grupos SQG K 1 MQG MQG/MQR Dentro dos Grupos SQR N-K MQR Total SQT N-1 SQT = SQG + SQR (mede a variao geral de todas as observaes). SQT a soma dos quadrados totais, decomposta em: SQG soma dos quadrados dos grupos (tratamentos), associada exclusivamente a um efeito dos grupos
grupos. SQR soma dos quadrados dos resduos, devidos exclusivamente ao erro aleatrio, medida dentro dos
MQG = Mdia quadrada dos grupos MQR = Mdia quadrada dos resduos (entre os grupos) SQG e MQG: medem a variao total entre as mdias SQR e MQR: medem a variao das observaes de cada grupo
f = MQG MQR
N 1=(K 1) + (N K)
SQT = SQG + SQR MQG = SQG (K 1) A hiptese nula sempre ser rejeitada quando f calculado for maior que o valor tabelado. Da mesma forma, se MQG for maior que MQR, rejeita-se a hiptese nula. Quadro Fonte de variao SQ (soma dos quadrados) GDL (g.l) MQ (quadrados mdio) Teste F Entre Grupos Dentro dos grupos Total Se o teste f indicar diferenas significativas entre as mdias, e os nveis forem fixos, haver interesse em identificar quais as mdias que diferem entre si. Calcular o desvio padro das mdias;
Sx = , ,onde nc a soma do nmero de cada varivel (grupo) dividido pelo nmero de variveis. Calcular o limite de deciso (ld) 3 x Sx Ordenar as mdias em ordem crescente ou decrescente e compara-las duas a duas. A diferena ser significativa se for maior que Ld. Se o teste f indicar diferenas significativas entre as mdias, e os nveis forem aleatrios, haver interesse em identificar a estimativa dos componentes de variao.
O valor encontrado acima indicar a variabilidade total entre grupos, indicando se considerado significativa ou no. Exemplo (nveis fixos): Um pesquisador realizou um estudo para verificar qual posto de trabalho gerava mais satisfao para o funcionrio. Para isso, durante um ms, 10 funcionrios foram entrevistados. Ao final de um ms os funcionrios responderam um questionrio gerando uma nota para o bem estar do funcionrio. Postos 2 5 6 7 6 5 6 7 5 6 6
Funcionrios 1 2 3 4 5 6 7 8 9 10
1 7 8 7 8 9 7 8 6 7 6
3 8 9 8 9 8 8 9 10 8 9
RESUMO Grupo 1 2 3 Contagem 10 10 10 Soma 73 59 86 Mdia Varincia 7,3 0,9 5,9 0,544444 8,6 0,488889
ANOVA Fonte da variao SQ Entre grupos 36,46667 Dentro dos grupos 17,4 Total 53,86667 gl 2 27 29 MQ 18,23 0,64 F valor-P F crtico 28,29 2,37E-07 3,35
Como f calculado maior do que o f tabelado, rejeita-se a hiptese nula em prol da hiptese alternativa ao risco de 5%. H diferenas significativas entre os grupos. Observa-se que MQG muito superior a MQR, indicando uma forte varincia entre os grupos. 1. Calcular o desvio padro das mdias;
2.
3.
Ordenar as mdias em ordem crescente ou decrescente e compara-las duas a duas. 5,9 7,3 8,6 x1 x2 = - 1,4 x1 x3 = - 2,7 x2 x3 = - 1,3
As trs diferenas so menores que o Ld, conclui-se portanto que as mdias diferem entre si.
A relao linear entre as duas variveis medida pelo coeficiente de correlao (R).
R varia de 1 a 1, onde 1 a correlao perfeita e o oposto indica forte correlao negativa. Valores prximos de zero indicam fraca correlao. No exemplo abaixo, se existisse um R elevado poderia-se prever y para eventos futuros. Y Gastos com combustvel Renda Pessoal Nmeros de defeitos de peas X Km rodados Anos de estudo Horas de treinamentos em qualidade
O clculo de R uma operao bastante simples para softwares com funes estatsticas, sendo desnecessrio o aprofundamento dos procedimentos de calculo. Neste tipo de anlise importante determinar o quanto a linha de regresso representa os dados. Neste caso, se faz necessrio calcular o R 2 de Pearson ou coeficiente de determinao. Um R2 igual a 0,80, tem-se que 80% da variabilidade decorre de x. Inversamente, pode-se dizer que 20% da varincia de Y no atribuvel s diferenas em x. Para obter-se o teste de hiptese, formula-se H0 e H1 da seguinte forma: H0 :p = 0 H1: p 0 O clculo de t realizado atravs da formula,
2603 3105 1305 804 1604 2706 805 1903 3203 3702 3203 3203 803 803 1102 3202 1604 1603 3203 3702 3403
340 400 150 100 200 300 100 200 400 450 400 400 100 100 130 400 150 200 400 450 440
Estatstica de regresso R mltiplo 0,993064678 R-Quadrado 0,986177454 R-quadrado ajustado 0,985519237 Erro padro 127,508336 Observaes 23 Observando a tabela acima, percebe-se uma forte correlao entre as variveis, onde R est muito prximo de 1. Quilmetros rodados explica 98% da varincia de gastos.
Analogamente, a preocupao geral do analista nesta anlise, o R2 que indica a variabilidade total do modelo de regresso, e os Rs que variam de 1 a 1, indicando a variabilidade total, onde haver uma relao entre a varivel de resposta e as regressoras. O teste de hiptese baseia-se no j abordado valor do t, onde ocorre a situao do mesmo sendo calculado e maior do que o tabelado, rejeita-se a hiptese nula.
Exemplo: Variveis Prazo de entrega Envolvimento da equipe na soluo de problemas Preo praticado Trabalho de ps venda Embalagem Coeficiente 0,154 0,135 -0,002 0,134 0,065
Neste exemplo real, objetivava-se mensurar o grau de satisfao dos clientes de uma empresa distribuidora de software, onde a varivel de resposta era a satisfao geral e as regressoras eram as acima citadas (para um grupo de fatores). Observa-se que pouca representatividade exercida por estas variveis, afinal os coeficientes pouco se afastam de zero. No entanto o R2 elevado (0,68), conferindo uma boa preciso no clculo.
16. Exerccios
1. Uma empresa possui quatro equipes de vendedores e deseja avaliar os resultados abaixo discriminados. As vendas deveriam ser as mesmas. Para testar essa hiptese foram feitas medies nas equipes. Analise os resultados e conclua a respeito de possveis diferenas entre as equipes.
Equipe 1 Equipe 2 Equipe 3 Equipe 4 824 817 822 826 821 830 810 828 829 819 831 810 808 809 824 820 815 825 818 815
2.
Supondo que a varivel escolhida de um pesquisa, seja nominal e a populao finita de 600 indivduos (onde 60% dos indivduos so mulheres). Deseja-se trabalhar com um alpha de 5% e um erro amostral de 7%. Calcule o tamanho da amostra.
3.
Organize os dados abaixo em uma tabela de distribuio de freqncia, contendo o intervalo de classe, a freqncia absoluta, a freqncia acumulada, a freqncia relativa e a freqncia relativa acumulada.
20,4 22,3 23,1 23,5 23,8 24,1 24,3 24,3 24,6 24,8 24,9 25,0 25,1 25,3 25,3 25,4 25,6 25,7 25,8 26,0
26,0 26,1 26,2 26,2 26,3 26,5 26,6 26,7 26,8 26,9 27,1 27,1 27,3 27,5 27,7 27,9 28,0 28,3 28,7 29,6
4.
Trs arremessadores de disco, treinam para a Olimpada. Os atletas arremessam seus discos a 66 metros de distncia (em mdia), com desvio padro de 6,1 metros.
5.
Uma determinada amostra possui varincia de 0,0015 e mdia de 12,258. Sendo o n igual a 12, construa o intervalo de confiana para mdia amostral.
6.
Um gerente geral de determinada rede de lojas de varejo deseja saber se a estao climtica do ano interfere no volume de artigos vendidos. Teste a hiptese da estao do ano interferir no volume vendido.
7.
Um automvel recebeu as notas abaixo junto a leitores de revista especializada. Durante dois meses o pesquisa foi publicada e agora o fabricante deseja saber se h diferenas significativas entre as notas ao longo dos dois meses.
Ms Jan 9 8 7 9 7 6 4 9 9 9 9 8 8 7
Ms de Fev 6 6 6 6 5 5 5 4 3 2 6 5 5 8
8.
Atravs de um estudo de share of mind, quatro amostras de telespectadores foram entrevistados, oriundas dos estados de SP, AM, RN e RS. O objetivo do pesquisador verificar se h diferenas significativas entre as quatro amostras, se houve o mesmo impacto da propaganda nos estados.
SP 5,2 5,9 6,6 7,3 8,0 8,7 9,4 7,9 8,3 7,3 8,0 8,7 9,4 7,9 8,3
AM 5,9 6,3 6,7 7,1 7,5 7,9 8,3 8,7 9,1 9,5 5,9 6,3 6,7 7,1 7,5
RN 5,2 5,9 6,6 7,3 8,0 8,7 9,4 9,7 5,2 5,9 6,6 7,3 8,0 8,7 9,4
RS 6,9 6,8 6,7 6,6 6,5 6,4 6,3 6,2 6,1 6,0 5,9 5,8 5,7 5,6 5,5
17. Bibliografia
CUNHA, M.V. Anlise Multidimensional de Dados Categricos. In: PPGA, UFRGS, 16. 1997. Porto Alegre, RS FONSECA, J. S, MARTINS, G. Curso de Estatstica. So Paulo. Atlas.1996 FREITAS & CUNHA CONSULTORES LTDA. Guia do Usurio Sphinx Lxica 2.08 for Windows. Porto Alegre, 1998. KOTLER, P. Administrao de Marketing: Anlise, Implementao e controle. So Paulo: Atlas, 1996. Planejamnto,
LABES, E. M. Questionrio: do planejamento aplicao na pesquisa. Chapec: Grifos, 1998. MARR, S.L., CROSBY, L.A. Customer Satisfaction Measurement: a management Information system for total quality. Artigo de trabalho da Disciplina de Comportamento do consumidor PPGA UFRGS, 1996. MATTAR, F. N. Pesquisa de Marketing. So Paulo: Atlas, 1996.
ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfao de clientes: o estadoda-arte proposio de um mtodo Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais. 1997, Rio das Pedras, RJ. p.124 SLACK, N. Administrao da produo. So Paulo: Atlas, 1997.