Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTATSTICA E PROBABILIDADE
MDULO 1
1.1
O QUE ESTATSTICA?
A estatstica pode ser definida como: a cincia de coletar, organizar e interpretar fatos numricos que chamamos de dados. Diariamente somos bombardeados com diversos dados. Pela mdia, recebemos informaes sobre: ndice de popularidade do presidente da repblica. Temperatura mdia para determinado dia. Venda de veculos no ms passado, etc.
Outra definio de estatstica1: Estatstica se refere ao conjunto de tcnicas usadas na coleo, organizao e interpretao de dados. Estes podem ser quantitativos, com valores expressos numericamente, ou qualitativos, representados por caractersticas tais quais as preferncias dos consumidores obtidas em uma pesquisa. A anlise estatstica utilizada na administrao e economia para auxiliar na tomada de decises mediante a compreenso das fontes
1
de variao e a identificao de padres e relacionamentos nos dados. Outro autor define estatstica da seguinte forma2: A cincia de coletar, analisar, interpretar e retirar concluses a partir de dados. Nos debates pblicos sobre economia, educao e polticas sociais, todas as partes envolvidas utilizam dados em seus argumentos. Voc vai ao mdico e com base no que relatado so solicitados determinados exames. Com base nos dados dos exames determinado tratamento indicado. Voc vai ao mecnico e relata certo rudo. Com base nisso so testados determinados equipamentos. Portanto, o uso de informaes aumenta a chance de tomar decises mais eficientes.
Quando voc resolver problemas estatsticos pense no contexto do problema e formule as concluses obtidas na situao especfica. Lembre-se de que o objetivo da estatstica no o clculo em si, mas o ganho de compreenso a partir dos nmeros.
2 3
nmero de propsitos. As origens mais remotas da estatstica vinculam-se ao desejo dos governantes de contar o nmero de habitantes ou medir o valor de terras tributveis em seus domnios. O termo estatstica4 surge da expresso em latim statisticum collegium, palestra sobre os assuntos do Estado, de onde surgiu a palavra em lngua italiana statista, que significa "homem de estado", ou poltico, e a palavra alem Statistik, designando a anlise de dados sobre o Estado. A palavra foi proposta pela primeira vez no sculo XVII, em latim, por Schmeitzel na Universidade de Jena e adotada pelo acadmico alemo Godofredo Achenwall. Aparece como vocabulrio na Enciclopdia Britnica em 1797, e adquiriu um significado de coleta e classificao de dados, no incio do sculo 19. A Teoria das probabilidades comeou a ganhar fora a partir do sculo 17 quando os cientistas se interessaram em calcular as chances de sucesso nos jogos de azar.
www.wikipedia.com.br
X8 - Fumante ou no
ESTATSTICA NA MEDICINA
A Estatstica aplica-se rea mdica em qualquer situao que envolva o planejamento, coleta e anlise de dados. Problemas como testar a eficcia de determinado medicamento em relao a uma doena, bem como a criao de ndices que classifiquem as doenas pelo nvel de gravidade so alguns exemplos. Outro exemplo a elaborao de polticas de preveno e combate a doenas, baseada em dados sobre a populao de interesse. Verificar se determinada varivel patolgica constitui uma endemia, uma epidemia, ou ainda uma pandemia. Planejamento de sade pblica para determinada rea de abrangncia.
ESTATSTICA NA ECONOMIA
Otimizao de Carteiras de Investimentos: Para investir no mercado de capitais necessita-se da obteno da melhor combinao de risco e retorno possvel. As melhores estimativas para tais parmetros so a chave para a construo de modelos mais realistas. Finanas governamentais: O governo necessita das melhores projees possveis em relao arrecadao de impostos para saber quanto ter de dinheiro no prximo ano para realizar despesas com sade, educao, segurana, etc. Indicadores econmicos: Prever com certa preciso o ndice de Inflao, por exemplo, pode ser de fundamental importncia para uma determinada empresa que deseja se expandir. A compra de mquinas atravs de financiamento deve considerar a taxa de juros cobrada, assim como a expectativa inflacionria.
ESTATSTICA NA ENGENHARIA
Mtodos de Previso: A compra de determinados insumos utilizados na fabricao de produtos exige um planejamento eficiente. Adquirir quantidades menores que o necessrio pode resultar em falta de produtos. Por outro lado, comprar muito acima do necessrio pode deixar o capital da empresa ocioso. Assim, uma boa soluo para o problema utilizar mtodos de previso com base em variveis que estejam relacionadas venda do produto. Controle de estoque: tempo em que as mercadorias levam para serem vendidas. A empresa deve manter um nvel de estoque capaz de atender suas demandas. Se faltar insumos, pode prejudicar o processo de produo. O acmulo de estoques envolve custos. Controle estatstico de processos: Qual a margem de erro no peso de determinado produto empacotado? Amostragem: Quantas peas devem ser inspecionadas para sabermos o ndice de defeitos? Planejamento de experimentos: Qual a melhor temperatura para retirar determinada
pea do forno?
Ao realizar uma pesquisa, na maioria das vezes invivel consultar todos os elementos de interesse. Um exemplo clssico nesse sentido a pesquisa eleitoral. Na poca das eleies deseja-se saber a preferncia do eleitorado sobre os candidatos ao pleito. No Brasil, pas com quase 200 milhes de habitantes, temos mais de 100 milhes de eleitores. pouco vivel perguntar a todos esses indivduos quais as intenes de voto. Para ter uma idia de como se distribuem os eleitores por candidato nas pesquisas, faz-se necessrio utilizar uma amostra da populao de eleitores. Dessa forma, se o nmero de eleitores for 100 milhes e a amostra utilizada na pesquisa for de 2.000 pessoas, qual o tamanho da populao e qual o tamanho da amostra? Na medicina, o uso de amostras muito claro. Quando uma pessoa fica doente e os mdicos necessitam verificar as caractersticas do sangue dela, impossvel pesquisar todo o sangue da pessoa. O procedimento consiste na simples coleta de uma pequena amostra de sangue. Avaliando-se essa pequena amostra so tiradas concluses acerca de todo o sangue do corpo. Nesse caso a populao seria o volume total de sangue. Quanto maior o tamanho da amostra, maior a probabilidade de ela refletir o tamanho da populao inteira. Por exemplo: suponha que estejamos interessados em pesquisar o perfil dos alunos dos cursos de Engenharia da faculdade. Se houver 1.000 alunos matriculados, pode ser invivel entrevistar todos. Nesse contexto faz-se necessrio realizar a pesquisa por amostragem tomando um subconjunto da populao. Podemos pesquisar apenas 100 alunos. Alguns clculos estatsticos so necessrios para medir a preciso da referida pesquisa.
ESTRATGIA PEDAGGICA
Para efeitos didticos, a Estatstica bsica pode ser ensinada em trs etapas: 1) Descrio de dados (tambm conhecida como Anlise exploratria de dados), 2) Probabilidade, 3) Inferncia (nessa etapa utilizamos dados de amostras para extrair concluses acerca da populao de interesse. A Descrio de dados utilidade quando tomamos um conjunto de dados e resumimos os mesmos atravs de grficos, tabelas, medidas de tendncia central, medidas de variabilidade, etc. A Teoria das Probabilidades nos auxiliar a tomar decises levando em considerao a incerteza inerente aos acontecimentos. A Inferncia se utiliza das propriedades probabilsticas para a construo de testes de hipteses sobre determinado fenmeno. Por exemplo, suponha que o pesquisador acredite que as
mulheres tm uma tendncia maior a votar tambm em mulheres, em comparao aos homens. Aps colher uma amostra, as tcnicas de inferncia estatstica podem ser usadas para concluir que essa hiptese seja verdadeira ou falsa.
Ao realizar uma pesquisa, se for consultada toda a populao de interesse afirmamos que a pesquisa censitria. Portanto foi realizado um censo. No Brasil, de 10 em 10 anos esse tipo de pesquisa realizada para o levantamento de informaes sociais e econmicas da populao. Suponha que estamos interessados em traar o perfil de todos os estudantes de Engenharia da Faculdade Pitgoras de Betim. Se forem 2.000 alunos no total, o que caracteriza uma pesquisa por censo e o que caracteriza uma pesquisa por amostragem? Se consultarmos todos os 2.000 alunos estaremos diante de um censo. Se consultarmos um subconjunto dos 2.000 (100, por exemplo) estaremos diante de uma pesquisa por amostragem. Se uma das perguntas do questionrio utilizado na pesquisa for Qual a sua altura? podemos calcular a altura mdia dos alunos dos cursos de engenharia. Se a altura mdia for extrada de uma pesquisa com os 1.000 alunos (ou seja, pesquisa censitria), estaremos diante de um parmetro. Se a altura mdia for extrada de uma pesquisa por amostragem (com 100 alunos, por exemplo), estaremos diante de uma estatstica.
TIPOS DE VARIVEIS
Quando realizamos uma pesquisa, a mesma geralmente contm um conjunto de perguntas. A pesquisa realizada com os alunos de estatstica contm perguntas sobre altura, peso, idade, tipo de transporte para a faculdade, etc. Geralmente, cada pergunta feita no questionrio pode ser considerada uma varivel. Por exemplo, se for perguntado no questionrio qual a cor preferida, esta pode variar entre azul, vermelho, verde, etc. Se for perguntada a altura do estudante, a mesma pode variar entre 140 e 210 centmetros, por exemplo. Temos que fazer a distino entre os tipos de variveis. Basicamente as variveis podem ser divididas entre VARIVEIS QUANTITATIVAS ou VARIVEIS QUALITATIVAS (CATEGRICAS). As quantitativas podem ser discretas ou contnuas. As qualitativas podem ser ordinais ou nominais. Observe a figura abaixo.
(N de irmos)
(Altura)
(Estado Civil)
(Escolaridade)
EXERCCIO 1.1
Classifique as seguintes variveis: Altura: Quantitativa contnua. Peso: Nmero de irmos: Estado Civil: Escolaridade do pai: Tipo de transporte para a faculdade: Conhecimento de Excel:
1 Qual sua data de nascimento ?______________________________________ 2 Em mdia, quantas horas voc trabalha por semana?____________________ 3 Qual sua altura?__________ 4 Qual seu peso?___________ 5 Em que dia da semana foi (ou ser) seu aniversrio em 2009?_______________ 6 Voc nasceu numa capital? ( ) sim ( ) no 7 Qual a distncia de sua residncia Faculdade Pitgoras?________________ 8 Voc gosta de ir ao supermercado? ( ) sim ( ) no 9 Voc tem quantos irmos?_________________________________________ 10 Como voc vai para a faculdade? ( ) nibus ( ) carro ( ) a p ( ) motocicleta ( 11 Quanto voc gostava de Fsica? ( ) muito ( ) mdio ( ) pouco ( ) nada 12 Quanto voc gostava de Qumica? ( ) muito ( ) mdio ( ) pouco ( ) nada 13 Quanto voc gostava de Matemtica? ( ) muito ( ) mdio ( ) pouco ( ) nada 14 Quanto voc gostava de Histria? ( ) muito ( ) mdio ( ) pouco ( ) nada 15 Quanto voc gostava de Geografia? ( ) muito ( ) mdio ( ) pouco ( ) nada 16 Quanto voc gostava de Lngua Portuguesa? ( ) muito ( ) mdio ( ) pouco ( ) nada 17 Quanto voc gostava de Literatura Brasileira? ( ) muito ( ) mdio ( ) pouco ( ) nada 18 Quanto voc gostava de Lngua Inglesa? ( ) muito ( ) mdio ( ) pouco ( ) nada 19 Quanto voc gostou de microeconomia? ( ) muito ( ) mdio ( ) pouco ( ) nada 20 Quanto voc gostou de macroeconomia? ( ) muito ( ) mdio ( ) pouco ( ) nada
) outro
Foi utilizada uma planilha em Excel para a tabulao dos dados. O quadro abaixo mostra uma parte da referida planilha:
Para a apresentao dos dados num relatrio de pesquisa, foi construda a tabela abaixo.
TABELA 2.1: Banco de dados dos alunos de Estatstica da Turma de Administrao de 2009
Horas Indivduo Atlura Peso Gnero Idade trabalhadas por semana 1 170 69 M 30 50 2 163 65 M 28 48 3 171 78 M 26 44 4 165 55 F 23 0 5 161 51 F 19 0 6 160 47 F 19 20 7 165 80 M 25 30 8 165 53 F 25 21 9 170 70 F 36 91 10 160 51 M 19 36 11 173 55 F 21 30 12 163 55 F 21 36 13 164 72 F 22 48 14 158 48 F 19 0 15 180 65 M 20 20 16 172 80 M 35 40 17 171 69 F 20 43 18 158 54 F 29 30 Dia da semana em que ser o aniversrio domingo sexta quarta quarta sbado tera domingo sexta sbado quinta sbado sbado quinta quarta tera sbado tera quarta Capital Superm. Irmos 1 0 1 0 1 1 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 1 1 1 1 1 1 1 1 1 1 0 1 0 0 3 2 2 0 3 1 1 2 4 2 1 1 2 1 0 3 3 2 Deslocamento para a Faculdade 2 2 2 2 1 3 1 3 2 1 3 1 4 5 2 1 2 1 Matemtica Histria 4 3 4 3 4 3 3 4 3 3 3 4 3 4 2 4 4 3 3 3 3 1 2 4 2 4 4 1 2 2 2 2 4 4 2 4 Microeconomia 4 3 4 3 3 3 0 4 4 2 3 4 0 4 2 4 3 4 Macroeconomia 4 3 4 3 3 3 0 4 4 2 3 4 0 4 3 4 3 4
Aps a obteno dos dados tabulados, a anlise dos mesmos torna-se possvel. Para isso, podemos utilizar o prprio Excel ou algum software estatstico. Geralmente tais softwares so relativamente caros. Alguns deles so adquiridos somente por grandes empresas ou organizaes de
10
pesquisa.
GRFICO DE SETORES
Ao analisarmos os dados dos alunos da turma de 2009 podemos construir a seguinte tabela relativa varivel DESLOCAMENTO.
FREQNCIA 4 7 1 5 1 18
Outra forma de apresentar os dados acima atravs do grfico de setores tambm conhecido como grfico de pizza:
Formas de deslocamento dos alunos para a faculdade
5,6% 38,9%
A P
CARRO
MOTOCICLETA
NIBUS
OUTROS
GRFICO 2.1: Formas de deslocamento dos alunos de Estatstica da Turma de Administrao de 2009
11
Observe que o grfico apresenta valores em porcentagem. O nmero de alunos (n) 18. O grfico poderia ser construdo com valores absolutos. No entanto, fica mais didtico com o uso de porcentagens.
GRFICOS DE BARRAS
Para a varivel acima, tambm pode ser utilizado um grfico de barras. A vantagem que ele oferece uma preciso visual um pouco melhor.
Formas de deslocamento dos alunos para a faculdade 8 7 7 6 5 5 4 4 3 2 1 1 0 A P CARRO MOTOCICLETA NIBUS OUTROS 1
GRFICO 2.2: Formas de deslocamento dos alunos de Estatstica da Turma de Administrao de 2009 Cuidado com a escala muito importante ter ateno com a escala dos grficos. Observe a figura abaixo:
TAXA DE DESEMPREGO
11,0% 10,5%
10,6%
7,0%
Qual a diferena entre os dois grficos? Observe que os valores para as taxas de desemprego para os dois perodos so as mesmas. Porm, uma mudana na escala do grfico no eixo das ordenadas (no caso eixo do
12
percentual de desemprego) distorceu fortemente o aspecto visual da situao. Grfico para duas variveis categricas O grfico mostrado na seo anterior descreve apenas uma varivel. Quando estamos interessados em descrever duas variveis ao mesmo tempo, podemos construir uma tabela de dupla entrada (tambm conhecida como tabela de contingncia). Uma das perguntas feitas na pesquisa com os alunos da turma de 2009 foi: Voc gosta de supermercado? Dessa forma a varivel aleatria SUPERMERCADO pode assumir duas situaes: ou a pessoa gosta de supermercado ou a pessoa no gosta. Quando utilizamos tabelas de dupla entrada os dados so desagregados, ou seja, podem ser interpretados de forma mais detalhada. Observe na tabela abaixo que o total de pessoas que gosta de supermercado 13 e que no gosta 5. Alm disso, podemos saber que dos 13 que gostam, 4 so homens e 9 so mulheres. Outra forma de interpretar seria: das 11 mulheres, 2 no gostam de supermercado. TABELA 2.3: Distribuio da varivel SUPERMECADO por GNERO
Total 7 11 18
Fonte: Dados da pesquisa Observe um grfico feito no Excel para representar os dados acima.
12 9
10
Masculino
EXERCCIO 2.1
(a) Faa um grfico de barras vertical para o a varivel: IRMOS
13
EXERCCIO 2.2
Construa uma tabela de dupla entrada para as variveis: capital e supermercado.
TOTAL
Observe que o grfico de setores pode ser feito utilizando-se tanto os valores absolutos, como os percentuais. A escolha depender do tipo de estudo e bom senso do analista. O importante que o grfico seja o mais didtico possvel, para que o leitor consiga entend-lo.
GRFICOS DE LINHAS
Podemos fazer um grfico de linhas para a varivel: DESLOCAMENTO, conforme mostrado na figura abaixo:
8
7 6
5 4 4
3 2
1 0 A P CARRO
MOTOCICLETA
NIBUS
OUTROS
14
Entretanto, conforme discutido anteriormente, para esse tipo de varivel (categrica), os grficos de barras e setores so os mais indicados. O grfico de linhas bastante utilizado para o uso de sries temporais. O grfico abaixo representa a evoluo do retorno de trs aes na bolsa de valores.
6
2 A B C
0
ja n/ 04 ar /0 m 4 ai /0 4 ju l/0 4 se t/0 no 4 v/ 04 ja n/ 0 m 5 ar /0 m 5 ai /0 5 ju l/0 5 se t/0 no 5 v/ 05 ja n/ 06 m ar /0 m 6 ai /0 6 ju l/0 6 se t/0 no 6 v/ 06 ja n/ 0 m 7 ar /0 m 7 ai /0 7 ju l/0 7 se t/0 no 7 v/ 07 ja n/ 08 m ar /0 m 8 ai /0 8 ju l/0 8 se t/0 no 8 v/ 08
-1
-2
-3
-4
EXERCCIO 2.3
A Tabela abaixo apresenta a evoluo do nmero de pedidos de frias de funcionrios de uma empresa fictcia. Faa um grfico de linha para representar os dados.
Tabela 2.2 - Evoluo do nmero de pedidos de frias dos funcionrios da Empresa W em 2009 Ms N de pedidos Janeiro 10 Fevereiro 8 Maro 5 Abril 3 Maio 2 Junho 4 Julho 7 Agosto 3 Setembro 1 Outubro 1 Novembro 5 Dezembro 7 Fonte: Dados da empresa W
Por que colocar os dados num grfico? Eles oferecem uma forma resumida de enxergar como os dados se comportam.
15
A seguir, mostraremos os passos para construir uma distribuio de freqncia para uma varivel quantitativa. O quadro abaixo apresenta os dados de altura dos 18 alunos do banco de dados de referencia.
2 PASSO: Calcular a amplitude Amplitude = (maior valor menor valor): 180 158 = 22 3 PASSO: Calcular o nmero de classes: Nmero de classes =
16
AC
Observao: O arredondamento no clculo da amplitude de classe deve ser sempre para cima, para evitar que alguma observao da amostra fique fora da tabela de distribuio. 5 PASSO: Definir o limite inferior da primeira classe: 158
Observao: O limite inferior da primeira classe deve ser igual ao menor valor observado da amostra, e o limite superior da ltima classe deve ser superior ao maior valor observado da amostra.
6 PASSO: Definir os intervalos (extremos) das classes: 1) 158 a 163; 2) 163 a 168; 3) 168 a 173; 4) 173 a 178; 5) 178 a 183;
Observao: Os intervalos so definidos somando o limite inferior da primeira classe mais a amplitude da classe.
7 PASSO: : Contar a freqncia de observaes em cada classe (ni) e calcular a freqncia relativa (fi) 8 PASSO: calcular a freqncia acumulada (Ni) e a freqncia relativa acumulada (Fi) 9 PASSO: apresentar a tabela de freqncia.
Altura 158 163 163 178 168 173 173 178 178 183
Ni 5 11 16 17 18 18
17
Significado dos smbolos ni: Freqncia absoluta simples fi: Freqncia relativa simples Ni: Freqncia absoluta acumulada Fi: Freqncia relativa acumulada
Portanto, quais os tipos de freqncia? Absoluta Absoluta acumulada Relativa Relativa Acumulada
Estamos aprendendo a resumir os dados de uma pesquisa. Uma das formas de fazer isso atravs de distribuies de freqncia. Na vida real a construo de uma distribuio de freqncia uma pouco mais simples quando usamos computadores. Uma forma de visualizar os dados da distribuio de freqncia atravs do grfico conhecido como HISTOGRAMA. A figura abaixo mostra um histograma construdo no EXCEL.
7 6 6 5 5 5
2 1 1 1
0 158 163 163 178 168 173 173 178 178 183
18
EXERCCIO 2.4
Construa uma distribuio de freqncia para a varivel peso: 1 PASSO: Ordenar os dados
7 PASSO: : Contar a freqncia de observaes em cada classe (ni) e calcular a freqncia relativa (fi) 8 passo: calcular a freqncia acumulada (Ni) e a freqncia relativa acumulada (Fi) 9 PASSO: apresentar a tabela de freqncia.
19
EXERCCIO 2.5
Construa um histograma utilizando a distribuio de freqncia do exerccio anterior.
Os histogramas se parecem bastante com os grficos de barras. Entretanto existem trs diferenas principais: (1) As barras podem ser grudadas. (H situaes onde isso no ocorre quando a freqncia for zero). (2) indicado para variveis quantitativas agrupadas e no para variveis categricas.
Sim, mas para representar categorias o grfico de barras mais indicado. O hbito de fazer a distino entre os dois tipos de grfico nos conduz a sempre diferenciar entre variveis contnuas e discretas, sob o ponto de vista de distribuies de probabilidades.
EXERCCIO 2.6
O quadro abaixo mostra o nmero de multas aplicadas por um radar numa determinada avenida nos 30 dias de um ms. Siga os passos abaixo para construir uma distribuio de freqncia para os dados.
20
2 10 13 18
(a) Calcule a amplitude
4 10 13 18
5 11 13 19
5 11 14 19
6 11 14 19
7 11 15 21
7 12 15 21
8 12 16 22
8 13 16 25
8 13 17 26
(e) Defina os intervalos de classes (use a tabela abaixo) (f) Conte a freqncia de observaes em cada classe (ni) e calcule a freqncia relativa (fi) (use a tabela abaixo) (g) Calcule a freqncia acumulada (Ni) e a freqncia relativa acumulada (Fi) (use a tabela abaixo)
Classes
Distribuio de Freqncia das notas de estatstica freqncia freqncia Freqncia Freqncia relativa absoluta (ni) relativa (fi) acumulada (Ni) acumulada (Fi)
21
x
i 1
onde n representa o nmero de observaes ou tamanho da amostra. A mdia aritmtica simples geralmente representada pela letra x com uma barra sobre a mesma. No numerador aparece um smbolo de somatrio indicando que todas as unidades observacionais devem ser somadas. O quadro abaixo mostra cinco valores referentes ao tempo de chegada da viatura em acidentes de trnsito classificados como graves:
9
n
10
30
39
50
x
i 1
9 10 30 39 50 27,6 5
O resultado da frmula mostra uma mdia de 27,6 minutos. Esse valor pode ser calculado no Excel utilizando a frmula:
22
EXERCCIO 3.1
Calcule o tempo mdio de chegada da viatura para os acidentes de gravidade BAIXA. A mdia _____
NMERO GRAVIDADE NMERO DE DISTNCIA TEMPO DE DA DA DIA DURAO VTIMA VECULOS DO MOTORISTA CHEGADA OCORRNCIA OCORRNCIA (TEMPO) FATAL ENVOLVIDOS POSTO POLICIAL ALCOOLIZADO DA VIATURA 1 ALTA FIM-DE-SEMANA 75 SIM 8 2,5 SIM 10 2 MDIA DURANTE A SEMANA 66 NO 5 1,4 SIM 5 3 BAIXA DURANTE A SEMANA 18 NO 3 3,2 NO 15 4 BAIXA DURANTE A SEMANA 19 NO 4 5,9 NO 26 5 MDIA DURANTE A SEMANA 25 NO 2 6,4 NO 30 6 BAIXA FIM-DE-SEMANA 26 NO 2 8,3 NO 40 7 MDIA FIM-DE-SEMANA 35 NO 2 1,3 SIM 6 8 BAIXA DURANTE A SEMANA 44 NO 2 5,5 NO 19 9 BAIXA DURANTE A SEMANA 17 NO 3 14,2 NO 35 10 MDIA DURANTE A SEMANA 29 SIM 2 6,6 SIM 22 11 BAIXA DURANTE A SEMANA 30 NO 3 7,1 NO 19 12 BAIXA DURANTE A SEMANA 41 NO 2 3,3 NO 12 13 BAIXA DURANTE A SEMANA 22 NO 3 4,1 NO 12 14 MDIA FIM-DE-SEMANA 55 NO 5 8,8 SIM 25 15 ALTA FIM-DE-SEMANA 80 SIM 3 7,6 SIM 30 16 BAIXA DURANTE A SEMANA 24 NO 2 8 NO 18 17 MDIA DURANTE A SEMANA 36 NO 2 4 NO 16 18 MDIA FIM-DE-SEMANA 75 NO 5 5,3 SIM 22 19 MDIA DURANTE A SEMANA 15 SIM 1 9,3 NO 31 20 BAIXA DURANTE A SEMANA 22 NO 2 4,1 NO 14 21 ALTA DURANTE A SEMANA 21 SIM 2 13,2 NO 50 22 MDIA FIM-DE-SEMANA 25 NO 1 11 SIM 33 23 MDIA DURANTE A SEMANA 39 NO 6 15 SIM 38 24 ALTA FIM-DE-SEMANA 61 SIM 2 14,3 SIM 39 25 MDIA DURANTE A SEMANA 40 NO 4 10 NO 40 26 BAIXA DURANTE A SEMANA 17 NO 2 14 NO 51 27 MDIA DURANTE A SEMANA 26 NO 2 5 NO 17 28 ALTA FIM-DE-SEMANA 69 SIM 6 2,5 SIM 9 29 BAIXA DURANTE A SEMANA 22 NO 2 1,9 SIM 6 30 BAIXA DURANTE A SEMANA 29 NO 1 1 NO 4
23
MDIA PONDERADA
A mdia ponderada uma mdia aritmtica na qual cada valor ponderado de acordo com sua importncia no grupo como um todo. A frmula da mdia ponderada :
xw
w x
i 1 i
w
i 1
Operacionalmente, cada valor no grupo (X) multiplicado por um fator de peso apropriado (w) e o produto ento somado e dividido pela soma dos pesos. Por exemplo, se eu estiver interessado na nota mdia do ENEM (Exame Nacional do ensino mdio) para quatro escolas de uma determinada regio, importante ponderar os valores das notas pelo nmero de matrculas por escola. A Tabela abaixo apresenta o nmero de matrculas na rede estadual em cada estado (valores fictcios):
Distribuio das notas das escolas num teste de proficincia ESCOLA NOTA N DE ALUNOS A 8 200 B 9 150 C 6 400 D 7 250 Fonte: fictcia
A mdia ponderada para os dados da tabela acima pode ser calculada da seguinte forma:
n
xw
w
i 1 n i 1
xi
i
8 200 9 150 6 400 7 250 7.100 7,1 200 150 400 250 1.000
Para calcular a mdia ponderada no EXCEL devemos utilizar a funo SOMARPRODUTO para obter o resultado do numerador. Para o denominador, utilizamos a funo SOMA. A sada do EXCEL a seguir resume o procedimento.
24
EXERCCIO 3.2
Calcule a mdia ponderada da NOTA para os dados da tabela abaixo:
Nota das Companhias referentes ao Batalho 10 Companhia NOTA N DE MILITARES Companhia A 80 175 Companhia B 77 250 Companhia C 91 330 Companhia D 85 425 Fonte: fictcia
O RESULTADO ___________
ACHANDO A MEDIANA
Quando temos um conjunto de dados que apresentam valores discrepantes, podemos utilizar outra medida para resumir os dados: a MEDIANA. O clculo feito tomando o valor do meio, aps os dados terem sido colocados em ordem crescente. O quadro abaixo apresenta os valores do TEMPO DE CHEGADA em minutos da viatura
25
16
17
22
22
25
30
31
33
38
40
Para calcular a mediana desses dados, devemos inicialmente coloc-los em ordem crescente. O prximo passo consiste em encontrar a posio que divide os dados ao meio. Se tivssemos 3 valores, a posio seria referente ao segundo valor. Se tivssemos 11 valores a posio seria referente ao sexto valor. Se tivssemos 13, a posio seria referente ao 7 valor. Como temos 12 valores, devemos escolher a posio referente ao 6,5 valor. Para isso basta encontrar o valor do meio entre 22 e 25: 23,5. No Excel, basta utilizar a funo:
=MED
Observe:
Portanto, se voc tiver, por exemplo, 3 valores, a mediana o valor que encontra-se na posio 2. Se tiver 4 valores, a mediana o valor que se encontra na posio 2,5 (entre os nmeros de posio 2 e 3). E se voc tiver n nmeros?
3 passos para achar a mediana: 1 Organize os nmeros em ordem crescente 2 Se voc tiver um nmero mpar de valores, a mediana o valor que est no meio. 3 Se tiver um nmero par de valores, some 1 ao nmero de valores e depois divida
26
EXERCCIO 3.3
Calcule a mediana da varivel DISTNCIA. O resultado ___________
MODA
A Moda simplesmente o valor que mais aparece. Geralmente mais til para variveis nominais (ou categricas). A funo utilizada no EXCEL para o clculo da moda : MODO
EXERCCIO 3.4
Qual a MODA da varivel NMERO DE VECULOS ENVOLVIDOS? O resultado ___________
Para um pequeno conjunto de dados no qual nenhum dos valores medidos se repetiu, no existe moda. Quando dois valores aparecem com a mesma freqncia, a distribuio descrita como sendo bimodal. Distribuies de medies com muitas modas so denominadas multimodais.
EXERCCIO 3.5
Para uma amostra de 15 estudantes do ensino fundamental numa lanchonete, os seguintes valores de vendas, agrupados em ordem crescente so observados:
27
[b] Mediana:
[c] Moda
EXERCCIO 3.6
O quadro abaixo apresenta uma amostra de 20 operadores de produo de uma companhia, os quais receberam os seguintes valores lquidos como pagamento aps todos os descontos em uma dada semana, arredondado ao dlar mais prximo e agrupada em ordem crescente:
Calcule:
[a] Mdia
[b] Mediana
[c] Moda
28
EXERCCIO 3.7
Aumento Custo mdio por ms percentual (antes do aumento) Leite 0,10 20 Carne moda -0,06 30 Vesturio -0,08 30 Gasolina 0,20 50 Item
Use a tabela acima para determinar a variao mdia percentual atravs da ponderao das variaes percentuais para cada item, pelo valor mensal gasto com cada item antes da modificao. (PORTANTO, CALCULE A MDIA PONDERADA.
29
A AMPLITUDE
A amplitude consiste na diferena entre o maior e o menor valor num conjunto de dados, conforme a frmula abaixo:
A 8 9 9 10 10 10 11 11 12
B 8 10 10 10 10 10 10 10 12
30
Amplitude = 12 8 = 4 No entanto, a referida medida apresenta limitaes, pois retrata apenas os valores extremos do conjunto de dados, desconsiderando o que ocorre entre o maior e o menor valor. Podemos ilustrar tal argumento construindo um histograma para cada grupo com base nos dados das distribuies de freqncia, conforme os quadros a seguir.
1 0 0 10 a 10,9 11 a 11,9
8 a 8,9
9 a 9,9
10 a 10,9
11 a 11,9
12 a 12,9
8 a 8,9
9 a 9,9
12 a 12,9
Portanto, a amplitude5 s descreve a largura dos dados e no como eles so dispersos entre os limites. Os dois conjuntos de dados acima tm a mesma amplitude, mas os valores so distribudos de forma diferente. O segundo conjunto tem valores discrepantes valores extremos altos e baixos. Aparentemente, a amplitude pode medir at que ponto os valores esto dispersos, mas difcil ter uma idia real de como os dados so distribudos.
GRIFFITHS, Dawn, Use a cabea: estatstica. Editoras Altabooks. Rio de Janeiro, 2009, pag.88. Adaptado de: GRIFFITHS, Dawn, Use a cabea: estatstica. Editoras Altabooks. Rio de Janeiro, 2009, pag.89.
31
valores so dispersos pode ser bastante enganoso, devido sensibilidade a tais valores discrepantes. Suponha que tenhamos um conjunto de dados como a seguir:
1 1 1 2 2 2 2 3 3 3 3 3 4
Aqui, os nmeros esto razoavelmente distribudos de forma uniforme entre o limite inferior e o limite superior, e no h nenhum valor discrepante com que nos preocupamos. Qual a amplitude desse conjunto de dados?
Amplitude = 5 1 = 4
1 1 1 2 2 2 2 3 3 3 3 3 4
Amplitude = 10 1 = 9
5 10
Nosso limite inferior o mesmo, mas o limite superior aumentou para 10, nos dando uma nova amplitude igual a 9. A amplitude aumentou em 5, s porque acrescentamos um nmero extra, um valor discrepante. Sem o valor discrepante, os dois conjuntos de dados seriam idnticos; ento, por que h uma diferena to grande na forma em que descrevemos como os dados esto distribudos? Notamos que a amplitude apresenta-se como uma medida de disperso limitada, uma vez que reflete apenas os extremos dos dados. Se ela to limitada, por que to usada? Pelo fato de ser de fcil entendimento, at de leigos. Ento qual seria a soluo para driblar o problema da limitao da amplitude? Podemos trabalhar com quartis.
QUARTIS
Os quartis surgem como medidas estatsticas intermedirias. Num conjunto de dados podemos obter os seguintes valores: a) O primeiro quartil: Aponta o valor que representa a posio referente a 25% dos dados. Os 25% menores. b) Segundo quartil: Aponta o valor que representa a posio referente a 50% dos dados. Os 50% menores. Na verdade esse valor a prpria mediana. c) Terceiro quartil: Aponta o valor que representa a posio referente a 75% dos dados. Os 75% menores (ou 25% maiores). Nesse sentido, ao apresentar medidas resumo num conjunto de dados de uma pesquisa, podemos resumir uma varivel com as seguintes informaes: mnimo, mximo, mdia, mediana,
32
(x
i 1
x)2
Portanto, a varincia consiste em subtrair cada valor observado da mdia, elev-lo ao quadrado, somar todos os valores e em seguida dividir pelo tamanho da amostra. No entanto, para que a medida de variao tenha a mesma dimenso da mdia, mais comum trabalhar com o desvio-padro, que nada mais que a RAIZ QUADRADA DA VARINCIA.
EXERCCIO 4.1
Calcule a varincia e o desvio padro da varivel DISTNCIA do banco de dados fictcio para as variveis de gravidade ALTA.
33
RETOMANDO
A primeira etapa da anlise de dados consiste no resumo dos mesmos. Uma das formas de fazer isso atravs da construo de distribuies de freqncia e pelo uso dos mais diversos tipos de grficos. Alm disso, podemos utilizar medidas-resumo. As principais so mdia, mediana, desviopadro, mnimo, mximo e quartis. O quadro a seguir apresenta a nota dos alunos de trs turmas.
A 5 5 6 7 7
TURMAS B 3 4 6 8 9
C 0 1 9 10 10
A nota mdia das trs turmas a mesma: 6. Dessa forma podemos notar uma limitao da mdia: No fornece informao sobre como os dados se distribuem. Uma forma de solucionar o problema atravs do clculo do desvio padro. Os valores de desvio padro para os dados do quadro acima so, respectivamente: 0,9; 2,3 e 4,5. Isso significa que, apesar das mdias serem iguais, os valores encontram-se mais espalhados na turma C.
CV
x 100
EXERCCIO 4.2
Considere que voc seja o Administrador de uma Fbrica de Biscoitos. Em funo do aumento da demanda pelos produtos surgiu a necessidade de expanso da fbrica. Ao pesquisar sobre a fonte de financiamento do maquinrio, foram obtidos os seguintes dados acerca da taxa de juros cobrada por dois diferentes bancos nos ltimos 12 meses conforme a Tabela abaixo:
34
(1) Calcule a Mdia Aritmtica da Taxa de Juros da cada banco nos ltimos 12 meses
(5) Discuta com seus colegas qual o melhor Banco a ser escolhido para fazer o financiamento do
maquinrio.
35
EXERCCIO 4.3
Um investidor possui R$ 30.000 aplicados no mercado de aes. Os investimentos foram divididos em: R$ 7.500 no ativo A, R$ 9.000 no ativo B e R$ 13.500 no ativo C. Durante 5 meses, os retornos respectivos (em percentual) foram:
A B C
Considerando que o retorno da carteira de investimentos consiste na mdia ponderada do retorno dos ativos, calcule o retorno da carteira (em percentual) no perodo considerado.
EXERCCIO 4.4
O nmero de carros vendidos por cada um dos vendedores de uma agencia de automveis durante um determinado ms, agrupado em ordem crescente, :
2 10
Determine: [a] Amplitude [b] Desvio mdio absoluto
4 12
7 12
10 14
10 15
[c] Mdia
[d] Mediana
36
[e] Moda
[f] varincia
[g] Desvio-padro
EXERCCIO 4.5
NMERO GRAVIDADE NMERO DE DISTNCIA TEMPO DE DA DA DIA DURAO VTIMA VECULOS DO MOTORISTA CHEGADA OCORRNCIA OCORRNCIA (TEMPO) FATAL ENVOLVIDOS POSTO POLICIAL ALCOOLIZADO DA VIATURA 1 ALTA FIM-DE-SEMANA 75 SIM 8 2,5 SIM 10 2 MDIA DURANTE A SEMANA 66 NO 5 1,4 SIM 5 3 BAIXA DURANTE A SEMANA 18 NO 3 3,2 NO 15 4 BAIXA DURANTE A SEMANA 19 NO 4 5,9 NO 26 5 MDIA DURANTE A SEMANA 25 NO 2 6,4 NO 30 6 BAIXA FIM-DE-SEMANA 26 NO 2 8,3 NO 40 7 MDIA FIM-DE-SEMANA 35 NO 2 1,3 SIM 6 8 BAIXA DURANTE A SEMANA 44 NO 2 5,5 NO 19 9 BAIXA DURANTE A SEMANA 17 NO 3 14,2 NO 35 10 MDIA DURANTE A SEMANA 29 SIM 2 6,6 SIM 22 11 BAIXA DURANTE A SEMANA 30 NO 3 7,1 NO 19 12 BAIXA DURANTE A SEMANA 41 NO 2 3,3 NO 12 13 BAIXA DURANTE A SEMANA 22 NO 3 4,1 NO 12 14 MDIA FIM-DE-SEMANA 55 NO 5 8,8 SIM 25 15 ALTA FIM-DE-SEMANA 80 SIM 3 7,6 SIM 30 16 BAIXA DURANTE A SEMANA 24 NO 2 8 NO 18 17 MDIA DURANTE A SEMANA 36 NO 2 4 NO 16 18 MDIA FIM-DE-SEMANA 75 NO 5 5,3 SIM 22 19 MDIA DURANTE A SEMANA 15 SIM 1 9,3 NO 31 20 BAIXA DURANTE A SEMANA 22 NO 2 4,1 NO 14 21 ALTA DURANTE A SEMANA 21 SIM 2 13,2 NO 50 22 MDIA FIM-DE-SEMANA 25 NO 1 11 SIM 33 23 MDIA DURANTE A SEMANA 39 NO 6 15 SIM 38 24 ALTA FIM-DE-SEMANA 61 SIM 2 14,3 SIM 39 25 MDIA DURANTE A SEMANA 40 NO 4 10 NO 40 26 BAIXA DURANTE A SEMANA 17 NO 2 14 NO 51 27 MDIA DURANTE A SEMANA 26 NO 2 5 NO 17 28 ALTA FIM-DE-SEMANA 69 SIM 6 2,5 SIM 9 29 BAIXA DURANTE A SEMANA 22 NO 2 1,9 SIM 6 30 BAIXA DURANTE A SEMANA 29 NO 1 1 NO 4
Utilizando o banco de dados acima, calcule: [a] A mdia do tempo de chegada da viatura nos fins de semana.
37
[c] A varincia e desvio padro do tempo de chegada da viatura nos fins de semana.
[d] A varincia e desvio padro do tempo de chegada da viatura nos dias de semana.
[f] O tempo mdio de durao do atendimento para ocorrncias de gravidade: ALTA, MDIA E BAIXA.
38
REFERNCIAS BIBLIOGRFICAS
GRIFFITHS, Dawn. Use a cabea! Estatstica. Rio de Janeiro: Altabooks, 2009. MAGALHES, Marcos Nascimento, LIMA, Antnio Carlos Pedroso de. Noes de Probabilidade e Estatstica. 6. Edusp, 2007. MONTGOMERY, D. C.; RUNGER, G. C. Estatstica aplicada e probabilidade para engenheiros. 3.ed. Rio de Janeiro: LTC, 2009. MOORE, David S. A estatstica bsica e sua prtica. Rio de Janeiro. LTC, 2005. MOORE, David. S, McCABE, George P., DUCKWORTH, William M., SCLOVE, Stanley L. A Prtica da Estatstica Empresarial. Como Usar Dados para Tomar Decises. Rio de Janeiro: LTC, 2006. TRIOLA, Mrio F. Introduo Estatstica. LTC. 10a edio 2008. 722p. WALPOLE, Ronald. E. Probabilidade e estatstica para engenharia e cincias. So Paulo: Pearson Prentice Hall, 2009.
39