Sei sulla pagina 1di 29

ESTATSTICA

Estatstica um conjunto de mtodos e processos quantitativos que serve para estudar e medir os fenmenos coletivos.
Durg de Bernonville O termo Estatstica, provm da palavra Estado e foi utilizado originalmente para denominar levantamentos de dados, cuja finalidade era orientar o estado em suas decises. A estatstica teve acelerado desenvolvimento a partir do sculo XVII, com os estudos de BERNOULLI, FERMAT, PASCAL, LAPLACE, GAUSS, GALTON, PEARSON, FISHER, POISSON e outros que estabeleceram suas caractersticas atuais. Estatstica para os cursos de economia, administrao, cincias contbeis Ermes e Elio Medeiros da Silva, Valter Gonalves e Afrnio Carlos Murolo. A Estatstica tem como objetivo o estudo dos fenmenos coletivos e das relaes que existem entre eles. Fenmenos coletivos so os fenmenos que se referem populao ou ao universo que compreende um grande nmero de entes, portanto para a Estatstica interessa apenas os fatos que englobem um grande nmero de elementos, pois ela busca encontrar leis de comportamento para todo o conjunto, no se preocupando-se com cada um dos elementos, em particular.

1.0 Importncia da Estatstica


A direo de uma organizao com fins lucrativos (qualquer que seja a indstria) ou no, de uma organizao governamental, exige de seus administradores a importante e crucial tarefa de tomada de decises, e o conhecimento e uso da de estudos e pesquisas estatsticas facilitam o trabalho de dirigir e controlar a organizao. Por meio das pesquisas, coleta de dados pode-se conhecer a realidade geogrfica, social, de recursos naturais, humanos e financeiros disponveis no meio, na regio, no estado e pas em que a organizao atue ou seja parte integrante, assim como as expectativas do pblico sobre as organizaes pblicas ou privadas ( lucrativas ou no), estabelecendo metas e objetivos com maiores possibilidade de serem alcanados. A Estatstica ajudar nesse trabalho, assim como na seleo e organizao da estratgia a ser adotada no empreendimento e, ainda, na escolha das tcnicas de verificao e avaliao da quantidade e da qualidade do produto e mesmo dos possveis lucros e/ou perdas.

2.0. Estatstica Descritiva e Indutiva


1

A Estatstica utiliza de um ferramental que a matemtica aplicada, e que fornece o mtodo e os processos quantitativos para a coleta, organizao, descrio, anlise e interpretao de dados para utilizao dos mesmos nas tomadas de decises, portanto podemos definir: 2.1. Estatstica Descritiva o estudo estatstico que preocupa-se apenas em descrever e analisar determinada populao e / ou amostra sem tirar concluses. Trata da coleta, organizao e descrio dos dados 2.2. Estatstica Indutiva ou Inferencial o estudo estatstico que preocupa-se no s descrever e analisar determinada populao e / ou amostra, mas tambm tirar concluses, analisar, a interpretao de dados e deles fazer previses.

3.0 Populao e Amostras


Populao Conjunto de entes portadores de, pelo menos, uma caracterstica em comum, que interessam ao estudo de um fenmeno coletivo. Amostra qualquer subconjunto no vazio de uma populao, excetuando-se a prpria populao. portanto uma parte da populao Exemplo: Na figura abaixo, a populao poderia ser representada por toda rea interior elipse e a amostra pela rea negra interior elipse.

Parmetro Uma caracterstica numrica estabelecida para uma populao Estimador Uma caracterstica numrica estabelecida para uma amostra. Exemplo: Numa eleio para governador do Estado do Rio de Janeiro Populao: Seriam todos os eleitores habilitados no Estado do Rio de Janeiro Parmetro: Proporo de votos do candidato A Amostra: Grupo de 1.000 eleitores Estimador: Proporo de votos do candidato A obtida na amostra

3.1. Processos Estatsticos de Abordagem: 3.1.1. Censo: uma avaliao direta do parmetro, utilizando-se todos os componentes da populao. Propriedades Principais: 1. Admite erro processual zero e tem confiabilidade 100%; 2. caro; 3. lento; 4. quase sempre desatualizado; 5. Nem sempre vivel 3.1.2. Estimao: uma avaliao indireta de um parmetro, com base em um estimador atravs do clculo de probabilidades. Propriedades Principais: 1. Admite erro processual positivo e tem confiabilidade menor que 100%; 2. barata; 3. rpida 4. atualizada; 5. sempre vivel 3.2. Amostragem 3.2.1. Amostragem casual ou aleatria simples Tipo de amostragem que equivale a um sorteio lotrico. Exemplo: Na obteno de uma amostra representativa para pesquisa da estatura de 90 alunos de uma escola. 1. Numera-se os alunos de 01 a 90 2. Escolhe-se aleatoriamente 9 alunos desses 90 Medindo-se as alturas dos alunos correspondentes aos nmeros sorteados, tendo-se portanto uma amostra das estaturas dos noventas alunos. 3.2.2. Amostragem proporcional estratificada Tipo de amostragem que considera todas os subgrupos ou estratos em que se divide a populao, portanto a amostra ter elementos representativos de cada estrato da populao. Exemplo: Supondo que no exemplo anterior, o grupo de 90 alunos, 54 sejam meninos e 36 meninas, logo teremos: Sexo M F Total Populao 54 36 90 10% ( 10 54 )/100 = 5,4 ( 10 36 )/100 = 3,6 ( 10 90 )/100 = 9,0 Amostra 5 4 9

3.2.3. Amostragem sistemtica Quando no se necessrio construir o sistema de referncia. Todos os elementos j esto ordenados. Exemplo: Uma rua que contenha 900 prdios, e desejamos obter uma amostra de 50 prdios. Procedimento: Como 900/50=18, escolhe-se por sorteio casual um nmero de 1 a 18, ( inclusive ) o qual indicaria o 1 elemento da amostra, portanto os prdios escolidos seriam: Nmero sorteado 4 1 prdio a ser sorteado o de n 4 sendo o prximo o de n 22, o seguinte de n 40. Exerccio: Escolas A B C D E F Total Nmero Estudantes 80 102 110 134 150 300 876 10% ( 10 80 )/100 = 8 ( 10 102 )/100 = 10,2 ( 10 110 )/100 = 11 ( 10 134 )/100 = 13,4 ( 10 150 )/100 = 15 ( 10 300 )/100 = 30 ( 10 876 )/100 = 87,6 Amostra 8 10 11 13 15 31 88

Exerccio 2: Em uma escola existem 250 alunos, sendo 35 na 1 srie, 32 na 2 , 30 na 3 , 28 na 4 , 35 n 5 , 32 na 6 , 31 na 7 e 27 na 8 . Obtenha uma amostra de 40 alunos.

4.0. Fases do Mtodo Estatstico


4.1 Planejamento - Quando os objetivos da pesquisa j estiverem sido claramente definidos, deve ser estabelecida uma estratgia afim de possibilitar a obteno dos resultados, com a seguinte mxima: Obtermos o mximo de informaes com o mnimo de tempo e custos possveis. 4.2 Coleta de Dados Aps definido o objeto de pesquisa d-se incio coleta dos dados numricos que possam representar o fenmeno a ser estudado, e podem ser classificadas conforme abaixo: 4.2.1 Coleta Contnua como se fosse um registro, so dados que so continuamente registrados, como por exemplo: nmero de nascimentos, de bitos, etc.; 4.2.2 Coleta Peridica a coleta que realizada a um determinado perodo de tempo, como por exemplo: censo a cada 10 anos; 4.2.3 Coleta Ocasional a coleta que realizada quando demandada, como por exemplo: estudo sobre preferncias de votos em eleies; Como fazer a coleta dos dados: 4

Observao Direta Consiste em se fazer uma observao do fato atravs de uma pessoa / cmara de filmagem onde se pode conhecer a reao das pessoas / do pblico alvo em relao modificao do produto / servio, etc. Entrevista Mtodo mais eficiente, porm mais dispendioso, porque a entrevista feita com cada um dos componentes da amostra ou da populao, afim de que se possa ter absoluta certeza da opinio do entrevistado acerca do fato pesquisado. Auto-entrevista Feita atravs de formulrios enviados ao pblico alvo, permitindo que se faa uma pesquisa com grande nmero de elementos, a um custo relativamente baixo. 4.3 Crtica dos Dados Aps amealhados os dados brutos necessrio a depurao desses dados, procurando erros, falhas, dados excedentes, dados faltosos afim de os resultados do estudo no sejam influenciados por dados no interessantes ao fenmeno. 4.4 Organizao dos Dados Disposio dos dados respeitando os critrios do estudo do fenmeno. 4.5 Apresentao dos Dados Apresentao dos dados do estudo em forma de tabelas ou grficos. 4.6 Anlise dos Dados So as concluses que se podem tirar das informaes obtidas e analisadas,aps todo o depuramento dessas informaes realizado pela Estatstica Descritiva, faz-se a anlise dos resultados obtidos, atravs dos mtodos de Estatstica Indutiva ou Inferencial, onde apresentaremos as concluses do estudo.

5.0 Mtodos de Pesquisa


Primeiramente precisamos definir o objetivo da pesquisa, o que se quer saber, procurar, descobrir, entender, conhecer, concluir e a partir do objetivo da pesquisa j definido, necessrio traar uma estratgia para alcan-lo. 5.1. Mtodo Cientfico - Conjunto de meios dispostos convenientemente para se chegar ao objetivo almejado, destacamos: 5.1.2. Mtodo Experimental - Consiste em se manter constantes todos os fatores, menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam.

5.1.3.Mtodo Estatstico - Admite todas os fatores presentes como possivelmente inconstantes, registrando essas variaes e procurando determinar no resultado final, que influncias cabem a cada uma delas. Exemplo: Determinao das causas que determinam os preos de uma mercadoria. Causas: Preferncias dos consumidores Salrios Nvel geral dos preos de outras mercadorias Escassez da mercadoria

6.0 Varivel
Varivel o objeto da pesquisa, o que exatamente estamos procurando, como por exemplo, quando estamos estudando a altura dos alunos da classe A de uma determinada escola, a varivel : altura dos alunos da classe A. 6.1. Varivel Qualitativa Quando seus valores so expressos em atributos, como por exemplo: a. Sexo - masculino e feminino b. Cor da pele Branca, Negra, Amarela, etc 6.2. Varivel Quantitativa Quando seus valores so expressos em nmeros, como por exemplo: a. Salrios de funcionrios b. Idade dos alunos de uma classe 6.2.1. Varivel Quantitativa Discreta Quando seus valores so expressos em nmeros inteiros, contagem ou enumeraes, como por exemplo: a. Nmero de alunos de uma classe b. Idade dos alunos de uma classe c. Nmero de acidentes numa estrada d. Quantidade de livros numa biblioteca

6.2.2. Varivel Quantitativa Contnua Quando uma varivel pode assumir, qualquer valor entre dois limites, no sendo possvel enumerar todos os valores possveis entre esses dois limites, como por exemplo: 6

a. Peso dos alunos de uma classe b. Tempo de durao de uma lmpada c. Lucro das empresas na indstria metalrgica

Tabelas Quadro que resume um conjunto de observaes Uma tabela composta de: o corpo conjunto de linhas e colunas que contm informaes sobre a varivel em estudo; o cabealho parte superior da tabela que especifica o contedo das colunas; o coluna indicadora parte da tabela que especifica o contedo das linhas; o linhas retas imaginrias que facilitam a leitura no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas; o casa ou clula espao destinado a um s nmeros; o ttulo conjunto de informaes, as mais complexas possveis, respondendo s perguntas: O qu? Quando? Onde?, localizado no topo da tabela H ainda a considerar os elementos complementares da tabela, que so a fonte, as notas e as chamadas, colocados de preferncia em seu rodap. Ttulo PRODUO DE CAF Cabealho BRASIL Anos 1991 1992 1993 1994 1995 Rodap
FONTE: IBGE

1991 - 1995

Produo ( 1.000 t ) 2.535 2.666 2.122 3.750 2.007

De acordo com a Resoluo 886 da Fundao IBGE, nas casas ou clulas devemos colocar: Trao horizontal ( - ) quando o valor zero; Trs pontos ( ... ) quando no temos os dados; Um ponto de interrogao ( ? ) quando temos dvida quanto exatido de determinado valor; Zero ( 0 ) quando o valor muito pequeno para ser expresso pela unidade utilizada. Se no entanto os valores so expresos em nmeros 7

decimais, teremos que acrescentar parte decimal um nmero correspondente de zeros ( 0,0; 0,00; 0,000; ... )

Sries Estatsticas Denominamos srie estatstica toda tabela que representa a distribuio de um conjunto de dados estatsticos em funo da poca, do local ou da espcie. Sries Histricas, cronolgicas, temporais ou marchas PREO MDIO DA CARNE NO VAREJO RIO DE JANEIRO - 1989-94
ANOS 1989 1990 1991 1992 1993 1994 FONTE: APA PREO MDIO ( R$/kg) 4,48 5,56 4,24 3,80 4,08 5,24

Sries Geogrficas, Espaciais, Territoriais ou de Localizao Descrevem-se valores da varivel, em determinado instante, discriminados segundo regies. DURAO MDIA DE ESTUDOS SUPERIORES 1994
PASES Itlia Alemanha Frana Holanda Inglaterra NMERO DE ANOS 7,5 7,0 7,0 5,9 Menos de 4

FONTE: Revista Veja.

Sries especficas ou categricas Descrevem-se valores da varivel, em determinado tempo e local, discriminados segundo especificaes ou categorias. REBANHOS BRASILEIROS - 1992
ESPCIES QUANTIDADE ( 1.000 cabeas )

Bovinos Eqinos Muares Sunos Ovinos Caprinos Coelhos FONTE: IBGE.

154.440,8 549,5 208,5 34.532,2 19.955,9 12.159,6 6,1

Sries Conjugadas - Tabela de dupla entrada Uma nica tabela com a conjugao de duas ou mais sries Exemplo: TERMINAIS TELEFNICOS EM SERVIOS 1991 - 93
REGIES Norte Nordeste Sudeste Sul Centro-Oeste 1991 342.938 1.287.813 6.234.501 1.497.315 713.357 1992 375.658 1.379.101 6.729.467 1.608.989 778.925 1993 403.494 1.486.649 7.231.634 1.746.232 884.822

FONTE: Ministrio das Comunicaes.

Exemplo de srie geogrfico-histrica Verificou-se, em 1993, as seguintes importaes de mercadorias realizadas pelo Brasil. 14.839.804 toneladas oriundas da Arbia Saudita, no valor de U$ 1.469.104.000; 10.547.889 toneladas dos Estados Unidos; no valor de U$ 6.034.946.000 e 561.024 toneladas do Japo, no valor de U$ 1.518.843.000. Confeccionar a srie correspondente e classifique-a sabendo que a fonte o Ministrio da Fazenda. Dados Absolutos e Dados Relativos Dados absolutos - Dados estatsticos resultantes da coleta direta da fonte, sem outra manipulao seno a contagem ou medida, so chamadas. Dados Relativos - So o resultado de comparaes por quociente ( razes ) que se estabelecem entre dados absolutos e tm por finalidade realar ou facilitar as comparaes entre quantidades. Os dados relativos so traduzidos, em geral, por meio de percentagens, ndices, coeficientes e taxas. MATRCULA NAS ESCOLAS CIDADE A - 1995
CATEGORIAS 1 grau 2 grau N ALUNOS 19.286 1.681 % 91,0 7,9

3 grau Total

234 21.201

1,1 100,0

FONTE: Secretaria Municipal de Educao da Cidade A

1 grau = (19.286 * 100)/21.201 = 90,96 = 91 2 grau = (1.681*100)/21.201 = 7,92 = 7,9 3 grau = ( 234*100)/21.201=1,1 0=1,1 Os valores dessa nova coluna nos dizem aproximadamente que, de cada 100 alunos da cidade A, 91 esto matriculados no 1 grau, 8 no 2 grau e 1 no 3 grau. O emprego da percentagem de grande valia quando nosso intuito destacar a participao da parte no todo. Considera-se agora: MATRCULA NAS ESCOLAS CIDADE A e B - 1995
CATEGORIAS 1 grau 2 grau 3 grau Total CIDADE A N ALUNOS % 19.286 91,0 1.681 7,9 234 1,1 21.201 100,0 CIDADE B N ALUNOS % 38.660 91,0 3.399 8,0 424 1,0 42.483 100,0

Fonte: Dados Fictcios

Nota: Neste caso acima tomamos 100 como base de comparao, pode-se entretanto tomar outro nmero qualquer, entre os quais destaca-se o nmero 1. Exemplo: MATRCULA NAS ESCOLAS CIDADE A e B - 1995
CATEGORIAS 1 grau 2 grau 3 grau Total CIDADE A N ALUNOS % 19.286 0,091 1.681 0,0079 234 0,0011 21.201 1,0 CIDADE B N ALUNOS % 38.660 0,091 3.399 0,008 424 0,001 42.483 1,0

Fonte: Dados Fictcios Nota 2: Em geral, quando usamos a base 100, os nmeros so arredondados at a 1 casa decimal e quando tomamos 1 por base, so arredondados at a 3 casa decimal. Exerccio: Escolas A Nmero Estudantes 175 Por 1 0,098 Por 100 9,8 10

B C D E F Total

222 202 362 280 540 1.781 ndices

1,0

100

So razes entre duas grandezas tais que uma no inclui a outra Densidade Demogrfica = Populao / Superfcie ndices econmicos : Produo per capita Renda per capita Receita per capita = valor total da produo / Populao Consumo per capita = consumo de bens / Populao = Renda / Populao = Receita / Populao Os Coeficientes Os coeficientes so as razes entre o nmero de ocorrncias e o nmero total ( nmero de ocorrncias e nmero de no ocorrncias ). Coeficiente de natalidade = nmero de nascimentos / Populao total Coeficiente de mortalidade = nmero de bitos / Populao total Coeficiente de evaso escolar = nmero de alunos evadidos / Nmero de alunos inscritos Coeficiente de aproveitamento escolar = nmero de alunos aprovados / Nmero inicial de matrculas Taxas As taxas so os coeficientes multiplicados por uma potncia de 10 ( 10, 100, 1000, etc. ) para tornar o resultado mais inteligvel. O mais usual utilizar 100 para se expressar taxas. Taxa de mortalidade = coeficiente de mortalidade 100 Taxa de natalidade = coeficiente de natalidade 100 Grficos O grfico estatstico uma forma de apresentao de dados estatsticos, cujo objetivo o de produzir, no investigador ou no pblico em geral, uma impresso mais rpida e viva do fenmeno em estudo, j que os grficos falam mais rpido compreenso do que as sries. A representao grfica de um fenmeno deve obedecer a certos requisitos fundamentais para ser realmente til: 11

a. Simplicidade o grfico deve ser destitudo de detalhes de importncia secundria, que possam levar o observador a uma anlise morosa ou com erros. b. Clareza estudo. O grfico deve expressar a verdade sobre o fenmeno em

c. Veracidade o grfico deve expressar a verdade sobre o fenmeno em estudo. Principais tipos de grficos: Diagramas So os grficos geomtricos de, no mximo, duas dimenses. Para sua cosntruo em geral fazemos uso do sistema cartesiano. Os tipos de diagramas so o grfico em linha ou curva, o grfico em colunas ou barras, o grfico em colunas ou barras mltiplas e o grfico em setores. Grfico em linha constitui uma aplicao do processo de representao das funes num sistema de coordenadas cartesianas. Nesse sistema fazemos uso de duas retas perpendiculares; as retas so os eixos coordenados e o ponto de interseco, a origem. O eixo horizontal denominado eixo das abscissas ( ou eixo dos xx ) e o vertical o eixo das coordenadas ( ou eixo dos yy ). Exemplo: - 92 PRODUO BRASILEIRA DE LEO DE DEND 1987
Anos 1987 1988 1989 1990 1991 1992 FONTE: Agropalma Produo ( 1.000 t ) 39,3 39,1 53,9 65,1 69,1 59,5

PRODUO BRASILEIRA DE LEO DE DEND 1987 - 92


1.000 t

80 70 60 50 40 30 20 10 0 1987 1988 1989 1990 1991 1992

FONTE: Agropalma

12

Grfico em colunas ou barras a representao por meio de retngulos, dispostos verticalmente ( em colunas ) ou horizontalmente ( em barras ). Quando em colunas, os retngulos tm a mesma base e a salturas so proporcionais aos respectivos dados. Quando em barras, os retngulos tm a mesma altura e os comprimentos so proporcionais aos respectivos dados. a.Grfico em colunas PRODUO BRASILEIRA DE LEO DE DEND 1987 - 92
1.000 t

80 70 60 50 40 30 20 10 0 1987 1988 1989 1990 1991 1992

FONTE: Agropalma

b. Grfico em barras PRODUO BRASILEIRA DE LEO DE DEND 1987 - 92


1992 1991 1990 1989 1988 1987 0 20 40 60
1.000 t

80

FONTE: Agropalma

Grfico em colunas ou barras duplas Tipo empregado quando queremos representar, simultaneamente, dois ou mais fenmenos estudados com o propsito de comparao.

13

BALANA COMERCIAL DO BRASIL 1989 - 93


Anos 1989 1990 1991 1992 1993 Valor ( US$ 1.000.000 ) Exportaes Importaes 34.383 18.263 31.414 20.661 31.620 35.793 38.783 21.041 20.554 25.711

FONTE: Ministrio da Fazenda

BALANA COMERCIAL DO BRASIL 1989 - 93


45.000 40.000 35.000 30.000 25.000 20.000 15.000 10.000 5.000 1989 1990 1991 1992 1993

EXPORTAO IMPORTAO

FONTE: Ministrio da Fazenda

Grficos por Setores Este grfico construdo com base em um crculo e empregado sempre que desejamos ressaltar a participao do dado no total. O total representado pelo crculo, que fica dividido em tantos setores quantas so as partes. Os setores so tais que suas reas so respectivamente proporcionais aos dados da srie. Obtem-se cada setor atravs de uma regra de trs simples e direta. Exemplo: REBANHO SUNO DO SUDESTE DO BRASIL 1992
Estados Minas Gerais Esprito Santo Rio de Janeiro So Paulo Total
FONTE: IBGE

Quantidade ( mil cabeas ) 3.363,7 430,4 308,5 2.035,9 6.138,5

14

REBANHO SUNO DO SUDESTE DO BRASIL

Minas Gerais Esprito Santo Rio de Janeiro So Paulo

FONTE: IBGE

Temos: 6.138,5 360 3.363,7 X 1 X2 = 25 X3 = 18 X4 = 120 Cartograma a representao grfica sobre uma carta geogrfica Grfico empregado com o objetivo de figurar os dados estatsticos diretamente relacionados com reas geogrficas ou polticas Distingui-se suas aplicaes: a. Representar dados absolutos (populao) neste caso, lanamos mo, em geral, dos pontos, em nmero proporcional aos dados . b. Representar dados relativos (densidade) neste caso, lanamos mo, em geral, de hachuras ou cores. POPULAO PROJETADA DA REGIO SUL DO BRASIL 1994
Estados Paran Santa Catarina Rio Grande do Sul
FONTE: IBGE

X1 = 3.363,7 360 = 197,2 197

anlogamente 6.138,5

Populao (hab) 8.651.100 4.767.800 9.475.900

rea (km) 199.324 95.318 280.674

Densidade 43,4 50,0 33,88

15

Pictograma Constitui um dos processos grficos que melhor fala ao pblico, pela sua forma ao mesmo tempo atraente e sugestiva. A representao grfica consta de figuras. POPULAO DO BRASIL - 1960-90
Anos 1960 1970 1980 1990 FONTE: IBGE Populao (milhares) 70.070,4 93.139,0 118.562,5 155.822,4

Distribuio de Freqncia A forma pela qual podemos descrever os dados estatsticos resultantes de variveis quantitativas, como por exemplo estatura de alunos, salrios de funcionrios de uma empresa, etc. Suponhamos ter-se executado uma coleta de dados relativos s estaturas de quarenta alunos de uma classe do colgio A, a saber: ESTATURAS DE 40 ALUNOS DO COLGIO A
166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161

Esta uma tabela cujos elementos no foram numericamente organizados e qual denominamos tabela primitiva. Assim difcil formarmos uma idia exata do comportamento do grupo como um todo, a partir de dados no ordenados. A maneira mais simples de organizarmos os dados atravs de uma certa ordenao (crescente ou decrescente). A tabela obtida aps a ordenao dos dados recebe o nome de rol. Organizando a tabela teremos:

ESTATURAS DE 40 ALUNOS DO COLGIO A


150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173

Podemos agora saber com relativa facilidade qual a maior e a menor estatura, por exemplo, da turma. Com um exame mais acurado podemos 16

perceber que temos alguns alunos que possuem a mesma altura, portanto h uma concentrao de alunos com determinada estatura. A varivel estatura ser mais observada e estudada facilmente se dispusermos os dados ordenados em uma tabela. Determinamos frequncia o nmero de alunos que fica relacionado a um determinado valor da varivel. Obtemos, assim, uma tabela que recebe o nome de distribuio de freqncia. ESTATURAS DE 40 ALUNOS DO COLGIO A
Estatura ( cm ) 150 151 152 153 154 155 156 157 158 160 161 162 163 164 165 166 167 168 169 170 172 173 Total Frequncia 1 1 1 1 1 4 3 1 2 5 4 2 2 3 1 1 1 2 1 1 1 1 40

Mas o processe dado ainda incoveniente pois exige muito espao para demosntrar os dados da tabela em questo e, sendo possvel, a soluo mais aceitvel, pela prpria natureza da varivel contnua, o agrupamento dos valores em vrios intervalos, em intervalos de 4 cm, por exemplo teramos a tabela abaixo, denominada distribuio de freqncia com intervalos de classe.

17

ESTATURAS DE 40 ALUNOS DO COLGIO A


Estatura ( cm ) 150 154 154 158 158 162 162 166 166 170 170 174 Total Frequncia 4 9 11 8 5 3 40

Ao agrupar-se os valores da varivel em classes, ganha-se em simplicidade mas perde-se em pormenores, pois no se consegue saber exatamente quantos alunos possuem a altura de 150, embora sabe-se com exatido que na classe h 4 alunos com estatura de 150 a 154 cm. O que se pretende realar com essa tabela o que h de essencial nos dados e, tambm, tornar possvel o uso de tcnicas analticas para sua total descrio, at porque a Estatstica tem por finalidade analisar o conjunto de valores desinteressando-se pelo estudo de casos isolados. Elementos de uma Distribuio de Freqncia Classes de Freqncia ou Classes ( k ) so intervalos de variao da varivel, assim em nosso exemplo, o intervalo 154 158 define a segunda classe. Podemos afirmar que a distribuio acima formada por 6 classes. Limites de Classe os extremos de cada classe Limite inferior da classe o menor nmero da classe. No exemplo da distribuio acima, na segunda classe o limite inferior 154 cm. Limite superior o maior nmero da classe. No exemplo da distribuio acima, na segunda classe o limite superior 158 cm. Amplitude ou intervalo de classe ( h ) a medida de intervalo que define a classe. No exemplo da distribuio acima, na segunda classe temos a amplitude de 4 cm ( 158 cm 154 cm ). Amplitude Total da distribuio a medida de intervalo que define a distribuio. No exemplo da distribuio acima, a amplitude da distribuio de 24 cm ( 174 cm 150 cm ). Podemos calcular a amplitude da distribuio, atravs da relao: AT=k*h 18

Ponto Mdio de uma classe o ponto que divide o intervalo de classe em duas partes iguais. Para obtermos esse ponto no exemplo da distribuio acima, somamos os valores dos limites inferior e superior e dividimos por 2.: X = (154 + 158)/2 = 156

ESTATURAS DE 40 ALUNOS DO COLGIO A


Estatura ( cm ) 150 154 154 158 158 162 162 166 166 170 170 174 Total xi 152 156 160 164 168 172

Freqncia simples ou absoluta simbolizada por fi o nmero de observaes correspondentes classe. No exemplo da distribuio acima, a freqncia da 2 classe 9 alunos. Freqncia relativa simbolizada por fri, so os valores das razes entre as freqncias simples e a freqncia total.
ESTATURAS DE 40 ALUNOS DO COLGIO A Estatura ( cm ) 150 154 154 158 158 162 162 166 166 170 170 174 Total Fi 4 9 11 8 5 3 40 Fri 4/40 = 0,1 9/40 = 0,2 11/40 = 0,3 8/40 = 0,2 5/40 = 0,1 3/40 = 0,1 1

O objetivo das freqncias relativas o de permitir a anlise ou facilitar as comparaes.

19

Freqncia acumulada simbolizada por Fac, o total de todos os valores inferiores ao limite superior de uma dada classe.
ESTATURAS DE 40 ALUNOS DO COLGIO A Estatura ( cm ) 150 154 154 158 158 162 162 166 166 170 170 174 Total fi 4 9 11 8 5 3 40 Fac 4 13 24 32 37 40

Freqncia acumulada relativa simbolizada por facr, so os valores das razes entre as freqncias acumuladas absolutas e a freqncia total.

ESTATURAS DE 40 ALUNOS DO COLGIO A Estatura ( cm ) 150 154 154 158 158 162 162 166 166 170 170 174 Total fi 4 9 11 8 5 3 40 Fac 4 13 24 32 37 40 Facr 4/40 = 0,1 13/40 = 0,3 24/40 = 0,6 3240 = 0,8 37/40 = 0,9 40/40 = 0,1

Freqncia acumulada decrescente e freqncia acumulada decrescente relativa simbolizada por Fac dec, o total de todos os valores superiores ao limite superior de uma dada classe e a freqncia acumulada decrescente relativa simbolizada por facr dec, so os valores das razes entre as freqncias acumuladas absolutas decrescentes e a freqncia total.

ESTATURAS DE 40 ALUNOS DO COLGIO A Estatura ( cm ) 150 154 154 158 158 162 fi 4 9 11 Fac dec 40 36 27 Facr 40/40 = 1 36/40 = 0,9 27/40 = 0,6

20

162 166 166 170 170 174 Total

8 5 3 40

16 8 3

16/40 = 0,4 8/40 = 0,2 3/40 = 0,1

Representao Grfica de uma Distribuio Uma distribuio de freqncia pode ser apresentada graficamente pelo histograma, pelo polgono de freqncia e pelo polgono de freqncia acumulada ( ou ogiva de Galton ). Histograma utilizado na representao grfica de dados agrupados em classes, o que ocorre normalmente com dados contnuos. O seu uso recomendado quando: Os valores da varivel so inteiros e no-inteiros, ou somente nointeiros A quantidade de valores da varivel grande, no caso de valores inteiros ( discretos ) No for importante a perda de informao ocasionada pelos dados. Histograma referente tabela estaturas de 40 alunos do colgio A.
12 10 8 6 4 2 0

150 174

154

158

162

166

170

Polgono de Freqncia um grfico em linha, sendo as freqncias marcadas sobre perpendicularidades ao eixo horizontal, levantadas pelos pontos mdios dos intervalos de classe. Polgono de Freqncia Simples referente tabela estaturas de 40 alunos do colgio A. 21

12 10 8 6 4 2 0

Polgono de Freqncia Acumulada traado marcando-se as freqncias acumuladas sobre perpendicularidades ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Polgono de Freqncia Acumulada referente tabela estaturas de 40 alunos do colgio A.
50 40 30 20 10 0

Formas de curvas de freqncia a representao grfica de uma distribuio por meio de uma curva regular, que procura acompanhar o mesmo traado e a mesma rea subtendida pelo polgono. Distribuio Simtrica

16 14 12 10 8 6 4 2 0

Distribuio Assimtrica Positiva 22

Distribuio Assimtrica Negativa


20 15 10 5 0

Medidas Descritivas - Medidas de Posio Medidas que possibilitam representar um conjunto de dados relativos observao de determinado fenmeno de forma resumida. So as medidas de posio ou medidas da tendncia central, pois representam os fenmenos pelos seus valores mdios, em torno dos quais tendem a concentrar-se os dados. Mdia Aritmtica dados no agrupados- Sejam x, x, ..., x, portanto n valores da varivel X. A mdia aritmtica simples de X representada por: X= x/ N Exemplo: Seja um conjunto de n valores, a saber: {3, 7, 8, 10, 11 }. Seja n o n de elementos do conjunto, nesse caso n= 5 A mdia x =(3 + 7 + 8 + 10 + 11)/5 = 7,8 Mdia Aritmtica dados agrupados Quando os dados estiverem agrupados numa distribuio de freqncia, usa-se a mdia aritmtica dos valores x, x, ... , x, ponderados pelas respectivas frequncias absolutas F, F, ... , F. X= x F / N
X 1 2 3 F 1 3 5 xF 1 6 15

23

1 10

4 26

Ma = x F /N= 26/10 = 2,6 Mdia Geomtrica Sejam x, x, ..., x, valores de X, associados s freqncias absolutas F, F, ... , F, respectivamente. A mdia geomtrica de X definida pelo produto de cada x elevado respectiva F de cada classe da distribuio elevado raiz n Sendo a distribuio abaixo, X F 1 1 2 3 3 5 4 1 1 0 A mdia geomtrica : Mg = Raiz dcima de ( 1 x 8 x 243 x 4 ) = 2,45 Mdia Harmnica - Sejam x, x, ..., x, valores de X, associados s freqncias absolutas F, F, ... , F, respectivamente. A mdia harmnica de X definida pela diviso de n pelo somatrio da diviso da freqncia por seus respectivos valores de X. Mh = _________N______________ F / x Seja a tabela:
X 1 2 3 4 3 5 1 1 0 F 1 F / Xi 1 1 3 2 5 3 1 4 / / / /

x F 1 = 1 2 = 8 35 = 243 4 = 4

+ F / x + ... + F / x

24

Mh =

_________10____________ = 2,26 1/1 + 3 /2 + 5/3 + 1/4

Mdia ponderada - o quociente entre a soma dos produtos dos valores da varivel pelos respectivos pesos e a soma dos pesos. Exemplo: quatro provas com pesos 1, 2, 3, 4 Notas 8, 7, 9 e 9 X = (( 8 x 1 ) + ( 7 x 2 ) + ( 9 x 3 ) + ( 9 x 4 ))/(1+2+3+4) = 8,5 Moda Denominamos moda o valor que ocorre com maior freqncia em uma srie de valores. Dados no agrupados Quando lidamos com valores no agrupados, a moda facilmente reconhecvel, basta, de acordo com a definio, procurar o valor que mais se repete. a. Para a srie de dados: 7, 8, 9, 10, 10, 10, 11, 12, 13, 15 A moda igual a 10. b. Para a srie de dados: 3, 5, 8, 10, 12, 13 No h moda, portanto uma distribuio amodal c. Para a srie de dados: 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 Temos duas modas, 4 e 7, portanto uma distribuio bimodal

Dados agrupados Com intervalos de classe A classe que apresenta maior freqncia denominada classe modal. Pela definio, podemos afirmar que a moda nesse caso o valor dominante que est compreendido entre os limites da classe modal. O mtodo mais simples para o clculo da moda consiste em tomar o ponto mdio da classe modal. Damos a esse valor a denominao de moda bruta, temos ento: Mo = l + L moda l L - limite superior da classe modal Assim, para a distribuio:
ESTATURAS DE 40 ALUNOS DO COLGIO A

onde: l limite inferior da classe

25

Estatura ( cm ) 150 154 154 158 158 162 162 166 166 170 170 174 Total

fi 4 9 11 8 5 3 40

Temos a classe modal de maior freqncia, 11, onde l ( limite inferios da classe modal ) 158cm e L ( limite superior da classe modal ) 162cm, portanto: Mo = l + L = 158 + 162 = 320 = 160 cm 2 2 2

Utilizando-se o mtodo mais elaborado, como o mtodo de Czuber, teramos: Mo = l + ( D1 / (D1 + D2) ) x h onde: D1 - fi f ( ant ) D2 - fi f ( post ) l limite inferior da classe modal h amplitude da classe modal sendo: fi freqncia simples da classe modal f ( ant. ) freqncia simples da classe anterior classe modal; f ( post. ) freqncia simples da classe posterior classe modal portanto para a distribuio acima, temos para o clculo da moda pelo mtodo de Czuber: Mo = l + ( D1 / (D1 + D2) ) x h = 158 + (2 /(2+3)) x 4 = 159,6

Mediana - A mediana uma outra medida de posio definida como o nmero que se encontra no centro de uma srie de nmeros, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo nmero de elementos. 26

Seja a srie abaixo de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9, De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao ( crescente ou decrescente ) dos valores: 2, 5, 6, 9, 10, 13, 15, 16, 18 Em seguida, tomamos o valor central que apresenta o mesmo nmero de elementos esquerda e direita. Em nosso exemplo, esse valor o 10, j que, nessa srie, h quatro elementos acima dele e quatro abaixo. Temos ento: Md = 10, ou seja, o termo de ordem (n + 1)/2 , para a srie acima que possui n = 9 elementos, a mediana ( 9 + 1 )/2 = 5, o 5 termo da srie. Se a srie contivesse um nmero de elementos pares, assim como: 2, 5, 6, 9, 10, 13, 15, 16 Teramos a mediana como a mdia aritmtica dos termos de ordem n/2 e n/2 + 1. Como a sire acima possui 8 elementos, temos: n=8 8/2 = 4 e 8/2 + 1 = 5 logo a mediana a mdia aritmtica do 4 e 5 termo da srie. Md = (9 + 10)/2 = 9,5 Notas: 1. O valor da mediana pode coincidir ou no com um elemento da srie, como vimos. Quando os elementos da srie for impar, h coincidncia. O mesmo no acontece, porm, quando esse nmero par. 2. A mediana, a mdia e a moda no tm necessariamente o mesmo valor. Seja a srie: 1, 2, 3, 4, 5, 5, 50 Temos: Mediana = 4 Mdia = 10 Moda = 5

Dados Agrupados: 1. Determinamos as freqncias acumuladas. 27

2. Calculamos

F / 2

3. Marcamos a classe correspondente freqncia acumulada imediatamente superior F / 2 classe mediana e, em seguida, empregamos a frmula: Md = l + [ F / 2 F ac ant ] x h Fi Onde: l limite inferior da classed a mediana F ac ant Freqncia acumulada da classe anterior classe mediana Fi Freqncia simples da classe mediana h amplitude do intervalo da classe da mediana
ESTATURAS DE 40 ALUNOS DO COLGIO A Estatura ( cm ) 150 154 154 158 158 162 162 166 166 170 170 174 Total fi 4 9 11 8 5 3 40 Fac 4 13 24 32 37 40

O valor da mediana segundo a tabela acima: F / 2 = 40 / 2 = 20 Fi = 11 l = 158 F ac ant = 13 h = 162 158 = 4 Md = 158 + [ 20 13 ] x 4 = 160,5 cm 11 Separatrizes A mediana caracteriza uma srie de valores devido sua posio central. No entanto, ela apresenta uma outra caracterstica, to importante quanto primeira: ela separa a srie em dois grupos que apresentam o mesmo nmero de valores. Assim, alm das medidas de posio que estudamos, h outras que, consideradas individualmente, no so medidas de tendncia central, mas esto ligadas mediana relativamente sua segunda caracterstica, j que se baseiam em sua posio na srie. Essas medidas os quartis, 28

os percentis e os decis so juntamente com a mediana, conhecidas como separatrizes. Quartis Os valores de uma srie que a dividem em quatro partes iguais: a. Primeiro quartil ( Q1 ) valor situado de tal modo na srie que uma quarta parte ( 25% ) dos dados menor que ele e as trs quartas partes restantes ( 75% ) so maiores. b. Segundo quartil ( Q2 ) coincide com a mediana ( Q2 = Md ). c. Terceiro quartil ( Q3 ) valor situado de tal modo que as tr6es quartas partes ( 75% ) dos termos so menores que ele e uma quarta parte ( 25% ) maior. Quando os dados so agrupados, para determinar os quartis usamos a mesma tcnica do clculo da mediana, bastando substituir, na frmula da mediana, Fi / 2, por k Fi / 4, onde k o nmero de ordem do quartil. Assim temos: Q1 = l + [ F / 4 F ac ant ] / Fi x h e Q3 = l + [3 F / 4 F ac ant ] / Fi x h

Percentis Os valores de uma srie que a dividem em cem partes iguais: O clculo de um percentil segue a mesma tcnica do clculo da mediana, porm a frmula Fi/2 ser substituda por: k Fi 100 Sendo k o nmero de ordem do percentil. Assim para o 72 percentil temos: K = 72 P72 = l + [27 F / 100 F ac ant ] / Fi x h

29