Sei sulla pagina 1di 21

FRMULAS DE ESTATSTICA N + 1 Xi Fi X= media X= N +1 Xi = varivel em estudo Fi = freqncia 2 2 Moda = varivel que ocorre com maior freqncia.

. Achar o elemento da mediana na Fac ____________________________________________________________________________________________________________ MEDIANA Tipo B Para achar o elemento da mediana tipo B 1) Achar o elemento central N/2 (posio do elemento da mediana) 2) Procurar em Fac a posio do elemento da mediana (classe da mediana) ( N/2 Fac anterior ) Md= Li + Fi 1) 2) Moda Tipo B Quem a maior freqncia? Na coluna do Fi encontrar a classe modal 1 Mo= moda Mo = Li + 1 + 2 . h onde 1= Fi maior Fi anterior onde 2= Fi maior Fi posterior .h para distribuio do tipo B varivel contnua Para achar o elemento da mediana Tipo A N N par e N Md = mediana Tipo A N impar 2

Percentil = in/100 para achar o elemento do percentil procurado (ver na Fac a posio do elemento) Quartil = in/4 para achar o elemento do quartil procurado (ver na Fac a posio do elemento) Decil = in/10 para achar o elemento do decil procurado (ver na Fac a posio do elemento) Pi = Li + { in/100

Fac anterior }. h Fi X - Mo As =

Qi = Li + { in/4

Fac anterior }.h Fi X S Mo

Di = Li + { in/10

- Fac anterior }. h
Fi

Assimetria = As

As =

As = 0 Simtrica 1 As > 0 Assimtrica positiva

As < 0

Assimtrica negativa

= N

Xi . Fi

( Xi . Fi ) N


CV = X

1 S = ------N-1 . Xi Fi - ( Xi Fi ) N K = 1 + 3, 32 log N R h = ----K Ls - Li h = -----------K

s=

s2

S CV = X

Para achar o n de classes

Para achar o valor do intervalo Ls + Li Xi = 2

Onde Li limite inferior - valor do menor dado Ls limite superior valor do maior dado

Para os demais Xi devemos somar o o valor do intervalo. (Xi o ponto mdio entre o Li e o Ls)

A ESTATSTICA uma parte da matemtica aplicada que fornece mtodos para coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises. A coleta, a organizao, a descrio dos dados, o clculo e a interpretao de coeficientes pertencem ESTATSTICA DESCRITIVA, enquanto a anlise e a interpretao dos dados, associado a uma margem de incerteza, ficam a cargo da ESTATSTICA INDUTIVA ou INFERENCIAL, tambm chamada como a medida da incerteza ou mtodos que se fundamentam na teoria da probabilidade. FASES DO MTODO ESTATSTICO 1 - DEFINIO DOS OBJETIVOS: Saber exatamente aquilo que se pretende pesquisar, local, grau de preciso, tipo de amostragem, tamanho da amostra, tempo disponvel e custo previsto. 2 - PLANEJAMENTO: Como levantar informaes? Que dados devero ser obtidos? Qual levantamento a ser utilizado? Censitrio? Por amostragem? E o cronograma de atividades? 3 - COLETA DE DADOS: Fase operacional. o registro sistemtico de dados, com um objetivo determinado. quando so publicados pela prpria pessoa ou organizao que os haja recolhido. Ex: tabelas do censo demogrfico do IBGE. Dados secundrios: quando so publicados por outra organizao. Ex: quando determinado jornal publica estatsticas referentes ao censo demogrfico extradas do IBGE. OBS: mais seguro trabalhar com fontes primrias. O uso da fonte secundria traz o grande risco de erros de transcrio. Coleta Direta: quando obtida diretamente da fonte. Ex: Empresa que realiza uma pesquisa para saber a preferncia dos consumidores pela sua marca. Coleta contnua: registros de nascimento, bitos, casamentos; Coleta peridica: recenseamento demogrfico, censo industrial; Coleta ocasional: registro de casos de dengue. Coleta Indireta: feita por dedues a partir dos elementos conseguidos pela coleta direta, por analogia, por avaliao, indcios ou proporcionalizao.
Dados primrios:

4 - INSTRUMENTOS DE COLETA DE DADOS: Observao, Entrevista, questionrio, formulrio, tele marketing, mtodo interativo. 5 - CRTICA DE DADOS: Externa: visa as causas dos erros por parte do informante, por distrao, m interpretao das perguntas que foram feitas. Interna: quando visa observar os elementos originais dos dados da coleta. 6 - APURAO DOS DADOS: Resumo dos dados atravs de sua contagem e agrupamento. a condensao e tabulao de dados. Pode ser manual, eletrnico, eletro-eletrnico, mecnico, etc. 7 - APRESENTAO DOS DADOS: H duas formas de apresentao, que no se excluem mutuamente. A apresentao tabular, ou seja, uma apresentao numrica dos dados em linhas e colunas distribudas de modo ordenado, segundo regras prticas fixadas pelo Conselho Nacional de Estatstica. A apresentao grfica dos dados numricos constitui uma apresentao geomtrica permitindo uma viso rpida e clara do fenmeno.

8 - ANLISE E INTERPRETAO DOS DADOS: A ltima fase do trabalho estatstico a mais importante e delicada. Est ligada essencialmente ao clculo de medidas e coeficientes, cuja finalidade principal descrever o fenmeno (estatstica descritiva). DEFINIES BSICAS DA ESTATSTICA. FENMENO ESTATSTICO: qualquer evento que se pretenda analisar, cujo estudo seja possvel aplicao do mtodo estatstico. Tambm chamada de varivel que convencionalmente o conjunto de resultados possveis de um fenmeno em estudo. DADO ESTATSTICO: um dado numrico e considerada a matria-prima sobre a qual iremos aplicar os mtodos estatsticos. POPULAO: o conjunto total de elementos portadores de, pelo menos, uma caracterstica em comum. AMOSTRA: uma parcela representativa da populao, retirada segundo regras convenientes com o propsito de tirarmos concluses sobre a essa populao, sem perder as caractersticas em comum. PARMETROS: So valores singulares que existem na populao e que servem para caracteriz-la. Para definirmos um parmetro devemos examinar toda a populao. ESTIMATIVA: um valor aproximado do parmetro e calculado com o uso da amostra. ATRIBUTO: quando os dados estatsticos apresentam um carter qualitativo, o levantamento e os estudos necessrios ao tratamento desses dados so designados genericamente de estatstica de atributo. VARIVEL: o conjunto de resultados possveis de um fenmeno. VARIVEL QUALITATIVA: Quando seus valores so expressos por atributos: sexo, cor da pele, etc. VARIVEL QUANTITATIVA: Quando os dados so de carter nitidamente quantitativo, e o conjunto dos resultados possui uma estrutura numrica, trata-se, portanto da estatstica de varivel e se dividem em: VARIVEL DISCRETA OU DESCONTNUA: Seus valores so expressos geralmente atravs de nmeros inteiros no negativos. Resulta normalmente de contagens. Ex: nmeros de alunos presentes s aulas, nmero de carteiras, nmero de carros, etc. VARIVEL CONTNUA: Resulta normalmente de uma mensurao, e a escala numrica de seus possveis valores corresponde ao conjunto R dos nmeros Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex.: Quando voc vai medir a temperatura de seu corpo, medidas de peso, medidas de altura, etc. AMOSTRAGEM MTODOS PROBABILSTICOS Exige que cada elemento da populao possua determinada probabilidade de ser selecionado. Normalmente possuem a mesma probabilidade. Assim, se N for o tamanho da populao, a probabilidade de cada elemento ser selecionado ser 1/N. Trata-se do mtodo que garante cientificamente a aplicao das tcnicas estatsticas de inferncias. Somente com base em amostragens probabilsticas que se podem realizar inferncias ou indues sobre a populao a partir do conhecimento da amostra.

uma tcnica especial para recolher amostras, que garantem, tanto quanto possvel, o acaso na escolha.

AMOSTRAGEM CASUAL ou ALEATRIA SIMPLES o processo mais elementar e freqentemente utilizado. equivalente a um sorteio lotrico. Pode ser realizada numerando-se a populao de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatrio qualquer, x nmeros dessa seqncia, os quais correspondero aos elementos pertencentes amostra. Ex: Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90 alunos de uma escola: 1 - numeramos os alunos de 1 a 90. 2 - escrevemos os nmeros dos alunos, de 1 a 90, em pedaos iguais de papel, colocamos na urna e aps mistura retiramos, um a um, nove nmeros que formaro a amostra. OBS: quando o nmero de elementos da amostra muito grande, esse tipo de sorteio torna-se muito trabalhoso. Neste caso utiliza-se uma Tabela de nmeros aleatrios, construda de modo que os algarismos de 0 a 9 so distribudos ao acaso nas linhas e colunas. .AMOSTRAGEM PROPORCIONAL ESTRATIFICADA: Quando a populao se divide em estratos (sub-populaes), convm que o sorteio dos elementos da amostra leve em considerao tais estratos, da obtemos os elementos da amostra proporcional ao nmero de elementos desses estratos. Exemplo: Exemplo: Certa escola infantil com seis salas de aula resolveu retirar uma amostra proporcional estratificada de 20 alunos para um determinado passeio. Tendo a sala A 50 alunos, a sala B 80 alunos, a sala C 70 alunos, a sala D 40 alunos, a sala E 25 alunos e a sala F com 45 alunos, determine a amostra proporcional estratificada.

SALA A B C D E F

N DE AMOSTRA ALUNOS 50 50 X 6,45% = 3,23 80 80 X 6,45% = 5,16 70 70 X 6,45% = 4,51 40 40 X 6,45% = 2,58 25 25 X 6,45% = 1,61 45 45 X 6,45% = 2,90 Total= 310 Amostra =

3 5 4 3 2 3 20

310 alunos 100% 20 alunos X% = Resultado = 6,45% A amostra de 20 alunos corresponde a 6,45% do total de alunos. Aplicando-se a % as sala de alunos obtm-se os valores proporcionais estratificados de cada sala. Arredondar para inteiro por se tratar de alunos. Os arredondamentos devem seguir a resoluo 886/66 do IBGE

AMOSTRAGEM SISTEMTICA: Quando os elementos da populao j se acham ordenados, no h necessidade de construir o sistema de referncia. So exemplos os pronturios mdicos de um hospital, os prdios de uma rua, etc. Nestes casos, a seleo dos elementos que constituiro a amostra pode ser feita por um sistema imposto pelo pesquisador. Ex: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra formada por 50 casas para uma pesquisa de opinio. Podemos, neste caso, usar o seguinte procedimento: como 900/50 = 18, escolhemos por sorteio casual um nmero de 01 a 18, o qual

indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Assim, suponhamos que o nmero sorteado fosse 4 a amostra seria: 4 casa, 22 casa, 40 casa, 58 casa, 76 casa, etc. AMOSTRAGEM POR CONGLOMERADOS (ou AGRUPAMENTOS) Algumas populaes no permitem, ou tornam extremamente difcil que se identifiquem seus elementos. No obstante isso, pode ser relativamente fcil identificar alguns subgrupos da populao. Em tais casos, uma amostra aleatria simples desses subgrupos (conglomerados) pode se colhida, e uma contagem completa deve ser feita para o conglomerado sorteado. Agrupamentos tpicos so quarteires, famlias, organizaes, agncias, edifcios etc. Ex: Num levantamento da populao de determinada cidade, podemos dispor do mapa indicando cada quarteiro e no dispor de uma relao atualizada dos seus moradores. Podese, ento, colher uma amostra dos quarteires e fazer a contagem completa de todos os que residem naqueles quarteires sorteados. MTODOS NO PROBABILSITCOS So amostragens em que h uma escolha deliberada dos elementos da amostra. No possvel generalizar os resultados das pesquisas para a populao, pois as amostras noprobabilsticas no garantem a representatividade da populao. AMOSTRAGEM ACIDENTAL Trata-se de uma amostra formada por aqueles elementos que vo aparecendo, que so possveis de se obter at completar o nmero de elementos da amostra. Geralmente utilizada em pesquisas de opinio, em que os entrevistados so acidentalmente escolhidos. Ex: Pesquisas de opinio em praas pblicas, ruas de grandes cidades; TABELA: um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemtica. De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela devemos colocar : um trao horizontal ( - ) quando o valor zero; trs pontos ( ... ) quando no temos os dados; zero ( 0 ) quando o valor muito pequeno para ser expresso pela unidade utilizada; um ponto de interrogao ( ? ) quando temos dvida quanto exatido de determinado valor. Obs.: O lado direito e esquerdo de uma tabela oficial devem ser abertos. GRFICOS ESTATSTICOSG So representaes visuais dos dados estatsticos que devem corresponder, mas nunca substituir as tabelas estatsticas. Caractersticas: Uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade. So grficos destinados principalmente ao pblico em geral, objetivando proporcionar uma visualizao rpida e clara. So grficos tipicamente expositivos, dispensando comentrios explicativos adicionais. As legendas podem ser omitidas, desde que as informaes desejadas estejam presentes.
Grficos de informao:

So grficos que prestam-se melhor ao trabalho estatstico, fornecendo elementos teis fase de anlise dos dados, sem deixar de ser tambm informativos. Os grficos de anlise freqentemente vm acompanhados de uma tabela estatstica. Inclui-se, muitas vezes um texto explicativo, chamando a ateno do leitor para os pontos principais revelados pelo grfico.
Grficos de anlise:

Uso indevido de Grficos: Podem trazer uma idia falsa dos dados que esto sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de construo de escalas. .

Classificao dos grficos: 1 - DIAGRAMAS:

Diagramas, Pictogramas e Cartogramas.

1.11.2-

So grficos geomtricos dispostos em duas dimenses. So os mais usados na representao de sries estatsticas. Eles podem ser: Grficos em barras horizontais.

Grficos em barras verticais ( colunas ). Quando as legendas no so breves usam-se de preferncia os grficos em barras horizontais. Nesses grficos os retngulos tm a mesma base e as alturas so proporcionais aos respectivos dados. A ordem a ser observada a cronolgica, se a srie for histrica, e a Decrescente, se for geogrfica ou categrica. Grficos em barras compostas. Grficos em colunas superpostas. Eles diferem dos grficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos. Grficos em linhas ou lineares. So freqentemente usados para representao de sries cronolgicas com um grande nmero de perodos de tempo. As linhas so mais eficientes do que as colunas, quando existem intensas flutuaes nas sries ou quando h necessidade de se representarem vrias sries em um mesmo grfico. Quando representamos, em um mesmo sistema de coordenadas, a variao de dois fenmenos, a parte interna da figura formada pelos grficos desses fenmenos denominada de rea de excesso. Grficos em setores. Este grfico construdo com base em um crculo, e empregado sempre que desejamos ressaltar a participao do dado no total. O total representado pelo crculo, que fica dividido em tantos setores quantas so as partes. Os setores so tais que suas reas so respectivamente proporcionais aos dados da srie. O grfico em setores s deve ser empregado quando h, no mximo, sete dados. Obs: As sries temporais geralmente no so representadas por este tipo de grfico.

1.31.4

1.5

1.5

3 - PICTOGRAMAS: So construdos a partir de figuras representativas da intensidade do fenmeno. Este tipo de grfico tem a vantagem de despertar a ateno do pblico leigo, pois sua forma atraente e sugestiva. Os smbolos devem ser auto-explicativos. A desvantagem dos pictogramas que apenas mostram uma viso geral do fenmeno, e no de detalhes minuciosos. Veja o exemplo abaixo: 4- CARTOGRAMAS: So ilustraes relativas a cartas geogrficas (mapas). O objetivo desse grfico o de figurar os dados estatsticos diretamente relacionados com reas geogrficas ou polticas. DISTRIBUIO DE FREQNCIA um tipo de tabela que condensa uma coleo de dados conforme as freqncias (repeties de seus valores). Tabela primitiva ou dados brutos: uma tabela ou relao de elementos que no foram numericamente organizados. difcil formarmos uma idia exata do comportamento do grupo como um todo, a partir de dados no ordenados. Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

Xi = Varivel em estudo X = mdia aritmtica Fi = freqncia = somatrio n = nmero de elementos da amostra DISTRIBUIO DE FREQNCIA DO TIPO A VARIVEL DISCRETA dados no agrupados um tipo de tabela que condensa uma coleo de dados conforme as freqncias (repeties de seus valores). Tabela primitiva ou dados brutos: uma tabela ou relao de elementos que no foram numericamente organizados. difcil formarmos uma idia exata do comportamento do grupo como um todo, a partir de dados no ordenados. Ex : idade de 12 meninos = 7, 9, 7 , 8 , 9 , 4 , 4 , 4 , 6, 7, 4 , 8 ROL: a tabela obtida aps a ordenao dos dados em ordem crescente ou decrescente Ex : 4, 4, 4, 4, 6, 7, 7, 7, 8, 8, 9, 9 a simples condensao dos dados conforme as repeties de seu valores. Veja exemplo abaixo: n = 12
Distribuio de freqncia SEM INTERVALOS DE CLASSE (tipo A)

Mdia aritmtica dos dados obtidos:


Xi X= media X= N =

4+4+4+4+6+7+7+7+8+8+9+9
=

6,4167

12

____________________________________________________________________________________________________________

Mediana de uma distribuio do Tipo A = o elemento central de uma distribuio de dados ordenados em ordem crescente ou decrescente. Exemplo: 5, 5, 7, 7, 7, 7, 7, 8, 8, 9, 9 n= 11 (11 impar)

Frmula para calcular o elemento central onde n impar


n+1 11 + 1 12 = 2 2 2

6 elemento

1 2 3 4 5 6 7 9 10 11 12 5, 5, 7, 7, 7, 7, 7, 8, 8, 9, 9

elemento da mediana valor da mediana

Frmula para calcular o elemento central onde n par


Exemplo= 3, 3, 4, 4, 6, 6, 6, 8, Frmula para n par n n 8 +1 2 2 2 1 2 3 4 5 6 n=8 8 e 7 2 8 +1 logo n par.

5 elementos

3, 3, 4, 4, 6, 4 elemento = 4

6,

6, 8

5 elemento = 6 4 + 6 = 10 2 = 5 (Valor da mediana)


____________________________________________________________________________________________

Moda = valor que ocorre com maior freqncia. Ex: 7, 7, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 11, 11 Valor da moda = 9 ( valor que aparece o maior nmero de vezes)

DISTRIBUIO DE FREQNCIA DO TIPO A VARIVEL DISCRETA dados agrupados


As variveis so agrupadas em uma coluna Xi e as freqncias das variveis em uma coluna Fi. Para o clculo da mdia aritmtica constri-se uma nova coluna para Xi. Fi e multiplica-se a varivel e a freqncia de cada linha. Na soma de todas as multiplicaes de Xi. Fi obtmse o somatrio.

( Xi. Fi)
Para o clculo da mdia, dividimos o somatrio de Xi. Fi pelo nmero de elementos da distribuio. Ex: 7, 7, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 11, 11, 11 onde n= 15 (nmero de elementos da amostra)

Xi Freqncia 7 2 8 3 9 6 10 1 11 3 Total n=15


Xi.Fi
X= media X = N =

Xi . Fi 14 24 54 10 33 Xi Fi = 135

135
=

15

Mediana de dados agrupados:


Ex: 7, 7, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 11, 11, 11 1 - Mediana o elemento central de uma distribuio de dados em ordem crescente ou decrescente; 2 - n par ou impar; 3 Como n = 15 impar ento: n+1 15 + 1 16 =8 2 2 2 4 Encontra-se em Fac o 8 elemento e em Xi o valor da mediana = 9

Xi Freqncia 7 2 8 3 9 6 10 1 11 3 Total n=15


Moda para dados agrupados da distribuio do Tipo A

Fac 2 5 11 12 15

1 ao 2 3 ao 5 6 ao 11 12 13 ao 15

Para encontrarmos a moda, perguntamos quem a maior freqncia? Na coluna de Fi observamos a maior freqncia e na coluna de Xi encontramos o valor da moda = 9 Distribuio de freqncia COM INTERVALOS DE CLASSE Tipo B

Quando o tamanho da amostra elevado, mais racional efetuar o agrupamento dos valores em vrios intervalos de classe.

Classes Freqncias 41 |------- 45 7 45 |------- 49 3 49 |------- 53 4 53 |------- 57 1 57 |------- 61 5 Total 20 ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA (com intervalos de classe) CLASSE: so os intervalos de variao da varivel e o nmero total de classes simbolizada por k. Ex: na tabela anterior k = 5 LIMITES DE CLASSE: so os extremos de cada classe. O menor nmero o limite inferior da classe ( Li ) e o maior nmero, limite superior (Ls) INTERVALO DE CLASSE: h AMPLITUDE TOTAL DA AMOSTRA (Range): a diferena entre o valor mximo e o valor mnimo da amostra (ROL). Onde R = Xmax - Xmin. Em nosso exemplo R = 60 - 41 = 19. PONTO MDIO DE CLASSE: o ponto que divide o intervalo de classe em duas partes iguais. . Ls + Li 2 Mtodo prtico para construo de uma Distribuio de Freqncias do Tipo B varivel contnua. 1 - Organize os dados brutos em um ROL. 8 10 12 12 12 12 13 14 15 16 17 18 19 20 23 24 25 27 29 30 31 32 33 - 34 35 36 37 38 38 39 40 41 43 45 46 47 48 49 50 50 51 52 53 54 60 66 - 66 67 72 - 75 (nmeros inteiros sem casas depois da vrgula) n= 50 log de 50 = 1,6989 2 Calcule a amplitude total Ls Li 75 8 = 67 3 Calcule o nmero de classes atravs da "Regra de Sturges": K= 1 + 3,32 log n K = 1 + 3,32 Log n - onde n o nmero de elementos da amostra K = 1 + 3,32 log n K= 1 + 3,32. 1, 6989 K = 1+ 5,6403 K = 6,6403 K = 7 como o nmero de linhas inteiro, aumentamos uma unidade no valor inteiro encontrado. Ou seja, 6,6403 passa para 7. 4 Clculo do intervalo de classe (h) Ls Li 75 8 67 h= = = = 9,5714 K 7 7 Para definirmos o valor de h verificamos os nmeros da distribuio: 1 Se os nmeros da distribuio so inteiros, o intervalo deve ser inteiro. No clculo do intervalo acima, o valor 9 (inteiro) passa para 10. 2 Se os nmeros da distribuio tm casas depois da vrgula, devemos observar o nmero de casas da vrgula e arredondar em uma unidade a casa depois da vrgula. Exemplos:

1- 2,3 2,4 2,7 3,3 4,6 5,8 utilizando o valor do intervalo acima (9,5714) o valor de h passa para 9,6. 2- 4,67 6,98 7,77 8,13 Utilizando o valor do intervalo anterior (9,5714) o valor de h passa para 9,58 Li Classes Ls Freqncias Para a montagem da freqncia 1- 8|------- 18 11 verificamos quantos dados da 2- 18|------- 28 7 distribuio dada esto nos intervalos 3- 28|------- 38 9 de cada classe. O smbolo |------- representa um 4- 38|------- 48 9 intervalo fechado esquerda e aberto 5- 48|--------58 8 direita. Portanto o valor 18 no pertence quela classe. 6- 58|--------68 4 8 9 10 11 12 13 14 15 16 7- 68|--------78 2 17 = de 8 a 17 (h = 10) n =50 REPRESENTAO GRFICA DE UMA DISTRIBUIO Histograma, Polgono de freqncia e Polgono de freqncia acumulada Em todos os grficos acima utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da varivel e na linha vertical (eixo das ordenadas), as freqncias.. Histograma: formado por um conjunto de retngulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos mdios coincidam com os pontos mdios dos intervalos de classe. A rea de um histograma proporcional soma das freqncias simples ou absolutas.
12 10 8 6 4 2 0 8|------- 18 28|------- 38 38|------- 48 48|--------58

18|------- 28

58|--------68 68|--------78

Li Classes Ls 1- 8|------- 18 2- 18|------- 28 3- 28|------- 38 4- 38|------- 48 5- 48|--------58 6- 58|--------68 7- 68|--------78

Freqncias 11 7 9 9 8 4 2

n =50
Freqncias simples ou absoluta (Fi) so os valores que realmente representam o nmero de dados de cada classe. A soma das freqncias simples igual ao nmero total dos dados da distribuio. Freqncias relativas (Fr): so os valores das razes entre as freqncias absolutas de cada classe e a freqncia total da distribuio. A soma das freqncias relativas igual a 1 (100 %).

Li Classes Ls 1- 8|------- 18 2- 18|------- 28 3- 28|------- 38 4- 38|------- 48 5- 48|--------58 6- 58|--------68 7- 68|--------78

Fi 11 7 9 9 8 4 2

Fr = Freq. relativa 11/50 = 0,22 7/50 = 0,14 9/50 = 0,18 9/50 = 0,18 8/50 = 0,16 4/50 = 0,08 2/50 = 0,04

n =50

Polgono de freqncia: um grfico em linha, sendo as freqncias marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos mdios dos intervalos de classe. Para realmente obtermos um polgono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos mdios da classe anterior primeira e da posterior ltima, da distribuio.
12 11 10 9 8 7 6 4 2 0 8|------- 18 18|------- 28 28|------- 38 38|------- 48 48|--------58 58|--------68 68|--------78 4 2 9 8

Polgono de freqncia acumulada: traado marcando-se as freqncias acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Freqncia simples acumulada de uma classe (Fac): o total das freqncias de todos os valores inferiores ao limite superior do intervalo de uma determinada classe. Freqncia relativa acumulada de um classe (Frac): a freqncia acumulada da classe, dividida pela freqncia total da distribuio. Li Classes Ls 1- 8|------- 18 2- 18|------- 28 3- 28|------- 38 4- 38|------- 48 5- 48|--------58 6- 58|--------68 7- 68|--------78 Freqncia 11 7 9 9 8 4 2 Fac 11 18 27 36 44 48 Fr 0,22 0,14 0,18 0,18 0,16 0,08 0,04 Frac 0,22 0,36 0,54 0,72 0,88 0,96

50

n =50

Fi = freqncia simples; Xi = ponto mdio de classe; Fac = freqncia simples acumulada; Fr = freqncia relativa e Frac = freqncia relativa acumulada.

3. MEDIDAS DE POSIO
Introduo So as estatsticas que representam uma srie de dados orientando-nos quanto posio da distribuio em relao ao eixo horizontal do grfico da curva de freqncia. As medidas de posies mais importantes so as medidas de tendncia central (verifica-se uma tendncia dos dados observados a se agruparem em torno dos valores centrais). As medidas de tendncia central mais utilizadas so: mdia aritmtica, moda e mediana. Outras medidas de tendncia central menos usadas so as mdias: geomtrica, harmnica e geral As outras medidas de posio so as separatrizes, que englobam: a prpria mediana, os decis, os quartis e os percentis. MDIA ARITMTICA = Para distribuio do Tipo B varivel contnua. Com intervalos de classe Neste caso, convencionamos que todos os valores includos em um determinado intervalo de classe coincidem com o seu ponto mdio, e determinamos a mdia aritmtica ponderada por meio da frmula: onde Xi o ponto mdio da classe.
Ls + Li Xi = 2
=

54 + 50
=

104
=

52

Para os demais Xi, devemos somar o valor do intervalo. (Xi o ponto mdio entre o Li e o Ls) Exemplo= 52 + 4 = 56 56 + 4 = 60 60 + 4 = 64 64 + 4 = 68 68 + 4 = 72 Ex: Calcular a estatura mdia de bebs conforme a tabela abaixo. Estaturas (cm) 50 |------------ 54 54 |------------ 58 58 |------------ 62 62 |------------ 66 66 |------------ 70 70 |------------ 74 Fi 4 9 11 8 5 3 n=40 Xi 52 56 60 64 68 72 ..Xi . Fi 208 504 660 512 340 216 Xi Fi =2.440

Xi Fi X= media X= N =

2.440
= 61

cm.

40

MDIA GEOMTRICA = g a raiz n-sima do produto de todos eles. Mdia Geomtrica Simples: ou . Ex.: - Calcular a mdia geomtrica dos seguintes conjuntos de nmeros:E a) { 1, 4, 16, 64 }: = (1 * 4 * 16 * 64 ) ^(1/4) ....R: 8 Ex - Calcular a mdia geomtrica dos valores da tabela abaixo:

...xi... ...fi... 1 2 3 4 9 2 27 1 Total 9 = MDIA HARMNICA h (12 * 34 * 92 * 271) (1/9)........R: 3,8296.

o inverso da mdia aritmtica dos inversos. . Mdia Harmnica Simples:. (para dados no agrupados)

.. MODA - Mo o valor que ocorre com maior freqncia em uma srie de valores. Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais comum, isto , o salrio recebido pelo maior nmero de empregados dessa fbrica. . Com intervalos de classe: A classe que apresenta a maior freqncia denominada classe modal. Pela definio, podemos afirmar que a moda, neste caso, o valor dominante que est compreendido entre os limites da classe modal. Ex: Calcule a estatura modal conforme a tabela abaixo. Classes (em cm) Freqncia 54 |------------ 58 9 58 |------------ 62 11 62 |------------ 66 8 66 |------------ 70 5 Resposta: a classe modal 58|-------- 62, pois a classe de maior freqncia. Fi = 11 Clculo da Moda pela frmula de CZUBER: 1 Mo= moda Mo = Li + . h onde 1= Fi maior Fi anterior 1 + 2 onde 2= Fi maior Fi posterior Li = limite inferior da classe modal..... onde 1= Fi maior Fi anterior onde 2= Fi maior Fi posterior h = amplitude da classe modal 1 11 9 2 Mo = Li + . h Mo = 58 + .4 58 + .4 1 + 2 11-9 + 11-8 5 2.4 Mo = 58 + 5 Mo = 58 + 1,6 = 59,6 Mo = 59,6

Obs: A moda utilizada quando desejamos obter uma medida rpida e aproximada de posio ou quando a medida de posio deva ser o valor mais tpico da distribuio. J a mdia aritmtica a medida de posio que possui a maior estabilidade. MEDIANA - Md A mediana de um conjunto de valores, dispostos segundo uma ordem ( crescente ou decrescente), o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo nmero de elementos.M. Mediana da distribuio do Tipo B Devemos seguir os seguintes passos: 1) Achar o elemento central do conjunto de dados. N/2 2) Construir uma coluna de freqncia acumulada para identificar o elemento procurado. 3) Marcar a classe correspondente freqncia acumulada. Esta classe ser a classe mediana; Li = o limite inferior da classe mediana. Fi= a freqncia da classe mediana. Fac anterior= a freqncia acumulada anterior classe mediana h = o intervalo da classe mediana. Ex: estatura mdia de bebs em cm conforme a tabela abaixo. classes Fi Fac 50 |------------ 54 4 4 (1 ao 4 elemento) 54 |------------ 58 9 13 (5 ao 13 elemento) 58 |------------ 62 11 24 (14 ao 24 elemento) 62 |------------ 66 8 32 (25 ao 32 elemento) 66 |------------ 70 5 37 (33 ao 37 elemento) 70 |------------ 74 3 40 (38 ao 40 elemento) total 40 N/2 para encontrar o elemento central 40: 2 = 20 elemento Logo. a classe mediana ser 58 |---------- 62 Substituindo os dados encontrados na frmula, obtemos: (N/2 Fac anterior) ( 40/2 - 13 ) Md= Li + .h Md = 58 + . 4 Fi 11 ( 20 - 13 ) Md = 58 + . 4 Md = 58 + 2,54 Md = 60,54 11 Emprego da Mediana Quando desejamos obter o ponto que divide a distribuio em duas partes iguais. Quando h valores extremos que afetam de maneira acentuada a mdia aritmtica. Quando a varivel em estudo salrio. SEPARATRIZES Alm das medidas de posio que estudamos, h outras que, consideradas individualmente, no so medidas de tendncia central, mas esto ligadas mediana relativamente sua caracterstica de separar a srie em duas partes que apresentam o mesmo nmero de valores. Essas medidas - os quartis, os decis e os percentis - so, juntamente com a mediana, conhecidas pelo nome genrico de separatrizes..

QUARTIS - Q Denominamos quartis os valores de uma srie que a dividem em quatro partes iguais. Precisamos portanto de 3 quartis (Q1 , Q2 e Q3) para dividir a srie em quatro partes iguais. Obs: O quartil 2 ( Q2 ) SEMPRE SER IGUAL A MEDIANA DA SRIE. Quartis para dados agrupados em classes Usamos a mesma tcnica do clculo da mediana, bastando substituir, na frmula da mediana n/2 por i.n/4 Ex 3 - Calcule os quartis da tabela abaixo: classes Fi Fac 50 |------------ 54 4 4 54 |------------ 58 9 13 58 |------------ 62 11 24 62 |------------ 66 8 32 66 |------------ 70 5 37 70 |------------ 74 3 40 total 40 O quartil 2 = Md , logo: i.n/4 2.40/4 = 20 elemento. Logo.a classe do quartil 2 ser 58 |---------- 62 Substituindo esses valores na frmula, obtemos: Qi = Li + { in/4 - Fac anterior }.h Q2 = 58 + ( 2.40/4 - 13 ) . 4 Fi Q2 = 58 + { 20 - 13 } . 4 11 Q2 = 58 + 2,54 = 60,54 DECIS - D 11 Q2 = 58 + 7 . 4 11

A definio dos decis obedece ao mesmo princpio dos quartis, com a modificao da porcentagem de valores que ficam aqum e alm do decil que se pretende calcular. A frmula bsica ser : i.n/10 onde i o nmero de ordem do decil a ser calculado. Indicamos os decis : D1, D2, ... , D9. Deste modo precisamos de 9 decis para dividirmos uma srie em 10 partes iguais. De especial interesse o quinto decil, que divide o conjunto em duas partes iguais. Assim sendo,o QUINTO DECIL IGUAL AO SEGUNDO QUARTIL, que por sua vez IGUAL MEDIANA.

PERCENTIL ou CENTIL Denominamos percentis ou centis como sendo os noventa e nove valores que separam uma srie em 100 partes iguais. Indicamos: P1, P2, ... , P99. evidente que P50 = Md ; P25 = Q1 e P75 = Q3. O clculo de um centil segue a mesma tcnica do clculo da mediana, porm a frmula ser : i.n / 100 onde i o nmero de ordem do centil a ser calculado.

Disperso ou Variabilidade: a maior ou menor diversificao dos valores de uma varivel em torno de um valor de tendncia central ( mdia ou mediana ) tomado como ponto de comparao.

A mdia - ainda que considerada como um nmero que tem a faculdade de representar uma srie de valores - no pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compem o conjunto.

Consideremos os seguintes conjuntos de valores das variveis X, Y e Z: X = { 70, 70, 70, 70, 70 } Y = { 68, 69, 70 ,71 ,72 } Z = { 5, 15, 50, 120, 160 } Observamos ento que os trs conjuntos apresentam a mesma mdia aritmtica = 350/5 = 70 Entretanto, fcil notar que o conjunto X mais homogneo que os conjuntos Y e Z, j que todos os valores so iguais mdia. O conjunto Y, por sua vez, mais homogneo que o conjunto Z, pois h menor diversificao entre cada um de seus valores e a mdia representativa. Conclumos ento que o conjunto X apresenta DISPERSO NULA e que o conjunto Y apresenta uma DISPERSO MENOR que o conjunto Z. DESVIO PADRO a medida de disperso mais geralmente empregada, pois leva em considerao a totalidade dos valores da varivel em estudo. um indicador de variabilidade bastante estvel. O desvio padro baseia-se nos desvios em torno da mdia aritmtica e a sua frmula bsica pode ser traduzida como : a raiz quadrada da varincia e representada por S quando estudamos uma amostra e por (sigma) quando estudamos a populao.
s= s2

VARINCIA - S2 o desvio padro elevado ao quadrado. A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm extremamente importante na inferncia estatstica e em combinaes de amostras. MEDIDAS DE DISPERSO RELATIVA

Coeficiente de Variao de Pearson - CVP Na estatstica descritiva o desvio padro por si s tem grandes limitaes. Assim, um desvio padro de 2 unidades pode ser considerado pequeno para uma srie de valores cujo valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito. Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais sries de valores, relativamente sua disperso ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou variabilidade dos dados em termos relativos a seu valor mdio, medida essa denominada de CVP: Coeficiente de Variao de Pearson ( A RAZO ENTRE O DESVIO PADRO E A MDIA REFERENTES A DADOS DE UMA MESMA SRIE).

CVP = (S /

) x 100

o resultado neste caso expresso em percentual, entretanto pode ser expresso tambm atravs de um fator decimal, desprezando assim o valor 100 da frmula.

Ex: Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivduos: Discriminao ESTATURAS PESOS MDIA 175 cm 68 kg DESVIO PADRO 5,0 cm 2,0 kg

- Qual das medidas (Estatura ou Peso) possui maior homogeneidade ? Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menor ser o de maior homogeneidade ( menor disperso ou variabilidade). CVP estatura = CVP peso = ( 5 / 175 ) x 100 ( 2 / 68 ) x 100 = 2,85 % = 2,94 %.

Logo, nesse grupo de indivduos, as estaturas apresentam menor grau de disperso que os pesos. Coeficiente de Variao de Thorndike - CVT igual ao quociente entre o desvio padro e a mediana.

CVT = ( S / Md ) x 100 % Coeficiente Quartlico de Variao - CVQ Esse coeficiente definido pela seguinte expresso: CVQ = [(Q3 - Q1) / (Q3 + Q1)] x 100 %. Desvio quartil Reduzido Dqr Dqr = [(Q3 - Q1) / 2Md ] x 100 %.

5. MEDIDAS DE ASSIMETRIA
Introduo: Uma distribuio com classes simtrica quando : Mdia = Mediana = Moda Uma distribuio com classes :

Assimtrica esquerda ou negativa quando : Assimtrica direita ou positiva quando : Coeficiente de assimetria:

Mdia < Mediana < Moda Mdia > Mediana > Moda

A medida anterior, por ser absoluta, apresenta a mesma deficincia do desvio padro, isto , no permite a possibilidade de comparao entre as medidas de duas distribuies. Por esse motivo, daremos preferncia ao coeficiente de assimetria de Person:

As = 3 ( Mdia - Mediana ) / Desvio Padro

Escalas de assimetria: | AS | < 0,15 0,15 < | AS | < 1 | AS | > 1 assimetria pequena assimetria moderada assimetria elevada

Obs: Suponhamos AS = - 0,49 a assimetria considerada moderada e negativa Suponhamos AS = 0,75 a assimetria considerada moderada e positiva. MEDIDAS DE CURTOSE Introduo: Denominamos CURTOSE o grau de achatamento de uma distribuio em relao a uma distribuio padro, denominada curva normal (curva correspondente a uma distribuio terica de probabilidade). Quando a distribuio apresenta uma curva de freqncia mais fechada que a normal (ou mais aguda ou afilada em sua parte superior), ela recebe o nome de leptocrtica. Quando a distribuio apresenta uma curva de freqncia mais aberta que a normal (ou mais achatada em sua parte superior), ela recebe o nome de platicrtica. A curva normal, que a nossa base referencial, recebe o nome de mesocrtica.

Coeficiente de curtose C1 = (Q3 - Q1) / 2(P90 - P10)

Este coeficiente conhecido como percentlico de curtose.

Relativamente a curva normal, temos: C1 = 0,263 C1 < 0,263 C1 > 0,263 curva mesocrtica curva leptocrtica curva platicrtica

O coeficiente abaixo ( C2 )ser utilizado em nossas anlises:

onde S desvio padro C2 = 3 curva mesocrtica C2 > 3 curva leptocrtica C2 < 3 curva platicrtica

IV Formato de uma distribuio


O terceiro e quarto momentos1 de uma distribuio so freqentemente usados para estudar a aparncia de uma distribuio, em especial sua assimetria e sua curtose. Em outras palavras, a distribuio dos dados pode ser simtrica ou no, ou ainda achatada ou pontiaguda e, isso, dar um formato curva de distribuio. 4.1 - Medida de Assimetria Denomina-se assimetria o grau de afastamento da simetria de uma distribuio de dados. Em uma distribuio simtrica, tem-se igualdade dos valores da mdia, mediana e moda. Entretanto, se numa distribuio ocorrer: a) X Md Mo : existiro mais dados da srie maiores do que a mdia, porem a curva de distribuio ter uma cauda mais longa para os dados menores do que a mdia, isto , diz-se que a distribuio tem assimetria negativa; b) X Md Mo : existiro mais dados da srie menores do que a mdia, porm a curva da distribuio ter uma cauda mais longa para os dados maiores do que a mdia, isto , diz-se que a distribuio tem assimetria positiva.

Interpretao a) S = 0 : se o resultado for zero, a distribuio simtrica, b) S < 0 : se o valor for negativo, a distribuio assimtrica negativa (inclinada para a esquerda) e, c) S > 0 : se o resultado for positivo, a distribuio assimtrica positiva (inclinada para a direita). Obs: A assimetria positiva surge quando a mdia aritmtica aumentada por algum valor extraordinariamente elevado e, a assimetria negativa ocorre quando a mdia reduzida por algum valor extremamente baixo. Os dados so simtricos quando no existem valores realmente extremos em uma direo especfica, de modo que os valores baixos e altos se equilibram entre si. Alguns Conceitos Bsicos de varivel aleatria As variveis econmicas so, por sua natureza, aleatrias. No sabemos quais sero seus valores seno depois de observ-los. A probabilidade uma forma de expressar a incerteza sobre eventos e resultados econmicos. Variveis Aleatrias Grande parte dos dados cientficos so obtidos atravs de experimentao. Entretanto, a economia uma cincia social, em que muitos dos dados no se originam de um processo experimental controlado. Um experimento controlado aquele possvel reproduzi-lo mantendo-se controlada pelo pesquisador as condies originais. Ele pode ser repetido sob diferentes variveis de controle para verificar o efeito sobre o resultado. No entanto, embora possa ser repetido, os valores observados no so iguais em cada repetio, dado que as condies de experimento para outro no so realmente idnticas. Neste caso, o resultado uma varivel aleatria. Um experimento no controlado aquele em que o pesquisador um mero expectador dos dados. Ele no tem controle sobre a gerao dos dados. Os valores das variveis econmicas esto sob efeito de um sem nmero de variveis simultaneamente. Neste caso, esses dados so com certeza uma varivel aleatria.

Varivel Aleatria uma varivel cujo valor no conhecido at que seja observado. O valor de varivel no pode ser previsto acuradamente. A varivel aleatria pode ser discreta ou continua. Varivel Aleatria Discreta - so aquelas que s podem assumir valores finitos os quais possam ser contados utilizando-se os nmeros inteiros positivos. Varivel Aleatria Contnua so aquelas que podem tomar qualquer valor real em pelo menos um intervalo na reta real.

Potrebbero piacerti anche