Sei sulla pagina 1di 27

Universidade Federal do Par Ncleo de Altos Estudos Amaznicos Programa de Ps-Graduao em Gesto Pblica

Estatstica

Organizao e elaborao: Profa. Marina Yassuko Toma (UFPA)

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

Belm 2013

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

1 - CONCEITOS FUNDAMENTAIS

1.4 TIPOS DE AMOSTRAGEM E CLCULO AMOSTRAL Quando se deseja colher informaes sobre um ou mais aspectos de um grupo grande ou numeroso, verifica-se, muitas vezes, ser praticamente impossvel fazer um levantamento do todo. Da a necessidade de investigar apenas uma parte desse todo. O problema da amostragem , portanto, escolher uma parte, de tal forma que ela seja a mais representativa possvel do todo e, a partir dos resultados obtidos, relativos a essa parte, poder inferir, o mais legitimamente possvel, os resultados do todo, se esta fosse verificada. Apresenta-se a seguir um resumo dos quatro mtodos mais usuais em amostragem probabilstica. 1.4.1 Amostragem Aleatria Simples (AAS): consistem em selecionar n unidades amostrais de modo que cada unidade tenha a mesma chance de ser escolhida. Em geral quando se tem caractersticas diferentes no se deve fazer a AAS, ou seja, a populao deve ser homognea. Na prtica, a amostra aleatria simples escolhida unidade por unidade. As unidades da populao so numeradas de 1 a N. Em seguida, escolhe-se uma srie de nmeros aleatrios, por meio de uma tabela de nmeros aleatrios, geradores de nmeros aleatrios ( software ou calculadora cientfica) ou colocando-se todos os nmeros dentro de uma urna, retirando-se uma a uma, sem reposio, at completar a amostra de tamanho n. 1.4.2 Amostragem Aleatria Estratificada (AAE): consiste em subdividir a populao em grupos homogneos (denominados estratos) segundo a(s) varivel(is) de interesse. Os estratos tm por objetivo controlar a variabilidade (menor variabilidade), assim consegue-se diminuir o tamanho da amostra. O mtodo de estratificao mais comum o proporcional, onde o tamanho dos estratos amostrais so proporcionais ao tamanho de cada estrato ( h) na populao (Nh), levando-se em considerao o peso Wh de cada estrato. Porm, pode-se selecionar a amostra uniformemente, onde o tamanho dos estratos so iguais. 3

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

1.4.3 Amostragem Aleatria de Conglomerados (AAG): neste caso, as unidades amostrais so conglomerados (quarteires, escolas, blocos de apartamento, etc). Os conglomerados devem ser homogneos entre si e heterogneos dentro, segundo a varivel de interesse. A seleo dos conglomerados deve ser feita a partir da amostragem aleatria simples, j que os conglomerados so homogneos. 1.4.4 Amostragem Sistemtica (AS): uma variao da AAS, onde a populao ou a relao de seus componentes deve ser ordenada, de forma tal que cada elemento seja identificado, unicamente, pela posio. A AS eficiente medida que a relao (ou listagem, fila, a disposio dos prdios etc...) esteja misturada no que se refere caracterstica em estudo. Suponha por exemplo que o total populacional seja dado por N = nk, onde n o tamanho da amostra e k o comprimento do intervalo entre as observaes amostradas. Neste caso, seleciona-se inicialmente um valor r entre 1 e k (inclusive), para ser o chute inicial, ou seja, a primeira observao a ser selecionada, onde
k =N n

e a partir da considera-se todos os elementos em intervalos de k unidades.

Isto , seleciona-se os elementos r, r+k, r+2k, e assim sucessivamente, at que se complete o tamanho da amostra [r + (n-1)k]. Por exemplo, considerando uma populao de 150 fichas de servidores pblicos, para selecionar uma amostra sistemtica de 10 fichas tem-se que k = 15 e se a primeira unidade selecionada a de nmero r = 10, as seguintes sero as fichas de nmero 25, 40, 55, 70, 85, 100, 115, 130, 145. 1.4.5 Tamanho Mnimo de Amostra Uma maneira fcil de obter o tamanho da amostra calculada pela frmula:
n= N n0 N + n0

(1)

onde N o tamanho da populao e n0 a primeira aproximao do tamanho da amostra, obtido por n0 = E 2 , sendo que E o erro amostral mximo tolervel.
1

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

Obs.: quando no se conhece o N (tamanho da populao), pode-se considerar a populao como infinita, e neste caso suficiente considerar o tamanho da amostra (n) como sendo igual a n0 . A Figura 1 mostra que para um erro amostral fixo ( E), a medida que o tamanho da populao cresce, o tamanho amostral ( n) tende para o tamanho amostral mnimo ( n0 ). Desta forma, no correta retirar amostras estabelecendo-se percentuais da populao. Figura 1 - Representao grfica do tamanho da populao ( N) em funo do tamanho da amostra (n), fixando o erro amostral (E).

n0

No caso da Amostragem Aleatria Estratificada Proporcional, deve-se calcular o tamanho amostral dentro de cada estrato ( h), sendo dado por: nh = n Nh , onde n N

obtido pela Equao (1), N h o total populacional do estrato h e N o tamanho total da populao. J no caso da Amostragem Aleatria Estratificada Uniforme, deve-se calcular o tamanho da amostra para cada estrato ( h) a partir de:
nh = n , com h =1, , m. m

Exemplo: Supondo que seja de interesse realizar um levantamento por amostragem para avaliar algumas caractersticas da populao de N servidores pblicos de um rgo pblico. Qual deve ser o tamanho mnimo ( n0 ) e o tamanho corrigido (n) da amostra, tal que se possa admitir, com alta confiana, que os erros amostrais no ultrapassem 4% ( E = 0,04). Calcule para: a) N = 35 alunos; b) N = 200 alunos; c) N = 200.000 alunos. 5

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

Observe que para manter o mesmo erro amostral, no item a) foi necessria uma amostra abrangendo quase 100% da populao; enquanto que no item b) a amostra abrange 76%; e no item c) abrange apenas 0,3% da populao. , portanto, errnea a ideia de que para uma amostra ser representativa deva abranger uma percentagem fixa da populao. Ex.: Suponha que em uma regio existam 6.000 alunos de Ensino Fundamental, 3.000 do Ensino Mdio e 1.000 do Ensino Superior. Para selecionar uma amostra de 250 alunos: a) Utilizando uma amostragem aleatria simples: Para selecionar uma amostra aleatria simples deve-se garantir que a populao a ser estudada homognea, ou seja, esta populao no pode ser subdividida em relao a alguma caracterstica em comum. Considerando que isso seja verdade, ou seja, que a populao de 10.000 estudantes homognea seleciona-se uma amostra de 250 alunos, enumerando-se a populao de 1 a 10.000 e fazendo um sorteio aleatrio de 250 alunos. b) Utilizando uma amostragem estratificada: Considerando agora que a populao estudada subdividida em estrato, ou seja, heterognea em relao aos tipos de ensino fundamental, mdio e superior. Desta forma, pode-se estabelecer a amostra a partir de dois mtodos: b1) AAE Uniforme:

m = 3 (nmero de estratos),
nh = 250 / 3 = 83 estudantes.

h = 1, 2, 3, n = 250 (tamanho da amostra).

Relaciona-se os alunos de acordo com a escolaridade e seleciona-se, por amostragem aleatria simples ou sistemtica, os 83 estudantes de cada estrato. b2) AAE Proporcional:

m = 3 (nmero de estratos),
n1 = 250

h = 1, 2, 3

n = 250 (tamanho da amostra).

6000 = 250 0,60 = 150 alunos do ensino fundamenta l. 10000 3000 n 2 = 250 = 250 0,30 = 75 alunos do ensino mdio. 10000 1000 n 3 = 250 = 250 0,10 = 25 alunos do ensino superior. 10000

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

Relaciona-se os alunos de acordo com a escolaridade e seleciona-se, por amostragem aleatria simples ou sistemtica. b3) Utilizando-se amostragem sistemtica para selecionar os alunos: Enumera-se os 10.000 alunos por algum critrio. Para selecionar n = 250, ento k = 10.000/250 = 40. Seleciona-se um nmero de 1 a 40, digamos 20. Ento, as unidades amostrais sero: 20o, 60o, 100o, 140o, ..., 9980o (20+24940). 1.5 VARIVEL A estatstica ocupa-se fundamentalmente das propriedades das populaes cujas caractersticas so passveis de representao. A caracterstica que interessa analisar chamada de varivel. Varivel: convencionalmente o conjunto de resultados possveis de um fenmeno, conjunto este chamado domnio da varivel. As variveis podem ser divididas em dois tipos: qualitativas e quantitativas. Varivel Qualitativa: quando o resultado da observao apresentado na forma de qualidade ou atributo. Ex.: sexo, estado civil, grau de escolaridade, cor dos olhos, etc. Pode ser subdividida em nominal e ordinal. Nominal: assume resultados em categorias ou atributos sem ordenao. Exemplo: Gnero, cor dos olhos. Ordinal: assume resultados em categorias que podem ser naturalmente ordenados. Exemplo: Escolaridade, dia da semana, faixa etria, faixa salarial, etc. Varivel Quantitativa: quando o resultado da observao expresso em nmeros. Exemplo: nmero de empregados, nmero de imveis, salrio, altura, peso, etc. A varivel quantitativa pode ser: Contnua: quando assume qualquer valor entre dois limites e que resultam normalmente de uma mensurao. Exemplo: peso (em Kg), altura (em cm), idade, salrio (em R$), temperatura (em oC), etc. Discreta: quando assume valores inteiros, inclusive zero e que resultem, frequentemente de uma contagem. Exemplo: nmero de alunos, nmero de filhos, tamanho da famlia, etc. 7

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

Quadro 1 - Esquema de classificao de variveis. Qualitativa Varivel Quantitativa Exerccio: Classifique as variveis abaixo: a) Nmero de filhos dos funcionrios de uma escola. b) Altura dos estudantes da turma A do Ensino Fundamental de uma escola. c) Cor dos cabelos dos alunos de uma faculdade. d) Salrio dos professores de uma escola. e) Nmero de indivduos nas famlias dos moradores de um conjunto residencial. f) Estado civil dos funcionrios de uma escola. g) Comprimento dos pregos produzidos por uma mquina. h) Nmero de peas defeituosas fabricadas por uma mquina diariamente. 2 FASES DO TRABALHO ESTATSTICO E ELABORAO DE Nominal Ordinal Discreta Contnua

QUESTIONRIOS 2.1 FASES DO TRABALHO ESTATSTICO 1a. Definio do problema: Saber exatamente aquilo que se pretende pesquisar, ou seja, definir corretamente o problema. 2a. Planejamento: Como levantar informaes? Que dados devem ser obtidos? Qual levantamento a ser utilizado? Censitrio? Por amostragem? E o cronograma de atividades? Os custos envolvidos? etc. 3a. Coleta de dados: Fase operacional. o registro sistemtico de dados, com um objetivo determinado. i) Dados primrios: quando so publicados pela prpria pessoa ou organizao que os haja recolhido. Exemplo: tabelas do censo demogrfico do IBGE. ii) Dados secundrios: quando so publicados por outra organizao. 8

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

Exemplo: quando determinado jornal publica estatsticas referentes ao censo demogrfico extradas do IBGE. Obs.: mais seguro trabalhar com fontes primrias. O uso da fonte secundria traz o grande risco de erros de transcrio. iii) Coleta Direta: quando obtida diretamente da fonte. Ex.: Empresa que realiza uma pesquisa para saber a preferncia dos consumidores pela sua marca. A coleta direta dos dados pode ser: Coleta contnua: registros de nascimento, bitos, casamentos; Coleta peridica: recenseamento demogrfico, censo industrial; Coleta ocasional: registro de casos de dengue. iv) Coleta indireta: feita por dedues a partir dos elementos conseguidos pela coleta direta, por analogia, por avaliao, indcios ou proporcionalizao. 4a. Apurao e crtica dos dados: Resumo dos dados a partir de sua contagem e agrupamento. a condensao e tabulao de dados. 5a. Apresentao dos dados: H duas formas de apresentao, que no se excluem mutuamente. A apresentao tabular, ou seja, uma apresentao numrica dos dados em linhas e colunas distribudas de modo ordenado, segundo regras prticas fixadas pelo Conselho Nacional de Estatstica. A apresentao grfica dos dados numricos constitui uma apresentao geomtrica permitindo uma viso rpida e clara do fenmeno. 6a. Anlise e interpretao dos dados: A ltima fase do trabalho estatstico a mais importante e delicada. Est ligada essencialmente ao clculo de medidas e coeficientes, cuja finalidade principal descrever o fenmeno (estatstica descritiva). Tambm podem ser feitas generalizaes (inferncias) e previses. 7a. Apresentao de relatrio final: Esta fase representa a finalizao do trabalho estatstico. Nela, deve-se apresentar um relatrio tcnico com a metodologia adotada, os resultados encontrados e as concluses possveis de serem apresentadas. 9

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

3 - TABELAS ESTATSTICAS

3.2 SRIE ESTATSTICA: qualquer tabela que apresenta a distribuio de um conjunto de dados estatsticos em funo da poca, do local ou da espcie. 3.2.1 Srie Temporal: Identifica-se pelo carter varivel do fator cronolgico. O local e a espcie (fenmeno) so elementos fixos. Esta srie tambm chamada de histrica ou evolutiva.
Tabela 2: Evoluo do Nmero de Tcnico-Administrativo por Classe: UFPA - 2007/2011.

Ano 200 7 200 8 200 9 201 0 201 1

Classe A 0 23 23 18 19

Classe B 0 33 32 28 28

Classe C 68 492 482 458 452

Classe D 1.460 1.044 1.029 1.003 992

Classe E 753 821 807 802 813

Total Geral 2.281 2.413 2.373 2.309 2.304

Fonte: Elaborao prpria com base no Anurio 2012_AB2011 PROPLAN/UFPA, p. 70.

3.2.2 Srie Geogrfica: Apresenta como elemento varivel o fator geogrfico. A poca e o fato (espcie) so elementos fixos. Tambm chamada de espacial, territorial ou de localizao.
Tabela 3: Nomeao de Tcnico-Administrativo por Campus: UFPA - 2011.

Campus Abaetetuba Altamira Bragana Marab Breves

Cargos Administrador Assistente em Administrao Analista de Tecnologia da Informao Tcnico em Tecnologia da Informao Tcnico em Assuntos Educacionais Tcnico em Tecnologia da Informao Tcnico em Laboratrio/rea Administrador Assistente em Administrao Assistente em Administrao Tcnico em Tecnologia da Informao

Nomeaes 1 3 2 1 1 1 3 1 1 2 1

10

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

Camet

Assistente em Administrao Secretrio Executivo

1 1

Fonte: Elaborao prpria com base no Anurio 2012_AB2011 PROPLAN/UFPA, p. 33.

3.2.3 Srie Especfica: O carter varivel apenas o fato ou espcie. Tambm chamada de srie categrica.
Tabela 4 - Atendimentos Realizados pela Percia Mdica-PROGEP: UFPA-2011.

Natureza de Atendimento Quantidade Licena Sade 284 Licena Maternidade 32 Licena para Acompanhar Pessoa Enferma na Famlia 31 Habilitao Acadmica para Candidatos Portadores de Deficincia 28 Iseno de Imposto de Renda 22 Avaliao da Capacidade Laborativa 8 Acidentes de Trabalho 5 Mobilidade Acadmica 2 Licena Adotante 1 Readaptao Funcional 1 Total Geral 414
Fonte: Elaborao prpria com base no Anurio 2012_AB2011 PROPLAN/UFPA, p. 36.

3.2.4 Srie Conjugada: Tambm chamada de tabela de dupla entrada ou srie mista. So apropriadas apresentao de duas ou mais sries de maneira conjugada, havendo duas ordens de classificao: uma horizontal e outra vertical. O exemplo abaixo de uma srie geogrfica-temporal.
Tabela 5 - Quantidade de Alunos Matriculados na Graduao - UFPA: 2007 a 2011.

Local Belm Interior Total

2007 18.784 8.995 27.779

2008 18.955 11.342 30.297

2009 18.901 11.544 30.445

2010 18.891 13.278 32.169

2011 18.988 15.537 34.525

Fonte: Elaborao prpria com base no Anurio 2012_AB2011 PROPLAN/UFPA, p. 19.

3.2.6 Sries de Dados Agrupados ou Distribuio de Frequncias Neste caso TODOS os elementos so fixos (poca, local e fenmeno). A distribuio de frequncia pode ser por intervalo ou por pontos, dependendo da quantidade de informaes que se tenha ou/e do tipo de varivel. um tipo de tabela que condensa uma coleo de dados conforme as frequncias (repeties de seus valores). utilizada quando se tem dados quantitativos discretos ou contnuos.

11

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

(i) Distribuio de Frequncia por Intervalos: uma srie estatstica na qual a varivel observada est dividida em subintervalos do intervalo total observado e o tempo, a espcie e a regio permanecem fixos. Exemplo de Distribuio de Frequncia por Intervalo:
Tabela 6: Faixa Etria (anos) de Tcnico-Administrativos Ativo Permanente: UFPA-2011.

Faixa Etria (anos) 1 classe 2 classe 3 classe 4 classe 5 classe 6 classe 7 classe 8 classe 9 classe 10 classe 21 || 25 26 || 30 31 | |35 36 | |40 41 | |45 46 | |50 51 | |55 56 | |60 61 | |65 66 | |70

Nmero de T.A. (fi) 34 159 176 171 236 410 516 353 173 73 2.271

Fi

fri

Fri

Xi

Fonte: Elaborao prpria com base no Anurio 2012_AB2011 PROPLAN/UFPA, p. 75.

a) Construo de Distribuies de Frequncias por Intervalos: 1 - Passo: montar o Rol (organizar os dados em ordem crescente ou decrescente). 2- Passo: calcular a Amplitude Total da distribuio de frequncia ( T), que a diferena existente entre o maior (Xmximo) e o menor valor (Xmnimo) observado.
T = X mximo X mnimo .

3 - Passo: Determinar o Nmero de Classes da Distribuio de Frequncia (K), que so os subintervalos nos quais so contadas as observaes da varivel. Existem varias maneiras de se calcular o nmero de classes, neste curso ser utilizado o mtodo prtico. - Se n < 25, utiliza-se K=5 classes; - Se n 25, utiliza-se: K = n . Obs.: Sempre arredondar o valor de K seguindo as regras de arredondamento. 4 - Passo: calcular o intervalo de Classe ou Amplitude do Intervalo de Classe ( h), que o comprimento da classe. (geralmente este valor fornecido): h = 5 - Passo: Construo das Classes 1 Classe Limite Inferior = menor valor do Rol 12
T . K

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

Limite Superior = Limite Inferior da 1 Classe + Valor do Intervalo de classe 2a Classe Limite Inferior = Limite Superior da 1 Classe Limite Superior = Limite Inferior da 2 Classe + Valor do Intervalo de classe ... ka Classe Limite Inferior = Limite Superior da (k-1) Classe Limite Superior = Limite Inferior da k Classe + Valor do Intervalo de classe. Conveno: | inclui esquerda e exclui direita. | exclui esquerda e inclui direita. exclui ambos. || inclui ambos. 6 - Passo: obteno da Frequncia Simples ou Frequncia Absoluta da Classe ( Fi ) que o nmero de observaes contadas dentro da classe. b) Tipos de Frequncia b.1) Frequncia Absoluta Acumulada de Classe ( Fi): a acumulao sucessiva, a partir da primeira classe at uma classe qualquer, das frequncias simples ou absoluta das classes.
F1 = f 1 F2 = f1 + f 2 ... FK = f1 + f 2 + ... + f K

b.2) Frequncia Relativa de Classe ( fri): a relao existente entre a frequncia absoluta ou simples de classe e o nmero de observaes da varivel. fri =
K fi i =1

fi

Obs.: 1)

fr

= 1 e 2) n = f i .

b.3) Frequncia Relativa Acumulada ( Fri ): a acumulao sucessiva, a partir da primeira classe at uma classe qualquer das frequncias relativas das classes.

13

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

Fr1 = fr1 Fr2 = fr1 + fr2 ... Frk = fr1 + fr2 + ... + frk

b.4) Ponto Mdio de Classe ( X i ): a mdia aritmtica calculada entre o limite inferior ( li ) e o superior ( l s ) da classe. o valor em estatstica que representa os valores da varivel dentro da classe. X i = (ii) Distribuio de Frequncia por Pontos uma srie estatstica na quais as frequncias observadas esto associadas a um ponto real observado. Na construo da distribuio por ponto, o numero linhas (classes) na tabela igual ao nmero de pontos existentes, e utilizam-se os mesmos elementos da distribuio por intervalo, com a diferena que o prprio ponto j o valor de Xi (ponto mdio na distribuio por intervalo). Exemplo de Distribuio de Frequncia por Pontos:
Tabela 07: Nmero de Dependentes dos Professores em Dezembro/2012. Dependentes (Xi) 0 1 2 3 4 Professores (fi) 40 50 30 20 10 Fi fri Fri

(li + ls ) . 2

1 ponto 2 ponto 3 ponto 4 ponto 5 ponto

150

Fonte: Dados Hipotticos, JAN/2012.

5 - MEDIDAS DE TENDNCIA CENTRAL So medidas representativas das caractersticas avaliadas pelos seus valores centrais, em torno dos quais tendem a concentrar-se os dados. Tais medidas possibilitam comparaes de sries de dados pelo confronto de seus valores. As medidas de tendncia centrais mais utilizadas so: mdia aritmtica, moda e mediana. 5.1 MDIA ARITMTICA: X 14

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

A mdia aritmtica obtida pela soma de todos os valores de uma varivel X


n

dividida pelo nmero total de observaes ( n):

Xi . X 1 + X 2 + ... + X n i =1 X = = n n

Exemplo: Sabendo-se que o atendimento dirio em uma empresa de arquitetura, durante uma semana foi de 10, 14, 13, 15, 16, 18 e 12 pessoas, temos para atendimento mdio dirio na semana de:
X = 10 + 14 + 13 + 15 + 16 + 18 + 12 = 14 pessoas. 7

Se os dados esto agrupados em uma distribuio de frequncia, devem ser consideradas duas possibilidades: a) Sem intervalos de classe: Consideremos a distribuio relativa a 34 famlias de quatro filhos, tomando para varivel o nmero de filhos do gnero masculino. Calcularemos a quantidade mdia de meninos por famlia: N. de meninos N. de famlias ( f i ) 0 2 1 6 2 10 3 12 4 4 Total 34 Como as frequncias so nmeros indicadores da intensidade de cada valor da varivel, elas funcionam como fatores de ponderao, o que nos leva a calcular a mdia aritmtica ponderada, dada pela frmula:
k

f X + f 2 X 2 + ... + f k X k X= 1 1 = f 1 + f 2 + ... + f k

( f
i =1 k

Xi)
em que
i

f
i =1

f
i =1

=n

Que na prtica pode ser determinado como: xi 0 1 2 3 4 Total fi 2 6 10 12 4 34 xi.fi 0 6 20 36 16 78 15

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

Logo X =

k i =1

( X i fi )
k fi i =1

= 78/34 = 2,3 2

b) Com intervalos de classe: Neste caso, convencionamos que todos os valores includos em um determinado intervalo de classe coincidem com o seu ponto mdio, e determinamos a mdia aritmtica ponderada por meio da frmula com X i agora sendo o ponto mdio da classe. Exemplo: Calcular a estatura mdia de bebs conforme a tabela abaixo. Estaturas (cm) Frequncia ( f i ) Ponto mdio ( X i ) 50 | 54 4 52 54 | 58 9 56 58 | 62 11 60 62 | 66 8 64 66 | 70 5 68 70 | 74 3 72 Total 40 Aplicando a frmula acima temos: X =
X i fi

208 504 660 512 340 216 2.440

( f
i =1 k

Xi ) =
i

f
i =1

2440 = 61 . Logo: X = 61 cm 40

5.2 MEDIANA: M d Colocados os valores em ordem crescente de grandeza (rol), a mediana


( M d ) ser o valor que ocupa a posio central da srie de dados, ou seja, o valor

que divide a srie em duas partes com nmeros iguais de elementos. A mediana prefervel mdia quando se est interessado em conhecer exatamente o centro da distribuio dos dados, ou ainda, quando os valores extremos podem afetar sensivelmente a mdia. O clculo da mediana feito sob duas condies: 5.2.1 A MEDIANA EM DADOS NO-AGRUPADOS Dada uma srie de valores como, por exemplo: {5, 2, 6, 13, 9, 15, 10}. De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos valores: {2, 5, 6, 9, 10, 13, 15}. O valor que divide a srie acima em duas partes iguais igual a 9, logo M d = 9. i) Mtodo prtico para o clculo da Mediana: 16

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

a) Se a srie de dados tiver nmero mpar de termos: O valor mediano ser o termo que ocupa a posio central do rol, ou seja, o termo cuja posio dada pela frmula: (n + 1)/2 Ex: Calcule a mediana da srie {1, 3, 0, 0, 2, 4, 1, 2, 5} 1 - ordenar a srie {0, 0, 1, 1, 2, 2, 3, 4, 5} 2 - calcular a posio: n = 9 logo (n + 1)/2 dado por (9+1) / 2 = 5, ou seja, o 5 elemento da srie ordenada ser a mediana. Portanto, a mediana ser o 5 elemento, ento M d = 2 b) Se a srie dada tiver nmero par de termos: O valor mediano ser a mdia aritmtica dos valores centrais do rol, ou seja, os termos que ocupam a posio n/2 e n/2+1 Ex: Calcule a mediana da srie {1, 3, 0, 0, 2, 4, 1, 3, 5, 6} 1 - ordenar a srie {0, 0, 1, 1, 2, 3, 3, 4, 5, 6} 2 - calcular a posio: n = 10 logo a mediana ser a mdia aritmtica do termo que ocupa a posio n/2 = 10/2 =5, ou seja, o 5 termo e do termo que ocupa a posio n/2+1 = 10/2+1 = 6, ou seja, o 6 termo. No rol: 5 termo = 2 e 6 termo = 3 A mediana ser a mdia aritmtica do 5 e 6 termos da srie, ou seja = (2+3) / 2 ou seja, M d = 2,5. 5.2.2 A MEDIANA EM DADOS AGRUPADOS a) Sem intervalos de classe: Neste caso, o bastante identificar a frequncia acumulada ( FAc ) imediatamente superior metade da soma das frequncias. A mediana ser aquele valor da varivel que corresponde a tal frequncia acumulada. Exemplo: conforme distribuio de frequncias abaixo: Varivel ( X i ) 0 1 2 3 4 Total Frequncia ( f i ) 2 6 9 13 5 35 Frequncia acumulada

( FAc (i ) )
2 8 17 30 35 -

17

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

Quando o somatrio das frequncias for mpar o valor mediano ser o termo que ocupa a posio dada pela frmula:

+1

Como o somatrio das frequncias = 35 a frmula ficar: (35+1)/2 = 18 termo. Localizando na coluna da varivel (Xi), M d = 3. Quando o somatrio das frequncias for par o valor mediano ser a mdia aritmtica dos valores centrais da distribuio, ou seja, os termos que ocupam a posio

f
2

f
2

+1

Exemplo: Calcule a Mediana da distribuio de frequncias abaixo: Varivel ( X i ) Frequncia ( f i ) 12 14 15 16 17 20 Total 1 2 1 2 1 1 8 Frequncia acumulada

( FAc (i ) )
1 3 4 6 7 8 -

Localizando a posio da mediana na frequncia acumulada teremos: 8/2 = 4 termo e 8/2+1 = 5 termo. Localizando na coluna da varivel (X i), o 4 termo = 15 e o 5 termo = 16. Logo M d = (15 + 16) / 2 = 15,5 b) Com intervalos de classe: Devemos seguir os seguintes passos: 1) Determinamos as frequncias acumuladas; 2) Calculamos

f
2

para localizar a classe mediana;

3) Marcamos a classe correspondente frequncia acumulada imediatamente superior

f
2

. Tal classe ser a classe mediana;

k f i FAc ( ant ) i 4) Calculamos a Mediana pela frmula: M d = li + =1 h fi

18

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

onde: li = Limite inferior da classe da mediana;


FAc ( ant ) = Frequncia acumulada anterior da classe da M d ;

f i = Frequncia simples da classe da mediana;

h = Intervalo de classe.

Ex.: Frequncia ( f i ) Frequncia acumulada ( FAc ( i ) ) 4 4 9 13 11 24 8 32 5 37 3 40 40 f 40 1 Localizar a classe mediana: i = = 20 . A classe mediana ser 58 | 62 2 2 Classes 50 | 54 54 | 58 58 | 62 62 | 66 66 | 70 70 | 74 Total 2 Identificar os elementos da frmula na classe mediana:
l i = 58; FAc ( ant ) = 13; h = 4 e f i = 11;

3 Substituindo esses valores na frmula, obtemos:


Md = 58 +

( 20 13). 4 = 60,54
11

Obs: Esta mediana estimada, pois no temos os 40 valores da distribuio. 5.3 MODA: M o A moda ( M o ) o valor que ocorre com maior frequncia ou o valor que mais se repete. Quando a srie de dados tal que as frequncias so maiores nos extremos, ou quando se quer destacar um valor de alta frequncia ou quando se pretende obter uma medida rpida e aproximada da tendncia central, a moda pode ento, ser considerada para a interpretao dos dados. Com relao moda, uma srie de dados pode ser classificada em amodal (no possui moda), unimodal (possui apenas uma moda), bimodal (possui duas modas) ou multimodal (possui mais de duas modas). 5.3.1 A Moda quando os dados no esto agrupados A moda facilmente reconhecida: basta, de acordo com definio, procurar o valor que mais se repete. 19

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

Ex: Na srie {7, 8, 9, 10, 10, 10, 11, 12} a moda igual a 10. H sries nas quais no exista valor modal, isto , nas quais nenhum valor aparea mais vezes que outros. Ex: {3, 5, 8, 10, 12} no apresenta moda. A srie amodal. Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos, ento, que a srie tem dois ou mais valores modais. Ex: {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 } apresenta duas modas: 4 e 7. A srie bimodal. 5.3.2 A Moda quando os dados esto agrupados a) Sem intervalos de classe: Uma vez agrupados os dados, possvel determinar imediatamente a moda: basta localizar o valor da varivel de maior frequncia. Ex: Qual a temperatura mais comum medida no ms abaixo: Temperatura Frequncia 0 C 3 1 C 9 2 C 12 3 C 6 Resp: 2 C a temperatura modal, pois a de maior frequncia. b) Com intervalos de classe: A classe que apresenta a maior frequncia denominada classe modal. Pela definio, podemos afirmar que a moda, neste caso, o valor dominante que est compreendido entre os limites da classe modal. O mtodo mais simples para o clculo da moda consiste em tomar o ponto mdio da classe modal. Damos a esse valor a denominao de moda bruta.
M o = (li + l s ) / 2

onde li = limite inferior da classe modal e l s = limite superior da classe modal. Exemplo: Calcule a estatura modal conforme a tabela abaixo. Classes (em cm) Frequncia 54 | 58 9 58 | 62 11 62 | 66 66 | 70 8 5 20

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

Resposta: a classe modal 58| 62, pois a de maior frequncia. li = 58 e l s = 62


M o = (58+62) / 2 = 60 cm (este valor estimado, pois no conhecemos o valor real

da moda). Mtodo mais elaborado pela frmula de CZUBER:


f Mo f ant M o = li + h 2 f ( f + f ) Mo ant post

onde: li = Limite inferior da classe modal;


f Mo = Frequncia modal;

f ant = Frequncia simples anterior classe modal;


f post

= Frequncia simples posterior classe modal;

h = Intervalo de classe.

Ex.: Calcule a Moda da tabela do exemplo anterior pelo processo de CZUBER


11 9 Mo = 58 + 4 = 59,6 2 11 ( 9 + 8)

Obs.: A moda utilizada quando desejamos obter uma medida rpida e aproximada de posio ou quando a medida de posio deva ser o valor mais tpico da distribuio. J a mdia aritmtica a medida de posio que possui a maior estabilidade e a mediana a medida mais central.

6 - MEDIDAS DE DISPERSO 6.1 MEDIDAS DE DISPERSO ABSOLUTA 6.1.1 AMPLITUDE TOTAL: a nica medida de disperso que no tem na mdia o ponto de referncia.

21

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

Quando os dados no esto agrupados a amplitude total a diferena entre o maior e o menor valor observado: AT = X Mx X Mn . Exemplo: Para os valores 40, 45, 48, 62 e 70 a amplitude total ser:
AT = 70 40 =30

Quando os dados esto agrupados sem intervalos de classe ainda temos:


AT = X Mx X Mn .

Ex.: Xi 0 1 3 4 fi 2 6 5 3
AT = 4 - 0 = 4

* Com intervalos de classe a AMPLITUDE TOTAL a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe. Ento:
AT = LMx LMn

Ex.: Classes 4 | 6 6 | 8 8 |10 fi 6 2 3

AT = 10 4 = 6

A amplitude total tem o inconveniente de s levar em conta os dois valores extremos da srie, descuidando do conjunto de valores intermedirios. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de clculo rpido sem muita exatido.

6.1.4 DESVIO PADRO - S a medida de disperso mais geralmente empregada, pois leva em considerao a totalidade dos valores da varivel em estudo. um indicador de variabilidade bastante estvel. O desvio padro baseia-se nos desvios em torno da mdia aritmtica e a sua frmula bsica pode ser traduzida como: a raiz quadrada da mdia aritmtica dos quadrados dos desvios e representada por: 22

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

S=

i =1

(Xi X ) n

A frmula acima empregada quando tratamos de uma populao de dados no-agrupados. Ex.: Calcular o desvio padro da populao representada por {-4, -3, -2, 3, 5}. Como= - 0,2, ento: -4 -3 -2 3 5 - 3,8 - 2,8 - 1,8 3,2 5,2 = 14,44 7,84 3,24 10,24 27,04 62,8

Sabe-se que n = 5 e 62,8/5 = 12,56.


S=
2 ( X i X ) = n

62,8 = 12,56 = 3,54 5

Obs: Quando nosso interesse no se restringe descrio dos dados, mas partindo da amostra, visamos tirar inferncias vlidas para a respectiva populao, convm efetuar uma modificao, que consiste em usar o divisor n - 1 em lugar de n. A frmula ficar ento: S =

( X

X )2

n 1

Se os dados {- 4 , -3 , -2 , 3 , 5} representassem uma amostra o desvio padro amostral ser a raiz quadrada de 62,8 / (5 -1) = 3,96. O desvio padro detm algumas propriedades, dentre as quais destacamos: 1: Somando-se (ou subtraindo-se) uma constante a todos os valores de uma varivel, o desvio padro no se altera. 2: Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante (diferente de zero), o desvio padro fica multiplicado (ou dividido) por essa constante. Quando os dados esto agrupados (temos a presena de frequncias) a frmula do desvio padro ser:

23

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

S=

( X i X ) 2 f i ou S = ( X i X ) 2 f i quando se trata de uma amostra. fi f i 1


Xi f i Xi . f i 0 2 0 1 6 6 2 12 24 3 7 21 4 3 12 Total 30 63

Ex: Calcule o desvio padro populacional da tabela abaixo: -2,1 -1,1 -0,1 0,9 1,9 4,41 1,21 0,01 0,81 3,61 8,82 7,26 0,12 5,67 10,83 32,70

Sabe-se que

fi

= 30 e 32,7 / 30 = 1,09.

A raiz quadrada de 1,09 o desvio padro = 1,044 Se considerar os dados como sendo de uma amostra o desvio padro ser a raiz quadrada de 32,7 / (30 -1) = 1,062. O desvio padro pode ser calculado usando a seguinte frmula prtica:

S=

( X i fi )2 X f ou n S= fi
2 i i

( X i fi )2 X f quando se trata de uma n f i 1


2 i i

amostra. Ex: Calcule o desvio padro populacional do exemplo anterior:


.

0 2 1 6 2 12 3 7 4 3 Total 30

0 6 24 21 12 63

0 1 4 9 16

0 6 48 63 48 165

Se os dados forem uma amostra, o resultado ser:

24

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

Obs.: Nas tabelas de frequncias com intervalos de classe a frmula a ser utilizada a mesma do exemplo anterior. Ex: Calcule o desvio padro populacional da tabela abaixo: necessrio calcular o ponto mdio das classes

Pontos 2 4 4 6 6 8 8 10 Total () 8 7 13 2 30 3 5 7 9

. 24 35 91 18 168 9 25 49 81 72 175 637 162 1046

Usando a frmula prtica:

Se os dados forem uma amostra, o resultado ser:

6.1.5 VARINCIA - S 2 o desvio padro elevado ao quadrado. A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm extremamente importante na inferncia estatstica e em combinaes de amostras. 6.2 MEDIDA DE DISPERSO RELATIVA 6.2.1 Coeficiente de Variao uma medida adimensional, til para comparar variabilidades de diferentes amostras, onde as mdias so muito desiguais ou as unidades de medidas so diferentes. O coeficiente de variao (CV) o desvio padro expresso em

25

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

porcentagem da mdia, isto , magnitude relativa do desvio padro quando comparado com a mdia da distribuio das medidas. O coeficiente dado por:
CV = S 100 X

Ex.: Tome os resultados das estaturas e dos pesos de um mesmo grupo de indivduos: Discriminao ESTATURAS PESOS Mdia 175 cm 68 kg Desvio Padro 5,0 cm 2,0 kg

Qual das medidas (Estatura ou Peso) possui maior homogeneidade? Resposta: Teremos que calcular o CV da Estatura e o CV do Peso. O resultado menor ser o de maior homogeneidade (menor disperso ou variabilidade). CV estatura = (5 / 175) x 100 = 2,85% CV peso = (2 / 68) x 100 = 2,94%. Logo, nesse grupo de indivduos, as estaturas apresentam menor grau de disperso que os pesos.

Exerccios
1. Supondo que a varivel escolhida de um pesquisa, seja nominal e a populao finita de 600 indivduos (onde 60% dos indivduos so mulheres). Deseja-se trabalhar com um alpha de 5% e um erro amostral de 7%. Calcule o tamanho da amostra. 2. Organize os dados abaixo em uma tabela de distribuio de freqncia, contendo o intervalo de classe, a freqncia absoluta, a freqncia acumulada, a freqncia relativa e a freqncia relativa acumulada. 20,4 26,0 26,0 27,1 22,3 25,0 26,1 27,1 23,1 25,1 26,2 27,3 23,5 25,3 26,2 25,7 23,8 25,3 26,3 27,7 24,1 25,4 26,5 27,9 24,3 25,6 26,6 28,0 24,3 25,7 26,7 28,3 24,6 25,8 26,8 28,7

3. Trs arremessadores de disco, treinam para a Olimpada. Os atletas arremessam seus discos a 66 metros de distncia (em mdia), com desvio padro de 6,1 metros. Qual a probabilidade de um atleta lanar seu disco entre 64 e 67 metros?

26

UNIVERSIDADE FEDERAL DO PAR NCLEO DE ALTOS ESTUDOS AMAZNICOS MESTRADO EM GESTO PBLICA DISCIPLINA: ESTATSTICA

4. Foi encomendado um estudo para avaliao de uma entidade de ensino superior. Para isso, aplicou-se um questionrio e obteve-se respostas de 110 alunos. Indique: a) a varivel em estudo; c) a populao em estudo; b) a amostra escolhida; 5. Indique abaixo quais amostras so consideradas boas: a) Em um cinema, desejou-se verificar quais eram as intenes de voto para a prxima eleio. As pessoas entrevistadas, eram as que estavam presentes b) Para saber a opinio a respeito de mtodos contraceptivos, resolveu-se aplicar um estudo em uma escola de ensino fundamental, junto aos alunos. 5. Em uma pesquisa realizada em uma escola, identificou-se os seguintes indicadores (1) idade (2) anos de estudo (3) ano de escolaridade (4) renda (5) sexo (6) local de estudo (7) conceito obtido na ltima prova de biologia (8) Quantidade de livros que possui a) Das variveis acima, quais so as quantitativas e quais so as qualitativas? b) Das variveis quantitativas, diga quais so discretas?

27

Potrebbero piacerti anche