Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Para que a gente consiga utilizar à inferência estatística é necessário ter uma noção bastante
abrangente de Probabilidades. Na verdade a estatística descritiva surgiu muito antes da inferência
estatística. Esta última depende da especificação de modelos matemáticos baseados numa noção
fundamental, que é a de "probabilidade".
A estatística descritiva é responsável pela:
Apresentação dos dados (tabelas e gráficos);
Descrição e sumarização dos dados coletados.
12
Já a maneira de resumir ainda mais os dados (mais do que as tabelas e os gráficos já
resumiram) é através de medidas numéricas que dão a partir de apenas um número, informações
sobre todo o conjunto de dados. Essas medidas são dadas por:
Medidas de posição: média, mediana, quantis, moda.
Medidas de dispersão ou variabilidade: variância, desvio padrão, amplitude, erro padrão,
coeficiente de variação, entre outras.
Freqüência acumulada F ac : é a soma de cada freqüência com as que lhe são anteriores
p
na distribuição
13
Distribuição de Freqüência para variáveis qualitativas
Exemplo: Uma empresa resolveu fazer uma pesquisa interna com seus funcionários. Para isso, uma
amostra de 25 funcionários foi analisada, utilizando o seguinte questionário:
Depois que os questionários foram aplicados, os dados foram organizados no banco de dados
abaixo:
14
BANCO DE DADOS
Estado Núm. Mora Satisfacao Satisfacao Satisfacao Nota
Func. Sexo Idade Escola Civil peso altura filhos Sozinho Salario Toler. Exerc. Gosta G S A TV OpTV Feliz Feliz
1 1 24 1 0 74,5 1,84 1 0 1574,59 2 1 0 2 3 4 2,1 0 3 8
2 1 26 1 0 75,3 1,71 1 0 1354,15 2 1 0 2 2 4 3,1 2 1 10
3 0 24 1 0 71,1 1,79 1 0 1262,17 2 1 0 4 3 4 4,7 0 3 10
4 1 15 1 0 79,6 1,90 0 1 1388,85 2 1 0 4 2 3 3,9 1 4 9
5 0 26 1 0 77,3 1,79 0 0 1220,36 2 1 1 2 1 2 1,5 2 2 9
6 0 34 3 0 70,8 1,83 0 0 1675,91 2 0 0 3 1 3 2,4 1 2 9
7 1 28 2 1 76,7 1,79 0 1 1035,26 2 0 0 2 1 4 2,4 0 3 8
8 1 28 3 0 63,0 1,90 2 0 1571,47 2 1 0 3 2 3 2,8 2 2 9
9 1 30 2 0 72,5 1,81 0 0 1443,98 1 1 0 4 1 3 3,4 1 3 9
10 1 24 0 0 72,0 1,80 0 0 1636,41 2 1 0 3 1 4 3,5 1 3 8
11 1 19 2 0 77,8 1,67 1 0 1627,89 2 1 0 4 3 4 1,9 0 2 10
12 1 27 2 0 67,6 1,76 0 1 1404,06 2 1 0 4 2 4 3,8 0 4 9
13 1 22 2 1 75,9 1,81 1 1 1330,84 1 1 0 4 0 4 4,1 3 2 9
14 1 25 0 1 70,0 1,83 0 0 1520,45 2 1 0 2 3 4 4,5 1 2 8
15 0 25 1 0 75,0 1,68 1 0 1859,41 1 1 0 3 0 3 3,6 0 2 9
16 1 29 1 0 76,5 1,68 0 0 1459,67 2 1 1 3 2 4 3,3 0 3 10
17 1 34 2 0 81,5 1,89 1 1 1444,23 2 1 0 3 3 4 2,5 1 4 10
18 1 29 3 0 75,8 1,80 0 0 1461,41 2 1 0 4 3 3 3,4 0 3 9
19 0 21 2 0 71,2 1,82 0 0 1255,94 2 1 0 4 1 4 4,5 1 0 10
20 0 25 1 0 71,5 1,77 0 1 1411,59 2 1 0 4 1 4 2,3 0 1 8
21 0 29 3 0 83,5 1,61 0 0 1449,21 2 1 1 4 4 2 3,5 1 3 8
22 1 32 0 1 78,2 1,87 1 0 1676,05 2 1 1 4 3 2 2,2 2 3 9
23 0 31 3 0 76,1 1,80 0 1 1349,86 2 1 0 3 1 4 3,5 2 3 10
24 0 27 2 0 76,0 1,89 0 1 1603,06 2 0 0 4 1 4 3,1 2 3 10
25 1 15 3 2 72,1 1,69 1 0 1626,69 2 1 1 3 3 4 3,2 1 3 8
LEGENDA
Func. codigo de identificacao do questionário Exerc. Se pratica exercício fisico: 0 se pratica exercício e 1 se não pratica
Sexo Sexo: 0 se masculino e 1 se feminino Gosta 0 se gosta do que faz e 1 se não gosta
Idade idade em anos Satisfacao Satisfação geral em trabalhar na empresa: 0 muito insatisfeito, 1 insatisfeito, 2 indiferente, 3 satisfeito e 4 muito
Escola Escolaridade: 0 se ensino fundamental, 1 se ensino médio, 2 se ensino superior e 3 se fez pos G
Satisfacao S satisfeito geral com o salário: 0 muito insatisfeito, 1 insatisfeito, 2 indiferente, 3 satisfeito e 4 muito satisfeito
Satisfação
Estado Civil graduacão
0 se solteiro, 1 se casado e 2 se outros Satisfacao A Satisfação geral com ambiente do trabalho: 0 muito insatisfeito, 1 insatisfeito, 2 indiferente, 3 satisfeito e 4 muito
peso peso em kg TV satisfeito
Horas assistindo TV
altura altura em metros OpTV Opinião sobre a programação da TV: 0 se ruim, 1 se média, 2 se boa e 3 se não sabe
Núm. de filhos número de filhos Feliz Como esta se sentido atualmente: 0 se muito infeliz, 1 se infeliz, 2 se nem feliz nem infeliz, 3 feliz e 4 muito feliz
Mora Sozinho 0 se mora sozinho e 1 se mora com outras pessoas Nota Feliz Nota de 0 a 10 para sua felicidade hoje
Salario salário em R$
Toler. Grau de tolerancia ao cigarro: 0 se incomoda pouco, 1 se é indiferente e 2 se incomodo muito
Para facilitar a visualização dos dados, será apresentando a seguir os dados das variáveis
Sexo, Escolaridade e Estado Civil (para economia de espaço, em vez de colocar em colunas,
apresentarmos os dados invertidos)
Func. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Sexo 1 1 0 1 0 0 1 1 1 1 1 1 1 1 0 1 1 1 0 0 0 1 0 0 1
Escola 1 1 1 1 1 3 2 3 2 0 2 2 2 0 1 1 2 3 2 1 3 0 3 2 3
Estado Civil 0 0 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0 0 1 0 0 2
Sexo: 0-Masc e 1-Fem. Escola: 0-Ens. fundamental, 1-Ens. Médio, 2-Superior e 3-Pós-graduação Estado Civil: 0-Solteiro, 1-Casado e 2-Outros
Escolaridade Nº de vezes = fa
0 – E Fundamental 3
1 – E Médio 8
2 - Superior 8
3 – Pós-graduação 6
Total 25
15
Estado Civil Nº de vezes = fa
0 – Solteiro 20
1 – Casado 4
2 - Outros 1
Total 25
Escolaridade fa fr fp Fpac
0 – E Fundamental 3 0,12 12% 12%
1 – E Médio 8 0,32 32% 44%
2 - Superior 8 0,32 32% 76%
3 – Pós-graduação 6 0,24 24% 100%
Total 25 1 100% -
É importante saber interpretar essas tabelas. Pelas tabelas acima, podemos perceber que:
64% dos funcionários são do sexo feminino;
Apenas 24% dos funcionários fizeram pós-graduação e 44% dos funcionários estudaram até o
ensino médio;
80% dos funcionários são solteiros.
16
Distribuição de Freqüência para variáveis quantitativas discretas
Exemplo1: Considere o exemplo anterior, onde a variável quantitativa discreta “número de filhos” será
analisada nos 25 funcionários da amostra.
Func. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Núm. filhos 1 1 1 0 0 0 0 2 0 0 1 0 1 0 1 0 1 0 0 0 0 1 0 0 1
Exemplo 2: O gerente do departamento de uma instituição financeira deseja analisar o número diário
de operações fechadas nos últimos dois anos (total de 625 dias úteis) por um operador de seu
departamento de ações negociadas na Bolsa de valores. Uma amostra probabilística simples de 26
dias foi analisada, onde se observou o número de operações realizadas pelo operador nestes dias. A
tabela a seguir apresenta os dados levantados desta amostra:
Dia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
Nº de
14 12 13 11 12 13 16 14 14 15 17 14 11 13 14 15 13 12 14 13 14 13 15 16 12 12
operações
Para se analisar esses dados, podemos primeiramente contar o número de vezes que cada
valor diferente das operações ocorreu. Desta forma, teremos as freqüências absolutas de cada valor:
Nº de
fa fr fp Fpac
operações
11 2 0,08 8% 8%
12 5 0,19 19% 27%
13 6 0,23 23% 50%
14 7 0,27 27% 77%
15 3 0,12 12% 88%
16 2 0,08 8% 96%
17 1 0,04 4% 100%
Total 26 1 100 -
17
Distribuição de Freqüência para variáveis quantitativas contínuas
No caso de variáveis quantitativas, em especial a variável contínua, são observadas as
freqüências em intervalos de valores (de preferência iguais), ao invés de freqüências individuais. Para
variável quantitativa é de grande importância a distribuição de freqüências acumuladas.
A freqüência se refere ao número de valores da variável em cada intervalo. Um critério
empregado aqui é o de considerar os intervalos fechados à esquerda, isto é, inclui o valor extremo
esquerdo e não inclui o valor à direita.
Para a construção de uma distribuição de freqüências em classes são necessários os seguintes
componentes: a Amplitude dos dados (maior valor menos o menor valor dos dados) e o número de
classes desejado. Com isso, podemos obter o tamanho ou largura de cada classe (intervalo) que
iremos utilizar para construção da tabela, ou seja:
maior valor menor valor
tamanho das classes
número de classes
Alguns elementos são importantes definirmos para falarmos em uma tabela de freqüência
para variáveis quantitativas contínuas:
fr Freqüência relativa, fr fa / n
Exemplo: Considere o exemplo anterior, do levantamento feito com os funcionários de uma empresa,
onde a variável quantitativa contínua “peso dos funcionários” será analisada nos 25 funcionários da
amostra.
Func. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
peso 74,5 75,3 71,1 79,6 77,3 70,8 76,7 63,0 72,5 72,0 77,8 67,6 75,9 70,0 75,0 76,5 81,5 75,8 71,2 71,5 83,5 78,2 76,1 76,0 72,1
Como podemos observar, não é possível contarmos os valores diferentes das variáveis, como
fizemos para as variáveis qualitativas e quantitativas discretas, pois quase todos os 25 números da
amostra são diferentes. Neste caso, é necessário agruparmos os valores de pesos em classes.
Nesta hora, sempre surgirá à dúvida: “Mas quantas classes devemos criar?”
O número ideal de classes irá depender dos dados que estamos trabalhando (é bastante
comum trabalharmos com 4 a 8 classes). No entanto, temos que nos atentar, ao definirmos o número
de classes, que:
18
Devemos apresentar tabelas de freqüências agrupadas de forma resumida e sem perder muita
informação.
Tabelas com poucas linhas, resumem demais os dados e consequentemente há muita perda de
informação.
Tabelas com muitas linhas fogem da essência de tabelas de freqüências que é o resumo adequado
dos dados.
Para facilitar esse agrupamento, podemos determinar o tamanho de cada classe por:
maior valor menor valor 83,5 63,0
tamanho das classes 5,13 5,5
número de classes 4
A primeira classe da tabela é formada por um numero no limite inferior e outro no limite
superior da classe. O numero do limite inferior da classe pode ser o menor número do conjunto de
dados e o número do limite superior deve ser o menor número somado com o valor calculado acima,
ou seja:
63,0 a 63,0 + 5,5 ou melhor 63,0 a 68,5
Fazendo a contagem dos pesos do conjunto de dados em cada classe de peso definida
acima, podemos completar a tabela de freqüência:
Peso fa fr fp Fpac
63 a 68,5 2 0,08 8% 8%
68,5 a 74,0 8 0,32 32% 40%
74,0 a 79,5 12 0,48 48% 88%
79,5 a 85,0 3 0,12 12% 100%
Total 25 1 100% -
Na tabela acima, há um problema na definição dos limites das classes, ou seja, se no conjunto
de dados aparecer um número igual a 68,5, esse número será contado na primeira classe (63 a 68,5)
ou na segunda (68,5 a 74,0)?
Existem várias maneiras para resolvermos esse problema, mas uma solução seria utilizar o
símbolo ┝. Esse símbolo significa que o limite inferior entra na classe em questão e o limite superior
não, sendo contato até um número muito próximo do limite superior.
Desta forma, temos a seguinte tabela:
19
Peso fa fr fp Fpac
63 ┝. 68,5 2 0,08 8% 8%
68,5 ┝ 74,0 8 0,32 32% 40%
74,0 ┝79,5 12 0,48 48% 88%
79,5 ┝ 85,0 3 0,12 12% 100%
Total 25 1 100% -
Exemplo: Voltando ao exemplo da pesquisa interna com funcionários de uma empresa. Considere
que as variáveis Sexo, Estado civil e escolaridade dos funcionários foram levantadas e que queremos
saber qual o perfil de escolaridade entre os homens e as mulheres.
Func. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Sexo 1 1 0 1 0 0 1 1 1 1 1 1 1 1 0 1 1 1 0 0 0 1 0 0 1
Escola 1 1 1 1 1 3 2 3 2 0 2 2 2 0 1 1 2 3 2 1 3 0 3 2 3
Estado Civil 0 0 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0 0 1 0 0 2
Sexo: 0-Masc e 1-Fem. Escola: 0-Ens. fundamental, 1-Ens. Médio, 2-Superior e 3-Pós-graduação Estado Civil: 0-Solteiro, 1-Casado e 2-Outros
Para isso, primeiramente, temos que fazer uma tabela de freqüências absolutas, onde
contamos simultaneamente os valores das variáveis.
Sexo
Escolaridade Total
0-Masc. 1-Fem
0 – E Fundamental - 3 3
1 – E Médio 4 4 8
2 - Superior 2 6 8
3 – Pós-graduação 3 3 6
Total 9 16 25
20
Desta forma, temos 3 tabelas com freqüências percentuais:
Percentual sobre o total
Percentual sobre a coluna
Percentual sobre a linha
Tabela com percentual sobre o total: dividir todos os números da tabela pelo total da amostra (n=25)
Sexo
Escolaridade Total
0-Masc. 1-Fem
0 – E Fundamental 0% 12% 12%
1 – E Médio 16% 16% 32%
2 - Superior 8% 24% 32%
3 – Pós-graduação 12% 12% 24%
Total 36% 64% 100%
Tabela com percentual sobre a coluna: dividir cada coluna pelo total da coluna correspondente.
Sexo
Escolaridade Total
0-Masc. 1-Fem
0 – E Fundamental 0% 19% 12%
1 – E Médio 44% 25% 32%
2 - Superior 22% 38% 32%
3 – Pós-graduação 33% 19% 24%
Total 100% 100% 100%
Entre os funcionários do sexo masculino, 44% fizeram até o ensino médio, 22% um curso superior e
33% uma pós-graduação.
Já entre as mulheres, 19% cursaram somente o ensino fundamental, 25% o ensino médio, 38%
fizeram um curso superior e apenas 19% uma pós-graduação.
Tabela com percentual sobre a linha: dividir cada linha pelo total da linha correspondente.
Sexo
Escolaridade Total
0-Masc. 1-Fem
0 – E Fundamental 0% 100% 100%
1 – E Médio 50% 50% 100%
2 - Superior 25% 75% 100%
3 – Pós-graduação 50% 50% 100%
Total 36% 64% 100%
Entre os funcionários com pós-graduação, 50% são do sexo masculino e 50% do sexo feminino.
Entre os funcionários com curso superior, 75% são mulheres e 25% homens.
21
EXERCÍCIOS DE ESTATÍSTICA
1) Para o projeto de pesquisa que seu grupo esta realizando como forma de avaliação na disciplina
de Estatística, utilize os 10 questionários que você aplicou e construa:
a) Um banco de dados com os 10 questionários.
b) Faça uma tabela de freqüência para cada variável de estudo.
2) A partir das idades dos alunos de uma escola, fazer uma distribuição por freqüência, agrupando
os dados em classes e depois interprete os resultados.
Idades (dados brutos)
8 8 7 6 9 9 7 8 10 10 12 15 13 12
11 11 9 7 8 6 5 10 6 9 8 6 7 11 9
3) Uma empresa resolveu fazer um cadastro de seus clientes a fim de conhecê-los melhor e elaborar
uma estratégia de marketing adequada. Abaixo, estão dos dados de 18 clientes. (Consultar
caderno ou livro do CRESPO, A. A., Estatística Fácil, São Paulo: Saraiva, 2002 – cap.5)
22
b) Que porcentagem de estudantes tem estatura igual ou superior a 175cm?
c) Quantos são os estudantes com estatura maior ou igual a 160cm e ao mesmo tempo
menor que 175cm?
d) Qual a porcentagem de estudantes com estatura abaixo de 170cm?
23