Quando se estuda uma variável, o maior interesse do
pesquisador é conhecer o comportamento dessa variável, analisando a ocorrência de suas possíveis realizações.
Uma maneira de se dispor um conjunto de dados, para se ter
uma idéia global sobre elas (ou seja, da sua distribuição) é através da distribuição de frequência.
Probabilidade e Estatística Tabelas e Gráficos
Distribuição de frequência
Contém os valores da variável e suas respectivas contagens
(frequências absolutas e relativas).
Seja n o número total de observações, usaremos a seguinte
notação: ni para indicar a frequência absoluta de cada classe, ou categoria, da variável. ni fi = n para indicar a frequência relativa (ou proporção) de cada classe. 100fi para indicar a porcentagem de cada classe.
Probabilidade e Estatística Tabelas e Gráficos
Distribuição de frequência - Exemplo
Tabela 2.1 Estatística Básica (Bussab e Morettin).
Informações sobre estado civil, grau de instrução, número de
filhos, salário (expresso como fração do salário mínimo), idade (medida em anos e meses) e procedência de 36 empregados da seção de orçamentos da Companhia MB.
Probabilidade e Estatística Tabelas e Gráficos
Probabilidade e Estatística Tabelas e Gráficos Distribuição de frequência - Variáveis qualitativas
Variável de interesse: Grau de instrução.
Classificação da variável: qualitativa ordinal. Categorias: fundamental, médio e superior.
Não temos perda de informação dos dados originais.
Probabilidade e Estatística Tabelas e Gráficos
Distribuição de frequência - Variáveis qualitativas
As proporções são muito úteis quando se quer comparar
resultados de duas pesquisas distintas. Suponhamos que se queira comparar a variável grau de instrução para empregados da seção de orçamentos com a mesma variável para todos os empregados da Companhia MB.
Probabilidade e Estatística Tabelas e Gráficos
Distribuição de frequência - Variáveis qualitativas
Não podemos comparar diretamente as colunas deas
frequências das Tabelas 2.2 e 2.3, pois os totais de empregados são diferentes (ou seja, possuem escalas diferentes). Mas as colunas das porcentagens são compatíveis, pois reduzimos as frequências a um mesmo total (ou seja, estão na mesma escala).
Probabilidade e Estatística Tabelas e Gráficos
Distribuição de frequência - Variáveis contínuas
A construção de tabelas de frequência para variáveis
contínuas necessita de certo cuidado. A construção da tabela de frequência para a variável salário, usando o mesmo procedimento do exemplo anterior, não resumirá as 36 observações num grupo menor, pois não existem observações iguais. A solução empregada é agrupar os dados por faixas de salário.
Probabilidade e Estatística Tabelas e Gráficos
Distribuição de frequência - Variáveis contínuas
Notação; a ` b = [a, b) o intevalo contendo o extremo a mas não
contendo o extremo b. Procedendo-se desse modo, ao resumir os dados referente a uma variável contínua, perde-se alguma informação.
Probabilidade e Estatística Tabelas e Gráficos
Distribuição de frequência - Variáveis contínuas
A escolha dos intervalos é arbitrária e a familiaridade do
pesquisador com os dados é que lhe indicará quantas classes (intervalos) devem ser usadas. Deve-se observar que, com um pequeno número de classes, perde-se informação, e com um número grande de classes, o objetivo de resumir os dados fica prejudicado.
Usualmente, sugere-se o uso de 5 a 15 classes com o mesmo
tamanho (amplitude), onde o tamanho de uma classe a ` b é definida por
tamanho(a ` b) = b − a.
Probabilidade e Estatística Tabelas e Gráficos
Distribuição de frequência - Variáveis contínuas
Usualmente, sugere-se o uso de 5 a 15 classes com a mesma
amplitude (r), onde a amplitude de uma classe a ` b é definida por r(a ` b) = b − a.
√ Uma regra prática é usar n classes.
Probabilidade e Estatística Tabelas e Gráficos
Procedimento para construção com classes de mesma amplitude
1. Encontre o menor e o maior valor das observações:
Menor valor (a(1) ) = 4.00 Maior valor (a(n) ) = 23.30
2. Calcule a Amplitude (R) das observações:
R = Maior valor − Menor valor =
= a(n) − a(1) = 23.30 − 4.00 = 19.30.
Probabilidade e Estatística Tabelas e Gráficos
Procedimento para construção com classes de mesma amplitude
3. Determine o número de classes (K):
√ √ K= n= 36 = 6 (no máximo 6 classes).
4. Determine o tamanho das classes (r):
R 19.30 r= = = 3.216666 ≈ 4. K 6 5. Determine as classes:
[a(1) + (i.r), a(1) + (i.r + r)) para i = 0, 1, . . . , K − 1.
Probabilidade e Estatística Tabelas e Gráficos
Observação: Variáveis Quantitativas Discretas
No caso em que temos variáveis quantitativas discretas (número
de filhos dos funcionários casados), as duas formas de construção são possíveis. Podemos utilizar todas as valores encontrado nas observações {0, 1, 2, 3, 4, 5} Ou podemos dividi-los em classes (por exemplo 0 ` 3 e 3 ` 6). Qual seria a melhor maneira de construir a distribuição de frequência para a variável número de filhos dos funcionários casados?
Probabilidade e Estatística Tabelas e Gráficos
Exercício I
Usando os dados da Tabela 2.1, construa a distribuição de
frequência das variáveis: a) Região de procedência. b) Número de filhos dos empregados casados. c) Idade.