Sei sulla pagina 1di 23

WEB AULA 1

ESTATÍSTICA DESCRITIVA

Olá pessoal, antes de iniciarmos a nossa disciplina vou me apresentar para vocês: eu sou o
Professor Marcelo Caldeira Viegas, Graduado em Engenharia Química pela UEM (1996), Mestre
em Engenharia Química pela UNICAMP (1999) e Doutor em Engenharia Química pela UNICAMP
(2003), atuo há mais de oito anos como pesquisador de uma empresa multinacional, onde
sempre utilizei a Estatística como ferramenta fundamental para execução do meu trabalho e
tomada de decisões estratégicas, além de atuar também como professor em cursos de Pós-
Graduação da UNOPAR na área de Gestão da Qualidade.

Como temos muito trabalho pela frente, proponho a você muito estudo durante esta disciplina, a
qual passamos a apresentar em seguida.

Estatística Aplicada à Gestão Empresarial

No moderno ambiente administrativo e econômico global, qualquer pessoa pode ter acesso a
uma enorme quantidade de informações estatísticas. Os gerentes e gestores mais bem-sucedidos
são aqueles capazes de entender a informação e usá-la de maneira eficaz.

A direção de uma empresa, de qualquer tipo, incluindo as estatais e governamentais, exige de


seu administrador a importante tarefa de tomar decisões, e o conhecimento e o uso da
Estatística facilitarão seu tríplice trabalho de organizar, dirigir e controlar a empresa.

Por meio de sondagens, de coleta de dados e de recenseamento de opiniões, pode conhecer a


realidade geográfica e social, os recursos naturais, humanos e financeiros disponíveis, as
expectativas da comunidade sobre a empresa, e estabelecer suas metas, seus objetivos com
maior possibilidade de serem alcançados a curto, médio ou longo prazos.

A Estatística ajudará em tal trabalho, como também na seleção e organização da estratégia a ser
adotada no empreendimento e, ainda, na escolha das técnicas de verificação e avaliação da
quantidade e de qualidade do produto e mesmo dos possíveis lucros e/ou perdas.

1. INTRODUÇÃO

Considere as seguintes notícias de jornais e revistas:

“O Comércio Varejista do país iniciou 2010 com crescimentos de 2,7% no volume de vendas e de
3,0% na receita nominal, na comparação com dezembro (ajustadas sazonalmente). Nas demais
comparações, obtidas das séries originais (sem ajuste), o varejo nacional obteve, em termos de
volume de vendas, acréscimos da ordem de 10,4% sobre janeiro do ano anterior e de 6,2% no
acumulado dos últimos 12 meses. Para os mesmos indicadores, a receita nominal de vendas
apresentou taxas de variação de 12,3% e de 10,1%, respectivamente.” (Fonte IBGE – Instituto
Brasileiro de Geografia e Estatística, 11/03/10) - http://www.ibge.gov.br/home/ (acessado em
21/03/2010)

“Em janeiro de 2010, o emprego industrial mostrou variação positiva de 0,3% frente ao mês
anterior, já descontadas as influências sazonais, após queda de 0,6% em dezembro. Ainda na
série com ajuste sazonal, o índice de média móvel trimestral manteve a trajetória ascendente
iniciada em agosto último, ao registrar acréscimo de 0,3% entre os trimestres encerrados em
dezembro e janeiro.” (Fonte IBGE – Instituto Brasileiro de Geografia e Estatística, 11/03/10) -
http://www.ibge.gov.br/home/ (acessado em 21/03/2010)

Diariamente, somos expostos a uma grande quantidade de informações numéricas, semelhantes


às relatadas. Dependendo das situações, ora somos consumidores destas informações, ora
precisamos produzi-las. Assim, necessitamos de capacitações para compreendermos informações
numéricas produzidas por outros, bem como nos habilitarmos a construí-las. O emprego dos
procedimentos, técnicas e métodos estatísticos é fundamental para nos auxiliar na execução
dessas tarefas.
O QUE É A ESTATÍSTICA? Vamos desvendar esta ciência? Então, vamos lá...

ESTATÍSTICA: A estatística é a ciências dos dados. Ela nos fornece métodos para coleta,
organização, descrição, análise e interpretação de dados para a utilização dos mesmos na
tomada de decisões. É objetivo da estatística: extrair informação de um conjunto de dados para
obter uma melhor compreensão das situações que representam.

A Estatística é dividida basicamente em duas áreas: Estatística Descritiva e Inferencial. No nosso


curso serão abrangidas estas áreas conforme veremos.

Para melhor compreendermos os propósitos da Estatística, é necessário conhecermos as algumas


definições:

População: É a totalidade dos elementos, objetos ou pessoas que estão sendo considerados
inicialmente.

Amostra: É todo subconjunto de unidades retiradas de uma população para obter a informação
desejada. Uma amostra tem que representar e ter as mesmas características da população
original, portanto, a amostra só traz informação sobre a população da qual foi retirada. Em
outras palavras, a amostra é parte da população que é selecionada para análise. A preocupação
central é que a amostra seja representativa da população inicial.

Amostragem: É o método de retirada de amostras de uma população. Consiste em selecionar


parte de uma população, para observar, de forma que seja possível estimar algo sobre toda a
população.

Estatística Descritiva:

Os objetivos da estatística descritiva envolvem coleta, organização e descrição de um conjunto


de dados quantitativos ou qualitativos. Com a construção de gráficos, tabelas e com o cálculo de
medidas com base em uma coleção de dados numéricos, poderemos compreender melhor o
comportamento da variável expressa no conjunto de dados sob análise.

Estatística Inferencial:

È a área da estatística responsável pela análise e interpretação dos dados, associado a uma
margem de incerteza. Nesta fase são empregados métodos que tornam possível a estimação de
características de uma população baseadas nos resultados amostrais.

Por que estudarmos a amostra e não a população? Abaixo, seguem algumas razões que nos
levam a trabalhar com as amostras, e não com toda a população:

• Alto custo e demora dos censos;

• Em alguns casos populações muito grandes;

• Impossibilidade física de se examinar toda a população;

• Comprovado valor cientifico das informações coletadas por meio de amostras;

A condução de uma pesquisa eleitoral ilustra o processo da inferência estatística. O pesquisador,


impossibilitado de entrevistar todos os eleitores (população), seleciona uma amostra de eleitores
e questiona sobre suas preferências eleitorais. Baseado nas respostas amostrais, conclui sobre
todo o conjunto dos eleitores. Junto com suas conclusões, o pesquisador informa a probabilidade
de confiança de que seus resultados amostrais refletem o comportamento de todos os eleitores
(população).

Aprofundando o conhecimento: Agora sugiro que você abra a biblioteca digital, procure pelo
livro: LARSON, R.; FARBER, B. Estatística Aplicada. 2ª Edição. São Paulo: Editora Pearson, 2008 e
leia o capítulo 1 da página 2 a 6.

Outras Definições Básicas da Estatística

Atributos: Quando os dados estatísticos apresentam um caráter qualitativo, o levantamento e os


estudos necessários ao tratamento desses dados são designados genericamente de estatística de
atributo.
Variável: É uma condição ou característica das unidades da população. Por exemplo, a idade das
pessoas residentes no Brasil, ou classe social são variáveis. As variáveis são classificadas em dois
tipos: Qualitativas e Quantitativas

Variáveis qualitativas ou atributos: Quando os dados são distribuídos em categorias


mutuamente exclusivas. Seus valores são expressos por atributos: São exemplos de variáveis
qualitativas: sexo, cor da pele, cidade de nascimento, tipo sanguíneo (O, A, B, AB), etc. Estas
variáveis são classificadas em dois tipos:

• Nominal (exemplo: gênero - masculino e feminino);

• Ordinal (exemplo: classe social: A, B, C, D, E).

Variáveis quantitativas ou numéricas: Quando os dados são de caráter nitidamente


quantitativo, e o conjunto dos resultados possui uma estrutura numérica. São exemplos de
variáveis quantitativas: idade, estatura, taxa de colesterol, etc. As variáveis quantitativas ou
numéricas são classificadas em dois tipos:

• Variável Discreta: A variável discreta só pode assumir apenas valores inteiros. São exemplos
de variáveis discretas: número de filhos (0, 1, 2, 3, etc.), número de estudantes em uma sala de
aula, etc.

• Variável Contínua: A variável contínua pode assumir qualquer valor num dado intervalo.
Exemplo de variável contínua: peso de uma pessoa (60,50 Kg).

Dados: São os valores da variável em estudo, obtidos por meio de uma amostragem. Os dados
são do mesmo do tipo que as variáveis, por exemplo, uma variável discreta produz dados
discretos.

Dados Brutos: É uma tabela ou relação de elementos que não foram numericamente
organizados. É difícil formarmos uma idéia exata do comportamento do grupo como um todo, a
partir de dados não ordenados ou dados brutos.

Exemplo: 45, 41, 42, 41, 42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51.

ROL: É a tabela obtida após a ordenação dos dados brutos (de forma crescente ou decrescente).

Exemplo: 41, 41, 41, 42, 42 43, 44, 45, 46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60.

Organização de Dados Estatísticos (Fases do Método Estatístico)

A Estatística Descritiva tem por objetivos planejar uma pesquisa, coletar informações, descrever
e analisar dados, retirando o maior número possível das informações nelas contidas com o
objetivo de utilizá-las na tomada de decisões. Seguindo este raciocínio a Estatística divide o
estudo e análise dos dados em algumas fases que são descritas a seguir:

1º Fase- Definição do Problema, Definir Objetivos: Saber exatamente aquilo que se pretende
pesquisar é o mesmo que definir corretamente o problema inicial.

2º Fase- Planejamento da pesquisa: Como levantar informações? Que dados deverão ser
obtidos? Qual levantamento a ser utilizado? Cronograma de atividades? Custos envolvidos? Etc...
Segue abaixo algumas perguntas que precisam ser respondidas no planejamento de um
levantamento de dados estatísticos


o O quê? – Características a serem observadas: VARIÁVEIS
o Quem? – Os elementos a serem pesquisados: POPULAÇÃO / AMOSTRA
o Como? – O instrumento de coleta de dados: MÉTODO DE AMOSTRAGEM A SER
UTILIZADO, QUESTIONÁRIO /ENTREVISTA ESTRUTURADA, ETC...

3º Fase- Execução da Pesquisa, Coleta de Dados: Fase operacional. É o registro sistemático de


dados, focando o objetivo determinado inicialmente.


o Dados primários (coleta direta): Quando são publicados pela própria pessoa ou
organização que os tenha coletados. Exemplos: Tabelas do censo demográfico do
IBGE, uma empresa realiza uma pesquisa para saber a preferência dos
consumidores pela sua marca.
o Dados secundários (coleta indireta): Quando são publicados por outra
organização. Exemplo: Quando determinado jornal publica estatísticas referentes
ao censo demográfico extraídas do IBGE.

Observação: É mais seguro trabalhar com dados primários. O uso de dados secundários traz o
grande risco de erros de transcrição.

4º Fase- Apuração dos Dados: Resumo dos dados através de sua contagem e agrupamento. É a
condensação e tabulação de dados.

5º Fase- Análise e Apresentação dos Dados: Há duas formas de apresentação, que não se
excluem mutuamente:


o Apresentação de dados em tabelas - É uma apresentação numérica dos dados
em linhas e colunas distribuídas de modo ordenado, construídas segundo normas
técnicas citadas pela Fundação Instituto Brasileiro de Geografia e Estatística
(IBGE, 1993)
o Apresentação gráfica dos dados numéricos - constitui uma apresentação gráfica
permitindo uma visão rápida e clara da variável estudada.

6º Fase- Interpretação dos Dados e Conclusões Obtidas a partir dos dados (estatística
inferencial): A última fase do trabalho estatístico é a mais importante e delicada. Está ligada
essencialmente ao cálculo de medidas e coeficientes, cuja finalidade principal é descrever a
variável estudada.

Aprofundando o conhecimento: Agora sugiro que você abra a biblioteca digital, procure pelo
livro MCCLAVE, “Estatística para Administração e Economia”, 10º Edição, São Paulo: Pearson
Prentice Hall, 2009 e leia o capítulo 1 (itens 1.1 a 1.3) da página 2 a 8.

WEB AULA 2

APRESENTAÇÃO DE DADOS EM TABELAS

Existem regulamentações para construção de tabelas estatísticas, todavia, em função dos


objetivos práticos desta web aula, não serão adotadas normas rígidas para elaboração de
tabelas. Temos que ter em mente que a tabela deverá ser uma forma objetiva de se demonstrar
o comportamento de variáveis, o que se deve buscar são representações simples que
possibilitem ao leitor a compreensão do fenômeno sem muito esforço.

Uma tabela deve apresentar a seguinte estrutura:

• Cabeçalho;

• Corpo;

• Rodapé;

O cabeçalho da tabela especifica o conteúdo das colunas, com palavras claras e concisas, sem
abreviações. Deve conter o suficiente para que sejam respondidas as questões: O que está
representado (fato)? Onde ocorreu (local)? Quando ocorreu (tempo)?

O corpo da tabela é representado por colunas e subcolunas dentro das quais serão registrados os
dados numéricos e informações.

O rodapé é reservado para observações pertinentes à tabela, bem como para registro e
identificação da fonte de dados. A fonte dos dados é a entidade responsável pelos dados
numéricos, deverá ser colocada na parte inferior, por extenso, precedida da palavra Fonte ou
Fontes (IBGE, 1993). As notas esclarecem aspectos relevantes do levantamento dos dados

A Tabela 01 apresenta um exemplo de tabela que obedece às normas técnicas.

Tabela 01. População residente no Brasil, segundo o sexo, de acordo com o censo demográfico
de 2000
Fonte: IBGE (2003)

Conforme critério de agrupamento as tabelas, podem representar diversas séries estatísticas que
são descritas a seguir.

a) Série Cronológica

É a série estatística em que todos os dados são observados segundo a época de ocorrência. Nesta
série a variável é o tempo, sendo que o fato e o local permanecem fixos. A Tabela 02 apresenta
um exemplo de tabela que descreve uma série cronológica.

Tabela 02. Vendas da Companhia Alfa – 2004 - 2008

Fonte: Departamento e Marketing da Companhia Alfa (Dados Fictícios)

b) Série Geográfica ou de Localização

É a série estatística em que os dados são observados segundo a localidade de ocorrência. Neste
tipo de série a variável é o local e são fixos o fato e a época. Exemplo - Tabela 03.

Tabela 03. Vendas de Computadores por Empresa – 2006 (Alagoinhas – Bahia)

Fonte: Dados Fictícios

c) Série Específica

É a série estatística em que os dados são agrupados segundo a modalidade de ocorrência, ou


seja, varia o fato e permanece constante a época e o local. Exemplo (Tabela 04)

Tabela 04. Regime de Trabalho dos Professores de Química – 2010 (Londrina – Jd Piza)

Fonte: Coordenadoria de Recursos Humanos (Unopar)

d) Distribuição de Frequências
É uma série estatística em que os dados são agrupados com suas respectivas frequências
absolutas.

Nas tabelas de distribuição de frequências, é usual fornecer a proporção (frequência relativa) de


unidades que caem em cada categoria. A frequência relativa é dada por:

Apresentação de Dados Qualitativos: Quando observamos dados qualitativos, classificamos cada


unidade da amostra em uma dada categoria. A idéia é resumir as informações na forma de uma
tabela que mostre as contagens (frequências) em cada categoria, obtendo, então, uma tabela de
distribuição de frequência. A Tabela 05 apresenta um exemplo de distribuição de frequência de
dados qualitativos.

Tabela 05. Opinião dos consumidores sobre determinado produto

Fonte: Dados Fictícios

Apresentação de Dados Quantitativos: Os dados numéricos são apresentados na ordem em que


são coletados. Dados numéricos podem ser apresentados em tabelas de distribuição de
frequências (com ou sem intervalos de classe) conforme veremos a seguir.

Distribuição de frequência sem intervalos de classe: É a simples condensação dos dados


conforme as repetições de seus valores. Exemplo - Tabela 06.

Tabela 06. Distribuição do número de faltas de 30 empregados de uma determinada empresa no


semestre.

Para uma amostra de tamanho razoável esta distribuição de frequência é inconveniente, já que
exige muito espaço. Tabelas com grande número de dados não oferecem ao leitor visão rápida e
global do fenômeno. Por esta razão, tanto dados discretos quanto contínuos, desde que em
grande número, devem ser apresentados em tabelas de distribuição de frequência com
intervalos de classes, conforme veremos a seguir.

Distribuição de frequência com intervalos de classe: Quando o tamanho da amostra é elevado,


é mais indicado efetuar o agrupamento dos valores em vários intervalos de classe. Para construir
uma tabela de distribuição de frequência com intervalos de classe siga os procedimentos a
seguir.

1º Passo) Organize os dados brutos em um ROL;

2º Passo) Encontre o valor máximo e mínimo do conjunto de dados e calcule a Amplitude Total
(A), que é a diferença entre os valores máximo e mínimo, portanto: A = Maior Medida – Menor
Medida;

3º Passo) Calcule o número de classes (K): O número de classes de uma representação será um
número inteiro próximo de K, que pode ser obtido por vários métodos, sendo os mais usuais:

Onde: K é o número de classes, e n é o número de dados (tamanho da amostra).

O indicado é sempre o arredondamento do valor de K obtido para um valor mais alto.


Observação: O cálculo de K por meio de fórmulas pode servir como referência, mas não deve ser
entendido como obrigatório.

4º Passo) Decidido o número de classes, calcule então o tamanho do intervalo de classe (h). Que
é definido por:

Assim como no caso do número de classes (K), a amplitude das classes (h) deve ser aproximada
para o maior valor inteiro. Assim, se K=6,4, usa-se K=7; e h=1,7, usa-se h=2

5º Passo) Organize as classes, de maneira que a primeira contenha o menor valor observado. O
primeiro elemento das classes seguintes sempre será formado pelo último elemento da classe
anterior.

Exemplo (Construção de uma tabela de distribuição de frequência com intervalos de classe):


Vamos construir uma tabela de distribuição de frequências das idades dos funcionários de uma
amostra de 50 elementos selecionados de uma empresa.

Dados Brutos:

1º Passo) A partir dos dados brutos construir o ROL (ordenação dos dados em ordem crescente)
2º Passo) Determinar a Amplitude Total (A):

A - Maior Valor - Menor Valor

A = 65 - 18 = 47

3º Passo) Como os dados serão agrupados em classes, é preciso escolher o número de classes
(K):

Pela Regra de Sturges temos que: , sendo


que n=50, portanto:

4º Passos) Cálculo do Tamanho do intervalo de classe (h):

Quanto aos limites das classes, utilizaremos o seguinte critério a |— b (incluiremos nesta classe
todos os elementos maiores ou iguais a a e menores do que b). A Tabela 07 mostra um exemplo
de uma tabela de distribuição de frequência para variável contínua.

Tabela 07. Distribuição de frequências que representa a idade dos funcionários de certa empresa
(n=50)

Aprofundando o conhecimento: Agora, sugiro que você abra a biblioteca digital, procure pelo
livro GARCIA, R. - UNOPAR. Estatística. São Paulo: Editora: Pearson Education do Brasil, 2009, e
leia o capítulo 2 da página 33 a 40.

APRESENTAÇÃO DE DADOS EM GRÁFICOS

Gráficos ajudam a visualizar a distribuição das variáveis. Nesta etapa, trataremos das formas de
apresentar dados em gráficos, seguindo as normas nacionais, ditadas pela Fundação Instituto
Brasileiro de Geografia e Estatística (IBGE).

Todo gráfico deve apresentar título e escala. O título deve ser colocado abaixo do gráfico. As
escalas devem ser crescentes da esquerda para a direita e de baixo para cima.

Gráficos de Linhas/Dispersão

Os gráficos de linhas e dispersão exibem uma série como um conjunto de pontos conectados por
uma única linha. As linhas dos gráficos são usadas para representar grandes quantidades de
dados que ocorrem em um período de tempo contínuo. É o gráfico que melhor representa a
evolução conjunta de duas variáveis quantitativas, sendo que X é considerada a variável
independente e Y a variável dependente.

A Figura 01 mostra um gráfico de linhas que contém três séries.

Figura 01: Gráfico de Linhas (Exemplo)

Gráficos de Colunas / Barras

No gráfico de colunas as barras são apresentadas na posição vertical. Para ilustrar o gráfico de
colunas, serão utilizados os dados apresentados na Tabela 05, originando assim a Figura 02
(gráfico de colunas com linhas auxiliares – grades e rótulos).

Figura 02. Opinião dos consumidores sobre determinado produto (Gráfico de Colunas)

No gráfico de barras, as barras são apresentadas na posição horizontal, como apresentado na


Figura 03.
Figura 03. Opinião dos consumidores sobre determinado produto (Gráfico de Barras)

Gráficos de Setores

É a representação gráfica de uma série estatística, em um círculo, por meio de setores. É


utilizado quando se pretende comparar cada valor da série com o total.

A partir dos dados apresentados na Tabela 02, foi obtido o gráfico de setores apresentado na
Figura 04.

Figura 04. Vendas da Companhia Alfa – 2004 - 2008 (Gráfico se setores)

Histograma
É o gráfico que melhor apresenta as frequências de uma variável quantitativa contínua agrupada

em classes. Quando os dados são contínuos e a amostra é grande é mais conveniente condensar
os dados, isto é, organizar uma tabela de distribuição de frequências, agrupar os dados em
classes e a partir desta desenhar um histograma.

O histograma é a representação gráfica de uma distribuição de frequência, formado por um


conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal
modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe.

Para ilustrar o histograma serão utilizados os dados apresentados na Tabela 07, obtendo-se assim
a Figura 05.

Figura 05. Histograma para idade de 50 funcionários de certa empresa

O histograma dispõe de informações de modo que seja possível a visualização da forma de


distribuição do conjunto de dados e também a percepção do valor central e da dispersão dos
dados em torno deste valor central. Pelos dados da Figura 04, fica fácil perceber que a maior
quantidade de funcionários tem idade entre 32 e 38 anos.

Observar: O histograma contém as mesmas informações da tabela de distribuição de


frequências. São representações que buscam a organização e sintetizarão de grupos de dados
quantitativos.

WEB AULA 1

MEDIDAS DE TENDÊNCIA CENTRAL

Como o próprio título sugere, nosso objetivo aqui é a determinação de medidas que ofereçam o
posicionamento da distribuição dos valores de uma variável que desejamos analisar.

São os cálculos estatísticos que representam uma série de dados orientando-nos quanto à
posição da distribuição em relação ao eixo horizontal do gráfico da curva de frequência
(histograma). As medidas de tendência central mais utilizadas são: média aritmética, moda e
mediana.

Média Aritmética ( )
A medida de tendência central mais comum para um conjunto de dados é a média aritmética. A
média aritmética amostral de um conjunto de dados é o quociente entre a soma dos valores do
conjunto e o número total dos valores.

Onde: xi são os valores da variável e n o número de valores.

Exemplo 1: Encontrar a média aritmética para um conjunto de observações: 5, 1, 6, 2, 4.

Solução: Temos cinco observações: n=5, então:

Quando a amostra é muito grande e os dados são discretos, podem ocorrer valores repetidos.
Nesse caso como vimos anteriormente (web aula 2), é razoável organizar os dados em uma
tabela de distribuição de frequências e trabalharmos com dados agrupados.

Quando os dados estiverem agrupados numa distribuição de freqüência, usaremos a média


aritmética dos valores x1, x2, x3,....xn, ponderados pelas respectivas frequências absolutas: F1,
F2, F3,..., Fn, Assim:

Exemplo (Cálculo da média sem intervalos de classe): Dada a seguinte distribuição de


frequência, determinar a média.

Uma maneira prática para resolvermos este problema é a composição da seguinte tabela
(lembre-se que ΣFi=n):

Aplicando a equação acima, obtemos:


Exemplo (Cálculo da média com intervalos de classe): Neste caso, convencionamos que todos os
valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e
determinamos a média aritmética ponderada por meio da fórmula anterior, onde xi é o ponto
médio da classe. Dada a seguinte distribuição de frequência:

Aplicando a equação anterior temos que:

Mediana (Md)

A mediana é o valor que ocupa a posição central do conjunto de dados ordenados (ROL),
portanto está localizada na posição central, tal que 50% dos valores são menores que a mediana,
e os demais 50% são maiores.

Para a sua determinação utiliza-se a seguinte regra, depois de ordenada a amostra de n


elementos dispostos segundo uma ordem (crescente ou decrescente):

Quando o número de elementos (n) da série estatística for ímpar, haverá coincidência da
mediana com um dos elementos da série. Neste caso existirá um único valor de posição central,
e esse valor será a mediana.

Por exemplo, o conjunto de dados {2, 5, 6, 9, 10, 13, 15}, O valor que divide a esta série em
duas partes iguais é igual a 9, logo a mediana é 9.

Quando o número de elementos da série estatística for par, nunca haverá coincidência da
mediana com um dos elementos da série de dados. A mediana será sempre a média aritmética
dos 2 elementos centrais da série de dados. Por exemplo, o conjunto de dados {0, 0, 1, 1, 2, 3,
3, 4, 5, 6}, a mediana no exemplo será a média aritmética do 5º e 6º termos da série. Portanto,
a mediana será = (2+3) / 2, ou seja, m = 2,50.Em algumas circunstâncias, a medida melhor
descreve a tendência central dos dados. É o caso de conjuntos com dados discrepantes, isto é,
dados que têm um ou mais valores bem maiores ou menores que os demais. Por exemplo:

Em {5, 7, 10, 13, 15} a média = 10 e a mediana = 10

Em {5, 7, 10, 13, 65} a média = 20 e a mediana = 10

A média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores
extremos, ao passo que a mediana permanece a mesma.

Cálculo da mediana em dados agrupados e sem intervalos de classe (variável discreta): Neste
caso, é o bastante identificar a frequência acumulada imediatamente superior à metade da
soma das frequências. A mediana será aquele valor da variável (x) que corresponde a tal
frequência acumulada.

• Quando o somatório das frequências (n) for ímpar o valor mediano será o termo de ordem dado
pela fórmula:

Onde: n= nº. total de elementos; fi=frequência acumulada

• Quando o somatório das frequências (n) for par a mediana será a média entre os elementos de

ordem

Exemplo (n = impar): Dada a distribuição de frequência:

Neste caso, n=11 é impar, logo a mediana (m) será o elemento de ordem , ou seja,

. Por meio das frequências acumuladas, encontra-se o valor de xi


correspondente a mediana. Neste exemplo, será o valor 3, portanto, a mediana =3. Observe:
será o xi correspondente à classe que contiver a ordem calculada.

Exemplo (n = par): Dada a distribuição de frequência:

Neste caso n=8, é par, logo a mediana (m) será a média entre os valores de ordem

, ou seja: . Assim, a mediana


corresponde à média: (4º elemento + 5º elemento) / 2 = (15 + 16) / 2 = 15,5

Cálculo da mediana em dados agrupados e com intervalos de classe (variável contínua):

Devemos seguir os seguintes passos:


1º Passo) Determinamos as frequências acumuladas (∑fi = n);

2º Passo) Calculamos ; como a variável é contínua, não se preocupe se n é par ou ímpar.


3º Passo) Marcamos a classe correspondente à frequência acumulada imediatamente superior à
∑fi/2 . Tal classe será a classe mediana (classe Md);
4º Passo) Calculamos a Mediana pela seguinte fórmula:

Onde:
lMd = limite inferior da classe mediana;
n = tamanho da amostra ou número de elementos;
FAA = é a frequência acumulada da classe anterior à classe mediana.
h = é a amplitude do intervalo da classe mediana.
FMd = é a frequência da classe mediana.

Exemplo: Dada a distribuição amostral, calcular a mediana.

1º Passo: Calcula-se . Como n=58, temos que


2º Passo: Identifica-se a classe mediana (Md) pela frequência acumulada. Neste caso a classe
mediana é a 3º.
3º Passo: Aplica-se a fórmula:

Neste caso: lMd = 55; n = 58; FAA= 17; h = 10, FMd = 18; Logo:
Moda (Mo)

Dentre as principais medidas de posição, destaca-se a Moda. É o valor da amostra que mais se
repete, ou seja, valor que ocorre com maior frequência.

A Moda quando os dados não estão agrupados: A moda é facilmente reconhecida: basta, de
acordo com definição, procurar o valor que mais se repete. Por exemplo, no conjunto de dados
{7, 8, 9, 10, 10, 10, 11, 12} a moda é igual a 10.

Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes
que outros. Por exemplo, o conjunto de dados {3, 5, 8, 10, 12} não apresenta moda. A série é
amodal.

Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série
tem dois ou mais valores modais. Por exemplo, o conjunto de dados {2, 3, 4, 4, 4, 5, 6, 7, 7, 7,
8, 9} apresenta duas modas: 4 e 7. Neste caso a série é bimodal.

Distribuições Simples: Quando uma tabela de distribuição de frequência apresenta grande


quantidade de dados. É importante destacar a classe de maior frequência, a chamada classe
modal. Essa classe mostra a área em que os dados estão concentrados. Assim, para a
distribuição:

A moda será 248 (maior frequência). Indica-se Mo=248 (moda)

Valores Agrupados com intervalos de classe: A classe que apresenta a maior frequência é
denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor
dominante que está compreendido entre os limites da classe modal. Um dos métodos para
determinação da moda é a aplicação da fórmula de CZUBER:

1º Passo) Identifique a classe modal (aquela que possuir maior frequência).

2º Passo) Aplicar a fórmula:

Onde:
l = limite inferior da classe modal
d1 = frequência da classe modal - frequência da classe anterior à da classe modal
d2 = frequência da classe modal - frequência da classe posterior à da classe modal
h = amplitude da classe modal
Exemplo: Determinar a moda para a seguinte distribuição de frequência:
1º Passo) Identifica-se a classe modal. Neste caso, trata-se da 3¿ classe 2 I- 3.
2º Passo) Sabendo que: l = 2; d1 = 17-10=7; d2 = 17-8=9; h = 1. Aplica-se a fórmula dada acima:

Aprofundando o conhecimento: Agora sugiro que você abra a biblioteca digital, procure pelo
livro: LARSON, R.; FARBER, B. Estatística Aplicada. 2ª Edição. São Paulo: Editora Pearson, 2008 e
leia o capítulo 2 da página 47 a 57.

WEB AULA 2

MEDIDAS ESTATÍSTICAS

Por causa da variabilidade as medidas de tendência central, ainda que consideradas como
números que têm a faculdade de representar uma série de dados, não podem por si mesma
destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que
compõem o conjunto e, portanto, não bastam para descrever um conjunto de dados. As medidas
de tendência central são tanto mais descritivas de um conjunto de dados quanto menor for a
variabilidade. Então, quando apresentamos medidas de tendência central para descrever um
conjunto de dados, devemos indicar também uma medida de variabilidade ou dispersão.

MEDIDAS DE DISPERSÃO

São medidas estatísticas utilizadas para avaliar o grau de variabilidade ou dispersão, dos valores
em torno da média.

Consideremos os seguintes conjuntos de valores das variáveis X, Y e Z:

X = {70, 70, 70, 70, 70}


Y = {68, 69, 70, 71, 72}
Z = {5, 15, 50, 120, 160}

Podemos observar que os três conjuntos apresentam a mesma média aritmética = 350/5 = 70

Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que
todos os valores são iguais à média. O conjunto Y, por sua vez, é mais homogêneo que o
conjunto Z, pois há menor diversificação entre cada um de seus valores e a média
representativa. Portanto, concluímos então que o conjunto X apresenta DISPERSÃO NULA e que o
conjunto Y apresenta uma DISPERSÃO MENOR que o conjunto Z.A seguir, são apresentadas as
principais medidas de dispersão da estatística: amplitude, desvio-médio, desvio-padrão e
variância.

Medidas de Dispersão Absoluta:

Amplitude Total (A)

É a diferença entre o maior e o menor valor observado no conjunto de dados, conforme segue:

Amplitude = Valor máximo — Valor mínimo

Exemplo:
Para a série: 10,12,20,22,25,33,38, a amplitude total é dada por:

Amplitude = 38 — 10 = 28

Observação: A utilização da amplitude total como medida de dispersão é muito limitada, pois,
sendo uma medida que depende apenas dos valores externos, é instável, não sendo afetada pela
dispersão dos valores internos.

Desvio-Médio (DM)

Quando desejamos medir a dispersão dos dados em relação à média, é interessante a análise dos
desvios em torno da média. Isto é:

Portanto, pela fórmula acima podemos perceber que o desvio em relação à média (di) é a
diferença entre cada elemento de um conjunto de valores e a média aritmética.

Mas a soma de todos os desvios é igual a zero. Isto é:

O desvio médio (DM) é a média aritmética dos valores absolutos dos desvios tomados em relação
à média.

Onde: n= número de elementos; x = média amostral; Fi = frequência.

Veja que os desvios foram considerados em módulo, evitando-se assim que a soma fosse nula.

Variância populacional (σ2) e amostral (S2)

A variância é uma medida que tem pouca utilidade como estatística descritiva. Porém, é
extremamente importante na inferência estatística e em combinações de amostras. A definição
de variância populacional (σ2) é dada por:

Observações:

1. σ2 indica variância populacional e lê-se sigma ao quadrado;


2. X= média da população (populacional)
3. Fi = frequência
4. N = tamanho da população

Para o caso do cálculo da variância amostral (S2), é conveniente o uso da seguinte fórmula:
Onde: x = média amostral, n = tamanho da amostra.

Desvio Padrão populacional (σ) e amostral (S)

O desvio padrão é a medida de dispersão mais geralmente empregada, pois leva em


consideração a totalidade dos valores da variável em estudo. É um indicador de variabilidade
bastante estável.

Observando-se a fórmula original para o cálculo da variância, nota-se que a é uma soma de
quadrado. Dessa forma, se a unidade da variável for, por exemplo, metro (m) teremos como
resultado metro ao quadrado (m2). Para se ter a unidade original, necessita-se definir outra
medida de dispersão, que é a raiz quadrada da variância – o desvio padrão. Assim temos:

Resumindo: para o cálculo do desvio-padrão deve-se primeiramente determinar o valor da


variância e, em seguida, extrair a raiz quadrada desse resultado.

OBS.: O desvio padrão tem a mesma dimensão de unidades dos valores da média.

O desvio padrão possui algumas propriedades, dentre as quais destacamos:

• Somando-se (ou subtraindo-se) uma constante a todos os valores de uma variável, o desvio
padrão não se altera.

• Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante
(diferente de zero), o desvio padrão fica multiplicado (ou dividido) por essa constante.

Exemplo: Calcular o desvio-médio (DM), a variância (S2) e o desvio-padrão (S) da seguinte


distribuição amostral.

Resolução:

Primeiramente, precisamos do valor da média, conforme vimos anteriormente na web aula 3,


temos que:

1º) Cálculo do Desvio-Médio (DM)

Para o cálculo do DM deverão ser abertas novas colunas, conforme segue:


2º) Cálculo da Variância Amostral (S2)

Para calcularmos a variância amostral (S2), é preciso encontrar o valor de ∑di2Fi. Para tanto,
uma nova coluna deverá ser considerada na tabela anterior:

3º) Cálculo desvio-padrão Amostral (S)

Como

Resumindo: A distribuição possui média 8,06. Isto é, seus valores estão em torno de 8,06 e seu
grau de dispersão é de 1,20, medido pelo desvio-médio, e de 1,69, medido pelo desvio-padrão.

Medida de Dispersão Relativa:

Coeficiente de Variação (CV)

Trata-se de uma medida relativa de dispersão útil para comparação em termos relativos do grau
de dispersão em torno da média de séries distintas. É dado por:
Onde:
σ = desvio-padrão populacional; S= desvio-padrão amostral
X = média populacional; x = média amostral

Exemplo: Numa empresa, o salário médio dos homens é de R$ 4000,00 com desvio-padrão de R$
1500,00, e os das mulheres é em média de R$ 3000,00 com desvio-padrão de R$ 1200,00. Então:

Logo, podemos concluir que nesta empresa os salários das mulheres apresentam maior dispersão
relativa que os dos homens.

Nota
Questão 1
Excelente
Uma parte ou subconjunto da população selecionada para análise denomina-se:
Sua resposta
Amostra.
Resposta gabarito
Amostra.
Comentário do gabarito
Conforme vimos anteriormente, a amostra é uma parte ou subconjunto da população, que é
selecionada para análise estatística (Estatística Descritiva).
Nota
Questão 2
Excelente
O número de funcionários de uma empresa é uma variável:
Sua resposta
Quantitativa Discreta.
Resposta gabarito
Quantitativa Discreta.
Comentário do gabarito
O número de funcionários de uma empresa trata-se de uma variável que só pode assumir apenas
valores inteiros, portanto, uma variável quantitativa discreta.
Nota
Questão 3
Excelente
Considerando a pesquisa de opinião dos consumidores de certo produto, representada
pela tabela abaixo, determine a porcentagem de consumidores que preferem o produto
“C”.

Sua resposta
21,85 %.
Resposta gabarito
21,85 %.
Comentário do gabarito
Cálculo da porcentagem de consumidores que preferem o produto C = (Frequência Relativa)
*100%: (600/2745)*100 = 21,85 %
Nota
Questão 4
Excelente
A gerência industrial de certa empresa coletou uma amostra formada 64 produtos
produzidos. A quantidade de defeitos contidas em cada produto foi contada, e variaram
de 3 a 51 defeitos. Os resultados obtidos foram tabulados em classes de frequências,
construídas conforme os procedimentos formais da estatística, sendo que o número de
classes foi obtido segundo a regra de Sturges. Calcule o tamanho do intervalo de cada
classe (h).
Sua resposta
7
Resposta gabarito
7
Comentário do gabarito
Amplitude total (A)= 51 - 3 = 48; número de classes (K): K= 1 + 3,3*log (64) = 6,96 ~ 7 classes
(arredondar para o maior valor inteiro); tamanho do intervalo das classes (h) é dado por: h=A/K,
ou seja, h=48/7=6,85 ~ 7(arredondar para o maior valor inteiro). Portanto, h=7.
Nota
Questão 5
Excelente
Assinale a alternativa que melhor apresenta gráfico usualmente empregado para
representar a evolução conjunta de duas variáveis quantitativas, sendo que X é
considerada a variável independente e Y a variável dependente.
Sua resposta
Gráfico de Dispersão.
Resposta gabarito
Gráfico de Dispersão.
Comentário do gabarito
O gráfico que é usualmente empregado para representar a evolução conjunta de duas variáveis
quantitativas, sendo que X é considerada a variável independente e Y a variável dependente é o
gráfico de dispersão.

Nota Não
Questão 1
gerada
Dados os conjuntos de valores: A = {1, 1, 2, 3, 4, 5, 5, 8, 8, 8, 9, 10}. B = {6, 7, 8, 9, 9,
10, 11, 12}. C = {1, 2, 4, 4, 4, 4, 5, 8, 9, 9, 9, 9, 10}. Em relação à moda, afirmamos que:
I) A é unimodal, e a moda é 10. II) B é unimodal, e a moda é 9. III) C é bimodal, e as
modas são 4 e 9. Então, em relação às afirmativas, é CORRETO afirmar que:
Sua resposta
Somente II e III são verdadeiras.
Nota Não
Questão 2
gerada
Durante cinco meses consecutivos, os rendimentos da bolsa de valores foram iguais a
4%, (-1%), 5%, (-2%) e 6%, respectivamente. Com base, nestes cinco meses, foram
calculados o rendimento médio (retomo esperado) e o risco, dado pelo desvio padrão
amostral (s). Os resultados obtidos foram:
Sua resposta
Média = 2,40% e desvio padrão = 3,65%.
Nota Não
Questão 3
gerada
Dada a distribuição de frequência, qual o valor da mediana:

Sua resposta
21,85
Nota Não
Questão 4
gerada
Calcular a média para distribuição de frequência:

Sua resposta
10,61
Nota Não
Questão 5
gerada
Dadas as receitas mensais de certa empresa, em US$ milhões, a receita média mensal
do ano e o desvio-padrão amostral respectivamente são:

Sua resposta
8,80 e 3,66

Potrebbero piacerti anche