Sei sulla pagina 1di 75

20/05/2017

ESTATÍSTICA ECONÔMICA II
Profa. Andrea Andrade Prudente

Departamento de Estatística

Instituto de Matemática e Estatística

Por que estudar


Estatística?
Para saber como apresentar e descrever
informações de forma apropriada;

Para saber como tirar conclusões a partir de


grandes populações, com base somente na
informação obtida a partir de amostras;

Para saber como melhorar os processos;

Para saber como obter previsões confiáveis;

Métodos estatísticos são essenciais no estudo de


situações em que os fatores de interesse
2
apresentam grande variabilidade.

1
20/05/2017

Estatística
É uma coleção de métodos para planejar experimentos, obter,
organizar, resumir, analisar e interpretar dados e deles extrair

Profa. Andrea A. Prudente


conclusões.

Uma ciência baseada na Teoria das Probabilidades, cujo


objetivo principal é nos auxiliar a tomar decisões ou obter
conclusões em situação de incerteza, a partir de informações
numéricas.

Grandes áreas da
Estatística
Profa. Andrea A. Prudente

Estatística Descritiva = coleta de dados, organização,


apresentação e sintetização dos dados.

Estatística Inferencial = consiste em inferir (deduzir ou tirar


conclusões a respeito das) propriedades de um universo a partir
de uma amostra.

2
20/05/2017

População e Amostra
População:
Conjunto de todos os indivíduos, objetos ou informações que

Profa. Andrea A. Prudente


apresentam pelo menos uma característica (observável) comum
cujo comportamento interessa-nos analisar.

Quanto ao número de elementos, a população pode ser finita


ou infinita.

Exemplo: Deseja-se estudar os salários mensais pagos no setor


industrial baiano no ano de 2015.
5

População e Amostra
População: conjunto de todos os trabalhadores alocados nas
indústrias localizadas no Estado da Bahia em 2015.
Profa. Andrea A. Prudente

Característica de interesse: salários pagos a esses trabalhadores.

Censo é uma coleção de dados relativos a todos os elementos


de uma população.

Amostra:
Qualquer subconjunto finito de elementos extraídos da
população, em geral com dimensão sensivelmente menor, sobre
o qual se faz as observações. 6

3
20/05/2017

Profa. Andrea A. Prudente


Qualquer amostra fornece informações, porém não é qualquer
uma que permite estender os resultados para a população da
qual ela foi retirada. 7

Classificação de Variáveis
As características da população são comumente chamadas de
variáveis. Estas, quanto à sua natureza, são classificadas como
Profa. Andrea A. Prudente

qualitativas e quantitativas.

4
20/05/2017

Variáveis qualitativas
Se os resultados das observações serão expressos através de
categorias, que se distinguem por alguma característica não-
numérica.

Profa. Andrea A. Prudente


Exemplo: setor de atividade econômica, porte da empresa, grau
de escolaridade do empregado, sexo, estado civil, …

Variáveis quantitativas
Se os resultados das observações serão expressos sempre através
de números, que representam contagens ou medidas.
Exemplo: número de empregados, salário mensal, faturamento
anual, idade, altura, peso, …
9

As variáveis qualitativas podem ser classificadas em:

Nominal
Caracteriza-se por dados que consistem apenas em nomes,
rótulos ou categorias. Os dados não podem ser dispostos
Profa. Andrea A. Prudente

segundo uma ordem.


Exemplo: setor de atividade econômica, sexo, (sim ou não),
estado civil, …

Ordinal
Envolve dados que podem ser dispostos em alguma ordem.
Exemplo: porte da empresa, grau de escolaridade do
empregado, grau de satisfação, classe social, … 10

5
20/05/2017

As variáveis quantitativas, estas podem ser classificadas em:

Discreta
Quando os resultados possíveis da observação formam um
conjunto finito ou infinito enumerável de números e que

Profa. Andrea A. Prudente


resultam, frequentemente de uma contagem.
Exemplo: número de empregados, idade (em anos completos),
número de ações negociadas em uma Bolsa de Valores, …
Contínua
Pode assumir qualquer valor pertencente a um determinado
intervalo do conjunto dos números reais e que resultam,
normalmente, de uma mensuração (medição).
11
Exemplo: salário mensal, faturamento anual, altura, peso, …

Outra maneira de classificar dados é usando as escalas de


mensuração.

Escala nominal
Escala ordinal

Escala intervalar
É como o nível ordinal, mas as diferenças são significativas, não
existe ponto inicial natural e as razões não têm sentido.
Exemplo: a medição da temperatura, o calendário, a distância
entre duas cidades, … 13

6
20/05/2017

Escala de razão
É o nível intervalar com a propriedade adicional de que há um
ponto inicial, zero natural. Para valores nessa escala, as
diferenças e razões, são ambas, significativas.
Exemplo: peso, preço, duração em minutos de um filme, …

13

Coleta de dados
Os dados estatísticos podem ser obtidos de várias maneiras:

• Fonte publicada
Profa. Andrea A. Prudente

Exemplo: balanço de uma S.A., cadastro de uma empresa na


Junta Comercial, dados do IBGE e SEI, etc.

• Estudo controlado (experimento)


Exemplo: medir a eficiência de novo método de alfabetização
em comparação ao método tradicional.

• Pesquisa de campo

• Estudo observacional
14
Exemplo: observar o comportamento social de um grupo de
indivíduos numa situação especial.

7
20/05/2017

Coleta de dados
• Registros administrativos
São informações (dados) que resultam da necessidade de
fiscalizar, de controlar a geração e a utilização dos impostos

Profa. Andrea A. Prudente


ou de organizar administrativamente órgãos e entidades
públicas e privadas.
- Elaborar uma avaliação prévia da base conceitual,
classificatória e da referência temporal desses registros para o
uso para fins estatísticos.
Exemplo: Os registros administrativos referentes ao ICMS,
informação sob a guarda das Secretarias da Fazenda dos
Estados. Este imposto é registrado de três formas diferentes: 15

ICMS gerado, recolhido e transferido no mês.

Coleta de dados
Exemplos de órgãos públicos que produzem informações
estatísticas oriundas de seus registros administrativos:
Profa. Andrea A. Prudente

RAIS – Relação Anual de Informações Sociais/Ministério do


Trabalho e Emprego (MTE): “Registra grande quantidade de
informações necessárias ao processo administrativo
(viabilização do pagamento do abono salarial, por exemplo)
e possibilita, também, tabulações estatísticas de fundamental
importância para o acompanhamento e para a
caracterização do mercado de trabalho formal.”
16

8
20/05/2017

Coleta de dados
CAGED – Cadastro Geral de Empregados e
Desempregados/Ministério do Trabalho e Emprego (MTE):

Profa. Andrea A. Prudente


“Constitui fonte de informação de âmbito nacional e de
periodicidade mensal. Foi criado como instrumento de
acompanhamento e de fiscalização do processo de admissão
e de dispensa de trabalhadores regidos pela CLT, com o
objetivo de assistir os desempregados e de apoiar medidas
contra o desemprego. (…) Como decorrência dos substanciais
avanços, pôde-se construir, a partir de 1983, o índice mensal
de emprego, a taxa de rotatividade e a flutuação da mão-
17
de-obra (admitidos/desligados).”

Apresentação dos dados

Os dados estatísticos podem ser mais facilmente


Profa. Andrea A. Prudente

compreendidos quando apresentados através de tabelas e


gráficos, que permite uma visualização instantânea de
todos os dados.

18

9
20/05/2017

Apresentação Tabular

A apresentação de dados estatísticos na forma tabular consiste


na reunião ou grupamento dos dados em tabelas.

Profa. Andrea A. Prudente


Uma tabela dispõe os dados de uma forma ordenada e
resumida, facilitando a compreensão das conclusões da análise
apresentadas ao leitor.

As normas para apresentação dos dados em tabelas, bem como


definições, terminologia e simbologia, podem ser encontradas
em:
• Resolução nº 886 de 26-10-1966 do Conselho Nacional de Estatística.
19
• IBGE – Normas de Apresentação Tabular. 3ª Ed. Rio de Janeiro,
1993.

Apresentação Tabular

A apresentação de dados estatísticos na forma tabular consiste


na reunião ou grupamento dos dados em tabelas.
Profa. Andrea A. Prudente

Uma tabela dispõe os dados de uma forma ordenada e


resumida, facilitando a compreensão
RESOLUÇÃO dasDEconclusões
CD Nº 10/15, 31 DE da análise
MARÇO DE 2015
apresentadas ao leitor.
Institui Grupo de Trabalho visando à
atualização da publicação das
Normas de Apresentação
As normas para apresentação dos dadosTabular.
em tabelas, bem como
definições, terminologia e simbologia,
Coletânea podem
da Legislação ser encontradas
do IBGE
Atualizada em: jul. 2016
em:
• Resolução nº 886 de 26-10-1966 do Conselho Nacional de Estatística.
20
• IBGE – Normas de Apresentação Tabular. 3ª Ed. Rio de Janeiro,
1993.

10
20/05/2017

Exemplo de uma tabela e seus elementos. O título deve responder

O que?
Quando?
Onde?

Profa. Andrea A. Prudente


Rodapé
(Fonte e Notas)
21

Elementos complementares:
Nota geral
Texto esclarecedor do conteúdo geral de uma tabela. Deve ser
inscrito logo após a fonte e ser precedido do termo Nota ou
Profa. Andrea A. Prudente

Notas.
Nota específica
Texto esclarecedor de algum elemento específico de uma
tabela. Deve ser inscrito no rodapé, logo após a nota geral (se
existir) .
Chamadas
Símbolo remissivo atribuído a algum elemento de uma tabela
22
que necessita uma nota específica.

11
20/05/2017

Exemplo:

23

ALERTA!!!!
A tabela deve ser autoexplicativa, isto é, sua compreensão
deve estar desvinculada do texto.
Nenhuma célula deve ficar em branco, utilizar os sinais
Profa. Andrea A. Prudente

convencionais – representação gráfica que substitui o dado


numérico.
A tabela não deve ser delineada à direita e à esquerda, por
traços verticais.
Numerar as tabelas quando em quantidade.
Totais e subtotais destacados.
Uniformidade com o número de casas decimais.
24

12
20/05/2017

Sinais Convencionais
- Dado numérico igual a zero não resultante de arredondamento;
.. Não se aplica dado numérico;
... Dado numérico não disponível;
Dado numérico omitido a fim de evitar a individualização da
x
informação;
0
0,0 Valor igual a zero resultante de arredondamento de um dado
0,00 numérico originalmente positivo;
etc.
-0
-0,0 Valor igual a zero resultante de arredondamento de um dado
-0,00 numérico originalmente negativo.
etc.

25

Tipos de Tabelas

Séries Estatísticas
É toda tabela que apresenta a distribuição de um conjunto de
Profa. Andrea A. Prudente

dados estatísticos em função do tempo, local ou fato.


Estes elementos determinam o surgimento de quatro tipos
fundamentais de séries estatísticas:
̶ Séries temporais, históricas ou cronológicas;
̶ Séries geográficas, espaciais, territoriais ou de localização;
̶ Séries específicas ou categóricas;
̶ Séries mistas ou conjugadas. 26

13
20/05/2017

Tipos de Tabelas

Distribuição de frequência (ou tabela de frequência)


É toda tabela que mostra como o conjunto de dados é dividido

Profa. Andrea A. Prudente


entre suas categorias ou seus valores observados, considerando o
número de vezes que ocorreram (frequência).

Podemos dividir as distribuições de frequências em dois tipos:

̶ sem intervalos de classe - usada para variáveis qualitativas


ou quantitativas discretas com poucos valores diferentes;
̶ com intervalos de classes - usada para variáveis
quantitativas contínuas ou discretas com muitos valores
27
diferentes.

Séries Estatísticas

Série Temporal, Histórica ou Cronológica – O elemento que


serve como base de classificação é a fração do tempo, como o
Profa. Andrea A. Prudente

dia, o mês, o ano, o século, etc.

Vítimas mortas em acidentes de trânsito no


município de Salvador-BA, período 2010-2013

Anos Vítimas mortas


2010 258
2011 240
2012 260
2013 261
Fontes: SET/Detran/CP.
28

14
20/05/2017

Série Geográfica, Espacial, Territorial ou de Localização –


Apresenta como elemento variável somente o local.

Instituições públicas federais de ensino superior,

Profa. Andrea A. Prudente


segundo as Grandes Regiões - 2014

Grandes Regiões Quantidade


Norte 17
Nordeste 29
Sudeste 34
Sul 17
Centro-Oeste 10
Fonte: Instituto Nacional de Estudos e Pesquisas
Educacionais Anísio Teixeira – INEP.

29

Série Específica ou Categórica – Apresenta como elemento


ou caráter variável o fato (ou espécie).

Efetivo dos rebanhos – BAHIA – 2013


Profa. Andrea A. Prudente

Espécies Efetivo ( cabeças )


Bovinos 10.828.409
Bubalinos 30.299
Caprinos 2.458.179
Equinos 485.356
Ovinos 2.926.601
Suínos 1.389.113
Fonte: IBGE – Produção da Pecuária Municipal.

30

15
20/05/2017

Série Mista ou Conjugada – Combinações dos tipos de séries


citados anteriormente.

Veículos cadastrados, por tipo – Bahia – 2010-2013

Profa. Andrea A. Prudente


Veículos cadastrados 2010 2011 2012 2013
Automóvel 1.198.875 1.298.093 1.419.293 1.535.766
Camioneta 260.330 289.300 321.335 354.465
Caminhão 105.656 115.052 123.077 131.228
Ônibus 29.905 32.305 34.010 37.191
Moto 721.815 831.420 932.053 1.026.789
Outros(1) 164.216 189.755 216.981 247.647
Fonte: Detran.

(1) Micro ônibus e outros.

31

Distribuição de Frequências
Algumas definições:
Frequência simples absoluta ( ni )
É o número de ocorrências ou repetições de um valor individual
Profa. Andrea A. Prudente

ou um intervalo de valores.
Frequência simples relativa ( fi )
É a razão entre a frequência simples absoluta e o número total
de dados.
Frequência acumulada (Ni ou Fi)
abaixo de - É a soma da frequência da classe e de todas as
classes que a antecedem.
32
acima de - É a soma da frequência da classe e de todas as
classes que a sucedem.

16
20/05/2017

Resumo

33

Distribuições de frequência de acordo com o tipo de variável:

Variável Qualitativa Nominal


Profa. Andrea A. Prudente

34

17
20/05/2017

Variável Qualitativa Ordinal

Profa. Andrea A. Prudente


35

Variável Quantitativa Discreta


Profa. Andrea A. Prudente

36

18
20/05/2017

Variável Quantitativa Discreta

Profa. Andrea A. Prudente


37

Variável Quantitativa Contínua


Profa. Andrea A. Prudente

38
Slide 76

19
20/05/2017

Construção da tabela de distribuição de frequências de uma


variável qualitativa.

Exemplo: A seguir, é apresentado um conjunto de dados que

Profa. Andrea A. Prudente


indica a forma como adultos pagam suas contas mensais nos
Estados Unidos em 2007. Os dados são nominais: 1 representa
dinheiro em espécie, 2 cheque, 3 caixa eletrônico/internet, 4
designa outras formas.

39

1 2 3 1 3 1 2 3 3 1
2 2 2 2 2 2 3 1 2 3
4 3 2 3 3 3 2 2 2 3
2 2 1 1 2 2 2 4 2 2
3 3 2 2 3 3 3 2 3 2
Profa. Andrea A. Prudente

2 2 3 3 2 2 2 2 2 1
1 2 2 2 1 2 2 1 2 2
3 3 2 3 2 3 3 2 2 3
1 2 2 2 2 2 2 3 2 2
3 2 1 2 3 1 2 2 4 1

Depois de fornecidos esses dados, que podemos concluir sobre


como as pessoas pagam suas contas mensais?
40

20
20/05/2017

Dados em ordem crescente (Rol dos dados)


1 1 2 2 2 2 2 3 3 3
1 1 2 2 2 2 2 3 3 3
1 1 2 2 2 2 2 3 3 3

Profa. Andrea A. Prudente


1 1 2 2 2 2 2 3 3 3
1 1 2 2 2 2 2 3 3 3
1 2 2 2 2 2 2 3 3 3
1 2 2 2 2 2 2 3 3 3
1 2 2 2 2 2 2 3 3 4
1 2 2 2 2 2 2 3 3 4
1 2 2 2 2 2 3 3 3 4

41

Construção da tabela de distribuição de frequências de uma


variável quantitativa.

Algumas definições:
Profa. Andrea A. Prudente

Dados brutos – É o conjunto dos dados numéricos obtidos


após a coleta dos dados.
Rol – É o arranjo dos dados brutos em uma determinada
ordem crescente ou decrescente.
Amplitude Total (AT) – É a diferença entre o maior valor e
o menor valor observado.

AT = x max − xmin
42

21
20/05/2017

Número de classes (k) – Representa o total de classes da


variável.
Amplitude da classe (h) – É a divisão entre a amplitude
total e o número de classes,

Profa. Andrea A. Prudente


AT .
h=
k

Ponto médio da classe (mi) – Corresponde ao valor que se


encontra no centro do intervalo de classe,

hi
mi = linf + ; i = 1, 2K , k .
2
43

Determinação do número de classes

Não existe uma fórmula exata para o cálculo. Seja n o


tamanho da amostra selecionada. Existem alternativas:
Profa. Andrea A. Prudente

Para n ≤ 25, k = 5 e para n > 25, k ≅ n;


Fórmula de Sturges ou regra do logaritmo:
k ≅ 1 + 3,3 log 10 n.
Obs.: Segundo Morettin e Bussab, com um pequeno número de
classes perde-se informação, e com um número grande de
classes o objetivo de resumir os dados fica prejudicado.
Normalmente, sugere-se o uso de 5 a 15 classes com a mesma
amplitude. 44

22
20/05/2017

Exemplo: Os dados a seguir representam os preços de


fechamento de 40 ações ordinárias. A empresa decidiu construir
uma tabela de frequência para obter um resumo do conjunto
de dados.
Dados brutos

Profa. Andrea A. Prudente


45

Rol dos dados


Profa. Andrea A. Prudente

Passos
1. Fazer o rol dos dados, identificando o menor e o maior valor
do conjunto. Verificar o tamanho da amostra e calcular a
amplitude total;
2. Obtenção do número de classes;
3. Calcular a amplitude das classes; 46
4. Montar a tabela de distribuição de frequências.

23
20/05/2017

Apresentação Gráfica

É uma forma de apresentação dos dados com o objetivo de


produzir uma impressão mais rápida e viva do fenômeno em

Profa. Andrea A. Prudente


estudo.

Os gráficos devem obedecer a certos requisitos fundamentais:

Simplicidade - deve ser destituído de detalhes de importância


secundária, assim como de traços desnecessários que possam levar o
observador a uma análise com erros;

Clareza - deve possibilitar uma correta interpretação dos valores


representativos do fenômeno em estudo;
47
Veracidade - deve expressar a verdade sobre o fenômeno em estudo.

Algumas características indispensáveis nos gráficos:


Deve ter título e escala, para ser interpretados sem
necessidade de esclarecimentos adicionais no texto;
O título do gráfico pode ser escrito em cima ou abaixo do
Profa. Andrea A. Prudente

gráfico, em trabalhos científicos é comum estar abaixo da


figura;
No eixo das abscissas, a escala cresce da esquerda para
direita e é escrita embaixo do eixo;
No eixo das ordenadas, a escala cresce de baixo para cima e
é escrita à esquerda do eixo;
A escala deve ser iniciada em zero, caso a escala seja muito
elevada pode ser feita uma interrupção no eixo; 48

24
20/05/2017

Algumas características indispensáveis nos gráficos:


Escolher adequadamente as escalas dos eixos para não
distorcer a informação que se pretende transmitir. Se o objetivo
for comparar as informações de dois os mais gráficos, use a

Profa. Andrea A. Prudente


mesma escala;
As variáveis representadas em cada eixo devem ser
identificadas (incluir unidade de medida);
O sistema de eixos e linhas auxiliares devem ser grafados com
traço mais claro;
Exibir no rodapé a fonte que forneceu os dados.

49

Existem vários tipos de gráficos, dependendo do tipo de variável a


ser representada e da série estatística.

Fator
Tipo de Série Gráfico mais indicado
Profa. Andrea A. Prudente

Variante
Histórica Tempo Linhas, colunas
Específica Fenômeno Barras, colunas ou setores
Geográfica Local Cartogramas, colunas, barras ou setores
Histograma (contínua); colunas
Distribuição Intensidade
(discreta); barras, colunas ou setores
de frequências do fenômeno
(qualitativas)

50

25
20/05/2017

Gráfico de Setores

Profa. Andrea A. Prudente


- Adequado quando o objetivo for a análise da participação de
cada categoria em relação ao total. 51

- As frequências devem somar 100%.

Gráfico de Setores

- Não serve para fazer comparações ou evoluções temporais.


Profa. Andrea A. Prudente

52

26
20/05/2017

53

Gráfico de Barras (Colunas)


Profa. Andrea A. Prudente

- Compara a distribuição de frequências de uma mesma


variável em vários grupos de maneira rápida.
- A ordem dos grupos pode ser qualquer, ou a mais adequada.
- Economia de espaço na apresentação. 54

27
20/05/2017

Gráfico de Colunas

Profa. Andrea A. Prudente


55

Gráfico em Linhas
Profa. Andrea A. Prudente

Geralmente utilizado quando:


- Uma das variáveis é o tempo; - Várias séries em um mesmo gráfico
- Existem flutuações intensas na série; - Série cobre um grande período de
tempo. 56

28
20/05/2017

Cartogramas

- As frequências das categorias de uma variável são projetadas


nas áreas específicas do mapa, utilizando-se cores ou traçados.

57

Histograma

- É um gráfico de colunas, porém construído com as colunas


unidas devido ao caráter contínuo dos valores da variável.
Profa. Andrea A. Prudente

- Representa a distribuição da frequência de um conjunto de


dados, em que cada barra tem uma área proporcional à
frequência correspondente.

- Dispõe as informações de modo que seja possível a


visualização da forma da distribuição de um conjunto de
dados e também a percepção da localização do valor central
e da dispersão dos dados em torno deste valor central.
58

29
20/05/2017

Histograma

Histograma para a distribuição de frequências Histograma para a distribuição de frequências


(absolutas) dos índices de endividamento (em %) (relativas) dos índices de endividamento (em %)
de 20 empresas de um setor específico de 20 empresas de um setor específico

Profa. Andrea A. Prudente


59

Histograma

Histograma do custo da refeição, em dólares, Histograma do custo da refeição, em dólares,


nos restaurantes localizados em uma cidade nos restaurantes localizados nos subúrbios da
norte-americana mesma cidade norte-americana
Profa. Andrea A. Prudente

60

30
20/05/2017

Histograma (Classes Desiguais)

Faturamento das empresas industriais (em mil unidades monetárias) de


uma determinada região no ano X

Profa. Andrea A. Prudente


61

Alguns tipos de histogramas


Profa. Andrea A. Prudente

Assimétrico à Assimétrico à
Simétrico esquerda direita

62
Ilhas Isoladas Bimodal (com dois picos)

31
20/05/2017

Polígono de frequências

- É um gráfico construído reunindo-se os pontos médios


das classes das bases superiores dos retângulos de um
histograma.

Profa. Andrea A. Prudente


- As alturas dos pontos que estão ligados para formar o
polígono representam as frequências das classes.

- Para realmente obtermos um polígono (linha fechada),


devemos completar a figura, ligando os extremos da
linha obtida aos pontos médios da classe anterior à
primeira e da posterior à última, da distribuição.
63

Polígono de frequências
Profa. Andrea A. Prudente

Fonte: Instituto Goiano de Matemática - Estatística descritiva: variáveis contínuas. 64


http://www.igm.mat.br/aplicativos/index.php

32
20/05/2017

33
Profa. Andrea A. Prudente Profa. Andrea A. Prudente
65

66
Representação Gráfica
Cuidados na
20/05/2017

Profa. Andrea A. Prudente


67

“O gráfico de evolução, na parte


superior esquerda, ficaria mais
claro com o uso de gráfico de
tendência.”
Profa. Andrea A. Prudente

“...uso das ondas sonoras da buzina


para mostrar quais os locais são os
grandes responsáveis pelos
chamados de barulho.”

“O problema é que há uma distorção


da parte gráfica para o que
realmente são os dados.”
68

Estado de São Paulo, 20/06/2010, Caderno C-3.

34
20/05/2017

“Tufte batizou isto de “Lie Factor” (fator de


mentira) do gráfico, onde a forma não
representa o valor e podemos ser induzidos a
concluir algo que os dados não dizem.”

Profa. Andrea A. Prudente


69

Estado de São Paulo, 20/06/2010, Caderno C-3.

Gráfico interessante
Profa. Andrea A. Prudente

“Variando apenas uma dimensão (altura), gráfico bonito,


claro e principalmente rápido para comunicar a informação,
mostra o limite de dano à saúde e que a vuvuzela realmente
tem um som infernal.”

70

Revista Veja, 23/06/2010.

35
20/05/2017

Profa. Andrea A. Prudente


“Mesmo que fique “chata” ou “sem graça” a
barra comprida e sem o efeito 3D, num
gráfico de barras não há necessidade da
terceira dimensão e nunca devemos começar
escalas pela metade, sem exceções.”

71
“O Brasil a preço de ouro”, Revista Veja, 27/10/2010.

“Manchete e o Gráfico, um fala uma


coisa, o outro desmente e vice-versa.”

“um erro de classificação de


duas das barras”

“não dispor as barras numa


ordem decrescente”

“...não se encontra no gráfico o aumento


no faturamento de 43% de 2008 para
2010, e sim 33% (de 0,9 para 1,2).”

“...declarar que o cinema chinês conquista


“o mercado” sendo que o gráfico
posiciona a China lá embaixo, em
penúltimo lugar, com destaque enorme
para Japão, Reino Unido e França.” 72

Folha de São Paulo, 22/05/2010.

36
20/05/2017

Medidas estatísticas de
sumarização ou resumo
Valores que resumem um conjunto de dados podem ser

Profa. Andrea A. Prudente


classificados em:

Medidas de Posição;

Medidas de Dispersão;

Medidas de Assimetria;
Se as medidas forem calculadas para os
Medidas de Curtose. dados de uma amostra, elas são
chamadas de estatísticas da amostra.
Se as medidas forem calculadas para os 73
dados de uma população, elas são
chamadas de parâmetros populacionais.

Medidas de posição
ou localização
Profa. Andrea A. Prudente

Média

Mediana Medidas de tendência central

Moda

Quantis

74

37
20/05/2017

Média Aritmética Simples

É um valor que respresenta um ponto de equilíbrio. É a


somatória de valores dividido pelo número de valores.

Profa. Andrea A. Prudente


Σ in=1 xi Média Amostral
x=
n

Média Populacional Σ iN=1 xi


µ=
N 75

Exemplo: As tarifas cobradas por cheques devolvidos (em $),


para uma amostra correspondente a 10 bancos, é

26 28 20 21 22 25 18 23 15 30
Profa. Andrea A. Prudente

Calcule o valor médio das tarifas.

76

38
20/05/2017

Média Aritmética Ponderada

Calculada quando se deseja definir pesos para valores


específicos do conjunto de dados, podendo ser definida por:

Profa. Andrea A. Prudente


Σ in=1 xi .wi
x= n
Σ i =1 wi
Exemplo: Um estudante obteve na 1ª unidade a nota 7,0, na 2ª
nota 9,0 e na 3ª nota 8,0. A nota final do semestre é uma
média ponderada, em que as três unidades têm pesos 3, 3 e 4,
respectivamente. Logo, qual será a nota final deste aluno? 77

No caso de distribuições de frequências, os ponderadores


serão as frequências.

Σ ik=1 xi .ni
x= k
Σ i =1 ni

ni
x = ∑i =1 xi
k
= Σ ik=1 xi f i
Σ k
i =1 ni
78

39
20/05/2017

Exemplo: Deseja-se estudar o número de erros de impressão em


um livro. Para isso escolhe-se uma amostra de 50 páginas deste
livro encontrando-se o seguinte número de erros por página:

Erros Número de páginas Frequência relativa


(xi) (ni) (fi)
0 25 0,50
1 10 0,20
2 5 0,10
3 6 0,12
4 4 0,08
Total 50 1,00

Encontre o número médio de erros.


79
7
9

Exemplo: Foram monitoradas eletronicamente 25 residências,


para determinar o número de horas em que a televisão da
família permanecia ligada em um período de 24 horas. O
resultado encontra-se a seguir na forma de distribuição de
Profa. Andrea A. Prudente

frequência.

Número de horas Frequência


0 |-- 5 6
5 |-- 10 5
10 |-- 15 8
15 |-- 20 4
20 |-- 25 2
Total 25

Em média, quantas horas uma família passa com a televisão 80

ligada?

40
20/05/2017

Comentários

A média representa um valor “típico” (característico) do


conjunto de dados.

Profa. Andrea A. Prudente


É a principal medida de tendência central, por fornecer uma
medida intuitiva e de fácil interpretação.
Leva em consideração todas as observações efetuadas.
Cálculo simples e fácil de ser realizado.

81

Propriedades da média aritmética

1. A soma algébrica dos desvios (ou diferenças) de cada elemento


de um conjunto de números em relação à média aritmética é
zero.
Profa. Andrea A. Prudente

2. A soma do quadrado dos desvios tomados em relação à média


aritmética é um valor mínimo.
3. Se n1 números têm média x1 , n2 números têm média x2 , …,
nk números têm média xk , a média global será a média
aritmética ponderada dos x j com os ponderadores sendo os n j ,
para j = 1, K , k .

82

41
20/05/2017

Propriedades da média aritmética

Exemplo: A tabela abaixo fornece o número de propriedades agrícolas, por


classes de tamanho, e o tamanho médio por classe. Calcule a média
aritmética global para todos os estabelecimentos.

Profa. Andrea A. Prudente


83

Propriedades da média aritmética

4. Somando-se (ou subtraindo-se) um valor constante e


arbitrário a cada um dos elementos de um conjunto de
números, a média fica somada (ou subtraída) por essa
Profa. Andrea A. Prudente

constante.

84
X =5 xi + 10 X = 15

42
20/05/2017

Propriedades da média aritmética

5. Multiplicando-se (ou dividindo-se) cada elemento de um


conjunto de números por um valor constante e arbitrário, a
média fica multiplicada (ou dividida) por essa constante.

Profa. Andrea A. Prudente


85

X =5 xi × 2 X = 10

Desvantagem

Muito sensível a valores extremos, isto é, a valores


excessivamente pequenos ou grandes, em relação às demais
Profa. Andrea A. Prudente

observações do conjunto de dados.

Exemplo: Salário médio mensal (em reais) de cinco empregados


de uma certa empresa.
R$ 640,60

Rol: 123 145 210 225 2.500


86

43
20/05/2017

Moda
A moda é o valor que ocorre com maior frequência na
distribuição, quando trabalhamos com valores individuais.

Exemplo:
X = {2, 3, 3, 5, 5, 5, 6, 7}
Y = {10, 12, 17, 21, 32}
Z = {2, 2, 5, 5, 7, 7}
W = {10, 12, 12, 12, 13, 13, 15, 18, 18, 18, 21}

A moda é a menos empregada. No entanto, é adequada para


caracterizar situações onde estejam em causa os casos ou
valores mais usuais. Por exemplo:
87
Em estudos de mercado, o empresário pode estar interessado
nos produtos que mais se vendem.

Exemplo: Estudo sobre qual o animal escolhido para bicho de


estimação .

Animal de Frequência
Estimação (%)
Cachorro 40
Gato 30
Pássaro 20
Outros 10
Total 100

Qual a moda?

88

44
20/05/2017

Moda Bruta
É o ponto médio da classe modal, quando trabalhamos com
valores em intervalos de classes.

Exemplo: Faturamento no ano 2 das empresas situadas na


Região XWZ.

89

Cuidados no uso da moda

Muitas vezes a moda não apresenta utilidade como


elemento sintetizador do conjunto de dados.
Exemplo:

Para variáveis contínuas, só tem sentido calcularmos a moda


se as informoções estiverem agrupadas em intervalos de
classes. 90

45
20/05/2017

Mediana

É o valor central em uma distribuição, quando o conjunto de


dados está ordenado.

Divide a distribuição em duas partes iguais, de modo que 50%


dos valores observados são iguais ou inferiores ao valor
mediano e 50% iguais ou superiores a esse valor.

A mediana é uma medida de posição resistente, pois é pouco


afetada por mudanças de pequena porção dos dados, ao
contrário da média que é sensível a valores atípicos
(discrepantes).
91

Mediana

Para dados não-agrupados:

- Se o total de observações for ÍMPAR, a mediana, é o valor que


ocupa a posição P = n + 1 . Ou seja, a mediana está localizada
2
exatamente no centro do conjunto de dados.

- Se o total de observações for PAR, a mediana é a média


aritmética entre os valores centrais do conjunto de dados.
n n
Posições centrais: P = e P = +1 .
2 2
92

46
20/05/2017

Mediana

Usando as estatísticas de ordem

x(1) ≤ x( 2 ) ≤ K ≤ x( n −1) ≤ x( n ) ,

a mediana da variável X pode ser definida como:

 x n +1  , se n é ímpar;
  2 

md ( X ) =  x n  + x n 
  2   2 +1  , se n é par.
 2
93

Exemplo: Calcule a mediana dos conjuntos a seguir.

Conjunto 1 = {10, 29, 26, 28, 15}


Conjunto 2 = {500, 600, 800, 50.000, 1.000, 500}
Conjunto 3 = {29,63; 9,25; 10,00; 32,25; 34,00; 16,50; 25,02; 29,63;
43,25; 38,00; 18,00; 79,38; 8,75; 53,38; 8,00; 11,38;
37,88; 16,63; 28,50; 38,88; 8,63; 1,25; 24,25; 11,50;
7,63; 48,38; 21,63; 52,00; 30,38; 18,00; 18,50; 14,00;
35,25; 9,38; 33,63; 9,00; 19,38; 9,25; 31,13; 33,50}
Rol dos dados –
Conjunto 3

94

47
20/05/2017

Mediana

Para dados agrupados:

Exemplo: Deseja-se estudar o número de erros de impressão em


um livro. Para isso escolhe-se uma amostra de 50 páginas deste
livro encontrando-se o seguinte número de erros por página:

Erros Número de páginas


(xi) (ni)
0 25
1 10
2 5
3 6
4 4
Total 50
95

Encontre o número mediano de erros.

Exemplo: Foram monitoradas eletronicamente 25 residências,


para determinar o número de horas em que a televisão da
família permanecia ligada em um período de 24 horas. O
resultado encontra-se a seguir na forma de distribuição de
frequência.
Número de horas Frequência
0 |─ 5 6
5 |─ 10 5
10 |─ 15 8
15 |─ 20 4
20 |─ 25 2
Total 25

Qual a hora mediana que uma família passa com a televisão


ligada?
96

48
20/05/2017

hi Md − li
Propriedade da proporcionalidade entre retângulos =
ni P − N ant

n 
 − N ant 
Md = li + hi
(0,5 − Fant )
Md = li + hi  
2 OU 97

ni
fi

Relação entre média, mediana e moda

A comparação entre os valores observados para a média,


mediana e moda serve como uma primeira verificação da
assimetria.

a) X = X~ = Mo, distribuição é simétrica

98

49
20/05/2017

~
b) X ≥ X ≥ Mo, distribuição é assimétrica positiva ou à direita

~
c) X ≤ X ≤ Mo, distribuição é assimétrica negativa ou à
esquerda

99

Exemplo de uma distribuição Assimétrica Positiva ou à Direita


Profa. Andrea A. Prudente

100

50
20/05/2017

Exemplo de uma distribuição Assimétrica Negativa ou à Esquerda

Profa. Andrea A. Prudente


101

Separatrizes

Permitem calcular valores da variável que dividem a


distribuição em partes iguais. Existem quatro tipos de
Profa. Andrea A. Prudente

separatrizes, também chamada de quantis.


- Mediana
- Quartis
- Decis
- Centis ou Percentis

102

51
20/05/2017

Enquanto a mediana separa a distribuição em duas partes


iguais, a característica principal das outras separatrizes é:
- Quartis (Qi): dividem a distribuição em quatro partes iguais;
- Decis (Di): dividem em dez partes iguais;
- Centis ou Percentis (Ci): dividem em cem partes iguais.

Relação entre as separatrizes:

103

Cálculo do percentil de ordem i :

1. Ordenar os dados de forma crescente;


2. Calcular a posição (P) do percentil i
Profa. Andrea A. Prudente

i
P= × n,
100
3. P é um número inteiro?

SIM - O percentil i será calculado como a média aritmética dos


elementos que ocupam a posição P e a posição P+1.
NÃO - O percentil i é o elemento que ocupa a posição P, sendo
que P será arredondado para o maior inteiro mais próximo.
104

52
20/05/2017

Exemplo: Os dados a seguir representam o preço de


fechamento de 40 ações ordinárias. Calcule todos os quartis e os
percentis 50 e 82. Interprete os resultados.

Rol dos dados

Profa. Andrea A. Prudente


105

Exemplo: Com as informações abaixo referentes às separatrizes, responda:

Número de
Faturamento Faturamento Idade da
Medidas estatísticas empregados
Ano 1 Ano 2 empresa
Ano 2

No de observações 124 124 124 124

5 77,00 88,25 5,25 3,00

10 118,00 137,00 8,50 4,00


Profa. Andrea A. Prudente

Q1 25 207,75 233,00 12,00 5,00

Percentis Md=Q2 50 364,50 378,00 15,00 8,00

Q3 75 497,75 501,50 19,75 16,00

90 741,50 676,00 23,00 20,00

95 836,75 746,00 26,00 22,50

a. Qual o valor a partir do qual identificamos 25% das empresas que no ano 2
tiveram mais empregados?
b. Com relação às empresas com menor faturamento, qual os valores nos dois
anos considerados que permitem a identificação das empresas com os 10%
menores faturamentos? Interprete os resultados.
c. Qual a amplitude para os 50% dos faturamentos das empresas localizados no
centro da distribuição nos dois anos? Interprete os resultados. 106
d. Até cinco anos do tempo de existência, qual a proporção de empresas
existentes?

53
20/05/2017

Diagramas em Caixas
Box Plot

• É um método alternativo ao histograma para representar os


dados.

Profa. Andrea A. Prudente


• São convenientes para revelar tendências centrais, dispersão,
distribuição dos dados e a presença de outliers (valores
discrepantes).
• Utiliza: valor mínimo, ~
x , Q1, Q3 e o valor máximo do conjunto
de dados.
• Útil para comparar dois ou mais conjuntos de dados.
• O box plot pode ser desenhado na posição vertical (mais
comum) ou horizontal.
107

Profa. Andrea A. Prudente

108

54
20/05/2017

Exemplo: A taxa de juros para 40 observações mensais relativa


a uma aplicação em um fundo de investimentos (em
percentagem ao mês) foi

1,09 1,92 2,31 1,79 2,28 1,74 1,47 1,97


0,85 1,24 1,58 2,03 1,70 2,17 2,60 2,11
1,86 1,90 1,68 1,51 1,64 0,72 1,69 1,85
1,82 1,79 2,46 1,88 2,08 1,67 1,37 1,93
1,40 1,64 2,09 1,75 1,63 2,37 1,75 1,69

Construa o box plot para a variável taxa de juros.

109

ROL

0,72 1,40 1,64 1,69 1,79 1,88 2,03 2,28


0,85 1,47 1,64 1,70 1,79 1,90 2,08 2,31
1,09 1,51 1,67 1,74 1,82 1,92 2,09 2,37
1,24 1,58 1,68 1,75 1,85 1,93 2,11 2,46
1,37 1,63 1,69 1,75 1,86 1,97 2,17 2,60

Q1 = 1,635 Q2 = 1,77 Q3 = 2,00 d = 0,365

LI = 1,635 - (1,5*0,365) ≈ 1,09 LS = 2,00 + (1,5*0,365) ≈ 2,55


110

55
20/05/2017

Box plot para os dados sobre as taxas de juros de


certo fundo de investimentos
% a.m.

111

Interpretação do gráfico box plot


• A mediana é o traço no centro do retângulo.
• A dispersão é representada pela altura do retângulo (Q3 - Q1),
amplitude interquartil.
Profa. Andrea A. Prudente

• Assimetria: a proximidade da linha da mediana em relação a


Q1 e Q3 informa sobre a assimetria.
- Se a mediana está no centro do retângulo → Simetria
- Se a mediana é próxima de Q1 → Assimetria positiva
- Se a mediana é próxima de Q3 → Assimetria negativa
• Os pontos que estão fora do intervalo [LI; LS] são
considerados valores atípicos ou discrepantes (outliers), ou seja,
valores muito grandes ou muito pequenos em relação aos
demais. Geralmente são representados pelos símbolos ° ou *. 112

56
20/05/2017

O que fazer se são detectados


outliers em um conjunto de dados?

Profa. Andrea A. Prudente


Abandonar a observação quando houver uma justificativa
convincente: observação incorreta ou erro na execução do
experimento. A análise deve ser refeita sem o outlier.

Conservar quando nenhuma explicação pode ser dada à


observação atípica. Neste caso é preciso um tratamento
especial na análise desses dados.

113

Box Plot e Assimetria


Profa. Andrea A. Prudente

114

57
20/05/2017

Medidas de dispersão
ou variabilidade

Profa. Andrea A. Prudente


Absolutas

Amplitude total

Amplitude interquartílica

Variância

Desvio padrão

Expressas na mesma unidade de medida 115


da variável em estudo.

Medidas de dispersão
ou variabilidade
Profa. Andrea A. Prudente

Relativas

Coeficiente de variação de Pearson

Independem da unidade de medida da variável


observada. Servem para estudar
comparativamente a variabilidade de duas ou
mais distribuições.
116

58
20/05/2017

Motivação

Produção diária da peça Z de três empregados de uma


indústria no período de 15 à 19 de março de 2016
Dia Média

Profa. Andrea A. Prudente


Empregado
1º 2º 3º 4º 5º Diária
Carlos 82 70 65 60 73 70
Daniel 60 78 68 62 82 70
Eduardo 53 72 75 75 75 70

Supondo-se que interessa ao administrador da empresa que os


empregados apresentem produção elevada e a mais
homogênea possível. Qual dos três empregados apresentou
melhor desempenho no trabalho no período observado?
117

Amplitude total

A amplitude de um conjunto de dados é a diferença entre os


valores extremos do conjunto.
Profa. Andrea A. Prudente

AT = xmax − xmin

Exemplo: Calcule a amplitude total da produção da peça Z


para cada empregado da indústria e identifique qual
empregado apresentou a menor dispersão e qual apresentou a
maior dispersão na produção diária.

Seriam idênticas as produções diárias observadas de Daniel e


Eduardo? 118

59
20/05/2017

Observações

• É a medida mais simples de dispersão.


• Possui desvantagem, pois leva em conta apenas os valores

Profa. Andrea A. Prudente


extremos do conjunto, não indicando qualquer variação no
interior do conjunto de dados.
• Também sofre influência de um valor “atípico” na
distribuição.

119

Variância

É uma medida de variabilidade que utiliza todos os dados,


baseada na diferença entre o valor de cada observação (xi) e a
média ( x para amostra e µ para população).
Profa. Andrea A. Prudente


N
( xi − µ ) 2 ∑
n
i =1
( xi − x ) 2
σ 2
= s 2
= i =1
N n −1

Variância Populacional Variância Amostral

A variância apresenta a unidade de medida elevada ao


quadrado.
Exemplo: Calcule o variância da produção da peça Z para cada 120

empregado da indústria.

60
20/05/2017

Desvio padrão

É a medida de dispersão mais usada e mais importante. Assim


como a variância, mede a concentração dos dados em torno da
média. Porém, tem a unidade de medida igual a unidade de

Profa. Andrea A. Prudente


medida original da variável.

∑ ∑
N n
( xi − µ ) 2 ( xi − x ) 2
i =1 i =1
σ= σ = 2
s= s =
2
N n −1
Desvio padrão Populacional Desvio padrão Amostral

Exemplo: Calcule o desvio padrão da produção da peça Z para


cada empregado da indústria.
121

Interpretação do desvio padrão (análoga à da variância)

O desvio padrão mede a variação entre valores. Assim:


• Se os valores estiverem próximos uns dos outros, então o
desvio padrão será pequeno, e consequentemente os dados
Profa. Andrea A. Prudente

serão mais homogêneos.

• Se os valores estiverem distantes uns dos outros, então o


desvio padrão será grande, e consequentemente os dados
serão heterogêneos.

122

61
20/05/2017

Algumas propriedades do desvio padrão e da variância

Somando-se (ou subtraindo-se) um valor constante e


arbitrário a cada um dos elementos de um conjunto de

Profa. Andrea A. Prudente


números, o desvio padrão e a variância não se alteram.
Multiplicando-se (ou dividindo-se) cada elemento de um
conjunto de números por um valor constante e arbitrário, o
desvio padrão fica multiplicado (ou dividido) por essa
constante e a variância fica multiplicado (ou dividido) pelo
quadrado dessa constante.

123

Motivação

Considerando agora apenas dois empregados com produção


média diária diferente.

Produção diária da peça Z de dois empregados de uma


indústria no período de 15 à 19 de março de 2016
Dia Média
Empregado
1º 2º 3º 4º 5º Diária
Antônio 75 71 69 70 70 71
Benedito 75 80 75 70 80 76

Quem apresentou melhor desempenho no trabalho no período


observado, Antônio ou Benedito? 124

62
20/05/2017

Coeficiente de Variação de Pearson (CV)

É uma medida relativa de dispersão, útil para compararmos a


variabilidade de dois ou mais conjuntos
- com médias aritméticas diferentes;
- quando estes referem-se a diferentes fenômenos e são
expressos em unidades de medida distintas.

Para um conjunto de n observações, o CV é definido como


σ S .
CV = ou CV =
µ X
O CV é um número adimensional e, portanto, seu valor
independe da unidade de medida da variável analisada.
125

Como o CV é uma medida que exprime a variabilidade


relativa à média, é usualmente expresso em porcentagem.

Algumas regras empíricas para a interpretação do CV:


• Se CV < 15% há baixa dispersão -> boa representatividade da
média aritmética como medida de posição;
• Se 15% ≤ CV < 30% há média dispersão -> a representatividade
da média aritmética como medida de posição é apenas
regular;
• Se CV ≥ 30% há elevada dispersão -> a representatividade da
média aritmética como medida de posição é ruim.
126

63
20/05/2017

Exemplo: O gerente de operações de um serviço de entregas de


encomendas está decidindo se deve comprar uma nova frota
de caminhões. Quando as embalagens são carregadas nos
caminhões, no preparo para as entregas, o gerente precisa
considerar dois importantes parâmetros – o peso (em
quilogramas) e o volume (em metros cúbicos) de cada um dos
itens.
O gerente de operações extrai uma amostra de 200
embalagens e descobre que a média do peso corresponde a
26,0 quilos, com um desvio padrão de 3,9 quilos, e a média do
volume é de 8,8m3 , com um desvio padrão de 2,2m3. De que
modo o gerente pode comparar a variação do peso e do
volume? 127

Medidas estatísticas de
sumarização ou resumo
Valores que resumem um conjunto de dados podem ser
Profa. Andrea A. Prudente

classificados em:

Medidas de Posição; Já estudado.

Medidas de Dispersão; Já estudado.

Medidas de Assimetria;

Medidas de Curtose.

128

64
20/05/2017

Momentos
As principais medidas de posição e de dispersão estudadas
anteriormente nada mais são do que momentos.
Na construção de medidas de assimetria e de medidas de
curtose também são utilizados momentos.
O termo momento teve origem na mecânica com o estudo
dos momentos de força. Os momentos são de três tipos:
o momentos naturais;
o momentos em relação a uma origem qualquer;
o momentos centrados na média. 129

Momento natural ou absoluto

Notação:

m’r = momento natural de ordem r (ou momento absoluto de


ordem r, ou momento de ordem r em relação à origem zero),
onde r é um número inteiro positivo.

Definição:

Sejam x1 , x2 ,..., xn , n valores que a variável X assume. O


momento natural de ordem r é definido como
n

∑x r
i
m 'r = i =1 .
n 130

65
20/05/2017

Se o conjunto de dados estiver organizado na forma de


distribuição de frequências, de modo que x1 , x2 ,..., xn sejam k
valores que a variável X assume e n1 , n2 ,..., nk as respectivas
frequências absolutas, então o momento natural de ordem r
assume a seguinte expressão:
k

∑ x .n r
i i k
m'r = i =1
k
e ∑n i =n.
∑n
i =1
i
i =1

131

Momento centrado na média

Notação:

mr = momento de ordem r centrado na média aritmética.


Definição:

Sejam x1 , x2 ,..., xn , n valores que a variável X assume, e x a


média aritmética desse conjunto. O momento de ordem r em
relação à média aritmética é definido como
n

∑ (x − x)
i
r

mr = i =1 .
n
132

66
20/05/2017

Se o conjunto de dados estiver organizado na forma de


distribuição de frequências, de modo que x1 , x2 ,..., xn sejam k
valores que a variável X assume e n1 , n2 ,..., nk as respectivas
frequências absolutas, então o momento de ordem r em
relação à média aritmética assume a seguinte expressão:

∑ ( x − x ) .n
i
r
i k
mr = i =1
k e ∑n i =n.
∑n
i =1
i
i =1

133

Medidas de
assimetria

As medidas de assimetria são utilizadas para avaliar o grau de


assimetria da distribuição de frequências, sendo que assimetria
pode ser definida como o grau de deformação de uma curva
de frequências.

134

67
20/05/2017

Profa. Andrea A. Prudente


135

Método de comparação entre as medidas de tendência central


(já estudado)

~
a) Se X ≤ X ≤ Mo, distribuição assimétrica negativa ou à esquerda;
~
b) Se X = X = Mo, distribuição é simétrica;
~
c) Se X ≥ X ≥ Mo, distribuição é assimétrica positiva ou à direita.

Quanto mais afastados estiverem os três valores a assimetria será


maior.

136

68
20/05/2017

Observação:

Apenas pela comparação entre as três principais medidas de


tendência central, não existe uma medida-resumo para medir o

Profa. Andrea A. Prudente


grau de deformação da distribuição em relação à forma
simétrica.

137

Coeficientes momento de assimetria

O terceiro momento centrado na média é indicado para o


cálculo da assimetria da distribuição, já que os momentos de
Profa. Andrea A. Prudente

ordem ímpar superior a quatro, em geral, não são utilizados.

Existem duas maneiras de medir a assimetria utilizando o


conceito de momentos.

138

69
20/05/2017

139

140

70
20/05/2017

Interpretação dos resultados de eM :

eM < 0 -> assimetria negativa ou à esquerda;


eM = 0 -> simétrica;
eM > 0 -> assimetria positiva ou à direita.

141

Medidas de
curtose

As medidas de curtose indicam até que ponto a distribuição de


frequências de uma distribuição se apresenta mais achatada ou
mais afilada em relação à distribuição teórica de probabilidade
tomada como referência, a distribuição Normal Padrão.

142

71
20/05/2017

Pode-se classificar a curtose de uma distribuição em três tipos:

Curva ou Distribuição Mesocúrtica

143

Curva ou Distribuição Platicúrtica

144

72
20/05/2017

Curva ou Distribuição Leptocúrtica

145

146

73
20/05/2017

147

148

74
20/05/2017

75
Profa. Andrea A. Prudente
149

Potrebbero piacerti anche