Sei sulla pagina 1di 21

Medidas de posição - dados não agrupados

As medidas mais conhecidas da estatística são: Média, Moda e


Mediana, e são medidas denominadas de posição central.

• A média (𝑥ҧ ou µ) é do que a soma de todos os elementos


dividido pelo nº total de elementos da amostra. Isto é:

A média aritmética é um valor que pode substituir todos os


valores da variável, isto é, é o valor que a variável teria se em
vez de “variável” ela fosse “constante”.
• A mediana (Md) é o ponto da série ORDENADA que os
divide exatamente ao meio, isto é, temos a certeza que
abaixo desse valor estão 50% dos dados e acima os outros
50%.

Md
Xmin Xmax

50% 50%

• Moda (Mo) é o valor que ocorre com maior frequência em um conjunto de dados.

• Em um conjunto de dados podemos ter duas modas ou nenhuma; a distribuição que


possui duas modas chamamos de distribuição bimodal.
Comparação entre média aritmética,
mediana e moda.
• Qual a medida de tendência central que representa melhor o
conjunto de dados em estudo?

• A mediada ideal em cada caso é aquela que melhor representa a maioria


dos dados.

• Na maioria das vezes, teremos valores diferenciados para a série e


consequentemente a medida irá representar bem, os dados que estão
próximos a este valor.
• A moda é uma medida que requer apenas o conhecimento da frequência
absoluta e pode ser utilizada para qualquer tipo de variáveis, tanto
qualitativas, quanto quantitativas.

• A mediana é uma medida que exige uma ordenação de categorias, da


mais baixa a mais alta, assim ela só pode ser obtida para variáveis
qualitativas ordinais ou para as quantitativas, jamais para variáveis
qualitativas nominais.

• A média aritmética trabalha com todos os elementos do conjunto de


dados, enquanto a mediana utiliza apenas um ou dois valores. No
entanto a média sofre influência de valores extremos (muito alto ou
baixo). Ela é uma medida que pode ser calculada apenas para variáveis
quantitativas. E embora a média seja um valor mais fácil de entender,
tem o defeito de nos induzir em erro se a nossa amostra tiver valores
muito extremos.

• A mediana não é influenciada por valores extremos.


Assim, no caso das variáveis quantitativas, quando
o valor da Mediana é muito diferente da Média, é
aconselhável considerar sempre a Mediana como
valor de referência mais importante.
Aspecto das distribuições

Uma distribuição de frequência será do tipo:

• Simétrica X  Md  Mo

• Uniforme – os dados não variam

• Assimétrica à esquerda
Mo  Md  X
• Assimétrica à direita
X  Md  Mo
• Simétrica – quando pudermos traçar uma linha
vertical pelo ponto médio do gráfico e as suas
metades resultantes forem aproximadamente
iguais.
• Distribuição uniforme: quando todas as frequências
são iguais.
• Distribuição assimétrica à esquerda: se a sua cauda
se prolongar para a esquerda.
• Distribuição assimétrica à direita: se a sua cauda se
prolongar para a direita.
Medidas de Dispersão ou Medidas de Variabilidade
Medidas de dispersão ou de variabilidade são “estatísticas” que medem as
oscilações ou as variações de uma variável, elas nos fornece informação sobre a
dispersão dos dados e mede o quanto em média seus dados estão distantes da
média.
• Exemplo: Viagem de carro (http://manipulandodados.com.br/o-que-e-desvio-
padrao-entenda-com-um-exemplo)

Imagine que você mora na cidade do Rio de Janeiro e viaje bastante para São
Paulo a trabalho e para Cabo Frio, onde você tem uma casa de descanso, e que
você quer avaliar para quão longe do Rio você está viajando e se compensa se
mudar para um lugar mais próximo de onde vai com frequência. Veremos em
breve como isso tem relação com o desvio padrão.
Considere que São Paulo fica a aproximadamente 500km a esquerda do Rio de
Janeiro e que Cabo Frio fica a 150km a direita da cidade maravilhosa.
Matematicamente, consideramos que viagens para a esquerda são negativas.
Então, se eu vou para São Paulo partindo do Rio, eu viajo -500km. Veja na figura
abaixo uma ilustração.
Suponha que em uma semana você tenha ido e voltado de São Paulo
duas vezes e ido e voltado de Cabo Frio uma vez, sempre tomando como
referência o ponto zero, o Rio de Janeiro. A viagem de ida para São Paulo
dá 500km para a esquerda (-500) e 500km de volta para a direita (+500).
Para ir para Cabo Frio eu percorro 150km a direita (+150) e para voltar
mais 150km para a esquerda (-150km). Então, temos os seguintes dados

Viagem Distância
São Paulo (ida) -500
São Paulo (volta) +500
Cabo Frio (ida) +150
Cabo Frio (volta) -150
São Paulo (ida) -500
São Paulo (volta) +500
Agora vamos avaliar o quão longe você está indo viajar em média da sua casa,
no Rio de Janeiro. Essa noção de “quão longe está viajando em média” é o
quanto você se afasta do Rio em média quando você viaja. Como calcular isso?
• Calculando a distância média percorrida
Se pegarmos apenas uma média dessas distâncias, teríamos zero porque as
viagens de ida e volta se cancelam. Então precisamos arrumar um jeito para
que essas distâncias não se cancelem quando calculo a média. Para isso,
primeiro devemos elevar todas as distâncias ao quadrado e tudo fica positivo.
Assim, vamos obter uma nova tabela com todos os valores ao quadrado.

Distância ao
Viagem Distância
quadrado
São Paulo (ida) -500 250000
São Paulo (volta) +500 250000
Cabo Frio (ida) +150 22500
Cabo Frio (volta) -150 22500
São Paulo (ida) -500 250000
São Paulo (volta) +500 250000
Média 0 174166.7
Note que tomando a média diretamente das distâncias ao quadrado a
escala será em km². Porém, estamos interessados quantos km estamos
nos afastando em média de nossa casa, não quantos km². Por isso que
não apenas somamos todas as distâncias ao quadrado e dividimos pelo
número de viagens.

O fluxo de etapas para calcular essa estatística a qual estamos


interessados é:
1) Elevar todas as distâncias ao quadrado.
2) Somar todas as medidas obtidas acima.
3) Dividir pelo número de viagens (n).
4) Tirar a raiz quadrada do valor obtido acima.

Assim, obtemos a medida de desvio padrão na escala de nosso


interesse, em km, não em km². Com isso, podemos observar o quanto
em média eu estou me afastando de casa ao longo de uma semana e
decidir se preciso me mudar ou não, por exemplo. Neste caso, o valor
obtido foi de 457,16. Então, ao longo de uma semana eu viajo 457.16
quilômetros para longe da minha casa em média.
• O que acabamos de fazer foi calcular um desvio padrão.
Neste caso, calculamos em média o quanto nos afastamos
do Rio de Janeiro ao longo de uma semana. Se
interpretarmos o Rio de Janeiro como nossa média, temos
uma estatística que mede o quanto nossos dados se afastam
da média. Isso é exatamente o que nos diz um desvio
padrão: o quanto meus dados estão distantes da minha
média.
• Para calcularmos esta dispersão em relação à média, utilizaremos algumas
medidas:

• Variância: (para população)

(para amostra)
• Desvio Padrão: (para população)

(para amostra)

• Desvio Médio
Coeficiente de Variação

• O coeficiente de variação mede a homogeneidade dos dados


num conjunto, em relação a média, sua fórmula é expressa por:

• O valor obtido será dado em porcentagem, e acima de 30% o


conjunto de dados é considerado heterogêneo e abaixo de 30%
o conjunto é considerado BOM.
Analisando o desvio padrão
Para dados com distribuição simétrica (forma de sino), o desvio padrão tem
as seguintes características:

• Considere um intervalo com amplitude de dois desvios padrão e cujo ponto


médio é a média. Dentro dele estão 68% dos dados.

• Considere um intervalo com amplitude de quatro desvios padrão e cujo


ponto médio é a média. Dentro dele estão 95% dos dados.

• Considere um intervalo com amplitude de seis desvios padrão e cujo ponto


médio é a média. Dentro dele estão 99,7% dos dados.
Quando a distribuição dos dados é considerada "normal", então a
melhor medida de localização do centro, é a média. Sendo a
Distribuição Normal uma das distribuições mais importantes e que
surge com mais frequência em aplicações, esse fato justifica a grande
utilização da média.

Potrebbero piacerti anche