Sei sulla pagina 1di 4

Estatística Descritiva

As técnicas usadas costumam classificar-se como:

1.Gráficos descritivos: São usados vários tipos de gráficos para sumarizar os dados. Por
exemplo: Histogramas.

2.Descrição Tabular: Na qual se usam tabelas para sumarizar os dados. Por exemplo
tabelas de Frequências.

3.Descrição Paramétrica: Na qual estimamos os valores de certos parâmetros, os quais


assumimos que completam a descrição do conjunto dos dados. Por exemplo: Média.

- Mediana

Em teoria da probabilidade e em estatística, a mediana é uma medida de tendência central,


um número que caracteriza as observações de uma determinada variável de tal forma que
este número (a mediana) de um grupo de dados ordenados separa a metade inferior da
amostra, população ou distribuição de probabilidade, da metade superior. Mais
concretamente, 1/2 da população terá valores inferiores ou iguais à mediana e 1/2 da
população terá valores superiores ou iguais à mediana.

A mediana pode ser calculada para um conjunto de observações ou para funções de


distribuição de probabilidade.

Cálculo da mediana para dados ordenados

No caso de dados ordenados de amostras de tamanho n, se n for ímpar, a mediana será o

elemento central . Se n for par, a mediana será o resultado da média simples

entre os elementos e .

Exemplos

Para a seguinte população:

1, 3, 5, 7, 9

A mediana é 5 (igual à média)

No entanto, para a população:


1, 2, 4, 10, 13

A mediana é 4 (enquanto a média é 6)

Para populações pares:

1, 2, 4, 7, 9, 10

A mediana é (4+7)/2, que é 5.5.

Cálculo da mediana para dados classificados

Quando se trata de um conjunto de dados classificados, o cálculo da mediana é feito através


do histograma, ou através da função cumulativa de frequências relativas. A mediana é o
ponto do eixo das abcissas correspondente a 50% da frequência relativa acumulada.

No caso de variáveis contínuas, a mediana é calculada pela solução da equação

ou, equivalentemente, .

No caso de variáveis discretas, e quando as frequências estão calculadas por unidade, a


mediana é o ponto do eixo das abcissas para o qual a frequência relativa acumulada é
inferior ou igual a 50% e superior ou igual a 50% para o ponto imediatamente a seguir.

- Moda

Em estatística descritiva, a moda é o valor que detém o maior número de observações, ou


seja, o valor ou valores mais frequentes. A moda não é necessariamente única, ao contrário
da média ou da mediana. É especialmente útil quando os valores ou observações não são
numéricos, uma vez que a média e a mediana podem não ser bem definidas.

A moda de {maçã, banana, laranja, laranja, laranja, pêssego} é laranja.

A série {1, 3, 5, 5, 6, 6} apresenta duas modas (bimodal): 5 e 6.

A série {1, 3, 2, 5, 8, 7, 9} não apresenta moda. Bimodal: possui dois valores modais
Amodal: não possui moda.
- Assimetria

Em Estatística, a obliquidade ou assimetria (em Inglês "skewness", em Alemão


"Schiefe"), é uma medida da assimetria de uma determinada distribuição de frequência. É
definida por:

Onde m3(µ) é o terceiro Momento central e σ é o desvio-padrão.

Significado

A obliquidade mede a assimetria das caudas da distribuição. Distribuições assimétricas que


tem uma cauda mais "pesada" que a outra apresentam obliquidade. Distribuições simétricas
tem obliquidade zero. Assim:

• Se v>0, então a distribuição tem uma cauda direita (valores acima da média) mais
pesada
• Se v<0, então a distribuição tem uma cauda esquerda (valores abaixo da média)
mais pesada
• Se v=0, então a distribuição é aproximadamente simétrica (na terceira potência do
desvio em relação à média).

- Curtose

Em Estatística descritiva, a curtose é uma medida de dispersão que caracteriza o


"achatamento" da curva da função de distribuição. É normalmente definida como:

Onde m4(μ) é o quarto Momento central e σ é o Desvio-padrão.

Alguns textos definem a curtose como ; neste caso a curtose da normal é 3.

A curtose não tem limite superior (ou seja, existem distribuições com curtose tão alta
quanto se queira), porém seu limite inferior é -2, na Bernoulli com p = 1/2.
Significado

• Se o valor da curtose for = 0 (ou 3, pela segunda definição), então tem o mesmo
achatamento que a distribuição normal. Chama-se a estas funções de mesocúrticas
• Se o valor é > 0 (ou > 3), então a distribuição em questão é mais alta (afunilada) e
concentrada que a distribuição normal. Diz-se desta função probabilidade que é
leptocúrtica, ou que a distribuição tem caudas pesadas (o significado é que é
relativamente fácil obter valores que se afastam da média a vários múltiplos do
desvio padrão)
• Se o valor é < 0 (ou < 3), então a função de distribuição é mais "achatada" que a
distribuição normal. Chama-se-lhe platicúrtica

Sites relacionados....

www.each.usp.br/rvicente/Paternelli_Cap2.pdf

Potrebbero piacerti anche