Sei sulla pagina 1di 22

INSTITUTO FEDERAL DE EDUCAO, CINCIA E TECNOLOGIA DO RIO GRANDE DO SUL

CMPUS FARROUPILHA

Fevereiro de 2014
Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha

ESTATSTICA DESCRITIVA
Sumrio
1 Introduo.................................................................................................................................................. 3
1.1 Definies Bsicas de Estatstica ....................................................................................................... 3
2 Fases do Mtodo Estatstico ...................................................................................................................... 4
3 Grficos Estatsticos .................................................................................................................................. 4
3.1 Classificao dos grficos .................................................................................................................. 5
3.1.1 Diagramas ................................................................................................................................... 5
3.1.2 Estereogramas ............................................................................................................................. 5
3.1.3 Pictogramas ................................................................................................................................ 5
3.1.4 Cartogramas ................................................................................................................................ 5
4 Distribuio de Frequncias ...................................................................................................................... 5
4.1 Frequncias absolutas (fi):.................................................................................................................. 5
4.2 Frequncias relativas (fri):.................................................................................................................. 6
4.3 Frequncia acumulada (F):................................................................................................................. 6
4.4 Frequncia relativa acumulada (Fr): .................................................................................................. 6
4.5 Regras para a elaborao de uma ....................................................................................................... 6
4.6 Representao grfica de uma distribuio de frequncias ................................................................ 6
4.6.1 Histograma.................................................................................................................................. 6
4.6.2 Polgono de frequncia: .............................................................................................................. 6
4.6.3 Polgono de frequncia acumulada ............................................................................................. 6
4.6.4 Frequncia absoluta acumulada de uma classe: .......................................................................... 7
4.6.5 Frequncia relativa acumulada de uma classe: ........................................................................... 7
4.6.6 Curva de frequncia (curva suavizada):...................................................................................... 7
4.7 Diagrama de Disperso ...................................................................................................................... 7
4.7.1 Etapas na construo do Diagrama de Disperso ....................................................................... 7
4.7.2 Interpretao do Diagrama de Disperso .................................................................................... 7
5 Medidas de Posio ................................................................................................................................... 8
5.1 Mdia Aritmtica ............................................................................................................................... 8
5.1.1 Mdia para dados no-agrupados ............................................................................................... 8
5.1.2 Mdia para dados agrupados (sem intervalos de classe) ............................................................ 9
5.1.3 Mdia para dados agrupados (com intervalos de classe) ............................................................ 9
5.2 Mdia Geomtrica ............................................................................................................................ 10
5.2.1 Mdia Geomtrica Simples....................................................................................................... 10
5.2.2 Mdia Geomtrica Ponderada................................................................................................... 10
5.3 Mdia Harmnica............................................................................................................................. 11
5.3.1 Mdia Harmnica Simples (para dados no agrupados)........................................................... 11
5.3.2 Mdia Harmnica Ponderada (para dados agrupados) ............................................................. 11
5.4 Mediana............................................................................................................................................ 12
5.4.1 A Mediana para dados no-agrupados ...................................................................................... 12
5.4.2 A Mediana para dados agrupados ............................................................................................ 12
5.5 Moda ................................................................................................................................................ 13
5.5.1 A Moda quando os dados no esto agrupados ........................................................................ 13
5.5.2 A Moda quando os dados esto agrupados ............................................................................... 13
5.6 Quartis .............................................................................................................................................. 14
5.6.1 Quartis para dados no agrupados ............................................................................................ 14
5.6.2 Quartis para dados agrupados em classes ................................................................................. 15
5.7 Decis ................................................................................................................................................ 15
6 Medidas de Disperso ............................................................................................................................. 16
6.1 Amplitude total ................................................................................................................................ 16
6.2 Desvio mdio absoluto ..................................................................................................................... 17
6.3 Desvio-padro .................................................................................................................................. 17
6.4 Varincia .......................................................................................................................................... 18
6.5 Coeficiente de Variao ................................................................................................................... 18
6.6 Amplitude inter-quartlica ................................................................................................................ 19
Exerccios ................................................................................................................................................... 20
BIBLIOGRAFIA ........................................................................................................................................ 22
Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

1 Introduo
O raciocnio estatstico amplamente utilizado em todas as reas do conhecimento, tais
como, na indstria, na administrao de empresas, na informtica, na medicina, na biologia, na
meteorologia, na metrologia, etc. O conhecimento estatstico necessrio para tomarmos
decises corretas e evitar concluses errneas por falsas evidncias.
Estatstica a disciplina que engloba um conjunto de mtodos cientficos para a coleta,
organizao, resumo, anlise e apresentao de dados atravs do emprego de tabelas, grficos e
medidas, bem como a obteno de concluses vlidas que dem suporte tomada de decises
baseadas em tais anlises. A Estatstica esta dividida em:
Estatstica Descritiva: se ocupa com a organizao e a apresentao de dados; inclui as
tcnicas que dizem respeito sintetizao e descrio de dados atravs de grficos, tabelas e
medidas resumo.
Estatstica Inferencial: com base na Teoria da Amostragem, Teoria das Probabilidades e
Estatstica Descritiva permite fazer inferncias (afirmaes) sobre caractersticas de uma
populao, a partir de resultados de uma ou mais amostras. Essas inferncias constituem-se na
base para a tomada de deciso.
1.1 Definies Bsicas de Estatstica
Fenmeno Estatstico: qualquer evento que se pretenda analisar, cujo estudo seja
possvel a partir da aplicao dos mtodos estatsticos.
Dado Estatstico: um dado numrico e considerado a matria-prima sobre a qual
iremos aplicar os mtodos estatsticos.
Populao: o conjunto total de elementos portadores de, pelo menos, uma
caracterstica comum.
Amostra: uma parcela representativa da populao que examinada com o propsito
de tirarmos concluses sobre essa populao.
Parmetros: so valores singulares que existem na populao e que servem para
caracteriz-la. Para definirmos um parmetro devemos examinar toda a populao.
Estimativa: um valor aproximado do parmetro e calculado com o uso de uma
amostra extrada da populao.
Atributo: uma qualidade associada a um elemento. Quando os dados estatsticos
apresentam um carter qualitativo, o levantamento e os estudos necessrios ao tratamento desses
dados so designados genericamente de estatstica de atributo.
Varivel: qualquer quantidade ou caracterstica que pode assumir diferentes valores
numricos ou no-numricos. o conjunto de resultados que pode ser associado a cada
elemento da populao ou amostra. As variveis podem ser classificadas como qualitativas e
quantitativas.
Varivel Qualitativa: quando os valores da varivel so expressos por caractersticas ou
atributos. A varivel qualitativa pode ser classificada como: varivel qualitativa nominalclassificada por um tipo ou atributo que no permite ordenao; varivel qualitativa ordinalclassificada por uma caracterstica ou atributo que permite ordenao.
Varivel Quantitativa: quando os dados so de carter nitidamente quantitativo e o
conjunto dos resultados possui uma estrutura numrica trata-se, portanto, de uma varivel
quantitativa. As variveis quantitativas se dividem em: varivel quantitativa discreta - so
aquelas que assumem valores dentro de um espao finito ou enumervel, seus valores so
expressos geralmente atravs de nmeros inteiros no negativos; varivel quantitativa contnua
- resulta normalmente de uma mensurao, e a escala numrica de seus possveis valores
corresponde ao conjunto R dos nmeros Reais, ou seja, podem assumir, teoricamente, qualquer
valor entre dois limites, so exemplos, o peso ou a altura de uma pessoa.
Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

2 Fases do Mtodo Estatstico


Os mtodos estatsticos devem ser usados de maneira eficiente a fim de produzir um
retorno apropriado para o custo de seu uso. Para atingir esse objetivo no suficiente substituir
nmeros em frmulas. Todo processo deve incluir um planejamento cuidadoso da coleta e
anlise dos dados para se obter as concluses estatsticas confiveis proporcionando uma boa
transio para a soluo do problema tcnico original.
1- Definio do Problema: saber exatamente aquilo que se pretende pesquisar o
mesmo que definir corretamente o problema.
2- Planejamento: como levantar informaes? Que dados devero ser obtidos? Qual
levantamento a ser utilizado? Censitrio? Por amostragem ? E o cronograma de atividades? Os
custos envolvidos? etc.
3- Coleta de dados: fase operacional. o registro sistemtico de dados, com um
objetivo determinado. Os dados podem ser classificados em:
Dados primrios: quando so publicados pelo prprio pesquisador ou organizao que os
tenha coletado. Ex.: tabelas do censo demogrfico do IBGE.
Dados secundrios: quando so publicados por outra organizao. Ex.: quando
determinado jornal publica estatsticas referentes ao censo demogrfico extradas do IBGE.
Obs.: mais seguro trabalhar com fontes primrias. O uso da fonte secundria traz um risco de erros de transcrio.

Dados Brutos: quando os dados originais (coletados) ainda no se encontram prontos


para anlise por no estarem numericamente organizados.
Rol de dados: uma lista em que os valores esto organizados em uma determinada
ordem, crescente ou decrescente.
4- Crtica dos dados: obtidos os dados, eles devem ser cuidadosamente criticados,
procura de possveis falhas e imperfeies, a fim de no incorrermos em erros grosseiros ou de
certo vulto, que possam influir sensivelmente nos resultados.
5- Apresentao dos dados: os dados devem ser apresentados sob a forma adequada
(tabelas ou grficos), tornando mais fcil o exame daquilo que est sendo objeto de tratamento
estatstico.
6- Anlise dos dados: A ltima fase do trabalho estatstico a mais importante e
delicada. Est ligada essencialmente ao clculo de medidas e coeficientes, cuja finalidade
principal descrever o fenmeno (estatstica descritiva), ou tirar concluses sobre a populao a
partir de informaes fornecidas pela amostra (estatstica inferencial).
3 Grficos Estatsticos
So representaes visuais dos dados estatsticos que devem corresponder, mas nunca
substituir as tabelas estatsticas. Os grficos apresentam as seguintes caractersticas: uso de
escalas, sistema de coordenadas (eixo das abcissas e eixo das ordenadas), identificao do
grfico (ttulo), fonte de origem dos dados, identificao dos eixos e respectivas unidades de
medidas, uso de legendas quando necessrio, simplicidade, clareza e veracidade.
Grficos de informao: So grficos destinados principalmente ao pblico em geral,
objetivando proporcionar uma visualizao rpida e clara. So grficos tipicamente expositivos,
dispensando comentrios explicativos adicionais. As legendas podem ser omitidas, desde que as
informaes desejadas estejam presentes.
Grficos de anlise: So grficos que prestam-se melhor ao trabalho estatstico,
fornecendo elementos teis fase de anlise dos dados sem deixar de ser tambm informativos.
Os grficos de anlise frequentemente vm acompanhados de uma tabela estatstica. Inclui-se,
muitas vezes um texto explicativo, chamando a ateno do leitor para os pontos principais
revelados pelo grfico.
Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

3.1 Classificao dos grficos


Os grficos podem ser classificados de acordo com a forma em: diagramas,
estereogramas, pictogramas e cartogramas.
3.1.1 Diagramas
So grficos geomtricos dispostos em duas dimenses. So os mais usados na
representao de sries estatsticas. Eles podem ser :
a) Grficos em barras horizontais
Usam-se, de preferncia, os grficos em barras horizontais quando as legendas no so
breves.
b) Grficos em barras verticais (colunas)
Nesses grficos os retngulos normalmente tm a mesma base e as alturas so
proporcionais as quantidades dos respectivos dados. Se a srie for histrica, a ordem a ser
observada a cronolgica, se a srie for geogrfica ou categrica, a ordem a ser observada a
decrescente.
c) Grficos em barras compostas (mltiplas barras)
d) Grficos em colunas sobrepostas (colunas empilhadas)
Eles diferem dos grficos em barras ou colunas convencionais apenas pelo fato de
apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar
comparativamente dois ou mais atributos.
e) Grficos em linhas ou lineares
So frequentemente usados para representao de sries cronolgicas com um grande
nmero de perodos de tempo. As linhas so mais eficientes do que as colunas, quando existem
intensas flutuaes nas sries ou quando h necessidade de se representarem vrias sries em um
mesmo grfico.
f) Grficos em setores
Este grfico construdo com base em um crculo, e empregado sempre que desejamos
ressaltar a participao das partes em relao ao total. O total representado pelo crculo, que
fica dividido em tantos setores quantas forem as partes. Os setores so tais que suas reas so
respectivamente proporcionais aos dados da srie. O grfico em setores s deve ser empregado
quando h, no mximo, sete dados a serem apresentados.
3.1.2 Estereogramas
So grficos geomtricos dispostos em trs dimenses, pois representam volume. So
usados nas representaes grficas das tabelas de dupla entrada. Em alguns casos este tipo de
grfico fica difcil de ser interpretado dada a pequena preciso que oferecem.
3.1.3 Pictogramas
So construdos a partir de figuras representativas da intensidade do fenmeno. Este tipo
de grfico tem a vantagem de despertar a ateno do pblico leigo, pois sua forma atraente e
sugestiva. Os smbolos devem ser auto-explicativos. A desvantagem dos pictogramas que
apenas mostram uma viso geral do fenmeno, e no de detalhes minuciosos.
3.1.4 Cartogramas
So ilustraes relativas a cartas geogrficas (mapas). O objetivo desse grfico o de
apresentar os dados estatsticos diretamente relacionados com reas geogrficas ou polticas.
4 Distribuio de Frequncias
um tipo de tabela que condensa uma coleo de dados na qual os valores se apresentam
em correspondncia com suas repeties, evitando-se, assim, que eles apaream mais de uma vez
na tabela, como ocorre com o rol de dados.
4.1 Frequncias absolutas (fi): so os valores que realmente representam o nmero de dados de
cada classe. A soma das frequncias simples igual ao nmero total dos dados da distribuio.
Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

4.2 Frequncias relativas (fri): so os valores das razes entre as frequncias absolutas de cada
classe e a frequncia total da distribuio (fi/n). A soma das frequncias relativas igual a 1,00
ou (100 %).
4.3 Frequncia acumulada (F): a frequncia absoluta total de todos os valores inferiores ao
limite superior de uma dada classe denominada frequncia acumulada at aquela classe.
4.4 Frequncia relativa acumulada (Fr): a frequncia relativa total de todos os valores
inferiores ao limite superior de uma dada classe denominada frequncia relativa acumulada at
aquela classe.
4.5 Regras para a elaborao de uma distribuio de frequncias com classes
1 - Organize os dados brutos em um rol;
2 - Calcule a amplitude total R R X mx X min ;
3 - Determine o nmero de classes (k), que ser calculado usando as frmulas
k=1+log2n ou k=1+3,32.log n ou ainda k n , obrigatoriamente o k deve estar compreendido
entre 5 a 20.
4 - Conhecido o nmero de classes k define-se a amplitude de cada classe pela frmula:
R
h
k
4.6 Representao grfica de uma distribuio de frequncias - histograma, polgono de
frequncia e polgono de frequncia acumulada
Em todos os grficos acima utilizamos o primeiro quadrante do sistema de eixos
coordenados cartesianos ortogonais. Na linha horizontal (eixo das abcissas) colocamos os
valores da varivel e na linha vertical (eixo das ordenadas), as frequncias.
4.6.1 Histograma: o grfico formado por um conjunto de retngulos justapostos, cujas
bases se localizam sobre o eixo horizontal, de tal forma que seus pontos mdios coincidam com
os pontos mdios dos intervalos de classe. A rea de um histograma proporcional soma das
frequncias simples ou absolutas.
Um histograma ou uma distribuio de frequncias representa a variabilidade dos dados
da varivel estudada, ou seja, o padro de variao de todos os resultados que podem ser gerados
pelo fenmeno em estudo.
O histograma um grfico de barras cujo eixo horizontal representa a variao total da
caracterstica em estudo subdividida em vrios pequenos intervalos;
Quando a caracterstica em estudo uma varivel discreta, os intervalos so valores
inteiros;
Para cada um destes intervalos construda uma barra vertical proporcional ao nmero de
observaes na amostra pertencente ao respectivo intervalo.
O Histograma uma ferramenta que permite resumir e visualizar a forma da distribuio
dos dados, a localizao do valor central e a disperso em torno desse valor.
4.6.2 Polgono de frequncia: um grfico em linha, sendo as frequncias marcadas
sobre perpendiculares ao eixo horizontal, levantadas pelos pontos mdios dos intervalos de
classe. Para realmente obtermos um polgono (linha fechada), devemos completar a figura,
ligando os extremos da linha obtida aos pontos mdios da classe anterior primeira e da
posterior ltima, da distribuio.
4.6.3 Polgono de frequncia acumulada: traado marcando-se as frequncias
acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos
limites superiores dos intervalos de classe.

Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

4.6.4 Frequncia absoluta acumulada de uma classe: o total das frequncias


absolutas de todos os valores inferiores ao limite superior do intervalo de uma determinada
classe.
4.6.5 Frequncia relativa acumulada de uma classe: o total das frequncias relativas
de todos os valores inferiores ao limite superior do intervalo de uma determinada classe.
Exerccio: com base na tabela abaixo construa o histograma, o polgono de frequncia e o polgono de frequncia
acumulada.
...Classe
......fi..... .....Xi..... .....fri..... .....Fi..... ......Fri.....
50 |------- 54
4
52
0,100
4
0,100
54 |------- 58
9
56
0,225
13
0,325
58 |------- 62
11
60
0,275
24
0,600
62 |------- 66
8
64
0,200
32
0,800
66 |------- 70
5
68
0,125
37
0,925
70 |------- 74
3
72
0,075
40
1,000
1,000
Total
40
Sendo fi= frequncia absoluta; Xi = ponto mdio de classe; Fi = frequncia absoluta acumulada; fri =
frequncia relativa e Fri = frequncia relativa acumulada.
Obs: uma distribuio de frequncias sem intervalos de classe representada graficamente por um diagrama onde
cada valor da varivel representado por um segmento de reta vertical e de comprimento proporcional respectiva
frequncia.

4.6.6 Curva de frequncia (curva suavizada): enquanto o polgono de frequncia nos


d a imagem real do fenmeno estudado, a curva de frequncia nos d a imagem tendencial. A
suavizao (geometricamente, corresponde eliminao dos vrtices da linha poligonal) de um
polgono de frequncia. A curva de frequncia nos mostra como seria tal polgono com um
nmero maior de dados em amostras mais amplas.
4.7 Diagrama de Disperso
O diagrama de disperso um grfico onde pontos no espao cartesiano XY so usados
para representar simultaneamente os valores de duas variveis quantitativas medidas em cada
elemento do conjunto de dados. O Diagrama de Disperso um grfico utilizado para a
visualizao do tipo de relacionamento existente entre duas variveis.
Pode ser usado para detectar se existe uma relao de causa e efeito entre duas variveis.
comum o eixo horizontal representar um parmetro do processo (causa), enquanto que o eixo
vertical representa uma caracterstica de qualidade de interesse (efeito).
O Diagrama de Disperso tambm pode ser usado para a investigao da relao
existente entre duas caractersticas de qualidade (efeitos), ou entre dois parmetros do processo
(causas).
4.7.1 Etapas na construo do Diagrama de Disperso
- Colete as observaes em pares (x, y) das variveis entre as quais voc deseja estudar as
relaes, e organize-as em uma tabela;
- Determine os valores mximo e mnimo para x e y;
- Defina as escalas do eixo horizontal e vertical de forma que ambos os comprimentos
sejam aproximadamente iguais;
- Registre as observaes nos grficos.
- Identifique o diagrama adicionando ttulo, perodo, denominao e unidade de medida
de cada eixo.
4.7.2 Interpretao do Diagrama de Disperso
- Examine a presena de dados atpicos, outliers. Um dado outlier uma observao
extrema que no condizente com o restante da massa dos dados.
- A identificao dos outliers e a anlise das causas que levaram ao seu aparecimento
podem resultar em atuaes sobre processo.
Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

O grfico de disperso poder indicar um padro:


- correlao positiva
- correlao negativa
- ausncia de correlao
- correlao no linear
- A existncia de uma correlao entre duas variveis no implica na existncia de um
relacionamento de causa e efeito entre elas.
- A correlao entre duas variveis depende do intervalo de variao.
- Os diagramas de disperso podem no ser vlidos para a realizao de extrapolaes
fora do intervalo de variao das variveis consideradas no estudo.
- Em muitos casos a anlise de um diagrama de disperso permite a descoberta da causa
do problema.
5 Medidas de Posio
So os ndices estatsticos que representam uma srie de dados orientando-nos quanto
posio da distribuio em relao ao eixo horizontal do grfico da curva de frequncia.
As medidas de posies mais importantes so as medidas de tendncia central (verifica-se
uma tendncia dos dados observados ao se agruparem em torno dos valores centrais).
As medidas de tendncia central mais utilizadas so: mdia aritmtica, moda e mediana.
Outras medidas de tendncia central menos usados so as mdias: geomtrica, harmnica,
quadrtica, cbica e biquadrtica.
As outras medidas de posio so as separatrizes, que englobam: a prpria mediana, os
quartis, os decis e os percentis.
5.1 Mdia Aritmtica
A mdia aritmtica do conjunto de dados X1, X2,..., Xn representada por X igual ao
quociente entre a soma dos valores Xi do conjunto de dados e o nmero total dos valores
observados calculada por:
n

X
i 1

......onde: Xi so os valores da varivel e n o nmero de valores do grupo de dados.

5.1.1 Mdia para dados no-agrupados


Quando desejamos conhecer a mdia dos dados no-agrupados em tabelas de frequncias,
determinamos a mdia aritmtica simples.
Exemplo:
Sabendo-se que a venda diria de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15,
16, 18 e 12 kg, temos, para venda mdia diria na semana de:
X .= (10+14+13+15+16+18+12)/7 = 14 kg
Desvio em relao mdia: a diferena entre cada elemento de um conjunto de valores e a
mdia aritmtica, ou seja:. di X i X
No exemplo temos sete desvios:... d1 = 10-14 = -4 , ...d2 = 14-14 = 0 , ...d3 = 13-4 = -1 , d4 = 15-14 = 1 ,... d5
= 16-14 = 2 ,... d6 = 18-14 = 4 ...e... d7 = 12-14 = -2.

Propriedades da mdia
1 propriedade: A soma algbrica dos desvios em relao mdia nula.
No exemplo: d1+d2+d3+d4+d5+d6+d7 = 0
2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de
uma varivel, a mdia do conjunto fica aumentada (ou diminuda) dessa constante.
Se no exemplo original somarmos a constante 2 a cada um dos valores da varivel temos:
Y (12 16 15 17 18 14) / 7 16Kg ou
Y X 2 14 2 16Kg
Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

3 propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma
constante (c), a mdia do conjunto fica multiplicada (ou dividida) por essa constante.
Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da varivel temos:
Y (30 42 39 45 48 54 36) / 7 42Kg ou
Y X .3 14.3 42Kg

5.1.2 Mdia para dados agrupados (sem intervalos de classe)


Consideremos a distribuio relativa a 34 famlias de quatro filhos, tomando para varivel
o nmero de filhos do sexo masculino. Calcularemos a quantidade mdia de meninos por
famlia:
n de meninos
0
1
2
3
4
Total

frequncia = fi
2
6
10
12
4
34

Como as frequncias so nmeros indicadores da intensidade de cada valor da varivel,


elas funcionam como fatores de ponderao (pesos) representados po Wi, o que nos leva a
calcular a mdia aritmtica ponderada, dada pela frmula, onde as frequncias absolutas
representam os pesos de cada valor da varivel:
X

X .W
W
i

Xi
0
1
2
3
4
Total

fi
2
6
10
12
4
34

fi.Xi
0
6
20
36
16
78

onde: X 78 2,3 meninos por famlia


34

5.1.3 Mdia para dados agrupados (com intervalos de classe)


Neste caso, convencionamos que todos os valores includos em um determinado intervalo
de classe coincidem com o seu ponto mdio, e determinamos a mdia aritmtica ponderada por
meio da frmula:
X

f .X ,..onde: fi a frequncia da classe ndice i e Xi o ponto mdio da classe ndice i.


f
i

Exemplo:
Calcular a estatura mdia de bebs conforme a tabela abaixo.
Estaturas (cm)
50 |------------ 54
54 |------------ 58
58 |------------ 62
62 |------------ 66
66 |------------ 70
70 |------------ 74
Total
Aplicando a frmula acima temos: X

Prof. Jorge Matos

frequncia = fi
4
9
11
8
5
3
40

ponto mdio = Xi
52
56
60
64
68
72

Xi.fi.
208
504
660
512
340
216
2.440

2440
61 cm
40

Estatstica Descritiva

IFRS-Cmpus Farroupilha

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

5.2 Mdia Geomtrica


A mdia geomtrica dos valores positivos: X1, X2,..., Xn representada por X g a raiz nsima do produto de todos os valores de X .
5.2.1 Mdia Geomtrica Simples
A mdia geomtrica simples calculada por:
n
X g X 1. X 2 ... X n
Exemplo:
Calcular a mdia geomtrica dos seguintes conjuntos de nmeros:E
a) {10, 60, 360}...
X g 3 10.60.360 60,0 ........
b) {2, 2, 2}........ ....

X g 3 2.2.2 2,0

c) {1, 4, 16, 64}........

X g 4 1.4.16.64 8,0 ....

5.2.2 Mdia Geomtrica Ponderada


A mdia geomtrica ponderada do conjunto de valores positivos: X1, X2,...,Xk, com pesos
w1, w2, ..., wk representada por X gp calculada por:

X gp i X 1w1 . X 2w2 .... X nwk


W

Exemplo:
Calcular a mdia geomtrica dos valores da tabela abaixo:
Xi
1
3
9
27
total

fi
2
4
2
1
9

Obs.: Para o clculo das mdias de uma distribuio de frequnicias as frequncias absolutas so
consideradas com pesos de ponderao.

X g 9 12.34.92.271 3,8

Propriedades da Mdia Geomtrica


1 propriedade: O produto dos quocientes de cada valor de um conjunto de nmeros pela
mdia geomtrica do conjunto igual a 1, ou seja, X 1 . X 2 . X 3 .... X n 1
Xg Xg Xg

Xg

Exemplo:
Comprovar a 1 propriedade da mdia geomtrica com os dados {10, 60, 360}
X g 60... onde: 10/60 x 60/60 x 360/60 = 1
2 propriedade: Sries que apresentam o mesmo nmero de elementos com o mesmo
produto tm a mesma mdia geomtrica.
Exemplo - Comprovar a 2 propriedade da mdia geomtrica com os dados:
a = {8 e 12,5}.........b = {2 e 50}
X g 10 ..................... X g 10
3 propriedade: A mdia geomtrica menor ou igual a mdia aritmtica.
A desigualdade . X g X sempre se verifica, quando os valores da srie forem positivos e
nem todos iguais. Se entre eles houver um ou mais zeros, a mdia geomtrica ser nula. A
igualdade X g X .s ocorrer quando todos os valores da srie forem iguais.
4 propriedade: Quanto maior for a diferena entre os valores originais maior ser a
diferena entre as mdias aritmtica e geomtrica.
Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha 10

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

Veja na tabela abaixo:


conjunto
Xi = {2, 2}
Yi = {14, 16}
Wi = {8, 12}
Zi = {2, 50}

mdia aritmtica
2,0
15,0
10,0
26,0

mdia geomtrica
2,0
14,97
9,8
10,0

5.3 Mdia Harmnica


A mdia harmnica dos valores positivos X1, X2,...,Xk, representada por X h o inverso da
mdia aritmtica dos inversos.
5.3.1 Mdia Harmnica Simples.(para dados no agrupados)..
A mdia harmnica simples calculada por:
Xh

1
1
1
1

...
X1 X 2
Xn
n

Xh

n
1
1
1

...
X1 X 2
Xn

ou X h

n
1

Exemplo:
Calcular a mdia harmnica simples dos seguintes conjuntos de nmeros:
a) {10, 60, 360}. Resp:.. 3/(1/10+1/60+1/360) = 25,12
b) {2, 2, 2, 2} . Resp:... . 4/(1/2+1/2+1/2+1/2) = 2,0....
5.3.2 Mdia Harmnica Ponderada (para dados agrupados)
A mdia harmnica do conjunto de valores positivos X1, X2,...,Xk,com pesos w1, w2, ..., wk
representada por X hp calculada por:
.. X hp

w
w
X

i
i
i

Exemplo:
Calcular a mdia harmnica dos valores da tabela abaixo:
classes
1 |--------- 3
3 |--------- 5
5 |--------- 7
7 |--------- 9
9 |---------11
total

fi
2
4
8
4
2
20

Xi
2
4
6
8
10

fi/Xi
2/2 = 1,00
4/4 = 1,00
8/6 = 1,33
4/8 = 0,50
2/10 = 0,20
4,03

Xh

20
4,96
4,03

Propriedades da Mdia Harmnica


A mdia harmnica menor que a mdia geomtrica para valores da varivel diferentes
de zero.
X h X g e por extenso de raciocnio podemos escrever :. X h X g X .
Obs.: A mdia harmnica no aceita valores iguais a zero como dados de uma srie.

A igualdade X h X g X ..s ocorrer quando todos os valores da srie forem iguais.


Obs: Quando os valores da varivel no forem muito diferentes, verifica-se aproximadamente a seguinte relao:
(X Xh)
Xg
2

Demonstraremos a relao acima com os seguintes dados:


X = {10,1; 10,1; 10,2; 10,4; 10,5}
Mdia aritmtica: X 51,30 10,2600
5

Mdia harmnica: X h

Prof. Jorge Matos

5
10,2574
0,487451

Estatstica Descritiva

IFRS-Cmpus Farroupilha 11

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica
Mdia geomtrica: X g 5 10,1.10,1.10,2.10,4.10,5 10,2857

Comprovando a relao: X g (10,2600 10,2574) / 2 10,2587 (mdia geomtrica)


5.4 Mediana
A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou
decrescente), o valor situado de tal forma no conjunto de dados, que o separa em dois
subconjuntos de mesmo nmero de elementos, ou seja, a mediana, uma medida de localizao
do centro da distribuio dos dados. Smbolo da mediana: md
5.4.1 A Mediana para dados no-agrupados
Dada uma srie de valores como, por exemplo: {5, 2, 6, 13, 9, 15, 10}
De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao
(crescente ou decrescente) dos valores: {2, 5, 6, 9, 10, 13, 15}
O valor que divide a srie acima em duas partes iguais igual a 9, logo a md = 9.
Mtodo prtico para a determinao da Mediana
Se a srie dada conter um nmero mpar de termos:
O valor mediano ser o termo central do conjunto de dados, que pode ser o termo de
n 1
ordem dado pela frmula :
2
Exemplo: Calcule a mediana da srie {1, 3, 0, 0, 2, 4, 1, 2, 5}
1 - ordenar a srie {0, 0, 1, 1, 2, 2, 3, 4, 5}
n = 9 logo (n + 1)/2 dado por (9+1)/2 = 5, ou seja, o 5 termo da srie ordenada ser a mediana.
A mediana ser o 5 termo = 2
Se a srie dada apresentar um nmero par de termos:
O valor mediano ser a mdia aritmtica entre os dois termos centrais da srie, cujos
termos de ordem so dados pelas frmulas: n/2 e n/2+1..
Obs.: n/2 e (n/2 + 1) sero termos de ordem e devem ser substitudos pelo valor correspondente.

Exemplo:
Calcule a mediana da srie {1, 3, 0, 0, 2, 4, 1, 3, 5, 6}
1 - ordenar a srie {0, 0, 1, 1, 2, 3, 3, 4, 5, 6}
n = 10 logo os termos sero: 10/2=5 e 10/2+1=6;
logo os termos centrais so: 5 termo e 6 termo;
5 termo = 2
6 termo = 3
A mediana ser = (2+3)/2 ou seja, md = 2,5 . A mediana no exemplo ser a mdia
aritmtica do 5 e 6 termos da srie.
5.4.2 A Mediana para dados agrupados
a) Sem intervalos de classe: neste caso, o bastante identificar a frequncia acumulada
imediatamente superior metade da soma das frequncias. A mediana ser aquele valor da
varivel que corresponde a tal frequncia acumulada.
b) Com intervalos de classe: para este caso, devemos seguir os seguintes passos:
1) Determinamos as frequncias acumuladas;
2) Calculamos n / 2 ;
3) Marcamos a classe correspondente frequncia acumulada que contm o termo de
ordem n / 2 . Esta classe ser a classe mediana;
4) Identificamos a frequncia absoluta acumulada at a classe anterior classe mediana
( Fi 1 );
5) Identificamos a amplitude da classe mediana;
6) Calculamos a mediana pela seguinte frmula:..

Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha 12

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

2 Fi 1
md lii hi

fi

onde:
lii = limite inferior da classe mediana;
hi = amplitude do intervalo da classe mediana;
n/2 = valor da metade do nmero de dados;
Fi-1 = frequncia acumulada absoluta da classe anterior classe mediana;
fi = frequncia absoluta da classe mediana.

5.5 Moda
A moda de um conjunto de valores, anotada por mo definida como sendo o valor ou os
valores do conjunto de dados que mais se repete. A moda ao contrrio da mediana e da mdia
pode no ser nica, isto , um conjunto de dados pode ser bimodal, trimodal, etc. Ou mesmo
amodal (sem moda).
Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais comum,
isto , o salrio recebido pelo maior nmero de empregados dessa fbrica.
5.5.1 A Moda quando os dados no esto agrupados
Exemplo:
Na srie {7 , 8 , 9 , 10 , 10 , 10 , 11 , 12} a moda igual a 10.
H sries nas quais no existe valor modal, isto , nas quais nenhum valor aparea mais
que outros.
Exemplo: {3 , 5 , 8 , 10 , 12} no apresenta moda, a srie amodal. Em outros casos, pode haver
dois ou mais valores repetidos. Dizemos, ento, que a srie tem dois ou mais valores modais.
Exemplo:
{2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9} apresenta duas modas: 4 e 7. A srie bimodal.
5.5.2 A Moda quando os dados esto agrupados
a) Sem intervalos de classe: uma vez agrupados os dados, possvel determinar
imediatamente a moda: basta fixar o valor da varivel de maior frequncia.
Exemplo:
Qual a temperatura mais comum medida no ms abaixo:
Temperaturas
0 C
1 C
2 C
3 C

frequncia
3
9
12
6

Resp.: mo=2 C a temperatura modal, pois a de maior frequncia.


b) Com intervalos de classe: a moda de uma distribuio de frequncias com intervalos
de classes dada pelas seguntes expresses:

f i1
mo lii hi
, denominada de moda de King, ou
f i1 f i1

f i f i1
mo lii hi
, denominada de moda de Kzuber, onde:
2 f i f i1 f i1
lii = limite inferior da classe modal, isto , a classe de maior frequncia;
hi = amplitude do intervalo da classe modal;
fi = frequncia absoluta da classe modal;
Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha 13

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

fi-1 = frequncia absoluta da classe anterior classe modal;


fi+1 = frequncia absoluta da classe posterior classe modal.
Notas:
- Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da
mediana com um dos elementos da srie.
- Quando o nmero de elementos da srie estatstica for par, poder haver coincidncia da
mediana com um dos elementos da srie. A mediana ser sempre a mdia aritmtica dos 2
elementos centrais da srie.
- Em uma srie: a mediana, a mdia e a moda no tm, necessariamente, o mesmo valor.
- A mediana depende da posio e no dos valores dos elementos na srie ordenada. Essa
uma das diferenas marcantes entre mediana e mdia (que se deixa influenciar, e muito, pelos
valores extremos). Vejamos:
Em {5, 7, 10, 13, 15} a mdia = 10 e a mediana = 10
Em {5, 7, 10, 13, 65} a mdia = 20 e a mediana = 10
isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia dos
valores extremos, ao passo que a mediana permanece a mesma.
Emprego da Mediana
- Quando desejamos obter o valor que divide a distribuio em duas partes iguais.
- Quando h valores extremos que afetam de maneira acentuada a mdia aritmtica.
Exemplo:
Calcule a mdia, a mediana e a moda para os dados da tabela abaixo:
classes
50 |------------ 54
54 |------------ 58
58 |------------ 62
62 |------------ 66
66 |------------ 70
70 |------------ 74
total

frequncia = fi
4
9
11
8
5
3
40

Freq. acumulada=Fi
acumulada=Fi
4
13
24
32
37
40

5.6 Quartis
Denominamos quartis os valores de uma srie que a dividem em quatro partes iguais.
Precisamos, portanto, de 3 quartis (Q1 , Q2 e Q3) para dividir a srie em quatro partes iguais.
O 1o quartil (Q1) corresponde a 25% dos dados;
O 2o quartil (Q2) corresponde a 50% dos dados;
O 3o quartil (Q3) orresponde a 75% dos dados
25%
50%
75%
!---------!---------!---------!---------!
Q1
Q2
Q3
Obs.: O 2o quartil (Q2) sempre ser igual a mediana da srie.

5.6.1 Quartis para dados no agrupados


O mtodo mais prtico utilizar o princpio do clculo da mediana para os 3 quartis. Na
realidade sero calculadas "3 medianas " em uma mesma srie.
Exemplo 1:
Calcule os quartis da srie: {5, 2, 6, 9, 10, 13, 15}
O primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos valores:
{2, 5, 6, 9, 10, 13, 15}
O valor que divide a srie acima em duas partes iguais igual a 9, logo a md = 9 que ser = Q2.
Temos agora {2, 5, 6} e {10, 13, 15} como sendo os dois grupos de valores iguais
proporcionados pela mediana (2o quartil). Para o clculo do 1o e 3o quartis basta calcular as
medianas das partes iguais provenientes da verdadeira mediana da srie (2o quartil).
Logo em {2, 5, 6} a mediana = 5 , ou seja: ser o 1o quartil
Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha 14

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

em {10, 13, 15} a mediana =13, ou seja: ser o 3o quartil


Exemplo 2:
Calcule os quartis da srie: {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13}
A srie j est ordenada, ento calcularemos o 2o quartil = md = (5+6)/2 = 5,5
O 1o quartil ser a mediana da srie esquerda de md: {1, 1, 2, 3, 5, 5} Q1 = (2+3)/2 = 2,5
O 3o quartil ser a mediana da srie direita de md: {6, 7, 9, 9, 10, 13} Q3 = (9+9)/2 = 9
Passos para a determinao dos quartis
1o - Partindo de uma amostra de tamanho n, colocar os valores em ordem crescente;
2o - Calcular o primeiro quartil usando a frmula:
Q1

X (i ) X ( j )
2

, onde : i(base)

n 1
n
, j (topo ) , onde i e j so as ordens dos valores
4
4

3o - Calcular o terceiro quartil usando a frmula:


Q3

X (i ) X ( j )
2

, onde : i(base)

3(n 1)
3n
, j (topo )
4
4

5.6.2 Quartis para dados agrupados em classes


O mtodo para determinar os 3 quartis para dados agrupados em classes segue a mesma
lgica da determinao da mediana:
1) Determinamos as frequncias acumuladas;
2) Identificamos a frequncia absoluta acumulada at a classe anterior classe do quartil
( Qi 1 );
3) Calculamos n / 4 para Q1 e 3n/4 para Q3;
5) Identificamos a amplitude da classe que se encontra o Qi ;
6) Calculamos o Qi utilizando as seguintes frmulas:..
n

3n

4 FQ11
4 FQ 31
Q1 liQ1 hQ1
Q3 liQ 3 hQ 3

fQ3
f Q1

onde:
liQi = limite inferior da classe do quartil;
hQi = amplitude do intervalo da classe do quartil;
n/4, 3n/4 = ordem de e do nmero de dados;
fQi = frequncia absoluta da classe do quartil;
FQi-1 = frequncia acumulada absoluta da classe anterior classe do quartil.

5.7 Decis
Os decis so os valores que dividem a srie de dados em 10 partes iguais. Precisamos,
portanto, de 9 quartis (D1 , D2 ,..., D9) para dividir a srie em dez partes iguais.
10%

20% 30% 40% 50% 60% 70% 80% 90%

!---!---!---!---!---!---!---!---!---!---!
D1

D2

D3

D4

D5

D6

D7

D8

D9

Para determinar os decis seguimos os seguintes passos:


1) Calculamos i.n , onde: i = 1, 2, 3, 4, 5, 6, 7,8 e 9
10

2) Identificamos a classe Di pela frequncia absoluta acumulada;


3) Aplicamos a frmula:
i.n

10 FDi1
Di lDi hDi

f Di

Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha 15

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

onde:
liDi = limite inferior da classe do decil;
hDi = amplitude do intervalo da classe do decil;
n = tamanho da amostra;
fQi = frequncia absoluta da classe do decil;
FDi-1 = frequncia acumulada absoluta da classe anterior classe do decil;
6 Medidas de Disperso
a maior ou menor diversificao dos valores de uma varivel em torno de um valor de
tendncia central (mdia ou mediana) tomado como ponto de comparao.
A mdia - ainda que considerada como um nmero que tem a faculdade de representar
uma srie de valores - no pode, por si mesma, destacar o grau de homogeneidade ou
heterogeneidade que existe entre os valores que compem o conjunto.
Consideremos os seguintes conjuntos de valores das variveis X, Y e Z:
X = {70, 70, 70, 70, 70}
Y = {68, 69, 70, 71, 72}
Z = {5, 15, 50, 120, 160}
Observamos ento que os trs conjuntos apresentam a mesma mdia aritmtica
350
X
70 , entretanto, fcil notar que o conjunto X mais homogneo que os conjuntos Y e
5

Z, j que todos os valores so iguais mdia. O conjunto Y, por sua vez, mais homogneo que
o conjunto Z, pois h menor diversificao entre cada um de seus valores e a mdia
representativa.
Conclumos ento que o conjunto X apresenta disperso nula e que o conjunto Y
apresenta uma disperso menor que o conjunto Z.
6.1 Amplitude total
uma medida de disperso que no tem na mdia o ponto de referncia. Quando os
dados no esto agrupados a amplitude total a diferena entre o maior e o menor valor
observado: R X mximo X mnimo
Exemplo:
Para os valores 40, 45, 48, 62 e 70 a amplitude total ser: R = 70 - 40 = 30
Quando os dados esto agrupados sem intervalos de classe ainda temos: R X mximo X mnimo
Exemplo:
Xi
0
1
3
4

fi
2
6
5
3

R=4-0=4
Com intervalos de classe a amplitude total a diferena entre o limite superior da ltima
classe e o limite inferior da primeira classe. Ento: R Lmximo Lmnimo
Exemplo:
Classes
4 |-------- 6
6 |-------- 8
8 |-------- 10

fi
6
2
3

R = 10 - 4 = 6
A amplitude total tem o inconveniente de s levar em considerao os dois valores
extremos da srie, descuidando do conjunto de valores intermedirios. Faz-se uso da amplitude
total quando se quer determinar a amplitude da temperatura em um dia, ou no controle de
qualidade como uma medida de clculo rpido sem muita exatido.
Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha 16

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

6.2 Desvio mdio absoluto


a mdia aritmtica dos valores absolutos dos desvios tomados em relao a uma das
seguintes medidas de tendncia central: mdia ou mediana. Smbolo = dma
Frmula : para a mdia : dma

Xi X
n

e para a mediana: dma

X i md
n

As barras verticais indicam que so tomados os valores absolutos, prescindindo do sinal


dos desvios.
Exemplo:
Calcular o desvio mdio do conjunto de nmeros {- 4 , - 3 , - 2 , 3 , 5}
Pela mdia : dma = 16,8 / 5 = 3,36
Pela mediana : dma = 15/5 = 3
Obs.: Apesar de o desvio mdio expressar aceitavelmente a disperso de uma amostra, no to frequentemente
empregado como o desvio-padro. O desvio mdio despreza o fato de alguns desvios serem negativos e outros
positivos, pois essa medida os trata como se fossem todos positivos.

6.3 Desvio-padro
a medida de disperso mais empregada, pois leva em considerao a totalidade dos
valores da varivel em estudo. um indicador de variabilidade bastante estvel. O desvio-padro
baseia-se nos desvios em torno da mdia aritmtica e a sua frmula bsica pode ser traduzida
como: a raiz quadrada da mdia aritmtica dos quadrados dos desvios em relao mdia e
representada por ou S.

ou

X
n

2
i

X (populao) S
2

ou S

X
n

2
i

X2

(amostra)

As frmulas acima so empregadas quando tratamos de uma populao ou de uma


amostra de dados no-agrupados.
Exemplo:
Calcular o desvio-padro da populao representada por - 4 , -3 , -2 , 3 , 5
Xi

Xi X

-4
-3
-2
3
5

- 0,2
- 0,2
- 0,2
- 0,2
- 0,2

- 3,8
- 2,8
- 1,8
3,2
5,2

14,44
7,84
3,24
10,24
27,04
62,8

Sabemos que n = 5 e ( X i X ) 2 62,8 ; logo 62,8 12,56


5

A raiz quadrada de 12,56 o desvio-padro: 3,54

Obs: Quando nosso interesse no se restringe descrio dos dados mas, partindo da amostra, visamos tirar
inferncias vlidas para a respectiva populao, convm efetuar uma modificao, que consiste em usar o divisor n1 em lugar de n, quando o tamanho da amostra for inferior a 30. A frmula ficar ento:
S

n 1

Se os dados - 4 , -3 , -2 , 3 , 5 representassem uma amostra o desvio-padro amostral seria


a raiz quadrada de 62,8 / (5 -1) = 3,96
O desvio-padro goza de algumas propriedades, dentre as quais destacamos:
1 propriedade: Somando-se (ou subtraindo-se) uma constante a todos os valores de uma
varivel, o desvio-padro no se altera.
2 propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por
uma constante (diferente de zero), o desvio-padro fica multiplicado (ou dividido) por essa
constante.
Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha 17

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

Quando os dados esto agrupados (temos a presena de frequncias) a frmula do desviopadro ficar :

f .X X
f

f .X

Exemplo:
Calcule o desvio-padro populacional da tabela abaixo:
Xi

fi

X i . fi

0
1
2
3
4
Total

2
6
12
7
3
30

0
6
24
21
12
63

Sabemos que

f .( X
i

X
2,1
2,1
2,1
2,1
2,1

Xi X

( X i X )2

( X i X )2 . fi

-2,1
-1,1
-0,1
0,9
1,9

4,41
1,21
0,01
0,81
3,61

8,82
7,26
0,12
5,67
10,83
32,70

X ) 2 32,70 e n=30, logo 32,70 1,09 1,044


30

Obs: Nas tabelas de frequncias com intervalos de classe a frmula a ser utilizada a mesma do exemplo anterior.

6.4 Varincia
o desvio-padro elevado ao quadrado e simbolizado por 2 ou S2. A varincia uma
medida que tem pouca utilidade como estatstica descritiva, porm extremamente importante
na inferncia estatstica e em combinaes de amostras.
Exerccios:
1- Considere os seguintes conjuntos de nmeros:
A = {10, 20, 30, 40, 50}
B = {100, 200, 300, 400, 500}
Que relao existe entre os desvios-padro dos dois conjuntos de nmeros ?
2- Dados os conjuntos de nmeros:
A = {220, 230, 240, 250, 260}
B = {20, 30, 40, 50, 60}
Que relao existe entre os desvios padres dos dois conjuntos de nmeros ?
3- Dados os conjuntos de nmeros: A = {-2, -1, 0, 1, 2}
B = {220, 225, 230, 235,
240}
Podemos afirmar, de acordo com as propriedades do desvio-padro, que o desvio-padro de B
igual:
a) ao desvio-padro de A;
b) ao desvio-padro de A, multiplicado pela constante 5;
c) ao desvio-padro de A, multiplicado pela constante 5, e esse resultado somado a 230;
d) ao desvio-padro de A mais a constante 230.
6.5 Coeficiente de Variao
Um desvio-padro pode ser considerado grande ou pequeno dependendo da ordem de
grandeza da varivel. Uma maneira de se expressar a variabilidade dos dados tirando a influncia
da ordem de grandeza da varivel atravs do coeficiente de variao (CV). O coeficiente de
variao uma medida relativa de disperso til para a comparao em termos relativos do grau
de concentrao em torno da mdia de sries distintas e dada por:
S

CV .100 ou CV .100 , o coeficiente de variao expresso em porcentagem.


X

Sua vantagem caracterizar a diperso dos dados em termos relativos ao seu valor mdio.
Assim uma pequena disperso absoluta pode ser na verdade, considervel quando comparada
com a ordem de grandeza dos valores da varivel e vice-versa.
Alm disso, por ser adimensional, o coeficiente de variao fornece uma maneira de se
comparar as disperses de variveis cujas unidades so irredutveis.
Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha 18

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

Exemplo:
Considere a tabela abaixo que contm as estaturas e os pesos de um mesmo grupo de
indivduos e responda: qual das medidas (estatura ou peso) possui maior homogeneidade?
Estaturas
Pesos

mdia
175,0 cm
68,0 kgf

desvio-padro
5,0 cm
2,0 kgf

Resposta:
Como no possvel responder a essa pergunta utilizando o desvio-padro, pois uma medida de disperso
absoluta, teremos que calcular o CVe da estatura e o CVp do peso. A srie que apresentar a menor variao, ou seja, o
menor valor do coeficiente CV, ser a srie de maior homogeneidade.
Utilizando a frmula do coeficiente CV, temos:
5,0
CVe
.100 2,86%
175,0
2,0
CV p
.100 2,94%
168,0
Logo, nesse grupo de indivduos, as estaturas apresentam menor grau de disperso que os pesos.

6.6 Amplitude inter-quartlica


Valores que dividem o conjunto de dados em quatro partes iguais so representados por Q1,
Q2, Q3, e denominam-se primeiro, segundo e terceiro quartis, respectivamente. A amplitude
inter-quartlica definida como a amplitude do intervalo entre o primeiro e o terceiro quartis, ou
seja: Q = Q3 - Q1
A amplitude inter-quartlica uma medida de variabilidade bastante robusta, que pouco
afetada pela presena de dados atpicos e guarda a seguinte relao aproximada com o desviopado: Q = (4/3) x desvio-padro.
Box-Plot
O Box-Plot um grfico no formato de caixa, cujos limites so o 1 quartil e o 3 quartil,
que representam 25% e 75% dos dados respectivamente. Esta caixa dividida por uma linha, a
mediana, que significa 50% dos dados. Existem tambm dois eixos, ou "bigodes", ligados
caixa estendendo-se no mximo a 1,5 vezes o tamanho da caixa, excluindo os valores
discrepantes (outliers). De um extremo ao outro, temos o espalhamento dos dados. O Box-Plot
especialmente til para mostrar as medidas de tendncia central, disperso, assimetria, caudas e
valores discrepantes de um grupo de dados, bem como, as diferenas de variabilidade, tendncia
central e assimetria que existem entre grupos.

Construo do Box plot:


Tamanho da caixa: Q3 Q1
Haste da caixa: at 1,5 x tamanho da caixa
Exemplo:
O Box-Plot a seguir compara as notas finais das trs turmas de Probabilidade e Estatstica.

Notas Finais

Comparao das notas das trs turmas de


Probabilidade e Estatstica
10,0
9,0
8,0
7,0
6,0
5,0
4,0
3,0
2,0
1,0
0,0

P rimeiro Quartil
M nimo
M ediana
M ximo
Terceiro Quartil

C.comp.

Prof. Jorge Matos

Eng. Eltrica
Cursos

Eng. Civil

Estatstica Descritiva

IFRS-Cmpus Farroupilha 19

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica

Exerccios
1 - Classifique as variveis abaixo:
(a) Tempo para fazer um teste
(b) Nmero de alunos aprovados por turma
(c) Nvel scio-econmico
(d) Sexo
(e) Gastos com alimentao
(f) Opinio com relao pena de morte
(g) Religio
(h) Valor de um imvel
(i) Conceitos em certa disciplina
(j) Classificao em um concurso
2 - Construa um diagrama de setores, percentual, correspondente aos empregados da ADR Ltda que possui a
seguinte distribuio por rea de trabalho: Diretoria (3 pessoas), Assessoria (6 pessoas), Transporte (18 pessoas),
Administrao (5 pessoas), rea tcnica (15 pessoas) e rea operacional (33 pessoas).
3 - Na administrao de um sistema escolar de certo municpio 70% da despesa vai para o ensino, 12% para a
administrao e manuteno e 18% para rgos auxiliares, encargos fixos e despesas ocasionais. Qual o grfico que
melhor representaria essa situao? Se o valor total da despesa de 10.000 unidades monetrias, qual o valor
gasto com administrao e manuteno?
4 - Os dados a seguir referem-se ao nmero de livros adquiridos, no ano passado, pelos 40 alunos da turma de
Probabilidade e Estatstica:
4
2
1
0
3
1
2
0
2
1
0
2
1
1
0
4
3
2
3
5
8
0
1
6
5
3
2
1
6
4
3
4
3
2
1
0
2
1
0
3
(a) Classifique a varivel.
(b) Organize os dados em uma tabela adequada.
(c) Qual o percentual de alunos que adquiriram menos do que 3 livros?
(d) Qual o percentual de alunos que adquiriram pelo menos 4 livros?
(e) A partir do item (b), quantos livros foram adquiridos pelos 40 alunos?
5- Os dados a seguir foram coletados em um processo de produo de fibras sintticas. Plote um grfico de
disperso (X e Y) e conclua a respeito.
X: Espaamento entre rolos

5,1

5,5

4,8

1,2

1,8

4,2

3,5

1,0

1,5

5,2

Y: Resistncia

11,8

12,8

13,0

13,0

13,5

14,3

14,4

14,6

13,6

12,5

6 - Considere os dados abaixo referentes ao consumo de gua, em m3, de 75 contas da CORSAN:


32 6 22 11 34 40 16 26 23 31 27 10 38 17 13
45 25 50 18 23 35 22 30 14 18 20 13 24 35 29
33 48 20 12 31 39 17 58 19 16 12 21 15 12 20
51 12 19 15 41 29 25 13 23 32 14 27 43 37 21
28 37 26 44
11
53 38
46
17
36
28 49
56 19
11
(a) Organize os dados numa distribuio de frequncias com 9 classes de amplitudes iguais, sendo Li = 6.
(b) A partir da distribuio de frequncias construda no item anterior, determine e interprete: f3; fr4; F5;
(Fr5-Fr2)

Fr6,

7) A tabela abaixo representa os salrios pagos a 100 operrios da empresa Fras-le:


no de salrios mnimos (Xi)
0 2
2 4
4 6
6 8
8 10
Prof. Jorge Matos

no de operrios (fi)
40
30
10
15
5
Estatstica Descritiva

IFRS-Cmpus Farroupilha 20

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica
Determinar:
a) Frequncia Absoluta Acumulada (abaixo de), Frequncia Simples Relativa e Frequncia Simples Acumulada
(abaixo de, e acima de).
b) Quantos operrios ganham at 2 salrios mnimos?
c) Quantos operrios ganham at 6 salrios mnimos?
d) Qual a % de operrios com salrios entre 6 a 8 salrios mnimos?
e) Qual a % de operrios com salrios inferior a 4 salrios mnimos?
f) Calcule a mdia e o desvio-padro salarial.

8- Em certa empresa trabalham 4 analistas de mercado, 2 supervisores, 1 chefe de seo e 1 gerente que ganham,
respectivamente: R$1.300,00; R$1.600,00; R$2.750,00, R$5.000,00. Qual o valor do salrio mdio desses
funcionrios? Qual o desvio-padro desses salrios?

9 - Um estudo foi realizado por um professor em trs turmas, obtendo a mdia e o desvio-padro das notas de sua
disciplina, conforme abaixo. Qual a turma apresenta menor variabilidade (mais homognea)? Justifique
adequadamente.
Turma
Mdia
Desvio-padro

A
6,5
2,2

B
8,0
1,7

C
8,0
2,0

10 - Os operrios de um setor industrial tm, em julho, um salrio mdio de 5 salrios mnimos (s.m.) e desviopadro de 2 s.m. Um acordo coletivo prev, para agosto, um aumento de 60%, mais uma parte fixa correspondente a
0,7 s.m. Qual a mdia do nmero de salrios mnimos e qual o desvio-padro em agosto?

11 - A nota mdia dos alunos de uma classe foi 7,0 e das alunas 9,0. O nmero de alunos era 20 e das alunas 30.
Qual a nota mdia da classe toda?

12 - As notas de estatstica de uma turma esto na tabela seguinte.


Nota
N de alunos

1
2

2
6

3
9

4
12

5
14

6
9

7
5

8
4

9
1

(a) Calcule os valores da mdia, da mediana e da moda dessas notas.


(b) Calcule o valor da varincia dessas notas.

13) Uma amostra de 20 operrios de uma companhia apresentou os seguintes salrios recebidos durante uma certa
semana : R$ 140, 140, 140, 140, 140, 140, 140, 140, 155, 155, 165, 165, 180, 180, 190, 200, 205, 225, 230, 240.
Calcular a mdia, a mediana e a moda para este grupo de salrios.

14 - Considere o polgono de frequncias seguinte:


Salrio Mensal dos Empregados da Empresa
AJK
45
40

Empregados

35
30
25
20
15
10
5
0
450

550

650

750

850

950

1050

1150

1250

1350

Salrios (R$)

(a) Qual o percentual de funcionrios que recebem mais de R$ 700,00 por ms?
Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha 21

Cursos: Engenharia de Controle e Automao/Engenharia Mecnica


Disciplina: Probabilidade e Estatstica
(b) Qual o total de empregados da empresa?
(c) Determine os valores da mdia, da moda e da mediana dos salrios da AJK.
(d) O que voc pode afirmar quanto simetria destes dados? Explique?
(e) Quantos empregados ganham acima de R$ 1.000,00?
15- Durante certo perodo de tempo as taxas de juros, em %, para dez aes foram as que a tabela abaixo registra:
Ao
Taxa

01
2,59

02
2,64

03
2,60

04
2,62

05
2,55

06
2,61

07
2,50

08
2,63

09
2,64

10
2,69

Calcule:
(a) a taxa mdia;
(b) a taxa mediana;
(c) a taxa modal;
(d) o desvio padro das taxas;
(e) o coeficiente de variao das taxas.
16 - Considere o grfico seguinte:
Salrio Mensal dos Empregados da GHT Ltda
45
40

Empregados

35
30
25
20
15
10
5
0

04 - 06 06 - 08

08 - 10

10 - 12

12 - 14

14 - 16

16 - 18

18 - 20

Salrios (unidades monetrias)

(a) Qual a denominao desse grfico?


(b) Qual o intervalo que contm a mediana desses dados?
(c) Quantos desses empregados ganham menos que 12 unidades monetrias de salrio mensal?
(d) Qual o salrio mdio desses empregados? Qual o salrio mediano?
(e) Qual o percentual de empregados que ganha entre 9 e 16 unidades monetrias?

BIBLIOGRAFIA
COSTA NETO, P. L. O. Estatstica. 2. ed. So Paulo: Edgard Blcher, 2002.
DOWING, D.; CLARK, J. Estatstica aplicada. 2. ed. So Paulo: Saraiva, 2003.
FONSECA, J. S.; MARTINS, G. A. Curso de Estatstica. 6. ed. So Paulo: Atlas, 1996.
FREUND, J. E. Estatstica aplicada: economia, administrao e contabilidade. 9. ed. Porto
Alegre: Bookman, 2000.
MONTGOMERY, D. C., RUNGER, G. C., HUBELE, N.F., Estatstica Aplicada
Engenharia. Rio de Janeiro: LTC, 2004.
MORETIN, P. A.; BUSSAB, W. O. Estatstica Bsica. 5. ed. So Paulo: Saraiva, 2005.
TRIOLA, M. F. Introduo Estatstica. 7. ed. Rio de Janeiro: LTC, 1999.

Prof. Jorge Matos

Estatstica Descritiva

IFRS-Cmpus Farroupilha 22

Potrebbero piacerti anche