Sei sulla pagina 1di 196

MÉTODOS QUANTITATIVOS

VOLTADOS PARA PESQUISA


EM CONTABILIDADE
AULA 1
01

ESTATÍSTICA

Definição:
É o conjunto de métodos e processos quantitativos que
servem para estudar, avaliar e conceituar as medidas e
os valores de um determinado fenômeno.

A Estatística é dividida em duas partes:

1º) ESTATÍSTICA DESCRITIVA ou DEDUTIVA


2º) ESTATÍSTICA INDUTIVA ou INFERENCIAL

ESTATÍSTICA DESCRITIVA ou DEDUTIVA (Parte I)

Definição:
Refere-se a organização e descrição dos dados a serem
estudados de uma população.

A Estatística Descritiva é composta pelos seguintes fatores estatísticos:

 Variáveis
 População e Amostra
 Técnicas de Amostragem
 Séries Estatísticas
 Gráficos Estatísticos
 Distribuição de Frequências

Estudaremos cada um deles posteriormente !

ESTATÍSTICA INDUTIVA ou INFERENCIAL (Parte I)

Definição:
Refere-se à análise e interpretação de dados de uma
população,a qual é baseada em amostras de probabilidade
da mesma.
02

A Estatística Indutiva é composta pelos seguintes fatores estatísticos:

 Resultados baseados em Amostras


 Conclusões baseadas em População
 Teorias baseadas em Probabilidade

RESUMO DE ESTATÍSTICA

ESTATÍSTICA

DESCRITIVA INDUTIVA

PROBABILIDADE
POPULAÇÃO

AMOSTRAGEM ANÁLISE DE
RESULTADO
AMOSTRA
HIPÓTES
E
VARIÁVEIS
GRÁFICO
S
TABELA
S
OBS: Para entendermos os fenômenos estudados pela estatística,devemos concei-
tuar primeiramente o conjunto de elementos que fazem parte destes estudo,o
qual chamaremos de POPULAÇÃO.

POPULAÇÃO

Definição:
É o conjunto de todos os elementos e valores que se
pretende estudar, isto é, o que possa ser medido.

Ex: Pessoas; Salários; Objetos, Animais; Etc.

OBS: Portanto, a população é um fenômeno mensurável,pois compreende o


conjunto de todos os dados em observação,sobre os quais queremos obter
uma determinada conclusão.
03

CLASSIFICAÇÃO DA POPULAÇÃO

A classificação da População é dividida em:

1º) População Finita: N ≤ 100.000 (Menor que cem mil elementos)

2º) População Infinita: N ≥ 100.000 (Maior que cem mil elementos)

OBS: Como a quantidade de elementos de cada população possui um valor muito


expressivo, então devemos fragmentá-la em uma pequena porcentagem
para analisarmos e obtermos os seus resultados. Essa pequena porcenta-
gem da população,definiremos como AMOSTRA.

AMOSTRA ( ou Amostragem)

Definição:
É um subconjunto de elementos extraídos de uma população,
mas com um grau de representatividade confiável.

Ex: População =
, , , , , ,

Conjunto de
Amostra = , Maçãs Vermelhas
e de Maçãs Verdes
!

OBS1: Essa representatividade dará confiança a Amostra, resultando assim em


uma probabilidade de acertos muito grande, referente as informações
retiradas da população.

OBS2: Quando estudamos a totalidade de um conjunto populacional, não podemos


mais utilizar o conceito de amostra, para isso,definiremos este estudo como
um CENSO.
04

CENSO x AMOSTRA

Censo: É o estudo de uma população em sua totalidade (100%).

Amostra: É o estudo de um determinado percentual da população.

Portanto: Quando o Censo não consegue atingir a sua totalidade é recorrido a


Amostra para expressar a probabilidade estatística do estudo que
queremos obter.

A forma que será realizada a Amostra é fundamental, pois se os fatores


estatísticos não forem bem claros o processo do estudo será perdido.

FASES DO MÉTODO ESTATÍSTICO

 Para realizar um determinado estudo, devemos estabelecer parâmetros


mensuráveis e seguir uma ordem cronológica dos fatores a serem
estudados:

1º) Definir o Problema :

O que devemos pesquisar exatamente ?

2º) Planejar:

a) Como iremos coletar as informações;


b) Quais são os dados a serem levantados;
c) Qual instrumento será utilizado para a pesquisa(Censo ou Amostra);
d) Cronograma das atividades;
e) Quanto custará a pesquisa ?

3º) Fases Operacionais:

 Desenvolvimento prático do estudo estatístico,o qual é dividido em:

FASE 1 : Coleta de Dados ( Amostragem, Pesquisa e Questionário)


05

 Esta é a fase inicial, a qual determina a Amostra do objeto de estudo, além


da pesquisa e o questionário que serão realizados para a coleta de dados do
processo estatístico.

Portanto, os Dados são um conjunto de informações que constituem os objetos de


estudo estatístico, sendo estes de fundamental importância para a credibilidade
das demais fases.

OBS: As coletas de Dados se dividem em Direta e Indireta!

Coleta de Dados Direta: Quando o estudo é realizado por um pesquisador, de


maneira contínua,periódica ou ocasional.

Coleta de Dados Indireta: Quando o estudo é baseado em dados já pesquisados


e publicado em revistas,jornais,livros,etc.

FASE 2: Apuração dos Dados ( Tabulação,Contagem e Softwares)

 Nesta fase o pesquisador terá uma gama de informações a sua disposição,


as quais deverão ser tabuladas, isto é, processadas e organizadas em
gráficos estáticos ou mapas de análise estatística. Feito esse procedimento,
devemos aplicar os cálculos estatísticos e matemáticos ou ainda utilizar
softwares específicos para obtenção dos resultados.

FASE 3: Apresentação dos Dados ( Tabelas, Gráficos e Planilhas)

 Consiste na utilização de um software para apresentação de tabelas,


gráficos e planilhas que esbocem o resultado da pesquisa.

FASE 4: Análise, Interpretação e Conclusão das Informações

 É a última fase do processo estatístico, a qual deverá processar todas as


informações coletadas, sendo que estas serão interpretadas de forma
analítica, isto é, são analisados minuciosamente os resultados e retiradas
determinadas conclusões que poderão ser utilizadas como tomadas de
decisões ou somente ficam a disposição como fonte de pesquisas futuras.
06

VARIÁVEIS

Definição:
São valores que recebem um tratamento estatístico.

As variáveis se dividem em:

NOMINAL (Ex: Sexo;Religião,Estado Civil, Etc.


 QUALITATIVA
ORDINAL(Ex: Dia da Semana,Mês,Grau de Instrução)

DISCRETA( Ex: Número de Faltas,Irmãos, Etc.)


 QUANTITATIVA
CONTÍNUA ( Ex: Altura, Área, Peso, Volume, Etc)

FONTES DE PESQUISA

Definição:
São as bases de informações do pesquisador, as quais são utilizadas
para fundamentar a pesquisa do estudo estatístico.

CLASSIFICAÇÃO DAS FONTES DE PESQUISA

1º) Primária: O pesquisador realiza as perguntas(pesquisa de campo)


Ex: Questionário(coleta de dados)

2º) Secundária: O pesquisador utiliza outras pesquisas já realizadas.


Ex: Livros, artigos, etc.

3º) Terciária: Direcionam o pesquisador para realizar a pesquisa primária e


secundária.
Ex: Bibliotecas, resumos, etc.
07

EXERCÍCIOS DE FIXAÇÃO

01) De entre os 3000 alunos de uma escola selecionaram-se 30 e inquiriram-se


sobre o programa de televisão preferido. Os resultados obtidos foram os
seguintes:
PROGRAMA PREFERIDO Nº. DE ALUNOS
Telejornal 10
Novelas 12
Cinema 8
Neste conjunto de dados indique:

a) a população_________
b) a amostra.___________

02) Classifique as seguintes variáveis em: (QN) Qualitativa nominal, (QO)


Qualitativa ordinal (QC) Quantitativa contínua, (QD)Quantitativa discreta
a) ( ) Cor dos olhos
b) ( ) Número de filhos de um casal
c) ( ) Peso de um indivíduo
d) ( ) Altura de um indivíduo
e) ( ) Número de alunos de uma escola
f) ( ) Tipo sanguíneo
g) ( ) Posicionamento das empresas no mercado
h) ( ) Fator RH
i) ( ) Sexo
j) ( ) Comprimento de um segmento de reta
k) ( ) Área de um círculo
l) ( ) Raça
m) ( ) Quantidade de livros de uma biblioteca
n) ( ) Escolaridade dos funcionários de uma empresa
o) ( ) Religião
p) ( ) Salário dos empregados de uma empresa
q) ( ) Comprimento dos parafusos produzidos em uma fábrica
r) ( ) Estado civil
s) ( ) O nível socioeconômico dos residentes em um bairro de Ipatinga
t) ( ) Tempo de vida de uma lâmpada
u) ( ) Profissão
v) ( ) Número de ações negociadas diariamente na bolsa de valores
w) ( ) Volume de água contida numa piscina
x) ( ) A classificação dos alunos no último vestibular
08

03) O método aplicado por um Instituto de Pesquisa, nas prévias eleitorais,


pertence ao ramo da:
a) Estatística Descritiva
b) Estatística Indutiva
c) Estatística Aplicada
d) Estatística Geral
e) Estatística Dedutiva

04) Ao nascer,os bebês são pesados e medidos para saber se estão dentro das
tabelas padrão. Estas duas variáveis são:
a) Qualitativas
b) Discretas
c) Contínuas
d) Contínuas e Discretas, respectivamente
e) Quantitativas

05) Parcela da População convenientemente escolhida para representá-la:


a) Variável
b) Rol
c) Dados
d) Amostra
e) Atributo

06) População ou Universo é:


a) Conjunto de Pessoas
b) Conjunto de Indivíduos que apresentam características especiais
c) Conjunto de elementos que apresentam uma característica comum
d) Subconjunto confiável para um estudo qualquer
e) N.D.A

07) Numere a segunda coluna, de acordo com a primeira, e registre a opção


correta:

1) Estudo de números associados a fenômenos.


2) Parte da população observada.
3) Denominação dada a atributos ou a quantidades, que variam quanto à
grandeza.
4) Grupo de indivíduos ou coisas cujas características são estudadas em
forma de um todo, não interessando um elemento em particular.
5) Cada valor observado de uma variável.
09

( ) Amostra a) 5 -1 -4 -3 -2
( ) Estatística b) 2 -3 -4 -1 -5
( ) População c) 3 -1 -4 -2 -5
( ) Variável d) 2 -1 -4 -5 -3
( ) Dado e) 2 -1 -4 -3 -5

GABARITO:

01 a) 3000 b) 30

02 a) QN b) QO c) QC d) QC e) QD f) QN
g) QN h) QN i) QN j) QC k) QC l) QN
m) QD n) QN o) QN p) QN q) QC r) QN
s) QN t) QD u) QN v) QD w) QC x) QN

03 B

04 C

05 D

06 C

07 E
MÉTODOS QUANTITATIVOS
VOLTADOS PARA PESQUISA
EM CONTABILIDADE
AULA 2
10

ESTATÍSTICA DESCRITIVA ou DEDUTIVA (Parte II)

Definição:

Refere-se a organização dos dados a serem estudados de uma população.

Possibilita a construção de planilhas, tabelas e gráficos, os quais serviram como


fatores determinantes para explicações do comportamento das variáveis numa
distribuição estatística, dando assim consistência aos nossos estudos.

OBS: Para obtermos uma análise final da estatística descritiva devemos seguir algumas
etapas, tais como:

1º) Distribuição de Frequência;

2º) Medidas;

3º) Análise.

DISTRIBUIÇÃO DE FREQUÊNCIA

Definição:

É uma série estatística, na qual as variáveis quantitativas são divididas em


classes e categorias, conforme as frequências correspondentes.

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

1º) Relação de Valores (ROL) : É o arranjo dos dados em ordem crescente.

Ex: Seja o ROL: 2,3,4,5,6 ( Esta distribuição esta na ordem crescente)

2º) Amplitude Total (AT): É a diferença entre o maior (>) e o menor (<) valor observado
no ROL.

Ex: 6 – 2 = 4. Portanto, AT = 4

3º) Classes: São as divisões nas variações apresentadas na distribuição de frequência.


11

4º) Frequência Simples (fi):. É o número de observações ocorridas em cada Classe.

5º) Limite de Classes: São os valores extremos de cada classe. São divididos em:

li = Limite inferior
ls = Limite superior

6º) Intervalo de Classes: É um mecanismo de representação das classes,


podendo ser representado das seguintes maneiras:

a) li ___ ls : Todos os valores serão considerados, menos os seus


extremos (li e ls).

b) li __ ls: Todos os seus valores serão considerados.

c) li ls: Todos os valores serão considerados, excluindo o ls.

d) li ls: Todos os valores serão considerados, excluindo o li.

Ex: Seja x Є |N, onde x é o intervalo de classes de { 2,3,4,5,6 }; temos então:

a) li ___ ls ► 2 __6 = { 3,4,5}

b) li __ ls ► 2 __ 6 = {2,3,4,5,6}

c) li __ ls: ► 2 ___6 = {2,3,4,5}

d) li __ ls: ► 2___ 6 = {3,4,5,6}

7º) Ponto Médio (Xi): É o número que representa uma classe.

Fórmula:
Xi = li + ls
2

8º) Números de Classe: . É a quantidade de classes referente a uma


distribuição de frequência.

Fórmula de Sturges:
K = 1 + 3,3.log N ; onde:

K = números de classe
N = números de elementos observados.
12

9º) Tipos de Frequência: São os valores distribuídos em uma tabela de estatística.


Elas podem ser divididas em:

a) Frequência Relativa Simples (fri): É o quociente entre a frequência simples e


o número de elementos observados.

b) Frequência Acumulada Crescente (Fi↓): É a soma das frequências simples


de cada classe com as suas anteriores.

OBS: Para tornarmos o estudo mais didático, usaremos a simbologia (Fac.) ou


invés de (Fi↓), facilitando assim, uma melhora significativa na assimilação
do
conteúdo.

c) Frequência Acumulada Decrescente (Fi ↑) : É a soma das frequências simples


de cada classe com as suas
posteriores.

OBS: Para tornarmos o estudo mais didático, usaremos a simbologia (Fad) ou


invés de (Fi↑),facilitando assim,um melhora significativa na assimilação do
conteúdo.

RESOLUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

Devemos obedecer a ordem dos seguintes critérios:

1º) Fazer o Rol: ( colocar os números na ordem crescente.)

Ex: 15,20,10,11,30,28,10,13,23,19,13,29,19,15,24,17,19,28,24,29,24,25,11,27
Temos então:

ROL= 10,10,11,11,13,13,14,15,15,17,19,19,19,20,22,23,24,24,25,27,
28,28,29,29,30
13

2º) Encontrar a Amplitude Total. (AT)

Temos então: AT = Xmáx – Xmín AT = 30 – 10 AT = 20

3º). Calcular o número de Classes. (Utilizar a fórmula de Sturges: K = 3,3.logN)

Temos então: N = 25 e K = 3,3Log25; logo fica:

K= 3,3.(1,40) K = 4,62 K=5

4º) Calcular a Amplitude do Intervalo de Classe. (h): (Utilizar a fórmula: h = AT)


K
Onde:
AT = Amplitude Total
K = Número de Classes

Logo temos: h = 20 h=4


5

5º) definir os limites de Classe( __ )

 Será obtido através do valor inferior do ROL com um intervalo do valor da


Amplitude Total e sucessivamente; finalizando o limite de classe no valor
superior do ROL.

Como temos o Xmín = 10 e Xmáx = 30 e h = 4 ; então os limites de classe


ficam da seguinte maneira :

10 14

14 18

18 22

22 26

26 30

6º) Calcular o Ponto Médio(Xi): Devemos somar o limite inferior com o limite
superior de cada classe e dividir por 2.

Ex: 10 14 10 + 14 = 24 = 12 e assim sucessivamente.


2 2
14

7º). Devemos calcular a frequência relativa simples (fri) para cada classe,conforme a
seguinte fórmula:

fri = fi onde: fi = frequência simples e


N N = Número de elementos observados

1º Classe: fri = 6 fri = 0,24


25

2º Classe: fri = 4 fri = 0,16 e assim sucessivamente !


25

Devemos calcular a fri (%) em porcentagem, isto é, multiplicamos cada fri por
100%,temos:

1º Classe: 0,24 x 100% = 24%

2º Classe: 0,16 x 100% = 16%

OBS: A ∑fri(%) de todas as classes deverá dar o valor de 100%,caso contrário,os


cálculos estarão errados.

8º). Devemos calcular a frequência acumulada crescente (Fac) e a frequência


acumulada decrescente (Fad) de cada classe, sendo:

Fac: 1º Classe: 6
2º classe: 6 + 4 = 10 e assim por em diante!

Fad: 1º Classe: 25
2º classe: 25 - 6 = 19 e assim por em diante !

9º). Devemos montar a Planilha com todos os dados já apresentados:


15

fi Xi fri fri(%) Fac Fad


10 14 6 12 0,24 24% 6 25
14 18 4 16 0,16 16% 10 19
18 22 4 20 0,16 16% 14 15
22 26 5 24 0,20 20% 19 10
26 30 6 28 0,24 24% 25 4
TOTAL: 25 100%

________________________________\\______________________________

Exercício:

Uma sala de aula possui 30 alunos, sendo que a idade do mais novo é de 18 anos e do
mais velho é 50 anos. Estes alunos estão dispostos em uma tabela, referente a sua
idade, da seguinte maneira: (Utilize log 30= 1,48)

28,25,19,22,44,50,22,25,33,20,
18,19,21,35,48,24,32,26,33,40,
42,22,30,40,45,19,20,25,32,21

1º) Passo: Organizar o ROL de Maneira crescente.

18,19,19,19,20,20,21,21,22,22
22,24,25,25,25,26,28,30,32,32
33,33,35,40,40,42,44,45,48,50

2º) Passo: Encontrar a Amplitude Total (AT);então temos:

AT = Xmáx – Xmín
AT = 50 – 18
AT = 32

3º) Passo: Calcular o número de classes, temos:

K = 3,3.logN , fica:
K = 3,3log30
K = 3,3.(1,48)
K = 4,884
K=5
16

4º) Passo: Calcular a Amplitude do Intervalo (h)

Temos: h = AT h = 32/5 h = 6,4 h=6


K

5º) Passo: Definir os limites de classes, portanto temos:

(18 | 22) ; ( 22| 26) ; (26 | 30) ; ( 30 | 34) ; (34 | 38) ; ( 38 | 42)
(42| 46) ; ( 46 | 50).

6º) Passo: Construir a montagem da distribuição.

Idade fi Xi fri Fri(%) Fac Fad


18 | 22 8
22| 26 7
26 | 30 2
30 | 34 5
34 | 38 1
38 | 42 2
42| 46 3
46 | 50 2
TOTAL 30

7º) Ponto Médio (Xi)

Xi = li + ls Xi = 18 + 22 Xi = 40 Xi = 20
2 2 2 e assim
sucessivamente!

Portanto, temos:

Idade fi Xi fri Fri(%) Fac Fad


18 | 22 8 20
22| 26 7 24
26 | 30 2 28
30 | 34 5 32
34 | 38 1 36
38 | 42 2 40
42| 46 3 44
46 | 50 2 48
TOTAL 30
17

8º) Passo: Calcular a frequência relativa simples (fri),temos:

Fri = fi fri = 8/30 fri = 0,27 (1º classe) e assim por em diante!
N
Calculando fri (%),temos: fri (%) = 0,27 x 100% = 27% . Portanto, temos:

Idade fi Xi fri Fri(%) Fac Fad


18 | 22 8 20 0,27 27%
22| 26 7 24 0,23 23%
26 | 30 2 28 0,06 7%
30 | 34 5 32 0,17 16%
34 | 38 1 36 0,03 3%
38 | 42 2 40 0,06 7%
42| 46 3 44 0,10 10%
46 | 50 2 48 0,06 7%
TOTAL 30 100%

9º) Passo: Calcular a Frequência Acumulada Crescente (Fac) e a frequência


Acumulada Decrescente (Fad).

Fac: 1º Classe: 8
2º classe: 8 + 7 = 15 e assim por em diante!

Fad: 1º Classe: 30
2º classe: 30 - 8 = 22 e assim por em diante!

Portanto, temos:

Idade fi Xi fri Fri(%) Fac Fad


18 | 22 8 20 0,27 27% 8 30
22| 26 7 24 0,23 23% 15 22
26 | 30 2 28 0,06 7% 17 15
30 | 34 5 32 0,17 16% 22 13
34 | 38 1 36 0,03 3% 23 8
38 | 42 2 40 0,06 7% 25 7
42| 46 3 44 0,10 10% 28 5
46 | 50 2 48 0,06 7% 30 2
TOTAL 30 100%
18

CONCLUSÕES DA PESQUISA:

 Metade dos alunos da sala (50%) estão entre 18 à 26 anos.

 Apenas 3% dos alunos da sala estão na faixa etária de 34 a 38 anos.

 73% dos alunos da sala estão abaixo dos 34 anos.


______________________________\\_________________\\______________________
EXERCÍCIOS DE FIXAÇÃO

Responda às questões de 1 a 6, sabendo que log 40 vale aproximadamente 1,6. Foi


feito uma pesquisa em uma sala de aula com 40 alunos, referente ao peso de cada um.
A Tabela abaixo representa esses pesos em kg, desses alunos.Portanto,
responda:

44,5 62 72 72 39,5 41,6 58 73,5


73,5 52,5 40 58,5 42 42 50,4 40
69 58 58 56 42 65 87 47,5
55 55 65 56,5 46,8 65 62 39,5
60 45,7 66,5 63,5 44,5 60 55,9 68
1) De acordo com a fórmula de Sturges, qual o número recomendável de classes
para uma distribuição de frequências contínua?

2) Qual a amplitude total da amostra?

3) Qual a amplitude a ser usada para a distribuição?

4) Qual a amplitude de cada um dos intervalos?

5) Qual o limite inferior da primeira classe?

6) Qual o limite superior da última classe?

07) Preencha a 2º coluna,conforme as respostas apresentadas na 1º coluna:

(A) frequência relativa ( ) É o ponto central de um intervalo de classe.

(B) frequência absoluta ( ) É o valor do extremo superior de um intervalo.

(C) limite de intervalo ( ) Simbologia: f / _f

(D) ponto médio ( ) Número de observações de cada dado.


(E) população observada ( ) Simbologia: _f i
19

Uma escola apresenta as matrículas efetuadas no começo do ano (Mês:Fevereiro) e


no final do ano (Mês: Dezembro) faz uma pesquisa para verificar a permanência dos
alunos em sala de aula. A tabela abaixo apresenta a quantidade de alunos
matriculados em cada série:

SÉRIES FEVEREIRO DEZEMBRO


1º 480 475
2º 458 456
3º 436 430
4º 420 420
TOTAL 1794 1781

As questões 08, 09 e 10 serão baseadas na tabela acima.

08) Qual a taxa de evasão escolar da primeira série?


a) 2,34 %
b) 4,35 %
c) 1,45 %
d) 1,04 %
e) 3,23 %

09) Qual é o coeficiente de evasão escolar, com aproximação a milésimos, da terceira


série?
a) 0,014
b) 0,14
c) 0,14 %
d) 0,013
e)1,3%

10) Qual a taxa de evasão escolar da escola ?


a) 0,75 %
b) 0,71
c) 0,72 %
d) 1,2 %
e) 0,15 %
20

GABARITO

01) 6 classes

02) 47,5

03) 48

04) 8

05) 39,5.

06) 87,5

07) D–C–A–B–E

08) D

09) A

10) C
MÉTODOS QUANTITATIVOS
VOLTADOS PARA PESQUISA
EM CONTABILIDADE
AULA 3
21

MEDIDAS DE POSICIONAMENTO ou POSIÇÃO

Definição:

As Medidas de posicionamento ou de posição são valores estatísticos que


determinam a localização das premissas que estudamos em uma distribuição de
frequência, para análise e conclusão de uma pesquisa. Essas medidas são
classificadas em:

 MEDIDAS DE TENDÊNCIA CENTRAL;


 SEPARATRIZES.

MEDIDAS DE TENDÊNCIA CENTRAL

Definição:

As medidas de tendência central são números que determinam o


posicionamento dos valores presentes na distribuição de frequência.

Elas são divididas em:


 Média Aritmética (X);
 Mediana (Md)
 Moda (Mo)

MÉDIA ARITMÉTICA ( X )

Definição:
É a medida que corresponde ao grau de concentração
dos valores de uma distribuição.
22

FÓRMULAS:

Média aritmética para uma


I) X = ∑Xi II) X = ∑Xi.fi distribuição de frequência.
N N

Ex: Determine a média aritmética da seguinte distribuição numérica:


{ 3,2,7,5,10,8}

SOLUÇÂO:

X = ∑Xi , onde: ∑Xi = 35 e N = 6 ,logo fica:


N
X = 3+2+7+5+10+8 X = 35 X = 5,83
6 6

MEDIANA (Md)

Definição:
É o valor do elemento do meio de uma distribuição,se
“ n” for ímpar, ou é a média dos valores do meio se “n”
for par.

Ex:1 N =7, onde temos: { 2 ,4, 6, 8, 10, 12, 16} Md = 8 ,pois este número é o
valor central !

Ex2: N = 4,onde temos: {2, 4, 6, 8} Md = 5 , pois 4 + 6 = 10 = 5


2 2
23

FÓRMULA DA MEDIANA:

Uma vez descoberta qual a Classe Mediana da Distribuição de Frequências,


restará apenas aplicar a Fórmula da Mediana:

Md = li + Emd - Facant . h e Emd = N


fmd 2

Onde:

li = Limite inferior da classe mediana;


Emd = Elemento mediano;
Facant = Frequência acumulada da classe anterior à classe mediana;
fmd = Frequência simples da classe mediana;
h = Amplitude do intervalo de classe.

Exemplo: Calcular a Md do conjunto abaixo:

Xi fmd

10 |--- 20 2

20 |--- 30 7

30 |--- 40 11

40 |--- 50 20

50 |--- 60 11

60 |--- 70 7

70 |--- 80 2

n=60
24

1o Passo) Calculamos o n e h. Neste caso, temos que n=60.e h = 10

2o Passo) Calculamos (n/2), que será: (60/2)=30, logo temos: Emd = 30

3o Passo) Construiremos a coluna da Facant :

Xi fmd Facant

10 !--- 20 2 2

20 !--- 30 7 9

30 !--- 40 11 20

40 !--- 50 20 40

50 !--- 60 11 51

60 !--- 70 7 58

70 !--- 80 2 60

n=60

4o Passo) Compararemos os valores da Facant com nosso valor de referência


Emd= 30.

Xi fmd Facant

10 |--- 20 2 2  3 é maior ou igual a 30 ? NÃO!

20 |--- 30 7 9  9 é maior ou igual a 30 ? NÃO!

30 |--- 40 11 20  20 é maior ou igual a 30 ? NÃO!

40 |--- 50 20 40  40 é maior ou igual a 30 ? SIM!

50 |--- 60 11 51

60 |--- 70 7 58

70 |--- 80 2 60

n=60

Encontramos a Classe Mediana: (40 |--- 50).


25

Xi Fi Fac

10 |--- 20 2 2

20 |--- 30 7 9

30 |--- 40 11 20  Classe Anterior!

40 |--- 50 20 40  Classe Mediana!

50 |--- 60 11 51

60 |--- 70 7 58

70 |--- 80 2 60

n=60

Temos que: Facant = 20 e fmd = 20

5o Passo) Devemos preencher os dados da distribuição na fórmula da Mediana:

 30  20 
Md = li + Emd - Facant . h Md  40    10 Md = 45
 20 
fmd

OBS: Quando existir uma frequência acumulada exatamente igual a (∑fi) : 2, a


mediana será o limite superior da classe correspondente.

Ex2: Numa pesquisa realizada por um órgão de fiscalização tributária, foi


coletado o seguinte número de reclamações por dia:

RECLAMAÇÕES Fi(dias)
100|---180 8
180|---260 12
260|---340 16
340|---420 10
420|---500 9
500|---580 5
TOTAL 60
1º) Passo: Determinar o elemento mediano(Emd).

Temos: Emd = N/2 Emd = 60/2 Emd = 30º elemento.


26

2º) Passo: Devemos utilizar a tabela de distribuição de frequência para


determinarmos a Facant , para verificar qual classe pertence o Emd.
Portanto,temos:

Classe Reclamações Fi(dias) Facant


1º 100|---180 8 8
+ 3º classe (36 elementos
2º 180|---260 12 20
observados).Portanto, o
3º 260|---340 16 36 Emd Є 3º classe,pois
4º 340|---420 10 46 compreende os elementos
5º 420|---500 9 55 do 21º a 36º

6º 500|--580 5 60

60

3º) Passo: Utilizamos a fórmula da Mediana:

Md = li + Emd - Facant . h; onde:


fmd

li = 260 Md = 260 + 30 - 20 .80 Md = 260 + 10 .80


Emd = 30 16 16
Facant = 20
Md = 260 + 800 Md = 260 + 50 Md = 310
fmd = 16 16
Portanto,ocorreu 310 Reclamações !
h = 80

QUANDO UTILIZAR A MEDIANA ?


 Quando desejarmos obter o ponto que divide a distribuição em partes
iguais;
 Quando existirem valores extremos que afetem de maneira acentuada a
média,
 Quando a variável em estudo for o salário.
27

PROPRIEDADES DA MEDIANA:

A Mediana será, assim como a Média, influenciada pelas quatro operações


básicas da matemática(Adição,Subtração,Multiplicação e Divisão)

1º) Se somarmos todos os elementos de um conjunto por uma constante, a nova


Mediana será (a Mediana anterior) também somada àquela mesma constante;

2º) Se subtrairmos todos os elementos de um conjunto de uma constante, a


nova Mediana será (a Mediana anterior) também subtraída daquela mesma
constante;

3º) Se multiplicarmos todos os elementos de um conjunto por uma constante, a


nova Mediana será (a Mediana anterior) também multiplicada àquela mesma
constante;

4º) Se dividirmos todos os elementos de um conjunto por uma constante, a nova


Mediana será (a Mediana anterior) também dividida por aquela mesma
constante.

MODA (Mo)

Definição:
É a medida que determina o valor de maior frequência na
distribuição, isto é, o valor que mais aparece na distribuição.

Ex: { 3,6,6,6,7,8,8,9,10}; então Mo = 6 ; pois o nº 6 aparece mais vezes


na distribuição.
28

OBS1: Quando dois números aparecem na mesma quantidade em uma


distribuição, teremos então uma distribuição BIMODAL.

Ex: { 3,6,6,6,7,7,7,2}; temos Mo = 6 e Mo = 7

OBS2: Quando não ocorre nenhuma repetição de número na frequência,


teremos uma distribuição AMODAL.

Ex: {2,3,4}; logo Mo = ᴓ ( Conjunto Vazio ! )


li = limite inferior da classe que contém o valor da
moda;
FÓRMULA DA MODA
d1 = Diferença entre o valor da moda com o valor
anterior;

Mo = li + d1 .h ; onde: d2 = Diferença entre o valor da moda com o valor


d1 + d2 posterior;

h = Amplitude do intervalo de classe.

Ex: Utilizando o exercício anterior,temos:

Temos:
Classe Reclamações Fi(dias)
1º 100|---180 8 li = 260 fica: Mo = 260 + 4 . 80
d1 = (16-12) = 4 4+6
2º 180|---260 12
d2 = (16-10) = 6 Mo = 260 + 32
3º 260|---340 16 h = 80 Mo = 292
4º 340|---420 10 Portanto, o dia que houve + reclamações,
tivemos 292 pessoas reclamando.
5º 420|---500 9
6º 500|---580 5

60
29

SEPARATRIZ
Definição:
São os valores que dividem uma distribuição em
partes iguais.
A Separatriz se divide em:

 Quartil;
 Decil;
 Percentil.

QUARTIL
Definição:
É quando a distribuição é dividida em 4(quatro) partes
iguais e cada parte corresponde a 25% dos valores.

Ex: Em uma empresa de contabilidade, temos 16 funcionários,onde os mesmos


ocupam o cargo de Auxiliar Administrativo, Técnico Contábil, Analista
Financeiro e Serviço Gerais.

Quartil !

Com isso, podemos afirmar que 25% dos funcionários ocupam cada cargo
mencionado anteriormente.
30

NOTAÇÃO:

Por extensão do conceito da mediana, podemos dividir um conjunto em 4 partes


iguais. Cada parte representará 25% do conjunto, surgindo assim a designação
de quartil.

Veja a figura abaixo:

Na figura, visualiza-se com facilidade que:


1. O primeiro quartil: o Q1 é um número onde abaixo dele se situam 25% dos
casos e acima, é óbvio, se situam 75%.

2. O segundo quartil: o Q2 = Md, pois abaixo ou acima dele se situam 50% dos
casos.

3. O terceiro quartil: o Q3 é um número onde abaixo dele se situam 75% dos


casos e acima 25%.

Para calcular os três quartis: Q1, Q2 e Q3 de dados não agrupados, o método


mais prático é o de utilizar o princípio do cálculo da mediana para os três quartis.
Na realidade serão calculadas "três medianas" em uma mesma série ordenada.

FÓRMULA: Temos:
Pq = p.n Pq = posição do quartil
q
p = posição desejada

n= quantidade de elementos

q = quartil(4)

OBS: A fórmula usada para o Decil e Percentil é a mesma,somente com a


referência de decil(10) e Percentil (1oo) no denominador.
31

EXERCÍCIO RESOLVIDO:

01) Calcule Q1, Q2 e Q3 para o seguinte conjunto de valores:

A = { 4,1,8,0,11,10,7,8,6,2,9,12 }

1º) Passo: Colocar os valores em ordem (rol),então temos:

A ={ 0,1,2,4,6,7,8,8,9,10,11,12 }

2º) Passo: Calcular a posição do 1º Quartil;

1  12
PQ1   3  posição do 1 quartil
4

OBS1: Valor do 1º Quartil esta na posição 3 !

Posição x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12


0 1 2 4 6 7 8 8 9 10 11 12

OBS2: O valor do 1º Quadril é 2, isto é, o número que corresponde a


25% no Rol é 2.

3º) Passo: Calcular a posição do 2º Quartil;

2  12
PQ 2   6  posição do 2 quartil
4

OBS1: Valor do 2º Quartil esta na posição 6 !

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12


0 1 2 4 6 7 8 8 9 10 11 12
32

OBS2: O número que corresponde a 50% do rol é o valor 7 !

4º) Passo: Calcular a posição do 3° quartil:

3  12
PQ 3   9  posição do 3 quartil
4

OBS1: Valor do 3º Quartil esta na posição 9 !

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12


0 1 2 4 6 7 8 8 9 10 11 12

OBS2: O número que corresponde a 75% do rol é o valor 9 !

DECIL
Definição:
A distribuição é dividida em 10 partes iguais,sendo que a
cada parte corresponde a 10% dos valores.
Temos:

10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

D1 D2 D3 D4 D5 D6 D7 D8 D9 D10

OBS: D1: É o primeiro decil, corresponde à separação dos primeiros 10 % de


elementos da série.

D5: É o quinto decil, coincide com a mediana (D5 = Md).

D9: É o nono decil, corresponde à separação dos últimos 10%


elementos da série.
33

CÁLCULO DE DECIS

1º) Cálculo do Decil para o Rol:

 Os passos são os mesmos que foram utilizados para o cálculo do


quartil para o Rol;

Exemplo: Calcular D1 e D8 do conjunto dado:

A = { 7,12,15,20,2,4,6,18,10,24 }

a) Inicialmente vamos colocar o conjunto em ordem crescente:

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
2 4 6 7 10 12 15 18 20 24

b) Calcular D1

1  n 1  10
PD1    1 ( posição)
10 10

OBS: O valor do D1=2 que corresponde a 10% do Rol

b) Calculo do D8

8  n 8  10
PD8    8 ( posição)
10 10

OBS: O valor do D8=18 que corresponde a 80% do Rol

2º) Cálculo do Decil para tabela sem Intervalo de Classe.:

 Os procedimentos são os mesmos utilizados para o cálculo dos quartís.

Exemplo:

A Tabela retrata a quantidade de filhos dos funcionários de uma pequena


empresa.Calcule então D3 e D7 desta tabela.
34

filhos f fa
0 18 18
1 35 53
2 46 99
3 28 127
4 25 152
5 10 162
6 5 167
7 3 170

f  170

a) Cálculo do D3:
D3 = 3∑ f = 3.170 = 51ª (posição)
10 10
OBS1: A posição do D3 está na 2° classe (fa 53)

OBS2: O valor da variável na segunda classe é 1 filho, que corresponde a


30% da pesquisa. 170-----100%
30%
51------x%

b) Cálculo do D7
D7 = 7∑ f = 7.170 = 119ª (posição)
10 10

OBS1: A posição do D7 está na 4° classe (fa 127)

OBS2: O valor da variável na quarta classe são 3 filhos, que corresponde a


70% da pesquisa. 170-----100%
70%
119------x%
35

3º) Cálculo do Decil para tabela com Intervalo de Classe

 Devemos determinar primeiramente a classe que contém o valor do Decil a


ser calculado pela seguinte expressão:

K∑ f , (Para K = 1,2,3,...,9)
10
Esse termo está localizado numa classe que recebe o nome de classe Decil.
Para o cálculo dos decis, utilizamos técnicas semelhantes às do cálculo dos
quartis.

FÓRMULA DO DECIL
K. K∑ f i _ Fant

Dx = lDx + 10 . hDK

fDK

Sendo:

lDx = Limite inferior da classe de Decil considerado;

Fant = Frequência acumulada da classe anterior à classe de Decil considerado;

hDK = Amplitude do intervalo de classe do Decil considerado;

fDK = Frequência simples da classe do Decil considerado;

hDx = Amplitude do Decil considerado.


36

Exemplo: Calcule os Decis (D1,D2,...),utilizando a tabela abaixo,sendo que a


mesma organiza as estaturas de adolescentes, colhidas durante o período em
que participaram de um acampamento, durante as férias.

Estaturas dos participantes de um acampamento!

i Estaturas (cm) Frequência (fi) Frequência acumulada (Fa)

1 120 ├ 128 6 6

2 128 ├ 136 12 18

3 136 ├ 144 16 34

4 144 ├ 152 13 47

5 152 ├ 160 7 54

  54
OBS: Calculam-se os decis D1, D2, ...D7, ..., de forma semelhante ao

cálculo dos quartis.

a) Primeiro decil (K=1):

1 f i 54
  5,4 (O primeiro Decil pertence à 1º Classe).
10 10

Logo temos:

1. K∑ f i _ Fant

D1 = lD1 + 10 . hDK = 120 + 5,4 –0 .8 = D1= 127,5 cm

fDK 6
37

b) Segundo Decil (K=2):

2 f i 2  54
  10 ,8 (O segundo decil pertence à 2º Classe).
10 10

2. K∑ f i _ Fant

D2 = lD2 + 10 . hDK = 128 + 10,8 – 6 .8 =

fDK 12

D2 = 131,2 cm

 E assim por em diante!

PERCENTIL

O Percentil (ou Centil) dividirá o conjunto em cem partes iguais. Por analogia, já
podemos concluir que a fração do numerador da fórmula para o Primeiro Centil
será (n/100)! E para os demais Percentis, teremos que:

2º Parte = P2 = 2n/100
3º Parte = P3 = 3n/100
E assim por em diante.

OBS: Percentis de ordem 25, 50 e 75 são denominados quartis e, mais


especificamente, primeiro, segundo e terceiro quartis. Os símbolos
usuais são Q1, Q2 e Q3 respectivamente.

OBS2: Percentis de ordem 10, 20, 30 ... 90 são denominados decis e


simbolizados por D1 (primeiro decil), D2 (segundo decil), etc.
38

MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE

Definição:
São os valores que complementam as informações fornecidas
pelas medidas de posição e caracterizam o grau de variação
existentes em um conjunto de valores.
As Medidas de Dispersão se dividem em :

 Amplitude Total (AT);


 Variância (S2);
 Desvio- padrão (S)
 Coeficiente de Variação (CV).

AMPLITUDE TOTAL (AT)

Definição:
Refere-se à diferença entre o maior e o menor valor observado
na Amostra.

FÓRMULA:
AT = X máx - X mín
Exemplo:
A altura de 5 alunos estão entre os seguintes medidas:

B = { 160 cm, 170 cm, 180 cm, 190 cm, 200 cm }


Então, temos:
AT = X máx - X mín
AT = 200cm – 160 cm
AT = 40 cm
Portanto, o intervalo da Amostra corresponde a 40.
39

VARIÂNCIA (S2)

Definição:
Refere-se a dispersão dos valores em uma distribuição,isto é,
determina o quanto esses valores estão distante da própria
média aritmética.
FÓRMULA:
S2 = ∑ ( x - x )2 ou S2 = ∑x2 – (∑x)2
n-1 2
n-1

Onde:
x = Valor da Amostra;
x = Valor médio da Amostra ;
n = Número de elementos observados .

Exemplo:
Em uma Amostra de 5 residências de uma determinada rua, foram
registrados os seguintes números de moradores:

CASA A CASA B CASA C CASA D CASA E

Nº MORADOES 3 6 2 7 2
Com isso, calcule a variância desta pesquisa.
Solução:

1º) x = ∑x 20 = 4 (Valor médio da Amostra);


n 5
2º) Usamos a fórmula:
S2 = ∑ ( x - x )2 , temos:
n-1
40

S2 = (3 - 4)2 + (6 - 4)2 + (2 – 4)2 + (7 - 4)2 + (2 – 4)2 = 1 + 4 + 4 + 9 + 4 =


5-1 4
S2 = 22 S2 = 5,5
4

OBS: O valor da variância é um referencial para analisarmos os elementos


presentes na distribuição.

DESVIO – PADRÃO (S)

Definição:
É o valor que representa um intervalo de valores que estão
dispostos em um distribuição.

FÓRMULA: S = √S2
 Utilizando o exercício anterior, temos:

S = √ 5,5 S = 2,34
OBS1: O valor do desvio-padrão indica a variabilidade dos valores à volta da
Média,em outras palavras,..., “Indica a dispersão dos dados; quanto
mais dispersos, maior o desvio padrão”.

OBS2: Se o desvio-padrão for igual a zero,isso indica que não há variabilidade,


isto é, todos os valores seriam igual a média.

OBS3: Existe uma variável que mede a precisão da média,a qual identificamos
por: Erro-Padrão da Média
FÓRMULA:
S(x) = Sx

n
41

COEFICIENTE DE VARIAÇÃO (CV)


Definição:
É o valor que representa o percentual de valores dispersos em
uma distribuição.
FÓRMULA:
CV = S x 100
x
onde:
CV < 30% Série estatística homogenia e x é representativa.
CV ≥ 30% série estatística heterogênea e Md é representativa.

Ex: Seja o Desvio – padrão (S) no valor de 215 e o ponto médio ( x ) igual a
300, então temos:
Solução:
Cv = 215. 100 = 71,67%
300
Portanto, a Série Estatística é heterogênea.

OBS: O coeficiente de variação é útil para compararmos a variabilidade


(dispersão) de dois conjuntos de dados de ordem de grandezas
Diferentes.

MEDIDAS DE ASSIMETRIA (As)


Definição:
É o coeficiente assimétrico que demonstra o posicionamento
dos valores na distribuição.

Ex: 2| 1| 3 | | 8 | 10 | 4 | 7 | 8 | 9 | 6|

ESQUERDA DIREITA
42

OBS:
 Os valores concentrados à direta da distribuição, são os números
Maiores.

 Os valores concentrados à esquerda da distribuição, são os números


Menores.
FÓRMULA:
As = x - Mo ou As = 3 ( x – Md)
S S
Onde:
As = Medida de Assimetria;
x = Média;
Mo = Moda;
S = Desvio – padrão;
Md = Mediana.

OBS2: Se As = 0, isto implica que a distribuição será simétrica !!!

MEDIDAS DE ACHATAMENTO OU CURTOSE (K)

Definição:
É a medida que proporciona o grau de achatamento de uma
distribuição de valores.

Essas Medidas se dividem em 3 situações:

 Distribuição de Frequência Mesocúrticas;

 Distribuição de Frequência Platicúrticas;

 Distribuição de Frequência Leptocúrticas


43

GRAU DE CURTOSE

Para calcular a medida de achatamento utilizamos o grau de curtose, através do


coeficiente da própria curtose:

FÓRMULA:
K= Q 3 - Q1
2(P90 - P10)
Onde:
Q3 = 3º Quartil
Q1 = 1º Quartil
P90 = 90º Percentil
P10 = 10º Percentil Leptocúrticas

Mesocúrticas

Platicúrticas

Exemplo:
01) ( AFRF-2002.1):

Em um ensaio para o estudo da distribuição de um atributo financeiro (X), foram


examinados 200 itens de natureza contábil do balanço de uma empresa. Esse
exercício produziu a tabela de frequência abaixo. A coluna Classes representa
intervalos de valores de X em reais e a coluna P representa a frequência relativa
acumulada. Não existem observações coincidentes com os extremos das
classes.
44

Classes P(%)
70 |– 90 5
90 |– 110 15
110 |– 130 40
130 |– 150 70
150|– 170 85
170 |– 190 95
190 |- 210 100
Entende-se por curtose de uma distribuição seu grau de achatamento em geral
medido em relação à distribuição normal. Uma medida de curtose é dada pelo
quociente k = Q / (P90-P10), onde Q é a metade da distância interquartílica e
P90 e P10 representam os percentis de 90% e 10%, respectivamente. Assinale
a opção que dá o valor da curtose k para a distribuição de X.
a) 0,263
b) 0,250
c) 0,300
d) 0,242
e) 0,000

Solução:

No enunciado, o elaborador tentou complicar um pouco a compreensão da


fórmula do índice percentílico de Curtose. Além disso, usou Percentis em lugar
de Decis. Todavia, sabemos perfeitamente que Décimo Percentil (P10) é o
mesmo que Primeiro Decil (D1), e que Nonagésimo Percentil (P90) é a mesma
coisa que Nono Decil (D9).

Daí, tudo esclarecido. Usaremos, de fato, para encontrar esta resposta, o


Índice Percentílico de Curtose, exatamente da forma como o conhecemos:

K= Q 3 - Q1
2(P90 - P10)
45

Aproveitaremos que todo esse trabalho de encontrar os Quartis (Q1 e Q3) e os


Decis (D1 e D9) já foram feitos para este mesmo enunciado, e reproduziremos
aqui a resolução desta questão.

Obviamente que todos perceberam que havia um trabalho preliminar a ser


realizado, que era exatamente o de chegarmos à coluna da frequência absoluta
simples – fi.
Como já foi falado exaustivamente sobre este procedimento de usar o Caminho
das Pedras para chegar às frequências desejadas, expomos a seguir o resultado
destas operações e, finalmente, a coluna da fi.

Classes Fac Fi fi

70 – 90 5% 5% 10

90 – 110 15% 10% 20

110 – 130 40% 25% 50

130 – 150 70% 30% 60

150 – 170 85% 15% 30

170 – 190 95% 10% 20

190 – 210 100% 5% 10

Cálculo do Primeiro Quartil – Q1:

1º Passo: Encontraremos n e calcularemos (n/4)


46

Xi fi

70 !--- 90 10

90 !--- 110 20

110 !--- 130 50

130 !--- 150 60

150 !--- 170 30

170 !--- 190 20

190 !--- 210 10

n=200

Temos então: n=200, portanto, (n/4)=50

2º Passo: Construiremos o Fac ( Frequência Acumulada Crescente)

Xi fi fac

70 !--- 90 10 10

90 !--- 110 20 30

110 !--- 130 50 80

130 !--- 150 60 140

150 !--- 170 30 170

170 !--- 190 20 190

190 !--- 210 10 200

n=200
47

3º Passo: Comparamos os valores de Fac com o valor de n/4

Xi fi fac

70 !--- 90 10 10  10 é maior ou igual a 50? NÃO!

90 !--- 110 20 30  30 é maior ou igual a 50? NÃO!

110 !--- 130 50 80  80 é maior ou igual a 50? SIM!

130 !--- 150 60 140

150 !--- 170 30 170

170 !--- 190 20 190

190 !--- 210 10 200

n=200

Como a resposta foi afirmativa na terceira fac, procuramos a classe


correspondente (110 !--- 130) e dizemos que esta será nossa Classe do Primeiro
Quartil.

4º) Passo: Aplicaremos a fórmula do Primeiro Quartil,tomando como referência


a Classe do Q1. Portanto, temos:

 n  
  4   facANT  50  30 
Q1  l inf       h  Q1  110    20  E: Q1=118,0
 fi   50 
 
 
48

Cálculo do Terceiro Quartil: Q3


1º Passo: Devemos calcular 3n/4
Xi fi

70 !--- 90 10

90 !--- 110 20

110 !--- 130 50

130 !--- 150 60

150 !--- 170 30

170 !--- 190 20

190 !--- 210 10

n=200

Temos então: n=200, portanto, (3n/4)=150

2º) Passo: Devemos calcular o Fac

Xi fi fac

70 !--- 90 10 10

90 !--- 110 20 30

110 !--- 130 50 80

130 !--- 150 60 140

150 !--- 170 30 170

170 !--- 190 20 190

190 !--- 210 10 200

n=200
49

3º) Passo: Comparamos os valores da Fac com os valores de 3n/4

Xi fi fac

70 !--- 90 10 10  10 é maior ou igual a 150? NÃO!

90 !--- 110 20 30  30 é maior ou igual a 150? NÃO!

110 !--- 130 50 80  80 é maior ou igual a 150? NÃO!

130 !--- 150 60 140  140 é maior ou igual a 150? NÃO!

150 !--- 170 30 170  170 é maior ou igual a 150? SIM!

170 !--- 190 20 190

190 !--- 210 10 200

n=200

Como a resposta SIM surgiu na fac da quinta classe (150 !--- 170), diremos que
esta será nossa Classe do Terceiro Quartil.

4º) Passo: Usaremos a fórmula do Q3,com os dados da Classe do Q3.

  3n  
  4   facANT 
150  140 
Q3  l inf     h  Q3  150     20
 fi   30
 
 

Logo, temos: Q3=156,6


50

Cálculo do Primeiro Decil (D1)


1º Passo: Devemos calcular n/10
Xi fi

70 !--- 90 10

90 !--- 110 20

110 !--- 130 50

130 !--- 150 60

150 !--- 170 30

170 !--- 190 20

190 !--- 210 10

n=200

Temos: n=200 e, portanto, (n/10)=20

2º) Passo: Devemos calcular o Fac:

Xi fi Fac

70 !--- 90 10 10

90 !--- 110 20 30

110 !--- 130 50 80

130 !--- 150 60 140

150 !--- 170 30 170

170 !--- 190 20 190

190 !--- 210 10 200

n=200
51

3º) Passo: Comparamos os valores do Fac com os valores de n/10.

Xi fi fac

70 !--- 90 10 10  10 é maior ou igual a 20? NÃO!

90 !--- 110 20 30  30 é maior ou igual a 20? SIM!

110 !--- 130 50 80

130 !--- 150 60 140

150 !--- 170 30 170

170 !--- 190 20 190

190 !--- 210 10 200

n=200

Portanto, que a classe correspondente (90 !--- 110) será nossa Classe
do Primeiro Decil!

4º) Passo: Usaremos a fórmula do Primeiro Decil


 n  
  10   facANT  20  10 
D1  l inf  
    h  D1  90    20  E: D1=100,0
 fi  
 20 
 
 

Calculo do Nono Decil (D9):

1º Passo) Devemos calcular (9n/10):


52

Xi fi

70 !--- 90 10

90 !--- 110 20

110 !--- 130 50

130 !--- 150 60

150 !--- 170 30

170 !--- 190 20

190 !--- 210 10

n=200

Portanto,temos: n=200 e (9n/10)=180

2º) Passo: Devemos calcular o Fac

Xi fi Fac

70 !--- 90 10 10

90 !--- 110 20 30

110 !--- 130 50 80

130 !--- 150 60 140

150 !--- 170 30 170

170 !--- 190 20 190

190 !--- 210 10 200

n=200
53

3º) Passo: Comparamos os valores do Fac com os valores do 9n/10.

Xi fi fac

70 !--- 90 10 10  10 é maior ou igual a 180? NÃO!

90 !--- 110 20 30  30 é maior ou igual a 180? NÃO!

110 !--- 130 50 80  80 é maior ou igual a 180? NÃO!

130 !--- 150 60 140  140 é maior ou igual a 180? NÃO!

150 !--- 170 30 170  170 é maior ou igual a 180? NÃO!

170 !--- 190 20 190  190 é maior ou igual a 180? SIM!

190 !--- 210 10 200

n=200

Portanto, que a classe correspondente (170 !--- 190) será nossa Classe do
Nono Decil.

4º) Passo: Usaremos a fórmula do Nono Decil:


  9n  
  10   facANT  180  170 
D9  l inf  
    h  D9  170  
 fi  
 20   20 =: D9 = 80
 
 

Utilizando a fórmula de Curtose,temos:

K= Q 3 - Q1 K= (156,6 – 118) K = 0,242


2(P90 - P10) 2(180 – 100)

Portanto: Letra D
54

EXERCÍCIOS DE FIXAÇÃO

01) Determinar a moda dos seguintes conjuntos:


a) 1, 6, 9, 3, 2, 7, 4 e 11
b) 6, 5, 5, 7, 5, 6, 5, 6, 3, 4 e 5
c) 8, 4, 4, 4, 4, 6, 9, 10, 10, 15, 10, 16 e 10
d) 23, 28, 35, 17, 28, 35, 18, 18, 17, 18, 18, 18, 28, 28 e 18

02) Determinar a mediana dos seguintes conjuntos:


a) 9; 14 ; 2 ; 8; 7; 14; 3; 21; 1
b) 0,02; 0,25; 0,47; 0,01; -0,30; -0.5
c) 1/2 ; 3/4 ; 4/7 ; 5/4 ; -2/3 ; -4/5 ; -1/5 ; 3/8

03) Para os conjuntos abaixo, determinar com aproximação centesimal, as


seguintes medidas:
A= { 0,04 ; 0,18 ; 0,45 ; 1,29 ; 2.35} e
B = {-7/4 ; -1/3 ; 3/5 ; 7/20 ; 1 4/3 }

a) A amplitude (AT)
b) A variância (S2)
c) O desvio padrão (S)
d) O coeficiente de variação. (CV)

04) Dados os seguintes conjuntos de valores:


A = { 1, 3, 7, 9, 10 }
B = {20, 60, 140 ,180, 200}
C = {10, 50, 130, 170 ,190}

Calculando a média e o desvio padrão do conjunto em A, determinar,


através das propriedades, a média e o desvio padrão dos conjuntos em
B e C.
55

Gabarito:
01
a) Amodal
b) 5
c) 4 e 10
d) 18

02
a) 8
b) 0,02
c) 7/16

03
Conjunto A
AT = 2,31
S2 = 0,74
S = 0,86
CV = 99,90%

Conjunto B
AT = 37/12 = 3,08
S2 = 1,03
S = 1,02
CV = 508,01%
04
Observe que o conjunto em B é igual ao conjunto em A multiplicado
por 20 e o conjunto em C é igual ao conjunto em A multiplicado por
20 e subtraído de 10 unidades.Logo,temos:
Conjunto A: X= 6 S = 3,87
Conjunto B: X = 120 S = 77,4
Conjunto C: X = 110 S = 67,4
56

AMOSTRAGEM

Definição:
É a técnica de seleção de uma Amostra, que possibilita o estudo das
características de uma população.

 Para compreendermos melhor o princípio da Amostragem, devemos


estudar a distribuição de valores. Esta distribuição esta dividida em 2
partes fundamentais para estatística,as quais são:

 Distribuição Normal;
 Distribuição Amostral.

DISTRIBUIÇÃO NORMAL

Definição:
É uma distribuição contínua,a qual possui dois parâmetros
estatísticos fundamentais:

1º) Média; (Parâmetro de localização)


2º) Desvio-padrão (Parâmetro de dispersão)

OBS1: A distribuição normal é uma distribuição de probabilidade !

OBS2: Os resultados da probabilidade(posicionamento dos valores),são


obtidos por meio de uma tabela de escore,denominada de Tabela Z.

OBS3: A curva da distribuição normal é conhecida como a Curva de Gauss.


57

Veja: Curva de Gauss

50% 50%

Md = X = Mo

FÓRMULA DA DISTRIBUIÇÃO NORMAL

Z = Valor da tabela Z
Z=X - µ onde:
X = Valor aleatório
σ
µ = Média aritmética

σ = Desvio-padrão

CARACTERÍSTICAS DA CURVA DE GAUSS

 Sua Média, Mediana e Moda são iguais.


 Tem forma de Sino e é simétrica em torno da média.
 A área total sob a curva é de 100%

Fonte: <http://www.tomcoelho.com.br/index.aspx/s/Artigos_Exibir/221/
O_mal_da_mediocridade>
58

TABELA DE DISTRIBUIÇÃO NORMAL


VALORES DE Z
59

OBS1: Desde que a distribuição normal é simétrica, para calcular a área


entre −∞ e z das curvas probabilísticas,devemos somar o valor de
0,5 aos valores da tabela.

OBS2: No caso de valores acima de 3,9 considera-se que o valor é


praticamente 1 pelo que não esta tabelado.

ALGUNS EXEMPLOS DE USO DA TABELA

1º) Exemplo:
Probabilidade de Z ≤ 1,53:
Na interseção da linha 1,5 com a coluna 0,03 há o valor 0,4370. Precisa-se
somar 0,5 porque, conforme visto, a tabela dá valores a partir de zero.
Assim, P( Z ≤ 1,53 ) ≈ 0,4370 + 0,5 = 0,9370.

2º) Exemplo:
Probabilidade de Z ≤ −1,53:
A simetria da curva permite deduzir a fórmula para valores negativos de z:
P( Z ≤ v ) = 1 − P( Z ≤ |v| ) para v < 0
Portanto, P( Z ≤ −1,53 ) ≈ 1 − 0,9370 = 0,0630.

3º) Exemplo:
Probabilidade de −1 ≤ Z ≤ 0,5:
A ideia gráfica permite concluir que é igual à diferença entre os valores
calculados para cada extremo.
P( Z ≤ 0,5 ) = 0,5 + 0,1915 = 0,6915. P( Z ≤ −1 ) = 1 − P( Z ≤ 1 ) =
1 − (0,5 + 0,3413) = 0,1587.
Portanto o resultado é dado por P( −1 ≤ Z ≤ 0,5 ) = 0,6915 − 0,1587 = 0,5328.
60

Ex: Um estudo dos aumentos percentuais dos preços, no atacado de produ-


tos industrializados, mostrou que ha distribuição normal com media de
50% e desvio- padrão de 10%. Qual a porcentagem dos artigos que:
a) Sofreram aumentos superiores a 75%? Resposta: (0,62%)

b) Sofreram aumentos entre 30% e 80%? Resposta: (97,59%)


Solução:
Dados:
µ = 50% (média)
σ = 10% (Desvio-padrão)
X = modificações percentuais de preços (valor aleatório)
a) Superiores a 75%
P (x>75) = P(z > 2,5)
Para: x= 75, Temos: z: x - µ = z: 75 - 50 = z: 25 = 2,5
σ 10 10
Portanto:
P(z > 2,5) = 0,5- 0,4938 = 0,0062 ou 0,62 %

b) Entre 30% e 80%


P ( 30 < x < 80) = P(-2 < z < 3)

Para: x= 30 , Temos: z: x - µ = z: 30 - 50 = z: - 20 = -2
σ 10 10
Para: x= 80, Temos: z: x - µ = z: 80 - 50 = z: 30 = 3
σ 10 10
Portanto:
P(-2 < z < 3) = - 0,4772 –0,4987 = - 0,9759 ou 97,59%
61

Portanto,a representação da curva Gaussiana fica:

0,62% 12% 25% 50% 97,59%

OBS1: Os valores 0,4772 foi retirado da Tabela Z; para Z = 2 !

OBS2: O valor negativo de – 0,4772 e -0,9759 devem ser ignorados!

DISTRIBUIÇÃO AMOSTRAL

Definição:
É a distribuição de probabilidade de uma medida estatística,
baseada em uma amostra aleatória, a qual é determinada o
posicionamento dos valores dentro dos parâmetros da média
e do Desvio-padrão.

OBS: Para estudarmos uma população, necessitamos de uma amostra, a qual


necessita de uma fundamentação específica para validar os seus dados.
Portanto essa validação é reconhecida por Inferências Estatísticas.
62

INFERÊNCIAS ESTATÍSTICAS:

Definição:
É o processo estatístico que se refere-se à possibilidade de
obtermos informações sobre a população por meio de resultados
amostrais.

As Inferências estatísticas são divididas em 2 áreas:

 Os Testes de Hipótese (Veremos mais adiante !)


 Estimação de Parâmetros.

Estimação de Parâmetros:
É o valor retirado diretamente da Amostra para
medir e comprovar a eficácia dos possíveis
resultados da pesquisa.

OBS1: Os parâmetros utilizados na População e na Amostra,são:

População: µ (Média) Amostra: X = Média


ρ 2 (Variância) S2 = Variância

OBS2: A variância Amostral das médias é igual à razão da variância


populacional pelo número de elementos da Amostra. Então temos:

S2x = ρ 2 Nesta fórmula a variância amostral é menor


n que a variância populacional ! S2 < ρ 2
63

DICA:
 Na página 106 do livro a variância populacional esta sendo representada
pela letra σ, para não confundirmos com Desvio-padrão,o qual utiliza a

mesma letra Sigma,trocamos esta pela letra grega (Rho) = ρ.


Então:
σ2 = ρ2 (Variância)

TIPOS DE AMOSTRAGEM

Temos 2 tipos de amostragem com as suas características bem definidas, as


quais se apresentam como:

 Amostragem Probabilística;
 Amostragem Não probabilística;

1º) AMOSTRAGEM PROBABILÍSTICA:

 Todos os elementos da população tem a mesma chance de fazer parte


da Amostra.

Ela se divide em:

a) Aleatória Simples: Escolhe os elementos sem utilizar nenhum critério.

b) Sistemática: Escolhemos os elementos por processo de repetição.

c) Proporcional: Escolhemos os elementos por proporção pré


estabelecida.
64

2º) AMOSTRAGEM NÃO PROBABILÍSTICA

 Os elementos da população são escolhidos de forma aleatória.

Ela se divide em:

a) Por conveniência: Escolhe os elementos, conforme a distribuição mais


favorável e facilitada.

b) Intencional: Escolhemos os elementos, conforme a sua vontade.

c) Por Tráfego: Escolhemos os seus elementos,conforme a


concentração, volume ou tráfego contidos na população.

d) Por Quotas: Escolhemos os seus elementos, seguindo um critério


específico.

CÁLCULO DO TAMANHO DA AMOSTRA

 Para determinarmos um estudo estatístico por meio de uma amostra,


devemos ter uma quantidade mínima de elementos que possibilite
realizar uma cálculo estatístico,o qual dará uma perspectiva confiável ao
resultado apresentado do que queremos pesquisar.Para isso,temos que
utilizar a seguinte fórmula:
 n = Z2.p.q
e2
Onde:
n = Número de indivíduos da Amostra;
Z = Nível de confiança Z;
p = proporção favorável;
q = proporção desfavorável;
e = Erro máximo provável (Erro-padrão)
α = Limite de confiança
65

OBS: Quando não for mencionado em um exercício o valor da


proporção,subentendemos que elas serão iguais,isto é, 50% para
cada lado,logo podemos concluir que p = q, e que p e q = R,onde
temos:
2
n = Z2.R2 n = Z.R
e2 e

OBS: Para aplicarmos esta fórmula,devemos seguir o nível de limite de


confiança para o tamanho de cada Amostra. Estes limites estão
expressos na tabela à seguir:

Limite de Valor Z
Confiança
80% 1,28
90% 1,65
95% 1,96
99% 2,58

OBS: Com as informações sobre o tipo de amostragem e o tamanho da


amostra,podemos fornecer informações extremamente relevantes
para a parte administrativa de uma empresa.
Exemplo:

01) Uma assistente social, deseja saber o tamanho da amostra necessário


para determinar a proporção da população atendida por uma Unidade de
Saúde,a qual pertence ao Município de São José dos Pinhais, região
metropolitana de Curitiba - Pr. Não foi feito um levantamento prévio da
proporção amostral e, portanto, seu valor é desconhecido. Ela quer ter
90% de confiança e estima um o erro máximo de 5% . Quantas pessoas
necessitam ser entrevistadas?
66

SOLUÇÃO:

Dados:
e= 5% = 0,05 (Erro máximo)
α = 90% (Limite de Confiança)
Z = 1,65 (Nível de Confiança,verificar tabela !)
p = q =R = 50% = 0,5 ( Proporção favorável e desfavorável)
n=? (Nº de Indivíduos da amostra)
Temos:
2 2
n = Z.R n = 1,65. 0,5 (16,5)2 = 272,25
e 0,05 n = 272 pessoas

Portanto, precisamos uma Amostra de 272 pessoas para determinar a


proporção da população atendida na Unidade de Saúde. De São José
dos Pinhais.

OBS: Caso a população seja finita,isto é, N< 100.000 elementos,


devemos utilizar a seguinte fórmula:

n = Z2.p.q.N Com N = População !


(N-1).e2 + Z2.p.q
67

EXERCÍCIOS DE FIXAÇÃO

01) Analisando as curvas abaixo marque a resposta correta.

(I) (II) (III)

a) a curva I é simétrica - x > med > mo ;

b) a curva II é assimétrica positiva - mo >  2 > x ;

c) a curva I é simétrica x = med = mo ;

d) a curva III é simétrica positiva x = med = mo ;

e) a curva II e III são aasimétricas: x = med = mo

02) A vida média útil de um aquecedor elétrico é de 1,5 anos, com um desvio –
padrão de 0,3 anos. Se são vendidos 12.000 unidades por uma empresa
fabricante ao mês, quantos aquecedores necessitarão de conserto antes
que expire o período de um ano de garantia ?
a) 510 aquecedores
b) 530 aquecedores
c) 550 aquecedores
d) 570 aquecedores
e) 590 aquecedores
68

03) Um processo industrial produz canos com diâmetro médio de 2 polegadas


e com desvio-padrão de 0,01 polegada. Os canos com diâmetro de mais de
0,03 polegadas acima da média, são considerados defeituosos. Em uma
produção de 10.000 canos, quantos canos estariam com defeito ?
a) 20
b) 27
c) 32
d) 36
e) 44

04) Um pesquisador deseja estimar a proporção de ratos nos quais se


desenvolve um certo tipo de tumor quando submetidos a radiação. Ele
deseja que sua estimativa não se desvie da proporção verdadeira por mais
de 0,02 com uma probabilidade de pelo menos 90%.Portanto,quantos
animais ele precisa examinar para satisfazer essa exigência?
a) 1285
b) 1302
c) 1447
d) 1528
e) 1681

05) Antes de uma eleição, um determinado partido está interessado em


estimar a proporção de eleitores favoráveis a seu candidato. Determine o
tamanho de amostra necessário para que o erro cometido na estimação
seja de, no máximo 0,01, com probabilidade de 80%.
a) 3942 eleitores
b) 4096 eleitores
c) 4595 eleitores
d) 5029 eleitores
e) N.D.A
69

Gabarito:

01 - C
02 - D
03 - B
04 - E
05 - B
MÉTODOS QUANTITATIVOS
VOLTADOS PARA PESQUISA
EM CONTABILIDADE
AULA 4
70

INTERVALO DE CONFIANÇA (IC)

Definição1:
É um intervalo (espaço) estimado de um parâmetro estatístico,o qual
possibilita o cálculo deste parâmetro estatístico desconhecido.

Definição2:
É quando fazemos uma estimativa de um intervalo de valores
possíveis, no qual se admite esteja o parâmetro populacional.

Em outras palavras:
“O intervalo de confiança é um intervalo matemático que
mede a confiabilidade de uma amostra retirada de uma
determinada população.”
Profº Alan Carter Kullack
Exemplo 1:

UTILIZAÇÃO DO INTERVALO DE CONFIANÇA

Utilizamos o intervalo de confiança para os seguintes parâmetros:


 Média;
 Diferença de Médias;
 Proporção;
 Diferença de Proporção;
 Variância;
 Tamanho de uma amostra.
71

REPRESENTAÇÃO GRÁFICA DO I.C.

O gráfico de intervalo de confiança, reproduz uma dimensão bem específica dos


valores a serem considerados na amostra,deixando assim o grau de confiança na
pesquisa mais elevado,isto é, com uma probabilidade de acerto maior.

Fonte:<http://pt.slideshare.net/NathliaMendona1/intervalos-de-confiana>

OBS: Utilizaremos a fórmula:


X – Z. Sx ≤ µ ≤ X + Z. Sx

Portanto,temos que: e = Z. Sx

INTERVALO DE CONFIANÇA DA MÉDIA POPULACIONAL(µ)

Definição:
São os valores retirados da média populacional, os quais podemos
validar para toda população a ser pesquisada, isto é, assim um
intervalo de confiança da própria média.
72

OBS:
Para efetuar a Estimativa de Médias de uma População utiliza-se desvio
padrão da distribuição que constitui a amostra (distribuição amostral), deve-se
levar em consideração se o desvio padrão da população é ou não conhecido.

ERRO-PADRÃO AMOSTRAL PARA A MÉDIA

Ao se obter uma amostra qualquer de tamanho n, calcula-se a média


aritmética populacional. Provavelmente, se uma nova amostra aleatória for
realizada, a média aritmética obtida será diferente daquela da primeira
amostra. A variabilidade das médias é estimada pelo seu erro padrão. Assim,
o erro padrão avalia a precisão do cálculo da média populacional.
O erro padrão é dado pela fórmula:

Sx → Erro padrão
Sx = S S → Desvio padrão
√n , onde: n → Tamanho da amostra
Para uma população conhecida, usaremos a seguinte fórmula:

Sx + S . N -n
√n N-1
OBS1: Quanto melhor a precisão no cálculo da média populacional,
menor será o erro padrão.
OBS2: A amostra e o erro-padrão são grandezas inversamente
proporcionais.
Exemplo:
Numa população obteve-se desvio padrão de 2,64 com uma amostra aleatória
de 60 elementos. Qual o provável erro padrão?
Solução:
73

INTERVALO DE CONFIANÇA PARA MÉDIA AMOSTRAS PEQUENAS(N<30)

Em muitas situações da vida real, o desvio padrão populacional é desconhecido.


Além disso, em função de fatores como tempo e custo, não é prático colher
amostras de tamanho 30 ou mais. Nesse caso, devemos construir intervalos de
confiança com uma distribuição para uma média populacional pequena,como isso
utilizamos a distribuição t de Student.

A DISTRIBUIÇÃO T DE STUDENT

Definição:
Se a distribuição de uma variável aleatória x é aproximadamente
normal e , então a distribuição amostral de é
uma distribuição t de Student, onde:

.
Onde:
t = Distribuição t de student;
X = Variável aleatória;
µ = Média;
S = Desvio Padrão amostral;
n = Número da amostra

Podemos representar a fórmula, da seguinte maneira:

X - t. Sx ≤ µ ≤ X + t. Sx

Portanto, temos:
74

Fonte: < http://slideplayer.com.br/slide/353636/>

Os valores críticos de t são denotados por tc. Diversas propriedades da distribuição t


estão relacionadas a seguir:

 A distribuição t tem a forma de sino e é simétrica em torno da média.


 A distribuição t é uma família de curvas, cada uma delas determinada por um
parâmetro chamado grau de liberdade (g.l). Os graus de liberdade são os números
de escolhas livre deixada após uma amostra estatística tal como ter sido
calculada. Quando se usa uma distribuição t para estimar uma média populacional, o
número de graus de liberdade é igual ao tamanho da amostra menos 1, ou seja, g.l
= n – 1.
 O risco é representado por α ( 1 – nível de confiança)
 A área total sob uma curva t é 1 ou 100%.
 A média, a moda e a mediana da distribuição t são iguais a zero.
 Quando o número de graus de liberdade cresce, a distribuição tende para a
distribuição normal. Após 30 graus de liberdade a distribuição t está muito próxima
da distribuição normal padrão z.
75

TABELA DOS VALORES DA DISTRIBUIÇÃO t DE STUDENT

Fonte: < http://slideplayer.com.br/slide/360340/>


76

ERRO-PADRÃO AMOSTRAL PARA A PROPORÇÃO:

Refere-se ao erro de estimativa de uma proporção, sendo a diferença do resultado


amostral em relação ao populacional para mais ou para menos, o qual aceitamos
em nossa pesquisa, em função do nível de confiança desejado e representado pelo
escore z.

p = Proporção favorável;
Fórmula:
q = Proporção desfavorável;
Sp = p.q Onde:
n n = Amostra;

Sp = Erro-padrão proporcional

Ex: Um instituto de pesquisa revelou,por meio de um estudo que realizou com 300
microempresas paranaenses, que 77% delas estão satisfeitas com os serviços
prestados por seus contadores e as demais estão insatisfeitas. Estime, com 95% de
confiança o intervalo da proporção populacional para aquelas empresas satisfeitas
com seus contadores.

Solução:

Dados: Sp = 77.23 = Sp = 1771


p = 77% 300 300

q = 23% Sp = 2,43 %
n = 300
Sp = ?
77

INTERVALO DE CONFIANÇA PARA A PROPORÇÃO POPULACIONAL

Definição:
Refere-se aos valores máximo e mínimo da proporção populacional.

Fórmula: p – Z. Sp ≤ ¶ ≤ p + Z.Sp

onde: Z = nível de confiança da tabela normal.

Exemplo:
Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobre
sua preferência por determinado produto. Destas 400 pessoas, 240 disseram preferir
o produto. Determinar um intervalo de confiança de 95% de probabilidade para o
percentual de preferência dos consumidores em geral para este produto.

Solução:

Têm-se 1 - α = 95%, então α = 5% e α / 2 = 2,5%. O coeficiente de confiança que


deve ser buscado na normal padrão é valor Zα/2 de Z tal que:

P(Z > Zα/2) = 2,5%, ou então: (-Zα/2) = 2,5%. Este valor vale 1,96.

A estimativa por ponto para a proporção populacional será: p = f/n = 240/400 = 0,60
= 60%.
Logo,devemos calcular o erro-padrão amostral:
Sp = p.q
n

Temos,então: Sp = 60.40 = Sp = 2400 = Sp = 2,45%


400 400
Então o intervalo de confiança de 95% para a proporção populacional será:
78

p – Z. Sp ≤ ¶ ≤ p + Z.Sp
60 – 1,96.2,45 ≤ ¶ ≤ 60 + 1,96.2,45
0,60 - 4,8 ≤ ¶ ≤ ,60 + 4,8 = [55,20%; 64,80%].

Portanto, pode-se afirmar com uma certeza de 95% de que este intervalo conterá a
proporção populacional, isto é, a verdadeira percentagem dos consumidores que
preferem o produto pesquisado.

TESTE DE HIPÓTESE

Definição:
Os testes de hipóteses tem a função de comparar as medidas
obtidas de uma amostra com os dados da população.

OBS: Este teste determina se o valor amostral é correto ou incorreto !

HIPOTESE ESTATÍSTICA

Definição:
É um processo de decisão para avaliar as hipóteses feitas a
respeito de uma determinada população.
Exemplo 1:
Suponhamos que uma indústria compre de certo fabricante parafusos cuja a carga
média de ruptura por tração é especificada em 50 Kg, o desvio-padrão das cargas
de ruptura é suposto ser igual a 4 Kg. O comprador deseja verificar se um grande
lote de parafusos recebidos deve ser considerado satisfatório, no entanto existe
alguma razão para se temer que a carga média de ruptura seja eventualmente
inferior à 50 Kg. Se for superior não preocupa o comprador pois neste caso os
parafusos seriam de melhor qualidade que a especificada. Neste exemplo, a
hipótese do comprador é que a carga média da ruptura é inferior a 50 Kg. O
comprador pode ter o seguinte critério para decidir se compra ou não o lote:
79

Resolve tomar uma amostra aleatória simples de 25 parafusos e submetê-los ao


ensaio de ruptura. Se a carga média de ruptura observada nesta amostra for maior
que 48 Kg ele comprará o lote, caso contrário se recusará a comprar.

CÁCULO DE TESTES DE HIPÓTESE:

Temos 2 hipóteses a serem testadas:


1º) H0 (Hipótese Nula)
2º) H1 (Hipótese Alternativa)

HIPÓTESE NULA (H0):

Definição:
É um valor suposto para um parâmetro.Se os resultados da amostra
não forem muito diferente de H0,ela não poderá ser rejeita.
No exemplo1, temos H0: µ = 50.

HIPÓTESE ALTERNATIVA (H1) :

Definição:
É uma hipótese que contraria a hipótese nula, complementar de H0.
Essa hipótese somente será aceita se os resultados forem muito
diferentes de H0.
No exemplo1, temos H1: µ < 50

ERROS DE DECISÃO

A decisão sobre uma hipótese estatística é um processo de inferência, de modo que


a possibilidade de que erros sejam cometidos é inerente ao processo. Em termos da
decisão sobre uma hipótese H0 existem dois tipos de erro:
80

1. Erro do tipo I: rejeitar a hipótese de nulidade quando ela não deveria


ser rejeitada.

2. Erro do tipo II: falhar na rejeição da hipótese de nulidade quando ela


deveria ser rejeitada.

Evidentemente, decisões corretas podem ser tomadas: não rejeitar quando H0 é a


hipótese adequada e rejeitar quando H1 é a hipótese adequada. A tabela que segue
resume as situações.
DECISÃO DE TOMADA
HIPÓTESE Não Rejeitar Rejeitar
HO Verdadeira Correta Erro Tipo I (α)
HO Falsa Erro Tipo II (β) Correta

OBS: Essa situação é totalmente análoga à decisão de um juiz sobre um réu após
um julgamento, como se pode ver na tabela abaixo. A hipótese de nulidade é o réu é
inocente e a decisão é no sentido de condenar ou não condenar o réu. Observe-se
que o erro do tipo I é o mais importante.

DECISÃO DE TOMADA
HIPÓTESE Não Condenar Condenar
Réu inocente Correta Erro Tipo I (Alfa)
Réu culpado Erro Tipo II ( Beta) Correta

É interessante notar que muitas vezes não há condenação porque as evidências


(provas) não são suficientes para condenação, ou seja, H0 não é rejeitada, mas não
quer dizer necessariamente que a inocência está provada.

Conclusão: Para aplicar um teste de significância, cria-se uma hipótese que,


geralmente, é a de igualdade (hipótese nula). O teste é feito para tentar refutar esta
hipótese. Mas, por erros amostrais (flutuações) pode-se incorrer em erros de tomada
de decisão.
81

OBS1: A probabilidade máxima do erro do tipo I denotada por α, é denominada


nível de significância, tipicamente fixada como um valor pequeno, como
0,1; 0,05 ou 0,01.

OBS2: A probabilidade de se rejeitar H0 quando ela é verdadeira, corresponde

ao nível de significância ( alfa ).

Reforçando a Analogia: Não rejeitar H0 não quer dizer necessariamente que ela é
verdadeira; apenas não há evidências na amostra para a sua rejeição.

RESUMO:

Probabilidade do erro do tipo I (α)


É a probabilidade de que H0 verdadeira seja rejeitada.

Probabilidade do erro do tipo II. (β)

É a probabilidade de que H0 falsa não seja rejeitada.

Observe a figura 1: Serve para demonstrar um teste de hipótese com a média de


uma população.

Fonte: <http://www.portalaction.com.br/inferencia/511-erros-cometidos-nos-
testes-de-hipoteses>

OBS: A Região Crítica(RC), é o conjunto de valores assumidos pela variável


aleatória(θ) ou estatística de testes, para o qual a hipótese nula é rejeita.
Esta região também é conhecida como região de rejeição.
82

Exemplo 1:
Suponha que equipe técnica tenha decidido adotar a seguinte regra:rejeitar Ho se X
for maior que 62.5 kgf e ou menor que 57.5 kgf.
Temos:
Rc  X  62, 5 ou X  57, 5  Região de rejeição de Ho
Rc  Ra  57, 5  X  62,4  Região de aceitação de Ho.
Solução:
Procedimento do Teste:
Se x Є Rc Rejeita -se Ho
Se x Rc Aceita-se Ho
Considerando as hipóteses :
H0:  = 60 contra
H1:  ≠ 60.
  P[ X  62,5 ou X  57,5 / H0   60] ; Sendo X ~ N(60,25 /16).
  P[ X  62,5 / H0   60] + P[X < 57,5 / H0   60]

P X – 60 > 62,5 - 60 + P X - 60 < 57,5 - 60


25/16 25/16 25/16 25/16
P [ Z > 2 ] + P [ Z < -2 ] = 0,02275 + 0,02275 = 0,0445 Temos, então:

Fonte: <http://www.ime.unicamp.br/~hlachos/Inferencia_Hipo1.pdf>
83

PASSOS PARA A CONSTRUÇÃO DE UM TESTE DE HIPÓTESES

Nos itens anteriores foram introduzidos os conceitos básicos e as terminologias que


são aplicados em testes de hipóteses. Um sumário dos principais passos que podem
ser usados sistematicamente para qualquer teste de hipóteses é apresentado aqui,
ou seja:
1º) Fixe a hipótese H0 a ser testada e a alternativa H1;

2º) Use a teoria estatística e as informações disponíveis para decidir qual


estatística (estimador) será usada para testar a hipótese H0, obtendo-se suas
propriedades (distribuição, estimativa, erro padrão);

3º) Fixe a probabilidade  de cometer o erro tipo I e use este valor para construir
a RC (região crítica). Lembre-se que a RC é construída para a estatística
definida no 1º passo , usando os valores hipotetizados por H0;

4º) Use as informações da amostra para calcular o valor da estatística do teste;

5º) Se o valor da estatística calculado com os dados da amostra não pertencer à


RC, não rejeite H0; caso contrário, rejeite H0.

TIPOS DE TESTES DE HIPÓTESES

Estudaremos testes de hipóteses com uma hipótese nula (Ho) e uma hipótese
alternativa (H1). A partir da formulação de Ho e H1, podemos definir o tipo do teste a
ser utilizado. Consideremos  o parâmetro estudado e o ,o valor Inicialmente
suposto para . Se nas hipótese formuladas forem do tipo:
 TESTE BILATERAL:
 TESTE UNILATERAL À DIREITA
 TESTE UNILATERAL À ESQUERDA
84

TESTE BILATERAL

H0 :  = 0
H1 :  = 1

/2
1- /2

-zc zc Z
RC = {Z  zc  ou Z  - zc}

TESTE UNILATERAL À DIREITA TESTE UNILATERAL À ESQUERDA

H0 :  = 0 H0 :  = 
H1 :  = 1 (1 < 0)
H1 :  ≠ 1 (1 > 0)


-ZC  x z
0 xc x
x 0 c
x RC = {Z  - zc }
85

TESTE DE HIPOTESE PARA A MÉDIA POPULACIONAL

Neste caso há interesse em testar a hipótese de que o parâmetro média


populacional () de uma certa variável Quantitativa seja maior, menor ou diferente
de um certo valor. Para a realização deste teste é necessário que uma das duas
condições seja satisfeita:

1º) Supor que a variável de interesse segue uma distribuição normal na população,
isso significa que a distribuição amostral da média também será normal, permitindo
realizar a inferência estatística paramétrica.

2º) A distribuição da variável na população é desconhecida, mas a amostra retirada


desta população é considerada “suficientemente grande” o que, de acordo com o
Teorema Central do Limite, permite concluir que a distribuição amostral da média é
normal. Supõe-se também que a amostra é representativa da população e foi
retirada de forma aleatória.

Tal como na Estimação de Parâmetros por Intervalo existirão diferenças nos testes
dependendo do conhecimento ou não da variância populacional da variável.

A) Se a variância populacional (2) da variável (cuja média populacional queremos

testar) for conhecida. Neste caso a variância amostral da média poderá ser
calculada através da expressão:

V( x) = 2 e, por conseguinte, o “desvio padrão” será S = 


N n
A variável de teste será a variável Z da distribuição normal padrão, lembrando
que:
Z= Valor – Média
Desvio - padrão
86

Podemos representar, esta Fórmula da seguinte maneira:

Onde:
Z = X - 0
X = Média Amostral;
S
n 0 = Média Populacional;
S = Desvio Padrão;

n = Amostra

Compara-se o valor da variável de teste com o valor crítico (Zcrítico que depende do
Nível de Significância adotado) de acordo com o tipo de teste:

Se H1:  > 0 Rejeitar H0 se Z > Zcrítico ( x > x crítico)


Se H1:  < 0 Rejeitar H0 se Z < Zcrítico( x < x crítico)
Se H1:   0 Rejeitar H0 se |Z| |Zcrítico|

B) Se a variância populacional (2) da variável for desconhecida. Naturalmente


este é o caso mais encontrado na prática. Como se deve proceder? Dependerá
do tamanho da amostra.

B1) Grandes amostras (mais de 30 elementos) Nestes casos procede-se como no


item anterior, apenas fazendo com que  = s, ou seja, considerando que o
desvio padrão da variável na população é igual ao desvio padrão da variável
na amostra (suposição razoável para grandes amostras).

B2) Pequenas amostras (até 30 elementos) Nestes casos a aproximação do item


B1 não será viável. Terá que ser feita uma correção na distribuição normal
padrão (Z) através da distribuição t de Student. Trata-se de uma distribuição
de probabilidades que possui média zero (como a distribuição normal padrão,
variável Z), mas sua variância é igual a n/(n-2), ou seja, a variância depende
87

do tamanho da amostra. Quanto maior for o tamanho da amostra mais o quociente


acima se aproxima de 1 (a variância da distribuição normal padrão), e mais a
distribuição t de Student aproxima-se da distribuição normal padrão. A partir de
n=30, já é possível considerar a variância da distribuição t de Student
aproximadamente igual a 1. A variável de teste será então t n-1 (t com n - 1 graus de
liberdade).
Portanto,temos a seguinte Fórmula para representar tal situação:

tcal = X - 0

S
n

Compara-se o valor da variável de teste com o valor crítico (tn-1,crítico que depende
do Nível de Significância adotado) de acordo com o tipo de teste.

Se H1:  > 0 Rejeitar H0 se tn-1 > tn-1,crítico ( x > x crítico)


Se H1:  < 0 Rejeitar H0 se tn-1 < tn-1,crítico ( x < x crítico)
Se H1:   0 Rejeitar H0 se |tn-1| |tn-1,crítico|

OBS: O Zcal ou tcal, deverá estar na área de aceitação,caso contrário, a hipótese é


rejeitada e assim, aceita-se H1.

TESTE DE HIPOTESE PARA A IGUALDADE ENTRE DUAS


MÉDIAS POPULACIONAIS

Há situações em que é necessário verificar a hipótese de existência,com duas


médias obtidas de populações diferentes.
88

As hipóteses são:
H0: µX1 - µX2 = d contra
H1: µX1 - µX2 ≠ d ou µX1 - µX2 > d

ou ainda

µX1 - µX2 < d


Se d = 0, então µX1 - µX2 = 0, isto é, µX1 = µX2.

Como as variâncias são conhecidas, tem-se então que, para n1 e n2 ≥ 30 ou para


amostras extraídas de populações normais, que a variável D = X1 – X2 ,terá uma
distribuição aproximadamente normal com média E(D) = µX1 - µX2 e variância V(D) =
S12 + S22 . A variável teste será, então:
n1 n2

Z cal = (X1 – X2) – d e tcal = X1 – X 2 - d sendo: gl = n1 + n2 - 2


S12 + S22 S12 + S22
n1 n2 n1 n2

Portanto,temos graficamente o teste de hipótese para duas médias:

/2
1- /2

Área de rejeição da Área de aceitação da Área de rejeição da


hipótese Ho. hipótese Ho. hipótese Ho.

Assim fixando o nível de significância “α“, a hipótese nula será rejeitada se:
|z| > zα/2 no teste bilateral;
z > zα, no teste unilateral à direita;
z < zα no teste unilateral à esquerda.
89

Exemplo:
Um fabricante produz dois tipos de pneus. Para o pneu do tipo A o desvio padrão é
de 2500 km e para o pneu do tipo B é de 3.000 km. Uma companhia de táxis testou
50 pneus do tipo A e 40 do tipo B, obtendo 24.000 km de média para o “A” e 26.000
para o tipo “B”. Adotando α = 4% testar a hipótese de que a duração média dos dois
tipos é a mesma.

Solução:

As hipóteses são:
H0: µA - µB = 0 ( µA = µB ) contra
H1: µA - µB ≠ 0 ( µA ≠ µB )
Como α = 4%, então zα/2 = -2,05.

O valor da variável teste será:

z= 24.000 – 26.000 - 0 = - 3,38

2.5002 + 3.0002
50 40

Portanto, rejeita-se a hipótese de igualdade entre as durações médias dos dois tipos
de pneus. Com base nestas amostras, pode-se afirmar, ao nível de 4% de
significância, que os dois tipos de pneus diferem quanto a durabilidade média.

TESTE DE HIPÓTESE PARA A PROPORÇÃO POPULACIONAL

Considere uma população e uma hipótese sobre uma proporção p dessa população:

H0 : p = p0
90

O problema fornece informações sobre H1, que pode ser:

a) H1 : p = p1 p1 > p 0 (teste unilateral à direita)

b) H1 : p = p1 p1 < p 0 (teste unilateral à esquerda)

c) H1 : p > p0 (teste unilateral à direita)

d) H1 : p < p0 (teste unilateral à esquerda)

e) H1 : p  p0 (teste bilateral)

Quando n (tamanho da amostra) é grande;


Potanto, temos:

Fórmula:
p̂  p 0
Z ; sendo p̂ é a proporção da Amostra
p(1  p) / n

Onde:
p̂ = Proporção Amostral;
po = Proporcional Populacional;
n = Amostra
Exemplo:

Um laboratório de vacinas contra febre aftosa reivindicou que ela imuniza 90% dos
animais. Em uma amostra de 200 animais, nos quais foram aplicados a vacina, 160
foram imunizados. Verificar se a declaração do fabricante é verdadeira ao nível de
5%.

Solução:

H0 : p = 0,90 (p0)
H1 : p < 0,90
160
n = 200 p̂  = 0,80  = 0,05
200
p̂  p 0 0,80  0,90
z obs  = = - 4,72
p 0 (1  p 0 ) / n (0,90.0,10) / 200

RC = {Z  -1,65}
91

EXERCÍCIOS DE FIXAÇÃO

01) Fazendo o teste H0: µ = 1150 (σ = 150) contra H1: µ = 1200 (σ = 200) e com n
= 100, estabeleceu-se a seguinte região crítica: RC = [1170, +∞). Determine:
a) Qual a probabilidade α de rejeitar H0 quando verdadeira?
b) Qual a probabilidade β de Aceitar H0 quando H1 é verdadeira?

02) Dados os valores: 4, 6, 3, 6 e 6, de uma amostra aleatória de 5 (cinco)


observações de uma variável X, estime a média e a variância de X e admitindo
que X tenha uma distribuição normal, teste, a 5%, a hipótese de que a média da
população é 1 (um), contra a hipótese alternativa de que é maior do que 1 (um).

03) A associação dos proprietários de indústrias metalúrgicas está preocupada


com o tempo perdido com acidentes de trabalho, cuja média, nos últimos
tempos, tem sido da ordem de 60 homens/hora por ano, com desvio padrão de
20 homens/hora. Tentou-se um programa de prevenção de acidentes e, após o
mesmo, tomou-se uma amostra aleatória de 16 indústrias e verificou-se que o
tempo perdido baixou para 50 homens /hora ano. Você diria que, ao nível de
5% de significância, o programa surtiu efeito?

04) Está-se desconfiado de que a média das receitas municipais, per capita, das
cidades pequenas (menos de 20 mil habitantes) é maior do que a média da
receita estadual que é de 1229 unidades monetárias. Para testar a hipótese é
realizada uma amostragem com 10 pequenas cidades que forneceram os
seguintes resultados (em termos de receitas médias):
1230, 582, 576, 2093, 2621, 1045, 1439, 717, 1838, 1359
Verifique que não é possível rejeitar a hipótese de que as receitas municipais
são iguais as do estado, aos níveis usuais de significância. Como isto se
justifica, já que a média da amostra obtida é bem maior do que a média do
estado!
92

05) Um fabricante garante que 90% das peças que fornece a um cliente estão de
acordo com as especificações exigidas. O exame de uma amostra aleatória de
200 destas peças revelou 25 fora das especificações. Verifique se as níveis de
5% e 1% de significância há exagero na afirmativa do fabricante.

06) Suponha que a experiência tenha mostrado que dos alunos submetidos a
determinado tipo de prova, 20% são reprovados. Se de uma determinada turma
de 100 alunos, são reprovados apenas 13, pode-se concluir, ao nível de
significância de 5%, que estes alunos, são melhores?

07) O rótulo de uma caixa de sementes informa que a taxa de germinação é de


90%. Entretanto, como a data de validade está vencida, acredita-se que a taxa
de germinação seja inferior a este número. Faz-se um experimento e de 400
sementes, tomadas ao acaso, 350 germinam. Qual a conclusão ao nível de 5%
de significância?

08) Diversas políticas, em relação às filiais de uma rede de supermercados, estão


associadas ao gasto médio dos clientes em cada compra. Deseja-se comparar
estes parâmetros de duas novas filiais, através de duas amostras de 50
clientes, selecionados ao acaso, de cada uma das novas filiais. As médias
obtidas foram 62 e 71 unidades monetárias. Supondo que os desvios padrões
sejam idênticos e iguais a 20 um, teste a hipótese de que o gasto médio dos
clientes não é o mesmo nas duas filiais. Utilize uma significância de 2,5%?

09) Num ensaio para testar a proteção de dois tipos de tinta em superfícies
metálicas, 55 painéis foram pintados com a tinta do tipo A e 75 com a tinta do
tipo. Decorridos dois anos de exposição dos painéis ao ar livre, verificou-se que,
dos painéis pintados com tinta A, 6 apresentaram problemas enquanto que dos
75 painéis pintados com tinta B, 19 apresentaram problemas. Pode-se concluir,
destes valores, com 5% de significância, que as duas marcas de tintas diferem
quanto a capacidade de proteção?
93

10) Os salários dos funcionários de uma fábrica de tecidos têm uma distribuição
aproximadamente normal. Para estimar o salário médio desta população, foram
observados os salários de 20 funcionários, obtendo-se x = 850 reais e s = 120
reais. Determine:
a) Um intervalo de confiança de 95% para a média populacional.
b) Um intervalo de confiança de 95% para a variância.
c) Um intervalo de confiança de 95% para o desvio-padrão populacional.

11) Considerando que uma amostra de cem elementos extraída de uma população
aproximadamente normal, cujo desvio padrão é igual a 2, forneceu média de
35,6, construir intervalos de confiança de 90%, 95% e 99% para a média dessa
população.

12) O valor de face dos títulos depositados em um banco para cobrança simples
tem distribuição normal com variância 400 (u.m.)2. Uma amostra de 10 títulos
escolhidos ao acaso forneceu os seguintes valores : 80, 120, 71, 120, 140, 200,
180, 70, 45, 87.

a) Qual é o intervalo de confiança de 90% para o valor médio dos títulos da


carteira?

b) O responsável pela carteira afirma, com 80% de confiança, que o valor médio
dos títulos é de 125. Ele pode estar correto?
94

GABARITO:

01- a) α = P(Rej. H0 / H0 é V) = P( X >1170 /µ = 1150) = P[Z >(1170 - 150)/ 15)]


= P(Z > 1,33) = 9,18%
b) β = P(Ac H0 / H1 é V) = P( X< 1170 / µ = 1200) =P[Z < (1170 - 1200) /20)]=
P(Z < -1,50) = 6,68%

02- x = 5; S2 = 2 ; t = 6,32 > t 5% = 2,132; Portanto rejeita H0

03- Como α = 5%, zα = -1,645 e zc = -2. Rejeita-se H0, isto é, pode-se dizer que
o programa surtiu efeito.

04- Como tc = -0,566, não é possível rejeitar a hipótese aos níveis de 1%, 5% e
mesmo 10%. Isto se justifica devido a grande variabilidade da amostra que
apresenta um desvio padrão igual a 675,82.

05- H0: π = 10% contra H1: π > 10%. Como zc = 1,18.


Logo não se pode rejeitar H0.

06- H0: π = 20% contra H1: π < 20%. Como zc = -1,75 e z5% = -1,645 . Logo
pode-se rejeitar H0.

07- H0: π = 90% contra H1: π < 90%. Como zc = -1,667 e z5% = -1,645 . Logo
pode-se rejeitar H0.

08- H0: 1 µ = 2 µ contra H1: 1 µ ≠ 2 µ . Como α = 2,5%, tα = -2,24 e tc = -2,25.


Rejeitar H0.

09- H0 :π1 = π2 contra H1: :π1 ≠ π2 . Como Zc = 2,20 e z5% = 1,96. Pode-se
afirmar que as duas tintas diferem.
95

10- a) A média populacional dos salários está entre R$ 793,84 e


R$ 906,16 reais.

b) A variância populacional está entre R$ 8.328,26 e R$ 30.717,41 reais.

c) O desvio-padrão populacional está entre R$ 91,26 e R$ 175,26 reais.

P(35,272  X  35,928)  0,90


11- P(35,208  X  35,992)  0,95
P(35,084  X  35,116)  0,99

12- a) P(100 ,93  X  121,67 )  0,90


b) Não. O valor máximo a esse nível de confiança é de 119,40.
MÉTODOS QUANTITATIVOS
VOLTADOS PARA PESQUISA
EM CONTABILIDADE
AULA 5
96

CORRELAÇÃO

Definição:

O termo correlação significa relação em dois sentidos (co +


relação), e é usado em estatística para designar a força que
mantém unidos dois conjuntos de valores.
Exemplos:
Peso x Idade,
Consumo x Renda,
Altura x Peso de um indivíduo.

OBS1: A verificação da existência e do grau de relação entre as variáveis é o


objeto de estudo da correlação.

OBS2: Uma vez caracterizada esta relação, procura-se descrevê-la sob forma
matemática, através de uma função. A estimação dos parâmetros
dessa função matemática é o objeto da regressão.

Os pares de valores das duas variáveis poderão ser colocados num diagrama
cartesiano chamado “diagrama de dispersão”. A vantagem de construir um
diagrama de dispersão está em que, muitas vezes sua simples observação já
nos dá uma ideia bastante boa de como as duas variáveis se relacionam. Uma
medida do grau e do sinal da correlação é dada pela covariância entre as duas
variáveis aleatórias X e Y que é uma medida numérica de associação linear
existente entre elas, e definida por:
Cov(X, Y) = 1 . ∑x.y - ∑x.∑y
n n
É mais conveniente usar para medida de correlação, o coeficiente de
correlação linear de Pearson, como estimador de xy, definido por:
97

rxy = Cov (x,y) = Sxy

σx . σy Sxx . Syy e

Sxx = ∑x2 - (∑x)2 ; Syy = ∑y2 – (∑y)2


n n

sendo:

n = número de pares das observações.

CORRELAÇÃO LINEAR

Definição:

É toda análise de correlação (ρ), a qual utilizamos duas


variáveis quantitativas da amostra, para verificarmos se existe correlação entre
elas. O grau de correlação é sintetizado e conhecido pelo coeficiente de
correlação de Pearson(r).

FÓRMULA:

r= n.∑Xi.Yi – (∑Xi).(∑Yi)

[ n.∑Xi2 – (Xi)2] . [ n.∑Yi2 – (∑Yi)2 ]

Onde:

X = Variável independente;

Y = Variável dependente;

n = Número de elementos observados.


98

OBS: Uma população que tenha duas variáveis não correlacionadas


linearmente pode produzir uma amostra com coeficiente de correlação
diferente de zero. Para testar se a amostra foi ou não retirada de uma
população de coeficiente de correlação não nulo entre duas variáveis,
precisamos saber qual é a distribuição amostral da estatística r.

COEFICIENTE DE RELAÇÃO LINEAR

Definição:
O coeficiente de correlação rxy linear é um número puro que
varia de –1 a +1 e sua interpretação dependerá do valor
numérico e do sinal, como segue:
rxy = -1 Correlação perfeita negativa;

-1 < rxy < 0 Correlação negativa;

rxy = 0 Correlação nula;

0 < rxy < 1 Correlação positiva;

rxy = 1 Correlação perfeita positiva;

0,2 < rxy < 0,4 Correlação fraca;

0,4 < rxy < 0,7 Correlação moderada;

0,7 < rxy < 0,9 Correlação forte;

Resumidamente, temos:

1º) r ≥ 0,5 (forte correlação positiva);

2º) r < 0,5 (fraca correlação positiva);

3º) r ≥ - 0,5 (forte correlação negativa);

4º) r < - 0,5 (fraca correlação negativa).


99

ANÁLISE DO DIAGRAMA DE DISPERSÃO

O diagrama de dispersão mostrará que a correlação será tanto mais forte


quanto mais próximo estiver o coeficiente de –1 ou +1, e será tanto mais fraca
quanto mais próximo o coeficiente estiver de zero.

a) CORRELAÇÃO PERFEITA NEGATIVA (RXY = -1):


Quando os pontos estiverem perfeitamente alinhados, mas em sentido
contrário, a correlação é denominada perfeita negativa.

b) CORRELAÇÃO NEGATIVA (-1 < RXY < 0):


A correlação é considerada negativa quando valores crescentes da variável
X estiverem associados a valores decrescentes da variável Y, ou valores
decrescentes de X associados a valores crescentes de Y.

c) CORRELAÇÃO NULA (RXY = 0):


Quando não houver relação entre as variáveis X e Y, ou seja, quando os
valores de X e Y ocorrerem independentemente, não existe correlação
entre elas.

d) CORRELAÇÃO POSITIVA (0 < RXY < 1):


Será considerada positiva se os valores crescentes de X estiverem
associados a valores crescentes de Y.

e) CORRELAÇÃO PERFEITA POSITIVA (RXY = 1):


A correlação linear perfeita positiva corresponde ao caso anterior, só que
os pontos (X, Y) estão perfeitamente alinhados.

f) CORRELAÇÃO ESPÚRIA:
Quando duas variáveis X e Y forem independentes, o coeficiente de
correlação será nulo. Entretanto, algumas vezes, isto não ocorre, podendo,
assim mesmo, o coeficiente apresentar um valor próximo de –1 ou +1.
Neste caso a correlação é espúria. Algumas situações que podem se
apresentar os diagramas de dispersão.
100

DIAGRAMAS DE DISPERSÃO LINEAR

Fonte: http://www.lugli.com.br/2008/02/diagrama-de-dispersao/

OBS: Se x e y variam em sentidos contrários,existe correlação negativa entre


as variáveis. Essa correlação é tanto maior quanto menor é a dispersão
dos pontos.

Fonte: http://www.lugli.com.br/2008/02/diagrama-de-dispersao/

OBS: Se x cresce e y varia ao acaso,não existe correlação entre as variáveis


ou o que é o mesmo entre elas pé nula.
101

Fonte: http://www.lugli.com.br/2008/02/diagrama-de-dispersao/

r SQUARE

Definição:
Determina o impacto da variável independente do X no
comportamento da variável dependente Y.

OBS: A análise r Square é o resultado do coeficiente de correlação de Pearson


ao quadrado(r2)

Exemplo:
Seja r = 0,92; onde X é o produto derivado do petróleo e Y é o
resíduo deste material,logo podemos deduzir que existe uma forte
correlação positiva entre as duas variáveis(X e Y),pois:

r Square = r2 r Square = (0,92)2 rSquare = 0,8464

Logo podemos deduzir que:

0,8464 x 100% = 84,64 % é referente ao impacto da produção de resíduos,


sendo que o restante (15,36%) retrata outras variáveis que também
determinam esse impacto.
102

CONCLUSÕES FINAIS:

 Correlação não é o mesmo que causa e efeito. Duas variáveis podem


estar altamente correlacionadas e, no entanto, não haver relação de
causa e efeito entre elas.

 Se duas variáveis estiverem amarradas por uma relação de causa e


efeito elas estarão, obrigatoriamente, correlacionadas.

 O estudo de correlação pressupõe que as variáveis X e Y tenham uma


distribuição normal.

 A palavra simples que compõe o nome correlação linear simples, indica


que estão envolvidas no cálculo somente duas variáveis.

 O coeficiente de correlação linear de Pearson mede a correlação em


estatística paramétrica.
103

EXERCÍCIOS DE FIXAÇÃO

01) Para estudar a poluição de um rio, um cientista mediu a concentração de um


determinado composto orgânico (Y) e a precipitação pluviométrica na semana
anterior (X):

X Y
0,91 0,10
1,33 1,10
4,19 3,40
2,68 2,10
1,86 2,60
1,17 1,00

a) Existe alguma relação entre o nível de poluição e a precipitação


pluviométrica? Informa-se que r= 0,89. Teste sua significância, ao nível de
5%. ,

02) Um pesquisador deseja verificar se um instrumento para medir a concentração


de determinada substância no sangue está bem calibrado. Para isto, ele tomou
15 amostras de concentrações conhecidas (X) e determinou a respectiva
concentração através do instrumento (Y), obtendo:

X 2,0 2,0 2,0 4,0 4,0 4,0 6,0 6,0 6,0 8,0 8,0 8,0 10,0 10,0 10,0
Y 2,1 1,8 1,9 4,5 4,2 4,0 6,2 6,0 6,5 8,2 7,8 7,7 9,6 10,0 10,1
Calcule o coeficiente de correlação entre as variáveis X e Y.

03) (AFTN-96) Considere a seguinte tabela, que apresenta valores referentes às


variáveis x e y, porventura relacionadas:
Valores das variáveis x e y relacionadas
X y x2 y2 xy
1 5 1 25 5
2 7 4 49 14
3 12 9 144 36
4 13 16 169 52
5 18 25 324 90
6 20 36 400 120
21 75 91 1.111 317
Marque a opção que representa o coeficiente de correlação linear entre as
variáveis x e y.
a) 0,903 b) 0,926 c) 0,947 d) 0,962 e)0,989
104

GABARITO:

01 – Temos que verificar a significância do coeficiente através da fórmula:


tc = r. n - 2
1 – r2
Fazendo:

tc = 0,89 . 6–2 = 3,86


1 – (0,89)2

Portanto: tc = 3,86. O valor crítico de t para n-2 = 4 graus de liberdade, e 5% de


nível de confiança é 2,78. Como o valor de t é superior ao valor crítico,concluí mos
que X e Y se correlacionam-se.

02- X = 6 e Y = 6,040 e r = 0,996

Cov( X , Y )
03- Devemos utilizar a fórmula: rX ,Y 
S X .S Y
Calculando a Covariância: Cov( x, y )  X .Y  X .Y .

X .Y 
 Xi.Yi  317  52,83 ; X 
 Xi  21  3,5 ;e Y
 Yi  75  12 ,5
n 6 n 6 n 6
Logo: Cov(x,y)=52,83-(3,5).(12,5)  Cov(x,y)=9,08

Calculando as Variâncias de X e de Y:

 
2  91 
S 2 X  X 2  X  S 2 X     3,5  15,16  12 ,25  2,91 e
6
2


2  1111 
S 2Y  Y 2  Y  S 2 Y  
 6 
  12 ,5  185 ,16  156 ,25  28,91
2

Calculando os Desvios Padrões de X e de Y:


S X  S 2 X  SX= 2,91 e

SY  S 2Y  Sy= 28,91

Calculando a Correlação:
Cov( X , Y ) 9,08 9,08 9,08
rX ,Y   rX ,Y     0,989
S X .S Y 2,91. 28,91 84 ,128 9,172

Resposta: 0.989 (letra E)


105

REGRESSÃO LINEAR

Definição:

É o processo estatístico que possui a finalidade de encontrar a


relação linear entre as variáveis aleatórias( dependentes e
independentes ),se a mesmas existirem.

CLASSIFICAÇÃO

As regressões lineares são basicamente divididas em duas:

 Regressão Linear Simples;


 Regressão Linear Múltipla:

REGRESSÃO LINEAR SIMPLES(RLS)

Definição:
É o processo estatístico pelo qual derivamos os parâmetros “a”
e “b” de uma função f (X). Estes parâmetros determinam as características da
função que relaciona ‘Y’ com ‘X’ que no caso do modelo linear se representa
por uma reta chamada de reta de regressão.

 Em outras palavras, podemos supor que X é a variável independente e


Y é a variável dependente, então a sua relação é dada como uma
função linear (função do primeiro grau),isto é:

Sendo: X = x ∈ |R; então temos: Y = f(x) ou y = ax + b (Função 1º grau)

Ex: y = 2x + 3
106

OBS1: A variável X é dita como variável independente ou explicativa.


OBS2: A variável Y é dita como variável dependente ou resposta.
OBS3: A letra a e b na função do 1º Grau, são coeficientes numéricos.

FÓRMULAS:

DESVIO-PADRÃO de X: Sxx = ∑X2 - ( ∑X)2


n

COVARIÂNCIA DE X e Y: Sxy = ∑X.Y - (∑X).(∑Y)


n

PARÂMETRO a: a = Sxy
Sxx

PARÂMETRO b: b = Y – a.X

EQUAÇÃO DA RETA: y = ax + b

Portanto, através das fórmulas anteriores podemos definir a equação que


poderá satisfazer a variável dependente(y). Com isso, podemos obter os
valores necessários para estimar uma pesquisa no tocante ao planejamento
quantitativo de uma determinada produção. Este processo, consegue reduzir
os custos operacionais de uma empresa, diminuindo drasticamente os seus
prejuízos ocasionados pela diminuição ou pelo excesso de produção e todos os
seus gastos envolvidos.
107

Exemplo:
Uma metalúrgica, gera e consegue armazenar anualmente 70
toneladas de resíduos no seu setor de produção.O gerente administrativo
solicitou a um pesquisador contábil, que estimula-se uma produção de 800
toneladas ao ano.
Com isso, o gerente questionou o pesquisador contábil se a empresa
precisaria passar por uma reestruturação física para comportar essa nova
geração de resíduos quando a produção chegasse 800 toneladas de
produção. Através do levantamento obtido e observado pelo pesquisador na
tabela a seguir, obtenha a resposta para o gerente da metalúrgica.

n Xi Yi Xi.Yi Xi2 Yi2


1 251 22
2 260 23
3 263 23
4 265 25
5 270 24
6 275 26
7 300 27
8 312 29
9 333 29
10 345 31

Média

Solução:

1º Passo: Preencher a tabela;sendo Xi = a quantidade(em toneladas) de


produtos produzidos pela metalúrgica e Yi = a quantidade de
resíduos gerados pela empresa em cada período de produção X
108

n Xi Yi Xi.Yi Xi2 Yi2


1 251 22 5522 63001 484
2 260 23 5980 67600 529
3 263 23 6049 69169 529
4 265 25 6625 70225 625
5 270 24 6480 72900 576
6 275 26 7150 75625 676
7 300 27 8100 90000 729
8 312 29 9048 97344 841
9 333 29 9657 110889 841
10 345 31 10695 119025 961
∑ 2874 259 75306 835778 6791
Média 287,4 25,9

2º Passo: Devemos calcular o coeficiente de correlação de Pearson(r):

r= n.∑Xi.Yi – (∑Xi).(∑Yi)

[ n.∑Xi2 – (Xi)2] . [ n.∑Yi2 – (∑Yi)2 ]

r= 10.(75306) – (2874).(259) r= 8694


[ 10. 835778 – ( 2874)2 ] . [ 10.679 – (259)2] 81162416

r = 8694 r = 0,9650328 ou r = 0,97


9009,02

3º Passo: Devemos calcular a equação de r Square, para obtermos o


percentual de impacto da variável X no comportamento da variável
Y. Portanto,este percentual indicará a relação de confiabilidade de
resultado em relação aos resíduos gerados pela metalúrgica.
109

r Square = r2 r Square = (0,9650328)2 = 0,931

Portanto,temos: 0,931 x 100% = 93,1 % (Porcentagem de confiabilidade


referente aos resíduos gerados).

OBS: O restante da porcentagem, isto é, os 6,9 % são considerado outros


fatores que contribuem para outras variáveis.

4º Passo: Usaremos todas as fórmulas necessárias para determinar a


Equação da Reta. (y = ax + b)

a) Sxx = ∑X2 - ( ∑X)2 Sxx = 835778 - (2874)2 Sxx = 9780,4


n 10

b) Sxy = ∑X.Y - (∑X).(∑Y) Sxy = 75306 - (2874).(259) Sxy= 869,4


n 10

c) a = Sxy a = 869,4 a = 0,0888


Sxx 9780,4

d) b = Yi – a. Xi b = 25,9 -0,0888.(287,4) b = 0,3785

e) y = ax + b y = 0,0888.x + 0,3785

5º Passo: Aplicaremos a equação da reta(y = 0,0888x + 0,3785) para obtenção


do valor da variável y, a qual esta vinculada a quantidade de
toneladas geradas em resíduos pela produção de 800 toneladas de
produtos (x).

Temos então:
110

y = 0,0888.x + 0,3785
y = 0,0888.(800) + 0,375
y = 71,42 toneladas de resíduos.

Portanto, o pesquisador contábil orientará o gerente administrativo da


metalúrgica a reestruturar o seu espaço físico,pois terá um excedente de 1,42
toneladas de resíduos a mais que atualmente.

REGRESSÃO LINEAR MÚLTIPLA (RLM)

Definição:
É um conjunto de técnicas estatísticas que servem para
construir modelos que descrevem de maneira razoável relações
entre várias variáveis explicativas ( X ) de um determinado
processo.

Em outras palavras, na RLM, outras variáveis são analisadas, proporcionando


uma conclusão mais precisa sobre a variável em estudo.

REPRESENTAÇÃO DE RLM

y = a + b1.X1 + b2.X2 + ....+ bn.Xn + ɛ

onde:
y = variável dependente;
x = variável independente;
a = parâmetro do modelo de equação;
b= valor de impacto da variável x na variável y

ɛ = Erro aleatório da equação.


111

OBS1: Para facilitarmos os nossos cálculos utilizaremos apenas duas


variáveis independentes,acima deste valores,os cálculos serão
realizados somente por softwares estatísticos,pois os cálculos ficariam
muito trabalhosos.Com isso,temos:

y = a + b1.X1 + b2.X2 + ɛ

OBS2: Podemos representar a fórmula da RLM pelo modelo dos mínimos


quadrados, a qual é expressa da seguinte maneira:

y = α + β1.X1 + β2.X2 + ɛ

OBS3: Ocorre duas mudanças,sendo na representação do valor de impacto e


no parâmetro do modelo da equação, ficando:
b=β e a=α
 Para facilitar o nosso entendimento, estaremos demonstrando as
fórmulas que fazem parte da montagem de uma RLM

FÓRMULAS:
2ª) Sy2 = ∑Y.X2 - ∑Y.∑X2
1ª) Sy1 = ∑(Y.X1) - ∑Y.∑X1 n
n

3ª) Sy11 = ∑X12 - (∑X1)2 4ª) Sx12 = ∑X1.X2 - ∑X1.∑X2

n n

6ª) Sy1 = Sx11 .b1 + Sx12.b2


5ª) Sx22 = ∑x22 - (∑X2)2
Sy2 = Sx12 .b1 + Sx22.b2
n

7ª) a = Y - X1.b1 - X2.b2 8ª) y = a + b1x1 + b2.x2


112

OBS: Se comparar a 6º fórmula com a 1º e 2º fórmula, teremos as seguintes


relações:

9ª) b1 = x22. y1 - x12. y1


x11.x22 - x122

10ª) b2 = x11.y2 - x12.y1


x11.x22 - x122
Exemplo:
Considere os dados da tabela a seguir, como sendo das variáveis:
Y = Quantidade vendida de um produto, X1 = Preço do produto e
X2 = Gasto com a divulgação do produto. Determinar a equação de
regressão de Y em função de X1 e de X2 .

Q(Kg) Preço (R$) Investimento(R$ Mil)


55 100 550
70 90 630
90 80 720
100 70 700
90 70 625
105 70 735
80 70 560
110 65 715
125 60 750
115 60 690
130 55 715
130 50 650

Portanto, montando os parâmetros da regressão linear múltipla, temos:


113

Y X1 X2 Y2 X12 X22 Y.X1 Y.X2 X1.X2


55 100 550 3025 10000 302500 5500 30250 55000
70 90 630 4900 8100 396900 6300 44100 56700
90 80 720 8100 6400 518400 7200 64800 57600
100 70 700 10000 4900 490000 7000 70000 49000
90 70 625 8100 4900 390625 6300 56250 43750
105 70 735 11025 4900 540225 7350 77175 51450
80 70 560 6400 4900 313600 5600 44800 39200
110 65 715 12100 4225 511225 7150 78650 46475
125 60 750 15625 3600 562500 7500 93750 45000
115 60 690 13225 3600 476100 6900 79350 41400
130 55 715 16900 3025 511225 7150 92950 39325
130 50 650 16900 2500 422500 6500 84500 32500

Y X1 X2
100 70 670

e X11 = 2.250 y1 = - 3.550


X22 = 49.000 y2 = 125,75
X12 = - 5.400 yy = 6300
Onde:
α = Y - X1.b1 - X2.b2
α = 100- 70.(-1,3077) - 670(0,1125) = 116,16
α = 116,16

β1 = x22. y1 - x12. y1
x11.x22 - x122

β1 = (49000). (-3550) - (-5400).(125,75) = -1,3077 ou b1 = -1,31


(2250).(49000) - (-5400)2
114

β2 = x11.y2 - x12.y1
x11.x22 - x122

β2 = (2250).(125,75) - (-5400).(-3550) = 0,1125 b2 = 0,1125


(2250).(49000) - (-5400)2

Portanto, a equação procurada é:


y = α + β1x1 + β2.x2
y = 116,16 – 1,31X1 + 0,11X2

Conclusão:
Desta forma, uma redução de R$10 no preço do produto, sem investimento em
publicidade, aumentaria as vendas em aproximadamente 13 kg. Um aumento
na publicidade de 100 mil, sem alteração no preço, aumenta as vendas em 11
kg.

GRÁFICO DE REGRESSÃO LINEAR SIMPLES

Uma regressão linear simples pode ser representada por gráficos lineares, isto
é, a função dada será representada por retas ou pela interseção delas,além
dos pontos aleatórios que ficam em seu entorno .

Exemplo: Os dados abaixo, indicam o valor y do aluguel e a idade x de 5


casas.

x 10 13 5 7 20
y 4 3 6 5 2

Equação de Regressão:
y = 6,87 – 0,261
115

Portanto, o gráfico fica:

Fonte: < www.inf.ufsc.br/~ogliari/.../Analise_de_Regressao_linear_simples.pp>

OBS1: Quando temos apenas uma variável independente, obtemos uma reta
no gráfico;
OBS2 Os pontos próximo da reta, são os valores de Y ,eles indicam os erros
aleatório ocasiona na distribuição.

GRÁFICO DE REGRESSÃO LINEAR MULTIPLA

Um gráfico de regressão linear múltipla, isto é, o qual possui duas ou mais


variáveis independentes, determina uma parábola em sua forma.Podemos
chamar essa função quadrática ou função do 2º Grau.

y = a + b1.X1 + b2.X2 + ɛ
116

Observe o gráfico RLM

Fonte: < www.inf.ufsc.br/~ogliari/.../Analise_de_Regressao_linear_simples.pp>

Esse modelo, embora não seja uma linha reta, continua sendo um modelo
linear nos parâmetros. O método que será discutido para o modelo de
regressão linear simples aplica-se diretamente aos demais modelos lineares
nos parâmetros.
117

EXERCÍCIOS DE FIXAÇÃO

01) Um pesquisador quis constatar a umidade relativa(UR) do ar com a


secagem de sementes de germinação,com isso,utilizou a relação
linear do 1º grau, e obteve com o experimento 4 diferentes valores
em porcentagem (%) para UR,obtendo os seguintes dados:

% UR 20 30 40 50
% Germinação 94 96 95 97

Calcule a porcentagem (%) de germinação esperada quando UR = 45%.

02) Para cada caso abaixo, estime a correspondente reta de regressão:

2
a) n  20,  X  200,  Y  300,  XY  6200,  X  3600.

b) n  36;  X  72; Y  37,  XY  3100;  X 2  620.

03) (BACEN/2006/UFF) Uma empresa.com a finalidade de determinar a


relação entre os gastos anuais em pesquisa e desenvolvimento (X) em
milhares de reais e o acréscimo anula nas vendas(Y),também em milhares de

reais,optou por utilizar o modelo linear simples Yi = α +βXi + ɛi, em que Yi é o

acréscimo nas vendas no ano i, Xi é o Valor gasto em pesquisa e

desenvolvimento no ano i e ɛi é o erro aleatório com respectivas hipóteses

consideradas para RLS (α e β) são parâmetros desconhecidos. Considerou


para o estudo as seguintes informações referente às observações nos últimos
10 anos da empresa.

∑Yi = 160 ∑Xi = 100 ∑XiYi = 1900 ∑Xi2 = 1200 ∑Yi2 = 3060
118

Utilizando a equação da reta obtida pelo método dos mínimos quadrados,


obteve-se para um determinado gasto em pesquisa e desenvolvimento uma
previsão de acréscimo nas vendas no valor de 19 mil reais. O valor que
considerou para o gasto em pesquisa e desenvolvimento, foi de:

a) 14 mil reais
b) 13,25 mil reais
c) 13 mil reais
d) 12,4 mil reais
e) 12 mil reais
119

GABARITO:

01- 95,5 %

02- a) y = -5 + 2x b) y = 6,4 - 11,8x

03- Temos: Sxx =∑X2 - ( ∑X)2 = 1200 - 1002 = 200


n 10
Sxy = ∑X.Y - (∑X).(∑Y) = 1900 - 160.100 = 300
n 10
b = Sxy a = 300 a = 1,5
Sxx 200

a= Y – a X b = 160 - (1,5). 100 = 1


10 10
Desta maneira,obtemos a equação da reta:
y = a + bx y = 1 + 1,5x

Sendo y = 19 mil reais, então temos:


19 = 1,5x + 1 x = 12 mil reais.

Portanto, o valor gasto em pesquisa e desenvolvimento foi de R$ 12.000,00


(Letra E)
120

SÉRIES TEMPORAIS

Definição:

Uma série temporal é uma sequência de observações sobre


uma variável de interesse. A variável é observada em pontos
temporais discretos, usualmente equidistantes, e a análise
de tal comportamento temporal envolve a descrição do
processo ou fenômeno que gera a sequência.

Em outras palavras, podemos afirmar que:

“Série temporal é o conjunto de observações {Y (t), t ∈ T}, Y : variável de interesse,


T: conjunto de índices”

Exemplos de Aplicabilidade de Séries Temporais:

ECONOMIA: Preços diários de ações; taxa de desemprego.


MEDICINA: Níveis de eletrocardiograma ou eletroencefalograma.
EPIDEMIOLOGIA: Casos semanais de sarampo; casos mensais de AIDS.
METEROLOGIA: Temperatura diária; registro de marés,etc.

OBS: A hipótese que fundamenta a análise de séries temporais é que há

um sistema causal mais ou menos constante, relacionado com o tempo,

que exerceu influência sobre os dados no passado e pode continuar a

fazê-lo no futuro.
121

MODELO CLÁSSICO DAS SÉRIES TEMPORAIS

Segundo o modelo clássico todas as séries temporais são compostas de quatro


padrões:

 Tendência
 Cíclicas ou períodos ciclos
 Sazonais ou Sazonalidade
 Estacionalidade

TENDÊNCIA (T)

Definição:

É o comportamento de longo prazo da série, que pode ser causada


pelo crescimento demográfico ou mudança gradual de hábitos de
consumo ou qualquer outro aspecto que afete a variável de
interesse no longo prazo.

 Em outras palavras, podemos afirmar que é o crescimento ou queda de uma


determinada variável observada a um longo prazo.

REPRESENTAÇÃO GRÁFICA DE TENDÊNCIA.

Fonte: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0034-71402006000200003>
122

CÍCLICAS OU PERÍODOS CICLOS (C)

Definição:

São oscilações nos valores de uma variável com duração superior a

um ano, e que se repetem com certa periodicidade, que podem ser

resultado de variações da economia como períodos de crescimento

ou recessão.

 Em outras palavras, podemos afirmar que são variações de crescimento ou


queda de uma determinada variável observada,com duração superior a um
ano.

REPRESENTAÇÃO GRÁFICA DE PERÍODOS CICLOS

Fonte: <http://g1.globo.com/economia/noticia/2013/04/inflacao-faz-copom-elevar-selic-75
-primeira-alta-desde-2011.html>
123

SAZONAIS OU SAZONALIDADE (S)

Definição:
São variações nos valores de uma variável com elevação ou queda
da mesma, com duração inferior ou igual a um ano ,as quais se
repetem todos os anos.

Exemplo: Consumo de energia elétrica de uma residência durante um ano.

REPRESENTAÇÃO GRÁFICA DE SAZONALIDADE

Fonte: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0101-74382002000300004>

ESTACIONALIDADE

Definição:
É quando não ocorre nenhuma oscilação na variável estudada, isto
é, a variável não sofre nenhuma mudança no seu comportamento,
ficando estável,ou melhor dizendo, sem elevação ou queda em
seu valor.
124

REPRESENTAÇÃO GRÁFICA DE ESTACIONALIDADE

5
4,5 Empresa Fictícia:
ARCOM S.A.
4
3,5
3
2,5 Contas a receber
2 Contas a pagar
1,5 Despesas
1
0,5
Valores
0 estipulados em

Fonte: autor

Podemos representar a estacionalidade com uma pequena variação através de um


eixo central.
Veja:
1

0,9

0,8

0,7

0,6

0,5

0,4

0,3

0,2

0,1

0
0 10 20 30 40 50 60 70 80 90 100

Fonte:<file:///C:/Users/seven/Downloads/599-1270-1-SM%20(1).pdf>
125

CLASIFICAÇÃO DAS SÉRIES TEMPORAIS

1. DISCRETA:
T = {t1, t2, . . . , tn}
Ex: Exportações mensais de 2013 a 2014: {01/13, 02/13, .., 11/14, 12/14} .
Notação: Yt

2. CONTÍNUA:
T= {t: t1< t< t2} Ex: Registro do gasto de combustível de um carro durante 1
ano. T = [0, 24] se unidade de tempo é a hora. Notação: Y (t)

3. MULTIVARIADA:
São as observações que podem ser representadas por uma sequência de
valores que possuem duas ou mais funções agregadas.
Notação: Y1(t), . . . , Yk(t), sendo t ∈ T .
Ex: Vendas semanais Y1(t) e gastos com propaganda Y2(t).
Podemos identificar T = {1, 2, . . . , n}

COMPONENTES DAS SÉRIES TEMPORAIS

Definição:
São fatores estatísticos que auxiliam na previsão do comportamento das
variáveis quantitativas. Esta avaliação da variável esta submetida com
os valores assumidos pela mesma durante um determinado período de
tempo, podendo assim analisar e sinalizar um resultado futuro.

Os componentes das séries temporais a serem estudados para possibilitar


previsões de analises de uma variável são:

 Oscilações Sazonal;
 Oscilações de Tendência;
 Oscilações Cíclica;
 Oscilações Aleatória.

126

OSCILAÇÕES SAZONAL

 Representa o movimento de oscilações de curta duração(um ano ou menos)


sobre uma determinada variável em estudo. Esta pequena duração de
tempo, é ocasionado por diversos fatores que influenciam na variação de
sua elevação ou regressão de seu comportamento durante esse período.

Exemplo:
Existem padrões nas vendas de:

 Sorvetes( alta no período do verão e baixa no período do inverno)

 Camiseta Regata (alta no período do verão e baixa no período do inverno)

REPRESENTAÇÃO GRÁFICA DE OSCILAÇÕES SAZONAL

Fonte:<http://rotadosconcursos.com.br/questoes-de-concursos/estatistica-grafico-de-
linhas/132416>
127

OSCILAÇÕES DE TENDÊNCIA

 Representa um movimento evolutivo, aumentando ou diminuindo a


quantidade de determinada variável,podendo ser ascendente ou descente
ao passar do tempo.

 Em outras palavras, podemos afirmar que as oscilações de tendência são as


mudanças que ocorrem a longo prazo no nível médio da série.

OBJETIVOS:

a) Remover a tendência de modo a permitir a análise de outras componentes.


b) Identificar a tendência de modo a utilizá-la como suporte em planejamentos e
decisões.

PRINCIPAIS TIPOS DE TENDÊNCIAS

A forma mais simples de tendência é:


Yt = α + βt + ε
Outras formas de tendências:

Função polinomial: Y = α + β t + β t2 +... β tk + εt

Exemplo:
Vamos supor que os dados a seguir representem a demanda por um
determinado produto nos últimos 20 anos. Analisar a série quanto à
tendência

ANO(X) DEMANDA(Y) ANO(X) DEMANDA(Y)


1º 10 11º 15
2º 12 12º 18
3º 7 13º 20
4º 11 14º 23
5º 11 15º 24
6º 15 16º 21
7º 16 17º 26
8º 12 18º 25
9º 18 19º 28
10° 17 20º 30
128

Adotando o modelo Y = a +bt, e aplicando o método dos mínimos quadrados para


determinar os valores de a (coeficiente linear) e b (coeficiente angular) temos:

Y = 6,9368 + 1,0489 t

GRÁFICO DA OSCILAÇÃO DE TENDÊNCIA

DEMANDA (Y)
35

30

25

20

15 DEMANDA (Y)

10 y = 1.0489x + 6.9368
R2 = 0.9044
5

0
0 5 10 15 20 25
ANO(X)

Fonte: autor

Se desejarmos fazer uma previsão da demanda para o 21º o ano, podemos usar a
linha de tendência (equação de regressão) para fazer essa previsão:

Y = 6,9368+1,0489. (21) = 28,96

OBS: As extrapolações usando modelos de regressão devem ser feitas com


restrições apenas para períodos curtos.
129

OSCILAÇÕES CÍCLICA

 Variações cíclicas são variações periódicas de amplitude superior a um ano.

OBS: As variações da variável ficam intercaladas entre fases de elevação ou


declínio da mesma dentro do período analisado.

REPRESENTAÇÃO GRÁFICA DE OSCILAÇÕES CÍCLICAS

Fonte:<http://pt-br.aia1317.wikia.com/wiki/An%C3%A1lise_Gr%C3%A1fica_-
_Normas_e_Interpreta%C3%A7%C3%A3o>

OSCILAÇÕES ALEATÓRIA

 Representa um movimento aleatório ou randômico, no qual não há como


prever possíveis mudanças de comportamento da variável. Esse fenômeno
ocorre quando há influência naturais,sociais ou econômicas para as quais
não há previsão,tais como:
Seca, greves, crises em outros países, guerras, etc.
130

OBS: Todas as situações que são do âmbito de previsões,fogem de qualquer


estimativa estatística, pois a variável em estudo sofre com muitos fatores
externos, os quais não conseguimos quantificar,impossibilitando uma
análise mais precisa .

REPRESENTAÇÃO GRÁFICA DE OSCILAÇÕES ALEATÓRIAS

Fonte: <http://www.scielo.br/img/revistas/prod/v12n1/html/v12n1a04fig06-08.htm>
131

ANÁLISE DE SÉRIES TEMPORAIS

As séries temporais possuem os seguintes objetivos:

i) Compreender o mecanismo gerador da série;


ii) Prever o comportamento futuro da série.

COMPREENDER O MECANISMO DA SÉRIE POSSIBILITA:

• Descrever efetivamente o comportamento da série;

• Encontrar periodicidades na série;

• Tentar obter razões para o comportamento da série ( possivelmente


através de variáveis auxiliares);

 Controlar a trajetória da série.

PREVER O COMPORTAMENTO FUTURO DA SÉRIE.

 Quando conseguimos prever o futuro das ações contábeis e


administrativas de uma empresa, isto possibilita tomadas de decisões
mais precisas, podendo estabelecer com mínimo de prejuízos ações
financeiras de longo, médio e curto prazo.

OBS: O nível de incerteza da série é quando estamos mais longe do


Futuro; portanto maior será a incerteza da previsão associada, isto é,
quanto mais tempo para prever o comportamento de uma variável,
maior é o erro do resultado que podemos obter pelo seu
comportamento.
132

EXERCÍCIOS DE FIXAÇÃO

01) Classifique as seguintes série em:


DISCRETA, CONTÍNUA ou MULTIVARIADA.

a) Índice diário da bolsa de valores de são Paulo(Bovespa)____________


b) Registro das marés do Porto de Paranaguá(Paraná),durante um período
de 2 meses____________
c) Medida da pressão sanguínea de um paciente durante uma
cirurgia_______________

02) Considere a série temporal(Exportação de soja em unidade de U$ 1.000.000,00


da tabela abaixo.
ANO 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014
EXP. 15 35 41 64 60 62 101 177 333 432

a) A série apresenta tendência ?


b) Determine e faça o gráfico da primeira diferença. Ela é estacionária ?

03) Considere a série temporal(PIB brasileiro em trilhões de reais),dado na tabela a


Seguir:
ANO 2009 2010 2011 2012 2013 2014
PIB 27.614 44.073 63.746 86.171 122.430 161.900

a) Faça o gráfico da série;


b) Verifique se a série apresenta uma tendência linear, através do cálculo da
primeira diferença.
133

GABARITO:

01- a) Discreta b) Contínua c) Discreta e Multivariada

02- a) Sim !

ANO 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014
EXP. 20 6 23 -4 2 39 76 156 99

Os valores são obtidos da seguinte maneira:


1º) 35 - 15 = 20
2º) 41 – 35 = 6
3º) 64 – 41 = 23 e assim por em diante !

EXPORTAÇÃO de SOJA em MILHÕES DE


DÓLARES
180
160
140
120
100
80
60
40
20
0
-20 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014

Pelo diagrama pode-se verificar que a série não é estacionária !


134

3–
a)

PIB Brasileiro em Trilhões de Reais


180000

160000

140000

120000

100000

80000 PIB

60000

40000

20000

0
2009 2010 2011 2012 2013 2014

b) A série não apresenta uma tendência linear,pois a primeira diferença não é


estacionária. Pelo gráfico pode-se perceber que a tendência da série é
exponencial.
MÉTODOS QUANTITATIVOS
VOLTADOS PARA PESQUISA
EM CONTABILIDADE
AULA 6
135

CÁLCULO MATRICIAL

MATRIZ

Definição:
É todo processo matemático que organiza valores numéricos em
uma sequência de linhas e colunas, estabelecendo uma ordem de localização
para cada número. A interação operacional destes números com variáveis gera
um cálculo matricial.
 Em outras palavras, podemos afirmar que o cálculo matricial é oriundo
da interação entre operações básicas da matemática dos valores
numéricos e de letras (variáveis), os quais estão dispostos em linhas e
colunas de uma matriz,a qual podemos chamar de tabela de valores.
Veja:

Seja uma matriz A m x n , onde i = linha, j = coluna e a Є |R(Conjunto

dos Números Reais), temos então:

A m x n = aij ∀m Є |N (Conjunto dos Números Naturais/ |N = 0,1,2,...)


A matriz A m x n é dita como matriz quadrada,pois a quantidade de
linhas e colunas apresentadas são iguais, isto é, m = n

CLASSIFICAÇÃO DAS MATRIZES

Uma matriz pode se apresentar de várias formas, associada na


organização de suas linhas , colunas e características em especial. Devido a
estes fatos, podemos classificar as matrizes em:

 Matriz Linha
 Matriz Coluna
 Matriz Nula
 Matriz Diagonal
 Matriz Triangular
136

 Matriz Transposta
 Matriz Quadrada
 Matriz Identidade.

OBS: O nosso foco de estudo será concentrado na Matriz Quadrada e Matriz


Identidade.

MATRIZ QUADRADA

Para representar uma matriz quadrada,devemos considerar que i = j , isto é,


que a quantidade de linhas seja igual a quantidade de colunas, logo podemos
afirmar que os pares (1,1) ; (2,2) ; (3,3) ; (4,4) ; ...(n,n) pertencem a uma matriz
quadrada. Entretanto,temos o par (0,0) que um caso especial de matriz,ou
melhor dizendo, nenhuma linha e nenhuma coluna representa uma matriz
nula.

OBS: Os valores que devemos considerar para as matrizes quadradas sempre


serão valores inteiros e positivos, é claro, diferente de zero.
Portanto, seja a matriz:

A m x n = A1x1 , dizemos que esta matriz é de ordem 1 ou de 1º ordem;


A m x n = A 2x2 , dizemos que esta matriz é de ordem 2 ou de 2º ordem;
A m x n = A 3x3, dizemos que esta matriz é de ordem 3 ou de 3º ordem;
E assim por em diante.

Visualmente, temos:

A mxn =

Fonte: <http://www.infoescola.com/wp-content/uploads/2013/11/matrizes3.jpg>
137

Para exemplificar o nosso entendimento a respeito de uma matriz quadrada,


temos uma matriz B de ordem 3 da seguinte maneira:

B3x3 = 2 0 -1 ou B3x3 = b11 b12 b13

5 1 3 b21 b22 b23

-6 7 4 b31 b32 b33

Por princípio de igualdade, podemos afirmar que:

b11 = 2 b21 = 5 b31 = - 6

b12 = 0 b22 = 1 b32 = 7

b13 = -1 b23 = 3 b33 = 4

OBS: Os valores dos termos matriciais (bij), poderão assumir valores


negativos ou decimais, mas a ordem matricial (A m x m), somente valores
inteiros e positivos.

MATRIZ IDENTIDADE

É uma matriz quadrada de ordem n sendo que n ≥ 2, onde os elementos que


pertencem à diagonal principal são sempre iguais a 1 e os outros elementos
que não pertencem à diagonal principal são iguais a zero.

Essa matriz possui uma representação, sempre que for indicar uma matriz
identidade pode-se escrever In.

Por exemplo:
Uma matriz identidade de ordem 2, será sempre escrita da seguinte forma:
138

Uma matriz identidade de ordem 3, será sempre escrita da seguinte forma:

1 0 0
I3 = 0 1 0

0 0 1

ÁLGEBRA MATRICIAL

Definição:
É todo cálculo matemático que envolve uma matriz com equações
lineares, formando um sistema de equações algébrico,isto é,equações com as
suas respectivas variáveis. A resolução deste sistema de equações lineares
ocorre através dos cálculos matriciais.

Um sistema de equações lineares pode ser representado por notação algébrica


ou por notação matricial

Considere. por exemplo, o sistema de equações a seguir.

a11X1 + a12X2 + a13X3 = b1


a21X1 + a22X2 + a23X3 = b2
a31X1 + a32X2 + a33X3 = b3

Esse sistema de equações pode ser representado por uma matriz e dois
vetores coluna como segue:

a11 a12 a13 X1 = b1


a21 a22 a23 2
X = b2
a31 a32 a33 X3 = b3
139

Assim, temos na ordem em que aparecem:

• Uma matriz de três linhas e três colunas representando os coeficientes das


variáveis,
• Um vetor coluna de três linhas representando as três variáveis, ou incógnitas:

• Um vetor coluna de três linhas representando as constantes.

Para verificar que a expressão acima é equivalente a anterior basta efetuar a


multiplicação indicada, ou seja, da matriz pelo primeiro vetor coluna. Assim,
temos:

a11X1 + a12X2 + a13X3 b1


a21X1 + a22X2 + a23X3 = b2
a31X1 + a32X2 + a33X3 =
b3

De maneira geral, equações lineares são expressas em forma matricial da


seguinte maneira:

As referidas equações podem ser escritas da seguinte forma resumida:

A.X=B

Onde: A = A matriz dos coeficientes,

X = O vetor coluna das variáveis,

B= O vetor coluna das constantes.


140

Se a álgebra matricial admitisse a operação de divisão nos mesmos moldes


como é utilizada pela álgebra, seria bastante simples obter a solução para a
expressão acima.
Como não é possível a divisão de forma direta em álgebra matricial, é
necessária a existência de um processo que permita obter resultados
semelhantes. Assim, se tivéssemos a expressão:

AB = C
e multiplicássemos ambos os membros dessa expressão por 1/A (inverso de A)
ou A-1
Teríamos: B= 1 x C
A

Dessa forma, com a operação de multiplicação, possível em álgebra matricial,


e com utilização de um termo matricial que possua propriedades semelhantes
ao inverso, torna-se viável a solução da questão. Em álgebra matricial existe
esse termo denominado de inversa, que é notado por um expoente negativo.

Por exemplo:
inversa de A = A -1

A inversa tem a seguinte propriedade:

A . A-1 = 1 ( Matriz Identidade)

Ou seja, a inversa de A multiplicada por A resulta na matriz-identidade


representada por 1. Como demonstramos anteriormente,uma matriz identidade
é uma matriz quadrada (aquela cujo número de linhas é igual ao número de
colunas), que possui o número 1 na diagonal principal e zero no restante.

1 0 0
Exemplo: I3x3 = 0 1 0
0 0 1

Diagonal Principal !
141

Deve-se ressaltar que na multiplicação matricial a matriz-identidade tem


propriedades semelhantes ao número 1 da multiplicação regular. Assim,
qualquer matriz multiplicada por uma matriz-identidade tem, como seu produto,
a matriz original.
Com base no que foi explicado, para resolver a expressão representativa do
caso em estudo, ou seja:
A.X=B

bastaria multiplicar pela inversa ambos os membros da expressão, ou seja:

A-1. AX = A-1 .B resultando em: I.X = A-1.B ou X = A-1.B

Em resumo, para solucionar a nossa questão, que é a de encontrar o valor das


variáveis, bastaria determinar o valor da matriz-inversa dos coeficientes (A) e
multiplicar esse resultado pela matriz das constantes (B).
Entretanto, resta ainda um problema adicional, qual seja o de como determinar
a matriz-inversa, para isso vamos lembra um pouco como realizamos uma
multiplicação entre duas matrizes.

MULTIPLICAÇÃO DE MATRIZES

Para multiplicarmos uma matriz A m x n por outra matriz B r x s, é necessário que o


número de coluna da 1º matriz seja igual ao número de linhas da segunda
matriz,no nosso caso temos:

Condição
A mxn . B r x s ,ou melhor dizendo, n = r Necessária !
!
OBS: Quando efetuamos a multiplicação de duas matrizes,automaticamente o
seu resultado será igual a uma terceira matriz, sendo que esta terá o seu
formato pela quantidade de linhas da 1º matriz e a quantidade de coluna
da 2º matriz.
142

Portanto, temos que:

A mxn . B rxs = C mxs

Exemplo: Sejam A 3x2 e B 2x4 matrizes, então o produto delas gera uma

matriz C da seguinte ordem:

A 3x2 . B 2x4 = C3x 4

PROCEDIMENTO DE MULTIPLICAÇÃO DE DUAS MATRIZES

Como explicamos anteriormente, o resultado da multiplicação de duas matrizes


irá gerar uma terceira matriz. Para que ocorra essa multiplicação dentro das
condições necessárias, devemos efetuar a multiplicação dos membros da linha
da 1º matriz pelos membros da coluna da 2º matriz, onde os elementos devem
ser somados, constituindo um único item posicional da matriz.

 Em outras palavras, linha da 1º matriz multiplica pela coluna da 2º


matriz, de maneira sucessiva. O resultado de cada multiplicação, deverá
ser somado a posição matricial (a11, a12...,)

Exemplo: 2 3 -3 1
Seja as matrizes C 2x2 = 1 5 e D 2x2 = 4 0

Temos: 2 . -3 + 3 . 4 = - 6 + 12 = 6

2.1 + 3.0 = 2 + 0 = 2

1 .-3 + 5 . 4 = -3 + 20 = 17

1.1 + 5.0= 1 + 0 = 1
143

C1 C2

Logo, fica:

6 2 L1

C2x2 . D2x2 = E2x2 = 17 1 L2

Podemos deduzir por demonstração que:

L1.C1 = L1

L2.C2 = L2

MÉTODO ALAN CARTER DE MULTIPLICAÇÃO DE DUAS MATRIZES:

Como a multiplicação de duas matrizes requer muita atenção e paciência, pois


o processo é trabalhoso, o qual possui alguma possibilidade de errar em algum
momento das operações inseridas; é de extrema importância que consigamos
agilizar o processo e evitar a probabilidade de erros que possam ocorrer
durante a operação matricial.Co isso, foi criado o método prof. Alan Carter ou
também conhecido como método da Cruz.
Esse método consiste em multiplicar duas matrizes de maneira direta, sem
precisar de utilizar o processo L.C = L ( Linha x Coluna = Linha). Neste caso, o
posicionamento matricial fica extremamente direcionado, pois anula a
possibilidade de troca do posicionamento dos elementos matriciais. Para que
possamos compreender melhor,utilizaremos o exemplo anterior.

-3 1
Veja: x
4 0

2.(-3) + 3.4 2.1 + 3. 0 = 6 2


2 3
1.(-3) + 5.4 1.1 + 5. 0 17 1
1 5
144

CALCULO DA MATRIZ INVERSA

Para acharmos uma matriz inversa de uma matriz dada, é necessário efetuar a
multiplicação entre essas duas matrizes e igualar a matriz identidade. O cálculo
da matriz inversa somente poderá ser realizado se a matriz dada for de ordem
quadrada, isto é, se a quantidade de linhas for igual a quantidade de colunas.
Além disso, devemos seguir a fórmula da matriz inversa:

Anxn . A-1nxn = I
Para compreendermos melhor,usaremos uma exemplificação para a fórmula
mencionada anteriormente.

Veja:

Seja uma matriz A2x2 = 2 1 , com A-1 = a b


3 0 c d

Onde temos: Anxn . A-1nxn = I 2 1 a b 1 0


3 0 c d = 0 1

Utilizando o método do prof. Alan Carter, temos:

a b
x
c d

2a + 1c 2b + 1d = 2a + c 2b + d
2 1
3a + 0c 3b + 0d 3a 3b
3 0

Como a multiplicação da matriz A pela sua inversa resultou em uma terceira


matriz com várias incógnitas, devemos igualar a matriz encontrada com a
matriz identidade, fazendo uma igualdade entre os cofatores matriciais de cada
matriz nas suas respectivas posições.
145

Portanto, temos:

2a + c 2b + d 1 0
=
3a 3b 0 1

Com isso, obtemos um sistema de equações lineares:

Resolvendo o sistema, temos:


2a + c = 1
3a = 0 a = 0/3 a=0
3a =0
2b + d = 0 2(0) + c = 1 c=1
3b =1 3b = 1 b = 1/3

2(1/3) + d = 0 d = - 2/3

a b 0 1/3
Sendo A-1 = , então a matriz inversa fica: A-1 =
c d 1 - 2/3

SISTEMA LINEAR

Definição:

É toda equação que possuem variáveis e apresenta na seguinte


forma a1x1 + a2x2 + a3x3 + ...+ anxn = b, em que a1, a2, a3, ....., são os coeficientes
reais e o termo independente e representado pelo número real b.

 Em outras palavras, podemos dizer que um conjunto de p equações


lineares com variáveis x1, x2, x3,....,xn formam um sistema linear com p
equações e n incógnitas.
146

Exemplos:

Sistema linear com duas equações e duas variáveis.


x+y=3
x–y=1

Sistema linear com duas equações e três variáveis.


2x + 5y – 6z = 24
x – y + 10z = 30

Sistema linear com três equações e três variáveis.


x + 10y – 12z = 120
4x – 2y – 20z = 60
–x + y + 5z = 10

Sistema linear com três equações e quatro variáveis.


x – y – z + w = 10
2x + 3y + 5z – 2w = 21
4x – 2y – z + w = 16

SOLUÇÃO DE UM SISTEMA LINEAR

Dado o sistema:
x+y=3
x–y=1
Dizemos que a solução deste sistema é o par ordenado (2,1), pois ele satisfaz
as duas equações do sistema linear. Observe:
x=2 e y=1
então:
2+1=3 3=3
2–1=1 1=1
147

Exemplo2:
Dado o sistema:
2x + 2y + 2z = 20
2x – 2y + 2z = 8
2x – 2y – 2z = 0

Podemos dizer que o trio ordenado (5, 3, 2) é solução do sistema, pois ele
satisfaz as três equações do sistema linear.
Veja:

2 . 5 + 2 . 3 + 2 . 2 = 20 10 + 6 + 4 = 20 20 = 20

2.5–2.3+2.2=8 10 – 6 + 4 = 8 8=8

2 .5 – 2 .3 – 2 . 2 = 0 10 – 6 – 4 = 0 0=0

CLASSIFICAÇÃO DE UM SISTEMA LINEAR

Todo sistema linear é classificado de acordo com o número de soluções


apresentadas por ele.
SPD – Sistema Possível e Determinado – possui apenas uma solução.
SPI – Sistema Possível e Indeterminado – possui infinitas soluções.
SI – Sistema Impossível – não possui solução.

Esquematizando o sistema linear, temos:


148

Exemplos:

1º) Um sistema é possível e determinado(SPD), quando apresenta apenas uma


solução para cada variável. Observe:
x +y=8
x–y=4
Neste caso, temos uma solução possível para a variável x e outra solução
possível para variável y. Temos, então: Solução: {6,2}

2º) Um sistema é possível e indeterminado(SPI),quando apresenta várias


soluções para cada variável. Observe:
x + y = 15
0.x + 0.y = 0

3º) Um sistema é dito como impossível, quando não temos nenhuma solução
para as variáveis que satisfaça as condições das equações lineares.
x + y = 12
x + y = 15

TÉCNICAS DE RESOLUÇÃO DE UM SISTEMA LINEAR

Um sistema linear pode ser resolvido por várias maneiras,mas a utilização de


cada técnica depende muito do próprio sistema,isto é, de quantas equações e
variáveis envolvidas. Para isso, apontamos algumas técnicas mais utilizadas
para resolução de um sistema linear, as quais são:

 Método da Substituição; Esses métodos são conhecidos


 Método da Comparação; como:
 Método da Adição; METODO DIRETO
 Método da Regra de Cramer.
 Método da Fatoração de Matrizes ou Eliminação de Gauss;
149

Para os Métodos de Substituição,Comparação e Adição usaremos um exemplo


único,o qual será passivo de comparação entre os próprios métodos.
Exemplo:
x+y=5
x–y=3

Método de Substituição:

Devemos escolher uma variável de uma das equações dadas, e isolar a


mesma. No nosso caso, iremos isolar a variável x da 1º equação.
Temos, então:
x=5–y
Devemos substituir essa variável isolada(x) na segunda equação,no lugar da
própria variável x e repetir o resto da equação.
Fica:
x –y=3
(5 – y) – y = 3
5 –y – y = 3

5 -2y = 3 Após ter achado o valor da variável y,


devemos substituir esse valor na primeira
-2y = 3 – 5
equação isolada. Temos, então:
-2y = -2 (. -1)
x=5–y
2y = 2
x=5–1
y= 2/2
x=4
y=1

Método de Comparação

Neste método, devemos escolher uma variável e isolar ela nas duas equações.
Após o isolamento, devemos comparar os seus valores pelo princípio da
igualdade.
150

Isolaremos a variável x,logo temos:


1º Equação: x=5–y
2º Equação: x=3+y

Comparando x = x, fica: 5–y = 3+y


Temos:
5- 3 = y +y
2 = 2y
y=1
Substituindo o valor da variável y em qualquer equação do sistema,temos:
x=5–y
x=5–1
x=4

Método da Adição

Para utilizarmos o método da adição,demos somar as duas equações e o


resultado desta operação,deverá anular uma variável. Veja:

+ x+y=5 Após ter achado o valor de uma


variável, devo substituir este em
x–y=3
qualquer equação do sistema:
2x =8
Veja: x+y=5
Logo, fica:
4 + y= 5
2x = 8
x = 8/2 y=1
x=4
OBS: Esses três métodos(Substituição,Comparação e Adição),são muito
utilizados quando o sistema é composto por 2 equações e duas
variáveis,caso contrário, o recomendável é a utilização da técnica da
Eliminação Gaussiana ou a Regra de Cramer.
151

Método da Fatoração de Matrizes ou Eliminação de Gauss ou Método do


Escalonamento

Esse método consiste em achar a matriz inversa de uma matriz dada. A sua
aplicabilidade consiste na fatoração ou eliminação do sistema dado, através de
operações matemáticas elementares.
Exemplo: Dado o sistema:
2x + 1y – 3z = -1
-1x + 3y + 2z = 12
3x + 1y – 3z = 0
Devemos trabalhar apenas com os coeficiente numéricos,isolando eles do
sistema. Além disso, devemos incluir os valores dos coeficientes constantes
dentro de uma matriz.
Veja:

2 1 -3 -1
A3x4 = -1 3 2 12
3 1 -3 0

Devemos separar a última coluna, para obtermos uma matriz quadrada.

2 1 -3 -1
-1 3 2 12
3 1 -3 0

Os valores que estão em destaque são os vetores(elementos) matriciais


respectivamente:
a21 = -1 ; a31 = 3 e a32 = 1 Deverão ser anulados,para formarmos uma
matriz triangular superior. Para isso, devemos utilizar operações com as linhas
da Matriz.
152

Para zerar a21 = -1 ,temos:


L2 = L1 + 2L2 ,fica:
L2 = (2 1 -3 -1) + 2(-1 3 2 12) = (2 1 -3 -1) + ( -2 6 4 24) =
L2 = ( 0 7 1 23)

Para zerar a31 = 3 ,temos:


L3 = 3L1 – 2L3
L3 = 3( 2 1 - 3 -1) - 2( 3 1 -3 0) = (6 3 -9 -3) + ( -6 -2 +6 0) =
L3 = (0 1 -3 -3)

Para zerar a32 = 1 ,temos:


L3 = L2 – 7L3 OBS: Devemos utilizar a L2 e L3 já alteradas,isto é:
L2 =(0 7 1 23) e L3 = (0 1 -3 -3), logo, fica:
L3 = (0 7 1 23) - 7(0 1 -3 -3) = (0 7 1 23) + (0 -7 21 21) =
L3 = ( 0 0 22 44 )
Com isso, a nossa nova matriz fica:

2 1 -3 -1
0 7 1 23
0 0 22 44

Podemos então, multiplicar os coeficientes numéricos pelas variáveis (x, y e z)


respectivamente, além disso, devemos igualar estes resultados com os
coeficientes constantes,obtendo assim um sistema linear mais simplificado.
Temos:
2x + y - 3z = -1
7y + z = 23
22z = 44
Utilizando a última equação,fica:
22z = 44
z = 44/22
z=2
153

Substituindo o valor da variável z na 2º Equação,temos:


7y + z = 23
7y + 2 = 23
7y = 23 – 2
7y = 21
y = 21/7
y=3
Para calcular a variável x, devemos substituir o valor das duas variáveis
encontradas na 1º equação
2x + y - 3z = -1
2x + 3 - 3(2) = -1
2x -3 = -1 x=1
Assim, a solução para o sistema linear é: 1,3,2

Método da Regra de Cramer

A regra de Cramer é utilizado para resolver sistema lineares, com a utilização


de determinantes. Devido a este fato,é de suma importância que o sistema
tenha um formato de matriz quadrada.

Exemplo:
3x + y = 9
2x + 3y = 13
Logo, temos uma matriz A2x2, da seguinte forma:
3 1 x 9
2 3 y = 13

Para calcular a variável x ,devemos dividir o resultado do determinante da


matriz B 9 1 pelo resultado do determinante da matriz A. 3 1
13 3 2 3
154

Temos:
x = det B
det A

9 1

13 3 9 . 3 – 13 . 1 27 - 13 14
X = = = 2
=
== 3 1 3. 3 -2.1 9 - 2 7

2 3

Para calcular a variável y, devemos dividir o resultado do determinante da


matriz C 3 9 pelo resultado do determinante da matriz A. 3 1
2 13 2 3

Temos:

y = det C
det A

3 9

2 13 3 . 13 – 2 . 9 39 - 18 21
= = =3
y= =
3 1 3. 3 -2.1 9 - 2 7

2 3

Portanto, a resolução doi sistema é 2;3


155

APLICABILIDADE DO CÁLCULO MATRICIAL

Devemos compreender que uma matriz é uma tabela de valores, e que as


operações que relacionam os elementos matriciais resultam em um sistema
matemático o qual denominamos de cálculo matricial. É importante sabermos
que o cálculo matricial é aplicado em grande escala nas empresas e com um
certo grau de exclusividade nos setores de administração, contabilidade e
logística entre outros.
Com isso, a sua funcionalidade fica mais perceptível nas tomadas de decisões
que buscam otimizar os resultados, elevando os lucros operacionais e
diminuindo as despesas consequentemente.

Para que possamos entender melhor a sua aplicabilidade funcional, usaremos


um exemplo para descrever os seus resultados obtidos.

Exemplo
Uma empresa pretende aumentar o seu faturamento mensal. Devido
a este fato, estabeleceu algumas metas de vendas a serem alcança-
das pelos seus vendedores. Estes funcionários deveram vender pro-
tos A, B e C, sendo que o produto A será comercializado em R$
9,00 o produto B em R$ 12,00 e o produto C em R$7,00. Sabe-se que
no final do mês foi feito um levantamento sobre as vendas e foi
contabilizado um lucro de R$ 24.000,00. O custo total de fabricação
destes produtos foi de R$ 3.020,00 e o custo de produção do produto
A equivale a um terço do produto C.Portanto,quantos produtos essa
essa empresa vendeu ao final do mês e qual dos produtos que obteve
a maior arrecadação financeira ?
156

Temos:
A , B e C = Variáveis, onde:

A + B + C = 3.020
9A + 12B + 7C = 24.000
A = C/3

Substituindo a 3 º Equação na 1º e na 2º Equação, temos:


C/3 + B + C = 3.000
[ B + 4C/3 = 3.020 ] 4º Equação

9(C/3) + 12B + 7C = 24.000


12B + 10C = 24.000
[12B + 10C = 24.000 ] 5º Equação
Arrumando o sistema, temos:
B + 4C/3 = 3.020
12B + 10C = 24.000

Utilizando o sistema de substituição, isolaremos a variável B da 1º equação:


B = 3.020 – 4C/3 , substituindo na 2º Equação, temos:

12(3.020 – 4C/3) + 10C = 24.000


36.240 – 16C + 10C = 24.000
C = 2040 peças
Logo, a variável B será:

B = 3020 – 4C/3
B = 3020 – 4(3020/3)
B = 3020 – 2720
B = 300 peças
157

Como A = C/3, temos:


A= 2040/3
A = 680 peças

Logo, foram vendidas ao todo : 2040 + 300 + 680 = 3020 peças


Devido a quantidade vendida, o produto C obteve a maior arrecadação
financeira,num total de 7.(2040) = R$ 14.280,00

Transformando, o sistema em matriz temos:

1 1 1 A 3.020

9 12 7 . B = 24.000

1 0 -1/3 C 0

OBS: A resolução desta operação matricial, irá resultar em um sistema


linear, conforme apresentado na resolução anterior.
158

EXERCÍCIOS DE FIXAÇÃO

01) Perguntado sobre a idade de seu filho Júnior, José respondeu o seguinte:
"Minha idade quando somada à idade de Júnior é igual a 47 anos; e quando
somada à idade de Maria é igual a 78 anos. As idades de Maria e Júnior
somam 39 anos." Qual a idade de Júnior?
a) 2 anos b) 3 anos c) 4 anos d) 5 anos e) 10 anos

02) (PUCCAMP) Um certo número de alunos fazia prova em uma sala. Em um


dado momento, retiraram-se da sala 15 moças, ficando o número de rapazes
igual ao dobro do número de moças. Em seguida, retiraram-se 31 rapazes,
ficando na sala igual ao número de moças e rapazes. O total de alunos que
fazia prova nessa sala era
a) 96 b) 98 c) 108 d) 116 e) 128

03) (UFG 2007) Para se deslocar de casa até o seu trabalho, um trabalhador
percorre 550 km por mês. Para isso, em alguns dias, ele utiliza um
automóvel e, em outros, uma motocicleta. Considerando que o custo do
quilômetro rodado é de 21 centavos para o automóvel e de 7 centavos para
a motocicleta, calcule quantos quilômetros o trabalhador deve andar em
cada um dos veículos, para que o custo total mensal seja de R$ 70,00.

04) Resolva o sistema linear, pelo método mais conveniente.


2 x  3 y  z  11

a)  x  y  z  6
5 x  2 y  3 z  18

05) Calcule os valores de x, y e z nos sistemas pelo Método da Regra de Cramer

x  2 y  z  2  x  y  10  0
 
a) 2 x  y  3 z  9 b)  x  z  5  0
3 x  3 y  2 z  3 y  z  3  0
 
159

06)(PEBII-SP) Em um artigo da Revista do Professor de Matemática, o


professor Elon Lages Lima justifica a importância do estudo de sistemas
lineares e discute o equívoco em se utilizar a Regra de Cramer para
discutir se um sistema é possível ou impossível. Dessa forma, o professor
aconselha a resolver sistemas por escalonamento ou interpretação
geométrica. No artigo, o professor Elon cita o sistema:

Pode-se afirmar que o sistema é:

a) impossível.

b) possível e indeterminado.

c) possível e determinado com uma solução nula.

d) possível e determinado com o produto das soluções igual a 28.

e) possível e determinado com a soma das soluções igual a 15.


160

GABARITO

01- C

02- C

03- Automóvel = 85,77 Km e Motocicleta = 464,23 Km

04- x = 1 ; y = 2 e z = 3

05- a) (1,2,3) b) (6,4,1)

06- Representando o sistema em Matriz,temos:

Observe que:
L2 da matriz foi multiplicada por -1/2 e
L3 foi multiplicada por -1/3.

Em seguida, L2 foi substituída pela sua soma com L1


L3 foi substituída pela sua soma com a L1.
Assim, temos o sistema dado transformado num sistema equivalente.

No sistema equivalente, na terceira equação 0x + 0y + 0z = -1/3, temos uma


contradição, pois o produto de qualquer número por zero é igual a zero.
Assim, o sistema dado não tem solução, ou seja, é impossível (alternativa A).
161

PROGRAMAÇÃO LINEAR
Definição:

A programação linear é a parte da matemática que consiste em


resolver problemas através da otimização de uma função linear,
denominada como função objetivo, respeitando-se um sistema linear
de igualdade ou desigualdades que recebem o nome de restrições do
modelo.

OBS: Restrição é aquilo que impede um melhor desempenho de um sistema e


representa normalmente limitações de recursos disponíveis ( capital,
mão de obra, recursos minerais ou fatores de produção) ou exigências e
condições que devem ser cumpridas no problema.

É importante entender, que devido a sua funcionalidade simples a


programação linear é muito utilizada em resolução de problemas que envolvam
um certo grau de complexidade. Em contabilidade é utilizado para:

 Maximizar os lucros;
 Dimensionar investimentos;
 Aferir a quantidade de máquinas e equipamentos;
 Minimizar custos, etc.

OBJETIVOS DA PROGRAMAÇÃO LINEAR :

 Reconhecer os problemas que são passíveis de análise pelo modelo;


 Auxiliar o analista no estágio inicial da investigação;
 Avaliar e interpretar inteligentemente os resultados;
 Aplicar os resultados com a confiança que é adquirida somente com a
compreensão dos problemas e dos resultados envolvidos.
162

PROBLEMAS DE PROGRAMAÇÃO LINEAR (PPL)

Para resolver um problema de programação linear, temos que estabelecer


alguns critérios para a sua resolução:

1º) Definição do objeto básico do problema;

2º) Definição das variáveis envolvidas no problema;

3º) Definição das restrições representadas pelas inequações matemáticas.

OBS: Um problema pode apresentar dois tipos de soluções em seu


desenvolvimento:

a) Solução Viável: Resultado das variáveis,contemplando as restrições;


b) Solução Ótima: Representa o resultado da variável mais favorável.

Num problema de programação linear com duas variáveis x e y o que se


pretende é maximizar (ou minimizar) uma forma linear é dado pela seguinte
fórmula: z=Ax+By
onde: A e B são constantes reais não nulas e Z é o resultado operacional

A forma linear traduz a função linear nas variáveis x e y.


As variáveis x e y estão sujeitas a certas condições restritivas expressas por
inequações lineares em x e y que traduzem as restrições do problema.

 Basicamente os problemas envolvendo a programação linear,são


classificados em função da quantidade de variáveis presentes.Devido, a
este fato temos a sua divisão da seguinte maneira:

1º) PROBLEMAS COM 2 VARIÁVEIS:

 Resolução Gráfica;
 Resolução por Análise Matemática;
163

2º) PROBLEMAS COM 3 OU MAIS VARIÁVEIS:

 Resolução por Análise Matemática;

Resolução Gráfica:
Esta técnica consiste em resolver um determinado
problema de programação linear com gráficos
cartesiano,o qual possui na função linear duas variáveis a
serem analisadas.

Veja:
y Ponto Solução:
(X,Y)

s r

Onde:

R e S = Representa uma função linear com 2 variáveis.

Exemplo:

Uma fábrica de confecções produz dois modelos de camisas de luxo. Uma


camisa do modelo A necessita de 1 metro de tecido, 4 horas de trabalho e
custa R$20,00. Uma camisa do modelo B exige 1,5 metros de tecido, 3 horas
de trabalho e custa R$16,00. Sabendo que a fábrica dispõe diariamente de 150
metros de tecido, 360 horas de trabalho e que consegue vender tudo o que
fabrica, quantas camisas de cada modelo será preciso fabricar para obter um
rendimento máximo?

Solução:

Dados:

Camisa A = x (necessita de 1metro de tecido e 4 horas trabalhadas)

Camisa B = y (necessita de 1,5 metros de tecido e 3 horas trabalhadas)


164

Tempo de trabalho = 360 horas

Comprimento do tecido disponível da fabrica diariamente = 150 m

Temos por função linear( inequação):

x + 1,5y ≤ 150

4x + 3y ≤ 360

Isolando y na 1º e 2º inequação, temos:

y ≤ 150 – x Inequação 1 y ≤ 360 - 4x Inequação 2


1,5 3

A cada valor atribuído a variável x, teremos um valor proporcional a variável y.


Quando ocorrerem dois valores iguais para a variável x e cada inequação
obtiver o mesmo valor para variável y, teremos um ponto comum entre as duas
funções lineares,o qual chamaremos de Ponto Solução (Resultado do
Problema)
Inequação 1 Inequação 2
Veja:
y x y
x y
15 90
15 100
140 30 80
30 80
120 60 60
60 40
100 150 0
(30,80) 90 0
80
60 REGIÃO DE
40 INTERESSE
20 x (REGIÃO VIÁVEL)
0 15 30 45 60 75 90

OBS: Os valores 150 e 360 são restrições apresentadas pelo problema.


165

Resolução por Análise Matemática:

Para resolvermos analiticamente temos de aceitar algumas regras:

 Se um problema de programação linear tem uma solução, esta está


localizada num dos vértices da região admissível.

 Se um problema de programação linear tem múltiplas soluções, pelo


menos uma delas está localizada num dos vértices da região admissível.

Em qualquer dos casos o valor correspondente da função linear é única.

Exemplo:

Utilizando o exercício anterior, temos quatro vértices, os quais estão

dispostos em coordenadas da seguinte maneira:: (0,0), (0,100), (30,80)

e (90,0).

Para cada um dos pares teremos de obter o valor da função linear, eliminamos
o par (0,0).

Fazendo: z = A x + B y ; temos:

Z = 20x + 16y então fica:

(0,100) = z = 20(0) + 16(100) = 0 + 1.600 = R$ 1.600,00

(30,80) = z = 20(30) + 16(80) = 600 + 1280 = R$ 1.880,00

(90,0) = z = 20(90) + 16(0) = 1800 + 0 = R$ 1.800,00

Portanto, o maior valor arrecadado pelas vendas das camisetas foi R$


1.880,00, quando foram produzidas 30 camisetas do modelo A e 80 camisetas
do modelo B.

OBS: Neste caso o Z pode ser representado por L, pois o problema questiona
a lucratividade das vendas,logo temos:

L(x,y) = 20x + 16y L(x,y) = R$ 1.880,00


166

EXERCÍCIOS RESOLVIDOS

.01) Certa empresa fabrica dois produtos P1 e P2. O lucro unitário do produto
P1 é de R$ 1.000,00 e o lucro unitário de P2 é R$ 1.800. A empresa
precisa de 20 horas para fabricar uma unidade de P1 e de 30 horas para
fabricar uma unidade de P2. O tempo anual de produção disponível para
isso é de 1200 horas. A demanda esperada para cada produto é de 40
unidades para P1 e 30 unidades para P2. Construa o modelo de
programação linear que objetiva Maximizar o lucro.

SOLUÇÃO:

Dados:
P1: Lucro – R$ 1.000,00
Tempo de produção P1: 20 horas
Demanda Esperada P1: 40 unidades

P2: Lucro – R$ 1.800,00


Tempo de produção P2: 30 horas Tempo Disponível de Produção: 1200 horas
Demanda Esperada P2: 30 unidades

Temos:
Unidade produzida do Produto P1: x Unidade produzida do Produto

P2: y Função Objetivo: Maximizar: 1000x + 1.800y

Restrições: (Tempo de Produção 1.200h), fica: 20x + 30y ≤ 1.200

Demanda Esperada do Produto (P1: 40 unidades) ,fica: x ≤ 40

Demanda Esperada do Produto (P2: 30 unidades), fica: y ≤ 30

Logo:

MAXIMIZAR LUCRO:

Max Z = 1000x + 1.800y

Restrições: 20x + 30y ≤ 1.200


x ≤ 40
y ≤ 30 x ,
x. y ≤ 0
167

NÚMEROS ÍNDICE

Definição:
São métodos quantitativos que auxiliam os administradores,
economistas, contadores entre outros profissionais, há comparar, compreender
e analisar determinadas variáveis relacionadas entre si com as suas variações.

OBS: Essas variações são mudanças significativas relacionadas aos preços


dos produtos comercializados, do volume físico do próprio produto, da
matéria-prima, entre outros.

UTILIZAÇÃO DOS NÚMEROS ÍNDICES

Em geral, os números índices são largamente usados na análise da elevação


ou diminuição de variáveis quantitativas, dentre elas podemos citar:

a) Variação ocorrida durante um certo período(tempo);


b) Variação entre localizações geográficas;
c) Variação entre categorias (pessoas, produtos, etc)

OBS:A importância dos números-índices é de extrema relevância para os


administradores e contadores, pois quando a moeda(Real) sofre uma
desvalorização constante e o processo de desenvolvimento econômico
acarreta em mudanças continuas nos hábitos dos consumidores, isso
provoca grandes modificações qualitativas e quantitativas na
composição da produção nacional e de cada empresa individualmente.
Devido a estes fatos, estes profissionais devem ficar atentos a essas
oscilações financeira e comportamentais, as quais serão fundamentais
em tomadas de decisões no processo administrativo e contábil de uma
empresa.
168

OBS2: Fora dos problemas gerados por alterações nos preços dos produtos, os
números-índices são úteis também em outras áreas de atuação da
empresa como, por exemplo, no campo da pesquisa de mercado. Neste
caso, podem ser utilizados nas mensurações do potencial de mercado,
na análise da lucratividade por produto, por canais de distribuição etc.
Em síntese, os números-índices são sempre úteis quando realizamos
análises comparativas.

CLASSIFICAÇÃO DOS NÚMEROS ÍNDICES

Basicamente podemos dividir os números índices em três categorias:

 Números Índices Simples;


 Número Índices Relativos;
 Número Índices de Ligação.

NÚMEROS ÍNDICES SIMPLES (NIS)

Definição:
São os números que avaliam a variação de um único item ou
variável em comparação a um valor base, o qual é definido pelo pesquisador
podendo abranger períodos(tempo),lugares ou qualquer outra situação que
necessite de comparação.

I = Índice de variação;
FÓRMULA:
Vn = Valor Nominal;
I = Vn . 100 onde:
Vo Vo = Valor Base.
169

NÚMEROS ÍNDICES RELATIVOS (NIR)

Definição:
Avalia a variação relativa de um único item ou variável em
comparação à media de valores. Essa média é oriunda dos valores observados
pelo pesquisador.

OBS: Através do NIR, podemos analisar a elevação ou queda de um


determinado valor, referente a média pré-estabelecida. Além disso,
podemos fundamentar essa comparação em valores percentuais.

FÓRMULA:
Ir = Índice de relativo;
Ir = Vn . 100% onde:
Vm Vn = Valor Nominal;

Vm = Valor Médio.

NÚMEROS ÍNDICES DE LIGAÇÃO (NIL)

Definição:
Determina as variações entre os períodos consecutivos,isto é, são
os valores encontrados, através de comparações feitas pela divisão de um
período pelo período anterior com o período atual.

OBS: Essa comparação é feita entre dois valores consecutivos, sendo


expresso o seu estudo em dados percentuais.

FÓRMULA: IL = Índice de ligação;


IL = Vat . 100 % - 100% Van = Valor anterior do período;
Van
Vat = Valor atual do período.
170

MUDANÇA DE BASE

A mudança de base de um Número Índice é a troca de um período para outro.


Um dos objetivos de tal mudança pode ser o de tornar o período base mais
recente. E isto proporciona uma medida mais corrente de variação. Outro
objetivo pode ser o de tornar comparáveis duas séries com bases diferentes. O
processo para a mudança de base é bastante simples, dada uma série de
Números Índices na base antiga. Exige apenas que todos os números da série
sejam divididos pelo Número Índice do novo período base.

Exemplo:
Nesta tabela, apenas um dos valores da segunda linha será igual a 100. Este
ano será, portanto, chamado ano base ! Todos os demais índices de preços
podem ser imediatamente “comparados” de forma percentual ao preço do ano
base, uma vez que este último é igual a 100 !
Veja:
Ano 2001 2002 2003 2004 2005 2006
Índice 75 88 92 100 110 122

Aqui, nosso ano base é 2004, pois é o único que traz o índice igual a
100! Se quisermos comparar o que houve com o preço desse produto no ano
de 2005, diremos sem dificuldades que ocorreu um aumento de 10%.

Para mudar a base dessa tabela,ou melhor dizendo,queremos que o ano base
deixe de ser 2004 e passe a ser o ano base de 2001. Para isso, o ano base de
2001 deverá assumir o valor de 100. Com isso, devemos dividir o índice do ano
de 2001(75) pelo ano base (100), obtendo o valor de 0,75. Para completar a
mudança, devemos dividir o índice de 2001(75) pelo próprio valor
encontrado(0,75), transformando ele no valor base 100.
171

Veja:

75 75  100 
  75x   100
0,75  75   75 
 
 100 

O que nos resta agora é apenas saber que, a mesma operação que foi
realizada com o índice da nova base será também feita com todos os outros
índices da tabela! Ou seja, não vai mudar só o índice do ano-base: mudará
toda a tabela! E a operação será a mesma: dividir por 0,75. Teremos, portanto:

Ano 2001 2002 2003 2004 2005 2006


Índice 100 88_ 92_ 100 110 122
0,75 0,75 0,75 0,75 0,75

Chegaríamos a:
Ano 2001 2002 2003 2004 2005 2006

Índice 100 117,3 122,7 133,3 146,7 162,7

Esta é nossa nova tabela, cuja nova base é o ano de 2001!

CONSTRUÇÃO DE NÚMEROS ÍNDICES

Para construirmos um número índice, devemos encontrar o período base, o


qual denotaremos como o valor de 100. Devido a isso, obtemos um parâmetro
qualquer número que encontrarmos entre as variáveis de estudo na base 100,
isto significa que não houve variação em relação a base.Se o valor for maior
do que 100,refere-se a um aumento em relação a base e caso contrário, existe
uma diminuição em relação a própria base.
Resumidamente, temos:
172

NI > 100 = Aumento referente ao valor base;


NI = 100 = Sem alteração ao valor base;
NI < 100 = Diminuição referente ao valor base;
Onde: NI = Número Índice
Exemplo:
Suponha que você esteja analisando o faturamento de uma empresa, conforme
dados abaixo:

ANO FATURAMENTO ANUAL EM REAIS


2005 R$ 1.234.321,00
2006 R$ 2.345.678,00
2007 R$ 3.456.809,00
2008 R$ 3.312.090,00
2009 R$ 3.211.601,00
2010 R$ 4.567.011,00
2011 R$ 5.299.181,00
2012 R$ 6.459.222,00
2013 R$ 5.878.477,00
2014 R$ 4.990.670,00

Nessa tabela, se seu objetivo for mostrar a evolução do faturamento, porém a


apresentação dos valores em si não é tão importante. É muito mais útil a
apresentação de uma tabela com números índices, com a mesma evolução da
sequência original, tornando a interpretação dos valores muito mais fácil. Para
a construção do número índice, você pode escolher arbitrariamente um valor
qualquer da tabela. Poderia ser o ano de 2007 porque, a partir desse ano, o
faturamento cresceu muito. Porém, poderia ser escolhido outro ano qualquer
que se denomina ano-base e, como vimos, deve ser representado por 100.
173

Escolhido o ano de 2009 como base, teríamos para o ano de 2005:

3. 211. 601,00 (valor de 2009 que é a base)..................100

1 .234. 321,00 (valor de 2005, que será ........................ x

Temos, então:
x = 1. 234. 321 = 0,3843 x 100% = 38,43%
3.211.601
Portanto:
O número índice 38,43, é menor que 100%, significando que o valor de 2005 é
61,57 % menor que o valor de 2009 (100% – 38,43%).

ANO PORCENTAGEM RELATIVA


Assim, os números índices
2005 38,43 %
referentes aos valores dos
2006 73,04 %
faturamentos seriam como os da
2007 107,64 %
tabela ao lado, cujo cálculo
2008 103,13 %
resume-se a dividir os valores,
2009 100,00 %
ano a ano pelo valor de 2009,
2010 142,20 %
eleito como ano base e com
faturamento de R$ 3.211.601,00. 2011 165,00 %
2012 200,84 %
2013 183,04 %
2014 155,40 %
ÍNDICE DE PREÇOS
Definição:
É a média ponderada de preços de bens e serviços, referente a um
ano base, sendo que os ponderadores são as quantidades relativas aos
próprios bens e serviços.
Exemplo: IPC (Índice de preço ao Consumidor)
IPI (Índice de Produção Industrial)
OBS: Este índice é utilizado para a verificação da variação geral dos
preços praticados na economia.
174

INDÍCES ESPECIAIS DE PREÇO

Definição:
São índices do tipo agregativo, pois as suas ponderações são
executadas pelas quantidades do período base ou do período atual ou de
outras formas.
Esses índices são basicamente classificados em:

 Índice de Laspeyres
 Índice de Paasche.

O ÍNDICE DE PREÇO DE LASPEYRES (IPL)

Definição:
Refere-se a uma média ponderada de relativos, tendo os fatores de
ponderação calculados a partir de preços e de quantidades da época básica.

OBS: O índice de preços de Laspeyres ,retrata um conjunto de mercadorias


em um determinado período, as quais estão submetidas em uma média
aritmética ponderada ,referente aos preços relativos destas. Os fatores
de ponderação são os valores monetários de cada mercadoria vendidas
na época básica.

FÓRMULA
po = Preço inicial;

IPL = ∑ pi.qo X 100 onde: pi= Preço atual;

∑ po.qo qo = Quantidade inicial


175

O ÍNDICE DE PREÇO DE PAASCHE(IPP)

Definição:
É o índice agregativo de preços, ponderado pela quantidade
consumida no período atual.

OBS: O índice de Paasche pode ser considerado como uma média ponderada
de relativos, cujos os pesos são representados pelo produto dos preços
no ano base e multiplicado pela quantidade na época.

FÓRMULA:
po = Preço inicial;

IPP = ∑pi.qi x 100 onde: pi= Preço atual;


∑po. qi qo = Quantidade inicial;

qi = Quantidade atual

ÍNDICE LASPEYRES X ÍNDICE PAASCHE

Quando utilizamos os índices Laspeyres ou o índice Paasche,muitas vezes não


percebemos que estes índices possuem as suas vantagens e desvantagens.
Com isso, observe o quadro a seguir e faça uma análise destas comparações.

LASPEYRES PAASCHE
Usa as quantidades do período base Usa quantidades do período corrente
Pode ficar desatualizado Está sempre atualizado
Tende a exagerar aumentos de Tende a mascarar aumentos de
preços preços
Fonte:<http://www.mspc.eng.br/matm/indices01.shtml>
176

SÍNTESE DA AULA

 Números Índices são usados para indicar variações relativas em


quantidades, preços e valores de um artigo (ou artigos) durante certo
período de tempo ou entre diferentes lugares.

 Um Número Índice simples avalia a variação relativa de um único item ou


variável econômica entre dois períodos de tempo.

 O número de Índice Relativo, é o número índice mais simples.


Relacionando-se o preço de um produto numa época chamada época atual
ou época dada, com o de uma época chamada básica ou simplesmente
base, teremos um relativo de preço.

 O Número de Índice de Ligação é a comparação é feita entre dois valores


consecutivos.

 O Índice de Laspeyres constitui uma média ponderada de relativos, sendo


os fatores de ponderação determinados a partir de preços e de
quantidades da época básica, por conseguinte, no Índice de Laspeyres, a
base de ponderação é a época básica, por isso a denominação método da
época básica.

 No Índice agregativo proposto por Paasche, a ponderação é feita em


função dos preços e quantidades do período atual. Entretanto, uma
desvantagem dos pesos do período atual é que eles devem ser revistos
cada ano
177

EXERCÍCIOS DE FIXAÇÃO

01) Calcular os índices relativos na tabela abaixo, considerando o ano de


2000 como base:

ANO 1999 2000 2001 2002 2003

VALOR EXPORTADO 50 40 35 48 51
(MILHÕES DE R$)

02) Em 2002, o preço de um produto era 35% mais baixo que em 2003 e,
em 2004, 30% maior que em 2003. Qual o índice de preço de 2002
(base) para 2004?

a) 100 %
b) 125%
c) 150%
d) 200%
e) 225%

03) O preço de um produto, em 2003 (data-base) era R$ 1.200,00. Em 2004


esse mesmo produto foi vendido por R$ 1.100,00. Qual o índice relativo
de preço e qual a variação percentual de preço respectivamente ?

a) 91,67% e 8,33%
b) 92,45% e 7,52%
c) 78,00% e 8,33 %
d) 92,45% e 6,29%
e) 91,67% e 7,52%
178

04) (AFTN/94) Considere a estrutura de preços e de quantidades relativa a


um conjunto de quatro bens, transcrita a seguir:

Anos ANO 0 (BASE) ANO 1 ANO 2 ANO 3

Bens Preços Quantidade Preços Quantidade Preços Quantidade Preços Quantidade

B1 5 5 8 5 10 10 12 10
B2 10 5 12 10 15 5 20 10
B3 15 10 18 10 20 5 20 5
B4 20 10 22 5 25 10 30 5

4.1) Os índices de quantidade de Paasche, correspondentes aos quatro anos,


são iguais, respectivamente a:

a) 100,0; 90,8; 92,3; 86,4


b) 100,0; 90,0; 91,3; 86,4
c) 100,0; 90,0; 91,3; 83,4
d) 100,0; 90,8; 91,3; 82,2
e) 100,0; 90,6; 91,3; 86,4

4.2) Os índices de preços de Laspeyres correspondentes aos quatro anos são


iguais, respectivamente, a:

a)100,0; 117,7; 135,3; 155,3


b)100,0; 112,6; 128,7; 142,0
c) 100,0; 112,6; 132,5; 146,1
d)100,0; 117,7; 132,5; 146,1
e)100,0; 117,7; 133,3; 155,3
179

GABARITO

01- ( 125% ; 100% ; 87,5% ; 120% ; 127,5% )

02- D

03- A

04

Pa 
q .p n n

5x8  10x12  10x18  5x22  450  0,900
q .p o n 5x8  5x12  10x18  10x22 500
Sendo 0,900 x 100% = 90%

Pa 
q .p n n

10x12  10x20  5x20  5x30  570  0,864
q .p o n 5x12  5x20  10x20  10x30 660
Sendo 0,8664 x 100% = 86,64%

Portanto,temos que o exercício 4.1 é a letra B

La 
 p .q
n o

10x5  15x5  20x10  25x10  575  1,353
 p .q
o o 5x5  10x5  15x10  20x10 425
Sendo 1,353 x 100% = 135,30 %

Portanto, temos que o exercício 4.2 é a letra A


180

SISTEMAS ESTATÍSTICOS

Definição:

É um conjunto de técnicas de análise de dados, cientificamente


formuladas, aplicáveis a quase todas as áreas do conhecimento que nos
auxiliam no processo de tomada de decisão;sendo este processo de extrema
relevâncias nos dias atuais.

APLICABILIDADE DO SISTEMA ESTATÍSTICO

Atualmente, vivemos em um mundo extremamente globalizado, isto é,


praticamente não temos mais fronteiras impeditivas da comunicação, trabalho,
religião,educação entre outras. Vivemos 24 horas conectados,interagindo com
mundo e observando as tendências atuais da sociedade local e internacional.
Com isso, os profissionais que possuem habilidades mais acentuadas, estão
na vanguarda dessa nova era. Dentre estes, os que possuem um
conhecimento básico ,intermediário ou melhor ainda, avançado em estatística,
são os mais valorizados pelo mercado de trabalho, o qual é extremamente
ocioso por profissionais que possam analisar os problemas e tomar decisões
mais coerentes, minimizando prejuízos ou por consequência, potencializando a
lucratividade da empresa.
Desta forma, estes profissionais que estão atrelados a essa cultura estatística
desempenham um papel fundamental na administração e contabilidade de uma
empresa, pois possuem conhecimento científico que agrega habilidades de
planejar, organizar e controlar todos os aspectos que fundamentam a vida
financeira da instituição,além de uma grande noção de sensibilidade humana e
bom senso.
181

O profissional que trabalha com estatística lida geralmente com uma amostra,
ou seja, com uma pequena parcela da população, pela facilidade, pela
limitação de tempo e custo mais baixo.
Como qualquer resultado de pesquisa não tem utopia, a estatística trabalha
com uma pequena margem de erro, pois os seus valores referenciais são
retirados de uma amostra populacional.
A aplicabilidade do sistema estatístico é fundamental em pesquisas eleitorais,
pesquisa de mercado, índices econômicos, controle de qualidade entre outros.

CLASSIFICAÇÃO DAS PESQUISAS ESTATÍSTICAS

Uma pesquisa é uma investigação sistemática,com técnicas aplicadas para


coletar informações e dados que serviram como parâmetro para analisar fatos
que determinam a cultura mercantil e social de uma determinada população.
Com isso, podemos classificar uma pesquisa em:

 Pesquisa Exploratória;
 Pesquisa Descritiva;
 Pesquisa Experimental.

PESQUISA EXPLORATÓRIA:

Definição:
É a pesquisa que proporciona ao pesquisador um maior
conhecimento do tema ou problema de interesse. Esta pesquisa é orientada
para aqueles que necessitam tomar ciência dos primeiros estágios da
investigação quando a familiaridade, o conhecimento e a compreensão do
fenômeno por parte do pesquisador são insuficientes.
182

OBJETIVOS

 Elevar o conhecimento e compreensão de um problema de pesquisa;

 Ajudar na formulação mais precisa de um problema a ser pesquisado;

 Acumular informações disponíveis relacionadas ao problema de


pesquisa;

 Investigar e auxiliar na formulação de hipóteses a serem estudadas;

 Auxiliar na construção dos instrumentos de coleta de dados;

PESQUISA DESCRITIVA

Definição:
A pesquisa descritiva retrata as características específicas de uma
determinada situação pontual sobre bens, produtos ou serviços. O seu estudo
é mais complexo,o qual fundamenta o mercado sobre um determinado
produto,dando base para o pesquisador sobre todos os aspectos a serem
estudados,tais como:
 Região de maior ou menor consumo;
 Renda Financeira;
 Faixa etária do consumidor ou usuário
 Etc.

OBS: A maioria das pesquisas de marketing realizadas são pesquisas


descritivas, as quais devem ser bem objetivas, planejadas e
fundamentadas.
183

OBJETIVOS

 Descrever as características de uma população de consumidores;

 Estimar a proporção de elementos numa população específica


que tenham determinadas características ou comportamentos;

 Descobrir ou verificar a existência de relação entre variáveis.

PESQUISA EXPERIMENTAL:

Definição:
A pesquisa experimental é baseada em fatos empíricos, os quais
sinalizam probabilidades estatísticas que estão alicerçadas em causa e efeito.

Em outras palavras, a pesquisa experimental é o resultado de um determinado


estudo através de uma suposição ocorrida com outro estudo semelhante ou
com condições similares.
Exemplo:
Em cidades com grande atividade noturna, a implementação de
cursos técnicos no período da meia noite até às 4:00 hs da madrugada possui
uma grande procura por alunos ?

Analisando este fato, temos a percepção que a pergunta sugestiona que uma
cidade com uma vida noturno elevada, terá uma grande procura dos alunos por
cursos técnicos no período da meia noite até às 4:00 hs da madrugada.
É fato consumado, que uma cidade com grande atividade noturna, terá uma
grande aceitação de redes de restaurantes, casas de show, farmácias entre
outros que funcionam neste horário específico. Em contrapartida, este horário é
184

impróprio para o estudo, pois a capacidade de concentração do aluno diminui


muito, prejudicando assim o conhecimento adquirido.
Por outro lado,temos um público alvo para academias noturnas,sendo a
procura pelo horário noturno o mais procurado. Desta maneira, o objeto de
estudo fundamenta a pesquisa e gera um grau de confiança maior, conforme
ocorre as repetições nas conclusões obtidas.

MARKETING

Definição:
É o conjunto de técnicas e métodos destinados ao
desenvolvimento das vendas, mediante quatro possibilidades:
 Preço,
 Distribuição,
 Comunicação e
 Produto.

Em outras palavras,podemos afirmar que marketing é a política empresarial, na


qual o desenvolvimento das vendas desempenha um papel predominante.

PESQUISA DE MARKETING

A pesquisa de marketing possui o objetivo da coleta de dados e informações


sobre determinado mercado, que de certa forma auxiliem nas tomadas de
decisão, minimizando os efeitos negativos sobre as ações comerciais
e administração sem planejamento. O plano de marketing é desenvolvido de
acordo com informações obtidas nos resultados conseguidos por meio desta
pesquisa.
185

DIVISÃO DE UMA PESQUISA DE MARKETING

O planejamento de uma pesquisa de marketing,é divido em cinco etapas,as


quais podem classificar em:

1º) Definição dos problemas e objetivos da pesquisa de mercado;

2º) Desenvolvimento da pesquisa do Mercado;

3º) Elaboração do questionário;

4º) Aplicação do questionário;

5º) Tabulação dos dados e análise dos resultados obtidos.

DEFINIÇÃO DOS PROBLEMAS E OS SEUS OBJETIVOS

Identificar qual o problema que deseja solucionar e traçar o seu objetivo


principal. Isso significa saber aonde você quer chegar e qual o público-alvo que
você deverá pesquisar. Neste contexto, é importante ressaltar que as
características determinantes dos pesquisados serão a idade, o sexo,renda,
grau de instrução, profissão,etc.

DESENVOLVIMENTO DA PESQUISA DO MERCADO;

É quando a pesquisa é efetivada, isto é, é colocada em prática respeitando o


seus objetivos e proporcionando um grau de confiabilidade ao estudo.
186

ELABORAÇÃO DO QUESTIONÁRIO

Após ter escolhido a metodologia empregada e ter definido a amostra da


pesquisa, o questionário a ser aplicado na pesquisa deve ser objetivo, claro,
bem fundamentado no que pretende estudar e isento,ou melhor dizendo,induzir
o entrevistado a uma resposta pessoal.

APLICAÇÃO DO QUESTIONÁRIO

O questionário pode ser realizado por correspondência,telefone, pessoalmente


ou pela internet. Atualmente, a pesquisa realizada por internet ganhou muito
espaço, pois diminui muito os gastos operacionais, além de facilitar as
distâncias geográficas.

TABULAÇÃO DOS DADOS E ANÁLISE DOS RESULTADOS

Nesta fase,os resultados da pesquisa são apresentados em forma de gráficos e


tabelas. Depois da tabulação de dados é feita a comparação dos resultados
para saber se a aplicação da pesquisa chegou a seu objetivo final. Após isso, é
feito um relatório de conclusão da pesquisa para indicar a tomada de decisões
que serão aplicadas no marketing da empresa.
187

PROJETOS EXPERIMENTAIS EM MARKETING

O Experimento é equivale a uma pesquisa científica, a qual ocorre


manipulações de variáveis que estão sujeitas as oscilações resultantes,
conforme as suas condições que estão são submetidas e analisadas.
Exemplos:
 Qual o melhor canal para distribuir nosso produto?

 O tipo de vizinhança do nosso produto na prateleira do supermercado


tem implicações em suas vendas?

 Qual o efeito sobre as vendas de uma pretendida redução no preço de


um produto?

 Qual deverá ser o efeito de um novo plano de incentivo à equipe de


vendas?

 O lançamento de um novo item em nossa linha de produtos ganhará


vendas de um produto concorrente ou ganhará vendas de um outro
produto nosso (canibalismo)?

FONTES DE PESQUISA DE MARKETING

As fontes de pesquisa sobre marketing são fatores que norteiam uma pesquisa
de consumo, serviço ou tendência sobre a coleta de informações que serviram
como parâmetro para a sinalização dos resultados apresentados. Estas fontes
podem ser classificadas em:
 Pesquisado;
 Informações do Pesquisado;
 Casos Similares;
 Dados Disponíveis.
188

PESQUISADO:

São indivíduos pesquisados que possuem informações relevantes sobre os


dados a serem pesquisados em marketing, através de suas declarações,
oralmente ou por escrito, ou através de sua observação;

INFORMAÇÃO SOBRE O PESQUISADO:

Quando ocorre do pesquisado ser inacessível é mais fácil conseguir a


informação desejada com outras pessoas que convivem com ele.

CASOS SIMILARES:

São conhecimento adquiridos por situações análogas ou similares. As formas


básicas de conhecer situações similares são através do estudo de casos, do
experimento e da simulação;

DADOS DISPONÍVEIS:

É quando temos um leque de informações de dados úteis e disponíveis para


marketing que já foram coletados, catalogados e analisados. Podem ser
encontrados em bibliotecas, órgãos governamentais, leitura de jornais e
revistas, etc.
189

EXERCÍCIOS DE FIXAÇÃO

01) Marketing é definido como “o processo através do qual as pessoas adquirem


o que necessitam e desejam” isso significa dizer que para praticar o marketing
as empresas precisam:
a) Fazer propaganda de seus produtos;
b) Criar novos produtos;
c) Vender produtos;
d) Nenhuma das alternativas anteriores.

02) Dentre as alternativas abaixo,qual delas define o processo em analisar


oportunidades de marketing,selecionar mercado-alvo,projetar estratégias de
marketing,desenvolver programa de marketing e gerenciar os esforços de
marketing.
a) Planejamento estratégico
b) Análise de oportunidade
c) Participação do cliente
d) Pesquisa de mercado
e) Planejamento e marketing

03) Marketing pode ser definido corretamente como:

a) Técnicas específicas de vendas para atacar a concorrência.


b) Técnicas que estruturam a venda do produto.
c) Estratégia de propaganda para aumentar as vendas.
d) Estudo das necessidades e desejos dos clientes.
e) Percepção de lacuna no mercado para lançamento de novo produto.
190

GABARITO

01- A

02- E

03- D

Potrebbero piacerti anche