Sei sulla pagina 1di 5

UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO

Estatística

ALUNA: PRISCILA MARQUES


PROFESSOR: GABRIEL RIVAS

Cabo de Santo Agostinho, 30 de agosto de 2018.


RESUMO REFERENTE AOS CAPÍTULOS 11.1 E 11.2 DO
LIVRO “ESTATÍSTICA E PROBABILIDADE APLICADA
PARA ENGENHEIROS”

 11.1
Modelos Empíricos

Modelos Empíricos em muitos problemas duas ou mais variáveis estão inerentemente


relacionadas, sendo necessário explorar a natureza dessa relação. Análise de regressão é uma
técnica estatística para modelar e investigar a relação entre duas ou mais variáveis. Exemplo:
Em um processo químico suponha que o rendimento do produto esteja relacionado à temperatura
de operação do processo: A análise de regressão pode ser usada para: - Construir um modelo
para prever o rendimento em um dado nível de temperatura; - Otimizar o processo - Encontrar o
nível de temperatura que maximiza o rendimento.
A análise de regressão é uma técnica estatística que identifica a relação entre duas ou mais
variáveis quantitativas: uma variável dependente, cujo valor deverá ser previsto e uma variável
(ou variáveis) independente(s) ou explicativa(s), sobre a(s) qual(is) existe conhecimento teórico
disponível. A técnica é usada para determinar uma equação que aproxima a relação entre as
variáveis. Uma análise de regressão simples pode mostrar que a relação entre uma variável
independente X e uma variável dependente Y é linear, usando a equação de regressão linear
simples Y= a + bX (em que a e b são constantes - parâmetros). A regressão múltipla apresentará
uma equação que prevê /estima o valor de uma variável a partir de duas ou mais variáveis
independentes, Y= a+ bX1+ cX2+ dX3.
A análise de regressão é usada com o propósito de previsão. O objetivo é o de desenvolver um
modelo estatístico que pode ser usado para prever valores de uma variável dependente (Y) em
função de valores de uma variável (X), ou mais variáveis independentes (X1, X2,... Xp).
No caso do exemplo, nosso interesse será estabelecer uma relação matemática (linear)
entre a viscosidade do óleo (X) e o desgaste do mancal (Y), e dessa maneira prever o desgaste
em função da viscosidade do óleo.
O comportamento conjunto de duas ou mais variáveis quantitativas pode ser observado
graficamente através do Diagrama de Dispersão, e numericamente através do Coeficiente de
Correlação. O termo correlação significa até que ponto duas variáveis estão correlacionadas
entre si.
 11.2
Regressão Linear Simples

O caso de regressão linear simples considera um único regressor ou preditor x e uma


variável dependente ou variável de resposta Y. Suponha que a relação verdadeira entre Y e x
seja uma linha reta e que observação em cada nível de x seja uma variável aleatória. Como
notado previamente, o valor esperado de Y para cada valor de x é:

Muitas vezes estamos interessados em estudar o comportamento conjunto de duas variáveis,


como visto anteriormente. Em outras situações, há interesse em estudar como uma variável varia
em função da outra. Por exemplo, em um processo químico, suponha que o resultado da
produção esteja relacionada com a temperatura de operação do processo. Normalmente existe
o interesse em estudar como a produção varia em função da temperatura. Quando se estuda a
variação de uma variável Y em função de uma variável X, diz-se que Y é a variável dependente
(ou resposta) e que X é a variável independente (ou explanatória). No caso do exemplo, sabe-
se que a produção varia em função da temperatura Então, produção é a variável dependente e
temperatura é a variável explanatória (explicativa).

Seja um conjunto de observações


 x y , x
1, 1 2, y2  ,...,  xn , yn 
. O chamado modelo de regressão
linear simples para as observações é dado por

Y  0  1 X  
Onde:
Y = Variável dependente
X = Variável explanatória
0 = intercepto da reta ou coeficiente linear da reta
1= inclinação da reta ou coeficiente angular da reta; e

i = é um erro aleatório de Y para a observação i, com média Zero e variancia 2

Os parâmetros 0 e 1 são chamados de coeficiente de regressão e o gráfico da


equação de regressão é chamada reta de regressão (ou reta de melhor ajuste, ou reta de
mínimos quadrados).
Para a construção do modelo descrito acima, precisamos obter estimativas para 0 e 1,
a partir de um conjunto de observações  x y , x
1, 1 2, y2  ,...,  xn , yn  . As estimativas de 0 e 1
devem resultar em uma linha que seja (em algum sentido) o “melhor ajuste” para os dados. O
cientista alemão Karl Gauss (1777-1855) propôs estimar os parâmetros do modelo de modo a
minimizar a soma dos quadrados dos desvios verticais na Figura 3.3. Este critério para estimar
os coeficientes de regressão é chamado de método dos mínimos quadrados.
Suposições:
1) Estamos investigando apenas relações lineares.
2) Para cada valor de x, y é uma variável aleatória com distribuição normal. Todas
essas distribuições de y têm a mesma variância e, ainda, para um dado valor de x, a média da
distribuição dos valores y está sobre a reta de regressão. (os resultados não são afetados
seriamente se os desvios da normalidade e da igualdade de variâncias não são grandes).

 Método dos Mínimos Quadrados para estimar  0 e 1


Um importante objetivo deste item é utilizar dados amostrais emparelhados para estimar a
equação de regressão. Dispondo apenas dos dados amostrais, não podemos achar os valores
exatos dos parâmetros populacionais 0 e 1, mas, com os dados amostrais, podemos estimá-
los com ˆ0 e ˆ1 . Chamamos esse critério para estimar os coeficientes de regressão de método
dos mínimos quadrados. A idéia dessa técnica é encontrar a reta que passe o mais próximo
possível dos pontos observados. Isto é:

yi
Figura 3.3 – Desvios dos dados em
i
relação ao modelo estimado de
regressão

xi
O método de mínimos quadrados consiste em fazer com a soma dos erros quadráticos seja a
menor possível.
Usando o modelo de regressão podemos expressar as n observações na amostra como

Yi  0  1 X i   i , i  1, 2,..., n

Onde o erro aleatório da i-ésima observação (i=1,2,...,n) é dada por

 i  Yi   0   X i 
O método do mínimo quadrado consiste em obter os valores de 0 e 1 que minimizem
a expressão
S   i  Yi   0   X i 
2

que pode ser feito igualando as derivadas parciais à zero, ou seja:


S S
0 e 0
0 1
resultando nas seguintes estimativas para 0 e 1 , as quais chamaremos de ˆ0 e ˆ1 ,
respectivamente
n( xy )    x   y 
ˆ0  y  ˆ1 x e ˆ1 
n(  x 2 )  (  x ) 2

A equação da reta de regressão e dada por


Ŷ  ˆ0  ˆ1 x
Para cada valor de xi (i=1,2,...,n), temos, pela equação de regressão, o valor predito:
Yˆi  ˆ0  ˆ1 xi
A diferença entre os valores observados e os preditos é chamada de resíduos;
ei  Yi  Yˆi
O resíduo relativo à i-ésima observação (ei) pode ser considerado uma estimativa do erro
aleatório (i) desta observação (veja Figura abaixo)
yi ŷ  ˆ0  ˆ1 x
ei
ŷi

xi
OBSERVAÇÕES:
 As equações de regressão podem ser úteis quando usadas para predizer o valor de uma
variável, dado um valor determinado da outra variável;
 Só devemos utilizar a equação da reta de regressão se r indica a existência de uma
correlação linear significativa;
 Os dados amostrais emparelhados podem conter um ou mais pontos de influência
(outliers), os quais afetam fortemente o gráfico da reta de regressão.
 Uma vez calculados 0 e 1, podemos identificar a equação estimada de regressão, que
apresenta a seguinte propriedade especial: A reta de regressão é a que mais se ajusta aos
pontos amostrais.

Potrebbero piacerti anche