Sei sulla pagina 1di 9

PROCESOS ESTADISTICOS CON EXCEL

Guía 2: ANALISIS DE REGRESIÓN Y CORRELACIÓN.


PRONOSTICOS

Autor: Lic. Jairo Alberto Mora Fernández

1. Introducción. Esta guía ilustra los procesos de análisis de series de


datos correspondientes a dos variables observadas sobre el mismo
objeto de estudio. El análisis consiste en el cálculo e interpretación de
estadígrafos para cada variable, seguido del análisis de la relación entre
las dos variables. La descripción de esta relación incluye el diseño de un
diagrama de dispersión de datos ajustada con una línea de regresión y
su correspondiente ecuación, y el valor del coeficiente de determinación.
Adicionalmente se obtiene la tabla de análisis de varianza
correspondiente a la regresión de los datos, y el valor el coeficiente de
correlación lineal. Posteriormente se ilustra una aplicación de los
procesos de regresión al análisis de una serie temporal.

2. Creando la base de datos. Los datos a utilizar para el análisis


corresponden a 2 variables observadas sobre un mismo objeto de
estudio, de las cuales se presume que están correlacionadas, esto es,
que la variación sobre una de ellas implica variación sobre la otra. La
variable de interés es la variable dependiente Y, y la otra relacionada
con esta es la variable independiente X. Para ilustrar nuestro análisis,
tomamos datos correspondientes el número de llamadas hechas a sus
potenciales clientes por los 13 vendedores de de una empresa
productora de fotocopiadoras, y el correspondiente número de
fotocopiadoras vendidas. Se presume que un mayor número de
llamadas a posibles clientes aumenta el número de unidades vendidas,
lo que indicaría que la cantidad de copiadoras vendidas depende del
número de llamadas hechas a posibles clientes. Por esta razón,
Llamadas a clientes es la variable independiente X, y Copiadoras
vendidas es la variable dependiente Y. Los datos correspondientes
son:

Vendedor N° Llamadas a clientes X Copiadoras vendidas Y


1 22 33
2 41 68
3 25 42
4 37 62
5 18 35
6 12 31
7 23 48
8 28 53
9 26 50
10 32 60
11 43 70
12 34 56
13 12 28

3. Creando resumen de estadígrafos para cada variable. Para crear un


resumen de estadísticas para cada variable, se desarrolla el siguiente
procedimiento de EXCEL:

- Active la secuencia Datos > Análisis de Datos > Estadística


Descriptiva > Aceptar. Recuerde que si la opción Análisis de Datos
no está activada, desarrolle la secuencia Botón de Office > Opciones
de Excel > Complementos > Ir, y active la opción Herramientas para
análisis. Aplique Aceptar. Queda entonces activada Análisis de
Datos.
- En el cuadro de diálogo que aparece, señale el Rango de Entrada,
resaltando la columna de datos de la variable Llamadas a clientes X.
- Active Rótulos si en el Rango de entrada incluyó la fila del nombre de
variable.
- Seleccione un Rango de salida, que puede ser una ubicación en la
misma hoja de trabajo, o en una Hoja nueva, o en un Libro nuevo.
- Seleccione Resumen de Estadísticas, y aplique Aceptar.

Se crea entonces el siguiente Resumen de Estadísticas:

Llamadas a clientes (X)

Media 27,15384615
Error típico 2,777764629
Mediana 26
Moda 12
Desviación estándar 10,0153728
Varianza de la muestra 100,3076923
Curtosis -0,837562038
Coeficiente de asimetría 0,00748988
Rango 31
Mínimo 12
Máximo 43
Suma 353
Cuenta 13
En forma similar se obtiene un resumen de estadísticas para la variable
Copiadoras vendidas Y:

Copiadoras vendidas (Y)

Media 48,92307692
Error típico 3,942636009
Mediana 50
Moda #N/A
Desviación estándar 14,21537629
Varianza de la muestra 202,0769231
Curtosis -1,307544914
Coeficiente de asimetría -0,05695969
Rango 42
Mínimo 28
Máximo 70
Suma 636
Cuenta 13

4. Elaborando un diagrama de dispersión. Para crear un diagrama de


dispersión de los datos se sigue la siguiente rutina:

- Resalte las columnas B1 a C14 correspondientes al rango de datos.

- Seleccione Insertar > Gráfico > Dispersión. Seleccione Puntos sin


líneas. De inmediato se crea la siguiente gráfica:

Copiadoras vendidas (Y)


80

70

60

50

40
Copiadoras vendidas (Y)
30

20

10

0
0 10 20 30 40 50
Haciendo doble click sobre los números de las escalas, y luego click
derecho, se pueden modificar y arreglar los detalles de escalas.

- Ubicando el puntero sobre uno de los puntos del gráfico, haciendo click
derecho y seleccionando Agregar línea de tendencia… y luego en el
cuadro de diálogo seleccionar Lineal, Presentar ecuación en el
gráfico, y Presentar el valor R cuadrado en el gráfico, y luego
Cerrar, nos presenta una gráfica como la que sigue:

Copiadoras vendidas (Y)


80
y = 1.3692x + 11.743
70
R² = 0.9306
60
Copiadoras vendidas (Y)
50

40 Linear (Copiadoras
vendidas (Y))
30
Linear (Copiadoras
20 vendidas (Y))
10

0
0 10 20 30 40 50

En este gráfico, la ecuación y el valor de R2 puede ser ubicado


adecuadamente:

Copiadoras vendidas (Y)


80 y = 1.3692x + 11.743
R² = 0.9306
70

60

50 Copiadoras vendidas (Y)

40 Linear (Copiadoras
vendidas (Y))
30

20
10 20 30 40 50
- Con la ecuación de tendencia obtenida, se puede complementar la base
de datos inicial, calculando las ventas estimadas (y), el error de
estimación o residual (Y – y), los residuales al cuadrado (Y – y)2, y la
suma de residuales al cuadrado (o suma de cuadrados del error SCE).

5. Utilizando la opción de Análisis de datos para Regresión. Esta


opción permite obtener los resultados del análisis de regresión de los
datos, y del análisis de varianza para regresión. Para activar esta
opción:

- Ubíquese en la hoja de datos de trabajo.


- Aplique la secuencia Datos > Análisis de DATOS > Regresión >
Aceptar.
- En el cuadro de dialogo, ubique los rangos Y y X de entrada, los
rotulos si estos fueron incluidos en el rango, y una ubicación de salida.
Se crea entonces el siguiente informa:

Resumen

Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,96469721
Coeficiente de determinación
R^2 0,930640707
R^2 ajustado 0,924335316
Error típico 3,910254013
Observaciones 13

ANÁLISIS DE VARIANZA

Grados de libertad Suma de cuadrados Promedio de lo


Regresión 1 2256,732126
Residuos 11 168,1909509
Total 12 2424,923077

Coeficientes Error típico Estadís


Intercepción 11,74271472 3,246879329
Llamadas a clientes (X) 1,369248466 0,11270605

Aunque la mayoría de los resultados de esta tabla corresponden a procesos


de inferencia estadística, se encuentran algunos, como los coeficientes de
correlación lineal, determinación y regresión que ya habíamos calculado
antes. Así mismo, encontramos la SCE calculada antes.
6. Utilizando la opción de Análisis de datos para Correlación. Este
proceso nos provee de la matriz de correlación lineal para las dos
variables del análisis. Veamos:

- Aplique la secuencia Datos > Análisis de DATOS > Coeficiente de


correlación > Aceptar.
- Llene la información del cuadro de diálogo y aplique Aceptar. Se
obtiene el cuadro siguiente:

Llamadas a clientes (X) Copiadoras vendidas (Y)


Llamadas a clientes
(X) 1
Copiadoras vendidas
(Y) 0,96469721 1

El cuadro presenta el valor del coeficiente de correlación lineal, para su


correspondiente interpretación.

7. Analizando una serie de tiempo. Para efecto del análisis,


comenzamos creando una base de datos con la serie para el análisis.
Los datos corresponden a la venta de gasolina, en miles de galones, de
una estación de gasolina, registrada durante 12 semanas.

VENTAS DE GASOLINA
SEMANA VENTAS
1 17
2 21
3 19
4 23
5 18
6 16
7 20
8 18
9 22
10 20
11 15
12 22
Para estos datos se puede diseñar un gráfico de líneas con puntos,
conteniendo una línea de tendencia. Para ello se desarrolla la secuencia
descrita en el punto 4., pero señalando únicamente la línea de Ventas:

VENTAS y = 0.0245x + 19.091


25 R² = 0.0012

20

15
VENTAS
10 Linear (VENTAS)

0
1 2 3 4 5 6 7 8 9 10 11 12

8. Aplicando promedios móviles para suavizar una serie temporal.


Para suavizar la serie anterior utilizando la estrategia de promedios
móviles, desarrolle la secuencia:

- Datos > Análisis de DATOS > Media Móvil > Aceptar.


- En el cuadro de diálogo ingrese el rango de datos de Ventas,
selecciones Rótulos ( si lo incluyó en el rango), escriba 3 en Intervalo
(para que haga el promedio móvil para cada 3 datos), escoja un rango
de salida, y seleccione Crear Gráfico. Veamos el resultado:
Media móvil
24
23
22
21
20
Valor

19 Real
18 Pronóstico
17
16
15
14
1 2 3 4 5 6 7 8 9 10 11 12
Punto de datos

9. Aplicando suavizamiento exponencial a una serie temporal. Para


aplicar suavizamiento exponencial a la serie, desarrolle la secuencia:

- Datos > Análisis de DATOS > Suavización exponencial > Aceptar.


- En el cuadro de diálogo ingrese el rango de datos de Ventas,
selecciones Rótulos ( si lo incluyó en el rango), escriba 0,2 en Factor
de suavización, escoja un rango de salida, y seleccione Crear Gráfico.
Veamos el resultado:

Suavización exponencial
25

23

21
Valor

19
Real

17 Pronóstico

15

13
1 2 3 4 5 6 7 8 9 10 11 12
Punto de datos
10. Haciendo pronósticos con la serie de tiempo. Para desarrollar esta
opción, se utiliza la función Pronóstico. Veamos:

- Seleccione una celda donde desee ubicar el resultado del pronóstico.


- Desarrolle la secuencia Insertar función > Estadísticas > Pronóstico
> Aceptar.
- En X escriba el número del periodo de la serie temporal que se va a
pronosticar. Para el ejemplo, escriba 13.
- En Conocido_y ingrese el rango de datos de Ventas, sin incluir el
rótulo.
- En Conocido_x ingrese el rango de dato de Semana, sin incluir el
rótulo.
- Aplique Aceptar. En la celda seleccionada al iniciar el proceso,
aparecerá el valor del pronóstico. Como podrá comprobar, este valor
corresponde al calculado con la ecuación de tendencia obtenida en la
gráfica del punto 7.

BIBLIOGRAFIA:

- ANALISIS DE DATOS UTILIZANDO EXCEL. Mendoza R., Henry y Bautista


M., Gloria. Universidad Nacional de Colombia. Bogotá, 2003.
- ANALISIS DE DATOS CON MICROSOFT EXCEL. Berk, Kenneth N. y
Carey, Patrick. Ed. Thomson Learning. Mexico, 2001.

Potrebbero piacerti anche